aboutsummaryrefslogtreecommitdiffhomepage
diff options
context:
space:
mode:
-rw-r--r--src/jumper/SkJumper_generated.S8444
-rw-r--r--src/jumper/SkJumper_generated_win.S6897
-rw-r--r--src/jumper/SkJumper_stages.cpp94
3 files changed, 8028 insertions, 7407 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index 6801d354a1..4f6681cc54 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -787,224 +787,238 @@ HIDDEN _sk_hue_aarch64
.globl _sk_hue_aarch64
FUNCTION(_sk_hue_aarch64)
_sk_hue_aarch64:
- .long 0x4f03f612 // fmov v18.4s, #1.000000000000000000e+00
- .long 0x4ea0d873 // fcmeq v19.4s, v3.4s, #0.0
- .long 0x6e23fe58 // fdiv v24.4s, v18.4s, v3.4s
- .long 0x4e731f13 // bic v19.16b, v24.16b, v19.16b
- .long 0x6e21de61 // fmul v1.4s, v19.4s, v1.4s
- .long 0x6e22de62 // fmul v2.4s, v19.4s, v2.4s
+ .long 0x6e23dc32 // fmul v18.4s, v1.4s, v3.4s
+ .long 0x6e23dc53 // fmul v19.4s, v2.4s, v3.4s
.long 0x4e26f4b5 // fmax v21.4s, v5.4s, v6.4s
- .long 0x4ea6f4b6 // fmin v22.4s, v5.4s, v6.4s
- .long 0x6e20de60 // fmul v0.4s, v19.4s, v0.4s
- .long 0x4ea2f433 // fmin v19.4s, v1.4s, v2.4s
- .long 0x52a7d328 // mov w8, #0x3e990000
+ .long 0x4ea6f4b7 // fmin v23.4s, v5.4s, v6.4s
+ .long 0x6e23dc11 // fmul v17.4s, v0.4s, v3.4s
.long 0x4e35f495 // fmax v21.4s, v4.4s, v21.4s
- .long 0x4eb6f496 // fmin v22.4s, v4.4s, v22.4s
- .long 0x4e22f438 // fmax v24.4s, v1.4s, v2.4s
- .long 0x4eb3f413 // fmin v19.4s, v0.4s, v19.4s
+ .long 0x4eb7f497 // fmin v23.4s, v4.4s, v23.4s
+ .long 0x4eb3f65b // fmin v27.4s, v18.4s, v19.4s
+ .long 0x52a7d328 // mov w8, #0x3e990000
+ .long 0x4f03f619 // fmov v25.4s, #1.000000000000000000e+00
+ .long 0x4e33f65c // fmax v28.4s, v18.4s, v19.4s
+ .long 0x4eb7d6b5 // fsub v21.4s, v21.4s, v23.4s
+ .long 0x4ebbf63b // fmin v27.4s, v17.4s, v27.4s
.long 0x72933348 // movk w8, #0x999a
- .long 0x4eb6d6b5 // fsub v21.4s, v21.4s, v22.4s
- .long 0x4e38f418 // fmax v24.4s, v0.4s, v24.4s
- .long 0x4eb3d421 // fsub v1.4s, v1.4s, v19.4s
- .long 0x4e040d14 // dup v20.4s, w8
+ .long 0x4ea7d737 // fsub v23.4s, v25.4s, v7.4s
+ .long 0x4e3cf63c // fmax v28.4s, v17.4s, v28.4s
+ .long 0x4ebbd652 // fsub v18.4s, v18.4s, v27.4s
+ .long 0x6e23deb5 // fmul v21.4s, v21.4s, v3.4s
+ .long 0x4e040d16 // dup v22.4s, w8
.long 0x52a7e2e8 // mov w8, #0x3f170000
- .long 0x4eb3d718 // fsub v24.4s, v24.4s, v19.4s
- .long 0x4eb3d400 // fsub v0.4s, v0.4s, v19.4s
- .long 0x4eb3d442 // fsub v2.4s, v2.4s, v19.4s
- .long 0x6e21dea1 // fmul v1.4s, v21.4s, v1.4s
+ .long 0x6e20dee0 // fmul v0.4s, v23.4s, v0.4s
+ .long 0x6e21dee1 // fmul v1.4s, v23.4s, v1.4s
+ .long 0x6e22dee2 // fmul v2.4s, v23.4s, v2.4s
+ .long 0x4ea3d739 // fsub v25.4s, v25.4s, v3.4s
+ .long 0x4ebbd79c // fsub v28.4s, v28.4s, v27.4s
+ .long 0x4ebbd631 // fsub v17.4s, v17.4s, v27.4s
+ .long 0x6e32deb2 // fmul v18.4s, v21.4s, v18.4s
.long 0x728147a8 // movk w8, #0xa3d
- .long 0x4ea0db13 // fcmeq v19.4s, v24.4s, #0.0
- .long 0x6e20dea0 // fmul v0.4s, v21.4s, v0.4s
- .long 0x6e22dea2 // fmul v2.4s, v21.4s, v2.4s
- .long 0x6e38fc21 // fdiv v1.4s, v1.4s, v24.4s
- .long 0x4e040d17 // dup v23.4s, w8
+ .long 0x4ebbd673 // fsub v19.4s, v19.4s, v27.4s
+ .long 0x4e39cc80 // fmla v0.4s, v4.4s, v25.4s
+ .long 0x4e39cca1 // fmla v1.4s, v5.4s, v25.4s
+ .long 0x4e39ccc2 // fmla v2.4s, v6.4s, v25.4s
+ .long 0x4ea0db99 // fcmeq v25.4s, v28.4s, #0.0
+ .long 0x6e31deb1 // fmul v17.4s, v21.4s, v17.4s
+ .long 0x6e3cfe52 // fdiv v18.4s, v18.4s, v28.4s
+ .long 0x4e040d18 // dup v24.4s, w8
.long 0x52a7bc28 // mov w8, #0x3de10000
- .long 0x6e38fc00 // fdiv v0.4s, v0.4s, v24.4s
- .long 0x6e38fc42 // fdiv v2.4s, v2.4s, v24.4s
- .long 0x4e731c21 // bic v1.16b, v1.16b, v19.16b
+ .long 0x6e33deb3 // fmul v19.4s, v21.4s, v19.4s
+ .long 0x6e3cfe31 // fdiv v17.4s, v17.4s, v28.4s
+ .long 0x4e791e52 // bic v18.16b, v18.16b, v25.16b
.long 0x7288f5c8 // movk w8, #0x47ae
- .long 0x4e27d470 // fadd v16.4s, v3.4s, v7.4s
- .long 0x6e37dcb6 // fmul v22.4s, v5.4s, v23.4s
- .long 0x4e731c00 // bic v0.16b, v0.16b, v19.16b
- .long 0x4e731c42 // bic v2.16b, v2.16b, v19.16b
- .long 0x6e37dc33 // fmul v19.4s, v1.4s, v23.4s
- .long 0x4ea7cc70 // fmls v16.4s, v3.4s, v7.4s
- .long 0x4e040d03 // dup v3.4s, w8
- .long 0x4e24ce96 // fmla v22.4s, v20.4s, v4.4s
- .long 0x4e20ce93 // fmla v19.4s, v20.4s, v0.4s
- .long 0x4e26cc76 // fmla v22.4s, v3.4s, v6.4s
- .long 0x4e22cc73 // fmla v19.4s, v3.4s, v2.4s
- .long 0x4eb3d6d3 // fsub v19.4s, v22.4s, v19.4s
- .long 0x4e33d421 // fadd v1.4s, v1.4s, v19.4s
- .long 0x4e33d400 // fadd v0.4s, v0.4s, v19.4s
- .long 0x6e37dc36 // fmul v22.4s, v1.4s, v23.4s
- .long 0x4e33d442 // fadd v2.4s, v2.4s, v19.4s
- .long 0x4e20ce96 // fmla v22.4s, v20.4s, v0.4s
- .long 0x4ea2f433 // fmin v19.4s, v1.4s, v2.4s
- .long 0x4e22cc76 // fmla v22.4s, v3.4s, v2.4s
- .long 0x4eb3f413 // fmin v19.4s, v0.4s, v19.4s
- .long 0x4eb6d417 // fsub v23.4s, v0.4s, v22.4s
- .long 0x6ea0ca63 // fcmge v3.4s, v19.4s, #0.0
- .long 0x4eb3d6d3 // fsub v19.4s, v22.4s, v19.4s
- .long 0x6e37ded7 // fmul v23.4s, v22.4s, v23.4s
- .long 0x6e33fef7 // fdiv v23.4s, v23.4s, v19.4s
- .long 0x4e22f435 // fmax v21.4s, v1.4s, v2.4s
- .long 0x4ea31c78 // mov v24.16b, v3.16b
- .long 0x4e37d6d7 // fadd v23.4s, v22.4s, v23.4s
- .long 0x4e35f415 // fmax v21.4s, v0.4s, v21.4s
- .long 0x6e771c18 // bsl v24.16b, v0.16b, v23.16b
- .long 0x4eb6d420 // fsub v0.4s, v1.4s, v22.4s
- .long 0x6e20dec0 // fmul v0.4s, v22.4s, v0.4s
- .long 0x6e33fc00 // fdiv v0.4s, v0.4s, v19.4s
- .long 0x4ea31c77 // mov v23.16b, v3.16b
- .long 0x4e20d6c0 // fadd v0.4s, v22.4s, v0.4s
- .long 0x6e601c37 // bsl v23.16b, v1.16b, v0.16b
- .long 0x4eb6d441 // fsub v1.4s, v2.4s, v22.4s
- .long 0x6e21dec1 // fmul v1.4s, v22.4s, v1.4s
- .long 0x6e33fc21 // fdiv v1.4s, v1.4s, v19.4s
- .long 0x4e21d6c1 // fadd v1.4s, v22.4s, v1.4s
- .long 0x6e611c43 // bsl v3.16b, v2.16b, v1.16b
- .long 0x6eb2e6b4 // fcmgt v20.4s, v21.4s, v18.4s
- .long 0x4eb6d652 // fsub v18.4s, v18.4s, v22.4s
- .long 0x4eb6d701 // fsub v1.4s, v24.4s, v22.4s
- .long 0x4eb6d6e2 // fsub v2.4s, v23.4s, v22.4s
- .long 0x4eb6d473 // fsub v19.4s, v3.4s, v22.4s
- .long 0x4eb6d6b5 // fsub v21.4s, v21.4s, v22.4s
- .long 0x6e21de41 // fmul v1.4s, v18.4s, v1.4s
- .long 0x6e22de42 // fmul v2.4s, v18.4s, v2.4s
- .long 0x6e33de52 // fmul v18.4s, v18.4s, v19.4s
- .long 0x6e35fc21 // fdiv v1.4s, v1.4s, v21.4s
- .long 0x6e35fc42 // fdiv v2.4s, v2.4s, v21.4s
+ .long 0x6e3cfe73 // fdiv v19.4s, v19.4s, v28.4s
+ .long 0x4e791e31 // bic v17.16b, v17.16b, v25.16b
+ .long 0x6e38de55 // fmul v21.4s, v18.4s, v24.4s
+ .long 0x4e040d17 // dup v23.4s, w8
+ .long 0x6e38dcbb // fmul v27.4s, v5.4s, v24.4s
+ .long 0x4e791e73 // bic v19.16b, v19.16b, v25.16b
+ .long 0x4e31ced5 // fmla v21.4s, v22.4s, v17.4s
+ .long 0x4e24cedb // fmla v27.4s, v22.4s, v4.4s
+ .long 0x4e33cef5 // fmla v21.4s, v23.4s, v19.4s
+ .long 0x4e26cefb // fmla v27.4s, v23.4s, v6.4s
+ .long 0x6ea0fab5 // fneg v21.4s, v21.4s
+ .long 0x4e3bcc75 // fmla v21.4s, v3.4s, v27.4s
+ .long 0x6e27dc74 // fmul v20.4s, v3.4s, v7.4s
+ .long 0x4e27d47a // fadd v26.4s, v3.4s, v7.4s
+ .long 0x4e35d623 // fadd v3.4s, v17.4s, v21.4s
+ .long 0x4e35d651 // fadd v17.4s, v18.4s, v21.4s
+ .long 0x6e38de38 // fmul v24.4s, v17.4s, v24.4s
+ .long 0x4e35d672 // fadd v18.4s, v19.4s, v21.4s
+ .long 0x4e23ced8 // fmla v24.4s, v22.4s, v3.4s
+ .long 0x4eb2f633 // fmin v19.4s, v17.4s, v18.4s
+ .long 0x4e32cef8 // fmla v24.4s, v23.4s, v18.4s
+ .long 0x4eb3f473 // fmin v19.4s, v3.4s, v19.4s
+ .long 0x4eb8d479 // fsub v25.4s, v3.4s, v24.4s
+ .long 0x6ea0ca76 // fcmge v22.4s, v19.4s, #0.0
+ .long 0x4eb3d713 // fsub v19.4s, v24.4s, v19.4s
+ .long 0x6e39df19 // fmul v25.4s, v24.4s, v25.4s
+ .long 0x6e33ff39 // fdiv v25.4s, v25.4s, v19.4s
+ .long 0x4e32f635 // fmax v21.4s, v17.4s, v18.4s
+ .long 0x4eb61edb // mov v27.16b, v22.16b
+ .long 0x4e39d719 // fadd v25.4s, v24.4s, v25.4s
+ .long 0x4e35f475 // fmax v21.4s, v3.4s, v21.4s
+ .long 0x6e791c7b // bsl v27.16b, v3.16b, v25.16b
+ .long 0x4eb8d623 // fsub v3.4s, v17.4s, v24.4s
+ .long 0x6e23df03 // fmul v3.4s, v24.4s, v3.4s
+ .long 0x6e33fc63 // fdiv v3.4s, v3.4s, v19.4s
+ .long 0x4eb61ed9 // mov v25.16b, v22.16b
+ .long 0x4e23d703 // fadd v3.4s, v24.4s, v3.4s
+ .long 0x6e631e39 // bsl v25.16b, v17.16b, v3.16b
+ .long 0x4eb8d651 // fsub v17.4s, v18.4s, v24.4s
+ .long 0x6e31df11 // fmul v17.4s, v24.4s, v17.4s
+ .long 0x6e33fe31 // fdiv v17.4s, v17.4s, v19.4s
+ .long 0x4e31d711 // fadd v17.4s, v24.4s, v17.4s
+ .long 0x6e711e56 // bsl v22.16b, v18.16b, v17.16b
+ .long 0x4eb8d69c // fsub v28.4s, v20.4s, v24.4s
+ .long 0x4eb8d771 // fsub v17.4s, v27.4s, v24.4s
+ .long 0x4eb8d732 // fsub v18.4s, v25.4s, v24.4s
+ .long 0x4eb8d6d3 // fsub v19.4s, v22.4s, v24.4s
+ .long 0x6eb4e6b7 // fcmgt v23.4s, v21.4s, v20.4s
+ .long 0x4eb8d6b5 // fsub v21.4s, v21.4s, v24.4s
+ .long 0x6e31df91 // fmul v17.4s, v28.4s, v17.4s
+ .long 0x6e32df92 // fmul v18.4s, v28.4s, v18.4s
+ .long 0x6e33df93 // fmul v19.4s, v28.4s, v19.4s
+ .long 0x6e35fe31 // fdiv v17.4s, v17.4s, v21.4s
.long 0x6e35fe52 // fdiv v18.4s, v18.4s, v21.4s
+ .long 0x6e35fe73 // fdiv v19.4s, v19.4s, v21.4s
.long 0xf8408423 // ldr x3, [x1], #8
- .long 0x4eb41e80 // mov v0.16b, v20.16b
- .long 0x4eb41e93 // mov v19.16b, v20.16b
- .long 0x4e21d6c1 // fadd v1.4s, v22.4s, v1.4s
- .long 0x4e22d6c2 // fadd v2.4s, v22.4s, v2.4s
- .long 0x4e32d6d2 // fadd v18.4s, v22.4s, v18.4s
- .long 0x6f00e411 // movi v17.2d, #0x0
- .long 0x6e781c20 // bsl v0.16b, v1.16b, v24.16b
- .long 0x6e771c53 // bsl v19.16b, v2.16b, v23.16b
- .long 0x6e631e54 // bsl v20.16b, v18.16b, v3.16b
- .long 0x4e31f400 // fmax v0.4s, v0.4s, v17.4s
- .long 0x4e31f661 // fmax v1.4s, v19.4s, v17.4s
- .long 0x4e31f682 // fmax v2.4s, v20.4s, v17.4s
- .long 0x6e20de00 // fmul v0.4s, v16.4s, v0.4s
- .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s
- .long 0x6e22de02 // fmul v2.4s, v16.4s, v2.4s
- .long 0x4eb01e03 // mov v3.16b, v16.16b
+ .long 0x4eb71ee3 // mov v3.16b, v23.16b
+ .long 0x4eb71efc // mov v28.16b, v23.16b
+ .long 0x4e31d711 // fadd v17.4s, v24.4s, v17.4s
+ .long 0x4e32d712 // fadd v18.4s, v24.4s, v18.4s
+ .long 0x4e33d713 // fadd v19.4s, v24.4s, v19.4s
+ .long 0x6f00e410 // movi v16.2d, #0x0
+ .long 0x6e7b1e23 // bsl v3.16b, v17.16b, v27.16b
+ .long 0x6e791e5c // bsl v28.16b, v18.16b, v25.16b
+ .long 0x6e761e77 // bsl v23.16b, v19.16b, v22.16b
+ .long 0x4e30f463 // fmax v3.4s, v3.4s, v16.4s
+ .long 0x4e30f791 // fmax v17.4s, v28.4s, v16.4s
+ .long 0x4e30f6f0 // fmax v16.4s, v23.4s, v16.4s
+ .long 0x4e23d400 // fadd v0.4s, v0.4s, v3.4s
+ .long 0x4e31d421 // fadd v1.4s, v1.4s, v17.4s
+ .long 0x4e30d442 // fadd v2.4s, v2.4s, v16.4s
+ .long 0x4eb4d743 // fsub v3.4s, v26.4s, v20.4s
.long 0xd61f0060 // br x3
HIDDEN _sk_saturation_aarch64
.globl _sk_saturation_aarch64
FUNCTION(_sk_saturation_aarch64)
_sk_saturation_aarch64:
- .long 0x4f03f612 // fmov v18.4s, #1.000000000000000000e+00
- .long 0x4ea0d8f3 // fcmeq v19.4s, v7.4s, #0.0
- .long 0x4e22f434 // fmax v20.4s, v1.4s, v2.4s
- .long 0x4ea2f422 // fmin v2.4s, v1.4s, v2.4s
- .long 0x4e27d470 // fadd v16.4s, v3.4s, v7.4s
- .long 0x6e27fe56 // fdiv v22.4s, v18.4s, v7.4s
- .long 0x4e34f414 // fmax v20.4s, v0.4s, v20.4s
- .long 0x4ea2f400 // fmin v0.4s, v0.4s, v2.4s
- .long 0x4ea7cc70 // fmls v16.4s, v3.4s, v7.4s
- .long 0x4e731ec3 // bic v3.16b, v22.16b, v19.16b
- .long 0x4ea0d680 // fsub v0.4s, v20.4s, v0.4s
- .long 0x6e24dc74 // fmul v20.4s, v3.4s, v4.4s
- .long 0x6e25dc76 // fmul v22.4s, v3.4s, v5.4s
- .long 0x6e26dc63 // fmul v3.4s, v3.4s, v6.4s
- .long 0x4ea3f6d7 // fmin v23.4s, v22.4s, v3.4s
+ .long 0x6e25dc72 // fmul v18.4s, v3.4s, v5.4s
+ .long 0x6e26dc73 // fmul v19.4s, v3.4s, v6.4s
+ .long 0x4e22f435 // fmax v21.4s, v1.4s, v2.4s
+ .long 0x4ea2f437 // fmin v23.4s, v1.4s, v2.4s
+ .long 0x6e24dc71 // fmul v17.4s, v3.4s, v4.4s
+ .long 0x4e35f415 // fmax v21.4s, v0.4s, v21.4s
+ .long 0x4eb7f417 // fmin v23.4s, v0.4s, v23.4s
+ .long 0x4eb3f65b // fmin v27.4s, v18.4s, v19.4s
.long 0x52a7d328 // mov w8, #0x3e990000
- .long 0x4e23f6d8 // fmax v24.4s, v22.4s, v3.4s
- .long 0x4eb7f697 // fmin v23.4s, v20.4s, v23.4s
+ .long 0x4f03f619 // fmov v25.4s, #1.000000000000000000e+00
+ .long 0x4e33f65c // fmax v28.4s, v18.4s, v19.4s
+ .long 0x4eb7d6b5 // fsub v21.4s, v21.4s, v23.4s
+ .long 0x4ebbf63b // fmin v27.4s, v17.4s, v27.4s
.long 0x72933348 // movk w8, #0x999a
- .long 0x4e38f698 // fmax v24.4s, v20.4s, v24.4s
- .long 0x4eb7d694 // fsub v20.4s, v20.4s, v23.4s
- .long 0x4eb7d6d6 // fsub v22.4s, v22.4s, v23.4s
- .long 0x4e040d01 // dup v1.4s, w8
+ .long 0x4ea7d737 // fsub v23.4s, v25.4s, v7.4s
+ .long 0x4e3cf63c // fmax v28.4s, v17.4s, v28.4s
+ .long 0x4ebbd652 // fsub v18.4s, v18.4s, v27.4s
+ .long 0x6e27deb5 // fmul v21.4s, v21.4s, v7.4s
+ .long 0x4e040d16 // dup v22.4s, w8
.long 0x52a7e2e8 // mov w8, #0x3f170000
- .long 0x4eb7d718 // fsub v24.4s, v24.4s, v23.4s
- .long 0x4eb7d463 // fsub v3.4s, v3.4s, v23.4s
- .long 0x6e34dc14 // fmul v20.4s, v0.4s, v20.4s
- .long 0x6e36dc16 // fmul v22.4s, v0.4s, v22.4s
+ .long 0x6e20dee0 // fmul v0.4s, v23.4s, v0.4s
+ .long 0x6e21dee1 // fmul v1.4s, v23.4s, v1.4s
+ .long 0x6e22dee2 // fmul v2.4s, v23.4s, v2.4s
+ .long 0x4ea3d739 // fsub v25.4s, v25.4s, v3.4s
+ .long 0x4ebbd79c // fsub v28.4s, v28.4s, v27.4s
+ .long 0x4ebbd631 // fsub v17.4s, v17.4s, v27.4s
+ .long 0x6e32deb2 // fmul v18.4s, v21.4s, v18.4s
.long 0x728147a8 // movk w8, #0xa3d
- .long 0x4ea0db17 // fcmeq v23.4s, v24.4s, #0.0
- .long 0x6e23dc00 // fmul v0.4s, v0.4s, v3.4s
- .long 0x6e38fe83 // fdiv v3.4s, v20.4s, v24.4s
- .long 0x6e38fed4 // fdiv v20.4s, v22.4s, v24.4s
- .long 0x4e040d15 // dup v21.4s, w8
+ .long 0x4ebbd673 // fsub v19.4s, v19.4s, v27.4s
+ .long 0x4e39cc80 // fmla v0.4s, v4.4s, v25.4s
+ .long 0x4e39cca1 // fmla v1.4s, v5.4s, v25.4s
+ .long 0x4e39ccc2 // fmla v2.4s, v6.4s, v25.4s
+ .long 0x4ea0db99 // fcmeq v25.4s, v28.4s, #0.0
+ .long 0x6e31deb1 // fmul v17.4s, v21.4s, v17.4s
+ .long 0x6e3cfe52 // fdiv v18.4s, v18.4s, v28.4s
+ .long 0x4e040d18 // dup v24.4s, w8
.long 0x52a7bc28 // mov w8, #0x3de10000
- .long 0x4e771e94 // bic v20.16b, v20.16b, v23.16b
+ .long 0x6e33deb3 // fmul v19.4s, v21.4s, v19.4s
+ .long 0x6e3cfe31 // fdiv v17.4s, v17.4s, v28.4s
+ .long 0x4e791e52 // bic v18.16b, v18.16b, v25.16b
.long 0x7288f5c8 // movk w8, #0x47ae
- .long 0x6e35dcb3 // fmul v19.4s, v5.4s, v21.4s
- .long 0x6e38fc00 // fdiv v0.4s, v0.4s, v24.4s
- .long 0x4e771c63 // bic v3.16b, v3.16b, v23.16b
- .long 0x6e35de96 // fmul v22.4s, v20.4s, v21.4s
- .long 0x4e040d02 // dup v2.4s, w8
- .long 0x4e24cc33 // fmla v19.4s, v1.4s, v4.4s
- .long 0x4e771c00 // bic v0.16b, v0.16b, v23.16b
- .long 0x4e23cc36 // fmla v22.4s, v1.4s, v3.4s
- .long 0x4e26cc53 // fmla v19.4s, v2.4s, v6.4s
- .long 0x4e20cc56 // fmla v22.4s, v2.4s, v0.4s
- .long 0x4eb6d673 // fsub v19.4s, v19.4s, v22.4s
- .long 0x4e33d694 // fadd v20.4s, v20.4s, v19.4s
- .long 0x4e33d463 // fadd v3.4s, v3.4s, v19.4s
- .long 0x6e35de95 // fmul v21.4s, v20.4s, v21.4s
- .long 0x4e33d400 // fadd v0.4s, v0.4s, v19.4s
- .long 0x4e23cc35 // fmla v21.4s, v1.4s, v3.4s
- .long 0x4ea0f693 // fmin v19.4s, v20.4s, v0.4s
- .long 0x4e20cc55 // fmla v21.4s, v2.4s, v0.4s
+ .long 0x6e3cfe73 // fdiv v19.4s, v19.4s, v28.4s
+ .long 0x4e791e31 // bic v17.16b, v17.16b, v25.16b
+ .long 0x6e38de55 // fmul v21.4s, v18.4s, v24.4s
+ .long 0x4e040d17 // dup v23.4s, w8
+ .long 0x6e38dcbb // fmul v27.4s, v5.4s, v24.4s
+ .long 0x4e791e73 // bic v19.16b, v19.16b, v25.16b
+ .long 0x4e31ced5 // fmla v21.4s, v22.4s, v17.4s
+ .long 0x4e24cedb // fmla v27.4s, v22.4s, v4.4s
+ .long 0x4e33cef5 // fmla v21.4s, v23.4s, v19.4s
+ .long 0x4e26cefb // fmla v27.4s, v23.4s, v6.4s
+ .long 0x6ea0fab5 // fneg v21.4s, v21.4s
+ .long 0x4e3bcc75 // fmla v21.4s, v3.4s, v27.4s
+ .long 0x6e27dc74 // fmul v20.4s, v3.4s, v7.4s
+ .long 0x4e27d47a // fadd v26.4s, v3.4s, v7.4s
+ .long 0x4e35d623 // fadd v3.4s, v17.4s, v21.4s
+ .long 0x4e35d651 // fadd v17.4s, v18.4s, v21.4s
+ .long 0x6e38de38 // fmul v24.4s, v17.4s, v24.4s
+ .long 0x4e35d672 // fadd v18.4s, v19.4s, v21.4s
+ .long 0x4e23ced8 // fmla v24.4s, v22.4s, v3.4s
+ .long 0x4eb2f633 // fmin v19.4s, v17.4s, v18.4s
+ .long 0x4e32cef8 // fmla v24.4s, v23.4s, v18.4s
.long 0x4eb3f473 // fmin v19.4s, v3.4s, v19.4s
- .long 0x4eb5d477 // fsub v23.4s, v3.4s, v21.4s
- .long 0x6ea0ca61 // fcmge v1.4s, v19.4s, #0.0
- .long 0x4eb3d6b3 // fsub v19.4s, v21.4s, v19.4s
- .long 0x6e37deb7 // fmul v23.4s, v21.4s, v23.4s
- .long 0x6e33fef7 // fdiv v23.4s, v23.4s, v19.4s
- .long 0x4e20f696 // fmax v22.4s, v20.4s, v0.4s
- .long 0x4ea11c38 // mov v24.16b, v1.16b
- .long 0x4e37d6b7 // fadd v23.4s, v21.4s, v23.4s
- .long 0x4e36f476 // fmax v22.4s, v3.4s, v22.4s
- .long 0x6e771c78 // bsl v24.16b, v3.16b, v23.16b
- .long 0x4eb5d683 // fsub v3.4s, v20.4s, v21.4s
- .long 0x6e23dea3 // fmul v3.4s, v21.4s, v3.4s
+ .long 0x4eb8d479 // fsub v25.4s, v3.4s, v24.4s
+ .long 0x6ea0ca76 // fcmge v22.4s, v19.4s, #0.0
+ .long 0x4eb3d713 // fsub v19.4s, v24.4s, v19.4s
+ .long 0x6e39df19 // fmul v25.4s, v24.4s, v25.4s
+ .long 0x6e33ff39 // fdiv v25.4s, v25.4s, v19.4s
+ .long 0x4e32f635 // fmax v21.4s, v17.4s, v18.4s
+ .long 0x4eb61edb // mov v27.16b, v22.16b
+ .long 0x4e39d719 // fadd v25.4s, v24.4s, v25.4s
+ .long 0x4e35f475 // fmax v21.4s, v3.4s, v21.4s
+ .long 0x6e791c7b // bsl v27.16b, v3.16b, v25.16b
+ .long 0x4eb8d623 // fsub v3.4s, v17.4s, v24.4s
+ .long 0x6e23df03 // fmul v3.4s, v24.4s, v3.4s
.long 0x6e33fc63 // fdiv v3.4s, v3.4s, v19.4s
- .long 0x4ea11c37 // mov v23.16b, v1.16b
- .long 0x4e23d6a3 // fadd v3.4s, v21.4s, v3.4s
- .long 0x6e631e97 // bsl v23.16b, v20.16b, v3.16b
- .long 0x4eb5d414 // fsub v20.4s, v0.4s, v21.4s
- .long 0x6e34deb4 // fmul v20.4s, v21.4s, v20.4s
- .long 0x6e33fe93 // fdiv v19.4s, v20.4s, v19.4s
- .long 0x4e33d6b3 // fadd v19.4s, v21.4s, v19.4s
- .long 0x6e731c01 // bsl v1.16b, v0.16b, v19.16b
- .long 0x6eb2e6c2 // fcmgt v2.4s, v22.4s, v18.4s
- .long 0x4eb5d652 // fsub v18.4s, v18.4s, v21.4s
- .long 0x4eb5d700 // fsub v0.4s, v24.4s, v21.4s
- .long 0x4eb5d6f3 // fsub v19.4s, v23.4s, v21.4s
- .long 0x4eb5d434 // fsub v20.4s, v1.4s, v21.4s
- .long 0x4eb5d6d6 // fsub v22.4s, v22.4s, v21.4s
- .long 0x6e20de40 // fmul v0.4s, v18.4s, v0.4s
- .long 0x6e33de53 // fmul v19.4s, v18.4s, v19.4s
- .long 0x6e34de52 // fmul v18.4s, v18.4s, v20.4s
- .long 0x6e36fc00 // fdiv v0.4s, v0.4s, v22.4s
- .long 0x6e36fe73 // fdiv v19.4s, v19.4s, v22.4s
- .long 0x6e36fe52 // fdiv v18.4s, v18.4s, v22.4s
+ .long 0x4eb61ed9 // mov v25.16b, v22.16b
+ .long 0x4e23d703 // fadd v3.4s, v24.4s, v3.4s
+ .long 0x6e631e39 // bsl v25.16b, v17.16b, v3.16b
+ .long 0x4eb8d651 // fsub v17.4s, v18.4s, v24.4s
+ .long 0x6e31df11 // fmul v17.4s, v24.4s, v17.4s
+ .long 0x6e33fe31 // fdiv v17.4s, v17.4s, v19.4s
+ .long 0x4e31d711 // fadd v17.4s, v24.4s, v17.4s
+ .long 0x6e711e56 // bsl v22.16b, v18.16b, v17.16b
+ .long 0x4eb8d69c // fsub v28.4s, v20.4s, v24.4s
+ .long 0x4eb8d771 // fsub v17.4s, v27.4s, v24.4s
+ .long 0x4eb8d732 // fsub v18.4s, v25.4s, v24.4s
+ .long 0x4eb8d6d3 // fsub v19.4s, v22.4s, v24.4s
+ .long 0x6eb4e6b7 // fcmgt v23.4s, v21.4s, v20.4s
+ .long 0x4eb8d6b5 // fsub v21.4s, v21.4s, v24.4s
+ .long 0x6e31df91 // fmul v17.4s, v28.4s, v17.4s
+ .long 0x6e32df92 // fmul v18.4s, v28.4s, v18.4s
+ .long 0x6e33df93 // fmul v19.4s, v28.4s, v19.4s
+ .long 0x6e35fe31 // fdiv v17.4s, v17.4s, v21.4s
+ .long 0x6e35fe52 // fdiv v18.4s, v18.4s, v21.4s
+ .long 0x6e35fe73 // fdiv v19.4s, v19.4s, v21.4s
.long 0xf8408423 // ldr x3, [x1], #8
- .long 0x4ea21c43 // mov v3.16b, v2.16b
- .long 0x4ea21c54 // mov v20.16b, v2.16b
- .long 0x4e20d6a0 // fadd v0.4s, v21.4s, v0.4s
- .long 0x4e33d6b3 // fadd v19.4s, v21.4s, v19.4s
- .long 0x4e32d6b2 // fadd v18.4s, v21.4s, v18.4s
- .long 0x6f00e411 // movi v17.2d, #0x0
- .long 0x6e781c03 // bsl v3.16b, v0.16b, v24.16b
- .long 0x6e771e74 // bsl v20.16b, v19.16b, v23.16b
- .long 0x6e611e42 // bsl v2.16b, v18.16b, v1.16b
- .long 0x4e31f460 // fmax v0.4s, v3.4s, v17.4s
- .long 0x4e31f681 // fmax v1.4s, v20.4s, v17.4s
- .long 0x4e31f442 // fmax v2.4s, v2.4s, v17.4s
- .long 0x6e20de00 // fmul v0.4s, v16.4s, v0.4s
- .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s
- .long 0x6e22de02 // fmul v2.4s, v16.4s, v2.4s
- .long 0x4eb01e03 // mov v3.16b, v16.16b
+ .long 0x4eb71ee3 // mov v3.16b, v23.16b
+ .long 0x4eb71efc // mov v28.16b, v23.16b
+ .long 0x4e31d711 // fadd v17.4s, v24.4s, v17.4s
+ .long 0x4e32d712 // fadd v18.4s, v24.4s, v18.4s
+ .long 0x4e33d713 // fadd v19.4s, v24.4s, v19.4s
+ .long 0x6f00e410 // movi v16.2d, #0x0
+ .long 0x6e7b1e23 // bsl v3.16b, v17.16b, v27.16b
+ .long 0x6e791e5c // bsl v28.16b, v18.16b, v25.16b
+ .long 0x6e761e77 // bsl v23.16b, v19.16b, v22.16b
+ .long 0x4e30f463 // fmax v3.4s, v3.4s, v16.4s
+ .long 0x4e30f791 // fmax v17.4s, v28.4s, v16.4s
+ .long 0x4e30f6f0 // fmax v16.4s, v23.4s, v16.4s
+ .long 0x4e23d400 // fadd v0.4s, v0.4s, v3.4s
+ .long 0x4e31d421 // fadd v1.4s, v1.4s, v17.4s
+ .long 0x4e30d442 // fadd v2.4s, v2.4s, v16.4s
+ .long 0x4eb4d743 // fsub v3.4s, v26.4s, v20.4s
.long 0xd61f0060 // br x3
HIDDEN _sk_color_aarch64
@@ -1012,88 +1026,94 @@ HIDDEN _sk_color_aarch64
FUNCTION(_sk_color_aarch64)
_sk_color_aarch64:
.long 0x52a7d328 // mov w8, #0x3e990000
- .long 0x4f03f612 // fmov v18.4s, #1.000000000000000000e+00
.long 0x72933348 // movk w8, #0x999a
- .long 0x4ea0d874 // fcmeq v20.4s, v3.4s, #0.0
- .long 0x4e040d13 // dup v19.4s, w8
+ .long 0x4e040d12 // dup v18.4s, w8
.long 0x52a7e2e8 // mov w8, #0x3f170000
- .long 0x4e27d470 // fadd v16.4s, v3.4s, v7.4s
- .long 0x6e23fe56 // fdiv v22.4s, v18.4s, v3.4s
.long 0x728147a8 // movk w8, #0xa3d
- .long 0x4ea7cc70 // fmls v16.4s, v3.4s, v7.4s
- .long 0x4e741ec3 // bic v3.16b, v22.16b, v20.16b
+ .long 0x6e27dc33 // fmul v19.4s, v1.4s, v7.4s
.long 0x4e040d15 // dup v21.4s, w8
.long 0x52a7bc28 // mov w8, #0x3de10000
- .long 0x6e21dc61 // fmul v1.4s, v3.4s, v1.4s
+ .long 0x6e27dc11 // fmul v17.4s, v0.4s, v7.4s
.long 0x7288f5c8 // movk w8, #0x47ae
- .long 0x6e35dcb4 // fmul v20.4s, v5.4s, v21.4s
- .long 0x6e20dc60 // fmul v0.4s, v3.4s, v0.4s
- .long 0x6e22dc62 // fmul v2.4s, v3.4s, v2.4s
- .long 0x6e35dc23 // fmul v3.4s, v1.4s, v21.4s
- .long 0x4e040d17 // dup v23.4s, w8
- .long 0x4e24ce74 // fmla v20.4s, v19.4s, v4.4s
- .long 0x4e20ce63 // fmla v3.4s, v19.4s, v0.4s
- .long 0x4e26cef4 // fmla v20.4s, v23.4s, v6.4s
- .long 0x4e22cee3 // fmla v3.4s, v23.4s, v2.4s
- .long 0x4ea3d683 // fsub v3.4s, v20.4s, v3.4s
- .long 0x4e23d421 // fadd v1.4s, v1.4s, v3.4s
- .long 0x4e23d400 // fadd v0.4s, v0.4s, v3.4s
- .long 0x6e35dc35 // fmul v21.4s, v1.4s, v21.4s
- .long 0x4e23d442 // fadd v2.4s, v2.4s, v3.4s
- .long 0x4e20ce75 // fmla v21.4s, v19.4s, v0.4s
- .long 0x4ea2f423 // fmin v3.4s, v1.4s, v2.4s
- .long 0x4e22cef5 // fmla v21.4s, v23.4s, v2.4s
- .long 0x4ea3f403 // fmin v3.4s, v0.4s, v3.4s
- .long 0x4eb5d417 // fsub v23.4s, v0.4s, v21.4s
- .long 0x6ea0c873 // fcmge v19.4s, v3.4s, #0.0
- .long 0x4ea3d6a3 // fsub v3.4s, v21.4s, v3.4s
- .long 0x6e37deb7 // fmul v23.4s, v21.4s, v23.4s
- .long 0x6e23fef7 // fdiv v23.4s, v23.4s, v3.4s
- .long 0x4e22f434 // fmax v20.4s, v1.4s, v2.4s
- .long 0x4eb31e78 // mov v24.16b, v19.16b
- .long 0x4e37d6b7 // fadd v23.4s, v21.4s, v23.4s
- .long 0x4e34f414 // fmax v20.4s, v0.4s, v20.4s
- .long 0x6e771c18 // bsl v24.16b, v0.16b, v23.16b
- .long 0x4eb5d420 // fsub v0.4s, v1.4s, v21.4s
- .long 0x6e20dea0 // fmul v0.4s, v21.4s, v0.4s
- .long 0x6e23fc00 // fdiv v0.4s, v0.4s, v3.4s
- .long 0x4eb31e77 // mov v23.16b, v19.16b
- .long 0x4e20d6a0 // fadd v0.4s, v21.4s, v0.4s
- .long 0x6e601c37 // bsl v23.16b, v1.16b, v0.16b
- .long 0x4eb5d441 // fsub v1.4s, v2.4s, v21.4s
- .long 0x6e21dea1 // fmul v1.4s, v21.4s, v1.4s
- .long 0x6e23fc21 // fdiv v1.4s, v1.4s, v3.4s
- .long 0x4e21d6a1 // fadd v1.4s, v21.4s, v1.4s
- .long 0x6e611c53 // bsl v19.16b, v2.16b, v1.16b
- .long 0x6eb2e696 // fcmgt v22.4s, v20.4s, v18.4s
- .long 0x4eb5d652 // fsub v18.4s, v18.4s, v21.4s
- .long 0x4eb5d701 // fsub v1.4s, v24.4s, v21.4s
- .long 0x4eb5d6e2 // fsub v2.4s, v23.4s, v21.4s
- .long 0x4eb5d663 // fsub v3.4s, v19.4s, v21.4s
- .long 0x4eb5d694 // fsub v20.4s, v20.4s, v21.4s
- .long 0x6e21de41 // fmul v1.4s, v18.4s, v1.4s
- .long 0x6e22de42 // fmul v2.4s, v18.4s, v2.4s
- .long 0x6e23de43 // fmul v3.4s, v18.4s, v3.4s
- .long 0x6e34fc21 // fdiv v1.4s, v1.4s, v20.4s
- .long 0x6e34fc42 // fdiv v2.4s, v2.4s, v20.4s
+ .long 0x4f03f617 // fmov v23.4s, #1.000000000000000000e+00
+ .long 0x6e35de7c // fmul v28.4s, v19.4s, v21.4s
+ .long 0x6e27dc54 // fmul v20.4s, v2.4s, v7.4s
+ .long 0x4e040d19 // dup v25.4s, w8
+ .long 0x4ea7d6fa // fsub v26.4s, v23.4s, v7.4s
+ .long 0x6e35dcbb // fmul v27.4s, v5.4s, v21.4s
+ .long 0x4e31ce5c // fmla v28.4s, v18.4s, v17.4s
+ .long 0x4ea3d6f7 // fsub v23.4s, v23.4s, v3.4s
+ .long 0x6e20df40 // fmul v0.4s, v26.4s, v0.4s
+ .long 0x6e21df41 // fmul v1.4s, v26.4s, v1.4s
+ .long 0x6e22df42 // fmul v2.4s, v26.4s, v2.4s
+ .long 0x4e24ce5b // fmla v27.4s, v18.4s, v4.4s
+ .long 0x4e34cf3c // fmla v28.4s, v25.4s, v20.4s
+ .long 0x4e37cc80 // fmla v0.4s, v4.4s, v23.4s
+ .long 0x4e37cca1 // fmla v1.4s, v5.4s, v23.4s
+ .long 0x4e37ccc2 // fmla v2.4s, v6.4s, v23.4s
+ .long 0x4e26cf3b // fmla v27.4s, v25.4s, v6.4s
+ .long 0x6ea0fb97 // fneg v23.4s, v28.4s
+ .long 0x4e3bcc77 // fmla v23.4s, v3.4s, v27.4s
+ .long 0x6e27dc70 // fmul v16.4s, v3.4s, v7.4s
+ .long 0x4e27d478 // fadd v24.4s, v3.4s, v7.4s
+ .long 0x4e37d623 // fadd v3.4s, v17.4s, v23.4s
+ .long 0x4e37d671 // fadd v17.4s, v19.4s, v23.4s
+ .long 0x6e35de35 // fmul v21.4s, v17.4s, v21.4s
+ .long 0x4e37d693 // fadd v19.4s, v20.4s, v23.4s
+ .long 0x4e23ce55 // fmla v21.4s, v18.4s, v3.4s
+ .long 0x4eb3f634 // fmin v20.4s, v17.4s, v19.4s
+ .long 0x4e33cf35 // fmla v21.4s, v25.4s, v19.4s
+ .long 0x4eb4f474 // fmin v20.4s, v3.4s, v20.4s
+ .long 0x4eb5d47a // fsub v26.4s, v3.4s, v21.4s
+ .long 0x6ea0ca92 // fcmge v18.4s, v20.4s, #0.0
+ .long 0x4eb4d6b4 // fsub v20.4s, v21.4s, v20.4s
+ .long 0x6e3adeba // fmul v26.4s, v21.4s, v26.4s
+ .long 0x6e34ff5a // fdiv v26.4s, v26.4s, v20.4s
+ .long 0x4e33f637 // fmax v23.4s, v17.4s, v19.4s
+ .long 0x4eb21e5b // mov v27.16b, v18.16b
+ .long 0x4e3ad6ba // fadd v26.4s, v21.4s, v26.4s
+ .long 0x4e37f477 // fmax v23.4s, v3.4s, v23.4s
+ .long 0x6e7a1c7b // bsl v27.16b, v3.16b, v26.16b
+ .long 0x4eb5d623 // fsub v3.4s, v17.4s, v21.4s
+ .long 0x6e23dea3 // fmul v3.4s, v21.4s, v3.4s
.long 0x6e34fc63 // fdiv v3.4s, v3.4s, v20.4s
- .long 0xf8408423 // ldr x3, [x1], #8
- .long 0x4eb61ec0 // mov v0.16b, v22.16b
- .long 0x4eb61ed2 // mov v18.16b, v22.16b
- .long 0x4e21d6a1 // fadd v1.4s, v21.4s, v1.4s
- .long 0x4e22d6a2 // fadd v2.4s, v21.4s, v2.4s
+ .long 0x4eb21e5a // mov v26.16b, v18.16b
.long 0x4e23d6a3 // fadd v3.4s, v21.4s, v3.4s
- .long 0x6f00e411 // movi v17.2d, #0x0
- .long 0x6e781c20 // bsl v0.16b, v1.16b, v24.16b
- .long 0x6e771c52 // bsl v18.16b, v2.16b, v23.16b
- .long 0x6e731c76 // bsl v22.16b, v3.16b, v19.16b
- .long 0x4e31f400 // fmax v0.4s, v0.4s, v17.4s
- .long 0x4e31f641 // fmax v1.4s, v18.4s, v17.4s
- .long 0x4e31f6c2 // fmax v2.4s, v22.4s, v17.4s
- .long 0x6e20de00 // fmul v0.4s, v16.4s, v0.4s
- .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s
- .long 0x6e22de02 // fmul v2.4s, v16.4s, v2.4s
- .long 0x4eb01e03 // mov v3.16b, v16.16b
+ .long 0x6e631e3a // bsl v26.16b, v17.16b, v3.16b
+ .long 0x4eb5d671 // fsub v17.4s, v19.4s, v21.4s
+ .long 0x6e31deb1 // fmul v17.4s, v21.4s, v17.4s
+ .long 0x6e34fe31 // fdiv v17.4s, v17.4s, v20.4s
+ .long 0x4e31d6b1 // fadd v17.4s, v21.4s, v17.4s
+ .long 0x6e711e72 // bsl v18.16b, v19.16b, v17.16b
+ .long 0x4eb5d61c // fsub v28.4s, v16.4s, v21.4s
+ .long 0x4eb5d771 // fsub v17.4s, v27.4s, v21.4s
+ .long 0x4eb5d753 // fsub v19.4s, v26.4s, v21.4s
+ .long 0x4eb5d654 // fsub v20.4s, v18.4s, v21.4s
+ .long 0x6eb0e6f9 // fcmgt v25.4s, v23.4s, v16.4s
+ .long 0x4eb5d6f7 // fsub v23.4s, v23.4s, v21.4s
+ .long 0x6e31df91 // fmul v17.4s, v28.4s, v17.4s
+ .long 0x6e33df93 // fmul v19.4s, v28.4s, v19.4s
+ .long 0x6e34df94 // fmul v20.4s, v28.4s, v20.4s
+ .long 0x6e37fe31 // fdiv v17.4s, v17.4s, v23.4s
+ .long 0x6e37fe73 // fdiv v19.4s, v19.4s, v23.4s
+ .long 0x6e37fe94 // fdiv v20.4s, v20.4s, v23.4s
+ .long 0xf8408423 // ldr x3, [x1], #8
+ .long 0x4eb91f23 // mov v3.16b, v25.16b
+ .long 0x4eb91f3c // mov v28.16b, v25.16b
+ .long 0x4e31d6b1 // fadd v17.4s, v21.4s, v17.4s
+ .long 0x4e33d6b3 // fadd v19.4s, v21.4s, v19.4s
+ .long 0x4e34d6b4 // fadd v20.4s, v21.4s, v20.4s
+ .long 0x6f00e416 // movi v22.2d, #0x0
+ .long 0x6e7b1e23 // bsl v3.16b, v17.16b, v27.16b
+ .long 0x6e7a1e7c // bsl v28.16b, v19.16b, v26.16b
+ .long 0x6e721e99 // bsl v25.16b, v20.16b, v18.16b
+ .long 0x4e36f463 // fmax v3.4s, v3.4s, v22.4s
+ .long 0x4e36f791 // fmax v17.4s, v28.4s, v22.4s
+ .long 0x4e36f732 // fmax v18.4s, v25.4s, v22.4s
+ .long 0x4e23d400 // fadd v0.4s, v0.4s, v3.4s
+ .long 0x4e31d421 // fadd v1.4s, v1.4s, v17.4s
+ .long 0x4e32d442 // fadd v2.4s, v2.4s, v18.4s
+ .long 0x4eb0d703 // fsub v3.4s, v24.4s, v16.4s
.long 0xd61f0060 // br x3
HIDDEN _sk_luminosity_aarch64
@@ -1102,87 +1122,93 @@ FUNCTION(_sk_luminosity_aarch64)
_sk_luminosity_aarch64:
.long 0x52a7d328 // mov w8, #0x3e990000
.long 0x72933348 // movk w8, #0x999a
- .long 0x4f03f612 // fmov v18.4s, #1.000000000000000000e+00
- .long 0x4e040d13 // dup v19.4s, w8
+ .long 0x4e040d12 // dup v18.4s, w8
.long 0x52a7e2e8 // mov w8, #0x3f170000
- .long 0x4ea0d8f4 // fcmeq v20.4s, v7.4s, #0.0
.long 0x728147a8 // movk w8, #0xa3d
- .long 0x4e27d470 // fadd v16.4s, v3.4s, v7.4s
- .long 0x6e27fe56 // fdiv v22.4s, v18.4s, v7.4s
+ .long 0x6e25dc73 // fmul v19.4s, v3.4s, v5.4s
.long 0x4e040d15 // dup v21.4s, w8
- .long 0x4ea7cc70 // fmls v16.4s, v3.4s, v7.4s
- .long 0x4e741ec3 // bic v3.16b, v22.16b, v20.16b
.long 0x52a7bc28 // mov w8, #0x3de10000
- .long 0x6e35dc21 // fmul v1.4s, v1.4s, v21.4s
- .long 0x6e25dc76 // fmul v22.4s, v3.4s, v5.4s
+ .long 0x6e24dc71 // fmul v17.4s, v3.4s, v4.4s
.long 0x7288f5c8 // movk w8, #0x47ae
- .long 0x6e24dc74 // fmul v20.4s, v3.4s, v4.4s
- .long 0x4e20ce61 // fmla v1.4s, v19.4s, v0.4s
- .long 0x6e35dec0 // fmul v0.4s, v22.4s, v21.4s
- .long 0x4e040d17 // dup v23.4s, w8
- .long 0x6e26dc63 // fmul v3.4s, v3.4s, v6.4s
- .long 0x4e34ce60 // fmla v0.4s, v19.4s, v20.4s
- .long 0x4e22cee1 // fmla v1.4s, v23.4s, v2.4s
- .long 0x4e23cee0 // fmla v0.4s, v23.4s, v3.4s
- .long 0x4ea0d420 // fsub v0.4s, v1.4s, v0.4s
- .long 0x4e20d6c2 // fadd v2.4s, v22.4s, v0.4s
- .long 0x4e20d681 // fadd v1.4s, v20.4s, v0.4s
- .long 0x6e35dc55 // fmul v21.4s, v2.4s, v21.4s
- .long 0x4e20d460 // fadd v0.4s, v3.4s, v0.4s
- .long 0x4e21ce75 // fmla v21.4s, v19.4s, v1.4s
- .long 0x4ea0f443 // fmin v3.4s, v2.4s, v0.4s
- .long 0x4e20cef5 // fmla v21.4s, v23.4s, v0.4s
- .long 0x4ea3f423 // fmin v3.4s, v1.4s, v3.4s
- .long 0x4eb5d437 // fsub v23.4s, v1.4s, v21.4s
- .long 0x6ea0c873 // fcmge v19.4s, v3.4s, #0.0
- .long 0x4ea3d6a3 // fsub v3.4s, v21.4s, v3.4s
- .long 0x6e37deb7 // fmul v23.4s, v21.4s, v23.4s
- .long 0x6e23fef7 // fdiv v23.4s, v23.4s, v3.4s
- .long 0x4e20f454 // fmax v20.4s, v2.4s, v0.4s
- .long 0x4eb31e78 // mov v24.16b, v19.16b
- .long 0x4e37d6b7 // fadd v23.4s, v21.4s, v23.4s
- .long 0x4e34f434 // fmax v20.4s, v1.4s, v20.4s
- .long 0x6e771c38 // bsl v24.16b, v1.16b, v23.16b
- .long 0x4eb5d441 // fsub v1.4s, v2.4s, v21.4s
- .long 0x6e21dea1 // fmul v1.4s, v21.4s, v1.4s
- .long 0x6e23fc21 // fdiv v1.4s, v1.4s, v3.4s
- .long 0x4eb31e77 // mov v23.16b, v19.16b
- .long 0x4e21d6a1 // fadd v1.4s, v21.4s, v1.4s
- .long 0x6e611c57 // bsl v23.16b, v2.16b, v1.16b
- .long 0x4eb5d402 // fsub v2.4s, v0.4s, v21.4s
- .long 0x6e22dea2 // fmul v2.4s, v21.4s, v2.4s
- .long 0x6e23fc42 // fdiv v2.4s, v2.4s, v3.4s
- .long 0x4e22d6a2 // fadd v2.4s, v21.4s, v2.4s
- .long 0x6e621c13 // bsl v19.16b, v0.16b, v2.16b
- .long 0x6eb2e696 // fcmgt v22.4s, v20.4s, v18.4s
- .long 0x4eb5d652 // fsub v18.4s, v18.4s, v21.4s
- .long 0x4eb5d700 // fsub v0.4s, v24.4s, v21.4s
- .long 0x4eb5d6e2 // fsub v2.4s, v23.4s, v21.4s
- .long 0x4eb5d663 // fsub v3.4s, v19.4s, v21.4s
- .long 0x4eb5d694 // fsub v20.4s, v20.4s, v21.4s
- .long 0x6e20de40 // fmul v0.4s, v18.4s, v0.4s
- .long 0x6e22de42 // fmul v2.4s, v18.4s, v2.4s
- .long 0x6e23de43 // fmul v3.4s, v18.4s, v3.4s
- .long 0x6e34fc00 // fdiv v0.4s, v0.4s, v20.4s
- .long 0x6e34fc42 // fdiv v2.4s, v2.4s, v20.4s
- .long 0x6e34fc63 // fdiv v3.4s, v3.4s, v20.4s
+ .long 0x4f03f617 // fmov v23.4s, #1.000000000000000000e+00
+ .long 0x6e35de7b // fmul v27.4s, v19.4s, v21.4s
+ .long 0x6e26dc74 // fmul v20.4s, v3.4s, v6.4s
+ .long 0x6e27dc70 // fmul v16.4s, v3.4s, v7.4s
+ .long 0x4e27d478 // fadd v24.4s, v3.4s, v7.4s
+ .long 0x4e040d19 // dup v25.4s, w8
+ .long 0x4ea7d6fa // fsub v26.4s, v23.4s, v7.4s
+ .long 0x4ea3d6e3 // fsub v3.4s, v23.4s, v3.4s
+ .long 0x6e35dc37 // fmul v23.4s, v1.4s, v21.4s
+ .long 0x4e31ce5b // fmla v27.4s, v18.4s, v17.4s
+ .long 0x4e20ce57 // fmla v23.4s, v18.4s, v0.4s
+ .long 0x4e34cf3b // fmla v27.4s, v25.4s, v20.4s
+ .long 0x6e20df5c // fmul v28.4s, v26.4s, v0.4s
+ .long 0x4e22cf37 // fmla v23.4s, v25.4s, v2.4s
+ .long 0x6ea0fb60 // fneg v0.4s, v27.4s
+ .long 0x6e21df41 // fmul v1.4s, v26.4s, v1.4s
+ .long 0x6e22df5a // fmul v26.4s, v26.4s, v2.4s
+ .long 0x4e37cce0 // fmla v0.4s, v7.4s, v23.4s
+ .long 0x4e23cc9c // fmla v28.4s, v4.4s, v3.4s
+ .long 0x4e23cca1 // fmla v1.4s, v5.4s, v3.4s
+ .long 0x4e23ccda // fmla v26.4s, v6.4s, v3.4s
+ .long 0x4e20d663 // fadd v3.4s, v19.4s, v0.4s
+ .long 0x4e20d622 // fadd v2.4s, v17.4s, v0.4s
+ .long 0x4e20d680 // fadd v0.4s, v20.4s, v0.4s
+ .long 0x6e35dc74 // fmul v20.4s, v3.4s, v21.4s
+ .long 0x4e22ce54 // fmla v20.4s, v18.4s, v2.4s
+ .long 0x4ea0f471 // fmin v17.4s, v3.4s, v0.4s
+ .long 0x4e20cf34 // fmla v20.4s, v25.4s, v0.4s
+ .long 0x4eb1f451 // fmin v17.4s, v2.4s, v17.4s
+ .long 0x4eb4d457 // fsub v23.4s, v2.4s, v20.4s
+ .long 0x6ea0ca32 // fcmge v18.4s, v17.4s, #0.0
+ .long 0x4eb1d691 // fsub v17.4s, v20.4s, v17.4s
+ .long 0x6e37de97 // fmul v23.4s, v20.4s, v23.4s
+ .long 0x6e31fef7 // fdiv v23.4s, v23.4s, v17.4s
+ .long 0x4e20f473 // fmax v19.4s, v3.4s, v0.4s
+ .long 0x4eb21e59 // mov v25.16b, v18.16b
+ .long 0x4e37d697 // fadd v23.4s, v20.4s, v23.4s
+ .long 0x4e33f453 // fmax v19.4s, v2.4s, v19.4s
+ .long 0x6e771c59 // bsl v25.16b, v2.16b, v23.16b
+ .long 0x4eb4d462 // fsub v2.4s, v3.4s, v20.4s
+ .long 0x6e22de82 // fmul v2.4s, v20.4s, v2.4s
+ .long 0x6e31fc42 // fdiv v2.4s, v2.4s, v17.4s
+ .long 0x4eb21e57 // mov v23.16b, v18.16b
+ .long 0x4e22d682 // fadd v2.4s, v20.4s, v2.4s
+ .long 0x6e621c77 // bsl v23.16b, v3.16b, v2.16b
+ .long 0x4eb4d403 // fsub v3.4s, v0.4s, v20.4s
+ .long 0x6e23de83 // fmul v3.4s, v20.4s, v3.4s
+ .long 0x6e31fc63 // fdiv v3.4s, v3.4s, v17.4s
+ .long 0x4e23d683 // fadd v3.4s, v20.4s, v3.4s
+ .long 0x6e631c12 // bsl v18.16b, v0.16b, v3.16b
+ .long 0x4eb4d61b // fsub v27.4s, v16.4s, v20.4s
+ .long 0x4eb4d720 // fsub v0.4s, v25.4s, v20.4s
+ .long 0x4eb4d6e3 // fsub v3.4s, v23.4s, v20.4s
+ .long 0x4eb4d651 // fsub v17.4s, v18.4s, v20.4s
+ .long 0x6eb0e675 // fcmgt v21.4s, v19.4s, v16.4s
+ .long 0x4eb4d673 // fsub v19.4s, v19.4s, v20.4s
+ .long 0x6e20df60 // fmul v0.4s, v27.4s, v0.4s
+ .long 0x6e23df63 // fmul v3.4s, v27.4s, v3.4s
+ .long 0x6e31df71 // fmul v17.4s, v27.4s, v17.4s
+ .long 0x6e33fc00 // fdiv v0.4s, v0.4s, v19.4s
+ .long 0x6e33fc63 // fdiv v3.4s, v3.4s, v19.4s
+ .long 0x6e33fe31 // fdiv v17.4s, v17.4s, v19.4s
.long 0xf8408423 // ldr x3, [x1], #8
- .long 0x4eb61ec1 // mov v1.16b, v22.16b
- .long 0x4eb61ed2 // mov v18.16b, v22.16b
- .long 0x4e20d6a0 // fadd v0.4s, v21.4s, v0.4s
- .long 0x4e22d6a2 // fadd v2.4s, v21.4s, v2.4s
- .long 0x4e23d6a3 // fadd v3.4s, v21.4s, v3.4s
- .long 0x6f00e411 // movi v17.2d, #0x0
- .long 0x6e781c01 // bsl v1.16b, v0.16b, v24.16b
- .long 0x6e771c52 // bsl v18.16b, v2.16b, v23.16b
- .long 0x6e731c76 // bsl v22.16b, v3.16b, v19.16b
- .long 0x4e31f420 // fmax v0.4s, v1.4s, v17.4s
- .long 0x4e31f641 // fmax v1.4s, v18.4s, v17.4s
- .long 0x4e31f6c2 // fmax v2.4s, v22.4s, v17.4s
- .long 0x6e20de00 // fmul v0.4s, v16.4s, v0.4s
- .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s
- .long 0x6e22de02 // fmul v2.4s, v16.4s, v2.4s
- .long 0x4eb01e03 // mov v3.16b, v16.16b
+ .long 0x4eb51ea2 // mov v2.16b, v21.16b
+ .long 0x4eb51ebb // mov v27.16b, v21.16b
+ .long 0x4e20d680 // fadd v0.4s, v20.4s, v0.4s
+ .long 0x4e23d683 // fadd v3.4s, v20.4s, v3.4s
+ .long 0x4e31d691 // fadd v17.4s, v20.4s, v17.4s
+ .long 0x6f00e416 // movi v22.2d, #0x0
+ .long 0x6e791c02 // bsl v2.16b, v0.16b, v25.16b
+ .long 0x6e771c7b // bsl v27.16b, v3.16b, v23.16b
+ .long 0x6e721e35 // bsl v21.16b, v17.16b, v18.16b
+ .long 0x4e36f440 // fmax v0.4s, v2.4s, v22.4s
+ .long 0x4e36f762 // fmax v2.4s, v27.4s, v22.4s
+ .long 0x4e36f6a3 // fmax v3.4s, v21.4s, v22.4s
+ .long 0x4e20d780 // fadd v0.4s, v28.4s, v0.4s
+ .long 0x4e22d421 // fadd v1.4s, v1.4s, v2.4s
+ .long 0x4e23d742 // fadd v2.4s, v26.4s, v3.4s
+ .long 0x4eb0d703 // fsub v3.4s, v24.4s, v16.4s
.long 0xd61f0060 // br x3
HIDDEN _sk_clamp_0_aarch64
@@ -2660,9 +2686,9 @@ FUNCTION(_sk_gather_i8_aarch64)
_sk_gather_i8_aarch64:
.long 0xaa0103e8 // mov x8, x1
.long 0xf8408429 // ldr x9, [x1], #8
- .long 0xb4000069 // cbz x9, 23b4 <sk_gather_i8_aarch64+0x14>
+ .long 0xb4000069 // cbz x9, 241c <sk_gather_i8_aarch64+0x14>
.long 0xaa0903ea // mov x10, x9
- .long 0x14000003 // b 23bc <sk_gather_i8_aarch64+0x1c>
+ .long 0x14000003 // b 2424 <sk_gather_i8_aarch64+0x1c>
.long 0xf940050a // ldr x10, [x8, #8]
.long 0x91004101 // add x1, x8, #0x10
.long 0xf8410548 // ldr x8, [x10], #16
@@ -3499,7 +3525,7 @@ _sk_gradient_aarch64:
.long 0x4d40c902 // ld1r {v2.4s}, [x8]
.long 0xf9400128 // ldr x8, [x9]
.long 0x4d40c943 // ld1r {v3.4s}, [x10]
- .long 0xb40006c8 // cbz x8, 2f58 <sk_gradient_aarch64+0x100>
+ .long 0xb40006c8 // cbz x8, 2fc0 <sk_gradient_aarch64+0x100>
.long 0x6dbf23e9 // stp d9, d8, [sp, #-16]!
.long 0xf9400529 // ldr x9, [x9, #8]
.long 0x6f00e413 // movi v19.2d, #0x0
@@ -3550,9 +3576,9 @@ _sk_gradient_aarch64:
.long 0xd1000508 // sub x8, x8, #0x1
.long 0x6e771fd0 // bsl v16.16b, v30.16b, v23.16b
.long 0x91009129 // add x9, x9, #0x24
- .long 0xb5fffaa8 // cbnz x8, 2ea0 <sk_gradient_aarch64+0x48>
+ .long 0xb5fffaa8 // cbnz x8, 2f08 <sk_gradient_aarch64+0x48>
.long 0x6cc123e9 // ldp d9, d8, [sp], #16
- .long 0x14000005 // b 2f68 <sk_gradient_aarch64+0x110>
+ .long 0x14000005 // b 2fd0 <sk_gradient_aarch64+0x110>
.long 0x6f00e414 // movi v20.2d, #0x0
.long 0x6f00e412 // movi v18.2d, #0x0
.long 0x6f00e411 // movi v17.2d, #0x0
@@ -4811,127 +4837,135 @@ HIDDEN _sk_hue_vfp4
.globl _sk_hue_vfp4
FUNCTION(_sk_hue_vfp4)
_sk_hue_vfp4:
- .long 0xed2d8b04 // vpush {d8-d9}
- .long 0xeeb78a00 // vmov.f32 s16, #112
- .long 0xf3f91503 // vceq.f32 d17, d3, #0
- .long 0xf2c00010 // vmov.i32 d16, #0
- .long 0xeddf9b78 // vldr d25, [pc, #480]
- .long 0xf2655f06 // vmin.f32 d21, d5, d6
+ .long 0xed2d8b0c // vpush {d8-d13}
+ .long 0xf3420d13 // vmul.f32 d16, d2, d3
.long 0xe4913004 // ldr r3, [r1], #4
- .long 0xf2456f06 // vmax.f32 d22, d5, d6
- .long 0xf346bd39 // vmul.f32 d27, d6, d25
- .long 0xf2645f25 // vmin.f32 d21, d4, d21
- .long 0xeec89a23 // vdiv.f32 s19, s16, s7
- .long 0xee889a03 // vdiv.f32 s18, s16, s6
- .long 0xf3501199 // vbsl d17, d16, d9
- .long 0xf2446f26 // vmax.f32 d22, d4, d22
- .long 0xf3412d92 // vmul.f32 d18, d17, d2
- .long 0xf3413d91 // vmul.f32 d19, d17, d1
- .long 0xf3411d90 // vmul.f32 d17, d17, d0
- .long 0xf2665da5 // vsub.f32 d21, d22, d21
- .long 0xf2634fa2 // vmin.f32 d20, d19, d18
- .long 0xf2437fa2 // vmax.f32 d23, d19, d18
- .long 0xf2614fa4 // vmin.f32 d20, d17, d20
- .long 0xf2417fa7 // vmax.f32 d23, d17, d23
- .long 0xf2633da4 // vsub.f32 d19, d19, d20
- .long 0xf2270da4 // vsub.f32 d0, d23, d20
- .long 0xf2611da4 // vsub.f32 d17, d17, d20
- .long 0xf2622da4 // vsub.f32 d18, d18, d20
- .long 0xeddf4b60 // vldr d20, [pc, #384]
- .long 0xf3051db3 // vmul.f32 d1, d21, d19
- .long 0xf3447d34 // vmul.f32 d23, d4, d20
- .long 0xf3052db1 // vmul.f32 d2, d21, d17
- .long 0xeddf1b5a // vldr d17, [pc, #360]
- .long 0xf3058db2 // vmul.f32 d8, d21, d18
- .long 0xf3f92500 // vceq.f32 d18, d0, #0
- .long 0xf26231b2 // vorr d19, d18, d18
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf26251b2 // vorr d21, d18, d18
- .long 0xf3503199 // vbsl d19, d16, d9
- .long 0xf3505191 // vbsl d21, d16, d1
- .long 0xf3456d31 // vmul.f32 d22, d5, d17
- .long 0xf3438db1 // vmul.f32 d24, d19, d17
- .long 0xf345adb4 // vmul.f32 d26, d21, d20
- .long 0xf3502192 // vbsl d18, d16, d2
- .long 0xf2476da6 // vadd.f32 d22, d23, d22
- .long 0xf3427db9 // vmul.f32 d23, d18, d25
- .long 0xf24a8da8 // vadd.f32 d24, d26, d24
- .long 0xf2466dab // vadd.f32 d22, d22, d27
- .long 0xf2487da7 // vadd.f32 d23, d24, d23
- .long 0xf2666da7 // vsub.f32 d22, d22, d23
- .long 0xf2433da6 // vadd.f32 d19, d19, d22
- .long 0xf2455da6 // vadd.f32 d21, d21, d22
- .long 0xf2422da6 // vadd.f32 d18, d18, d22
- .long 0xf3431db1 // vmul.f32 d17, d19, d17
- .long 0xf3454db4 // vmul.f32 d20, d21, d20
- .long 0xf3426db9 // vmul.f32 d22, d18, d25
- .long 0xf2441da1 // vadd.f32 d17, d20, d17
- .long 0xf2634fa2 // vmin.f32 d20, d19, d18
- .long 0xf2461da1 // vadd.f32 d17, d22, d17
- .long 0xf2654fa4 // vmin.f32 d20, d21, d20
- .long 0xf2636da1 // vsub.f32 d22, d19, d17
- .long 0xf2210da4 // vsub.f32 d0, d17, d20
- .long 0xf3f944a4 // vcge.f32 d20, d20, #0
- .long 0xf2627da1 // vsub.f32 d23, d18, d17
- .long 0xf2658da1 // vsub.f32 d24, d21, d17
+ .long 0xf3411d13 // vmul.f32 d17, d1, d3
+ .long 0xf2652f06 // vmin.f32 d18, d5, d6
+ .long 0xf2453f06 // vmax.f32 d19, d5, d6
+ .long 0xf3404d13 // vmul.f32 d20, d0, d3
+ .long 0xf2615fa0 // vmin.f32 d21, d17, d16
+ .long 0xf2642f22 // vmin.f32 d18, d4, d18
+ .long 0xf2443f23 // vmax.f32 d19, d4, d19
+ .long 0xf2416fa0 // vmax.f32 d22, d17, d16
+ .long 0xf2645fa5 // vmin.f32 d21, d20, d21
+ .long 0xf2632da2 // vsub.f32 d18, d19, d18
+ .long 0xf2443fa6 // vmax.f32 d19, d20, d22
+ .long 0xeddf6b76 // vldr d22, [pc, #472]
+ .long 0xf2611da5 // vsub.f32 d17, d17, d21
+ .long 0xf2644da5 // vsub.f32 d20, d20, d21
+ .long 0xf3422d93 // vmul.f32 d18, d18, d3
+ .long 0xf2238da5 // vsub.f32 d8, d19, d21
+ .long 0xf2600da5 // vsub.f32 d16, d16, d21
+ .long 0xf3f97508 // vceq.f32 d23, d8, #0
+ .long 0xf26751b7 // vorr d21, d23, d23
+ .long 0xf3029db1 // vmul.f32 d9, d18, d17
+ .long 0xeddf1b69 // vldr d17, [pc, #420]
+ .long 0xf302adb4 // vmul.f32 d10, d18, d20
+ .long 0xf3453d31 // vmul.f32 d19, d5, d17
+ .long 0xf302bdb0 // vmul.f32 d11, d18, d16
+ .long 0xeddf2b67 // vldr d18, [pc, #412]
+ .long 0xf2c00010 // vmov.i32 d16, #0
+ .long 0xeec9caa8 // vdiv.f32 s25, s19, s17
+ .long 0xee89ca08 // vdiv.f32 s24, s18, s16
+ .long 0xeeca9aa8 // vdiv.f32 s19, s21, s17
+ .long 0xee8a9a08 // vdiv.f32 s18, s20, s16
+ .long 0xeecbaaa8 // vdiv.f32 s21, s23, s17
+ .long 0xee8baa08 // vdiv.f32 s20, s22, s16
+ .long 0xf3444d32 // vmul.f32 d20, d4, d18
+ .long 0xf350519c // vbsl d21, d16, d12
+ .long 0xf3468d36 // vmul.f32 d24, d6, d22
+ .long 0xf3459db1 // vmul.f32 d25, d21, d17
+ .long 0xf2443da3 // vadd.f32 d19, d20, d19
+ .long 0xf26741b7 // vorr d20, d23, d23
+ .long 0xf350719a // vbsl d23, d16, d10
+ .long 0xf3504199 // vbsl d20, d16, d9
+ .long 0xf2433da8 // vadd.f32 d19, d19, d24
+ .long 0xf344adb2 // vmul.f32 d26, d20, d18
+ .long 0xf3478db6 // vmul.f32 d24, d23, d22
+ .long 0xf3433d93 // vmul.f32 d19, d19, d3
+ .long 0xf24a9da9 // vadd.f32 d25, d26, d25
+ .long 0xf2498da8 // vadd.f32 d24, d25, d24
+ .long 0xf2633da8 // vsub.f32 d19, d19, d24
+ .long 0xf2458da3 // vadd.f32 d24, d21, d19
+ .long 0xf2445da3 // vadd.f32 d21, d20, d19
+ .long 0xf2477da3 // vadd.f32 d23, d23, d19
+ .long 0xf3481db1 // vmul.f32 d17, d24, d17
+ .long 0xf3452db2 // vmul.f32 d18, d21, d18
+ .long 0xf3473db6 // vmul.f32 d19, d23, d22
+ .long 0xf2684fa7 // vmin.f32 d20, d24, d23
+ .long 0xf2486fa7 // vmax.f32 d22, d24, d23
+ .long 0xf2421da1 // vadd.f32 d17, d18, d17
+ .long 0xf2456fa6 // vmax.f32 d22, d21, d22
+ .long 0xf2432da1 // vadd.f32 d18, d19, d17
+ .long 0xf2653fa4 // vmin.f32 d19, d21, d20
+ .long 0xf3f944a3 // vcge.f32 d20, d19, #0
.long 0xf264a1b4 // vorr d26, d20, d20
- .long 0xf3011db6 // vmul.f32 d1, d17, d22
- .long 0xf2436fa2 // vmax.f32 d22, d19, d18
- .long 0xf3012db7 // vmul.f32 d2, d17, d23
- .long 0xf3018db8 // vmul.f32 d8, d17, d24
- .long 0xf264b1b4 // vorr d27, d20, d20
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2419d82 // vadd.f32 d25, d17, d2
- .long 0xf355a1b9 // vbsl d26, d21, d25
- .long 0xf2418d81 // vadd.f32 d24, d17, d1
- .long 0xf2c79f10 // vmov.f32 d25, #1
- .long 0xf2417d89 // vadd.f32 d23, d17, d9
- .long 0xf35241b8 // vbsl d20, d18, d24
- .long 0xf26a2da1 // vsub.f32 d18, d26, d17
- .long 0xf353b1b7 // vbsl d27, d19, d23
- .long 0xf2453fa6 // vmax.f32 d19, d21, d22
- .long 0xf2695da1 // vsub.f32 d21, d25, d17
- .long 0xf26b6da1 // vsub.f32 d22, d27, d17
- .long 0xf2647da1 // vsub.f32 d23, d20, d17
- .long 0xf2230da1 // vsub.f32 d0, d19, d17
- .long 0xf3051db2 // vmul.f32 d1, d21, d18
- .long 0xf3632ea9 // vcgt.f32 d18, d19, d25
- .long 0xf3052db6 // vmul.f32 d2, d21, d22
- .long 0xf3058db7 // vmul.f32 d8, d21, d23
- .long 0xf3436d17 // vmul.f32 d22, d3, d7
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2413d89 // vadd.f32 d19, d17, d9
- .long 0xf26281b2 // vorr d24, d18, d18
- .long 0xf2415d81 // vadd.f32 d21, d17, d1
- .long 0xf2411d82 // vadd.f32 d17, d17, d2
- .long 0xf35381ba // vbsl d24, d19, d26
- .long 0xf26231b2 // vorr d19, d18, d18
- .long 0xf2437d07 // vadd.f32 d23, d3, d7
- .long 0xf35531bb // vbsl d19, d21, d27
- .long 0xf35121b4 // vbsl d18, d17, d20
- .long 0xf2481fa0 // vmax.f32 d17, d24, d16
- .long 0xf2433fa0 // vmax.f32 d19, d19, d16
- .long 0xf2420fa0 // vmax.f32 d16, d18, d16
- .long 0xf2273da6 // vsub.f32 d3, d23, d22
- .long 0xf3030d31 // vmul.f32 d0, d3, d17
- .long 0xf3031d33 // vmul.f32 d1, d3, d19
- .long 0xf3032d30 // vmul.f32 d2, d3, d16
- .long 0xecbd8b04 // vpop {d8-d9}
+ .long 0xf2671da2 // vsub.f32 d17, d23, d18
+ .long 0xf2228da3 // vsub.f32 d8, d18, d19
+ .long 0xf26431b4 // vorr d19, d20, d20
+ .long 0xf3029db1 // vmul.f32 d9, d18, d17
+ .long 0xf3431d17 // vmul.f32 d17, d3, d7
+ .long 0xeec9aaa8 // vdiv.f32 s21, s19, s17
+ .long 0xee89aa08 // vdiv.f32 s20, s18, s16
+ .long 0xf2429d8a // vadd.f32 d25, d18, d10
+ .long 0xf35731b9 // vbsl d19, d23, d25
+ .long 0xf2619da2 // vsub.f32 d25, d17, d18
+ .long 0xf2637da2 // vsub.f32 d23, d19, d18
+ .long 0xf226ada2 // vsub.f32 d10, d22, d18
+ .long 0xf309bdb7 // vmul.f32 d11, d25, d23
+ .long 0xf2687da2 // vsub.f32 d23, d24, d18
+ .long 0xeecb9aaa // vdiv.f32 s19, s23, s21
+ .long 0xee8b9a0a // vdiv.f32 s18, s22, s20
+ .long 0xf302bdb7 // vmul.f32 d11, d18, d23
+ .long 0xeecbcaa8 // vdiv.f32 s25, s23, s17
+ .long 0xee8bca08 // vdiv.f32 s24, s22, s16
+ .long 0xf2427d8c // vadd.f32 d23, d18, d12
+ .long 0xf358a1b7 // vbsl d26, d24, d23
+ .long 0xf26a7da2 // vsub.f32 d23, d26, d18
+ .long 0xf309bdb7 // vmul.f32 d11, d25, d23
+ .long 0xf2657da2 // vsub.f32 d23, d21, d18
+ .long 0xeecbcaaa // vdiv.f32 s25, s23, s21
+ .long 0xee8bca0a // vdiv.f32 s24, s22, s20
+ .long 0xf302bdb7 // vmul.f32 d11, d18, d23
+ .long 0xf2428d8c // vadd.f32 d24, d18, d12
+ .long 0xeecbdaa8 // vdiv.f32 s27, s23, s17
+ .long 0xee8bda08 // vdiv.f32 s26, s22, s16
+ .long 0xf2427d8d // vadd.f32 d23, d18, d13
+ .long 0xf35541b7 // vbsl d20, d21, d23
+ .long 0xf2c77f10 // vmov.f32 d23, #1
+ .long 0xf2645da2 // vsub.f32 d21, d20, d18
+ .long 0xf3098db5 // vmul.f32 d8, d25, d21
+ .long 0xf3665ea1 // vcgt.f32 d21, d22, d17
+ .long 0xf2679d87 // vsub.f32 d25, d23, d7
+ .long 0xf2677d83 // vsub.f32 d23, d23, d3
+ .long 0xeec8baaa // vdiv.f32 s23, s17, s21
+ .long 0xee88ba0a // vdiv.f32 s22, s16, s20
+ .long 0xf2426d8b // vadd.f32 d22, d18, d11
+ .long 0xf265f1b5 // vorr d31, d21, d21
+ .long 0xf2422d89 // vadd.f32 d18, d18, d9
+ .long 0xf349bd90 // vmul.f32 d27, d25, d0
+ .long 0xf356f1b4 // vbsl d31, d22, d20
+ .long 0xf347cd94 // vmul.f32 d28, d23, d4
+ .long 0xf349dd91 // vmul.f32 d29, d25, d1
+ .long 0xf3494d92 // vmul.f32 d20, d25, d2
+ .long 0xf3476d96 // vmul.f32 d22, d23, d6
+ .long 0xf347ed95 // vmul.f32 d30, d23, d5
+ .long 0xf26571b5 // vorr d23, d21, d21
+ .long 0xf35251b3 // vbsl d21, d18, d19
+ .long 0xf35871ba // vbsl d23, d24, d26
+ .long 0xf2438d07 // vadd.f32 d24, d3, d7
+ .long 0xf24c9dab // vadd.f32 d25, d28, d27
+ .long 0xf24f2fa0 // vmax.f32 d18, d31, d16
+ .long 0xf2477fa0 // vmax.f32 d23, d23, d16
+ .long 0xf24e3dad // vadd.f32 d19, d30, d29
+ .long 0xf2464da4 // vadd.f32 d20, d22, d20
+ .long 0xf2450fa0 // vmax.f32 d16, d21, d16
+ .long 0xf2283da1 // vsub.f32 d3, d24, d17
+ .long 0xf2090da2 // vadd.f32 d0, d25, d18
+ .long 0xf2031da7 // vadd.f32 d1, d19, d23
+ .long 0xf2042da0 // vadd.f32 d2, d20, d16
+ .long 0xecbd8b0c // vpop {d8-d13}
.long 0xe12fff13 // bx r3
.long 0x3f170a3d // .word 0x3f170a3d
.long 0x3f170a3d // .word 0x3f170a3d
@@ -4944,127 +4978,135 @@ HIDDEN _sk_saturation_vfp4
.globl _sk_saturation_vfp4
FUNCTION(_sk_saturation_vfp4)
_sk_saturation_vfp4:
- .long 0xed2d8b04 // vpush {d8-d9}
- .long 0xeeb78a00 // vmov.f32 s16, #112
- .long 0xf3f91507 // vceq.f32 d17, d7, #0
- .long 0xf2c00010 // vmov.i32 d16, #0
- .long 0xeddf9b78 // vldr d25, [pc, #480]
- .long 0xf2615f02 // vmin.f32 d21, d1, d2
+ .long 0xed2d8b0c // vpush {d8-d13}
+ .long 0xf3430d16 // vmul.f32 d16, d3, d6
+ .long 0xeddf7b82 // vldr d23, [pc, #520]
+ .long 0xf3431d15 // vmul.f32 d17, d3, d5
.long 0xe4913004 // ldr r3, [r1], #4
- .long 0xf2416f02 // vmax.f32 d22, d1, d2
- .long 0xf346bd39 // vmul.f32 d27, d6, d25
- .long 0xf2605f25 // vmin.f32 d21, d0, d21
- .long 0xeec89a27 // vdiv.f32 s19, s16, s15
- .long 0xee889a07 // vdiv.f32 s18, s16, s14
- .long 0xf3501199 // vbsl d17, d16, d9
- .long 0xf2406f26 // vmax.f32 d22, d0, d22
- .long 0xf3412d96 // vmul.f32 d18, d17, d6
- .long 0xf3413d95 // vmul.f32 d19, d17, d5
- .long 0xf3411d94 // vmul.f32 d17, d17, d4
- .long 0xf2665da5 // vsub.f32 d21, d22, d21
- .long 0xf2634fa2 // vmin.f32 d20, d19, d18
- .long 0xf2437fa2 // vmax.f32 d23, d19, d18
- .long 0xf2614fa4 // vmin.f32 d20, d17, d20
- .long 0xf2417fa7 // vmax.f32 d23, d17, d23
- .long 0xf2633da4 // vsub.f32 d19, d19, d20
- .long 0xf2270da4 // vsub.f32 d0, d23, d20
- .long 0xf2611da4 // vsub.f32 d17, d17, d20
- .long 0xf2622da4 // vsub.f32 d18, d18, d20
- .long 0xeddf4b60 // vldr d20, [pc, #384]
- .long 0xf3051db3 // vmul.f32 d1, d21, d19
- .long 0xf3447d34 // vmul.f32 d23, d4, d20
- .long 0xf3052db1 // vmul.f32 d2, d21, d17
- .long 0xeddf1b5a // vldr d17, [pc, #360]
- .long 0xf3058db2 // vmul.f32 d8, d21, d18
- .long 0xf3f92500 // vceq.f32 d18, d0, #0
- .long 0xf26231b2 // vorr d19, d18, d18
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf26251b2 // vorr d21, d18, d18
- .long 0xf3503199 // vbsl d19, d16, d9
- .long 0xf3505191 // vbsl d21, d16, d1
- .long 0xf3456d31 // vmul.f32 d22, d5, d17
- .long 0xf3438db1 // vmul.f32 d24, d19, d17
- .long 0xf345adb4 // vmul.f32 d26, d21, d20
- .long 0xf3502192 // vbsl d18, d16, d2
- .long 0xf2476da6 // vadd.f32 d22, d23, d22
- .long 0xf3427db9 // vmul.f32 d23, d18, d25
- .long 0xf24a8da8 // vadd.f32 d24, d26, d24
- .long 0xf2466dab // vadd.f32 d22, d22, d27
- .long 0xf2487da7 // vadd.f32 d23, d24, d23
- .long 0xf2666da7 // vsub.f32 d22, d22, d23
- .long 0xf2433da6 // vadd.f32 d19, d19, d22
- .long 0xf2455da6 // vadd.f32 d21, d21, d22
- .long 0xf2422da6 // vadd.f32 d18, d18, d22
- .long 0xf3431db1 // vmul.f32 d17, d19, d17
- .long 0xf3454db4 // vmul.f32 d20, d21, d20
- .long 0xf3426db9 // vmul.f32 d22, d18, d25
- .long 0xf2441da1 // vadd.f32 d17, d20, d17
- .long 0xf2634fa2 // vmin.f32 d20, d19, d18
- .long 0xf2461da1 // vadd.f32 d17, d22, d17
- .long 0xf2654fa4 // vmin.f32 d20, d21, d20
- .long 0xf2636da1 // vsub.f32 d22, d19, d17
- .long 0xf2210da4 // vsub.f32 d0, d17, d20
- .long 0xf3f944a4 // vcge.f32 d20, d20, #0
- .long 0xf2627da1 // vsub.f32 d23, d18, d17
- .long 0xf2658da1 // vsub.f32 d24, d21, d17
+ .long 0xf2612f02 // vmin.f32 d18, d1, d2
+ .long 0xf2413f02 // vmax.f32 d19, d1, d2
+ .long 0xf3434d14 // vmul.f32 d20, d3, d4
+ .long 0xf2615fa0 // vmin.f32 d21, d17, d16
+ .long 0xf2602f22 // vmin.f32 d18, d0, d18
+ .long 0xf2403f23 // vmax.f32 d19, d0, d19
+ .long 0xf2416fa0 // vmax.f32 d22, d17, d16
+ .long 0xf2645fa5 // vmin.f32 d21, d20, d21
+ .long 0xf3468d37 // vmul.f32 d24, d6, d23
+ .long 0xf2632da2 // vsub.f32 d18, d19, d18
+ .long 0xf2443fa6 // vmax.f32 d19, d20, d22
+ .long 0xf2611da5 // vsub.f32 d17, d17, d21
+ .long 0xf2644da5 // vsub.f32 d20, d20, d21
+ .long 0xf3422d97 // vmul.f32 d18, d18, d7
+ .long 0xf2238da5 // vsub.f32 d8, d19, d21
+ .long 0xf2600da5 // vsub.f32 d16, d16, d21
+ .long 0xf3f96508 // vceq.f32 d22, d8, #0
+ .long 0xf26651b6 // vorr d21, d22, d22
+ .long 0xf3029db1 // vmul.f32 d9, d18, d17
+ .long 0xeddf1b68 // vldr d17, [pc, #416]
+ .long 0xf302adb4 // vmul.f32 d10, d18, d20
+ .long 0xf3453d31 // vmul.f32 d19, d5, d17
+ .long 0xf302bdb0 // vmul.f32 d11, d18, d16
+ .long 0xeddf2b66 // vldr d18, [pc, #408]
+ .long 0xf2c00010 // vmov.i32 d16, #0
+ .long 0xeec9caa8 // vdiv.f32 s25, s19, s17
+ .long 0xee89ca08 // vdiv.f32 s24, s18, s16
+ .long 0xeeca9aa8 // vdiv.f32 s19, s21, s17
+ .long 0xee8a9a08 // vdiv.f32 s18, s20, s16
+ .long 0xeecbaaa8 // vdiv.f32 s21, s23, s17
+ .long 0xee8baa08 // vdiv.f32 s20, s22, s16
+ .long 0xf3444d32 // vmul.f32 d20, d4, d18
+ .long 0xf350519c // vbsl d21, d16, d12
+ .long 0xf3459db1 // vmul.f32 d25, d21, d17
+ .long 0xf2443da3 // vadd.f32 d19, d20, d19
+ .long 0xf26641b6 // vorr d20, d22, d22
+ .long 0xf350619a // vbsl d22, d16, d10
+ .long 0xf3504199 // vbsl d20, d16, d9
+ .long 0xf2433da8 // vadd.f32 d19, d19, d24
+ .long 0xf344adb2 // vmul.f32 d26, d20, d18
+ .long 0xf3468db7 // vmul.f32 d24, d22, d23
+ .long 0xf3433d93 // vmul.f32 d19, d19, d3
+ .long 0xf24a9da9 // vadd.f32 d25, d26, d25
+ .long 0xf2498da8 // vadd.f32 d24, d25, d24
+ .long 0xf2633da8 // vsub.f32 d19, d19, d24
+ .long 0xf2458da3 // vadd.f32 d24, d21, d19
+ .long 0xf2445da3 // vadd.f32 d21, d20, d19
+ .long 0xf2466da3 // vadd.f32 d22, d22, d19
+ .long 0xf3481db1 // vmul.f32 d17, d24, d17
+ .long 0xf3452db2 // vmul.f32 d18, d21, d18
+ .long 0xf3463db7 // vmul.f32 d19, d22, d23
+ .long 0xf2684fa6 // vmin.f32 d20, d24, d22
+ .long 0xf2487fa6 // vmax.f32 d23, d24, d22
+ .long 0xf2421da1 // vadd.f32 d17, d18, d17
+ .long 0xf2457fa7 // vmax.f32 d23, d21, d23
+ .long 0xf2432da1 // vadd.f32 d18, d19, d17
+ .long 0xf2653fa4 // vmin.f32 d19, d21, d20
+ .long 0xf3f944a3 // vcge.f32 d20, d19, #0
.long 0xf264a1b4 // vorr d26, d20, d20
- .long 0xf3011db6 // vmul.f32 d1, d17, d22
- .long 0xf2436fa2 // vmax.f32 d22, d19, d18
- .long 0xf3012db7 // vmul.f32 d2, d17, d23
- .long 0xf3018db8 // vmul.f32 d8, d17, d24
- .long 0xf264b1b4 // vorr d27, d20, d20
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2419d82 // vadd.f32 d25, d17, d2
- .long 0xf355a1b9 // vbsl d26, d21, d25
- .long 0xf2418d81 // vadd.f32 d24, d17, d1
- .long 0xf2c79f10 // vmov.f32 d25, #1
- .long 0xf2417d89 // vadd.f32 d23, d17, d9
- .long 0xf35241b8 // vbsl d20, d18, d24
- .long 0xf26a2da1 // vsub.f32 d18, d26, d17
- .long 0xf353b1b7 // vbsl d27, d19, d23
- .long 0xf2453fa6 // vmax.f32 d19, d21, d22
- .long 0xf2695da1 // vsub.f32 d21, d25, d17
- .long 0xf26b6da1 // vsub.f32 d22, d27, d17
- .long 0xf2647da1 // vsub.f32 d23, d20, d17
- .long 0xf2230da1 // vsub.f32 d0, d19, d17
- .long 0xf3051db2 // vmul.f32 d1, d21, d18
- .long 0xf3632ea9 // vcgt.f32 d18, d19, d25
- .long 0xf3052db6 // vmul.f32 d2, d21, d22
- .long 0xf3058db7 // vmul.f32 d8, d21, d23
- .long 0xf3436d17 // vmul.f32 d22, d3, d7
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2413d89 // vadd.f32 d19, d17, d9
- .long 0xf26281b2 // vorr d24, d18, d18
- .long 0xf2415d81 // vadd.f32 d21, d17, d1
- .long 0xf2411d82 // vadd.f32 d17, d17, d2
- .long 0xf35381ba // vbsl d24, d19, d26
- .long 0xf26231b2 // vorr d19, d18, d18
- .long 0xf2437d07 // vadd.f32 d23, d3, d7
- .long 0xf35531bb // vbsl d19, d21, d27
- .long 0xf35121b4 // vbsl d18, d17, d20
- .long 0xf2481fa0 // vmax.f32 d17, d24, d16
- .long 0xf2433fa0 // vmax.f32 d19, d19, d16
- .long 0xf2420fa0 // vmax.f32 d16, d18, d16
- .long 0xf2273da6 // vsub.f32 d3, d23, d22
- .long 0xf3030d31 // vmul.f32 d0, d3, d17
- .long 0xf3031d33 // vmul.f32 d1, d3, d19
- .long 0xf3032d30 // vmul.f32 d2, d3, d16
- .long 0xecbd8b04 // vpop {d8-d9}
+ .long 0xf2661da2 // vsub.f32 d17, d22, d18
+ .long 0xf2228da3 // vsub.f32 d8, d18, d19
+ .long 0xf26431b4 // vorr d19, d20, d20
+ .long 0xf3029db1 // vmul.f32 d9, d18, d17
+ .long 0xf3431d17 // vmul.f32 d17, d3, d7
+ .long 0xeec9aaa8 // vdiv.f32 s21, s19, s17
+ .long 0xee89aa08 // vdiv.f32 s20, s18, s16
+ .long 0xf2429d8a // vadd.f32 d25, d18, d10
+ .long 0xf35631b9 // vbsl d19, d22, d25
+ .long 0xf2619da2 // vsub.f32 d25, d17, d18
+ .long 0xf2636da2 // vsub.f32 d22, d19, d18
+ .long 0xf227ada2 // vsub.f32 d10, d23, d18
+ .long 0xf309bdb6 // vmul.f32 d11, d25, d22
+ .long 0xf2686da2 // vsub.f32 d22, d24, d18
+ .long 0xeecb9aaa // vdiv.f32 s19, s23, s21
+ .long 0xee8b9a0a // vdiv.f32 s18, s22, s20
+ .long 0xf302bdb6 // vmul.f32 d11, d18, d22
+ .long 0xeecbcaa8 // vdiv.f32 s25, s23, s17
+ .long 0xee8bca08 // vdiv.f32 s24, s22, s16
+ .long 0xf2426d8c // vadd.f32 d22, d18, d12
+ .long 0xf358a1b6 // vbsl d26, d24, d22
+ .long 0xf26a6da2 // vsub.f32 d22, d26, d18
+ .long 0xf309bdb6 // vmul.f32 d11, d25, d22
+ .long 0xf2656da2 // vsub.f32 d22, d21, d18
+ .long 0xeecbcaaa // vdiv.f32 s25, s23, s21
+ .long 0xee8bca0a // vdiv.f32 s24, s22, s20
+ .long 0xf302bdb6 // vmul.f32 d11, d18, d22
+ .long 0xf2428d8c // vadd.f32 d24, d18, d12
+ .long 0xeecbdaa8 // vdiv.f32 s27, s23, s17
+ .long 0xee8bda08 // vdiv.f32 s26, s22, s16
+ .long 0xf2426d8d // vadd.f32 d22, d18, d13
+ .long 0xf35541b6 // vbsl d20, d21, d22
+ .long 0xf2645da2 // vsub.f32 d21, d20, d18
+ .long 0xf3098db5 // vmul.f32 d8, d25, d21
+ .long 0xf3675ea1 // vcgt.f32 d21, d23, d17
+ .long 0xf2c77f10 // vmov.f32 d23, #1
+ .long 0xf2679d87 // vsub.f32 d25, d23, d7
+ .long 0xeec8baaa // vdiv.f32 s23, s17, s21
+ .long 0xee88ba0a // vdiv.f32 s22, s16, s20
+ .long 0xf2677d83 // vsub.f32 d23, d23, d3
+ .long 0xf2426d8b // vadd.f32 d22, d18, d11
+ .long 0xf265f1b5 // vorr d31, d21, d21
+ .long 0xf2422d89 // vadd.f32 d18, d18, d9
+ .long 0xf349bd90 // vmul.f32 d27, d25, d0
+ .long 0xf356f1b4 // vbsl d31, d22, d20
+ .long 0xf347cd94 // vmul.f32 d28, d23, d4
+ .long 0xf349dd91 // vmul.f32 d29, d25, d1
+ .long 0xf3494d92 // vmul.f32 d20, d25, d2
+ .long 0xf3476d96 // vmul.f32 d22, d23, d6
+ .long 0xf347ed95 // vmul.f32 d30, d23, d5
+ .long 0xf26571b5 // vorr d23, d21, d21
+ .long 0xf35251b3 // vbsl d21, d18, d19
+ .long 0xf35871ba // vbsl d23, d24, d26
+ .long 0xf2438d07 // vadd.f32 d24, d3, d7
+ .long 0xf24c9dab // vadd.f32 d25, d28, d27
+ .long 0xf24f2fa0 // vmax.f32 d18, d31, d16
+ .long 0xf2477fa0 // vmax.f32 d23, d23, d16
+ .long 0xf24e3dad // vadd.f32 d19, d30, d29
+ .long 0xf2464da4 // vadd.f32 d20, d22, d20
+ .long 0xf2450fa0 // vmax.f32 d16, d21, d16
+ .long 0xf2283da1 // vsub.f32 d3, d24, d17
+ .long 0xf2090da2 // vadd.f32 d0, d25, d18
+ .long 0xf2031da7 // vadd.f32 d1, d19, d23
+ .long 0xf2042da0 // vadd.f32 d2, d20, d16
+ .long 0xecbd8b0c // vpop {d8-d13}
.long 0xe12fff13 // bx r3
.long 0x3f170a3d // .word 0x3f170a3d
.long 0x3f170a3d // .word 0x3f170a3d
@@ -5077,100 +5119,108 @@ HIDDEN _sk_color_vfp4
.globl _sk_color_vfp4
FUNCTION(_sk_color_vfp4)
_sk_color_vfp4:
- .long 0xed2d8b04 // vpush {d8-d9}
- .long 0xeeb78a00 // vmov.f32 s16, #112
- .long 0xf3f91503 // vceq.f32 d17, d3, #0
- .long 0xf2c00010 // vmov.i32 d16, #0
- .long 0xeddf2b58 // vldr d18, [pc, #352]
- .long 0xeddf4b59 // vldr d20, [pc, #356]
- .long 0xf3456d32 // vmul.f32 d22, d5, d18
- .long 0xeddf8b59 // vldr d24, [pc, #356]
- .long 0xf3447d34 // vmul.f32 d23, d4, d20
+ .long 0xed2d8b0e // vpush {d8-d14}
+ .long 0xeddf0b63 // vldr d16, [pc, #396]
+ .long 0xf3412d17 // vmul.f32 d18, d1, d7
+ .long 0xeddf3b63 // vldr d19, [pc, #396]
+ .long 0xf3401d17 // vmul.f32 d17, d0, d7
+ .long 0xf3454d30 // vmul.f32 d20, d5, d16
+ .long 0xeddf7b62 // vldr d23, [pc, #392]
+ .long 0xf3446d33 // vmul.f32 d22, d4, d19
.long 0xe4913004 // ldr r3, [r1], #4
- .long 0xf346bd38 // vmul.f32 d27, d6, d24
- .long 0xeec89a23 // vdiv.f32 s19, s16, s7
- .long 0xee889a03 // vdiv.f32 s18, s16, s6
- .long 0xf3501199 // vbsl d17, d16, d9
- .long 0xf2476da6 // vadd.f32 d22, d23, d22
- .long 0xf3413d91 // vmul.f32 d19, d17, d1
- .long 0xf3415d90 // vmul.f32 d21, d17, d0
- .long 0xf3411d92 // vmul.f32 d17, d17, d2
- .long 0xf2466dab // vadd.f32 d22, d22, d27
- .long 0xf3439db2 // vmul.f32 d25, d19, d18
- .long 0xf345adb4 // vmul.f32 d26, d21, d20
- .long 0xf3417db8 // vmul.f32 d23, d17, d24
- .long 0xf24a9da9 // vadd.f32 d25, d26, d25
- .long 0xf2477da9 // vadd.f32 d23, d23, d25
- .long 0xf2666da7 // vsub.f32 d22, d22, d23
- .long 0xf2433da6 // vadd.f32 d19, d19, d22
+ .long 0xf3425d17 // vmul.f32 d21, d2, d7
+ .long 0xf3428db0 // vmul.f32 d24, d18, d16
+ .long 0xf3419db3 // vmul.f32 d25, d17, d19
+ .long 0xf2464da4 // vadd.f32 d20, d22, d20
+ .long 0xf346ad37 // vmul.f32 d26, d6, d23
+ .long 0xf3456db7 // vmul.f32 d22, d21, d23
+ .long 0xf2498da8 // vadd.f32 d24, d25, d24
+ .long 0xf2c0e010 // vmov.i32 d30, #0
+ .long 0xf2444daa // vadd.f32 d20, d20, d26
+ .long 0xf2466da8 // vadd.f32 d22, d22, d24
+ .long 0xf3444d93 // vmul.f32 d20, d20, d3
+ .long 0xf2646da6 // vsub.f32 d22, d20, d22
+ .long 0xf2414da6 // vadd.f32 d20, d17, d22
+ .long 0xf2428da6 // vadd.f32 d24, d18, d22
.long 0xf2455da6 // vadd.f32 d21, d21, d22
- .long 0xf2416da6 // vadd.f32 d22, d17, d22
- .long 0xf3431db2 // vmul.f32 d17, d19, d18
- .long 0xf3452db4 // vmul.f32 d18, d21, d20
- .long 0xf3464db8 // vmul.f32 d20, d22, d24
- .long 0xf2421da1 // vadd.f32 d17, d18, d17
- .long 0xf2632fa6 // vmin.f32 d18, d19, d22
- .long 0xf2441da1 // vadd.f32 d17, d20, d17
- .long 0xf2652fa2 // vmin.f32 d18, d21, d18
+ .long 0xf3441db3 // vmul.f32 d17, d20, d19
+ .long 0xf3480db0 // vmul.f32 d16, d24, d16
+ .long 0xf3452db7 // vmul.f32 d18, d21, d23
+ .long 0xf2683fa5 // vmin.f32 d19, d24, d21
+ .long 0xf2486fa5 // vmax.f32 d22, d24, d21
+ .long 0xf2410da0 // vadd.f32 d16, d17, d16
+ .long 0xf2421da0 // vadd.f32 d17, d18, d16
+ .long 0xf2642fa3 // vmin.f32 d18, d20, d19
+ .long 0xf3f934a2 // vcge.f32 d19, d18, #0
+ .long 0xf26391b3 // vorr d25, d19, d19
+ .long 0xf2650da1 // vsub.f32 d16, d21, d17
+ .long 0xf2219da2 // vsub.f32 d9, d17, d18
+ .long 0xf26321b3 // vorr d18, d19, d19
+ .long 0xf3018db0 // vmul.f32 d8, d17, d16
+ .long 0xf3430d17 // vmul.f32 d16, d3, d7
+ .long 0xeec8aaa9 // vdiv.f32 s21, s17, s19
+ .long 0xee88aa09 // vdiv.f32 s20, s16, s18
+ .long 0xf2417d8a // vadd.f32 d23, d17, d10
+ .long 0xf35521b7 // vbsl d18, d21, d23
+ .long 0xf2445fa6 // vmax.f32 d21, d20, d22
+ .long 0xf2626da1 // vsub.f32 d22, d18, d17
+ .long 0xf2607da1 // vsub.f32 d23, d16, d17
+ .long 0xf225ada1 // vsub.f32 d10, d21, d17
+ .long 0xf307bdb6 // vmul.f32 d11, d23, d22
+ .long 0xf2686da1 // vsub.f32 d22, d24, d17
+ .long 0xeecb8aaa // vdiv.f32 s17, s23, s21
+ .long 0xf301cdb6 // vmul.f32 d12, d17, d22
+ .long 0xee8b8a0a // vdiv.f32 s16, s22, s20
+ .long 0xeeccdaa9 // vdiv.f32 s27, s25, s19
+ .long 0xee8cda09 // vdiv.f32 s26, s24, s18
+ .long 0xf2416d8d // vadd.f32 d22, d17, d13
+ .long 0xf35891b6 // vbsl d25, d24, d22
+ .long 0xf2696da1 // vsub.f32 d22, d25, d17
+ .long 0xf307ddb6 // vmul.f32 d13, d23, d22
+ .long 0xf2646da1 // vsub.f32 d22, d20, d17
+ .long 0xeecdcaaa // vdiv.f32 s25, s27, s21
+ .long 0xee8dca0a // vdiv.f32 s24, s26, s20
+ .long 0xf301ddb6 // vmul.f32 d13, d17, d22
+ .long 0xf2418d8c // vadd.f32 d24, d17, d12
+ .long 0xeecdeaa9 // vdiv.f32 s29, s27, s19
+ .long 0xee8dea09 // vdiv.f32 s28, s26, s18
+ .long 0xf2416d8e // vadd.f32 d22, d17, d14
+ .long 0xf35431b6 // vbsl d19, d20, d22
.long 0xf2634da1 // vsub.f32 d20, d19, d17
- .long 0xf2210da2 // vsub.f32 d0, d17, d18
- .long 0xf3f924a2 // vcge.f32 d18, d18, #0
- .long 0xf2667da1 // vsub.f32 d23, d22, d17
- .long 0xf2658da1 // vsub.f32 d24, d21, d17
- .long 0xf262a1b2 // vorr d26, d18, d18
- .long 0xf3011db4 // vmul.f32 d1, d17, d20
- .long 0xf2434fa6 // vmax.f32 d20, d19, d22
- .long 0xf3012db7 // vmul.f32 d2, d17, d23
- .long 0xf3018db8 // vmul.f32 d8, d17, d24
- .long 0xf262b1b2 // vorr d27, d18, d18
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2419d82 // vadd.f32 d25, d17, d2
- .long 0xf355a1b9 // vbsl d26, d21, d25
- .long 0xf2417d89 // vadd.f32 d23, d17, d9
- .long 0xf2c79f10 // vmov.f32 d25, #1
- .long 0xf353b1b7 // vbsl d27, d19, d23
- .long 0xf2453fa4 // vmax.f32 d19, d21, d20
- .long 0xf26a4da1 // vsub.f32 d20, d26, d17
- .long 0xf2695da1 // vsub.f32 d21, d25, d17
- .long 0xf2418d81 // vadd.f32 d24, d17, d1
- .long 0xf2230da1 // vsub.f32 d0, d19, d17
- .long 0xf35621b8 // vbsl d18, d22, d24
- .long 0xf3051db4 // vmul.f32 d1, d21, d20
- .long 0xf26b6da1 // vsub.f32 d22, d27, d17
- .long 0xf2627da1 // vsub.f32 d23, d18, d17
- .long 0xf3633ea9 // vcgt.f32 d19, d19, d25
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xf3052db6 // vmul.f32 d2, d21, d22
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xf3058db7 // vmul.f32 d8, d21, d23
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2414d89 // vadd.f32 d20, d17, d9
- .long 0xf26381b3 // vorr d24, d19, d19
- .long 0xf2415d81 // vadd.f32 d21, d17, d1
- .long 0xf2411d82 // vadd.f32 d17, d17, d2
- .long 0xf35481ba // vbsl d24, d20, d26
- .long 0xf26341b3 // vorr d20, d19, d19
- .long 0xf3436d17 // vmul.f32 d22, d3, d7
+ .long 0xf3079db4 // vmul.f32 d9, d23, d20
+ .long 0xf3654ea0 // vcgt.f32 d20, d21, d16
+ .long 0xf2c75f10 // vmov.f32 d21, #1
+ .long 0xf2657d83 // vsub.f32 d23, d21, d3
+ .long 0xeec9daaa // vdiv.f32 s27, s19, s21
+ .long 0xee89da0a // vdiv.f32 s26, s18, s20
+ .long 0xf2655d87 // vsub.f32 d21, d21, d7
+ .long 0xf2416d8d // vadd.f32 d22, d17, d13
+ .long 0xf264f1b4 // vorr d31, d20, d20
+ .long 0xf2411d88 // vadd.f32 d17, d17, d8
+ .long 0xf345ad90 // vmul.f32 d26, d21, d0
+ .long 0xf356f1b3 // vbsl d31, d22, d19
+ .long 0xf26461b4 // vorr d22, d20, d20
+ .long 0xf347bd94 // vmul.f32 d27, d23, d4
+ .long 0xf345cd91 // vmul.f32 d28, d21, d1
+ .long 0xf3453d92 // vmul.f32 d19, d21, d2
+ .long 0xf3475d96 // vmul.f32 d21, d23, d6
+ .long 0xf347dd95 // vmul.f32 d29, d23, d5
+ .long 0xf35141b2 // vbsl d20, d17, d18
+ .long 0xf35861b9 // vbsl d22, d24, d25
.long 0xf2437d07 // vadd.f32 d23, d3, d7
- .long 0xf35131b2 // vbsl d19, d17, d18
- .long 0xf35541bb // vbsl d20, d21, d27
- .long 0xf2481fa0 // vmax.f32 d17, d24, d16
- .long 0xf2442fa0 // vmax.f32 d18, d20, d16
- .long 0xf2430fa0 // vmax.f32 d16, d19, d16
- .long 0xf2273da6 // vsub.f32 d3, d23, d22
- .long 0xf3030d31 // vmul.f32 d0, d3, d17
- .long 0xf3031d32 // vmul.f32 d1, d3, d18
- .long 0xf3032d30 // vmul.f32 d2, d3, d16
- .long 0xecbd8b04 // vpop {d8-d9}
+ .long 0xf24b8daa // vadd.f32 d24, d27, d26
+ .long 0xf24f1fae // vmax.f32 d17, d31, d30
+ .long 0xf24d2dac // vadd.f32 d18, d29, d28
+ .long 0xf2466fae // vmax.f32 d22, d22, d30
+ .long 0xf2453da3 // vadd.f32 d19, d21, d19
+ .long 0xf2444fae // vmax.f32 d20, d20, d30
+ .long 0xf2273da0 // vsub.f32 d3, d23, d16
+ .long 0xf2080da1 // vadd.f32 d0, d24, d17
+ .long 0xf2021da6 // vadd.f32 d1, d18, d22
+ .long 0xf2032da4 // vadd.f32 d2, d19, d20
+ .long 0xecbd8b0e // vpop {d8-d14}
.long 0xe12fff13 // bx r3
+ .long 0xe320f000 // nop {0}
.long 0x3f170a3d // .word 0x3f170a3d
.long 0x3f170a3d // .word 0x3f170a3d
.long 0x3e99999a // .word 0x3e99999a
@@ -5182,100 +5232,108 @@ HIDDEN _sk_luminosity_vfp4
.globl _sk_luminosity_vfp4
FUNCTION(_sk_luminosity_vfp4)
_sk_luminosity_vfp4:
- .long 0xed2d8b04 // vpush {d8-d9}
- .long 0xeeb78a00 // vmov.f32 s16, #112
- .long 0xf3f91507 // vceq.f32 d17, d7, #0
- .long 0xf2c00010 // vmov.i32 d16, #0
- .long 0xeddf2b58 // vldr d18, [pc, #352]
- .long 0xeddf4b59 // vldr d20, [pc, #356]
- .long 0xf3416d32 // vmul.f32 d22, d1, d18
- .long 0xeddf8b59 // vldr d24, [pc, #356]
- .long 0xf3407d34 // vmul.f32 d23, d0, d20
+ .long 0xed2d8b0e // vpush {d8-d14}
+ .long 0xeddf0b63 // vldr d16, [pc, #396]
+ .long 0xf3432d15 // vmul.f32 d18, d3, d5
+ .long 0xeddf3b63 // vldr d19, [pc, #396]
+ .long 0xf3431d14 // vmul.f32 d17, d3, d4
+ .long 0xf3414d30 // vmul.f32 d20, d1, d16
+ .long 0xeddf7b62 // vldr d23, [pc, #392]
+ .long 0xf3406d33 // vmul.f32 d22, d0, d19
.long 0xe4913004 // ldr r3, [r1], #4
- .long 0xf342bd38 // vmul.f32 d27, d2, d24
- .long 0xeec89a27 // vdiv.f32 s19, s16, s15
- .long 0xee889a07 // vdiv.f32 s18, s16, s14
- .long 0xf3501199 // vbsl d17, d16, d9
- .long 0xf2476da6 // vadd.f32 d22, d23, d22
- .long 0xf3413d95 // vmul.f32 d19, d17, d5
- .long 0xf3415d94 // vmul.f32 d21, d17, d4
- .long 0xf3411d96 // vmul.f32 d17, d17, d6
- .long 0xf2466dab // vadd.f32 d22, d22, d27
- .long 0xf3439db2 // vmul.f32 d25, d19, d18
- .long 0xf345adb4 // vmul.f32 d26, d21, d20
- .long 0xf3417db8 // vmul.f32 d23, d17, d24
- .long 0xf24a9da9 // vadd.f32 d25, d26, d25
- .long 0xf2477da9 // vadd.f32 d23, d23, d25
- .long 0xf2666da7 // vsub.f32 d22, d22, d23
- .long 0xf2433da6 // vadd.f32 d19, d19, d22
+ .long 0xf3435d16 // vmul.f32 d21, d3, d6
+ .long 0xf3428db0 // vmul.f32 d24, d18, d16
+ .long 0xf3419db3 // vmul.f32 d25, d17, d19
+ .long 0xf2464da4 // vadd.f32 d20, d22, d20
+ .long 0xf342ad37 // vmul.f32 d26, d2, d23
+ .long 0xf3456db7 // vmul.f32 d22, d21, d23
+ .long 0xf2498da8 // vadd.f32 d24, d25, d24
+ .long 0xf2c0e010 // vmov.i32 d30, #0
+ .long 0xf2444daa // vadd.f32 d20, d20, d26
+ .long 0xf2486da6 // vadd.f32 d22, d24, d22
+ .long 0xf3444d97 // vmul.f32 d20, d20, d7
+ .long 0xf2646da6 // vsub.f32 d22, d20, d22
+ .long 0xf2414da6 // vadd.f32 d20, d17, d22
+ .long 0xf2428da6 // vadd.f32 d24, d18, d22
.long 0xf2455da6 // vadd.f32 d21, d21, d22
- .long 0xf2416da6 // vadd.f32 d22, d17, d22
- .long 0xf3431db2 // vmul.f32 d17, d19, d18
- .long 0xf3452db4 // vmul.f32 d18, d21, d20
- .long 0xf3464db8 // vmul.f32 d20, d22, d24
- .long 0xf2421da1 // vadd.f32 d17, d18, d17
- .long 0xf2632fa6 // vmin.f32 d18, d19, d22
- .long 0xf2441da1 // vadd.f32 d17, d20, d17
- .long 0xf2652fa2 // vmin.f32 d18, d21, d18
+ .long 0xf3441db3 // vmul.f32 d17, d20, d19
+ .long 0xf3480db0 // vmul.f32 d16, d24, d16
+ .long 0xf3452db7 // vmul.f32 d18, d21, d23
+ .long 0xf2683fa5 // vmin.f32 d19, d24, d21
+ .long 0xf2486fa5 // vmax.f32 d22, d24, d21
+ .long 0xf2410da0 // vadd.f32 d16, d17, d16
+ .long 0xf2421da0 // vadd.f32 d17, d18, d16
+ .long 0xf2642fa3 // vmin.f32 d18, d20, d19
+ .long 0xf3f934a2 // vcge.f32 d19, d18, #0
+ .long 0xf26391b3 // vorr d25, d19, d19
+ .long 0xf2650da1 // vsub.f32 d16, d21, d17
+ .long 0xf2219da2 // vsub.f32 d9, d17, d18
+ .long 0xf26321b3 // vorr d18, d19, d19
+ .long 0xf3018db0 // vmul.f32 d8, d17, d16
+ .long 0xf3430d17 // vmul.f32 d16, d3, d7
+ .long 0xeec8aaa9 // vdiv.f32 s21, s17, s19
+ .long 0xee88aa09 // vdiv.f32 s20, s16, s18
+ .long 0xf2417d8a // vadd.f32 d23, d17, d10
+ .long 0xf35521b7 // vbsl d18, d21, d23
+ .long 0xf2445fa6 // vmax.f32 d21, d20, d22
+ .long 0xf2626da1 // vsub.f32 d22, d18, d17
+ .long 0xf2607da1 // vsub.f32 d23, d16, d17
+ .long 0xf225ada1 // vsub.f32 d10, d21, d17
+ .long 0xf307bdb6 // vmul.f32 d11, d23, d22
+ .long 0xf2686da1 // vsub.f32 d22, d24, d17
+ .long 0xeecb8aaa // vdiv.f32 s17, s23, s21
+ .long 0xf301cdb6 // vmul.f32 d12, d17, d22
+ .long 0xee8b8a0a // vdiv.f32 s16, s22, s20
+ .long 0xeeccdaa9 // vdiv.f32 s27, s25, s19
+ .long 0xee8cda09 // vdiv.f32 s26, s24, s18
+ .long 0xf2416d8d // vadd.f32 d22, d17, d13
+ .long 0xf35891b6 // vbsl d25, d24, d22
+ .long 0xf2696da1 // vsub.f32 d22, d25, d17
+ .long 0xf307ddb6 // vmul.f32 d13, d23, d22
+ .long 0xf2646da1 // vsub.f32 d22, d20, d17
+ .long 0xeecdcaaa // vdiv.f32 s25, s27, s21
+ .long 0xee8dca0a // vdiv.f32 s24, s26, s20
+ .long 0xf301ddb6 // vmul.f32 d13, d17, d22
+ .long 0xf2418d8c // vadd.f32 d24, d17, d12
+ .long 0xeecdeaa9 // vdiv.f32 s29, s27, s19
+ .long 0xee8dea09 // vdiv.f32 s28, s26, s18
+ .long 0xf2416d8e // vadd.f32 d22, d17, d14
+ .long 0xf35431b6 // vbsl d19, d20, d22
.long 0xf2634da1 // vsub.f32 d20, d19, d17
- .long 0xf2210da2 // vsub.f32 d0, d17, d18
- .long 0xf3f924a2 // vcge.f32 d18, d18, #0
- .long 0xf2667da1 // vsub.f32 d23, d22, d17
- .long 0xf2658da1 // vsub.f32 d24, d21, d17
- .long 0xf262a1b2 // vorr d26, d18, d18
- .long 0xf3011db4 // vmul.f32 d1, d17, d20
- .long 0xf2434fa6 // vmax.f32 d20, d19, d22
- .long 0xf3012db7 // vmul.f32 d2, d17, d23
- .long 0xf3018db8 // vmul.f32 d8, d17, d24
- .long 0xf262b1b2 // vorr d27, d18, d18
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2419d82 // vadd.f32 d25, d17, d2
- .long 0xf355a1b9 // vbsl d26, d21, d25
- .long 0xf2417d89 // vadd.f32 d23, d17, d9
- .long 0xf2c79f10 // vmov.f32 d25, #1
- .long 0xf353b1b7 // vbsl d27, d19, d23
- .long 0xf2453fa4 // vmax.f32 d19, d21, d20
- .long 0xf26a4da1 // vsub.f32 d20, d26, d17
- .long 0xf2695da1 // vsub.f32 d21, d25, d17
- .long 0xf2418d81 // vadd.f32 d24, d17, d1
- .long 0xf2230da1 // vsub.f32 d0, d19, d17
- .long 0xf35621b8 // vbsl d18, d22, d24
- .long 0xf3051db4 // vmul.f32 d1, d21, d20
- .long 0xf26b6da1 // vsub.f32 d22, d27, d17
- .long 0xf2627da1 // vsub.f32 d23, d18, d17
- .long 0xf3633ea9 // vcgt.f32 d19, d19, d25
- .long 0xeec19aa0 // vdiv.f32 s19, s3, s1
- .long 0xf3052db6 // vmul.f32 d2, d21, d22
- .long 0xee819a00 // vdiv.f32 s18, s2, s0
- .long 0xeec21aa0 // vdiv.f32 s3, s5, s1
- .long 0xf3058db7 // vmul.f32 d8, d21, d23
- .long 0xee821a00 // vdiv.f32 s2, s4, s0
- .long 0xeec82aa0 // vdiv.f32 s5, s17, s1
- .long 0xee882a00 // vdiv.f32 s4, s16, s0
- .long 0xf2414d89 // vadd.f32 d20, d17, d9
- .long 0xf26381b3 // vorr d24, d19, d19
- .long 0xf2415d81 // vadd.f32 d21, d17, d1
- .long 0xf2411d82 // vadd.f32 d17, d17, d2
- .long 0xf35481ba // vbsl d24, d20, d26
- .long 0xf26341b3 // vorr d20, d19, d19
- .long 0xf3436d17 // vmul.f32 d22, d3, d7
+ .long 0xf3079db4 // vmul.f32 d9, d23, d20
+ .long 0xf3654ea0 // vcgt.f32 d20, d21, d16
+ .long 0xf2c75f10 // vmov.f32 d21, #1
+ .long 0xf2657d83 // vsub.f32 d23, d21, d3
+ .long 0xeec9daaa // vdiv.f32 s27, s19, s21
+ .long 0xee89da0a // vdiv.f32 s26, s18, s20
+ .long 0xf2655d87 // vsub.f32 d21, d21, d7
+ .long 0xf2416d8d // vadd.f32 d22, d17, d13
+ .long 0xf264f1b4 // vorr d31, d20, d20
+ .long 0xf2411d88 // vadd.f32 d17, d17, d8
+ .long 0xf345ad90 // vmul.f32 d26, d21, d0
+ .long 0xf356f1b3 // vbsl d31, d22, d19
+ .long 0xf26461b4 // vorr d22, d20, d20
+ .long 0xf347bd94 // vmul.f32 d27, d23, d4
+ .long 0xf345cd91 // vmul.f32 d28, d21, d1
+ .long 0xf3453d92 // vmul.f32 d19, d21, d2
+ .long 0xf3475d96 // vmul.f32 d21, d23, d6
+ .long 0xf347dd95 // vmul.f32 d29, d23, d5
+ .long 0xf35141b2 // vbsl d20, d17, d18
+ .long 0xf35861b9 // vbsl d22, d24, d25
.long 0xf2437d07 // vadd.f32 d23, d3, d7
- .long 0xf35131b2 // vbsl d19, d17, d18
- .long 0xf35541bb // vbsl d20, d21, d27
- .long 0xf2481fa0 // vmax.f32 d17, d24, d16
- .long 0xf2442fa0 // vmax.f32 d18, d20, d16
- .long 0xf2430fa0 // vmax.f32 d16, d19, d16
- .long 0xf2273da6 // vsub.f32 d3, d23, d22
- .long 0xf3030d31 // vmul.f32 d0, d3, d17
- .long 0xf3031d32 // vmul.f32 d1, d3, d18
- .long 0xf3032d30 // vmul.f32 d2, d3, d16
- .long 0xecbd8b04 // vpop {d8-d9}
+ .long 0xf24b8daa // vadd.f32 d24, d27, d26
+ .long 0xf24f1fae // vmax.f32 d17, d31, d30
+ .long 0xf24d2dac // vadd.f32 d18, d29, d28
+ .long 0xf2466fae // vmax.f32 d22, d22, d30
+ .long 0xf2453da3 // vadd.f32 d19, d21, d19
+ .long 0xf2444fae // vmax.f32 d20, d20, d30
+ .long 0xf2273da0 // vsub.f32 d3, d23, d16
+ .long 0xf2080da1 // vadd.f32 d0, d24, d17
+ .long 0xf2021da6 // vadd.f32 d1, d18, d22
+ .long 0xf2032da4 // vadd.f32 d2, d19, d20
+ .long 0xecbd8b0e // vpop {d8-d14}
.long 0xe12fff13 // bx r3
+ .long 0xe320f000 // nop {0}
.long 0x3f170a3d // .word 0x3f170a3d
.long 0x3f170a3d // .word 0x3f170a3d
.long 0x3e99999a // .word 0x3e99999a
@@ -7832,7 +7890,7 @@ _sk_gradient_vfp4:
.long 0xe494c00c // ldr ip, [r4], #12
.long 0xf4a41c9f // vld1.32 {d1[]}, [r4 :32]
.long 0xe35c0000 // cmp ip, #0
- .long 0x0a000036 // beq 3548 <sk_gradient_vfp4+0x110>
+ .long 0x0a000036 // beq 35c8 <sk_gradient_vfp4+0x110>
.long 0xe59e3004 // ldr r3, [lr, #4]
.long 0xf2c01010 // vmov.i32 d17, #0
.long 0xf2c07010 // vmov.i32 d23, #0
@@ -7882,12 +7940,12 @@ _sk_gradient_vfp4:
.long 0xf26371b3 // vorr d23, d19, d19
.long 0xf26481b4 // vorr d24, d20, d20
.long 0xf26561b5 // vorr d22, d21, d21
- .long 0x1affffd3 // bne 3484 <sk_gradient_vfp4+0x4c>
+ .long 0x1affffd3 // bne 3504 <sk_gradient_vfp4+0x4c>
.long 0xf26c01bc // vorr d16, d28, d28
.long 0xf22b11bb // vorr d1, d27, d27
.long 0xf22a21ba // vorr d2, d26, d26
.long 0xf22931b9 // vorr d3, d25, d25
- .long 0xea000003 // b 3558 <sk_gradient_vfp4+0x120>
+ .long 0xea000003 // b 35d8 <sk_gradient_vfp4+0x120>
.long 0xf2c05010 // vmov.i32 d21, #0
.long 0xf2c04010 // vmov.i32 d20, #0
.long 0xf2c03010 // vmov.i32 d19, #0
@@ -8437,14 +8495,14 @@ _sk_seed_shader_hsw:
.byte 197,249,110,199 // vmovd %edi,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,29,68,0,0 // vbroadcastss 0x441d(%rip),%ymm1 # 44e0 <_sk_callback_hsw+0x127>
+ .byte 196,226,125,24,13,45,69,0,0 // vbroadcastss 0x452d(%rip),%ymm1 # 45f0 <_sk_callback_hsw+0x127>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,2 // vaddps (%rdx),%ymm0,%ymm0
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,1,68,0,0 // vbroadcastss 0x4401(%rip),%ymm2 # 44e4 <_sk_callback_hsw+0x12b>
+ .byte 196,226,125,24,21,17,69,0,0 // vbroadcastss 0x4511(%rip),%ymm2 # 45f4 <_sk_callback_hsw+0x12b>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -8465,13 +8523,13 @@ _sk_dither_hsw:
.byte 76,139,0 // mov (%rax),%r8
.byte 196,66,125,88,8 // vpbroadcastd (%r8),%ymm9
.byte 196,65,61,239,201 // vpxor %ymm9,%ymm8,%ymm9
- .byte 196,98,125,88,21,192,67,0,0 // vpbroadcastd 0x43c0(%rip),%ymm10 # 44e8 <_sk_callback_hsw+0x12f>
+ .byte 196,98,125,88,21,208,68,0,0 // vpbroadcastd 0x44d0(%rip),%ymm10 # 45f8 <_sk_callback_hsw+0x12f>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,165,67,0,0 // vpbroadcastd 0x43a5(%rip),%ymm12 # 44ec <_sk_callback_hsw+0x133>
- .byte 196,98,125,88,45,160,67,0,0 // vpbroadcastd 0x43a0(%rip),%ymm13 # 44f0 <_sk_callback_hsw+0x137>
+ .byte 196,98,125,88,37,181,68,0,0 // vpbroadcastd 0x44b5(%rip),%ymm12 # 45fc <_sk_callback_hsw+0x133>
+ .byte 196,98,125,88,45,176,68,0,0 // vpbroadcastd 0x44b0(%rip),%ymm13 # 4600 <_sk_callback_hsw+0x137>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -8486,8 +8544,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,82,67,0,0 // vbroadcastss 0x4352(%rip),%ymm9 # 44f4 <_sk_callback_hsw+0x13b>
- .byte 196,98,125,24,21,77,67,0,0 // vbroadcastss 0x434d(%rip),%ymm10 # 44f8 <_sk_callback_hsw+0x13f>
+ .byte 196,98,125,24,13,98,68,0,0 // vbroadcastss 0x4462(%rip),%ymm9 # 4604 <_sk_callback_hsw+0x13b>
+ .byte 196,98,125,24,21,93,68,0,0 // vbroadcastss 0x445d(%rip),%ymm10 # 4608 <_sk_callback_hsw+0x13f>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,64,8 // vbroadcastss 0x8(%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -8525,7 +8583,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,243,66,0,0 // vbroadcastss 0x42f3(%rip),%ymm8 # 44fc <_sk_callback_hsw+0x143>
+ .byte 196,98,125,24,5,3,68,0,0 // vbroadcastss 0x4403(%rip),%ymm8 # 460c <_sk_callback_hsw+0x143>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -8541,7 +8599,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,198,66,0,0 // vbroadcastss 0x42c6(%rip),%ymm8 # 4500 <_sk_callback_hsw+0x147>
+ .byte 196,98,125,24,5,214,67,0,0 // vbroadcastss 0x43d6(%rip),%ymm8 # 4610 <_sk_callback_hsw+0x147>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -8580,7 +8638,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,109,66,0,0 // vbroadcastss 0x426d(%rip),%ymm8 # 4504 <_sk_callback_hsw+0x14b>
+ .byte 196,98,125,24,5,125,67,0,0 // vbroadcastss 0x437d(%rip),%ymm8 # 4614 <_sk_callback_hsw+0x14b>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -8593,7 +8651,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,80,66,0,0 // vbroadcastss 0x4250(%rip),%ymm0 # 4508 <_sk_callback_hsw+0x14f>
+ .byte 196,226,125,24,5,96,67,0,0 // vbroadcastss 0x4360(%rip),%ymm0 # 4618 <_sk_callback_hsw+0x14f>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -8606,7 +8664,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,51,66,0,0 // vbroadcastss 0x4233(%rip),%ymm8 # 450c <_sk_callback_hsw+0x153>
+ .byte 196,98,125,24,5,67,67,0,0 // vbroadcastss 0x4343(%rip),%ymm8 # 461c <_sk_callback_hsw+0x153>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -8619,7 +8677,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,18,66,0,0 // vbroadcastss 0x4212(%rip),%ymm8 # 4510 <_sk_callback_hsw+0x157>
+ .byte 196,98,125,24,5,34,67,0,0 // vbroadcastss 0x4322(%rip),%ymm8 # 4620 <_sk_callback_hsw+0x157>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -8643,7 +8701,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,221,65,0,0 // vbroadcastss 0x41dd(%rip),%ymm8 # 4514 <_sk_callback_hsw+0x15b>
+ .byte 196,98,125,24,5,237,66,0,0 // vbroadcastss 0x42ed(%rip),%ymm8 # 4624 <_sk_callback_hsw+0x15b>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -8691,7 +8749,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,88,65,0,0 // vbroadcastss 0x4158(%rip),%ymm8 # 4518 <_sk_callback_hsw+0x15f>
+ .byte 196,98,125,24,5,104,66,0,0 // vbroadcastss 0x4268(%rip),%ymm8 # 4628 <_sk_callback_hsw+0x15f>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -8725,7 +8783,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,224,64,0,0 // vbroadcastss 0x40e0(%rip),%ymm8 # 451c <_sk_callback_hsw+0x163>
+ .byte 196,98,125,24,5,240,65,0,0 // vbroadcastss 0x41f0(%rip),%ymm8 # 462c <_sk_callback_hsw+0x163>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -8750,7 +8808,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,143,64,0,0 // vbroadcastss 0x408f(%rip),%ymm8 # 4520 <_sk_callback_hsw+0x167>
+ .byte 196,98,125,24,5,159,65,0,0 // vbroadcastss 0x419f(%rip),%ymm8 # 4630 <_sk_callback_hsw+0x167>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -8778,7 +8836,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,50,64,0,0 // vbroadcastss 0x4032(%rip),%ymm8 # 4524 <_sk_callback_hsw+0x16b>
+ .byte 196,98,125,24,5,66,65,0,0 // vbroadcastss 0x4142(%rip),%ymm8 # 4634 <_sk_callback_hsw+0x16b>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -8800,7 +8858,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,240,63,0,0 // vbroadcastss 0x3ff0(%rip),%ymm8 # 4528 <_sk_callback_hsw+0x16f>
+ .byte 196,98,125,24,5,0,65,0,0 // vbroadcastss 0x4100(%rip),%ymm8 # 4638 <_sk_callback_hsw+0x16f>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -8810,7 +8868,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,222,63,0,0 // vbroadcastss 0x3fde(%rip),%ymm8 # 452c <_sk_callback_hsw+0x173>
+ .byte 196,98,125,24,5,238,64,0,0 // vbroadcastss 0x40ee(%rip),%ymm8 # 463c <_sk_callback_hsw+0x173>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -8868,7 +8926,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,233,62,0,0 // vbroadcastss 0x3ee9(%rip),%ymm9 # 4530 <_sk_callback_hsw+0x177>
+ .byte 196,98,125,24,13,249,63,0,0 // vbroadcastss 0x3ff9(%rip),%ymm9 # 4640 <_sk_callback_hsw+0x177>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -8921,7 +8979,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,10,62,0,0 // vbroadcastss 0x3e0a(%rip),%ymm8 # 4534 <_sk_callback_hsw+0x17b>
+ .byte 196,98,125,24,5,26,63,0,0 // vbroadcastss 0x3f1a(%rip),%ymm8 # 4644 <_sk_callback_hsw+0x17b>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -8972,7 +9030,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,66,61,0,0 // vbroadcastss 0x3d42(%rip),%ymm8 # 4538 <_sk_callback_hsw+0x17f>
+ .byte 196,98,125,24,5,82,62,0,0 // vbroadcastss 0x3e52(%rip),%ymm8 # 4648 <_sk_callback_hsw+0x17f>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9033,10 +9091,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,77,60,0,0 // vbroadcastss 0x3c4d(%rip),%ymm11 # 4540 <_sk_callback_hsw+0x187>
+ .byte 196,98,125,24,29,93,61,0,0 // vbroadcastss 0x3d5d(%rip),%ymm11 # 4650 <_sk_callback_hsw+0x187>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,62,60,0,0 // vbroadcastss 0x3c3e(%rip),%ymm12 # 4544 <_sk_callback_hsw+0x18b>
+ .byte 196,98,125,24,37,78,61,0,0 // vbroadcastss 0x3d4e(%rip),%ymm12 # 4654 <_sk_callback_hsw+0x18b>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -9046,7 +9104,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,1,60,0,0 // vbroadcastss 0x3c01(%rip),%ymm8 # 453c <_sk_callback_hsw+0x183>
+ .byte 196,98,125,24,5,17,61,0,0 // vbroadcastss 0x3d11(%rip),%ymm8 # 464c <_sk_callback_hsw+0x183>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -9127,100 +9185,111 @@ HIDDEN _sk_hue_hsw
.globl _sk_hue_hsw
FUNCTION(_sk_hue_hsw)
_sk_hue_hsw:
+ .byte 197,124,40,194 // vmovaps %ymm2,%ymm8
+ .byte 197,124,17,68,36,200 // vmovups %ymm8,-0x38(%rsp)
+ .byte 197,252,17,76,36,168 // vmovups %ymm1,-0x58(%rsp)
+ .byte 197,252,40,208 // vmovaps %ymm0,%ymm2
+ .byte 197,108,89,203 // vmulps %ymm3,%ymm2,%ymm9
+ .byte 197,116,89,211 // vmulps %ymm3,%ymm1,%ymm10
+ .byte 197,60,89,219 // vmulps %ymm3,%ymm8,%ymm11
+ .byte 197,84,95,198 // vmaxps %ymm6,%ymm5,%ymm8
+ .byte 196,65,92,95,192 // vmaxps %ymm8,%ymm4,%ymm8
+ .byte 197,84,93,230 // vminps %ymm6,%ymm5,%ymm12
+ .byte 196,65,92,93,228 // vminps %ymm12,%ymm4,%ymm12
+ .byte 196,65,60,92,196 // vsubps %ymm12,%ymm8,%ymm8
+ .byte 197,60,89,227 // vmulps %ymm3,%ymm8,%ymm12
+ .byte 196,65,44,93,195 // vminps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,93,232 // vminps %ymm8,%ymm9,%ymm13
+ .byte 196,65,44,95,195 // vmaxps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,95,192 // vmaxps %ymm8,%ymm9,%ymm8
+ .byte 196,65,60,92,245 // vsubps %ymm13,%ymm8,%ymm14
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,100,194,208,0 // vcmpeqps %ymm8,%ymm3,%ymm10
- .byte 196,98,125,24,13,152,58,0,0 // vbroadcastss 0x3a98(%rip),%ymm9 # 4548 <_sk_callback_hsw+0x18f>
- .byte 197,52,94,219 // vdivps %ymm3,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
- .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
- .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
- .byte 197,84,95,214 // vmaxps %ymm6,%ymm5,%ymm10
- .byte 196,65,92,95,210 // vmaxps %ymm10,%ymm4,%ymm10
- .byte 197,84,93,222 // vminps %ymm6,%ymm5,%ymm11
- .byte 196,65,92,93,219 // vminps %ymm11,%ymm4,%ymm11
- .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
- .byte 197,116,93,218 // vminps %ymm2,%ymm1,%ymm11
- .byte 196,65,124,93,219 // vminps %ymm11,%ymm0,%ymm11
- .byte 197,116,95,226 // vmaxps %ymm2,%ymm1,%ymm12
- .byte 196,65,124,95,228 // vmaxps %ymm12,%ymm0,%ymm12
- .byte 196,65,28,92,227 // vsubps %ymm11,%ymm12,%ymm12
- .byte 196,65,28,194,232,0 // vcmpeqps %ymm8,%ymm12,%ymm13
- .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
- .byte 196,193,124,94,196 // vdivps %ymm12,%ymm0,%ymm0
- .byte 196,195,125,74,192,208 // vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
- .byte 196,193,116,94,204 // vdivps %ymm12,%ymm1,%ymm1
- .byte 196,195,117,74,200,208 // vblendvps %ymm13,%ymm8,%ymm1,%ymm1
- .byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
- .byte 196,193,108,94,212 // vdivps %ymm12,%ymm2,%ymm2
- .byte 196,195,109,74,208,208 // vblendvps %ymm13,%ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,21,13,58,0,0 // vbroadcastss 0x3a0d(%rip),%ymm10 # 454c <_sk_callback_hsw+0x193>
- .byte 196,98,125,24,29,8,58,0,0 // vbroadcastss 0x3a08(%rip),%ymm11 # 4550 <_sk_callback_hsw+0x197>
- .byte 196,65,84,89,227 // vmulps %ymm11,%ymm5,%ymm12
- .byte 196,66,93,184,226 // vfmadd231ps %ymm10,%ymm4,%ymm12
- .byte 196,98,125,24,45,249,57,0,0 // vbroadcastss 0x39f9(%rip),%ymm13 # 4554 <_sk_callback_hsw+0x19b>
- .byte 196,66,77,184,229 // vfmadd231ps %ymm13,%ymm6,%ymm12
- .byte 196,65,116,89,243 // vmulps %ymm11,%ymm1,%ymm14
- .byte 196,66,125,184,242 // vfmadd231ps %ymm10,%ymm0,%ymm14
- .byte 196,66,109,184,245 // vfmadd231ps %ymm13,%ymm2,%ymm14
- .byte 196,65,28,92,230 // vsubps %ymm14,%ymm12,%ymm12
- .byte 196,65,124,88,244 // vaddps %ymm12,%ymm0,%ymm14
- .byte 196,65,116,88,252 // vaddps %ymm12,%ymm1,%ymm15
- .byte 196,193,108,88,196 // vaddps %ymm12,%ymm2,%ymm0
- .byte 197,132,93,200 // vminps %ymm0,%ymm15,%ymm1
- .byte 197,140,93,209 // vminps %ymm1,%ymm14,%ymm2
- .byte 197,132,95,200 // vmaxps %ymm0,%ymm15,%ymm1
- .byte 197,12,95,225 // vmaxps %ymm1,%ymm14,%ymm12
- .byte 196,193,4,89,203 // vmulps %ymm11,%ymm15,%ymm1
- .byte 196,194,13,184,202 // vfmadd231ps %ymm10,%ymm14,%ymm1
- .byte 196,194,125,184,205 // vfmadd231ps %ymm13,%ymm0,%ymm1
- .byte 197,60,194,210,2 // vcmpleps %ymm2,%ymm8,%ymm10
- .byte 197,12,92,217 // vsubps %ymm1,%ymm14,%ymm11
- .byte 196,65,116,89,219 // vmulps %ymm11,%ymm1,%ymm11
- .byte 197,244,92,210 // vsubps %ymm2,%ymm1,%ymm2
- .byte 197,36,94,218 // vdivps %ymm2,%ymm11,%ymm11
- .byte 196,65,116,88,219 // vaddps %ymm11,%ymm1,%ymm11
- .byte 196,67,37,74,222,160 // vblendvps %ymm10,%ymm14,%ymm11,%ymm11
- .byte 196,65,52,194,236,1 // vcmpltps %ymm12,%ymm9,%ymm13
- .byte 197,36,92,241 // vsubps %ymm1,%ymm11,%ymm14
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
+ .byte 196,65,12,194,248,0 // vcmpeqps %ymm8,%ymm14,%ymm15
+ .byte 196,65,52,92,205 // vsubps %ymm13,%ymm9,%ymm9
+ .byte 196,65,28,89,201 // vmulps %ymm9,%ymm12,%ymm9
+ .byte 196,65,52,94,206 // vdivps %ymm14,%ymm9,%ymm9
+ .byte 196,67,53,74,200,240 // vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ .byte 196,65,44,92,213 // vsubps %ymm13,%ymm10,%ymm10
+ .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
+ .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
+ .byte 196,195,45,74,200,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm1
+ .byte 196,65,36,92,213 // vsubps %ymm13,%ymm11,%ymm10
+ .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
+ .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
+ .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
+ .byte 196,98,125,24,53,21,59,0,0 // vbroadcastss 0x3b15(%rip),%ymm14 # 4658 <_sk_callback_hsw+0x18f>
+ .byte 196,98,125,24,61,16,59,0,0 // vbroadcastss 0x3b10(%rip),%ymm15 # 465c <_sk_callback_hsw+0x193>
+ .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
+ .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
+ .byte 196,226,125,24,5,1,59,0,0 // vbroadcastss 0x3b01(%rip),%ymm0 # 4660 <_sk_callback_hsw+0x197>
+ .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
+ .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
+ .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
+ .byte 196,98,29,184,208 // vfmadd231ps %ymm0,%ymm12,%ymm10
+ .byte 196,66,101,170,234 // vfmsub213ps %ymm10,%ymm3,%ymm13
+ .byte 196,65,52,88,213 // vaddps %ymm13,%ymm9,%ymm10
+ .byte 196,65,116,88,221 // vaddps %ymm13,%ymm1,%ymm11
+ .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
+ .byte 196,193,36,93,204 // vminps %ymm12,%ymm11,%ymm1
+ .byte 197,44,93,233 // vminps %ymm1,%ymm10,%ymm13
+ .byte 196,65,36,89,207 // vmulps %ymm15,%ymm11,%ymm9
+ .byte 196,66,45,184,206 // vfmadd231ps %ymm14,%ymm10,%ymm9
+ .byte 196,98,29,184,200 // vfmadd231ps %ymm0,%ymm12,%ymm9
+ .byte 196,193,44,92,193 // vsubps %ymm9,%ymm10,%ymm0
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 196,193,52,92,205 // vsubps %ymm13,%ymm9,%ymm1
+ .byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
+ .byte 196,65,36,92,241 // vsubps %ymm9,%ymm11,%ymm14
.byte 196,65,52,89,246 // vmulps %ymm14,%ymm9,%ymm14
- .byte 197,28,92,225 // vsubps %ymm1,%ymm12,%ymm12
- .byte 196,65,12,94,244 // vdivps %ymm12,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,37,74,222,208 // vblendvps %ymm13,%ymm14,%ymm11,%ymm11
- .byte 196,65,36,95,216 // vmaxps %ymm8,%ymm11,%ymm11
- .byte 197,4,92,241 // vsubps %ymm1,%ymm15,%ymm14
- .byte 196,65,116,89,246 // vmulps %ymm14,%ymm1,%ymm14
- .byte 197,12,94,242 // vdivps %ymm2,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,13,74,247,160 // vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- .byte 197,12,92,249 // vsubps %ymm1,%ymm14,%ymm15
+ .byte 197,12,94,241 // vdivps %ymm1,%ymm14,%ymm14
+ .byte 196,65,28,92,249 // vsubps %ymm9,%ymm12,%ymm15
.byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,252 // vdivps %ymm12,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,13,74,247,208 // vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- .byte 196,65,12,95,240 // vmaxps %ymm8,%ymm14,%ymm14
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 197,132,94,210 // vdivps %ymm2,%ymm15,%ymm2
- .byte 197,244,88,210 // vaddps %ymm2,%ymm1,%ymm2
- .byte 196,227,109,74,192,160 // vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- .byte 197,252,92,209 // vsubps %ymm1,%ymm0,%ymm2
- .byte 197,180,89,210 // vmulps %ymm2,%ymm9,%ymm2
- .byte 196,193,108,94,212 // vdivps %ymm12,%ymm2,%ymm2
- .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,227,125,74,193,208 // vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- .byte 196,193,124,95,208 // vmaxps %ymm8,%ymm0,%ymm2
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 196,226,69,172,216 // vfnmadd213ps %ymm0,%ymm7,%ymm3
- .byte 196,193,100,89,195 // vmulps %ymm11,%ymm3,%ymm0
- .byte 196,193,100,89,206 // vmulps %ymm14,%ymm3,%ymm1
- .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,132,94,201 // vdivps %ymm1,%ymm15,%ymm1
+ .byte 196,65,60,194,237,2 // vcmpleps %ymm13,%ymm8,%ymm13
+ .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
+ .byte 196,67,13,74,243,208 // vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ .byte 196,65,36,95,220 // vmaxps %ymm12,%ymm11,%ymm11
+ .byte 197,180,88,201 // vaddps %ymm1,%ymm9,%ymm1
+ .byte 196,195,117,74,204,208 // vblendvps %ymm13,%ymm12,%ymm1,%ymm1
+ .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
+ .byte 196,195,125,74,194,208 // vblendvps %ymm13,%ymm10,%ymm0,%ymm0
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,44,95,211 // vmaxps %ymm11,%ymm10,%ymm10
+ .byte 196,65,124,92,217 // vsubps %ymm9,%ymm0,%ymm11
+ .byte 196,65,28,92,233 // vsubps %ymm9,%ymm12,%ymm13
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,28,194,250,1 // vcmpltps %ymm10,%ymm12,%ymm15
+ .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
+ .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
+ .byte 196,65,52,88,219 // vaddps %ymm11,%ymm9,%ymm11
+ .byte 196,195,125,74,195,240 // vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ .byte 196,65,12,92,217 // vsubps %ymm9,%ymm14,%ymm11
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
+ .byte 196,65,52,88,219 // vaddps %ymm11,%ymm9,%ymm11
+ .byte 196,67,13,74,219,240 // vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ .byte 196,65,116,92,241 // vsubps %ymm9,%ymm1,%ymm14
+ .byte 196,65,20,89,238 // vmulps %ymm14,%ymm13,%ymm13
+ .byte 196,65,20,94,210 // vdivps %ymm10,%ymm13,%ymm10
+ .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
+ .byte 196,195,117,74,201,240 // vblendvps %ymm15,%ymm9,%ymm1,%ymm1
+ .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
+ .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
+ .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
+ .byte 196,226,125,24,13,238,57,0,0 // vbroadcastss 0x39ee(%rip),%ymm1 # 4664 <_sk_callback_hsw+0x19b>
+ .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
+ .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
+ .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
+ .byte 196,226,37,184,212 // vfmadd231ps %ymm4,%ymm11,%ymm2
+ .byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
+ .byte 197,172,89,76,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm1
+ .byte 196,226,37,184,205 // vfmadd231ps %ymm5,%ymm11,%ymm1
+ .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
+ .byte 197,172,89,84,36,200 // vmulps -0x38(%rsp),%ymm10,%ymm2
+ .byte 196,98,77,168,218 // vfmadd213ps %ymm2,%ymm6,%ymm11
+ .byte 196,193,36,88,208 // vaddps %ymm8,%ymm11,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -9228,100 +9297,112 @@ HIDDEN _sk_saturation_hsw
.globl _sk_saturation_hsw
FUNCTION(_sk_saturation_hsw)
_sk_saturation_hsw:
+ .byte 197,124,40,194 // vmovaps %ymm2,%ymm8
+ .byte 197,252,17,76,36,168 // vmovups %ymm1,-0x58(%rsp)
+ .byte 197,252,40,208 // vmovaps %ymm0,%ymm2
+ .byte 197,100,89,204 // vmulps %ymm4,%ymm3,%ymm9
+ .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
+ .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
+ .byte 197,124,41,192 // vmovaps %ymm8,%ymm0
+ .byte 197,252,17,68,36,200 // vmovups %ymm0,-0x38(%rsp)
+ .byte 197,116,95,192 // vmaxps %ymm0,%ymm1,%ymm8
+ .byte 196,65,108,95,192 // vmaxps %ymm8,%ymm2,%ymm8
+ .byte 197,116,93,224 // vminps %ymm0,%ymm1,%ymm12
+ .byte 196,65,108,93,228 // vminps %ymm12,%ymm2,%ymm12
+ .byte 196,65,60,92,196 // vsubps %ymm12,%ymm8,%ymm8
+ .byte 197,60,89,231 // vmulps %ymm7,%ymm8,%ymm12
+ .byte 196,65,44,93,195 // vminps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,93,232 // vminps %ymm8,%ymm9,%ymm13
+ .byte 196,65,44,95,195 // vmaxps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,95,192 // vmaxps %ymm8,%ymm9,%ymm8
+ .byte 196,65,60,92,245 // vsubps %ymm13,%ymm8,%ymm14
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,68,194,208,0 // vcmpeqps %ymm8,%ymm7,%ymm10
- .byte 196,98,125,24,13,209,56,0,0 // vbroadcastss 0x38d1(%rip),%ymm9 # 4558 <_sk_callback_hsw+0x19f>
- .byte 197,52,94,223 // vdivps %ymm7,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,44,89,220 // vmulps %ymm4,%ymm10,%ymm11
- .byte 197,44,89,229 // vmulps %ymm5,%ymm10,%ymm12
- .byte 197,44,89,214 // vmulps %ymm6,%ymm10,%ymm10
- .byte 197,116,95,234 // vmaxps %ymm2,%ymm1,%ymm13
- .byte 196,65,124,95,237 // vmaxps %ymm13,%ymm0,%ymm13
- .byte 197,244,93,202 // vminps %ymm2,%ymm1,%ymm1
- .byte 197,252,93,193 // vminps %ymm1,%ymm0,%ymm0
- .byte 197,148,92,192 // vsubps %ymm0,%ymm13,%ymm0
- .byte 196,193,28,93,202 // vminps %ymm10,%ymm12,%ymm1
- .byte 197,164,93,201 // vminps %ymm1,%ymm11,%ymm1
- .byte 196,193,28,95,210 // vmaxps %ymm10,%ymm12,%ymm2
- .byte 197,164,95,210 // vmaxps %ymm2,%ymm11,%ymm2
- .byte 197,236,92,209 // vsubps %ymm1,%ymm2,%ymm2
- .byte 196,65,108,194,232,0 // vcmpeqps %ymm8,%ymm2,%ymm13
- .byte 197,36,92,217 // vsubps %ymm1,%ymm11,%ymm11
- .byte 196,65,124,89,219 // vmulps %ymm11,%ymm0,%ymm11
- .byte 197,36,94,218 // vdivps %ymm2,%ymm11,%ymm11
- .byte 196,67,37,74,216,208 // vblendvps %ymm13,%ymm8,%ymm11,%ymm11
- .byte 197,28,92,225 // vsubps %ymm1,%ymm12,%ymm12
- .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
- .byte 197,28,94,226 // vdivps %ymm2,%ymm12,%ymm12
- .byte 196,67,29,74,224,208 // vblendvps %ymm13,%ymm8,%ymm12,%ymm12
- .byte 197,172,92,201 // vsubps %ymm1,%ymm10,%ymm1
- .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 197,252,94,194 // vdivps %ymm2,%ymm0,%ymm0
- .byte 196,195,125,74,192,208 // vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- .byte 196,226,125,24,21,77,56,0,0 // vbroadcastss 0x384d(%rip),%ymm2 # 455c <_sk_callback_hsw+0x1a3>
- .byte 196,226,125,24,13,72,56,0,0 // vbroadcastss 0x3848(%rip),%ymm1 # 4560 <_sk_callback_hsw+0x1a7>
- .byte 197,84,89,209 // vmulps %ymm1,%ymm5,%ymm10
- .byte 196,98,93,184,210 // vfmadd231ps %ymm2,%ymm4,%ymm10
- .byte 196,98,125,24,45,58,56,0,0 // vbroadcastss 0x383a(%rip),%ymm13 # 4564 <_sk_callback_hsw+0x1ab>
- .byte 196,66,77,184,213 // vfmadd231ps %ymm13,%ymm6,%ymm10
- .byte 197,28,89,241 // vmulps %ymm1,%ymm12,%ymm14
- .byte 196,98,37,184,242 // vfmadd231ps %ymm2,%ymm11,%ymm14
- .byte 196,66,125,184,245 // vfmadd231ps %ymm13,%ymm0,%ymm14
- .byte 196,65,44,92,214 // vsubps %ymm14,%ymm10,%ymm10
- .byte 196,65,36,88,218 // vaddps %ymm10,%ymm11,%ymm11
- .byte 196,65,28,88,226 // vaddps %ymm10,%ymm12,%ymm12
- .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 197,28,93,208 // vminps %ymm0,%ymm12,%ymm10
- .byte 196,65,36,93,210 // vminps %ymm10,%ymm11,%ymm10
- .byte 197,28,95,240 // vmaxps %ymm0,%ymm12,%ymm14
- .byte 196,65,36,95,246 // vmaxps %ymm14,%ymm11,%ymm14
- .byte 197,156,89,201 // vmulps %ymm1,%ymm12,%ymm1
- .byte 196,226,37,184,202 // vfmadd231ps %ymm2,%ymm11,%ymm1
- .byte 196,194,125,184,205 // vfmadd231ps %ymm13,%ymm0,%ymm1
- .byte 196,193,60,194,210,2 // vcmpleps %ymm10,%ymm8,%ymm2
- .byte 197,36,92,233 // vsubps %ymm1,%ymm11,%ymm13
- .byte 196,65,116,89,237 // vmulps %ymm13,%ymm1,%ymm13
- .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,65,20,94,234 // vdivps %ymm10,%ymm13,%ymm13
- .byte 196,65,116,88,237 // vaddps %ymm13,%ymm1,%ymm13
- .byte 196,67,21,74,219,32 // vblendvps %ymm2,%ymm11,%ymm13,%ymm11
- .byte 196,65,52,194,238,1 // vcmpltps %ymm14,%ymm9,%ymm13
- .byte 197,36,92,249 // vsubps %ymm1,%ymm11,%ymm15
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 197,12,92,241 // vsubps %ymm1,%ymm14,%ymm14
- .byte 196,65,4,94,254 // vdivps %ymm14,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,37,74,223,208 // vblendvps %ymm13,%ymm15,%ymm11,%ymm11
- .byte 196,65,36,95,216 // vmaxps %ymm8,%ymm11,%ymm11
- .byte 197,28,92,249 // vsubps %ymm1,%ymm12,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 196,65,4,94,250 // vdivps %ymm10,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,5,74,228,32 // vblendvps %ymm2,%ymm12,%ymm15,%ymm12
- .byte 197,28,92,249 // vsubps %ymm1,%ymm12,%ymm15
+ .byte 196,65,12,194,248,0 // vcmpeqps %ymm8,%ymm14,%ymm15
+ .byte 196,65,52,92,205 // vsubps %ymm13,%ymm9,%ymm9
+ .byte 196,65,28,89,201 // vmulps %ymm9,%ymm12,%ymm9
+ .byte 196,65,52,94,206 // vdivps %ymm14,%ymm9,%ymm9
+ .byte 196,67,53,74,200,240 // vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ .byte 196,65,44,92,213 // vsubps %ymm13,%ymm10,%ymm10
+ .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
+ .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
+ .byte 196,195,45,74,200,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm1
+ .byte 196,65,36,92,213 // vsubps %ymm13,%ymm11,%ymm10
+ .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
+ .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
+ .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
+ .byte 196,98,125,24,53,5,57,0,0 // vbroadcastss 0x3905(%rip),%ymm14 # 4668 <_sk_callback_hsw+0x19f>
+ .byte 196,98,125,24,61,0,57,0,0 // vbroadcastss 0x3900(%rip),%ymm15 # 466c <_sk_callback_hsw+0x1a3>
+ .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
+ .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
+ .byte 196,226,125,24,5,241,56,0,0 // vbroadcastss 0x38f1(%rip),%ymm0 # 4670 <_sk_callback_hsw+0x1a7>
+ .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
+ .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
+ .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
+ .byte 196,98,29,184,208 // vfmadd231ps %ymm0,%ymm12,%ymm10
+ .byte 196,66,101,170,234 // vfmsub213ps %ymm10,%ymm3,%ymm13
+ .byte 196,65,52,88,213 // vaddps %ymm13,%ymm9,%ymm10
+ .byte 196,65,116,88,221 // vaddps %ymm13,%ymm1,%ymm11
+ .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
+ .byte 196,193,36,93,204 // vminps %ymm12,%ymm11,%ymm1
+ .byte 197,44,93,233 // vminps %ymm1,%ymm10,%ymm13
+ .byte 196,65,36,89,207 // vmulps %ymm15,%ymm11,%ymm9
+ .byte 196,66,45,184,206 // vfmadd231ps %ymm14,%ymm10,%ymm9
+ .byte 196,98,29,184,200 // vfmadd231ps %ymm0,%ymm12,%ymm9
+ .byte 196,193,44,92,193 // vsubps %ymm9,%ymm10,%ymm0
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 196,193,52,92,205 // vsubps %ymm13,%ymm9,%ymm1
+ .byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
+ .byte 196,65,36,92,241 // vsubps %ymm9,%ymm11,%ymm14
+ .byte 196,65,52,89,246 // vmulps %ymm14,%ymm9,%ymm14
+ .byte 197,12,94,241 // vdivps %ymm1,%ymm14,%ymm14
+ .byte 196,65,28,92,249 // vsubps %ymm9,%ymm12,%ymm15
.byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,254 // vdivps %ymm14,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,29,74,231,208 // vblendvps %ymm13,%ymm15,%ymm12,%ymm12
- .byte 196,65,28,95,224 // vmaxps %ymm8,%ymm12,%ymm12
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 196,65,4,94,210 // vdivps %ymm10,%ymm15,%ymm10
- .byte 196,65,116,88,210 // vaddps %ymm10,%ymm1,%ymm10
- .byte 196,227,45,74,192,32 // vblendvps %ymm2,%ymm0,%ymm10,%ymm0
- .byte 197,252,92,209 // vsubps %ymm1,%ymm0,%ymm2
- .byte 197,180,89,210 // vmulps %ymm2,%ymm9,%ymm2
- .byte 196,193,108,94,214 // vdivps %ymm14,%ymm2,%ymm2
- .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,227,125,74,193,208 // vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- .byte 196,193,124,95,208 // vmaxps %ymm8,%ymm0,%ymm2
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 196,226,69,172,216 // vfnmadd213ps %ymm0,%ymm7,%ymm3
- .byte 196,193,100,89,195 // vmulps %ymm11,%ymm3,%ymm0
- .byte 196,193,100,89,204 // vmulps %ymm12,%ymm3,%ymm1
- .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,132,94,201 // vdivps %ymm1,%ymm15,%ymm1
+ .byte 196,65,60,194,237,2 // vcmpleps %ymm13,%ymm8,%ymm13
+ .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
+ .byte 196,67,13,74,243,208 // vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ .byte 196,65,36,95,220 // vmaxps %ymm12,%ymm11,%ymm11
+ .byte 197,180,88,201 // vaddps %ymm1,%ymm9,%ymm1
+ .byte 196,195,117,74,204,208 // vblendvps %ymm13,%ymm12,%ymm1,%ymm1
+ .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
+ .byte 196,195,125,74,194,208 // vblendvps %ymm13,%ymm10,%ymm0,%ymm0
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,44,95,211 // vmaxps %ymm11,%ymm10,%ymm10
+ .byte 196,65,124,92,217 // vsubps %ymm9,%ymm0,%ymm11
+ .byte 196,65,28,92,233 // vsubps %ymm9,%ymm12,%ymm13
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,28,194,250,1 // vcmpltps %ymm10,%ymm12,%ymm15
+ .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
+ .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
+ .byte 196,65,52,88,219 // vaddps %ymm11,%ymm9,%ymm11
+ .byte 196,195,125,74,195,240 // vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ .byte 196,65,12,92,217 // vsubps %ymm9,%ymm14,%ymm11
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
+ .byte 196,65,52,88,219 // vaddps %ymm11,%ymm9,%ymm11
+ .byte 196,67,13,74,219,240 // vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ .byte 196,65,116,92,241 // vsubps %ymm9,%ymm1,%ymm14
+ .byte 196,65,20,89,238 // vmulps %ymm14,%ymm13,%ymm13
+ .byte 196,65,20,94,210 // vdivps %ymm10,%ymm13,%ymm10
+ .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
+ .byte 196,195,117,74,201,240 // vblendvps %ymm15,%ymm9,%ymm1,%ymm1
+ .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
+ .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
+ .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
+ .byte 196,226,125,24,13,222,55,0,0 // vbroadcastss 0x37de(%rip),%ymm1 # 4674 <_sk_callback_hsw+0x1ab>
+ .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
+ .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
+ .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
+ .byte 196,226,37,184,212 // vfmadd231ps %ymm4,%ymm11,%ymm2
+ .byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
+ .byte 197,172,89,76,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm1
+ .byte 196,226,37,184,205 // vfmadd231ps %ymm5,%ymm11,%ymm1
+ .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
+ .byte 197,172,89,84,36,200 // vmulps -0x38(%rsp),%ymm10,%ymm2
+ .byte 196,98,77,168,218 // vfmadd213ps %ymm2,%ymm6,%ymm11
+ .byte 196,193,36,88,208 // vaddps %ymm8,%ymm11,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -9329,77 +9410,87 @@ HIDDEN _sk_color_hsw
.globl _sk_color_hsw
FUNCTION(_sk_color_hsw)
_sk_color_hsw:
- .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,100,194,208,0 // vcmpeqps %ymm8,%ymm3,%ymm10
- .byte 196,98,125,24,13,12,55,0,0 // vbroadcastss 0x370c(%rip),%ymm9 # 4568 <_sk_callback_hsw+0x1af>
- .byte 197,52,94,219 // vdivps %ymm3,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
- .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
+ .byte 197,124,40,202 // vmovaps %ymm2,%ymm9
+ .byte 197,124,17,76,36,200 // vmovups %ymm9,-0x38(%rsp)
+ .byte 197,252,17,76,36,168 // vmovups %ymm1,-0x58(%rsp)
+ .byte 197,252,40,208 // vmovaps %ymm0,%ymm2
+ .byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
+ .byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
+ .byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
+ .byte 196,98,125,24,45,119,55,0,0 // vbroadcastss 0x3777(%rip),%ymm13 # 4678 <_sk_callback_hsw+0x1af>
+ .byte 196,98,125,24,53,114,55,0,0 // vbroadcastss 0x3772(%rip),%ymm14 # 467c <_sk_callback_hsw+0x1b3>
+ .byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
+ .byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
+ .byte 196,98,125,24,61,99,55,0,0 // vbroadcastss 0x3763(%rip),%ymm15 # 4680 <_sk_callback_hsw+0x1b7>
+ .byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
+ .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
+ .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
+ .byte 196,66,37,184,207 // vfmadd231ps %ymm15,%ymm11,%ymm9
+ .byte 196,66,101,170,225 // vfmsub213ps %ymm9,%ymm3,%ymm12
+ .byte 196,65,60,88,204 // vaddps %ymm12,%ymm8,%ymm9
+ .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
+ .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
+ .byte 196,65,44,93,195 // vminps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,93,224 // vminps %ymm8,%ymm9,%ymm12
+ .byte 196,65,44,89,198 // vmulps %ymm14,%ymm10,%ymm8
+ .byte 196,66,53,184,197 // vfmadd231ps %ymm13,%ymm9,%ymm8
+ .byte 196,66,37,184,199 // vfmadd231ps %ymm15,%ymm11,%ymm8
+ .byte 196,65,52,92,232 // vsubps %ymm8,%ymm9,%ymm13
+ .byte 196,65,60,89,237 // vmulps %ymm13,%ymm8,%ymm13
+ .byte 196,65,60,92,244 // vsubps %ymm12,%ymm8,%ymm14
+ .byte 196,193,20,94,198 // vdivps %ymm14,%ymm13,%ymm0
+ .byte 196,65,44,92,248 // vsubps %ymm8,%ymm10,%ymm15
+ .byte 196,65,60,89,255 // vmulps %ymm15,%ymm8,%ymm15
+ .byte 196,65,4,94,254 // vdivps %ymm14,%ymm15,%ymm15
+ .byte 196,65,36,92,232 // vsubps %ymm8,%ymm11,%ymm13
+ .byte 196,65,60,89,237 // vmulps %ymm13,%ymm8,%ymm13
+ .byte 196,65,20,94,238 // vdivps %ymm14,%ymm13,%ymm13
+ .byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
+ .byte 196,65,12,194,228,2 // vcmpleps %ymm12,%ymm14,%ymm12
+ .byte 196,65,60,88,255 // vaddps %ymm15,%ymm8,%ymm15
+ .byte 196,67,5,74,250,192 // vblendvps %ymm12,%ymm10,%ymm15,%ymm15
+ .byte 196,65,44,95,211 // vmaxps %ymm11,%ymm10,%ymm10
+ .byte 196,65,60,88,237 // vaddps %ymm13,%ymm8,%ymm13
+ .byte 196,67,21,74,219,192 // vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
+ .byte 196,195,125,74,201,192 // vblendvps %ymm12,%ymm9,%ymm0,%ymm1
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,52,95,202 // vmaxps %ymm10,%ymm9,%ymm9
+ .byte 196,65,116,92,208 // vsubps %ymm8,%ymm1,%ymm10
+ .byte 196,65,28,92,232 // vsubps %ymm8,%ymm12,%ymm13
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,193,28,194,193,1 // vcmpltps %ymm9,%ymm12,%ymm0
+ .byte 196,65,52,92,200 // vsubps %ymm8,%ymm9,%ymm9
+ .byte 196,65,44,94,209 // vdivps %ymm9,%ymm10,%ymm10
+ .byte 196,65,60,88,210 // vaddps %ymm10,%ymm8,%ymm10
+ .byte 196,195,117,74,202,0 // vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ .byte 196,65,4,92,208 // vsubps %ymm8,%ymm15,%ymm10
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,65,44,94,209 // vdivps %ymm9,%ymm10,%ymm10
+ .byte 196,65,60,88,210 // vaddps %ymm10,%ymm8,%ymm10
+ .byte 196,67,5,74,210,0 // vblendvps %ymm0,%ymm10,%ymm15,%ymm10
+ .byte 196,65,36,92,248 // vsubps %ymm8,%ymm11,%ymm15
+ .byte 196,65,20,89,239 // vmulps %ymm15,%ymm13,%ymm13
+ .byte 196,65,20,94,201 // vdivps %ymm9,%ymm13,%ymm9
+ .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
+ .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
+ .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
+ .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
+ .byte 196,226,125,24,5,69,54,0,0 // vbroadcastss 0x3645(%rip),%ymm0 # 4684 <_sk_callback_hsw+0x1bb>
+ .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
- .byte 196,98,125,24,21,241,54,0,0 // vbroadcastss 0x36f1(%rip),%ymm10 # 456c <_sk_callback_hsw+0x1b3>
- .byte 196,98,125,24,29,236,54,0,0 // vbroadcastss 0x36ec(%rip),%ymm11 # 4570 <_sk_callback_hsw+0x1b7>
- .byte 196,65,84,89,227 // vmulps %ymm11,%ymm5,%ymm12
- .byte 196,66,93,184,226 // vfmadd231ps %ymm10,%ymm4,%ymm12
- .byte 196,98,125,24,45,221,54,0,0 // vbroadcastss 0x36dd(%rip),%ymm13 # 4574 <_sk_callback_hsw+0x1bb>
- .byte 196,66,77,184,229 // vfmadd231ps %ymm13,%ymm6,%ymm12
- .byte 196,65,116,89,243 // vmulps %ymm11,%ymm1,%ymm14
- .byte 196,66,125,184,242 // vfmadd231ps %ymm10,%ymm0,%ymm14
- .byte 196,66,109,184,245 // vfmadd231ps %ymm13,%ymm2,%ymm14
- .byte 196,65,28,92,230 // vsubps %ymm14,%ymm12,%ymm12
- .byte 196,65,124,88,244 // vaddps %ymm12,%ymm0,%ymm14
- .byte 196,65,116,88,252 // vaddps %ymm12,%ymm1,%ymm15
- .byte 196,193,108,88,196 // vaddps %ymm12,%ymm2,%ymm0
- .byte 197,132,93,200 // vminps %ymm0,%ymm15,%ymm1
- .byte 197,140,93,209 // vminps %ymm1,%ymm14,%ymm2
- .byte 197,132,95,200 // vmaxps %ymm0,%ymm15,%ymm1
- .byte 197,12,95,225 // vmaxps %ymm1,%ymm14,%ymm12
- .byte 196,193,4,89,203 // vmulps %ymm11,%ymm15,%ymm1
- .byte 196,194,13,184,202 // vfmadd231ps %ymm10,%ymm14,%ymm1
- .byte 196,194,125,184,205 // vfmadd231ps %ymm13,%ymm0,%ymm1
- .byte 197,60,194,210,2 // vcmpleps %ymm2,%ymm8,%ymm10
- .byte 197,12,92,217 // vsubps %ymm1,%ymm14,%ymm11
- .byte 196,65,116,89,219 // vmulps %ymm11,%ymm1,%ymm11
- .byte 197,244,92,210 // vsubps %ymm2,%ymm1,%ymm2
- .byte 197,36,94,218 // vdivps %ymm2,%ymm11,%ymm11
- .byte 196,65,116,88,219 // vaddps %ymm11,%ymm1,%ymm11
- .byte 196,67,37,74,222,160 // vblendvps %ymm10,%ymm14,%ymm11,%ymm11
- .byte 196,65,52,194,236,1 // vcmpltps %ymm12,%ymm9,%ymm13
- .byte 197,36,92,241 // vsubps %ymm1,%ymm11,%ymm14
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
- .byte 196,65,52,89,246 // vmulps %ymm14,%ymm9,%ymm14
- .byte 197,28,92,225 // vsubps %ymm1,%ymm12,%ymm12
- .byte 196,65,12,94,244 // vdivps %ymm12,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,37,74,222,208 // vblendvps %ymm13,%ymm14,%ymm11,%ymm11
- .byte 196,65,36,95,216 // vmaxps %ymm8,%ymm11,%ymm11
- .byte 197,4,92,241 // vsubps %ymm1,%ymm15,%ymm14
- .byte 196,65,116,89,246 // vmulps %ymm14,%ymm1,%ymm14
- .byte 197,12,94,242 // vdivps %ymm2,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,13,74,247,160 // vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- .byte 197,12,92,249 // vsubps %ymm1,%ymm14,%ymm15
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,252 // vdivps %ymm12,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,13,74,247,208 // vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- .byte 196,65,12,95,240 // vmaxps %ymm8,%ymm14,%ymm14
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 197,132,94,210 // vdivps %ymm2,%ymm15,%ymm2
- .byte 197,244,88,210 // vaddps %ymm2,%ymm1,%ymm2
- .byte 196,227,109,74,192,160 // vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- .byte 197,252,92,209 // vsubps %ymm1,%ymm0,%ymm2
- .byte 197,180,89,210 // vmulps %ymm2,%ymm9,%ymm2
- .byte 196,193,108,94,212 // vdivps %ymm12,%ymm2,%ymm2
- .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,227,125,74,193,208 // vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- .byte 196,193,124,95,208 // vmaxps %ymm8,%ymm0,%ymm2
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 196,226,69,172,216 // vfnmadd213ps %ymm0,%ymm7,%ymm3
- .byte 196,193,100,89,195 // vmulps %ymm11,%ymm3,%ymm0
- .byte 196,193,100,89,206 // vmulps %ymm14,%ymm3,%ymm1
- .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
+ .byte 196,226,37,184,212 // vfmadd231ps %ymm4,%ymm11,%ymm2
+ .byte 197,236,88,193 // vaddps %ymm1,%ymm2,%ymm0
+ .byte 197,172,89,76,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm1
+ .byte 196,226,37,184,205 // vfmadd231ps %ymm5,%ymm11,%ymm1
+ .byte 196,193,116,88,200 // vaddps %ymm8,%ymm1,%ymm1
+ .byte 197,172,89,84,36,200 // vmulps -0x38(%rsp),%ymm10,%ymm2
+ .byte 196,98,77,168,218 // vfmadd213ps %ymm2,%ymm6,%ymm11
+ .byte 196,193,36,88,209 // vaddps %ymm9,%ymm11,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -9407,77 +9498,87 @@ HIDDEN _sk_luminosity_hsw
.globl _sk_luminosity_hsw
FUNCTION(_sk_luminosity_hsw)
_sk_luminosity_hsw:
- .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,68,194,208,0 // vcmpeqps %ymm8,%ymm7,%ymm10
- .byte 196,98,125,24,13,181,53,0,0 // vbroadcastss 0x35b5(%rip),%ymm9 # 4578 <_sk_callback_hsw+0x1bf>
- .byte 197,52,94,223 // vdivps %ymm7,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,44,89,220 // vmulps %ymm4,%ymm10,%ymm11
- .byte 197,44,89,229 // vmulps %ymm5,%ymm10,%ymm12
- .byte 197,44,89,214 // vmulps %ymm6,%ymm10,%ymm10
- .byte 196,98,125,24,45,154,53,0,0 // vbroadcastss 0x359a(%rip),%ymm13 # 457c <_sk_callback_hsw+0x1c3>
- .byte 196,98,125,24,53,149,53,0,0 // vbroadcastss 0x3595(%rip),%ymm14 # 4580 <_sk_callback_hsw+0x1c7>
- .byte 196,193,116,89,206 // vmulps %ymm14,%ymm1,%ymm1
- .byte 196,226,21,168,193 // vfmadd213ps %ymm1,%ymm13,%ymm0
- .byte 196,98,125,24,61,134,53,0,0 // vbroadcastss 0x3586(%rip),%ymm15 # 4584 <_sk_callback_hsw+0x1cb>
- .byte 196,226,5,168,208 // vfmadd213ps %ymm0,%ymm15,%ymm2
- .byte 196,193,28,89,198 // vmulps %ymm14,%ymm12,%ymm0
- .byte 196,194,37,184,197 // vfmadd231ps %ymm13,%ymm11,%ymm0
- .byte 196,194,45,184,199 // vfmadd231ps %ymm15,%ymm10,%ymm0
- .byte 197,236,92,192 // vsubps %ymm0,%ymm2,%ymm0
- .byte 197,164,88,208 // vaddps %ymm0,%ymm11,%ymm2
- .byte 197,28,88,216 // vaddps %ymm0,%ymm12,%ymm11
- .byte 197,172,88,192 // vaddps %ymm0,%ymm10,%ymm0
- .byte 197,164,93,200 // vminps %ymm0,%ymm11,%ymm1
- .byte 197,108,93,209 // vminps %ymm1,%ymm2,%ymm10
- .byte 197,164,95,200 // vmaxps %ymm0,%ymm11,%ymm1
- .byte 197,108,95,225 // vmaxps %ymm1,%ymm2,%ymm12
- .byte 196,193,36,89,206 // vmulps %ymm14,%ymm11,%ymm1
- .byte 196,194,109,184,205 // vfmadd231ps %ymm13,%ymm2,%ymm1
- .byte 196,194,125,184,207 // vfmadd231ps %ymm15,%ymm0,%ymm1
- .byte 196,65,60,194,234,2 // vcmpleps %ymm10,%ymm8,%ymm13
- .byte 197,108,92,241 // vsubps %ymm1,%ymm2,%ymm14
- .byte 196,65,116,89,246 // vmulps %ymm14,%ymm1,%ymm14
- .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,65,12,94,242 // vdivps %ymm10,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
- .byte 196,65,52,194,244,1 // vcmpltps %ymm12,%ymm9,%ymm14
- .byte 197,108,92,249 // vsubps %ymm1,%ymm2,%ymm15
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 197,28,92,225 // vsubps %ymm1,%ymm12,%ymm12
- .byte 196,65,4,94,252 // vdivps %ymm12,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,195,109,74,215,224 // vblendvps %ymm14,%ymm15,%ymm2,%ymm2
- .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 197,36,92,249 // vsubps %ymm1,%ymm11,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 196,65,4,94,250 // vdivps %ymm10,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,5,74,219,208 // vblendvps %ymm13,%ymm11,%ymm15,%ymm11
- .byte 197,36,92,249 // vsubps %ymm1,%ymm11,%ymm15
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,252 // vdivps %ymm12,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,37,74,223,224 // vblendvps %ymm14,%ymm15,%ymm11,%ymm11
- .byte 196,65,36,95,216 // vmaxps %ymm8,%ymm11,%ymm11
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 196,65,4,94,210 // vdivps %ymm10,%ymm15,%ymm10
- .byte 196,65,116,88,210 // vaddps %ymm10,%ymm1,%ymm10
- .byte 196,227,45,74,192,208 // vblendvps %ymm13,%ymm0,%ymm10,%ymm0
- .byte 197,124,92,209 // vsubps %ymm1,%ymm0,%ymm10
- .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,65,52,94,204 // vdivps %ymm12,%ymm9,%ymm9
- .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
- .byte 196,227,125,74,193,224 // vblendvps %ymm14,%ymm1,%ymm0,%ymm0
- .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 196,226,69,172,216 // vfnmadd213ps %ymm0,%ymm7,%ymm3
- .byte 197,228,89,194 // vmulps %ymm2,%ymm3,%ymm0
- .byte 196,193,100,89,203 // vmulps %ymm11,%ymm3,%ymm1
- .byte 196,193,100,89,208 // vmulps %ymm8,%ymm3,%ymm2
+ .byte 197,124,40,202 // vmovaps %ymm2,%ymm9
+ .byte 197,124,17,76,36,168 // vmovups %ymm9,-0x58(%rsp)
+ .byte 197,252,17,76,36,200 // vmovups %ymm1,-0x38(%rsp)
+ .byte 197,252,40,208 // vmovaps %ymm0,%ymm2
+ .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
+ .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
+ .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
+ .byte 196,98,125,24,45,222,53,0,0 // vbroadcastss 0x35de(%rip),%ymm13 # 4688 <_sk_callback_hsw+0x1bf>
+ .byte 196,98,125,24,53,217,53,0,0 // vbroadcastss 0x35d9(%rip),%ymm14 # 468c <_sk_callback_hsw+0x1c3>
+ .byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
+ .byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
+ .byte 196,98,125,24,61,202,53,0,0 // vbroadcastss 0x35ca(%rip),%ymm15 # 4690 <_sk_callback_hsw+0x1c7>
+ .byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
+ .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
+ .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
+ .byte 196,66,37,184,207 // vfmadd231ps %ymm15,%ymm11,%ymm9
+ .byte 196,66,69,170,225 // vfmsub213ps %ymm9,%ymm7,%ymm12
+ .byte 196,65,60,88,204 // vaddps %ymm12,%ymm8,%ymm9
+ .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
+ .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
+ .byte 196,65,44,93,195 // vminps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,93,224 // vminps %ymm8,%ymm9,%ymm12
+ .byte 196,65,44,89,198 // vmulps %ymm14,%ymm10,%ymm8
+ .byte 196,66,53,184,197 // vfmadd231ps %ymm13,%ymm9,%ymm8
+ .byte 196,66,37,184,199 // vfmadd231ps %ymm15,%ymm11,%ymm8
+ .byte 196,65,52,92,232 // vsubps %ymm8,%ymm9,%ymm13
+ .byte 196,65,60,89,237 // vmulps %ymm13,%ymm8,%ymm13
+ .byte 196,65,60,92,244 // vsubps %ymm12,%ymm8,%ymm14
+ .byte 196,193,20,94,198 // vdivps %ymm14,%ymm13,%ymm0
+ .byte 196,65,44,92,248 // vsubps %ymm8,%ymm10,%ymm15
+ .byte 196,65,60,89,255 // vmulps %ymm15,%ymm8,%ymm15
+ .byte 196,65,4,94,254 // vdivps %ymm14,%ymm15,%ymm15
+ .byte 196,65,36,92,232 // vsubps %ymm8,%ymm11,%ymm13
+ .byte 196,65,60,89,237 // vmulps %ymm13,%ymm8,%ymm13
+ .byte 196,65,20,94,238 // vdivps %ymm14,%ymm13,%ymm13
+ .byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
+ .byte 196,65,12,194,228,2 // vcmpleps %ymm12,%ymm14,%ymm12
+ .byte 196,65,60,88,255 // vaddps %ymm15,%ymm8,%ymm15
+ .byte 196,67,5,74,250,192 // vblendvps %ymm12,%ymm10,%ymm15,%ymm15
+ .byte 196,65,44,95,211 // vmaxps %ymm11,%ymm10,%ymm10
+ .byte 196,65,60,88,237 // vaddps %ymm13,%ymm8,%ymm13
+ .byte 196,67,21,74,219,192 // vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
+ .byte 196,195,125,74,201,192 // vblendvps %ymm12,%ymm9,%ymm0,%ymm1
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,52,95,202 // vmaxps %ymm10,%ymm9,%ymm9
+ .byte 196,65,116,92,208 // vsubps %ymm8,%ymm1,%ymm10
+ .byte 196,65,28,92,232 // vsubps %ymm8,%ymm12,%ymm13
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,193,28,194,193,1 // vcmpltps %ymm9,%ymm12,%ymm0
+ .byte 196,65,52,92,200 // vsubps %ymm8,%ymm9,%ymm9
+ .byte 196,65,44,94,209 // vdivps %ymm9,%ymm10,%ymm10
+ .byte 196,65,60,88,210 // vaddps %ymm10,%ymm8,%ymm10
+ .byte 196,195,117,74,202,0 // vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ .byte 196,65,4,92,208 // vsubps %ymm8,%ymm15,%ymm10
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,65,44,94,209 // vdivps %ymm9,%ymm10,%ymm10
+ .byte 196,65,60,88,210 // vaddps %ymm10,%ymm8,%ymm10
+ .byte 196,67,5,74,210,0 // vblendvps %ymm0,%ymm10,%ymm15,%ymm10
+ .byte 196,65,36,92,248 // vsubps %ymm8,%ymm11,%ymm15
+ .byte 196,65,20,89,239 // vmulps %ymm15,%ymm13,%ymm13
+ .byte 196,65,20,94,201 // vdivps %ymm9,%ymm13,%ymm9
+ .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
+ .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
+ .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
+ .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
+ .byte 196,226,125,24,5,172,52,0,0 // vbroadcastss 0x34ac(%rip),%ymm0 # 4694 <_sk_callback_hsw+0x1cb>
+ .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
+ .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
+ .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
+ .byte 196,226,37,184,212 // vfmadd231ps %ymm4,%ymm11,%ymm2
+ .byte 197,236,88,193 // vaddps %ymm1,%ymm2,%ymm0
+ .byte 197,172,89,76,36,200 // vmulps -0x38(%rsp),%ymm10,%ymm1
+ .byte 196,226,37,184,205 // vfmadd231ps %ymm5,%ymm11,%ymm1
+ .byte 196,193,116,88,200 // vaddps %ymm8,%ymm1,%ymm1
+ .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
+ .byte 196,98,77,168,218 // vfmadd213ps %ymm2,%ymm6,%ymm11
+ .byte 196,193,36,88,209 // vaddps %ymm9,%ymm11,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -9497,7 +9598,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,72,52,0,0 // vbroadcastss 0x3448(%rip),%ymm8 # 4588 <_sk_callback_hsw+0x1cf>
+ .byte 196,98,125,24,5,72,52,0,0 // vbroadcastss 0x3448(%rip),%ymm8 # 4698 <_sk_callback_hsw+0x1cf>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -9509,7 +9610,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,43,52,0,0 // vbroadcastss 0x342b(%rip),%ymm8 # 458c <_sk_callback_hsw+0x1d3>
+ .byte 196,98,125,24,5,43,52,0,0 // vbroadcastss 0x342b(%rip),%ymm8 # 469c <_sk_callback_hsw+0x1d3>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -9595,7 +9696,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,115,51,0,0 // vbroadcastss 0x3373(%rip),%ymm10 # 4590 <_sk_callback_hsw+0x1d7>
+ .byte 196,98,125,24,21,115,51,0,0 // vbroadcastss 0x3373(%rip),%ymm10 # 46a0 <_sk_callback_hsw+0x1d7>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -9608,16 +9709,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,84,51,0,0 // vbroadcastss 0x3354(%rip),%ymm8 # 4594 <_sk_callback_hsw+0x1db>
+ .byte 196,98,125,24,5,84,51,0,0 // vbroadcastss 0x3354(%rip),%ymm8 # 46a4 <_sk_callback_hsw+0x1db>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,70,51,0,0 // vbroadcastss 0x3346(%rip),%ymm11 # 4598 <_sk_callback_hsw+0x1df>
- .byte 196,98,125,24,37,65,51,0,0 // vbroadcastss 0x3341(%rip),%ymm12 # 459c <_sk_callback_hsw+0x1e3>
+ .byte 196,98,125,24,29,70,51,0,0 // vbroadcastss 0x3346(%rip),%ymm11 # 46a8 <_sk_callback_hsw+0x1df>
+ .byte 196,98,125,24,37,65,51,0,0 // vbroadcastss 0x3341(%rip),%ymm12 # 46ac <_sk_callback_hsw+0x1e3>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,50,51,0,0 // vbroadcastss 0x3332(%rip),%ymm14 # 45a0 <_sk_callback_hsw+0x1e7>
+ .byte 196,98,125,24,53,50,51,0,0 // vbroadcastss 0x3332(%rip),%ymm14 # 46b0 <_sk_callback_hsw+0x1e7>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,40,51,0,0 // vbroadcastss 0x3328(%rip),%ymm10 # 45a4 <_sk_callback_hsw+0x1eb>
+ .byte 196,98,125,24,21,40,51,0,0 // vbroadcastss 0x3328(%rip),%ymm10 # 46b4 <_sk_callback_hsw+0x1eb>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -9643,16 +9744,16 @@ _sk_to_srgb_hsw:
.byte 197,124,82,192 // vrsqrtps %ymm0,%ymm8
.byte 196,65,124,83,200 // vrcpps %ymm8,%ymm9
.byte 196,65,124,82,208 // vrsqrtps %ymm8,%ymm10
- .byte 196,98,125,24,5,194,50,0,0 // vbroadcastss 0x32c2(%rip),%ymm8 # 45a8 <_sk_callback_hsw+0x1ef>
+ .byte 196,98,125,24,5,194,50,0,0 // vbroadcastss 0x32c2(%rip),%ymm8 # 46b8 <_sk_callback_hsw+0x1ef>
.byte 196,65,124,89,216 // vmulps %ymm8,%ymm0,%ymm11
- .byte 196,98,125,24,37,184,50,0,0 // vbroadcastss 0x32b8(%rip),%ymm12 # 45ac <_sk_callback_hsw+0x1f3>
- .byte 196,98,125,24,45,179,50,0,0 // vbroadcastss 0x32b3(%rip),%ymm13 # 45b0 <_sk_callback_hsw+0x1f7>
+ .byte 196,98,125,24,37,184,50,0,0 // vbroadcastss 0x32b8(%rip),%ymm12 # 46bc <_sk_callback_hsw+0x1f3>
+ .byte 196,98,125,24,45,179,50,0,0 // vbroadcastss 0x32b3(%rip),%ymm13 # 46c0 <_sk_callback_hsw+0x1f7>
.byte 196,66,21,168,204 // vfmadd213ps %ymm12,%ymm13,%ymm9
- .byte 196,98,125,24,53,169,50,0,0 // vbroadcastss 0x32a9(%rip),%ymm14 # 45b4 <_sk_callback_hsw+0x1fb>
+ .byte 196,98,125,24,53,169,50,0,0 // vbroadcastss 0x32a9(%rip),%ymm14 # 46c4 <_sk_callback_hsw+0x1fb>
.byte 196,66,13,184,202 // vfmadd231ps %ymm10,%ymm14,%ymm9
- .byte 196,98,125,24,21,159,50,0,0 // vbroadcastss 0x329f(%rip),%ymm10 # 45b8 <_sk_callback_hsw+0x1ff>
+ .byte 196,98,125,24,21,159,50,0,0 // vbroadcastss 0x329f(%rip),%ymm10 # 46c8 <_sk_callback_hsw+0x1ff>
.byte 196,65,44,93,201 // vminps %ymm9,%ymm10,%ymm9
- .byte 196,98,125,24,61,149,50,0,0 // vbroadcastss 0x3295(%rip),%ymm15 # 45bc <_sk_callback_hsw+0x203>
+ .byte 196,98,125,24,61,149,50,0,0 // vbroadcastss 0x3295(%rip),%ymm15 # 46cc <_sk_callback_hsw+0x203>
.byte 196,193,124,194,199,1 // vcmpltps %ymm15,%ymm0,%ymm0
.byte 196,195,53,74,195,0 // vblendvps %ymm0,%ymm11,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -9685,26 +9786,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,15,50,0,0 // vbroadcastss 0x320f(%rip),%ymm11 # 45c0 <_sk_callback_hsw+0x207>
+ .byte 196,98,125,24,29,15,50,0,0 // vbroadcastss 0x320f(%rip),%ymm11 # 46d0 <_sk_callback_hsw+0x207>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,252,49,0,0 // vbroadcastss 0x31fc(%rip),%ymm14 # 45c4 <_sk_callback_hsw+0x20b>
+ .byte 196,98,125,24,53,252,49,0,0 // vbroadcastss 0x31fc(%rip),%ymm14 # 46d4 <_sk_callback_hsw+0x20b>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,227,49,0,0 // vbroadcastss 0x31e3(%rip),%ymm14 # 45cc <_sk_callback_hsw+0x213>
+ .byte 196,98,125,24,53,227,49,0,0 // vbroadcastss 0x31e3(%rip),%ymm14 # 46dc <_sk_callback_hsw+0x213>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,209,49,0,0 // vbroadcastss 0x31d1(%rip),%ymm14 # 45c8 <_sk_callback_hsw+0x20f>
+ .byte 196,98,125,24,53,209,49,0,0 // vbroadcastss 0x31d1(%rip),%ymm14 # 46d8 <_sk_callback_hsw+0x20f>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,180,49,0,0 // vbroadcastss 0x31b4(%rip),%ymm11 # 45d4 <_sk_callback_hsw+0x21b>
+ .byte 196,98,125,24,29,180,49,0,0 // vbroadcastss 0x31b4(%rip),%ymm11 # 46e4 <_sk_callback_hsw+0x21b>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -9714,7 +9815,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,119,49,0,0 // vbroadcastss 0x3177(%rip),%ymm8 # 45d0 <_sk_callback_hsw+0x217>
+ .byte 196,98,125,24,5,119,49,0,0 // vbroadcastss 0x3177(%rip),%ymm8 # 46e0 <_sk_callback_hsw+0x217>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -9731,30 +9832,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,68,49,0,0 // vbroadcastss 0x3144(%rip),%ymm8 # 45d8 <_sk_callback_hsw+0x21f>
+ .byte 196,98,125,24,5,68,49,0,0 // vbroadcastss 0x3144(%rip),%ymm8 # 46e8 <_sk_callback_hsw+0x21f>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,39,49,0,0 // vbroadcastss 0x3127(%rip),%ymm9 # 45dc <_sk_callback_hsw+0x223>
+ .byte 196,98,125,24,13,39,49,0,0 // vbroadcastss 0x3127(%rip),%ymm9 # 46ec <_sk_callback_hsw+0x223>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,29,49,0,0 // vbroadcastss 0x311d(%rip),%ymm11 # 45e0 <_sk_callback_hsw+0x227>
+ .byte 196,98,125,24,29,29,49,0,0 // vbroadcastss 0x311d(%rip),%ymm11 # 46f0 <_sk_callback_hsw+0x227>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,7,49,0,0 // vbroadcastss 0x3107(%rip),%ymm13 # 45e8 <_sk_callback_hsw+0x22f>
+ .byte 196,98,125,24,45,7,49,0,0 // vbroadcastss 0x3107(%rip),%ymm13 # 46f8 <_sk_callback_hsw+0x22f>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,253,48,0,0 // vbroadcastss 0x30fd(%rip),%ymm14 # 45ec <_sk_callback_hsw+0x233>
+ .byte 196,98,125,24,53,253,48,0,0 // vbroadcastss 0x30fd(%rip),%ymm14 # 46fc <_sk_callback_hsw+0x233>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,227,48,0,0 // vbroadcastss 0x30e3(%rip),%ymm3 # 45e4 <_sk_callback_hsw+0x22b>
+ .byte 196,226,125,24,29,227,48,0,0 // vbroadcastss 0x30e3(%rip),%ymm3 # 46f4 <_sk_callback_hsw+0x22b>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,206,48,0,0 // vbroadcastss 0x30ce(%rip),%ymm12 # 45f0 <_sk_callback_hsw+0x237>
+ .byte 196,98,125,24,37,206,48,0,0 // vbroadcastss 0x30ce(%rip),%ymm12 # 4700 <_sk_callback_hsw+0x237>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -9770,7 +9871,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,122,48,0,0 // vbroadcastss 0x307a(%rip),%ymm0 # 45f4 <_sk_callback_hsw+0x23b>
+ .byte 196,226,125,24,5,122,48,0,0 // vbroadcastss 0x307a(%rip),%ymm0 # 4704 <_sk_callback_hsw+0x23b>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -9820,11 +9921,11 @@ _sk_scale_u8_hsw:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,51 // jne 165a <_sk_scale_u8_hsw+0x43>
+ .byte 117,51 // jne 176a <_sk_scale_u8_hsw+0x43>
.byte 197,122,126,0 // vmovq (%rax),%xmm8
.byte 196,66,125,49,192 // vpmovzxbd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,186,47,0,0 // vbroadcastss 0x2fba(%rip),%ymm9 # 45f8 <_sk_callback_hsw+0x23f>
+ .byte 196,98,125,24,13,186,47,0,0 // vbroadcastss 0x2fba(%rip),%ymm9 # 4708 <_sk_callback_hsw+0x23f>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -9842,9 +9943,9 @@ _sk_scale_u8_hsw:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 1662 <_sk_scale_u8_hsw+0x4b>
+ .byte 117,234 // jne 1772 <_sk_scale_u8_hsw+0x4b>
.byte 196,65,249,110,193 // vmovq %r9,%xmm8
- .byte 235,172 // jmp 162b <_sk_scale_u8_hsw+0x14>
+ .byte 235,172 // jmp 173b <_sk_scale_u8_hsw+0x14>
HIDDEN _sk_lerp_1_float_hsw
.globl _sk_lerp_1_float_hsw
@@ -9872,11 +9973,11 @@ _sk_lerp_u8_hsw:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,71 // jne 1705 <_sk_lerp_u8_hsw+0x57>
+ .byte 117,71 // jne 1815 <_sk_lerp_u8_hsw+0x57>
.byte 197,122,126,0 // vmovq (%rax),%xmm8
.byte 196,66,125,49,192 // vpmovzxbd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,39,47,0,0 // vbroadcastss 0x2f27(%rip),%ymm9 # 45fc <_sk_callback_hsw+0x243>
+ .byte 196,98,125,24,13,39,47,0,0 // vbroadcastss 0x2f27(%rip),%ymm9 # 470c <_sk_callback_hsw+0x243>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -9898,9 +9999,9 @@ _sk_lerp_u8_hsw:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 170d <_sk_lerp_u8_hsw+0x5f>
+ .byte 117,234 // jne 181d <_sk_lerp_u8_hsw+0x5f>
.byte 196,65,249,110,193 // vmovq %r9,%xmm8
- .byte 235,152 // jmp 16c2 <_sk_lerp_u8_hsw+0x14>
+ .byte 235,152 // jmp 17d2 <_sk_lerp_u8_hsw+0x14>
HIDDEN _sk_lerp_565_hsw
.globl _sk_lerp_565_hsw
@@ -9909,23 +10010,23 @@ _sk_lerp_565_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,169,0,0,0 // jne 17e1 <_sk_lerp_565_hsw+0xb7>
+ .byte 15,133,169,0,0,0 // jne 18f1 <_sk_lerp_565_hsw+0xb7>
.byte 196,65,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,180,46,0,0 // vpbroadcastd 0x2eb4(%rip),%ymm9 # 4600 <_sk_callback_hsw+0x247>
+ .byte 196,98,125,88,13,180,46,0,0 // vpbroadcastd 0x2eb4(%rip),%ymm9 # 4710 <_sk_callback_hsw+0x247>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,165,46,0,0 // vbroadcastss 0x2ea5(%rip),%ymm10 # 4604 <_sk_callback_hsw+0x24b>
+ .byte 196,98,125,24,21,165,46,0,0 // vbroadcastss 0x2ea5(%rip),%ymm10 # 4714 <_sk_callback_hsw+0x24b>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,155,46,0,0 // vpbroadcastd 0x2e9b(%rip),%ymm10 # 4608 <_sk_callback_hsw+0x24f>
+ .byte 196,98,125,88,21,155,46,0,0 // vpbroadcastd 0x2e9b(%rip),%ymm10 # 4718 <_sk_callback_hsw+0x24f>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,140,46,0,0 // vbroadcastss 0x2e8c(%rip),%ymm11 # 460c <_sk_callback_hsw+0x253>
+ .byte 196,98,125,24,29,140,46,0,0 // vbroadcastss 0x2e8c(%rip),%ymm11 # 471c <_sk_callback_hsw+0x253>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,130,46,0,0 // vpbroadcastd 0x2e82(%rip),%ymm11 # 4610 <_sk_callback_hsw+0x257>
+ .byte 196,98,125,88,29,130,46,0,0 // vpbroadcastd 0x2e82(%rip),%ymm11 # 4720 <_sk_callback_hsw+0x257>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,115,46,0,0 // vbroadcastss 0x2e73(%rip),%ymm11 # 4614 <_sk_callback_hsw+0x25b>
+ .byte 196,98,125,24,29,115,46,0,0 // vbroadcastss 0x2e73(%rip),%ymm11 # 4724 <_sk_callback_hsw+0x25b>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -9946,9 +10047,9 @@ _sk_lerp_565_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 15,135,68,255,255,255 // ja 173e <_sk_lerp_565_hsw+0x14>
+ .byte 15,135,68,255,255,255 // ja 184e <_sk_lerp_565_hsw+0x14>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 1850 <_sk_lerp_565_hsw+0x126>
+ .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 1960 <_sk_lerp_565_hsw+0x126>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -9960,12 +10061,12 @@ _sk_lerp_565_hsw:
.byte 196,65,57,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm8,%xmm8
.byte 196,65,57,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm8,%xmm8
.byte 196,65,57,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm8,%xmm8
- .byte 233,239,254,255,255 // jmpq 173e <_sk_lerp_565_hsw+0x14>
+ .byte 233,239,254,255,255 // jmpq 184e <_sk_lerp_565_hsw+0x14>
.byte 144 // nop
.byte 243,255 // repz (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 1855 <_sk_lerp_565_hsw+0x12b>
+ .byte 235,255 // jmp 1965 <_sk_lerp_565_hsw+0x12b>
.byte 255 // (bad)
.byte 255,227 // jmpq *%rbx
.byte 255 // (bad)
@@ -9994,23 +10095,23 @@ _sk_load_tables_hsw:
.byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 117,105 // jne 18ea <_sk_load_tables_hsw+0x7e>
+ .byte 117,105 // jne 19fa <_sk_load_tables_hsw+0x7e>
.byte 196,193,126,111,25 // vmovdqu (%r9),%ymm3
- .byte 197,229,219,13,50,48,0,0 // vpand 0x3032(%rip),%ymm3,%ymm1 # 48c0 <_sk_callback_hsw+0x507>
+ .byte 197,229,219,13,66,48,0,0 // vpand 0x3042(%rip),%ymm3,%ymm1 # 49e0 <_sk_callback_hsw+0x517>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 72,139,72,8 // mov 0x8(%rax),%rcx
.byte 76,139,72,16 // mov 0x10(%rax),%r9
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,50,48,0,0 // vpshufb 0x3032(%rip),%ymm3,%ymm2 # 48e0 <_sk_callback_hsw+0x527>
+ .byte 196,226,101,0,21,66,48,0,0 // vpshufb 0x3042(%rip),%ymm3,%ymm2 # 4a00 <_sk_callback_hsw+0x537>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,145 // vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,58,48,0,0 // vpshufb 0x303a(%rip),%ymm3,%ymm9 # 4900 <_sk_callback_hsw+0x547>
+ .byte 196,98,101,0,13,74,48,0,0 // vpshufb 0x304a(%rip),%ymm3,%ymm9 # 4a20 <_sk_callback_hsw+0x557>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,58,45,0,0 // vbroadcastss 0x2d3a(%rip),%ymm8 # 4618 <_sk_callback_hsw+0x25f>
+ .byte 196,98,125,24,5,58,45,0,0 // vbroadcastss 0x2d3a(%rip),%ymm8 # 4728 <_sk_callback_hsw+0x25f>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,193 // mov %r8,%rcx
@@ -10023,7 +10124,7 @@ _sk_load_tables_hsw:
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,194,125,140,25 // vpmaskmovd (%r9),%ymm0,%ymm3
- .byte 233,115,255,255,255 // jmpq 1886 <_sk_load_tables_hsw+0x1a>
+ .byte 233,115,255,255,255 // jmpq 1996 <_sk_load_tables_hsw+0x1a>
HIDDEN _sk_load_tables_u16_be_hsw
.globl _sk_load_tables_u16_be_hsw
@@ -10033,7 +10134,7 @@ _sk_load_tables_u16_be_hsw:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,201,0,0,0 // jne 19f2 <_sk_load_tables_u16_be_hsw+0xdf>
+ .byte 15,133,201,0,0,0 // jne 1b02 <_sk_load_tables_u16_be_hsw+0xdf>
.byte 196,1,121,16,4,72 // vmovupd (%r8,%r9,2),%xmm8
.byte 196,129,121,16,84,72,16 // vmovupd 0x10(%r8,%r9,2),%xmm2
.byte 196,129,121,16,92,72,32 // vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -10049,7 +10150,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,198,48,0,0 // vmovdqa 0x30c6(%rip),%xmm10 # 4a40 <_sk_callback_hsw+0x687>
+ .byte 197,121,111,21,214,48,0,0 // vmovdqa 0x30d6(%rip),%xmm10 # 4b60 <_sk_callback_hsw+0x697>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -10071,36 +10172,36 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,51,44,0,0 // vbroadcastss 0x2c33(%rip),%ymm8 # 461c <_sk_callback_hsw+0x263>
+ .byte 196,98,125,24,5,51,44,0,0 // vbroadcastss 0x2c33(%rip),%ymm8 # 472c <_sk_callback_hsw+0x263>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,123,16,4,72 // vmovsd (%r8,%r9,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,85 // je 1a58 <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 116,85 // je 1b68 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,1,57,22,68,72,8 // vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,72 // jb 1a58 <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 114,72 // jb 1b68 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,129,123,16,84,72,16 // vmovsd 0x10(%r8,%r9,2),%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 116,72 // je 1a65 <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 116,72 // je 1b75 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,105,22,84,72,24 // vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,59 // jb 1a65 <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 114,59 // jb 1b75 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,123,16,92,72,32 // vmovsd 0x20(%r8,%r9,2),%xmm3
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 15,132,9,255,255,255 // je 1944 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,132,9,255,255,255 // je 1a54 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,129,97,22,92,72,40 // vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 15,130,248,254,255,255 // jb 1944 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,130,248,254,255,255 // jb 1a54 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,1,122,126,76,72,48 // vmovq 0x30(%r8,%r9,2),%xmm9
- .byte 233,236,254,255,255 // jmpq 1944 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,236,254,255,255 // jmpq 1a54 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,223,254,255,255 // jmpq 1944 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,223,254,255,255 // jmpq 1a54 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,214,254,255,255 // jmpq 1944 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,214,254,255,255 // jmpq 1a54 <_sk_load_tables_u16_be_hsw+0x31>
HIDDEN _sk_load_tables_rgb_u16_be_hsw
.globl _sk_load_tables_rgb_u16_be_hsw
@@ -10110,7 +10211,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,127 // lea (%rdi,%rdi,2),%r9
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,193,0,0,0 // jne 1b41 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ .byte 15,133,193,0,0,0 // jne 1c51 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
.byte 196,129,122,111,4,72 // vmovdqu (%r8,%r9,2),%xmm0
.byte 196,129,122,111,84,72,12 // vmovdqu 0xc(%r8,%r9,2),%xmm2
.byte 196,129,122,111,76,72,24 // vmovdqu 0x18(%r8,%r9,2),%xmm1
@@ -10131,7 +10232,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,102,47,0,0 // vmovdqa 0x2f66(%rip),%xmm9 # 4a50 <_sk_callback_hsw+0x697>
+ .byte 197,121,111,13,118,47,0,0 // vmovdqa 0x2f76(%rip),%xmm9 # 4b70 <_sk_callback_hsw+0x6a7>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -10148,41 +10249,41 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
.byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,225,42,0,0 // vbroadcastss 0x2ae1(%rip),%ymm3 # 4620 <_sk_callback_hsw+0x267>
+ .byte 196,226,125,24,29,225,42,0,0 // vbroadcastss 0x2ae1(%rip),%ymm3 # 4730 <_sk_callback_hsw+0x267>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,72 // vmovd (%r8,%r9,2),%xmm0
.byte 196,129,121,196,68,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm0
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 117,5 // jne 1b5a <_sk_load_tables_rgb_u16_be_hsw+0xec>
- .byte 233,90,255,255,255 // jmpq 1ab4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,5 // jne 1c6a <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ .byte 233,90,255,255,255 // jmpq 1bc4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,72,6 // vmovd 0x6(%r8,%r9,2),%xmm1
.byte 196,1,113,196,68,72,10,2 // vpinsrw $0x2,0xa(%r8,%r9,2),%xmm1,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,26 // jb 1b89 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ .byte 114,26 // jb 1c99 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
.byte 196,129,121,110,76,72,12 // vmovd 0xc(%r8,%r9,2),%xmm1
.byte 196,129,113,196,84,72,16,2 // vpinsrw $0x2,0x10(%r8,%r9,2),%xmm1,%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 117,10 // jne 1b8e <_sk_load_tables_rgb_u16_be_hsw+0x120>
- .byte 233,43,255,255,255 // jmpq 1ab4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,38,255,255,255 // jmpq 1ab4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 1c9e <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ .byte 233,43,255,255,255 // jmpq 1bc4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,38,255,255,255 // jmpq 1bc4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,72,18 // vmovd 0x12(%r8,%r9,2),%xmm1
.byte 196,1,113,196,76,72,22,2 // vpinsrw $0x2,0x16(%r8,%r9,2),%xmm1,%xmm9
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,26 // jb 1bbd <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ .byte 114,26 // jb 1ccd <_sk_load_tables_rgb_u16_be_hsw+0x14f>
.byte 196,129,121,110,76,72,24 // vmovd 0x18(%r8,%r9,2),%xmm1
.byte 196,129,113,196,76,72,28,2 // vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm1,%xmm1
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 117,10 // jne 1bc2 <_sk_load_tables_rgb_u16_be_hsw+0x154>
- .byte 233,247,254,255,255 // jmpq 1ab4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,242,254,255,255 // jmpq 1ab4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 1cd2 <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ .byte 233,247,254,255,255 // jmpq 1bc4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,242,254,255,255 // jmpq 1bc4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,92,72,30 // vmovd 0x1e(%r8,%r9,2),%xmm3
.byte 196,1,97,196,92,72,34,2 // vpinsrw $0x2,0x22(%r8,%r9,2),%xmm3,%xmm11
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,20 // jb 1beb <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ .byte 114,20 // jb 1cfb <_sk_load_tables_rgb_u16_be_hsw+0x17d>
.byte 196,129,121,110,92,72,36 // vmovd 0x24(%r8,%r9,2),%xmm3
.byte 196,129,97,196,92,72,40,2 // vpinsrw $0x2,0x28(%r8,%r9,2),%xmm3,%xmm3
- .byte 233,201,254,255,255 // jmpq 1ab4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,196,254,255,255 // jmpq 1ab4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,201,254,255,255 // jmpq 1bc4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,196,254,255,255 // jmpq 1bc4 <_sk_load_tables_rgb_u16_be_hsw+0x46>
HIDDEN _sk_byte_tables_hsw
.globl _sk_byte_tables_hsw
@@ -10195,7 +10296,7 @@ _sk_byte_tables_hsw:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,31,42,0,0 // vbroadcastss 0x2a1f(%rip),%ymm8 # 4624 <_sk_callback_hsw+0x26b>
+ .byte 196,98,125,24,5,31,42,0,0 // vbroadcastss 0x2a1f(%rip),%ymm8 # 4734 <_sk_callback_hsw+0x26b>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,195,249,22,192,1 // vpextrq $0x1,%xmm0,%r8
@@ -10232,7 +10333,7 @@ _sk_byte_tables_hsw:
.byte 196,227,121,32,197,7 // vpinsrb $0x7,%ebp,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,112,41,0,0 // vbroadcastss 0x2970(%rip),%ymm9 # 4628 <_sk_callback_hsw+0x26f>
+ .byte 196,98,125,24,13,112,41,0,0 // vbroadcastss 0x2970(%rip),%ymm9 # 4738 <_sk_callback_hsw+0x26f>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
@@ -10393,7 +10494,7 @@ _sk_byte_tables_rgb_hsw:
.byte 196,227,121,32,197,7 // vpinsrb $0x7,%ebp,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,169,38,0,0 // vbroadcastss 0x26a9(%rip),%ymm9 # 462c <_sk_callback_hsw+0x273>
+ .byte 196,98,125,24,13,169,38,0,0 // vbroadcastss 0x26a9(%rip),%ymm9 # 473c <_sk_callback_hsw+0x273>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
@@ -10556,33 +10657,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,92,36,0,0 // vbroadcastss 0x245c(%rip),%ymm12 # 4630 <_sk_callback_hsw+0x277>
- .byte 196,98,125,24,45,87,36,0,0 // vbroadcastss 0x2457(%rip),%ymm13 # 4634 <_sk_callback_hsw+0x27b>
+ .byte 196,98,125,24,37,92,36,0,0 // vbroadcastss 0x245c(%rip),%ymm12 # 4740 <_sk_callback_hsw+0x277>
+ .byte 196,98,125,24,45,87,36,0,0 // vbroadcastss 0x2457(%rip),%ymm13 # 4744 <_sk_callback_hsw+0x27b>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,77,36,0,0 // vbroadcastss 0x244d(%rip),%ymm13 # 4638 <_sk_callback_hsw+0x27f>
+ .byte 196,98,125,24,45,77,36,0,0 // vbroadcastss 0x244d(%rip),%ymm13 # 4748 <_sk_callback_hsw+0x27f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,67,36,0,0 // vbroadcastss 0x2443(%rip),%ymm13 # 463c <_sk_callback_hsw+0x283>
+ .byte 196,98,125,24,45,67,36,0,0 // vbroadcastss 0x2443(%rip),%ymm13 # 474c <_sk_callback_hsw+0x283>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,57,36,0,0 // vbroadcastss 0x2439(%rip),%ymm11 # 4640 <_sk_callback_hsw+0x287>
+ .byte 196,98,125,24,29,57,36,0,0 // vbroadcastss 0x2439(%rip),%ymm11 # 4750 <_sk_callback_hsw+0x287>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,47,36,0,0 // vbroadcastss 0x242f(%rip),%ymm12 # 4644 <_sk_callback_hsw+0x28b>
+ .byte 196,98,125,24,37,47,36,0,0 // vbroadcastss 0x242f(%rip),%ymm12 # 4754 <_sk_callback_hsw+0x28b>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,37,36,0,0 // vbroadcastss 0x2425(%rip),%ymm12 # 4648 <_sk_callback_hsw+0x28f>
+ .byte 196,98,125,24,37,37,36,0,0 // vbroadcastss 0x2425(%rip),%ymm12 # 4758 <_sk_callback_hsw+0x28f>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,6,36,0,0 // vbroadcastss 0x2406(%rip),%ymm11 # 464c <_sk_callback_hsw+0x293>
+ .byte 196,98,125,24,29,6,36,0,0 // vbroadcastss 0x2406(%rip),%ymm11 # 475c <_sk_callback_hsw+0x293>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,252,35,0,0 // vbroadcastss 0x23fc(%rip),%ymm11 # 4650 <_sk_callback_hsw+0x297>
+ .byte 196,98,125,24,29,252,35,0,0 // vbroadcastss 0x23fc(%rip),%ymm11 # 4760 <_sk_callback_hsw+0x297>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,242,35,0,0 // vbroadcastss 0x23f2(%rip),%ymm0 # 4654 <_sk_callback_hsw+0x29b>
+ .byte 196,226,125,24,5,242,35,0,0 // vbroadcastss 0x23f2(%rip),%ymm0 # 4764 <_sk_callback_hsw+0x29b>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,232,35,0,0 // vbroadcastss 0x23e8(%rip),%ymm10 # 4658 <_sk_callback_hsw+0x29f>
+ .byte 196,98,125,24,21,232,35,0,0 // vbroadcastss 0x23e8(%rip),%ymm10 # 4768 <_sk_callback_hsw+0x29f>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,219,35,0,0 // vbroadcastss 0x23db(%rip),%ymm10 # 465c <_sk_callback_hsw+0x2a3>
+ .byte 196,98,125,24,21,219,35,0,0 // vbroadcastss 0x23db(%rip),%ymm10 # 476c <_sk_callback_hsw+0x2a3>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -10590,7 +10691,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,178,35,0,0 // vbroadcastss 0x23b2(%rip),%ymm8 # 4660 <_sk_callback_hsw+0x2a7>
+ .byte 196,98,125,24,5,178,35,0,0 // vbroadcastss 0x23b2(%rip),%ymm8 # 4770 <_sk_callback_hsw+0x2a7>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10610,33 +10711,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,106,35,0,0 // vbroadcastss 0x236a(%rip),%ymm12 # 4664 <_sk_callback_hsw+0x2ab>
- .byte 196,98,125,24,45,101,35,0,0 // vbroadcastss 0x2365(%rip),%ymm13 # 4668 <_sk_callback_hsw+0x2af>
+ .byte 196,98,125,24,37,106,35,0,0 // vbroadcastss 0x236a(%rip),%ymm12 # 4774 <_sk_callback_hsw+0x2ab>
+ .byte 196,98,125,24,45,101,35,0,0 // vbroadcastss 0x2365(%rip),%ymm13 # 4778 <_sk_callback_hsw+0x2af>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,91,35,0,0 // vbroadcastss 0x235b(%rip),%ymm13 # 466c <_sk_callback_hsw+0x2b3>
+ .byte 196,98,125,24,45,91,35,0,0 // vbroadcastss 0x235b(%rip),%ymm13 # 477c <_sk_callback_hsw+0x2b3>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,81,35,0,0 // vbroadcastss 0x2351(%rip),%ymm13 # 4670 <_sk_callback_hsw+0x2b7>
+ .byte 196,98,125,24,45,81,35,0,0 // vbroadcastss 0x2351(%rip),%ymm13 # 4780 <_sk_callback_hsw+0x2b7>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,71,35,0,0 // vbroadcastss 0x2347(%rip),%ymm11 # 4674 <_sk_callback_hsw+0x2bb>
+ .byte 196,98,125,24,29,71,35,0,0 // vbroadcastss 0x2347(%rip),%ymm11 # 4784 <_sk_callback_hsw+0x2bb>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,61,35,0,0 // vbroadcastss 0x233d(%rip),%ymm12 # 4678 <_sk_callback_hsw+0x2bf>
+ .byte 196,98,125,24,37,61,35,0,0 // vbroadcastss 0x233d(%rip),%ymm12 # 4788 <_sk_callback_hsw+0x2bf>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,51,35,0,0 // vbroadcastss 0x2333(%rip),%ymm12 # 467c <_sk_callback_hsw+0x2c3>
+ .byte 196,98,125,24,37,51,35,0,0 // vbroadcastss 0x2333(%rip),%ymm12 # 478c <_sk_callback_hsw+0x2c3>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,20,35,0,0 // vbroadcastss 0x2314(%rip),%ymm11 # 4680 <_sk_callback_hsw+0x2c7>
+ .byte 196,98,125,24,29,20,35,0,0 // vbroadcastss 0x2314(%rip),%ymm11 # 4790 <_sk_callback_hsw+0x2c7>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,10,35,0,0 // vbroadcastss 0x230a(%rip),%ymm11 # 4684 <_sk_callback_hsw+0x2cb>
+ .byte 196,98,125,24,29,10,35,0,0 // vbroadcastss 0x230a(%rip),%ymm11 # 4794 <_sk_callback_hsw+0x2cb>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,0,35,0,0 // vbroadcastss 0x2300(%rip),%ymm1 # 4688 <_sk_callback_hsw+0x2cf>
+ .byte 196,226,125,24,13,0,35,0,0 // vbroadcastss 0x2300(%rip),%ymm1 # 4798 <_sk_callback_hsw+0x2cf>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,246,34,0,0 // vbroadcastss 0x22f6(%rip),%ymm10 # 468c <_sk_callback_hsw+0x2d3>
+ .byte 196,98,125,24,21,246,34,0,0 // vbroadcastss 0x22f6(%rip),%ymm10 # 479c <_sk_callback_hsw+0x2d3>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,233,34,0,0 // vbroadcastss 0x22e9(%rip),%ymm10 # 4690 <_sk_callback_hsw+0x2d7>
+ .byte 196,98,125,24,21,233,34,0,0 // vbroadcastss 0x22e9(%rip),%ymm10 # 47a0 <_sk_callback_hsw+0x2d7>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -10644,7 +10745,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,192,34,0,0 // vbroadcastss 0x22c0(%rip),%ymm8 # 4694 <_sk_callback_hsw+0x2db>
+ .byte 196,98,125,24,5,192,34,0,0 // vbroadcastss 0x22c0(%rip),%ymm8 # 47a4 <_sk_callback_hsw+0x2db>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10664,33 +10765,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,120,34,0,0 // vbroadcastss 0x2278(%rip),%ymm12 # 4698 <_sk_callback_hsw+0x2df>
- .byte 196,98,125,24,45,115,34,0,0 // vbroadcastss 0x2273(%rip),%ymm13 # 469c <_sk_callback_hsw+0x2e3>
+ .byte 196,98,125,24,37,120,34,0,0 // vbroadcastss 0x2278(%rip),%ymm12 # 47a8 <_sk_callback_hsw+0x2df>
+ .byte 196,98,125,24,45,115,34,0,0 // vbroadcastss 0x2273(%rip),%ymm13 # 47ac <_sk_callback_hsw+0x2e3>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,105,34,0,0 // vbroadcastss 0x2269(%rip),%ymm13 # 46a0 <_sk_callback_hsw+0x2e7>
+ .byte 196,98,125,24,45,105,34,0,0 // vbroadcastss 0x2269(%rip),%ymm13 # 47b0 <_sk_callback_hsw+0x2e7>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,95,34,0,0 // vbroadcastss 0x225f(%rip),%ymm13 # 46a4 <_sk_callback_hsw+0x2eb>
+ .byte 196,98,125,24,45,95,34,0,0 // vbroadcastss 0x225f(%rip),%ymm13 # 47b4 <_sk_callback_hsw+0x2eb>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,85,34,0,0 // vbroadcastss 0x2255(%rip),%ymm11 # 46a8 <_sk_callback_hsw+0x2ef>
+ .byte 196,98,125,24,29,85,34,0,0 // vbroadcastss 0x2255(%rip),%ymm11 # 47b8 <_sk_callback_hsw+0x2ef>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,75,34,0,0 // vbroadcastss 0x224b(%rip),%ymm12 # 46ac <_sk_callback_hsw+0x2f3>
+ .byte 196,98,125,24,37,75,34,0,0 // vbroadcastss 0x224b(%rip),%ymm12 # 47bc <_sk_callback_hsw+0x2f3>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,65,34,0,0 // vbroadcastss 0x2241(%rip),%ymm12 # 46b0 <_sk_callback_hsw+0x2f7>
+ .byte 196,98,125,24,37,65,34,0,0 // vbroadcastss 0x2241(%rip),%ymm12 # 47c0 <_sk_callback_hsw+0x2f7>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,34,34,0,0 // vbroadcastss 0x2222(%rip),%ymm11 # 46b4 <_sk_callback_hsw+0x2fb>
+ .byte 196,98,125,24,29,34,34,0,0 // vbroadcastss 0x2222(%rip),%ymm11 # 47c4 <_sk_callback_hsw+0x2fb>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,24,34,0,0 // vbroadcastss 0x2218(%rip),%ymm11 # 46b8 <_sk_callback_hsw+0x2ff>
+ .byte 196,98,125,24,29,24,34,0,0 // vbroadcastss 0x2218(%rip),%ymm11 # 47c8 <_sk_callback_hsw+0x2ff>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,14,34,0,0 // vbroadcastss 0x220e(%rip),%ymm2 # 46bc <_sk_callback_hsw+0x303>
+ .byte 196,226,125,24,21,14,34,0,0 // vbroadcastss 0x220e(%rip),%ymm2 # 47cc <_sk_callback_hsw+0x303>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,4,34,0,0 // vbroadcastss 0x2204(%rip),%ymm10 # 46c0 <_sk_callback_hsw+0x307>
+ .byte 196,98,125,24,21,4,34,0,0 // vbroadcastss 0x2204(%rip),%ymm10 # 47d0 <_sk_callback_hsw+0x307>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,247,33,0,0 // vbroadcastss 0x21f7(%rip),%ymm10 # 46c4 <_sk_callback_hsw+0x30b>
+ .byte 196,98,125,24,21,247,33,0,0 // vbroadcastss 0x21f7(%rip),%ymm10 # 47d4 <_sk_callback_hsw+0x30b>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -10698,7 +10799,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,206,33,0,0 // vbroadcastss 0x21ce(%rip),%ymm8 # 46c8 <_sk_callback_hsw+0x30f>
+ .byte 196,98,125,24,5,206,33,0,0 // vbroadcastss 0x21ce(%rip),%ymm8 # 47d8 <_sk_callback_hsw+0x30f>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10718,33 +10819,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,134,33,0,0 // vbroadcastss 0x2186(%rip),%ymm12 # 46cc <_sk_callback_hsw+0x313>
- .byte 196,98,125,24,45,129,33,0,0 // vbroadcastss 0x2181(%rip),%ymm13 # 46d0 <_sk_callback_hsw+0x317>
+ .byte 196,98,125,24,37,134,33,0,0 // vbroadcastss 0x2186(%rip),%ymm12 # 47dc <_sk_callback_hsw+0x313>
+ .byte 196,98,125,24,45,129,33,0,0 // vbroadcastss 0x2181(%rip),%ymm13 # 47e0 <_sk_callback_hsw+0x317>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,119,33,0,0 // vbroadcastss 0x2177(%rip),%ymm13 # 46d4 <_sk_callback_hsw+0x31b>
+ .byte 196,98,125,24,45,119,33,0,0 // vbroadcastss 0x2177(%rip),%ymm13 # 47e4 <_sk_callback_hsw+0x31b>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,109,33,0,0 // vbroadcastss 0x216d(%rip),%ymm13 # 46d8 <_sk_callback_hsw+0x31f>
+ .byte 196,98,125,24,45,109,33,0,0 // vbroadcastss 0x216d(%rip),%ymm13 # 47e8 <_sk_callback_hsw+0x31f>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,99,33,0,0 // vbroadcastss 0x2163(%rip),%ymm11 # 46dc <_sk_callback_hsw+0x323>
+ .byte 196,98,125,24,29,99,33,0,0 // vbroadcastss 0x2163(%rip),%ymm11 # 47ec <_sk_callback_hsw+0x323>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,89,33,0,0 // vbroadcastss 0x2159(%rip),%ymm12 # 46e0 <_sk_callback_hsw+0x327>
+ .byte 196,98,125,24,37,89,33,0,0 // vbroadcastss 0x2159(%rip),%ymm12 # 47f0 <_sk_callback_hsw+0x327>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,79,33,0,0 // vbroadcastss 0x214f(%rip),%ymm12 # 46e4 <_sk_callback_hsw+0x32b>
+ .byte 196,98,125,24,37,79,33,0,0 // vbroadcastss 0x214f(%rip),%ymm12 # 47f4 <_sk_callback_hsw+0x32b>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,48,33,0,0 // vbroadcastss 0x2130(%rip),%ymm11 # 46e8 <_sk_callback_hsw+0x32f>
+ .byte 196,98,125,24,29,48,33,0,0 // vbroadcastss 0x2130(%rip),%ymm11 # 47f8 <_sk_callback_hsw+0x32f>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,38,33,0,0 // vbroadcastss 0x2126(%rip),%ymm11 # 46ec <_sk_callback_hsw+0x333>
+ .byte 196,98,125,24,29,38,33,0,0 // vbroadcastss 0x2126(%rip),%ymm11 # 47fc <_sk_callback_hsw+0x333>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,28,33,0,0 // vbroadcastss 0x211c(%rip),%ymm3 # 46f0 <_sk_callback_hsw+0x337>
+ .byte 196,226,125,24,29,28,33,0,0 // vbroadcastss 0x211c(%rip),%ymm3 # 4800 <_sk_callback_hsw+0x337>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,18,33,0,0 // vbroadcastss 0x2112(%rip),%ymm10 # 46f4 <_sk_callback_hsw+0x33b>
+ .byte 196,98,125,24,21,18,33,0,0 // vbroadcastss 0x2112(%rip),%ymm10 # 4804 <_sk_callback_hsw+0x33b>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,5,33,0,0 // vbroadcastss 0x2105(%rip),%ymm10 # 46f8 <_sk_callback_hsw+0x33f>
+ .byte 196,98,125,24,21,5,33,0,0 // vbroadcastss 0x2105(%rip),%ymm10 # 4808 <_sk_callback_hsw+0x33f>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -10752,7 +10853,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,220,32,0,0 // vbroadcastss 0x20dc(%rip),%ymm8 # 46fc <_sk_callback_hsw+0x343>
+ .byte 196,98,125,24,5,220,32,0,0 // vbroadcastss 0x20dc(%rip),%ymm8 # 480c <_sk_callback_hsw+0x343>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10761,26 +10862,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,206,32,0,0 // vbroadcastss 0x20ce(%rip),%ymm8 # 4700 <_sk_callback_hsw+0x347>
- .byte 196,98,125,24,13,201,32,0,0 // vbroadcastss 0x20c9(%rip),%ymm9 # 4704 <_sk_callback_hsw+0x34b>
- .byte 196,98,125,24,21,196,32,0,0 // vbroadcastss 0x20c4(%rip),%ymm10 # 4708 <_sk_callback_hsw+0x34f>
+ .byte 196,98,125,24,5,206,32,0,0 // vbroadcastss 0x20ce(%rip),%ymm8 # 4810 <_sk_callback_hsw+0x347>
+ .byte 196,98,125,24,13,201,32,0,0 // vbroadcastss 0x20c9(%rip),%ymm9 # 4814 <_sk_callback_hsw+0x34b>
+ .byte 196,98,125,24,21,196,32,0,0 // vbroadcastss 0x20c4(%rip),%ymm10 # 4818 <_sk_callback_hsw+0x34f>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,181,32,0,0 // vbroadcastss 0x20b5(%rip),%ymm9 # 470c <_sk_callback_hsw+0x353>
+ .byte 196,98,125,24,13,181,32,0,0 // vbroadcastss 0x20b5(%rip),%ymm9 # 481c <_sk_callback_hsw+0x353>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,171,32,0,0 // vbroadcastss 0x20ab(%rip),%ymm0 # 4710 <_sk_callback_hsw+0x357>
+ .byte 196,226,125,24,5,171,32,0,0 // vbroadcastss 0x20ab(%rip),%ymm0 # 4820 <_sk_callback_hsw+0x357>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,162,32,0,0 // vbroadcastss 0x20a2(%rip),%ymm8 # 4714 <_sk_callback_hsw+0x35b>
+ .byte 196,98,125,24,5,162,32,0,0 // vbroadcastss 0x20a2(%rip),%ymm8 # 4824 <_sk_callback_hsw+0x35b>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,152,32,0,0 // vbroadcastss 0x2098(%rip),%ymm9 # 4718 <_sk_callback_hsw+0x35f>
+ .byte 196,98,125,24,13,152,32,0,0 // vbroadcastss 0x2098(%rip),%ymm9 # 4828 <_sk_callback_hsw+0x35f>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,133,32,0,0 // vbroadcastss 0x2085(%rip),%ymm2 # 471c <_sk_callback_hsw+0x363>
+ .byte 196,226,125,24,21,133,32,0,0 // vbroadcastss 0x2085(%rip),%ymm2 # 482c <_sk_callback_hsw+0x363>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,123,32,0,0 // vbroadcastss 0x207b(%rip),%ymm11 # 4720 <_sk_callback_hsw+0x367>
+ .byte 196,98,125,24,29,123,32,0,0 // vbroadcastss 0x207b(%rip),%ymm11 # 4830 <_sk_callback_hsw+0x367>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,113,32,0,0 // vbroadcastss 0x2071(%rip),%ymm12 # 4724 <_sk_callback_hsw+0x36b>
+ .byte 196,98,125,24,37,113,32,0,0 // vbroadcastss 0x2071(%rip),%ymm12 # 4834 <_sk_callback_hsw+0x36b>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -10795,9 +10896,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,38,32,0,0 // vbroadcastss 0x2026(%rip),%ymm0 # 4728 <_sk_callback_hsw+0x36f>
+ .byte 196,226,125,24,5,38,32,0,0 // vbroadcastss 0x2026(%rip),%ymm0 # 4838 <_sk_callback_hsw+0x36f>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,29,32,0,0 // vbroadcastss 0x201d(%rip),%ymm8 # 472c <_sk_callback_hsw+0x373>
+ .byte 196,98,125,24,5,29,32,0,0 // vbroadcastss 0x201d(%rip),%ymm8 # 483c <_sk_callback_hsw+0x373>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10811,11 +10912,11 @@ _sk_load_a8_hsw:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,45 // jne 2755 <_sk_load_a8_hsw+0x3d>
+ .byte 117,45 // jne 2865 <_sk_load_a8_hsw+0x3d>
.byte 197,250,126,0 // vmovq (%rax),%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,242,31,0,0 // vbroadcastss 0x1ff2(%rip),%ymm1 # 4730 <_sk_callback_hsw+0x377>
+ .byte 196,226,125,24,13,242,31,0,0 // vbroadcastss 0x1ff2(%rip),%ymm1 # 4840 <_sk_callback_hsw+0x377>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -10832,9 +10933,9 @@ _sk_load_a8_hsw:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 275d <_sk_load_a8_hsw+0x45>
+ .byte 117,234 // jne 286d <_sk_load_a8_hsw+0x45>
.byte 196,193,249,110,193 // vmovq %r9,%xmm0
- .byte 235,178 // jmp 272c <_sk_load_a8_hsw+0x14>
+ .byte 235,178 // jmp 283c <_sk_load_a8_hsw+0x14>
HIDDEN _sk_gather_a8_hsw
.globl _sk_gather_a8_hsw
@@ -10880,7 +10981,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,253,30,0,0 // vbroadcastss 0x1efd(%rip),%ymm1 # 4734 <_sk_callback_hsw+0x37b>
+ .byte 196,226,125,24,13,253,30,0,0 // vbroadcastss 0x1efd(%rip),%ymm1 # 4844 <_sk_callback_hsw+0x37b>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -10898,14 +10999,14 @@ FUNCTION(_sk_store_a8_hsw)
_sk_store_a8_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 196,98,125,24,5,216,30,0,0 // vbroadcastss 0x1ed8(%rip),%ymm8 # 4738 <_sk_callback_hsw+0x37f>
+ .byte 196,98,125,24,5,216,30,0,0 // vbroadcastss 0x1ed8(%rip),%ymm8 # 4848 <_sk_callback_hsw+0x37f>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,10 // jne 2889 <_sk_store_a8_hsw+0x37>
+ .byte 117,10 // jne 2999 <_sk_store_a8_hsw+0x37>
.byte 196,65,123,17,4,58 // vmovsd %xmm8,(%r10,%rdi,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10913,10 +11014,10 @@ _sk_store_a8_hsw:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,236 // ja 2885 <_sk_store_a8_hsw+0x33>
+ .byte 119,236 // ja 2995 <_sk_store_a8_hsw+0x33>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 28ec <_sk_store_a8_hsw+0x9a>
+ .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 29fc <_sk_store_a8_hsw+0x9a>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -10927,7 +11028,7 @@ _sk_store_a8_hsw:
.byte 196,67,121,20,68,58,2,4 // vpextrb $0x4,%xmm8,0x2(%r10,%rdi,1)
.byte 196,67,121,20,68,58,1,2 // vpextrb $0x2,%xmm8,0x1(%r10,%rdi,1)
.byte 196,67,121,20,4,58,0 // vpextrb $0x0,%xmm8,(%r10,%rdi,1)
- .byte 235,154 // jmp 2885 <_sk_store_a8_hsw+0x33>
+ .byte 235,154 // jmp 2995 <_sk_store_a8_hsw+0x33>
.byte 144 // nop
.byte 246,255 // idiv %bh
.byte 255 // (bad)
@@ -10961,14 +11062,14 @@ _sk_load_g8_hsw:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,50 // jne 294a <_sk_load_g8_hsw+0x42>
+ .byte 117,50 // jne 2a5a <_sk_load_g8_hsw+0x42>
.byte 197,250,126,0 // vmovq (%rax),%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,14,30,0,0 // vbroadcastss 0x1e0e(%rip),%ymm1 # 473c <_sk_callback_hsw+0x383>
+ .byte 196,226,125,24,13,14,30,0,0 // vbroadcastss 0x1e0e(%rip),%ymm1 # 484c <_sk_callback_hsw+0x383>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,3,30,0,0 // vbroadcastss 0x1e03(%rip),%ymm3 # 4740 <_sk_callback_hsw+0x387>
+ .byte 196,226,125,24,29,3,30,0,0 // vbroadcastss 0x1e03(%rip),%ymm3 # 4850 <_sk_callback_hsw+0x387>
.byte 76,137,193 // mov %r8,%rcx
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
@@ -10982,9 +11083,9 @@ _sk_load_g8_hsw:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 2952 <_sk_load_g8_hsw+0x4a>
+ .byte 117,234 // jne 2a62 <_sk_load_g8_hsw+0x4a>
.byte 196,193,249,110,193 // vmovq %r9,%xmm0
- .byte 235,173 // jmp 291c <_sk_load_g8_hsw+0x14>
+ .byte 235,173 // jmp 2a2c <_sk_load_g8_hsw+0x14>
HIDDEN _sk_gather_g8_hsw
.globl _sk_gather_g8_hsw
@@ -11030,10 +11131,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,24,29,0,0 // vbroadcastss 0x1d18(%rip),%ymm1 # 4744 <_sk_callback_hsw+0x38b>
+ .byte 196,226,125,24,13,24,29,0,0 // vbroadcastss 0x1d18(%rip),%ymm1 # 4854 <_sk_callback_hsw+0x38b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,13,29,0,0 // vbroadcastss 0x1d0d(%rip),%ymm3 # 4748 <_sk_callback_hsw+0x38f>
+ .byte 196,226,125,24,29,13,29,0,0 // vbroadcastss 0x1d0d(%rip),%ymm3 # 4858 <_sk_callback_hsw+0x38f>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -11049,9 +11150,9 @@ _sk_gather_i8_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,192 // mov %rax,%r8
.byte 77,133,192 // test %r8,%r8
- .byte 116,5 // je 2a5b <_sk_gather_i8_hsw+0xf>
+ .byte 116,5 // je 2b6b <_sk_gather_i8_hsw+0xf>
.byte 76,137,192 // mov %r8,%rax
- .byte 235,2 // jmp 2a5d <_sk_gather_i8_hsw+0x11>
+ .byte 235,2 // jmp 2b6d <_sk_gather_i8_hsw+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,87 // push %r15
.byte 65,86 // push %r14
@@ -11089,14 +11190,14 @@ _sk_gather_i8_hsw:
.byte 73,139,64,8 // mov 0x8(%r8),%rax
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,226,117,144,28,128 // vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3
- .byte 197,229,219,5,21,30,0,0 // vpand 0x1e15(%rip),%ymm3,%ymm0 # 4920 <_sk_callback_hsw+0x567>
+ .byte 197,229,219,5,37,30,0,0 // vpand 0x1e25(%rip),%ymm3,%ymm0 # 4a40 <_sk_callback_hsw+0x577>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,52,28,0,0 // vbroadcastss 0x1c34(%rip),%ymm8 # 474c <_sk_callback_hsw+0x393>
+ .byte 196,98,125,24,5,52,28,0,0 // vbroadcastss 0x1c34(%rip),%ymm8 # 485c <_sk_callback_hsw+0x393>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,26,30,0,0 // vpshufb 0x1e1a(%rip),%ymm3,%ymm1 # 4940 <_sk_callback_hsw+0x587>
+ .byte 196,226,101,0,13,42,30,0,0 // vpshufb 0x1e2a(%rip),%ymm3,%ymm1 # 4a60 <_sk_callback_hsw+0x597>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,40,30,0,0 // vpshufb 0x1e28(%rip),%ymm3,%ymm2 # 4960 <_sk_callback_hsw+0x5a7>
+ .byte 196,226,101,0,21,56,30,0,0 // vpshufb 0x1e38(%rip),%ymm3,%ymm2 # 4a80 <_sk_callback_hsw+0x5b7>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -11117,35 +11218,35 @@ _sk_load_565_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,114 // jne 2bd8 <_sk_load_565_hsw+0x7c>
+ .byte 117,114 // jne 2ce8 <_sk_load_565_hsw+0x7c>
.byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,214,27,0,0 // vpbroadcastd 0x1bd6(%rip),%ymm0 # 4750 <_sk_callback_hsw+0x397>
+ .byte 196,226,125,88,5,214,27,0,0 // vpbroadcastd 0x1bd6(%rip),%ymm0 # 4860 <_sk_callback_hsw+0x397>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,201,27,0,0 // vbroadcastss 0x1bc9(%rip),%ymm1 # 4754 <_sk_callback_hsw+0x39b>
+ .byte 196,226,125,24,13,201,27,0,0 // vbroadcastss 0x1bc9(%rip),%ymm1 # 4864 <_sk_callback_hsw+0x39b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,192,27,0,0 // vpbroadcastd 0x1bc0(%rip),%ymm1 # 4758 <_sk_callback_hsw+0x39f>
+ .byte 196,226,125,88,13,192,27,0,0 // vpbroadcastd 0x1bc0(%rip),%ymm1 # 4868 <_sk_callback_hsw+0x39f>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,179,27,0,0 // vbroadcastss 0x1bb3(%rip),%ymm3 # 475c <_sk_callback_hsw+0x3a3>
+ .byte 196,226,125,24,29,179,27,0,0 // vbroadcastss 0x1bb3(%rip),%ymm3 # 486c <_sk_callback_hsw+0x3a3>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,170,27,0,0 // vpbroadcastd 0x1baa(%rip),%ymm3 # 4760 <_sk_callback_hsw+0x3a7>
+ .byte 196,226,125,88,29,170,27,0,0 // vpbroadcastd 0x1baa(%rip),%ymm3 # 4870 <_sk_callback_hsw+0x3a7>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,157,27,0,0 // vbroadcastss 0x1b9d(%rip),%ymm3 # 4764 <_sk_callback_hsw+0x3ab>
+ .byte 196,226,125,24,29,157,27,0,0 // vbroadcastss 0x1b9d(%rip),%ymm3 # 4874 <_sk_callback_hsw+0x3ab>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,146,27,0,0 // vbroadcastss 0x1b92(%rip),%ymm3 # 4768 <_sk_callback_hsw+0x3af>
+ .byte 196,226,125,24,29,146,27,0,0 // vbroadcastss 0x1b92(%rip),%ymm3 # 4878 <_sk_callback_hsw+0x3af>
.byte 255,224 // jmpq *%rax
.byte 65,137,200 // mov %ecx,%r8d
.byte 65,128,224,7 // and $0x7,%r8b
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,128 // ja 2b6c <_sk_load_565_hsw+0x10>
+ .byte 119,128 // ja 2c7c <_sk_load_565_hsw+0x10>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 2c40 <_sk_load_565_hsw+0xe4>
+ .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 2d50 <_sk_load_565_hsw+0xe4>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -11157,7 +11258,7 @@ _sk_load_565_hsw:
.byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- .byte 233,44,255,255,255 // jmpq 2b6c <_sk_load_565_hsw+0x10>
+ .byte 233,44,255,255,255 // jmpq 2c7c <_sk_load_565_hsw+0x10>
.byte 244 // hlt
.byte 255 // (bad)
.byte 255 // (bad)
@@ -11227,23 +11328,23 @@ _sk_gather_565_hsw:
.byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,85,26,0,0 // vpbroadcastd 0x1a55(%rip),%ymm0 # 476c <_sk_callback_hsw+0x3b3>
+ .byte 196,226,125,88,5,85,26,0,0 // vpbroadcastd 0x1a55(%rip),%ymm0 # 487c <_sk_callback_hsw+0x3b3>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,72,26,0,0 // vbroadcastss 0x1a48(%rip),%ymm1 # 4770 <_sk_callback_hsw+0x3b7>
+ .byte 196,226,125,24,13,72,26,0,0 // vbroadcastss 0x1a48(%rip),%ymm1 # 4880 <_sk_callback_hsw+0x3b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,63,26,0,0 // vpbroadcastd 0x1a3f(%rip),%ymm1 # 4774 <_sk_callback_hsw+0x3bb>
+ .byte 196,226,125,88,13,63,26,0,0 // vpbroadcastd 0x1a3f(%rip),%ymm1 # 4884 <_sk_callback_hsw+0x3bb>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,50,26,0,0 // vbroadcastss 0x1a32(%rip),%ymm3 # 4778 <_sk_callback_hsw+0x3bf>
+ .byte 196,226,125,24,29,50,26,0,0 // vbroadcastss 0x1a32(%rip),%ymm3 # 4888 <_sk_callback_hsw+0x3bf>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,41,26,0,0 // vpbroadcastd 0x1a29(%rip),%ymm3 # 477c <_sk_callback_hsw+0x3c3>
+ .byte 196,226,125,88,29,41,26,0,0 // vpbroadcastd 0x1a29(%rip),%ymm3 # 488c <_sk_callback_hsw+0x3c3>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,28,26,0,0 // vbroadcastss 0x1a1c(%rip),%ymm3 # 4780 <_sk_callback_hsw+0x3c7>
+ .byte 196,226,125,24,29,28,26,0,0 // vbroadcastss 0x1a1c(%rip),%ymm3 # 4890 <_sk_callback_hsw+0x3c7>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,17,26,0,0 // vbroadcastss 0x1a11(%rip),%ymm3 # 4784 <_sk_callback_hsw+0x3cb>
+ .byte 196,226,125,24,29,17,26,0,0 // vbroadcastss 0x1a11(%rip),%ymm3 # 4894 <_sk_callback_hsw+0x3cb>
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
.byte 65,94 // pop %r14
@@ -11256,11 +11357,11 @@ FUNCTION(_sk_store_565_hsw)
_sk_store_565_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 196,98,125,24,5,254,25,0,0 // vbroadcastss 0x19fe(%rip),%ymm8 # 4788 <_sk_callback_hsw+0x3cf>
+ .byte 196,98,125,24,5,254,25,0,0 // vbroadcastss 0x19fe(%rip),%ymm8 # 4898 <_sk_callback_hsw+0x3cf>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,233,25,0,0 // vbroadcastss 0x19e9(%rip),%ymm10 # 478c <_sk_callback_hsw+0x3d3>
+ .byte 196,98,125,24,21,233,25,0,0 // vbroadcastss 0x19e9(%rip),%ymm10 # 489c <_sk_callback_hsw+0x3d3>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -11271,7 +11372,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,10 // jne 2de1 <_sk_store_565_hsw+0x65>
+ .byte 117,10 // jne 2ef1 <_sk_store_565_hsw+0x65>
.byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11279,9 +11380,9 @@ _sk_store_565_hsw:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,236 // ja 2ddd <_sk_store_565_hsw+0x61>
+ .byte 119,236 // ja 2eed <_sk_store_565_hsw+0x61>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 2e40 <_sk_store_565_hsw+0xc4>
+ .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 2f50 <_sk_store_565_hsw+0xc4>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -11292,7 +11393,7 @@ _sk_store_565_hsw:
.byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
.byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
.byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- .byte 235,159 // jmp 2ddd <_sk_store_565_hsw+0x61>
+ .byte 235,159 // jmp 2eed <_sk_store_565_hsw+0x61>
.byte 102,144 // xchg %ax,%ax
.byte 245 // cmc
.byte 255 // (bad)
@@ -11325,28 +11426,28 @@ _sk_load_4444_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,138,0,0,0 // jne 2ef4 <_sk_load_4444_hsw+0x98>
+ .byte 15,133,138,0,0,0 // jne 3004 <_sk_load_4444_hsw+0x98>
.byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,18,25,0,0 // vpbroadcastd 0x1912(%rip),%ymm0 # 4790 <_sk_callback_hsw+0x3d7>
+ .byte 196,226,125,88,5,18,25,0,0 // vpbroadcastd 0x1912(%rip),%ymm0 # 48a0 <_sk_callback_hsw+0x3d7>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,5,25,0,0 // vbroadcastss 0x1905(%rip),%ymm1 # 4794 <_sk_callback_hsw+0x3db>
+ .byte 196,226,125,24,13,5,25,0,0 // vbroadcastss 0x1905(%rip),%ymm1 # 48a4 <_sk_callback_hsw+0x3db>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,252,24,0,0 // vpbroadcastd 0x18fc(%rip),%ymm1 # 4798 <_sk_callback_hsw+0x3df>
+ .byte 196,226,125,88,13,252,24,0,0 // vpbroadcastd 0x18fc(%rip),%ymm1 # 48a8 <_sk_callback_hsw+0x3df>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,239,24,0,0 // vbroadcastss 0x18ef(%rip),%ymm2 # 479c <_sk_callback_hsw+0x3e3>
+ .byte 196,226,125,24,21,239,24,0,0 // vbroadcastss 0x18ef(%rip),%ymm2 # 48ac <_sk_callback_hsw+0x3e3>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,230,24,0,0 // vpbroadcastd 0x18e6(%rip),%ymm2 # 47a0 <_sk_callback_hsw+0x3e7>
+ .byte 196,226,125,88,21,230,24,0,0 // vpbroadcastd 0x18e6(%rip),%ymm2 # 48b0 <_sk_callback_hsw+0x3e7>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,217,24,0,0 // vbroadcastss 0x18d9(%rip),%ymm8 # 47a4 <_sk_callback_hsw+0x3eb>
+ .byte 196,98,125,24,5,217,24,0,0 // vbroadcastss 0x18d9(%rip),%ymm8 # 48b4 <_sk_callback_hsw+0x3eb>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,207,24,0,0 // vpbroadcastd 0x18cf(%rip),%ymm8 # 47a8 <_sk_callback_hsw+0x3ef>
+ .byte 196,98,125,88,5,207,24,0,0 // vpbroadcastd 0x18cf(%rip),%ymm8 # 48b8 <_sk_callback_hsw+0x3ef>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,193,24,0,0 // vbroadcastss 0x18c1(%rip),%ymm8 # 47ac <_sk_callback_hsw+0x3f3>
+ .byte 196,98,125,24,5,193,24,0,0 // vbroadcastss 0x18c1(%rip),%ymm8 # 48bc <_sk_callback_hsw+0x3f3>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11355,9 +11456,9 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 15,135,100,255,255,255 // ja 2e70 <_sk_load_4444_hsw+0x14>
+ .byte 15,135,100,255,255,255 // ja 2f80 <_sk_load_4444_hsw+0x14>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 2f60 <_sk_load_4444_hsw+0x104>
+ .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 3070 <_sk_load_4444_hsw+0x104>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -11369,7 +11470,7 @@ _sk_load_4444_hsw:
.byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- .byte 233,16,255,255,255 // jmpq 2e70 <_sk_load_4444_hsw+0x14>
+ .byte 233,16,255,255,255 // jmpq 2f80 <_sk_load_4444_hsw+0x14>
.byte 244 // hlt
.byte 255 // (bad)
.byte 255 // (bad)
@@ -11439,25 +11540,25 @@ _sk_gather_4444_hsw:
.byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,121,23,0,0 // vpbroadcastd 0x1779(%rip),%ymm0 # 47b0 <_sk_callback_hsw+0x3f7>
+ .byte 196,226,125,88,5,121,23,0,0 // vpbroadcastd 0x1779(%rip),%ymm0 # 48c0 <_sk_callback_hsw+0x3f7>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,108,23,0,0 // vbroadcastss 0x176c(%rip),%ymm1 # 47b4 <_sk_callback_hsw+0x3fb>
+ .byte 196,226,125,24,13,108,23,0,0 // vbroadcastss 0x176c(%rip),%ymm1 # 48c4 <_sk_callback_hsw+0x3fb>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,99,23,0,0 // vpbroadcastd 0x1763(%rip),%ymm1 # 47b8 <_sk_callback_hsw+0x3ff>
+ .byte 196,226,125,88,13,99,23,0,0 // vpbroadcastd 0x1763(%rip),%ymm1 # 48c8 <_sk_callback_hsw+0x3ff>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,86,23,0,0 // vbroadcastss 0x1756(%rip),%ymm2 # 47bc <_sk_callback_hsw+0x403>
+ .byte 196,226,125,24,21,86,23,0,0 // vbroadcastss 0x1756(%rip),%ymm2 # 48cc <_sk_callback_hsw+0x403>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,77,23,0,0 // vpbroadcastd 0x174d(%rip),%ymm2 # 47c0 <_sk_callback_hsw+0x407>
+ .byte 196,226,125,88,21,77,23,0,0 // vpbroadcastd 0x174d(%rip),%ymm2 # 48d0 <_sk_callback_hsw+0x407>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,64,23,0,0 // vbroadcastss 0x1740(%rip),%ymm8 # 47c4 <_sk_callback_hsw+0x40b>
+ .byte 196,98,125,24,5,64,23,0,0 // vbroadcastss 0x1740(%rip),%ymm8 # 48d4 <_sk_callback_hsw+0x40b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,54,23,0,0 // vpbroadcastd 0x1736(%rip),%ymm8 # 47c8 <_sk_callback_hsw+0x40f>
+ .byte 196,98,125,88,5,54,23,0,0 // vpbroadcastd 0x1736(%rip),%ymm8 # 48d8 <_sk_callback_hsw+0x40f>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,40,23,0,0 // vbroadcastss 0x1728(%rip),%ymm8 # 47cc <_sk_callback_hsw+0x413>
+ .byte 196,98,125,24,5,40,23,0,0 // vbroadcastss 0x1728(%rip),%ymm8 # 48dc <_sk_callback_hsw+0x413>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -11472,7 +11573,7 @@ FUNCTION(_sk_store_4444_hsw)
_sk_store_4444_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 196,98,125,24,5,14,23,0,0 // vbroadcastss 0x170e(%rip),%ymm8 # 47d0 <_sk_callback_hsw+0x417>
+ .byte 196,98,125,24,5,14,23,0,0 // vbroadcastss 0x170e(%rip),%ymm8 # 48e0 <_sk_callback_hsw+0x417>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -11490,7 +11591,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,10 // jne 3125 <_sk_store_4444_hsw+0x71>
+ .byte 117,10 // jne 3235 <_sk_store_4444_hsw+0x71>
.byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11498,9 +11599,9 @@ _sk_store_4444_hsw:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,236 // ja 3121 <_sk_store_4444_hsw+0x6d>
+ .byte 119,236 // ja 3231 <_sk_store_4444_hsw+0x6d>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 3184 <_sk_store_4444_hsw+0xd0>
+ .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 3294 <_sk_store_4444_hsw+0xd0>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -11511,7 +11612,7 @@ _sk_store_4444_hsw:
.byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
.byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
.byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- .byte 235,159 // jmp 3121 <_sk_store_4444_hsw+0x6d>
+ .byte 235,159 // jmp 3231 <_sk_store_4444_hsw+0x6d>
.byte 102,144 // xchg %ax,%ax
.byte 245 // cmc
.byte 255 // (bad)
@@ -11546,16 +11647,16 @@ _sk_load_8888_hsw:
.byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 117,88 // jne 320d <_sk_load_8888_hsw+0x6d>
+ .byte 117,88 // jne 331d <_sk_load_8888_hsw+0x6d>
.byte 196,193,126,111,25 // vmovdqu (%r9),%ymm3
- .byte 197,229,219,5,190,23,0,0 // vpand 0x17be(%rip),%ymm3,%ymm0 # 4980 <_sk_callback_hsw+0x5c7>
+ .byte 197,229,219,5,206,23,0,0 // vpand 0x17ce(%rip),%ymm3,%ymm0 # 4aa0 <_sk_callback_hsw+0x5d7>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,5,22,0,0 // vbroadcastss 0x1605(%rip),%ymm8 # 47d4 <_sk_callback_hsw+0x41b>
+ .byte 196,98,125,24,5,5,22,0,0 // vbroadcastss 0x1605(%rip),%ymm8 # 48e4 <_sk_callback_hsw+0x41b>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,195,23,0,0 // vpshufb 0x17c3(%rip),%ymm3,%ymm1 # 49a0 <_sk_callback_hsw+0x5e7>
+ .byte 196,226,101,0,13,211,23,0,0 // vpshufb 0x17d3(%rip),%ymm3,%ymm1 # 4ac0 <_sk_callback_hsw+0x5f7>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,209,23,0,0 // vpshufb 0x17d1(%rip),%ymm3,%ymm2 # 49c0 <_sk_callback_hsw+0x607>
+ .byte 196,226,101,0,21,225,23,0,0 // vpshufb 0x17e1(%rip),%ymm3,%ymm2 # 4ae0 <_sk_callback_hsw+0x617>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -11572,7 +11673,7 @@ _sk_load_8888_hsw:
.byte 196,225,249,110,192 // vmovq %rax,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,194,125,140,25 // vpmaskmovd (%r9),%ymm0,%ymm3
- .byte 235,135 // jmp 31ba <_sk_load_8888_hsw+0x1a>
+ .byte 235,135 // jmp 32ca <_sk_load_8888_hsw+0x1a>
HIDDEN _sk_gather_8888_hsw
.globl _sk_gather_8888_hsw
@@ -11587,14 +11688,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,128 // vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- .byte 197,229,219,5,127,23,0,0 // vpand 0x177f(%rip),%ymm3,%ymm0 # 49e0 <_sk_callback_hsw+0x627>
+ .byte 197,229,219,5,143,23,0,0 // vpand 0x178f(%rip),%ymm3,%ymm0 # 4b00 <_sk_callback_hsw+0x637>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,106,21,0,0 // vbroadcastss 0x156a(%rip),%ymm8 # 47d8 <_sk_callback_hsw+0x41f>
+ .byte 196,98,125,24,5,106,21,0,0 // vbroadcastss 0x156a(%rip),%ymm8 # 48e8 <_sk_callback_hsw+0x41f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,132,23,0,0 // vpshufb 0x1784(%rip),%ymm3,%ymm1 # 4a00 <_sk_callback_hsw+0x647>
+ .byte 196,226,101,0,13,148,23,0,0 // vpshufb 0x1794(%rip),%ymm3,%ymm1 # 4b20 <_sk_callback_hsw+0x657>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,146,23,0,0 // vpshufb 0x1792(%rip),%ymm3,%ymm2 # 4a20 <_sk_callback_hsw+0x667>
+ .byte 196,226,101,0,21,162,23,0,0 // vpshufb 0x17a2(%rip),%ymm3,%ymm2 # 4b40 <_sk_callback_hsw+0x677>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -11611,7 +11712,7 @@ _sk_store_8888_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9
.byte 76,3,8 // add (%rax),%r9
- .byte 196,98,125,24,5,26,21,0,0 // vbroadcastss 0x151a(%rip),%ymm8 # 47dc <_sk_callback_hsw+0x423>
+ .byte 196,98,125,24,5,26,21,0,0 // vbroadcastss 0x151a(%rip),%ymm8 # 48ec <_sk_callback_hsw+0x423>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -11627,7 +11728,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,12 // jne 331c <_sk_store_8888_hsw+0x73>
+ .byte 117,12 // jne 342c <_sk_store_8888_hsw+0x73>
.byte 196,65,126,127,1 // vmovdqu %ymm8,(%r9)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,193 // mov %r8,%rcx
@@ -11640,7 +11741,7 @@ _sk_store_8888_hsw:
.byte 196,97,249,110,200 // vmovq %rax,%xmm9
.byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9
.byte 196,66,53,142,1 // vpmaskmovd %ymm8,%ymm9,(%r9)
- .byte 235,211 // jmp 3315 <_sk_store_8888_hsw+0x6c>
+ .byte 235,211 // jmp 3425 <_sk_store_8888_hsw+0x6c>
HIDDEN _sk_load_f16_hsw
.globl _sk_load_f16_hsw
@@ -11649,7 +11750,7 @@ _sk_load_f16_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,97 // jne 33ad <_sk_load_f16_hsw+0x6b>
+ .byte 117,97 // jne 34bd <_sk_load_f16_hsw+0x6b>
.byte 197,121,16,4,248 // vmovupd (%rax,%rdi,8),%xmm8
.byte 197,249,16,84,248,16 // vmovupd 0x10(%rax,%rdi,8),%xmm2
.byte 197,249,16,92,248,32 // vmovupd 0x20(%rax,%rdi,8),%xmm3
@@ -11675,29 +11776,29 @@ _sk_load_f16_hsw:
.byte 197,123,16,4,248 // vmovsd (%rax,%rdi,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,79 // je 340c <_sk_load_f16_hsw+0xca>
+ .byte 116,79 // je 351c <_sk_load_f16_hsw+0xca>
.byte 197,57,22,68,248,8 // vmovhpd 0x8(%rax,%rdi,8),%xmm8,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,67 // jb 340c <_sk_load_f16_hsw+0xca>
+ .byte 114,67 // jb 351c <_sk_load_f16_hsw+0xca>
.byte 197,251,16,84,248,16 // vmovsd 0x10(%rax,%rdi,8),%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 116,68 // je 3419 <_sk_load_f16_hsw+0xd7>
+ .byte 116,68 // je 3529 <_sk_load_f16_hsw+0xd7>
.byte 197,233,22,84,248,24 // vmovhpd 0x18(%rax,%rdi,8),%xmm2,%xmm2
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,56 // jb 3419 <_sk_load_f16_hsw+0xd7>
+ .byte 114,56 // jb 3529 <_sk_load_f16_hsw+0xd7>
.byte 197,251,16,92,248,32 // vmovsd 0x20(%rax,%rdi,8),%xmm3
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 15,132,114,255,255,255 // je 3363 <_sk_load_f16_hsw+0x21>
+ .byte 15,132,114,255,255,255 // je 3473 <_sk_load_f16_hsw+0x21>
.byte 197,225,22,92,248,40 // vmovhpd 0x28(%rax,%rdi,8),%xmm3,%xmm3
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 15,130,98,255,255,255 // jb 3363 <_sk_load_f16_hsw+0x21>
+ .byte 15,130,98,255,255,255 // jb 3473 <_sk_load_f16_hsw+0x21>
.byte 197,122,126,76,248,48 // vmovq 0x30(%rax,%rdi,8),%xmm9
- .byte 233,87,255,255,255 // jmpq 3363 <_sk_load_f16_hsw+0x21>
+ .byte 233,87,255,255,255 // jmpq 3473 <_sk_load_f16_hsw+0x21>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,74,255,255,255 // jmpq 3363 <_sk_load_f16_hsw+0x21>
+ .byte 233,74,255,255,255 // jmpq 3473 <_sk_load_f16_hsw+0x21>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,65,255,255,255 // jmpq 3363 <_sk_load_f16_hsw+0x21>
+ .byte 233,65,255,255,255 // jmpq 3473 <_sk_load_f16_hsw+0x21>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -11755,7 +11856,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,27 // jne 3511 <_sk_store_f16_hsw+0x65>
+ .byte 117,27 // jne 3621 <_sk_store_f16_hsw+0x65>
.byte 197,120,17,28,248 // vmovups %xmm11,(%rax,%rdi,8)
.byte 197,120,17,84,248,16 // vmovups %xmm10,0x10(%rax,%rdi,8)
.byte 197,120,17,76,248,32 // vmovups %xmm9,0x20(%rax,%rdi,8)
@@ -11764,22 +11865,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 197,121,214,28,248 // vmovq %xmm11,(%rax,%rdi,8)
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,241 // je 350d <_sk_store_f16_hsw+0x61>
+ .byte 116,241 // je 361d <_sk_store_f16_hsw+0x61>
.byte 197,121,23,92,248,8 // vmovhpd %xmm11,0x8(%rax,%rdi,8)
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,229 // jb 350d <_sk_store_f16_hsw+0x61>
+ .byte 114,229 // jb 361d <_sk_store_f16_hsw+0x61>
.byte 197,121,214,84,248,16 // vmovq %xmm10,0x10(%rax,%rdi,8)
- .byte 116,221 // je 350d <_sk_store_f16_hsw+0x61>
+ .byte 116,221 // je 361d <_sk_store_f16_hsw+0x61>
.byte 197,121,23,84,248,24 // vmovhpd %xmm10,0x18(%rax,%rdi,8)
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,209 // jb 350d <_sk_store_f16_hsw+0x61>
+ .byte 114,209 // jb 361d <_sk_store_f16_hsw+0x61>
.byte 197,121,214,76,248,32 // vmovq %xmm9,0x20(%rax,%rdi,8)
- .byte 116,201 // je 350d <_sk_store_f16_hsw+0x61>
+ .byte 116,201 // je 361d <_sk_store_f16_hsw+0x61>
.byte 197,121,23,76,248,40 // vmovhpd %xmm9,0x28(%rax,%rdi,8)
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,189 // jb 350d <_sk_store_f16_hsw+0x61>
+ .byte 114,189 // jb 361d <_sk_store_f16_hsw+0x61>
.byte 197,121,214,68,248,48 // vmovq %xmm8,0x30(%rax,%rdi,8)
- .byte 235,181 // jmp 350d <_sk_store_f16_hsw+0x61>
+ .byte 235,181 // jmp 361d <_sk_store_f16_hsw+0x61>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -11789,7 +11890,7 @@ _sk_load_u16_be_hsw:
.byte 76,139,0 // mov (%rax),%r8
.byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,204,0,0,0 // jne 363a <_sk_load_u16_be_hsw+0xe2>
+ .byte 15,133,204,0,0,0 // jne 374a <_sk_load_u16_be_hsw+0xe2>
.byte 196,65,121,16,4,64 // vmovupd (%r8,%rax,2),%xmm8
.byte 196,193,121,16,84,64,16 // vmovupd 0x10(%r8,%rax,2),%xmm2
.byte 196,193,121,16,92,64,32 // vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -11808,7 +11909,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,17,18,0,0 // vbroadcastss 0x1211(%rip),%ymm10 # 47e0 <_sk_callback_hsw+0x427>
+ .byte 196,98,125,24,21,17,18,0,0 // vbroadcastss 0x1211(%rip),%ymm10 # 48f0 <_sk_callback_hsw+0x427>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -11836,29 +11937,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,64 // vmovsd (%r8,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,85 // je 36a0 <_sk_load_u16_be_hsw+0x148>
+ .byte 116,85 // je 37b0 <_sk_load_u16_be_hsw+0x148>
.byte 196,65,57,22,68,64,8 // vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,72 // jb 36a0 <_sk_load_u16_be_hsw+0x148>
+ .byte 114,72 // jb 37b0 <_sk_load_u16_be_hsw+0x148>
.byte 196,193,123,16,84,64,16 // vmovsd 0x10(%r8,%rax,2),%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 116,72 // je 36ad <_sk_load_u16_be_hsw+0x155>
+ .byte 116,72 // je 37bd <_sk_load_u16_be_hsw+0x155>
.byte 196,193,105,22,84,64,24 // vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,59 // jb 36ad <_sk_load_u16_be_hsw+0x155>
+ .byte 114,59 // jb 37bd <_sk_load_u16_be_hsw+0x155>
.byte 196,193,123,16,92,64,32 // vmovsd 0x20(%r8,%rax,2),%xmm3
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 15,132,6,255,255,255 // je 3589 <_sk_load_u16_be_hsw+0x31>
+ .byte 15,132,6,255,255,255 // je 3699 <_sk_load_u16_be_hsw+0x31>
.byte 196,193,97,22,92,64,40 // vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 15,130,245,254,255,255 // jb 3589 <_sk_load_u16_be_hsw+0x31>
+ .byte 15,130,245,254,255,255 // jb 3699 <_sk_load_u16_be_hsw+0x31>
.byte 196,65,122,126,76,64,48 // vmovq 0x30(%r8,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 3589 <_sk_load_u16_be_hsw+0x31>
+ .byte 233,233,254,255,255 // jmpq 3699 <_sk_load_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 3589 <_sk_load_u16_be_hsw+0x31>
+ .byte 233,220,254,255,255 // jmpq 3699 <_sk_load_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 3589 <_sk_load_u16_be_hsw+0x31>
+ .byte 233,211,254,255,255 // jmpq 3699 <_sk_load_u16_be_hsw+0x31>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -11868,7 +11969,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 76,139,0 // mov (%rax),%r8
.byte 72,141,4,127 // lea (%rdi,%rdi,2),%rax
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,204,0,0,0 // jne 3794 <_sk_load_rgb_u16_be_hsw+0xde>
+ .byte 15,133,204,0,0,0 // jne 38a4 <_sk_load_rgb_u16_be_hsw+0xde>
.byte 196,193,122,111,4,64 // vmovdqu (%r8,%rax,2),%xmm0
.byte 196,193,122,111,84,64,12 // vmovdqu 0xc(%r8,%rax,2),%xmm2
.byte 196,193,122,111,76,64,24 // vmovdqu 0x18(%r8,%rax,2),%xmm1
@@ -11892,7 +11993,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,162,16,0,0 // vbroadcastss 0x10a2(%rip),%ymm10 # 47e4 <_sk_callback_hsw+0x42b>
+ .byte 196,98,125,24,21,162,16,0,0 // vbroadcastss 0x10a2(%rip),%ymm10 # 48f4 <_sk_callback_hsw+0x42b>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -11909,41 +12010,41 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,86,16,0,0 // vbroadcastss 0x1056(%rip),%ymm3 # 47e8 <_sk_callback_hsw+0x42f>
+ .byte 196,226,125,24,29,86,16,0,0 // vbroadcastss 0x1056(%rip),%ymm3 # 48f8 <_sk_callback_hsw+0x42f>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0
.byte 196,193,121,196,68,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 117,5 // jne 37ad <_sk_load_rgb_u16_be_hsw+0xf7>
- .byte 233,79,255,255,255 // jmpq 36fc <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 117,5 // jne 38bd <_sk_load_rgb_u16_be_hsw+0xf7>
+ .byte 233,79,255,255,255 // jmpq 380c <_sk_load_rgb_u16_be_hsw+0x46>
.byte 196,193,121,110,76,64,6 // vmovd 0x6(%r8,%rax,2),%xmm1
.byte 196,65,113,196,68,64,10,2 // vpinsrw $0x2,0xa(%r8,%rax,2),%xmm1,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,26 // jb 37dc <_sk_load_rgb_u16_be_hsw+0x126>
+ .byte 114,26 // jb 38ec <_sk_load_rgb_u16_be_hsw+0x126>
.byte 196,193,121,110,76,64,12 // vmovd 0xc(%r8,%rax,2),%xmm1
.byte 196,193,113,196,84,64,16,2 // vpinsrw $0x2,0x10(%r8,%rax,2),%xmm1,%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 117,10 // jne 37e1 <_sk_load_rgb_u16_be_hsw+0x12b>
- .byte 233,32,255,255,255 // jmpq 36fc <_sk_load_rgb_u16_be_hsw+0x46>
- .byte 233,27,255,255,255 // jmpq 36fc <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 38f1 <_sk_load_rgb_u16_be_hsw+0x12b>
+ .byte 233,32,255,255,255 // jmpq 380c <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,27,255,255,255 // jmpq 380c <_sk_load_rgb_u16_be_hsw+0x46>
.byte 196,193,121,110,76,64,18 // vmovd 0x12(%r8,%rax,2),%xmm1
.byte 196,65,113,196,76,64,22,2 // vpinsrw $0x2,0x16(%r8,%rax,2),%xmm1,%xmm9
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,26 // jb 3810 <_sk_load_rgb_u16_be_hsw+0x15a>
+ .byte 114,26 // jb 3920 <_sk_load_rgb_u16_be_hsw+0x15a>
.byte 196,193,121,110,76,64,24 // vmovd 0x18(%r8,%rax,2),%xmm1
.byte 196,193,113,196,76,64,28,2 // vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm1,%xmm1
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 117,10 // jne 3815 <_sk_load_rgb_u16_be_hsw+0x15f>
- .byte 233,236,254,255,255 // jmpq 36fc <_sk_load_rgb_u16_be_hsw+0x46>
- .byte 233,231,254,255,255 // jmpq 36fc <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 3925 <_sk_load_rgb_u16_be_hsw+0x15f>
+ .byte 233,236,254,255,255 // jmpq 380c <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,231,254,255,255 // jmpq 380c <_sk_load_rgb_u16_be_hsw+0x46>
.byte 196,193,121,110,92,64,30 // vmovd 0x1e(%r8,%rax,2),%xmm3
.byte 196,65,97,196,92,64,34,2 // vpinsrw $0x2,0x22(%r8,%rax,2),%xmm3,%xmm11
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,20 // jb 383e <_sk_load_rgb_u16_be_hsw+0x188>
+ .byte 114,20 // jb 394e <_sk_load_rgb_u16_be_hsw+0x188>
.byte 196,193,121,110,92,64,36 // vmovd 0x24(%r8,%rax,2),%xmm3
.byte 196,193,97,196,92,64,40,2 // vpinsrw $0x2,0x28(%r8,%rax,2),%xmm3,%xmm3
- .byte 233,190,254,255,255 // jmpq 36fc <_sk_load_rgb_u16_be_hsw+0x46>
- .byte 233,185,254,255,255 // jmpq 36fc <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,190,254,255,255 // jmpq 380c <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,185,254,255,255 // jmpq 380c <_sk_load_rgb_u16_be_hsw+0x46>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -11952,7 +12053,7 @@ _sk_store_u16_be_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax
- .byte 196,98,125,24,5,147,15,0,0 // vbroadcastss 0xf93(%rip),%ymm8 # 47ec <_sk_callback_hsw+0x433>
+ .byte 196,98,125,24,5,147,15,0,0 // vbroadcastss 0xf93(%rip),%ymm8 # 48fc <_sk_callback_hsw+0x433>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -11990,7 +12091,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,31 // jne 393d <_sk_store_u16_be_hsw+0xfa>
+ .byte 117,31 // jne 3a4d <_sk_store_u16_be_hsw+0xfa>
.byte 196,65,120,17,28,64 // vmovups %xmm11,(%r8,%rax,2)
.byte 196,65,120,17,84,64,16 // vmovups %xmm10,0x10(%r8,%rax,2)
.byte 196,65,120,17,76,64,32 // vmovups %xmm9,0x20(%r8,%rax,2)
@@ -11999,22 +12100,22 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,64 // vmovq %xmm11,(%r8,%rax,2)
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,240 // je 3939 <_sk_store_u16_be_hsw+0xf6>
+ .byte 116,240 // je 3a49 <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,23,92,64,8 // vmovhpd %xmm11,0x8(%r8,%rax,2)
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,227 // jb 3939 <_sk_store_u16_be_hsw+0xf6>
+ .byte 114,227 // jb 3a49 <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,214,84,64,16 // vmovq %xmm10,0x10(%r8,%rax,2)
- .byte 116,218 // je 3939 <_sk_store_u16_be_hsw+0xf6>
+ .byte 116,218 // je 3a49 <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,23,84,64,24 // vmovhpd %xmm10,0x18(%r8,%rax,2)
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,205 // jb 3939 <_sk_store_u16_be_hsw+0xf6>
+ .byte 114,205 // jb 3a49 <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,214,76,64,32 // vmovq %xmm9,0x20(%r8,%rax,2)
- .byte 116,196 // je 3939 <_sk_store_u16_be_hsw+0xf6>
+ .byte 116,196 // je 3a49 <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,23,76,64,40 // vmovhpd %xmm9,0x28(%r8,%rax,2)
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,183 // jb 3939 <_sk_store_u16_be_hsw+0xf6>
+ .byte 114,183 // jb 3a49 <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,214,68,64,48 // vmovq %xmm8,0x30(%r8,%rax,2)
- .byte 235,174 // jmp 3939 <_sk_store_u16_be_hsw+0xf6>
+ .byte 235,174 // jmp 3a49 <_sk_store_u16_be_hsw+0xf6>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
@@ -12022,10 +12123,10 @@ FUNCTION(_sk_load_f32_hsw)
_sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 119,110 // ja 3a01 <_sk_load_f32_hsw+0x76>
+ .byte 119,110 // ja 3b11 <_sk_load_f32_hsw+0x76>
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9
- .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 3a2c <_sk_load_f32_hsw+0xa1>
+ .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 3b3c <_sk_load_f32_hsw+0xa1>
.byte 73,99,4,138 // movslq (%r10,%rcx,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
@@ -12086,7 +12187,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,55 // jne 3ab9 <_sk_store_f32_hsw+0x6d>
+ .byte 117,55 // jne 3bc9 <_sk_store_f32_hsw+0x6d>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -12099,22 +12200,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,128 // vmovupd %xmm10,(%r8,%rax,4)
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,240 // je 3ab5 <_sk_store_f32_hsw+0x69>
+ .byte 116,240 // je 3bc5 <_sk_store_f32_hsw+0x69>
.byte 196,65,121,17,76,128,16 // vmovupd %xmm9,0x10(%r8,%rax,4)
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,227 // jb 3ab5 <_sk_store_f32_hsw+0x69>
+ .byte 114,227 // jb 3bc5 <_sk_store_f32_hsw+0x69>
.byte 196,65,121,17,68,128,32 // vmovupd %xmm8,0x20(%r8,%rax,4)
- .byte 116,218 // je 3ab5 <_sk_store_f32_hsw+0x69>
+ .byte 116,218 // je 3bc5 <_sk_store_f32_hsw+0x69>
.byte 196,65,121,17,92,128,48 // vmovupd %xmm11,0x30(%r8,%rax,4)
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,205 // jb 3ab5 <_sk_store_f32_hsw+0x69>
+ .byte 114,205 // jb 3bc5 <_sk_store_f32_hsw+0x69>
.byte 196,67,125,25,84,128,64,1 // vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- .byte 116,195 // je 3ab5 <_sk_store_f32_hsw+0x69>
+ .byte 116,195 // je 3bc5 <_sk_store_f32_hsw+0x69>
.byte 196,67,125,25,76,128,80,1 // vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,181 // jb 3ab5 <_sk_store_f32_hsw+0x69>
+ .byte 114,181 // jb 3bc5 <_sk_store_f32_hsw+0x69>
.byte 196,67,125,25,68,128,96,1 // vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- .byte 235,171 // jmp 3ab5 <_sk_store_f32_hsw+0x69>
+ .byte 235,171 // jmp 3bc5 <_sk_store_f32_hsw+0x69>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -12212,11 +12313,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,227,11,0,0 // vbroadcastss 0xbe3(%rip),%ymm3 # 47f0 <_sk_callback_hsw+0x437>
- .byte 196,98,125,24,5,222,11,0,0 // vbroadcastss 0xbde(%rip),%ymm8 # 47f4 <_sk_callback_hsw+0x43b>
+ .byte 196,226,125,24,29,227,11,0,0 // vbroadcastss 0xbe3(%rip),%ymm3 # 4900 <_sk_callback_hsw+0x437>
+ .byte 196,98,125,24,5,222,11,0,0 // vbroadcastss 0xbde(%rip),%ymm8 # 4904 <_sk_callback_hsw+0x43b>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,207,11,0,0 // vbroadcastss 0xbcf(%rip),%ymm3 # 47f8 <_sk_callback_hsw+0x43f>
+ .byte 196,226,125,24,29,207,11,0,0 // vbroadcastss 0xbcf(%rip),%ymm3 # 4908 <_sk_callback_hsw+0x43f>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12361,7 +12462,7 @@ _sk_gradient_hsw:
.byte 196,98,125,24,72,28 // vbroadcastss 0x1c(%rax),%ymm9
.byte 76,139,0 // mov (%rax),%r8
.byte 77,133,192 // test %r8,%r8
- .byte 15,132,143,0,0,0 // je 3f01 <_sk_gradient_hsw+0xb5>
+ .byte 15,132,143,0,0,0 // je 4011 <_sk_gradient_hsw+0xb5>
.byte 72,139,64,8 // mov 0x8(%rax),%rax
.byte 72,131,192,32 // add $0x20,%rax
.byte 196,65,28,87,228 // vxorps %ymm12,%ymm12,%ymm12
@@ -12388,8 +12489,8 @@ _sk_gradient_hsw:
.byte 196,67,13,74,201,208 // vblendvps %ymm13,%ymm9,%ymm14,%ymm9
.byte 72,131,192,36 // add $0x24,%rax
.byte 73,255,200 // dec %r8
- .byte 117,140 // jne 3e8b <_sk_gradient_hsw+0x3f>
- .byte 235,17 // jmp 3f12 <_sk_gradient_hsw+0xc6>
+ .byte 117,140 // jne 3f9b <_sk_gradient_hsw+0x3f>
+ .byte 235,17 // jmp 4022 <_sk_gradient_hsw+0xc6>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
@@ -12436,24 +12537,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,79,8,0,0 // vbroadcastss 0x84f(%rip),%ymm13 # 47fc <_sk_callback_hsw+0x443>
- .byte 196,98,125,24,53,74,8,0,0 // vbroadcastss 0x84a(%rip),%ymm14 # 4800 <_sk_callback_hsw+0x447>
+ .byte 196,98,125,24,45,79,8,0,0 // vbroadcastss 0x84f(%rip),%ymm13 # 490c <_sk_callback_hsw+0x443>
+ .byte 196,98,125,24,53,74,8,0,0 // vbroadcastss 0x84a(%rip),%ymm14 # 4910 <_sk_callback_hsw+0x447>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,64,8,0,0 // vbroadcastss 0x840(%rip),%ymm13 # 4804 <_sk_callback_hsw+0x44b>
+ .byte 196,98,125,24,45,64,8,0,0 // vbroadcastss 0x840(%rip),%ymm13 # 4914 <_sk_callback_hsw+0x44b>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,54,8,0,0 // vbroadcastss 0x836(%rip),%ymm14 # 4808 <_sk_callback_hsw+0x44f>
+ .byte 196,98,125,24,53,54,8,0,0 // vbroadcastss 0x836(%rip),%ymm14 # 4918 <_sk_callback_hsw+0x44f>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,33,8,0,0 // vbroadcastss 0x821(%rip),%ymm10 # 480c <_sk_callback_hsw+0x453>
+ .byte 196,98,125,24,21,33,8,0,0 // vbroadcastss 0x821(%rip),%ymm10 # 491c <_sk_callback_hsw+0x453>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,11,8,0,0 // vbroadcastss 0x80b(%rip),%ymm10 # 4810 <_sk_callback_hsw+0x457>
+ .byte 196,98,125,24,21,11,8,0,0 // vbroadcastss 0x80b(%rip),%ymm10 # 4920 <_sk_callback_hsw+0x457>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,245,7,0,0 // vbroadcastss 0x7f5(%rip),%ymm10 # 4814 <_sk_callback_hsw+0x45b>
+ .byte 196,98,125,24,21,245,7,0,0 // vbroadcastss 0x7f5(%rip),%ymm10 # 4924 <_sk_callback_hsw+0x45b>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -12477,7 +12578,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,190,7,0,0 // vbroadcastss 0x7be(%rip),%ymm8 # 4818 <_sk_callback_hsw+0x45f>
+ .byte 196,98,125,24,5,190,7,0,0 // vbroadcastss 0x7be(%rip),%ymm8 # 4928 <_sk_callback_hsw+0x45f>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -12511,9 +12612,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,82,7,0,0 // vbroadcastss 0x752(%rip),%ymm0 # 481c <_sk_callback_hsw+0x463>
+ .byte 196,226,125,24,5,82,7,0,0 // vbroadcastss 0x752(%rip),%ymm0 # 492c <_sk_callback_hsw+0x463>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,73,7,0,0 // vbroadcastss 0x749(%rip),%ymm8 # 4820 <_sk_callback_hsw+0x467>
+ .byte 196,98,125,24,5,73,7,0,0 // vbroadcastss 0x749(%rip),%ymm8 # 4930 <_sk_callback_hsw+0x467>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -12524,7 +12625,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,49,7,0,0 // vbroadcastss 0x731(%rip),%ymm0 # 4824 <_sk_callback_hsw+0x46b>
+ .byte 196,226,125,24,5,49,7,0,0 // vbroadcastss 0x731(%rip),%ymm0 # 4934 <_sk_callback_hsw+0x46b>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -12536,9 +12637,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,21,7,0,0 // vbroadcastss 0x715(%rip),%ymm1 # 4828 <_sk_callback_hsw+0x46f>
+ .byte 196,226,125,24,13,21,7,0,0 // vbroadcastss 0x715(%rip),%ymm1 # 4938 <_sk_callback_hsw+0x46f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,11,7,0,0 // vbroadcastss 0x70b(%rip),%ymm8 # 482c <_sk_callback_hsw+0x473>
+ .byte 196,98,125,24,5,11,7,0,0 // vbroadcastss 0x70b(%rip),%ymm8 # 493c <_sk_callback_hsw+0x473>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -12549,7 +12650,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm1 # 4830 <_sk_callback_hsw+0x477>
+ .byte 196,226,125,24,13,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm1 # 4940 <_sk_callback_hsw+0x477>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -12561,13 +12662,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,214,6,0,0 // vbroadcastss 0x6d6(%rip),%ymm0 # 4834 <_sk_callback_hsw+0x47b>
+ .byte 196,226,125,24,5,214,6,0,0 // vbroadcastss 0x6d6(%rip),%ymm0 # 4944 <_sk_callback_hsw+0x47b>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,205,6,0,0 // vbroadcastss 0x6cd(%rip),%ymm8 # 4838 <_sk_callback_hsw+0x47f>
+ .byte 196,98,125,24,5,205,6,0,0 // vbroadcastss 0x6cd(%rip),%ymm8 # 4948 <_sk_callback_hsw+0x47f>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,190,6,0,0 // vbroadcastss 0x6be(%rip),%ymm10 # 483c <_sk_callback_hsw+0x483>
- .byte 196,98,125,24,29,185,6,0,0 // vbroadcastss 0x6b9(%rip),%ymm11 # 4840 <_sk_callback_hsw+0x487>
+ .byte 196,98,125,24,21,190,6,0,0 // vbroadcastss 0x6be(%rip),%ymm10 # 494c <_sk_callback_hsw+0x483>
+ .byte 196,98,125,24,29,185,6,0,0 // vbroadcastss 0x6b9(%rip),%ymm11 # 4950 <_sk_callback_hsw+0x487>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -12579,16 +12680,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,156,6,0,0 // vbroadcastss 0x69c(%rip),%ymm0 # 4844 <_sk_callback_hsw+0x48b>
+ .byte 196,226,125,24,5,156,6,0,0 // vbroadcastss 0x69c(%rip),%ymm0 # 4954 <_sk_callback_hsw+0x48b>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,147,6,0,0 // vbroadcastss 0x693(%rip),%ymm8 # 4848 <_sk_callback_hsw+0x48f>
+ .byte 196,98,125,24,5,147,6,0,0 // vbroadcastss 0x693(%rip),%ymm8 # 4958 <_sk_callback_hsw+0x48f>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,137,6,0,0 // vbroadcastss 0x689(%rip),%ymm9 # 484c <_sk_callback_hsw+0x493>
- .byte 196,98,125,24,21,132,6,0,0 // vbroadcastss 0x684(%rip),%ymm10 # 4850 <_sk_callback_hsw+0x497>
+ .byte 196,98,125,24,13,137,6,0,0 // vbroadcastss 0x689(%rip),%ymm9 # 495c <_sk_callback_hsw+0x493>
+ .byte 196,98,125,24,21,132,6,0,0 // vbroadcastss 0x684(%rip),%ymm10 # 4960 <_sk_callback_hsw+0x497>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,122,6,0,0 // vbroadcastss 0x67a(%rip),%ymm9 # 4854 <_sk_callback_hsw+0x49b>
+ .byte 196,98,125,24,13,122,6,0,0 // vbroadcastss 0x67a(%rip),%ymm9 # 4964 <_sk_callback_hsw+0x49b>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,112,6,0,0 // vbroadcastss 0x670(%rip),%ymm10 # 4858 <_sk_callback_hsw+0x49f>
+ .byte 196,98,125,24,21,112,6,0,0 // vbroadcastss 0x670(%rip),%ymm10 # 4968 <_sk_callback_hsw+0x49f>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -12599,14 +12700,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,88,6,0,0 // vbroadcastss 0x658(%rip),%ymm8 # 485c <_sk_callback_hsw+0x4a3>
+ .byte 196,98,125,24,5,88,6,0,0 // vbroadcastss 0x658(%rip),%ymm8 # 496c <_sk_callback_hsw+0x4a3>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,74,6,0,0 // vbroadcastss 0x64a(%rip),%ymm10 # 4860 <_sk_callback_hsw+0x4a7>
- .byte 196,98,125,24,29,69,6,0,0 // vbroadcastss 0x645(%rip),%ymm11 # 4864 <_sk_callback_hsw+0x4ab>
+ .byte 196,98,125,24,21,74,6,0,0 // vbroadcastss 0x64a(%rip),%ymm10 # 4970 <_sk_callback_hsw+0x4a7>
+ .byte 196,98,125,24,29,69,6,0,0 // vbroadcastss 0x645(%rip),%ymm11 # 4974 <_sk_callback_hsw+0x4ab>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,54,6,0,0 // vbroadcastss 0x636(%rip),%ymm8 # 4868 <_sk_callback_hsw+0x4af>
+ .byte 196,98,125,24,5,54,6,0,0 // vbroadcastss 0x636(%rip),%ymm8 # 4978 <_sk_callback_hsw+0x4af>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -12617,12 +12718,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,30,6,0,0 // vbroadcastss 0x61e(%rip),%ymm0 # 486c <_sk_callback_hsw+0x4b3>
+ .byte 196,226,125,24,5,30,6,0,0 // vbroadcastss 0x61e(%rip),%ymm0 # 497c <_sk_callback_hsw+0x4b3>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,11,6,0,0 // vbroadcastss 0x60b(%rip),%ymm10 # 4870 <_sk_callback_hsw+0x4b7>
- .byte 196,98,125,24,29,6,6,0,0 // vbroadcastss 0x606(%rip),%ymm11 # 4874 <_sk_callback_hsw+0x4bb>
+ .byte 196,98,125,24,21,11,6,0,0 // vbroadcastss 0x60b(%rip),%ymm10 # 4980 <_sk_callback_hsw+0x4b7>
+ .byte 196,98,125,24,29,6,6,0,0 // vbroadcastss 0x606(%rip),%ymm11 # 4984 <_sk_callback_hsw+0x4bb>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -12634,13 +12735,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,233,5,0,0 // vbroadcastss 0x5e9(%rip),%ymm1 # 4878 <_sk_callback_hsw+0x4bf>
+ .byte 196,226,125,24,13,233,5,0,0 // vbroadcastss 0x5e9(%rip),%ymm1 # 4988 <_sk_callback_hsw+0x4bf>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,223,5,0,0 // vbroadcastss 0x5df(%rip),%ymm8 # 487c <_sk_callback_hsw+0x4c3>
+ .byte 196,98,125,24,5,223,5,0,0 // vbroadcastss 0x5df(%rip),%ymm8 # 498c <_sk_callback_hsw+0x4c3>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,208,5,0,0 // vbroadcastss 0x5d0(%rip),%ymm10 # 4880 <_sk_callback_hsw+0x4c7>
- .byte 196,98,125,24,29,203,5,0,0 // vbroadcastss 0x5cb(%rip),%ymm11 # 4884 <_sk_callback_hsw+0x4cb>
+ .byte 196,98,125,24,21,208,5,0,0 // vbroadcastss 0x5d0(%rip),%ymm10 # 4990 <_sk_callback_hsw+0x4c7>
+ .byte 196,98,125,24,29,203,5,0,0 // vbroadcastss 0x5cb(%rip),%ymm11 # 4994 <_sk_callback_hsw+0x4cb>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -12652,16 +12753,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,174,5,0,0 // vbroadcastss 0x5ae(%rip),%ymm1 # 4888 <_sk_callback_hsw+0x4cf>
+ .byte 196,226,125,24,13,174,5,0,0 // vbroadcastss 0x5ae(%rip),%ymm1 # 4998 <_sk_callback_hsw+0x4cf>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,164,5,0,0 // vbroadcastss 0x5a4(%rip),%ymm8 # 488c <_sk_callback_hsw+0x4d3>
+ .byte 196,98,125,24,5,164,5,0,0 // vbroadcastss 0x5a4(%rip),%ymm8 # 499c <_sk_callback_hsw+0x4d3>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,154,5,0,0 // vbroadcastss 0x59a(%rip),%ymm9 # 4890 <_sk_callback_hsw+0x4d7>
- .byte 196,98,125,24,21,149,5,0,0 // vbroadcastss 0x595(%rip),%ymm10 # 4894 <_sk_callback_hsw+0x4db>
+ .byte 196,98,125,24,13,154,5,0,0 // vbroadcastss 0x59a(%rip),%ymm9 # 49a0 <_sk_callback_hsw+0x4d7>
+ .byte 196,98,125,24,21,149,5,0,0 // vbroadcastss 0x595(%rip),%ymm10 # 49a4 <_sk_callback_hsw+0x4db>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,139,5,0,0 // vbroadcastss 0x58b(%rip),%ymm9 # 4898 <_sk_callback_hsw+0x4df>
+ .byte 196,98,125,24,13,139,5,0,0 // vbroadcastss 0x58b(%rip),%ymm9 # 49a8 <_sk_callback_hsw+0x4df>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,129,5,0,0 // vbroadcastss 0x581(%rip),%ymm10 # 489c <_sk_callback_hsw+0x4e3>
+ .byte 196,98,125,24,21,129,5,0,0 // vbroadcastss 0x581(%rip),%ymm10 # 49ac <_sk_callback_hsw+0x4e3>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -12672,14 +12773,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,105,5,0,0 // vbroadcastss 0x569(%rip),%ymm8 # 48a0 <_sk_callback_hsw+0x4e7>
+ .byte 196,98,125,24,5,105,5,0,0 // vbroadcastss 0x569(%rip),%ymm8 # 49b0 <_sk_callback_hsw+0x4e7>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,90,5,0,0 // vbroadcastss 0x55a(%rip),%ymm10 # 48a4 <_sk_callback_hsw+0x4eb>
- .byte 196,98,125,24,29,85,5,0,0 // vbroadcastss 0x555(%rip),%ymm11 # 48a8 <_sk_callback_hsw+0x4ef>
+ .byte 196,98,125,24,21,90,5,0,0 // vbroadcastss 0x55a(%rip),%ymm10 # 49b4 <_sk_callback_hsw+0x4eb>
+ .byte 196,98,125,24,29,85,5,0,0 // vbroadcastss 0x555(%rip),%ymm11 # 49b8 <_sk_callback_hsw+0x4ef>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,70,5,0,0 // vbroadcastss 0x546(%rip),%ymm8 # 48ac <_sk_callback_hsw+0x4f3>
+ .byte 196,98,125,24,5,70,5,0,0 // vbroadcastss 0x546(%rip),%ymm8 # 49bc <_sk_callback_hsw+0x4f3>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -12690,12 +12791,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,46,5,0,0 // vbroadcastss 0x52e(%rip),%ymm1 # 48b0 <_sk_callback_hsw+0x4f7>
+ .byte 196,226,125,24,13,46,5,0,0 // vbroadcastss 0x52e(%rip),%ymm1 # 49c0 <_sk_callback_hsw+0x4f7>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,26,5,0,0 // vbroadcastss 0x51a(%rip),%ymm10 # 48b4 <_sk_callback_hsw+0x4fb>
- .byte 196,98,125,24,29,21,5,0,0 // vbroadcastss 0x515(%rip),%ymm11 # 48b8 <_sk_callback_hsw+0x4ff>
+ .byte 196,98,125,24,21,26,5,0,0 // vbroadcastss 0x51a(%rip),%ymm10 # 49c4 <_sk_callback_hsw+0x4fb>
+ .byte 196,98,125,24,29,21,5,0,0 // vbroadcastss 0x515(%rip),%ymm11 # 49c8 <_sk_callback_hsw+0x4ff>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -12815,35 +12916,35 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,191,0,0,224 // add %al,-0x1fffff41(%rax)
- .byte 64,0,0 // add %al,(%rax)
- .byte 128,63,154 // cmpb $0x9a,(%rdi)
+ .byte 64,154 // rex (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 4595 <.literal4+0xb5>
+ .byte 71,225,61 // rex.RXB loope 46a1 <.literal4+0xb1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 45a5 <.literal4+0xc5>
+ .byte 71,225,61 // rex.RXB loope 46b1 <.literal4+0xc1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 45b5 <.literal4+0xd5>
+ .byte 71,225,61 // rex.RXB loope 46c1 <.literal4+0xd1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 45c5 <.literal4+0xe5>
+ .byte 71,225,61 // rex.RXB loope 46d1 <.literal4+0xe1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
.byte 63 // (bad)
- .byte 145 // xchg %eax,%ecx
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,145 // cmpb $0x91,(%rdi)
.byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi)
.byte 154 // (bad)
.byte 153 // cltd
@@ -12887,7 +12988,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4611 <.literal4+0x131>
+ .byte 224,7 // loopne 4721 <.literal4+0x131>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -12903,10 +13004,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 4638 <.literal4+0x158>
+ .byte 127,0 // jg 4748 <.literal4+0x158>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 46b1 <.literal4+0x1d1>
+ .byte 119,115 // ja 47c1 <.literal4+0x1d1>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -12920,10 +13021,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 466c <.literal4+0x18c>
+ .byte 127,0 // jg 477c <.literal4+0x18c>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 46e5 <.literal4+0x205>
+ .byte 119,115 // ja 47f5 <.literal4+0x205>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -12937,10 +13038,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 46a0 <.literal4+0x1c0>
+ .byte 127,0 // jg 47b0 <.literal4+0x1c0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4719 <.literal4+0x239>
+ .byte 119,115 // ja 4829 <.literal4+0x239>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -12954,10 +13055,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 46d4 <.literal4+0x1f4>
+ .byte 127,0 // jg 47e4 <.literal4+0x1f4>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 474d <.literal4+0x26d>
+ .byte 119,115 // ja 485d <.literal4+0x26d>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -12970,7 +13071,7 @@ BALIGN4
.byte 0,75,0 // add %cl,0x0(%rbx)
.byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 474b <.literal4+0x26b>
+ .byte 127,67 // jg 485b <.literal4+0x26b>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -12982,10 +13083,10 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 476b <.literal4+0x28b>
+ .byte 118,63 // jbe 487b <.literal4+0x28b>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 477f <.literal4+0x29f>
+ .byte 127,67 // jg 488f <.literal4+0x29f>
.byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax)
@@ -12994,7 +13095,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4761 <.literal4+0x281>
+ .byte 224,7 // loopne 4871 <.literal4+0x281>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -13006,7 +13107,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 477d <.literal4+0x29d>
+ .byte 224,7 // loopne 488d <.literal4+0x29d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -13017,7 +13118,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 47d2 <.literal4+0x2f2>
+ .byte 124,66 // jl 48e2 <.literal4+0x2f2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -13035,9 +13136,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 4815 <.literal4+0x335>
+ .byte 112,65 // jo 4925 <.literal4+0x335>
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 4823 <.literal4+0x343>
+ .byte 127,67 // jg 4933 <.literal4+0x343>
.byte 128,0,128 // addb $0x80,(%rax)
.byte 55 // (bad)
.byte 128,0,128 // addb $0x80,(%rax)
@@ -13045,7 +13146,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 4837 <.literal4+0x357>
+ .byte 127,71 // jg 4947 <.literal4+0x357>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,89 // ds pop %rcx
@@ -13142,16 +13243,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0048e8 <_sk_callback_hsw+0xa00052f>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004a08 <_sk_callback_hsw+0xa00053f>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120048f0 <_sk_callback_hsw+0x12000537>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004a10 <_sk_callback_hsw+0x12000547>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0048f8 <_sk_callback_hsw+0x1a00053f>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004a18 <_sk_callback_hsw+0x1a00054f>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004900 <_sk_callback_hsw+0x3000547>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004a20 <_sk_callback_hsw+0x3000557>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -13194,16 +13295,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004948 <_sk_callback_hsw+0xa00058f>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004a68 <_sk_callback_hsw+0xa00059f>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004950 <_sk_callback_hsw+0x12000597>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004a70 <_sk_callback_hsw+0x120005a7>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004958 <_sk_callback_hsw+0x1a00059f>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004a78 <_sk_callback_hsw+0x1a0005af>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004960 <_sk_callback_hsw+0x30005a7>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004a80 <_sk_callback_hsw+0x30005b7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -13246,16 +13347,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0049a8 <_sk_callback_hsw+0xa0005ef>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004ac8 <_sk_callback_hsw+0xa0005ff>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120049b0 <_sk_callback_hsw+0x120005f7>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004ad0 <_sk_callback_hsw+0x12000607>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0049b8 <_sk_callback_hsw+0x1a0005ff>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004ad8 <_sk_callback_hsw+0x1a00060f>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30049c0 <_sk_callback_hsw+0x3000607>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004ae0 <_sk_callback_hsw+0x3000617>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -13298,16 +13399,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004a08 <_sk_callback_hsw+0xa00064f>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004b28 <_sk_callback_hsw+0xa00065f>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004a10 <_sk_callback_hsw+0x12000657>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004b30 <_sk_callback_hsw+0x12000667>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004a18 <_sk_callback_hsw+0x1a00065f>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004b38 <_sk_callback_hsw+0x1a00066f>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004a20 <_sk_callback_hsw+0x3000667>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004b40 <_sk_callback_hsw+0x3000677>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -13428,14 +13529,14 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,95,91,0,0 // vbroadcastss 0x5b5f(%rip),%ymm1 # 5c28 <_sk_callback_avx+0x128>
+ .byte 196,226,125,24,13,139,92,0,0 // vbroadcastss 0x5c8b(%rip),%ymm1 # 5d54 <_sk_callback_avx+0x128>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,2 // vaddps (%rdx),%ymm0,%ymm0
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,67,91,0,0 // vbroadcastss 0x5b43(%rip),%ymm2 # 5c2c <_sk_callback_avx+0x12c>
+ .byte 196,226,125,24,21,111,92,0,0 // vbroadcastss 0x5c6f(%rip),%ymm2 # 5d58 <_sk_callback_avx+0x12c>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -13457,7 +13558,7 @@ _sk_dither_avx:
.byte 76,139,0 // mov (%rax),%r8
.byte 196,66,125,24,8 // vbroadcastss (%r8),%ymm9
.byte 196,65,60,87,209 // vxorps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,251,90,0,0 // vbroadcastss 0x5afb(%rip),%ymm11 # 5c30 <_sk_callback_avx+0x130>
+ .byte 196,98,125,24,29,39,92,0,0 // vbroadcastss 0x5c27(%rip),%ymm11 # 5d5c <_sk_callback_avx+0x130>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -13468,8 +13569,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,188,90,0,0 // vbroadcastss 0x5abc(%rip),%ymm12 # 5c34 <_sk_callback_avx+0x134>
- .byte 196,98,125,24,45,183,90,0,0 // vbroadcastss 0x5ab7(%rip),%ymm13 # 5c38 <_sk_callback_avx+0x138>
+ .byte 196,98,125,24,37,232,91,0,0 // vbroadcastss 0x5be8(%rip),%ymm12 # 5d60 <_sk_callback_avx+0x134>
+ .byte 196,98,125,24,45,227,91,0,0 // vbroadcastss 0x5be3(%rip),%ymm13 # 5d64 <_sk_callback_avx+0x138>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -13496,9 +13597,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,34,90,0,0 // vbroadcastss 0x5a22(%rip),%ymm9 # 5c3c <_sk_callback_avx+0x13c>
+ .byte 196,98,125,24,13,78,91,0,0 // vbroadcastss 0x5b4e(%rip),%ymm9 # 5d68 <_sk_callback_avx+0x13c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,24,90,0,0 // vbroadcastss 0x5a18(%rip),%ymm9 # 5c40 <_sk_callback_avx+0x140>
+ .byte 196,98,125,24,13,68,91,0,0 // vbroadcastss 0x5b44(%rip),%ymm9 # 5d6c <_sk_callback_avx+0x140>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,72,8 // vbroadcastss 0x8(%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -13536,7 +13637,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,190,89,0,0 // vbroadcastss 0x59be(%rip),%ymm8 # 5c44 <_sk_callback_avx+0x144>
+ .byte 196,98,125,24,5,234,90,0,0 // vbroadcastss 0x5aea(%rip),%ymm8 # 5d70 <_sk_callback_avx+0x144>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -13557,7 +13658,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,128,89,0,0 // vbroadcastss 0x5980(%rip),%ymm9 # 5c48 <_sk_callback_avx+0x148>
+ .byte 196,98,125,24,13,172,90,0,0 // vbroadcastss 0x5aac(%rip),%ymm9 # 5d74 <_sk_callback_avx+0x148>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -13599,7 +13700,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,31,89,0,0 // vbroadcastss 0x591f(%rip),%ymm8 # 5c4c <_sk_callback_avx+0x14c>
+ .byte 196,98,125,24,5,75,90,0,0 // vbroadcastss 0x5a4b(%rip),%ymm8 # 5d78 <_sk_callback_avx+0x14c>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -13612,7 +13713,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,2,89,0,0 // vbroadcastss 0x5902(%rip),%ymm0 # 5c50 <_sk_callback_avx+0x150>
+ .byte 196,226,125,24,5,46,90,0,0 // vbroadcastss 0x5a2e(%rip),%ymm0 # 5d7c <_sk_callback_avx+0x150>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -13625,7 +13726,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,229,88,0,0 // vbroadcastss 0x58e5(%rip),%ymm8 # 5c54 <_sk_callback_avx+0x154>
+ .byte 196,98,125,24,5,17,90,0,0 // vbroadcastss 0x5a11(%rip),%ymm8 # 5d80 <_sk_callback_avx+0x154>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -13642,7 +13743,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,184,88,0,0 // vbroadcastss 0x58b8(%rip),%ymm8 # 5c58 <_sk_callback_avx+0x158>
+ .byte 196,98,125,24,5,228,89,0,0 // vbroadcastss 0x59e4(%rip),%ymm8 # 5d84 <_sk_callback_avx+0x158>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -13670,7 +13771,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,119,88,0,0 // vbroadcastss 0x5877(%rip),%ymm8 # 5c5c <_sk_callback_avx+0x15c>
+ .byte 196,98,125,24,5,163,89,0,0 // vbroadcastss 0x59a3(%rip),%ymm8 # 5d88 <_sk_callback_avx+0x15c>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13730,7 +13831,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,198,87,0,0 // vbroadcastss 0x57c6(%rip),%ymm8 # 5c60 <_sk_callback_avx+0x160>
+ .byte 196,98,125,24,5,242,88,0,0 // vbroadcastss 0x58f2(%rip),%ymm8 # 5d8c <_sk_callback_avx+0x160>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13767,7 +13868,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,70,87,0,0 // vbroadcastss 0x5746(%rip),%ymm8 # 5c64 <_sk_callback_avx+0x164>
+ .byte 196,98,125,24,5,114,88,0,0 // vbroadcastss 0x5872(%rip),%ymm8 # 5d90 <_sk_callback_avx+0x164>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -13793,7 +13894,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,242,86,0,0 // vbroadcastss 0x56f2(%rip),%ymm8 # 5c68 <_sk_callback_avx+0x168>
+ .byte 196,98,125,24,5,30,88,0,0 // vbroadcastss 0x581e(%rip),%ymm8 # 5d94 <_sk_callback_avx+0x168>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -13822,7 +13923,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,146,86,0,0 // vbroadcastss 0x5692(%rip),%ymm8 # 5c6c <_sk_callback_avx+0x16c>
+ .byte 196,98,125,24,5,190,87,0,0 // vbroadcastss 0x57be(%rip),%ymm8 # 5d98 <_sk_callback_avx+0x16c>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -13845,7 +13946,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,77,86,0,0 // vbroadcastss 0x564d(%rip),%ymm8 # 5c70 <_sk_callback_avx+0x170>
+ .byte 196,98,125,24,5,121,87,0,0 // vbroadcastss 0x5779(%rip),%ymm8 # 5d9c <_sk_callback_avx+0x170>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -13856,7 +13957,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,56,86,0,0 // vbroadcastss 0x5638(%rip),%ymm8 # 5c74 <_sk_callback_avx+0x174>
+ .byte 196,98,125,24,5,100,87,0,0 // vbroadcastss 0x5764(%rip),%ymm8 # 5da0 <_sk_callback_avx+0x174>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -13918,7 +14019,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,52,85,0,0 // vbroadcastss 0x5534(%rip),%ymm9 # 5c78 <_sk_callback_avx+0x178>
+ .byte 196,98,125,24,13,96,86,0,0 // vbroadcastss 0x5660(%rip),%ymm9 # 5da4 <_sk_callback_avx+0x178>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -13975,7 +14076,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,70,84,0,0 // vbroadcastss 0x5446(%rip),%ymm8 # 5c7c <_sk_callback_avx+0x17c>
+ .byte 196,98,125,24,5,114,85,0,0 // vbroadcastss 0x5572(%rip),%ymm8 # 5da8 <_sk_callback_avx+0x17c>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -14030,7 +14131,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,111,83,0,0 // vbroadcastss 0x536f(%rip),%ymm8 # 5c80 <_sk_callback_avx+0x180>
+ .byte 196,98,125,24,5,155,84,0,0 // vbroadcastss 0x549b(%rip),%ymm8 # 5dac <_sk_callback_avx+0x180>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -14096,10 +14197,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,102,82,0,0 // vbroadcastss 0x5266(%rip),%ymm11 # 5c88 <_sk_callback_avx+0x188>
+ .byte 196,98,125,24,29,146,83,0,0 // vbroadcastss 0x5392(%rip),%ymm11 # 5db4 <_sk_callback_avx+0x188>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,87,82,0,0 // vbroadcastss 0x5257(%rip),%ymm13 # 5c8c <_sk_callback_avx+0x18c>
+ .byte 196,98,125,24,45,131,83,0,0 // vbroadcastss 0x5383(%rip),%ymm13 # 5db8 <_sk_callback_avx+0x18c>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -14110,7 +14211,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,21,82,0,0 // vbroadcastss 0x5215(%rip),%ymm8 # 5c84 <_sk_callback_avx+0x184>
+ .byte 196,98,125,24,5,65,83,0,0 // vbroadcastss 0x5341(%rip),%ymm8 # 5db0 <_sk_callback_avx+0x184>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -14205,107 +14306,121 @@ HIDDEN _sk_hue_avx
.globl _sk_hue_avx
FUNCTION(_sk_hue_avx)
_sk_hue_avx:
+ .byte 197,252,17,84,36,200 // vmovups %ymm2,-0x38(%rsp)
+ .byte 197,124,40,193 // vmovaps %ymm1,%ymm8
+ .byte 197,124,17,68,36,168 // vmovups %ymm8,-0x58(%rsp)
+ .byte 197,252,40,200 // vmovaps %ymm0,%ymm1
+ .byte 197,116,89,203 // vmulps %ymm3,%ymm1,%ymm9
+ .byte 197,60,89,211 // vmulps %ymm3,%ymm8,%ymm10
+ .byte 197,108,89,219 // vmulps %ymm3,%ymm2,%ymm11
+ .byte 197,84,95,198 // vmaxps %ymm6,%ymm5,%ymm8
+ .byte 196,65,92,95,192 // vmaxps %ymm8,%ymm4,%ymm8
+ .byte 197,84,93,230 // vminps %ymm6,%ymm5,%ymm12
+ .byte 196,65,92,93,228 // vminps %ymm12,%ymm4,%ymm12
+ .byte 196,65,60,92,196 // vsubps %ymm12,%ymm8,%ymm8
+ .byte 197,60,89,227 // vmulps %ymm3,%ymm8,%ymm12
+ .byte 196,65,44,93,195 // vminps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,93,232 // vminps %ymm8,%ymm9,%ymm13
+ .byte 196,65,44,95,195 // vmaxps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,95,192 // vmaxps %ymm8,%ymm9,%ymm8
+ .byte 196,65,60,92,245 // vsubps %ymm13,%ymm8,%ymm14
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,100,194,208,0 // vcmpeqps %ymm8,%ymm3,%ymm10
- .byte 196,98,125,24,13,119,80,0,0 // vbroadcastss 0x5077(%rip),%ymm9 # 5c90 <_sk_callback_avx+0x190>
- .byte 197,52,94,219 // vdivps %ymm3,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
- .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
- .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
- .byte 197,84,95,214 // vmaxps %ymm6,%ymm5,%ymm10
- .byte 196,65,92,95,210 // vmaxps %ymm10,%ymm4,%ymm10
- .byte 197,84,93,222 // vminps %ymm6,%ymm5,%ymm11
- .byte 196,65,92,93,219 // vminps %ymm11,%ymm4,%ymm11
- .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
- .byte 197,116,93,218 // vminps %ymm2,%ymm1,%ymm11
- .byte 196,65,124,93,219 // vminps %ymm11,%ymm0,%ymm11
- .byte 197,116,95,226 // vmaxps %ymm2,%ymm1,%ymm12
- .byte 196,65,124,95,228 // vmaxps %ymm12,%ymm0,%ymm12
- .byte 196,65,28,92,227 // vsubps %ymm11,%ymm12,%ymm12
- .byte 196,65,28,194,232,0 // vcmpeqps %ymm8,%ymm12,%ymm13
- .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
- .byte 196,193,124,94,196 // vdivps %ymm12,%ymm0,%ymm0
- .byte 196,195,125,74,192,208 // vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
- .byte 196,193,116,94,204 // vdivps %ymm12,%ymm1,%ymm1
- .byte 196,195,117,74,200,208 // vblendvps %ymm13,%ymm8,%ymm1,%ymm1
- .byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
- .byte 196,193,108,94,212 // vdivps %ymm12,%ymm2,%ymm2
- .byte 196,195,109,74,208,208 // vblendvps %ymm13,%ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,21,236,79,0,0 // vbroadcastss 0x4fec(%rip),%ymm10 # 5c94 <_sk_callback_avx+0x194>
- .byte 196,65,92,89,218 // vmulps %ymm10,%ymm4,%ymm11
- .byte 196,98,125,24,37,226,79,0,0 // vbroadcastss 0x4fe2(%rip),%ymm12 # 5c98 <_sk_callback_avx+0x198>
- .byte 196,65,84,89,236 // vmulps %ymm12,%ymm5,%ymm13
+ .byte 196,65,12,194,248,0 // vcmpeqps %ymm8,%ymm14,%ymm15
+ .byte 196,65,52,92,205 // vsubps %ymm13,%ymm9,%ymm9
+ .byte 196,65,28,89,201 // vmulps %ymm9,%ymm12,%ymm9
+ .byte 196,65,52,94,206 // vdivps %ymm14,%ymm9,%ymm9
+ .byte 196,67,53,74,200,240 // vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ .byte 196,65,44,92,213 // vsubps %ymm13,%ymm10,%ymm10
+ .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
+ .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
+ .byte 196,67,45,74,208,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm10
+ .byte 196,65,36,92,221 // vsubps %ymm13,%ymm11,%ymm11
+ .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
+ .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
+ .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
+ .byte 196,98,125,24,53,16,81,0,0 // vbroadcastss 0x5110(%rip),%ymm14 # 5dbc <_sk_callback_avx+0x190>
+ .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
+ .byte 196,98,125,24,61,6,81,0,0 // vbroadcastss 0x5106(%rip),%ymm15 # 5dc0 <_sk_callback_avx+0x194>
+ .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,98,125,24,45,211,79,0,0 // vbroadcastss 0x4fd3(%rip),%ymm13 # 5c9c <_sk_callback_avx+0x19c>
- .byte 196,65,76,89,245 // vmulps %ymm13,%ymm6,%ymm14
- .byte 196,65,36,88,222 // vaddps %ymm14,%ymm11,%ymm11
- .byte 196,65,124,89,242 // vmulps %ymm10,%ymm0,%ymm14
- .byte 196,65,116,89,252 // vmulps %ymm12,%ymm1,%ymm15
- .byte 196,65,12,88,247 // vaddps %ymm15,%ymm14,%ymm14
- .byte 196,65,108,89,253 // vmulps %ymm13,%ymm2,%ymm15
- .byte 196,65,12,88,247 // vaddps %ymm15,%ymm14,%ymm14
- .byte 196,65,36,92,222 // vsubps %ymm14,%ymm11,%ymm11
- .byte 196,65,124,88,243 // vaddps %ymm11,%ymm0,%ymm14
- .byte 196,65,116,88,251 // vaddps %ymm11,%ymm1,%ymm15
- .byte 196,193,108,88,195 // vaddps %ymm11,%ymm2,%ymm0
- .byte 197,132,93,200 // vminps %ymm0,%ymm15,%ymm1
- .byte 197,140,93,209 // vminps %ymm1,%ymm14,%ymm2
- .byte 197,132,95,200 // vmaxps %ymm0,%ymm15,%ymm1
- .byte 197,12,95,217 // vmaxps %ymm1,%ymm14,%ymm11
- .byte 196,193,12,89,202 // vmulps %ymm10,%ymm14,%ymm1
- .byte 196,65,4,89,212 // vmulps %ymm12,%ymm15,%ymm10
- .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,65,124,89,213 // vmulps %ymm13,%ymm0,%ymm10
- .byte 197,172,88,201 // vaddps %ymm1,%ymm10,%ymm1
- .byte 197,60,194,210,2 // vcmpleps %ymm2,%ymm8,%ymm10
- .byte 197,12,92,225 // vsubps %ymm1,%ymm14,%ymm12
- .byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
- .byte 197,244,92,210 // vsubps %ymm2,%ymm1,%ymm2
- .byte 197,28,94,226 // vdivps %ymm2,%ymm12,%ymm12
- .byte 196,65,116,88,228 // vaddps %ymm12,%ymm1,%ymm12
- .byte 196,67,29,74,230,160 // vblendvps %ymm10,%ymm14,%ymm12,%ymm12
- .byte 196,65,52,194,235,1 // vcmpltps %ymm11,%ymm9,%ymm13
- .byte 197,28,92,241 // vsubps %ymm1,%ymm12,%ymm14
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
- .byte 196,65,52,89,246 // vmulps %ymm14,%ymm9,%ymm14
- .byte 197,36,92,217 // vsubps %ymm1,%ymm11,%ymm11
- .byte 196,65,12,94,243 // vdivps %ymm11,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,29,74,230,208 // vblendvps %ymm13,%ymm14,%ymm12,%ymm12
- .byte 196,65,28,95,224 // vmaxps %ymm8,%ymm12,%ymm12
- .byte 197,4,92,241 // vsubps %ymm1,%ymm15,%ymm14
- .byte 196,65,116,89,246 // vmulps %ymm14,%ymm1,%ymm14
+ .byte 196,226,125,24,5,247,80,0,0 // vbroadcastss 0x50f7(%rip),%ymm0 # 5dc4 <_sk_callback_avx+0x198>
+ .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
+ .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
+ .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
+ .byte 196,193,44,89,215 // vmulps %ymm15,%ymm10,%ymm2
+ .byte 197,148,88,210 // vaddps %ymm2,%ymm13,%ymm2
+ .byte 197,28,89,232 // vmulps %ymm0,%ymm12,%ymm13
+ .byte 196,193,108,88,213 // vaddps %ymm13,%ymm2,%ymm2
+ .byte 197,36,89,219 // vmulps %ymm3,%ymm11,%ymm11
+ .byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
+ .byte 197,52,88,202 // vaddps %ymm2,%ymm9,%ymm9
+ .byte 197,44,88,218 // vaddps %ymm2,%ymm10,%ymm11
+ .byte 197,28,88,226 // vaddps %ymm2,%ymm12,%ymm12
+ .byte 196,193,36,93,212 // vminps %ymm12,%ymm11,%ymm2
+ .byte 197,52,93,234 // vminps %ymm2,%ymm9,%ymm13
+ .byte 196,193,52,89,214 // vmulps %ymm14,%ymm9,%ymm2
+ .byte 196,65,36,89,215 // vmulps %ymm15,%ymm11,%ymm10
+ .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
+ .byte 197,156,89,192 // vmulps %ymm0,%ymm12,%ymm0
+ .byte 197,124,88,210 // vaddps %ymm2,%ymm0,%ymm10
+ .byte 196,193,52,92,194 // vsubps %ymm10,%ymm9,%ymm0
+ .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
+ .byte 196,193,44,92,213 // vsubps %ymm13,%ymm10,%ymm2
+ .byte 197,252,94,194 // vdivps %ymm2,%ymm0,%ymm0
+ .byte 196,65,36,92,242 // vsubps %ymm10,%ymm11,%ymm14
+ .byte 196,65,44,89,246 // vmulps %ymm14,%ymm10,%ymm14
.byte 197,12,94,242 // vdivps %ymm2,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,13,74,247,160 // vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- .byte 197,12,92,249 // vsubps %ymm1,%ymm14,%ymm15
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,251 // vdivps %ymm11,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,13,74,247,208 // vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- .byte 196,65,12,95,240 // vmaxps %ymm8,%ymm14,%ymm14
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
+ .byte 196,65,28,92,250 // vsubps %ymm10,%ymm12,%ymm15
+ .byte 196,65,44,89,255 // vmulps %ymm15,%ymm10,%ymm15
.byte 197,132,94,210 // vdivps %ymm2,%ymm15,%ymm2
- .byte 197,244,88,210 // vaddps %ymm2,%ymm1,%ymm2
- .byte 196,227,109,74,192,160 // vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- .byte 197,252,92,209 // vsubps %ymm1,%ymm0,%ymm2
- .byte 197,180,89,210 // vmulps %ymm2,%ymm9,%ymm2
- .byte 196,193,108,94,211 // vdivps %ymm11,%ymm2,%ymm2
- .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,227,125,74,193,208 // vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- .byte 196,193,124,95,208 // vmaxps %ymm8,%ymm0,%ymm2
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 197,228,89,207 // vmulps %ymm7,%ymm3,%ymm1
- .byte 197,252,92,217 // vsubps %ymm1,%ymm0,%ymm3
- .byte 196,193,100,89,196 // vmulps %ymm12,%ymm3,%ymm0
- .byte 196,193,100,89,206 // vmulps %ymm14,%ymm3,%ymm1
- .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 196,65,60,194,237,2 // vcmpleps %ymm13,%ymm8,%ymm13
+ .byte 196,65,44,88,246 // vaddps %ymm14,%ymm10,%ymm14
+ .byte 196,67,13,74,243,208 // vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ .byte 196,65,36,95,220 // vmaxps %ymm12,%ymm11,%ymm11
+ .byte 197,172,88,210 // vaddps %ymm2,%ymm10,%ymm2
+ .byte 196,195,109,74,212,208 // vblendvps %ymm13,%ymm12,%ymm2,%ymm2
+ .byte 197,172,88,192 // vaddps %ymm0,%ymm10,%ymm0
+ .byte 196,195,125,74,193,208 // vblendvps %ymm13,%ymm9,%ymm0,%ymm0
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,52,95,203 // vmaxps %ymm11,%ymm9,%ymm9
+ .byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
+ .byte 196,65,28,92,234 // vsubps %ymm10,%ymm12,%ymm13
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,28,194,249,1 // vcmpltps %ymm9,%ymm12,%ymm15
+ .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
+ .byte 196,65,36,94,217 // vdivps %ymm9,%ymm11,%ymm11
+ .byte 196,65,44,88,219 // vaddps %ymm11,%ymm10,%ymm11
+ .byte 196,195,125,74,195,240 // vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ .byte 196,65,12,92,218 // vsubps %ymm10,%ymm14,%ymm11
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,36,94,217 // vdivps %ymm9,%ymm11,%ymm11
+ .byte 196,65,44,88,219 // vaddps %ymm11,%ymm10,%ymm11
+ .byte 196,67,13,74,219,240 // vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ .byte 196,65,108,92,242 // vsubps %ymm10,%ymm2,%ymm14
+ .byte 196,65,20,89,238 // vmulps %ymm14,%ymm13,%ymm13
+ .byte 196,65,20,94,201 // vdivps %ymm9,%ymm13,%ymm9
+ .byte 196,65,44,88,201 // vaddps %ymm9,%ymm10,%ymm9
+ .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
+ .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
+ .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
+ .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
+ .byte 196,98,125,24,5,208,79,0,0 // vbroadcastss 0x4fd0(%rip),%ymm8 # 5dc8 <_sk_callback_avx+0x19c>
+ .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
+ .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
+ .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
+ .byte 197,60,89,220 // vmulps %ymm4,%ymm8,%ymm11
+ .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,180,89,76,36,168 // vmulps -0x58(%rsp),%ymm9,%ymm1
+ .byte 197,60,89,221 // vmulps %ymm5,%ymm8,%ymm11
+ .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 197,52,89,76,36,200 // vmulps -0x38(%rsp),%ymm9,%ymm9
+ .byte 197,60,89,198 // vmulps %ymm6,%ymm8,%ymm8
+ .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
+ .byte 197,188,88,210 // vaddps %ymm2,%ymm8,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14313,107 +14428,122 @@ HIDDEN _sk_saturation_avx
.globl _sk_saturation_avx
FUNCTION(_sk_saturation_avx)
_sk_saturation_avx:
+ .byte 197,124,40,193 // vmovaps %ymm1,%ymm8
+ .byte 197,252,40,200 // vmovaps %ymm0,%ymm1
+ .byte 197,100,89,204 // vmulps %ymm4,%ymm3,%ymm9
+ .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
+ .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
+ .byte 197,252,17,84,36,200 // vmovups %ymm2,-0x38(%rsp)
+ .byte 197,124,41,192 // vmovaps %ymm8,%ymm0
+ .byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
+ .byte 197,124,95,194 // vmaxps %ymm2,%ymm0,%ymm8
+ .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
+ .byte 197,124,93,226 // vminps %ymm2,%ymm0,%ymm12
+ .byte 196,65,116,93,228 // vminps %ymm12,%ymm1,%ymm12
+ .byte 196,65,60,92,196 // vsubps %ymm12,%ymm8,%ymm8
+ .byte 197,60,89,231 // vmulps %ymm7,%ymm8,%ymm12
+ .byte 196,65,44,93,195 // vminps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,93,232 // vminps %ymm8,%ymm9,%ymm13
+ .byte 196,65,44,95,195 // vmaxps %ymm11,%ymm10,%ymm8
+ .byte 196,65,52,95,192 // vmaxps %ymm8,%ymm9,%ymm8
+ .byte 196,65,60,92,245 // vsubps %ymm13,%ymm8,%ymm14
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,68,194,208,0 // vcmpeqps %ymm8,%ymm7,%ymm10
- .byte 196,98,125,24,13,144,78,0,0 // vbroadcastss 0x4e90(%rip),%ymm9 # 5ca0 <_sk_callback_avx+0x1a0>
- .byte 197,52,94,223 // vdivps %ymm7,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,44,89,220 // vmulps %ymm4,%ymm10,%ymm11
- .byte 197,44,89,229 // vmulps %ymm5,%ymm10,%ymm12
- .byte 197,44,89,214 // vmulps %ymm6,%ymm10,%ymm10
- .byte 197,116,95,234 // vmaxps %ymm2,%ymm1,%ymm13
- .byte 196,65,124,95,237 // vmaxps %ymm13,%ymm0,%ymm13
- .byte 197,244,93,202 // vminps %ymm2,%ymm1,%ymm1
- .byte 197,252,93,193 // vminps %ymm1,%ymm0,%ymm0
- .byte 197,148,92,192 // vsubps %ymm0,%ymm13,%ymm0
- .byte 196,193,28,93,202 // vminps %ymm10,%ymm12,%ymm1
- .byte 197,164,93,201 // vminps %ymm1,%ymm11,%ymm1
- .byte 196,193,28,95,210 // vmaxps %ymm10,%ymm12,%ymm2
- .byte 197,164,95,210 // vmaxps %ymm2,%ymm11,%ymm2
- .byte 197,236,92,209 // vsubps %ymm1,%ymm2,%ymm2
- .byte 196,65,108,194,232,0 // vcmpeqps %ymm8,%ymm2,%ymm13
- .byte 197,36,92,217 // vsubps %ymm1,%ymm11,%ymm11
- .byte 196,65,124,89,219 // vmulps %ymm11,%ymm0,%ymm11
- .byte 197,36,94,218 // vdivps %ymm2,%ymm11,%ymm11
- .byte 196,67,37,74,216,208 // vblendvps %ymm13,%ymm8,%ymm11,%ymm11
- .byte 197,28,92,225 // vsubps %ymm1,%ymm12,%ymm12
- .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
- .byte 197,28,94,226 // vdivps %ymm2,%ymm12,%ymm12
- .byte 196,67,29,74,224,208 // vblendvps %ymm13,%ymm8,%ymm12,%ymm12
- .byte 197,172,92,201 // vsubps %ymm1,%ymm10,%ymm1
- .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 197,252,94,194 // vdivps %ymm2,%ymm0,%ymm0
- .byte 196,195,125,74,192,208 // vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- .byte 196,226,125,24,13,12,78,0,0 // vbroadcastss 0x4e0c(%rip),%ymm1 # 5ca4 <_sk_callback_avx+0x1a4>
- .byte 197,220,89,209 // vmulps %ymm1,%ymm4,%ymm2
- .byte 196,98,125,24,21,3,78,0,0 // vbroadcastss 0x4e03(%rip),%ymm10 # 5ca8 <_sk_callback_avx+0x1a8>
- .byte 196,65,84,89,234 // vmulps %ymm10,%ymm5,%ymm13
+ .byte 196,65,12,194,248,0 // vcmpeqps %ymm8,%ymm14,%ymm15
+ .byte 196,65,52,92,205 // vsubps %ymm13,%ymm9,%ymm9
+ .byte 196,65,28,89,201 // vmulps %ymm9,%ymm12,%ymm9
+ .byte 196,65,52,94,206 // vdivps %ymm14,%ymm9,%ymm9
+ .byte 196,67,53,74,200,240 // vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ .byte 196,65,44,92,213 // vsubps %ymm13,%ymm10,%ymm10
+ .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
+ .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
+ .byte 196,67,45,74,208,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm10
+ .byte 196,65,36,92,221 // vsubps %ymm13,%ymm11,%ymm11
+ .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
+ .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
+ .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
+ .byte 196,98,125,24,53,222,78,0,0 // vbroadcastss 0x4ede(%rip),%ymm14 # 5dcc <_sk_callback_avx+0x1a0>
+ .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
+ .byte 196,98,125,24,61,212,78,0,0 // vbroadcastss 0x4ed4(%rip),%ymm15 # 5dd0 <_sk_callback_avx+0x1a4>
+ .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
+ .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
+ .byte 196,226,125,24,5,197,78,0,0 // vbroadcastss 0x4ec5(%rip),%ymm0 # 5dd4 <_sk_callback_avx+0x1a8>
+ .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
+ .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
+ .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
+ .byte 196,193,44,89,215 // vmulps %ymm15,%ymm10,%ymm2
+ .byte 197,148,88,210 // vaddps %ymm2,%ymm13,%ymm2
+ .byte 197,28,89,232 // vmulps %ymm0,%ymm12,%ymm13
.byte 196,193,108,88,213 // vaddps %ymm13,%ymm2,%ymm2
- .byte 196,98,125,24,45,244,77,0,0 // vbroadcastss 0x4df4(%rip),%ymm13 # 5cac <_sk_callback_avx+0x1ac>
- .byte 196,65,76,89,245 // vmulps %ymm13,%ymm6,%ymm14
- .byte 196,193,108,88,214 // vaddps %ymm14,%ymm2,%ymm2
- .byte 197,36,89,241 // vmulps %ymm1,%ymm11,%ymm14
- .byte 196,65,28,89,250 // vmulps %ymm10,%ymm12,%ymm15
- .byte 196,65,12,88,247 // vaddps %ymm15,%ymm14,%ymm14
- .byte 196,65,124,89,253 // vmulps %ymm13,%ymm0,%ymm15
- .byte 196,65,12,88,247 // vaddps %ymm15,%ymm14,%ymm14
- .byte 196,193,108,92,214 // vsubps %ymm14,%ymm2,%ymm2
- .byte 197,36,88,218 // vaddps %ymm2,%ymm11,%ymm11
+ .byte 197,36,89,219 // vmulps %ymm3,%ymm11,%ymm11
+ .byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
+ .byte 197,52,88,202 // vaddps %ymm2,%ymm9,%ymm9
+ .byte 197,44,88,218 // vaddps %ymm2,%ymm10,%ymm11
.byte 197,28,88,226 // vaddps %ymm2,%ymm12,%ymm12
- .byte 197,252,88,194 // vaddps %ymm2,%ymm0,%ymm0
- .byte 197,156,93,208 // vminps %ymm0,%ymm12,%ymm2
- .byte 197,164,93,210 // vminps %ymm2,%ymm11,%ymm2
- .byte 197,28,95,240 // vmaxps %ymm0,%ymm12,%ymm14
- .byte 196,65,36,95,246 // vmaxps %ymm14,%ymm11,%ymm14
- .byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
- .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
- .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,65,124,89,213 // vmulps %ymm13,%ymm0,%ymm10
- .byte 197,172,88,201 // vaddps %ymm1,%ymm10,%ymm1
- .byte 197,60,194,210,2 // vcmpleps %ymm2,%ymm8,%ymm10
- .byte 197,36,92,233 // vsubps %ymm1,%ymm11,%ymm13
- .byte 196,65,116,89,237 // vmulps %ymm13,%ymm1,%ymm13
- .byte 197,244,92,210 // vsubps %ymm2,%ymm1,%ymm2
- .byte 197,20,94,234 // vdivps %ymm2,%ymm13,%ymm13
- .byte 196,65,116,88,237 // vaddps %ymm13,%ymm1,%ymm13
- .byte 196,67,21,74,219,160 // vblendvps %ymm10,%ymm11,%ymm13,%ymm11
- .byte 196,65,52,194,238,1 // vcmpltps %ymm14,%ymm9,%ymm13
- .byte 197,36,92,249 // vsubps %ymm1,%ymm11,%ymm15
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 197,12,92,241 // vsubps %ymm1,%ymm14,%ymm14
- .byte 196,65,4,94,254 // vdivps %ymm14,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,37,74,223,208 // vblendvps %ymm13,%ymm15,%ymm11,%ymm11
- .byte 196,65,36,95,216 // vmaxps %ymm8,%ymm11,%ymm11
- .byte 197,28,92,249 // vsubps %ymm1,%ymm12,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 197,4,94,250 // vdivps %ymm2,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,5,74,228,160 // vblendvps %ymm10,%ymm12,%ymm15,%ymm12
- .byte 197,28,92,249 // vsubps %ymm1,%ymm12,%ymm15
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,254 // vdivps %ymm14,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,29,74,231,208 // vblendvps %ymm13,%ymm15,%ymm12,%ymm12
- .byte 196,65,28,95,224 // vmaxps %ymm8,%ymm12,%ymm12
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
+ .byte 196,193,36,93,212 // vminps %ymm12,%ymm11,%ymm2
+ .byte 197,52,93,234 // vminps %ymm2,%ymm9,%ymm13
+ .byte 196,193,52,89,214 // vmulps %ymm14,%ymm9,%ymm2
+ .byte 196,65,36,89,215 // vmulps %ymm15,%ymm11,%ymm10
+ .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
+ .byte 197,156,89,192 // vmulps %ymm0,%ymm12,%ymm0
+ .byte 197,124,88,210 // vaddps %ymm2,%ymm0,%ymm10
+ .byte 196,193,52,92,194 // vsubps %ymm10,%ymm9,%ymm0
+ .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
+ .byte 196,193,44,92,213 // vsubps %ymm13,%ymm10,%ymm2
+ .byte 197,252,94,194 // vdivps %ymm2,%ymm0,%ymm0
+ .byte 196,65,36,92,242 // vsubps %ymm10,%ymm11,%ymm14
+ .byte 196,65,44,89,246 // vmulps %ymm14,%ymm10,%ymm14
+ .byte 197,12,94,242 // vdivps %ymm2,%ymm14,%ymm14
+ .byte 196,65,28,92,250 // vsubps %ymm10,%ymm12,%ymm15
+ .byte 196,65,44,89,255 // vmulps %ymm15,%ymm10,%ymm15
.byte 197,132,94,210 // vdivps %ymm2,%ymm15,%ymm2
- .byte 197,244,88,210 // vaddps %ymm2,%ymm1,%ymm2
- .byte 196,227,109,74,192,160 // vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- .byte 197,252,92,209 // vsubps %ymm1,%ymm0,%ymm2
- .byte 197,180,89,210 // vmulps %ymm2,%ymm9,%ymm2
- .byte 196,193,108,94,214 // vdivps %ymm14,%ymm2,%ymm2
- .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,227,125,74,193,208 // vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- .byte 196,193,124,95,208 // vmaxps %ymm8,%ymm0,%ymm2
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 197,228,89,207 // vmulps %ymm7,%ymm3,%ymm1
- .byte 197,252,92,217 // vsubps %ymm1,%ymm0,%ymm3
- .byte 196,193,100,89,195 // vmulps %ymm11,%ymm3,%ymm0
- .byte 196,193,100,89,204 // vmulps %ymm12,%ymm3,%ymm1
- .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 196,65,60,194,237,2 // vcmpleps %ymm13,%ymm8,%ymm13
+ .byte 196,65,44,88,246 // vaddps %ymm14,%ymm10,%ymm14
+ .byte 196,67,13,74,243,208 // vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ .byte 196,65,36,95,220 // vmaxps %ymm12,%ymm11,%ymm11
+ .byte 197,172,88,210 // vaddps %ymm2,%ymm10,%ymm2
+ .byte 196,195,109,74,212,208 // vblendvps %ymm13,%ymm12,%ymm2,%ymm2
+ .byte 197,172,88,192 // vaddps %ymm0,%ymm10,%ymm0
+ .byte 196,195,125,74,193,208 // vblendvps %ymm13,%ymm9,%ymm0,%ymm0
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,52,95,203 // vmaxps %ymm11,%ymm9,%ymm9
+ .byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
+ .byte 196,65,28,92,234 // vsubps %ymm10,%ymm12,%ymm13
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,28,194,249,1 // vcmpltps %ymm9,%ymm12,%ymm15
+ .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
+ .byte 196,65,36,94,217 // vdivps %ymm9,%ymm11,%ymm11
+ .byte 196,65,44,88,219 // vaddps %ymm11,%ymm10,%ymm11
+ .byte 196,195,125,74,195,240 // vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ .byte 196,65,12,92,218 // vsubps %ymm10,%ymm14,%ymm11
+ .byte 196,65,20,89,219 // vmulps %ymm11,%ymm13,%ymm11
+ .byte 196,65,36,94,217 // vdivps %ymm9,%ymm11,%ymm11
+ .byte 196,65,44,88,219 // vaddps %ymm11,%ymm10,%ymm11
+ .byte 196,67,13,74,219,240 // vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ .byte 196,65,108,92,242 // vsubps %ymm10,%ymm2,%ymm14
+ .byte 196,65,20,89,238 // vmulps %ymm14,%ymm13,%ymm13
+ .byte 196,65,20,94,201 // vdivps %ymm9,%ymm13,%ymm9
+ .byte 196,65,44,88,201 // vaddps %ymm9,%ymm10,%ymm9
+ .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
+ .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
+ .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
+ .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
+ .byte 196,98,125,24,5,158,77,0,0 // vbroadcastss 0x4d9e(%rip),%ymm8 # 5dd8 <_sk_callback_avx+0x1ac>
+ .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
+ .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
+ .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
+ .byte 197,60,89,220 // vmulps %ymm4,%ymm8,%ymm11
+ .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,180,89,76,36,168 // vmulps -0x58(%rsp),%ymm9,%ymm1
+ .byte 197,60,89,221 // vmulps %ymm5,%ymm8,%ymm11
+ .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 197,52,89,76,36,200 // vmulps -0x38(%rsp),%ymm9,%ymm9
+ .byte 197,60,89,198 // vmulps %ymm6,%ymm8,%ymm8
+ .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
+ .byte 197,188,88,210 // vaddps %ymm2,%ymm8,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14421,84 +14551,96 @@ HIDDEN _sk_color_avx
.globl _sk_color_avx
FUNCTION(_sk_color_avx)
_sk_color_avx:
- .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,100,194,208,0 // vcmpeqps %ymm8,%ymm3,%ymm10
- .byte 196,98,125,24,13,181,76,0,0 // vbroadcastss 0x4cb5(%rip),%ymm9 # 5cb0 <_sk_callback_avx+0x1b0>
- .byte 197,52,94,219 // vdivps %ymm3,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
- .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
- .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
- .byte 196,98,125,24,21,154,76,0,0 // vbroadcastss 0x4c9a(%rip),%ymm10 # 5cb4 <_sk_callback_avx+0x1b4>
- .byte 196,65,92,89,218 // vmulps %ymm10,%ymm4,%ymm11
- .byte 196,98,125,24,37,144,76,0,0 // vbroadcastss 0x4c90(%rip),%ymm12 # 5cb8 <_sk_callback_avx+0x1b8>
- .byte 196,65,84,89,236 // vmulps %ymm12,%ymm5,%ymm13
- .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,98,125,24,45,129,76,0,0 // vbroadcastss 0x4c81(%rip),%ymm13 # 5cbc <_sk_callback_avx+0x1bc>
- .byte 196,65,76,89,245 // vmulps %ymm13,%ymm6,%ymm14
- .byte 196,65,36,88,222 // vaddps %ymm14,%ymm11,%ymm11
- .byte 196,65,124,89,242 // vmulps %ymm10,%ymm0,%ymm14
- .byte 196,65,116,89,252 // vmulps %ymm12,%ymm1,%ymm15
- .byte 196,65,12,88,247 // vaddps %ymm15,%ymm14,%ymm14
- .byte 196,65,108,89,253 // vmulps %ymm13,%ymm2,%ymm15
- .byte 196,65,4,88,246 // vaddps %ymm14,%ymm15,%ymm14
- .byte 196,65,36,92,222 // vsubps %ymm14,%ymm11,%ymm11
- .byte 196,65,124,88,243 // vaddps %ymm11,%ymm0,%ymm14
- .byte 196,65,116,88,251 // vaddps %ymm11,%ymm1,%ymm15
- .byte 196,193,108,88,195 // vaddps %ymm11,%ymm2,%ymm0
- .byte 197,132,93,200 // vminps %ymm0,%ymm15,%ymm1
- .byte 197,140,93,209 // vminps %ymm1,%ymm14,%ymm2
- .byte 197,132,95,200 // vmaxps %ymm0,%ymm15,%ymm1
- .byte 197,12,95,217 // vmaxps %ymm1,%ymm14,%ymm11
- .byte 196,193,12,89,202 // vmulps %ymm10,%ymm14,%ymm1
- .byte 196,65,4,89,212 // vmulps %ymm12,%ymm15,%ymm10
- .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,65,124,89,213 // vmulps %ymm13,%ymm0,%ymm10
- .byte 197,172,88,201 // vaddps %ymm1,%ymm10,%ymm1
- .byte 197,60,194,210,2 // vcmpleps %ymm2,%ymm8,%ymm10
- .byte 197,12,92,225 // vsubps %ymm1,%ymm14,%ymm12
- .byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
- .byte 197,244,92,210 // vsubps %ymm2,%ymm1,%ymm2
- .byte 197,28,94,226 // vdivps %ymm2,%ymm12,%ymm12
- .byte 196,65,116,88,228 // vaddps %ymm12,%ymm1,%ymm12
- .byte 196,67,29,74,230,160 // vblendvps %ymm10,%ymm14,%ymm12,%ymm12
- .byte 196,65,52,194,235,1 // vcmpltps %ymm11,%ymm9,%ymm13
- .byte 197,28,92,241 // vsubps %ymm1,%ymm12,%ymm14
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
+ .byte 197,252,17,84,36,136 // vmovups %ymm2,-0x78(%rsp)
+ .byte 197,252,17,76,36,200 // vmovups %ymm1,-0x38(%rsp)
+ .byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
+ .byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
+ .byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
+ .byte 196,98,125,24,45,52,77,0,0 // vbroadcastss 0x4d34(%rip),%ymm13 # 5ddc <_sk_callback_avx+0x1b0>
+ .byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
+ .byte 196,98,125,24,53,42,77,0,0 // vbroadcastss 0x4d2a(%rip),%ymm14 # 5de0 <_sk_callback_avx+0x1b4>
+ .byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
+ .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
+ .byte 196,98,125,24,61,27,77,0,0 // vbroadcastss 0x4d1b(%rip),%ymm15 # 5de4 <_sk_callback_avx+0x1b8>
+ .byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
+ .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
+ .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
+ .byte 196,65,52,89,230 // vmulps %ymm14,%ymm9,%ymm12
+ .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
+ .byte 197,108,89,231 // vmulps %ymm7,%ymm2,%ymm12
+ .byte 196,65,28,89,215 // vmulps %ymm15,%ymm12,%ymm10
+ .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
+ .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
+ .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
+ .byte 197,60,88,192 // vaddps %ymm0,%ymm8,%ymm8
+ .byte 197,52,88,208 // vaddps %ymm0,%ymm9,%ymm10
+ .byte 197,28,88,216 // vaddps %ymm0,%ymm12,%ymm11
+ .byte 196,193,44,93,195 // vminps %ymm11,%ymm10,%ymm0
+ .byte 197,60,93,224 // vminps %ymm0,%ymm8,%ymm12
+ .byte 196,193,60,89,197 // vmulps %ymm13,%ymm8,%ymm0
+ .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
+ .byte 196,193,124,88,193 // vaddps %ymm9,%ymm0,%ymm0
+ .byte 196,65,36,89,207 // vmulps %ymm15,%ymm11,%ymm9
+ .byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
+ .byte 196,193,60,92,193 // vsubps %ymm9,%ymm8,%ymm0
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 196,65,52,92,236 // vsubps %ymm12,%ymm9,%ymm13
+ .byte 196,193,124,94,197 // vdivps %ymm13,%ymm0,%ymm0
+ .byte 196,65,44,92,241 // vsubps %ymm9,%ymm10,%ymm14
.byte 196,65,52,89,246 // vmulps %ymm14,%ymm9,%ymm14
- .byte 197,36,92,217 // vsubps %ymm1,%ymm11,%ymm11
- .byte 196,65,12,94,243 // vdivps %ymm11,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,29,74,230,208 // vblendvps %ymm13,%ymm14,%ymm12,%ymm12
- .byte 196,65,28,95,224 // vmaxps %ymm8,%ymm12,%ymm12
- .byte 197,4,92,241 // vsubps %ymm1,%ymm15,%ymm14
- .byte 196,65,116,89,246 // vmulps %ymm14,%ymm1,%ymm14
- .byte 197,12,94,242 // vdivps %ymm2,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,67,13,74,247,160 // vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- .byte 197,12,92,249 // vsubps %ymm1,%ymm14,%ymm15
+ .byte 196,65,12,94,245 // vdivps %ymm13,%ymm14,%ymm14
+ .byte 196,65,36,92,249 // vsubps %ymm9,%ymm11,%ymm15
.byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,251 // vdivps %ymm11,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,13,74,247,208 // vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- .byte 196,65,12,95,240 // vmaxps %ymm8,%ymm14,%ymm14
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 197,132,94,210 // vdivps %ymm2,%ymm15,%ymm2
- .byte 197,244,88,210 // vaddps %ymm2,%ymm1,%ymm2
- .byte 196,227,109,74,192,160 // vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- .byte 197,252,92,209 // vsubps %ymm1,%ymm0,%ymm2
- .byte 197,180,89,210 // vmulps %ymm2,%ymm9,%ymm2
- .byte 196,193,108,94,211 // vdivps %ymm11,%ymm2,%ymm2
- .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,227,125,74,193,208 // vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- .byte 196,193,124,95,208 // vmaxps %ymm8,%ymm0,%ymm2
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 197,228,89,207 // vmulps %ymm7,%ymm3,%ymm1
- .byte 197,252,92,217 // vsubps %ymm1,%ymm0,%ymm3
- .byte 196,193,100,89,196 // vmulps %ymm12,%ymm3,%ymm0
- .byte 196,193,100,89,206 // vmulps %ymm14,%ymm3,%ymm1
- .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 196,65,4,94,237 // vdivps %ymm13,%ymm15,%ymm13
+ .byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
+ .byte 196,65,4,194,228,2 // vcmpleps %ymm12,%ymm15,%ymm12
+ .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
+ .byte 196,67,13,74,242,192 // vblendvps %ymm12,%ymm10,%ymm14,%ymm14
+ .byte 196,65,44,95,211 // vmaxps %ymm11,%ymm10,%ymm10
+ .byte 196,65,52,88,237 // vaddps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,219,192 // vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
+ .byte 196,195,125,74,200,192 // vblendvps %ymm12,%ymm8,%ymm0,%ymm1
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,60,95,194 // vmaxps %ymm10,%ymm8,%ymm8
+ .byte 196,65,116,92,209 // vsubps %ymm9,%ymm1,%ymm10
+ .byte 196,65,28,92,233 // vsubps %ymm9,%ymm12,%ymm13
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,193,28,194,192,1 // vcmpltps %ymm8,%ymm12,%ymm0
+ .byte 196,65,60,92,193 // vsubps %ymm9,%ymm8,%ymm8
+ .byte 196,65,44,94,208 // vdivps %ymm8,%ymm10,%ymm10
+ .byte 196,65,52,88,210 // vaddps %ymm10,%ymm9,%ymm10
+ .byte 196,195,117,74,202,0 // vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ .byte 196,65,12,92,209 // vsubps %ymm9,%ymm14,%ymm10
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,65,44,94,208 // vdivps %ymm8,%ymm10,%ymm10
+ .byte 196,65,52,88,210 // vaddps %ymm10,%ymm9,%ymm10
+ .byte 196,67,13,74,210,0 // vblendvps %ymm0,%ymm10,%ymm14,%ymm10
+ .byte 196,65,36,92,241 // vsubps %ymm9,%ymm11,%ymm14
+ .byte 196,65,20,89,238 // vmulps %ymm14,%ymm13,%ymm13
+ .byte 196,65,20,94,192 // vdivps %ymm8,%ymm13,%ymm8
+ .byte 196,65,52,88,192 // vaddps %ymm8,%ymm9,%ymm8
+ .byte 196,193,116,95,207 // vmaxps %ymm15,%ymm1,%ymm1
+ .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
+ .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
+ .byte 196,226,125,24,5,226,75,0,0 // vbroadcastss 0x4be2(%rip),%ymm0 # 5de8 <_sk_callback_avx+0x1bc>
+ .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
+ .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
+ .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
+ .byte 197,164,89,196 // vmulps %ymm4,%ymm11,%ymm0
+ .byte 197,252,88,194 // vaddps %ymm2,%ymm0,%ymm0
+ .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
+ .byte 197,172,89,76,36,200 // vmulps -0x38(%rsp),%ymm10,%ymm1
+ .byte 197,164,89,213 // vmulps %ymm5,%ymm11,%ymm2
+ .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
+ .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
+ .byte 197,172,89,84,36,136 // vmulps -0x78(%rsp),%ymm10,%ymm2
+ .byte 197,36,89,206 // vmulps %ymm6,%ymm11,%ymm9
+ .byte 197,180,88,210 // vaddps %ymm2,%ymm9,%ymm2
+ .byte 196,193,108,88,208 // vaddps %ymm8,%ymm2,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14506,84 +14648,97 @@ HIDDEN _sk_luminosity_avx
.globl _sk_luminosity_avx
FUNCTION(_sk_luminosity_avx)
_sk_luminosity_avx:
- .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,65,68,194,208,0 // vcmpeqps %ymm8,%ymm7,%ymm10
- .byte 196,98,125,24,13,62,75,0,0 // vbroadcastss 0x4b3e(%rip),%ymm9 # 5cc0 <_sk_callback_avx+0x1c0>
- .byte 197,52,94,223 // vdivps %ymm7,%ymm9,%ymm11
- .byte 196,67,37,74,208,160 // vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- .byte 197,44,89,220 // vmulps %ymm4,%ymm10,%ymm11
- .byte 197,44,89,229 // vmulps %ymm5,%ymm10,%ymm12
- .byte 197,44,89,214 // vmulps %ymm6,%ymm10,%ymm10
- .byte 196,98,125,24,45,35,75,0,0 // vbroadcastss 0x4b23(%rip),%ymm13 # 5cc4 <_sk_callback_avx+0x1c4>
- .byte 196,193,124,89,197 // vmulps %ymm13,%ymm0,%ymm0
- .byte 196,98,125,24,53,25,75,0,0 // vbroadcastss 0x4b19(%rip),%ymm14 # 5cc8 <_sk_callback_avx+0x1c8>
- .byte 196,193,116,89,206 // vmulps %ymm14,%ymm1,%ymm1
- .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,11,75,0,0 // vbroadcastss 0x4b0b(%rip),%ymm1 # 5ccc <_sk_callback_avx+0x1cc>
- .byte 197,236,89,209 // vmulps %ymm1,%ymm2,%ymm2
- .byte 197,252,88,194 // vaddps %ymm2,%ymm0,%ymm0
- .byte 196,193,36,89,213 // vmulps %ymm13,%ymm11,%ymm2
- .byte 196,65,28,89,254 // vmulps %ymm14,%ymm12,%ymm15
- .byte 196,193,108,88,215 // vaddps %ymm15,%ymm2,%ymm2
- .byte 197,44,89,249 // vmulps %ymm1,%ymm10,%ymm15
- .byte 197,132,88,210 // vaddps %ymm2,%ymm15,%ymm2
- .byte 197,252,92,194 // vsubps %ymm2,%ymm0,%ymm0
- .byte 197,164,88,208 // vaddps %ymm0,%ymm11,%ymm2
+ .byte 197,124,40,226 // vmovaps %ymm2,%ymm12
+ .byte 197,124,17,100,36,168 // vmovups %ymm12,-0x58(%rsp)
+ .byte 197,252,17,76,36,200 // vmovups %ymm1,-0x38(%rsp)
+ .byte 197,252,40,208 // vmovaps %ymm0,%ymm2
+ .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
+ .byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
+ .byte 196,98,125,24,45,116,75,0,0 // vbroadcastss 0x4b74(%rip),%ymm13 # 5dec <_sk_callback_avx+0x1c0>
+ .byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
+ .byte 196,98,125,24,53,106,75,0,0 // vbroadcastss 0x4b6a(%rip),%ymm14 # 5df0 <_sk_callback_avx+0x1c4>
+ .byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
+ .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
+ .byte 196,98,125,24,61,91,75,0,0 // vbroadcastss 0x4b5b(%rip),%ymm15 # 5df4 <_sk_callback_avx+0x1c8>
+ .byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
+ .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
+ .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
+ .byte 196,65,52,89,230 // vmulps %ymm14,%ymm9,%ymm12
+ .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
+ .byte 197,100,89,230 // vmulps %ymm6,%ymm3,%ymm12
+ .byte 196,65,28,89,215 // vmulps %ymm15,%ymm12,%ymm10
+ .byte 196,65,36,88,210 // vaddps %ymm10,%ymm11,%ymm10
+ .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
+ .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
+ .byte 197,60,88,192 // vaddps %ymm0,%ymm8,%ymm8
+ .byte 197,52,88,208 // vaddps %ymm0,%ymm9,%ymm10
.byte 197,28,88,216 // vaddps %ymm0,%ymm12,%ymm11
- .byte 197,172,88,192 // vaddps %ymm0,%ymm10,%ymm0
- .byte 197,36,93,208 // vminps %ymm0,%ymm11,%ymm10
- .byte 196,65,108,93,210 // vminps %ymm10,%ymm2,%ymm10
- .byte 197,36,95,224 // vmaxps %ymm0,%ymm11,%ymm12
- .byte 196,65,108,95,228 // vmaxps %ymm12,%ymm2,%ymm12
- .byte 196,65,108,89,237 // vmulps %ymm13,%ymm2,%ymm13
- .byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
- .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
- .byte 197,252,89,201 // vmulps %ymm1,%ymm0,%ymm1
- .byte 196,193,116,88,205 // vaddps %ymm13,%ymm1,%ymm1
- .byte 196,65,60,194,234,2 // vcmpleps %ymm10,%ymm8,%ymm13
- .byte 197,108,92,241 // vsubps %ymm1,%ymm2,%ymm14
- .byte 196,65,116,89,246 // vmulps %ymm14,%ymm1,%ymm14
- .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,65,12,94,242 // vdivps %ymm10,%ymm14,%ymm14
- .byte 196,65,116,88,246 // vaddps %ymm14,%ymm1,%ymm14
- .byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
- .byte 196,65,52,194,244,1 // vcmpltps %ymm12,%ymm9,%ymm14
- .byte 197,108,92,249 // vsubps %ymm1,%ymm2,%ymm15
- .byte 197,52,92,201 // vsubps %ymm1,%ymm9,%ymm9
- .byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 197,28,92,225 // vsubps %ymm1,%ymm12,%ymm12
- .byte 196,65,4,94,252 // vdivps %ymm12,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,195,109,74,215,224 // vblendvps %ymm14,%ymm15,%ymm2,%ymm2
- .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 197,36,92,249 // vsubps %ymm1,%ymm11,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 196,65,4,94,250 // vdivps %ymm10,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,5,74,219,208 // vblendvps %ymm13,%ymm11,%ymm15,%ymm11
- .byte 197,36,92,249 // vsubps %ymm1,%ymm11,%ymm15
+ .byte 196,193,44,93,195 // vminps %ymm11,%ymm10,%ymm0
+ .byte 197,60,93,224 // vminps %ymm0,%ymm8,%ymm12
+ .byte 196,193,60,89,197 // vmulps %ymm13,%ymm8,%ymm0
+ .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
+ .byte 196,193,124,88,193 // vaddps %ymm9,%ymm0,%ymm0
+ .byte 196,65,36,89,207 // vmulps %ymm15,%ymm11,%ymm9
+ .byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
+ .byte 196,193,60,92,193 // vsubps %ymm9,%ymm8,%ymm0
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 196,65,52,92,236 // vsubps %ymm12,%ymm9,%ymm13
+ .byte 196,193,124,94,197 // vdivps %ymm13,%ymm0,%ymm0
+ .byte 196,65,44,92,241 // vsubps %ymm9,%ymm10,%ymm14
+ .byte 196,65,52,89,246 // vmulps %ymm14,%ymm9,%ymm14
+ .byte 196,65,12,94,245 // vdivps %ymm13,%ymm14,%ymm14
+ .byte 196,65,36,92,249 // vsubps %ymm9,%ymm11,%ymm15
.byte 196,65,52,89,255 // vmulps %ymm15,%ymm9,%ymm15
- .byte 196,65,4,94,252 // vdivps %ymm12,%ymm15,%ymm15
- .byte 196,65,116,88,255 // vaddps %ymm15,%ymm1,%ymm15
- .byte 196,67,37,74,223,224 // vblendvps %ymm14,%ymm15,%ymm11,%ymm11
- .byte 196,65,36,95,216 // vmaxps %ymm8,%ymm11,%ymm11
- .byte 197,124,92,249 // vsubps %ymm1,%ymm0,%ymm15
- .byte 196,65,116,89,255 // vmulps %ymm15,%ymm1,%ymm15
- .byte 196,65,4,94,210 // vdivps %ymm10,%ymm15,%ymm10
- .byte 196,65,116,88,210 // vaddps %ymm10,%ymm1,%ymm10
- .byte 196,227,45,74,192,208 // vblendvps %ymm13,%ymm0,%ymm10,%ymm0
- .byte 197,124,92,209 // vsubps %ymm1,%ymm0,%ymm10
- .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,65,52,94,204 // vdivps %ymm12,%ymm9,%ymm9
+ .byte 196,65,4,94,237 // vdivps %ymm13,%ymm15,%ymm13
+ .byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
+ .byte 196,65,4,194,228,2 // vcmpleps %ymm12,%ymm15,%ymm12
+ .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
+ .byte 196,67,13,74,242,192 // vblendvps %ymm12,%ymm10,%ymm14,%ymm14
+ .byte 196,65,44,95,211 // vmaxps %ymm11,%ymm10,%ymm10
+ .byte 196,65,52,88,237 // vaddps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,219,192 // vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
+ .byte 196,195,125,74,200,192 // vblendvps %ymm12,%ymm8,%ymm0,%ymm1
+ .byte 197,100,89,231 // vmulps %ymm7,%ymm3,%ymm12
+ .byte 196,65,60,95,194 // vmaxps %ymm10,%ymm8,%ymm8
+ .byte 196,65,116,92,209 // vsubps %ymm9,%ymm1,%ymm10
+ .byte 196,65,28,92,233 // vsubps %ymm9,%ymm12,%ymm13
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,193,28,194,192,1 // vcmpltps %ymm8,%ymm12,%ymm0
+ .byte 196,65,60,92,193 // vsubps %ymm9,%ymm8,%ymm8
+ .byte 196,65,44,94,208 // vdivps %ymm8,%ymm10,%ymm10
+ .byte 196,65,52,88,210 // vaddps %ymm10,%ymm9,%ymm10
+ .byte 196,195,117,74,202,0 // vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ .byte 196,65,12,92,209 // vsubps %ymm9,%ymm14,%ymm10
+ .byte 196,65,20,89,210 // vmulps %ymm10,%ymm13,%ymm10
+ .byte 196,65,44,94,208 // vdivps %ymm8,%ymm10,%ymm10
+ .byte 196,65,52,88,210 // vaddps %ymm10,%ymm9,%ymm10
+ .byte 196,67,13,74,210,0 // vblendvps %ymm0,%ymm10,%ymm14,%ymm10
+ .byte 196,65,36,92,241 // vsubps %ymm9,%ymm11,%ymm14
+ .byte 196,65,20,89,238 // vmulps %ymm14,%ymm13,%ymm13
+ .byte 196,65,20,94,192 // vdivps %ymm8,%ymm13,%ymm8
+ .byte 196,65,52,88,192 // vaddps %ymm8,%ymm9,%ymm8
+ .byte 196,193,116,95,207 // vmaxps %ymm15,%ymm1,%ymm1
+ .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
+ .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
+ .byte 196,226,125,24,5,34,74,0,0 // vbroadcastss 0x4a22(%rip),%ymm0 # 5df8 <_sk_callback_avx+0x1cc>
+ .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
+ .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
+ .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
+ .byte 197,164,89,196 // vmulps %ymm4,%ymm11,%ymm0
+ .byte 197,252,88,194 // vaddps %ymm2,%ymm0,%ymm0
+ .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
+ .byte 197,172,89,76,36,200 // vmulps -0x38(%rsp),%ymm10,%ymm1
+ .byte 197,164,89,213 // vmulps %ymm5,%ymm11,%ymm2
+ .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
- .byte 196,227,125,74,193,224 // vblendvps %ymm14,%ymm1,%ymm0,%ymm0
- .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8
- .byte 197,228,88,199 // vaddps %ymm7,%ymm3,%ymm0
- .byte 197,228,89,207 // vmulps %ymm7,%ymm3,%ymm1
- .byte 197,252,92,217 // vsubps %ymm1,%ymm0,%ymm3
- .byte 197,228,89,194 // vmulps %ymm2,%ymm3,%ymm0
- .byte 196,193,100,89,203 // vmulps %ymm11,%ymm3,%ymm1
- .byte 196,193,100,89,208 // vmulps %ymm8,%ymm3,%ymm2
+ .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
+ .byte 197,36,89,206 // vmulps %ymm6,%ymm11,%ymm9
+ .byte 197,180,88,210 // vaddps %ymm2,%ymm9,%ymm2
+ .byte 196,193,108,88,208 // vaddps %ymm8,%ymm2,%ymm2
+ .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,92,220 // vsubps %ymm12,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14603,7 +14758,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,180,73,0,0 // vbroadcastss 0x49b4(%rip),%ymm8 # 5cd0 <_sk_callback_avx+0x1d0>
+ .byte 196,98,125,24,5,181,73,0,0 // vbroadcastss 0x49b5(%rip),%ymm8 # 5dfc <_sk_callback_avx+0x1d0>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -14615,7 +14770,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,151,73,0,0 // vbroadcastss 0x4997(%rip),%ymm8 # 5cd4 <_sk_callback_avx+0x1d4>
+ .byte 196,98,125,24,5,152,73,0,0 // vbroadcastss 0x4998(%rip),%ymm8 # 5e00 <_sk_callback_avx+0x1d4>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -14701,7 +14856,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,223,72,0,0 // vbroadcastss 0x48df(%rip),%ymm10 # 5cd8 <_sk_callback_avx+0x1d8>
+ .byte 196,98,125,24,21,224,72,0,0 // vbroadcastss 0x48e0(%rip),%ymm10 # 5e04 <_sk_callback_avx+0x1d8>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -14714,17 +14869,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,192,72,0,0 // vbroadcastss 0x48c0(%rip),%ymm8 # 5cdc <_sk_callback_avx+0x1dc>
+ .byte 196,98,125,24,5,193,72,0,0 // vbroadcastss 0x48c1(%rip),%ymm8 # 5e08 <_sk_callback_avx+0x1dc>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,178,72,0,0 // vbroadcastss 0x48b2(%rip),%ymm11 # 5ce0 <_sk_callback_avx+0x1e0>
+ .byte 196,98,125,24,29,179,72,0,0 // vbroadcastss 0x48b3(%rip),%ymm11 # 5e0c <_sk_callback_avx+0x1e0>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,168,72,0,0 // vbroadcastss 0x48a8(%rip),%ymm13 # 5ce4 <_sk_callback_avx+0x1e4>
+ .byte 196,98,125,24,45,169,72,0,0 // vbroadcastss 0x48a9(%rip),%ymm13 # 5e10 <_sk_callback_avx+0x1e4>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,153,72,0,0 // vbroadcastss 0x4899(%rip),%ymm12 # 5ce8 <_sk_callback_avx+0x1e8>
+ .byte 196,98,125,24,37,154,72,0,0 // vbroadcastss 0x489a(%rip),%ymm12 # 5e14 <_sk_callback_avx+0x1e8>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,143,72,0,0 // vbroadcastss 0x488f(%rip),%ymm14 # 5cec <_sk_callback_avx+0x1ec>
+ .byte 196,98,125,24,53,144,72,0,0 // vbroadcastss 0x4890(%rip),%ymm14 # 5e18 <_sk_callback_avx+0x1ec>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -14753,18 +14908,18 @@ _sk_to_srgb_avx:
.byte 197,124,82,192 // vrsqrtps %ymm0,%ymm8
.byte 196,65,124,83,200 // vrcpps %ymm8,%ymm9
.byte 196,65,124,82,208 // vrsqrtps %ymm8,%ymm10
- .byte 196,98,125,24,5,26,72,0,0 // vbroadcastss 0x481a(%rip),%ymm8 # 5cf0 <_sk_callback_avx+0x1f0>
+ .byte 196,98,125,24,5,27,72,0,0 // vbroadcastss 0x481b(%rip),%ymm8 # 5e1c <_sk_callback_avx+0x1f0>
.byte 196,65,124,89,216 // vmulps %ymm8,%ymm0,%ymm11
- .byte 196,98,125,24,37,16,72,0,0 // vbroadcastss 0x4810(%rip),%ymm12 # 5cf4 <_sk_callback_avx+0x1f4>
+ .byte 196,98,125,24,37,17,72,0,0 // vbroadcastss 0x4811(%rip),%ymm12 # 5e20 <_sk_callback_avx+0x1f4>
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,45,6,72,0,0 // vbroadcastss 0x4806(%rip),%ymm13 # 5cf8 <_sk_callback_avx+0x1f8>
+ .byte 196,98,125,24,45,7,72,0,0 // vbroadcastss 0x4807(%rip),%ymm13 # 5e24 <_sk_callback_avx+0x1f8>
.byte 196,65,52,88,205 // vaddps %ymm13,%ymm9,%ymm9
- .byte 196,98,125,24,53,252,71,0,0 // vbroadcastss 0x47fc(%rip),%ymm14 # 5cfc <_sk_callback_avx+0x1fc>
+ .byte 196,98,125,24,53,253,71,0,0 // vbroadcastss 0x47fd(%rip),%ymm14 # 5e28 <_sk_callback_avx+0x1fc>
.byte 196,65,44,89,214 // vmulps %ymm14,%ymm10,%ymm10
.byte 196,65,44,88,201 // vaddps %ymm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,237,71,0,0 // vbroadcastss 0x47ed(%rip),%ymm10 # 5d00 <_sk_callback_avx+0x200>
+ .byte 196,98,125,24,21,238,71,0,0 // vbroadcastss 0x47ee(%rip),%ymm10 # 5e2c <_sk_callback_avx+0x200>
.byte 196,65,44,93,201 // vminps %ymm9,%ymm10,%ymm9
- .byte 196,98,125,24,61,227,71,0,0 // vbroadcastss 0x47e3(%rip),%ymm15 # 5d04 <_sk_callback_avx+0x204>
+ .byte 196,98,125,24,61,228,71,0,0 // vbroadcastss 0x47e4(%rip),%ymm15 # 5e30 <_sk_callback_avx+0x204>
.byte 196,193,124,194,199,1 // vcmpltps %ymm15,%ymm0,%ymm0
.byte 196,195,53,74,195,0 // vblendvps %ymm0,%ymm11,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -14801,7 +14956,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,73,71,0,0 // vbroadcastss 0x4749(%rip),%ymm11 # 5d08 <_sk_callback_avx+0x208>
+ .byte 196,98,125,24,29,74,71,0,0 // vbroadcastss 0x474a(%rip),%ymm11 # 5e34 <_sk_callback_avx+0x208>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -14811,19 +14966,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,34,71,0,0 // vbroadcastss 0x4722(%rip),%ymm11 # 5d14 <_sk_callback_avx+0x214>
+ .byte 196,98,125,24,29,35,71,0,0 // vbroadcastss 0x4723(%rip),%ymm11 # 5e40 <_sk_callback_avx+0x214>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,16,71,0,0 // vbroadcastss 0x4710(%rip),%ymm11 # 5d10 <_sk_callback_avx+0x210>
+ .byte 196,98,125,24,29,17,71,0,0 // vbroadcastss 0x4711(%rip),%ymm11 # 5e3c <_sk_callback_avx+0x210>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,248,70,0,0 // vbroadcastss 0x46f8(%rip),%ymm2 # 5d0c <_sk_callback_avx+0x20c>
+ .byte 196,226,125,24,21,249,70,0,0 // vbroadcastss 0x46f9(%rip),%ymm2 # 5e38 <_sk_callback_avx+0x20c>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,223,70,0,0 // vbroadcastss 0x46df(%rip),%ymm12 # 5d1c <_sk_callback_avx+0x21c>
+ .byte 196,98,125,24,37,224,70,0,0 // vbroadcastss 0x46e0(%rip),%ymm12 # 5e48 <_sk_callback_avx+0x21c>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -14833,7 +14988,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,162,70,0,0 // vbroadcastss 0x46a2(%rip),%ymm8 # 5d18 <_sk_callback_avx+0x218>
+ .byte 196,98,125,24,5,163,70,0,0 // vbroadcastss 0x46a3(%rip),%ymm8 # 5e44 <_sk_callback_avx+0x218>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14850,7 +15005,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,111,70,0,0 // vbroadcastss 0x466f(%rip),%ymm8 # 5d20 <_sk_callback_avx+0x220>
+ .byte 196,98,125,24,5,112,70,0,0 // vbroadcastss 0x4670(%rip),%ymm8 # 5e4c <_sk_callback_avx+0x220>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -14858,23 +15013,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,73,70,0,0 // vbroadcastss 0x4649(%rip),%ymm11 # 5d24 <_sk_callback_avx+0x224>
+ .byte 196,98,125,24,29,74,70,0,0 // vbroadcastss 0x464a(%rip),%ymm11 # 5e50 <_sk_callback_avx+0x224>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,51,70,0,0 // vbroadcastss 0x4633(%rip),%ymm12 # 5d2c <_sk_callback_avx+0x22c>
+ .byte 196,98,125,24,37,52,70,0,0 // vbroadcastss 0x4634(%rip),%ymm12 # 5e58 <_sk_callback_avx+0x22c>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,41,70,0,0 // vbroadcastss 0x4629(%rip),%ymm13 # 5d30 <_sk_callback_avx+0x230>
+ .byte 196,98,125,24,45,42,70,0,0 // vbroadcastss 0x462a(%rip),%ymm13 # 5e5c <_sk_callback_avx+0x230>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,10,70,0,0 // vbroadcastss 0x460a(%rip),%ymm1 # 5d28 <_sk_callback_avx+0x228>
+ .byte 196,226,125,24,13,11,70,0,0 // vbroadcastss 0x460b(%rip),%ymm1 # 5e54 <_sk_callback_avx+0x228>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,245,69,0,0 // vbroadcastss 0x45f5(%rip),%ymm14 # 5d34 <_sk_callback_avx+0x234>
+ .byte 196,98,125,24,53,246,69,0,0 // vbroadcastss 0x45f6(%rip),%ymm14 # 5e60 <_sk_callback_avx+0x234>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -14893,7 +15048,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,151,69,0,0 // vbroadcastss 0x4597(%rip),%ymm0 # 5d38 <_sk_callback_avx+0x238>
+ .byte 196,226,125,24,5,152,69,0,0 // vbroadcastss 0x4598(%rip),%ymm0 # 5e64 <_sk_callback_avx+0x238>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -14945,14 +15100,14 @@ _sk_scale_u8_avx:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,68 // jne 1898 <_sk_scale_u8_avx+0x54>
+ .byte 117,68 // jne 19c3 <_sk_scale_u8_avx+0x54>
.byte 197,122,126,0 // vmovq (%rax),%xmm8
.byte 196,66,121,49,200 // vpmovzxbd %xmm8,%xmm9
.byte 196,67,121,4,192,229 // vpermilps $0xe5,%xmm8,%xmm8
.byte 196,66,121,49,192 // vpmovzxbd %xmm8,%xmm8
.byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,192,68,0,0 // vbroadcastss 0x44c0(%rip),%ymm9 # 5d3c <_sk_callback_avx+0x23c>
+ .byte 196,98,125,24,13,193,68,0,0 // vbroadcastss 0x44c1(%rip),%ymm9 # 5e68 <_sk_callback_avx+0x23c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -14970,9 +15125,9 @@ _sk_scale_u8_avx:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 18a0 <_sk_scale_u8_avx+0x5c>
+ .byte 117,234 // jne 19cb <_sk_scale_u8_avx+0x5c>
.byte 196,65,249,110,193 // vmovq %r9,%xmm8
- .byte 235,155 // jmp 1858 <_sk_scale_u8_avx+0x14>
+ .byte 235,155 // jmp 1983 <_sk_scale_u8_avx+0x14>
HIDDEN _sk_lerp_1_float_avx
.globl _sk_lerp_1_float_avx
@@ -15004,14 +15159,14 @@ _sk_lerp_u8_avx:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,104 // jne 1974 <_sk_lerp_u8_avx+0x78>
+ .byte 117,104 // jne 1a9f <_sk_lerp_u8_avx+0x78>
.byte 197,122,126,0 // vmovq (%rax),%xmm8
.byte 196,66,121,49,200 // vpmovzxbd %xmm8,%xmm9
.byte 196,67,121,4,192,229 // vpermilps $0xe5,%xmm8,%xmm8
.byte 196,66,121,49,192 // vpmovzxbd %xmm8,%xmm8
.byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,12,68,0,0 // vbroadcastss 0x440c(%rip),%ymm9 # 5d40 <_sk_callback_avx+0x240>
+ .byte 196,98,125,24,13,13,68,0,0 // vbroadcastss 0x440d(%rip),%ymm9 # 5e6c <_sk_callback_avx+0x240>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -15037,9 +15192,9 @@ _sk_lerp_u8_avx:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 197c <_sk_lerp_u8_avx+0x80>
+ .byte 117,234 // jne 1aa7 <_sk_lerp_u8_avx+0x80>
.byte 196,65,249,110,193 // vmovq %r9,%xmm8
- .byte 233,116,255,255,255 // jmpq 1910 <_sk_lerp_u8_avx+0x14>
+ .byte 233,116,255,255,255 // jmpq 1a3b <_sk_lerp_u8_avx+0x14>
HIDDEN _sk_lerp_565_avx
.globl _sk_lerp_565_avx
@@ -15048,26 +15203,26 @@ _sk_lerp_565_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,208,0,0,0 // jne 1a7a <_sk_lerp_565_avx+0xde>
+ .byte 15,133,208,0,0,0 // jne 1ba5 <_sk_lerp_565_avx+0xde>
.byte 196,65,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,118,67,0,0 // vbroadcastss 0x4376(%rip),%ymm9 # 5d44 <_sk_callback_avx+0x244>
+ .byte 196,98,125,24,13,119,67,0,0 // vbroadcastss 0x4377(%rip),%ymm9 # 5e70 <_sk_callback_avx+0x244>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,103,67,0,0 // vbroadcastss 0x4367(%rip),%ymm10 # 5d48 <_sk_callback_avx+0x248>
+ .byte 196,98,125,24,21,104,67,0,0 // vbroadcastss 0x4368(%rip),%ymm10 # 5e74 <_sk_callback_avx+0x248>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,93,67,0,0 // vbroadcastss 0x435d(%rip),%ymm10 # 5d4c <_sk_callback_avx+0x24c>
+ .byte 196,98,125,24,21,94,67,0,0 // vbroadcastss 0x435e(%rip),%ymm10 # 5e78 <_sk_callback_avx+0x24c>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,78,67,0,0 // vbroadcastss 0x434e(%rip),%ymm11 # 5d50 <_sk_callback_avx+0x250>
+ .byte 196,98,125,24,29,79,67,0,0 // vbroadcastss 0x434f(%rip),%ymm11 # 5e7c <_sk_callback_avx+0x250>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,68,67,0,0 // vbroadcastss 0x4344(%rip),%ymm11 # 5d54 <_sk_callback_avx+0x254>
+ .byte 196,98,125,24,29,69,67,0,0 // vbroadcastss 0x4345(%rip),%ymm11 # 5e80 <_sk_callback_avx+0x254>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,53,67,0,0 // vbroadcastss 0x4335(%rip),%ymm11 # 5d58 <_sk_callback_avx+0x258>
+ .byte 196,98,125,24,29,54,67,0,0 // vbroadcastss 0x4336(%rip),%ymm11 # 5e84 <_sk_callback_avx+0x258>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
@@ -15094,9 +15249,9 @@ _sk_lerp_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 15,135,29,255,255,255 // ja 19b0 <_sk_lerp_565_avx+0x14>
+ .byte 15,135,29,255,255,255 // ja 1adb <_sk_lerp_565_avx+0x14>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,74,0,0,0 // lea 0x4a(%rip),%r9 # 1ae8 <_sk_lerp_565_avx+0x14c>
+ .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 1c14 <_sk_lerp_565_avx+0x14d>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -15108,28 +15263,27 @@ _sk_lerp_565_avx:
.byte 196,65,57,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm8,%xmm8
.byte 196,65,57,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm8,%xmm8
.byte 196,65,57,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm8,%xmm8
- .byte 233,200,254,255,255 // jmpq 19b0 <_sk_lerp_565_avx+0x14>
- .byte 244 // hlt
- .byte 255 // (bad)
- .byte 255 // (bad)
+ .byte 233,200,254,255,255 // jmpq 1adb <_sk_lerp_565_avx+0x14>
+ .byte 144 // nop
+ .byte 243,255 // repz (bad)
.byte 255 // (bad)
- .byte 236 // in (%dx),%al
.byte 255 // (bad)
+ .byte 235,255 // jmp 1c19 <_sk_lerp_565_avx+0x152>
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
+ .byte 255,227 // jmpq *%rbx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 220,255 // fdivr %st,%st(7)
+ .byte 219,255 // (bad)
.byte 255 // (bad)
- .byte 255,212 // callq *%rsp
+ .byte 255,211 // callq *%rbx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,204 // dec %esp
+ .byte 255,203 // dec %ebx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 191 // .byte 0xbf
+ .byte 190 // .byte 0xbe
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -15141,7 +15295,7 @@ _sk_load_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,26,2,0,0 // jne 1d2c <_sk_load_tables_avx+0x228>
+ .byte 15,133,26,2,0,0 // jne 1e58 <_sk_load_tables_avx+0x228>
.byte 196,65,124,16,4,184 // vmovups (%r8,%rdi,4),%ymm8
.byte 85 // push %rbp
.byte 65,87 // push %r15
@@ -15149,7 +15303,7 @@ _sk_load_tables_avx:
.byte 65,85 // push %r13
.byte 65,84 // push %r12
.byte 83 // push %rbx
- .byte 197,124,40,13,22,69,0,0 // vmovaps 0x4516(%rip),%ymm9 # 6040 <_sk_callback_avx+0x540>
+ .byte 197,124,40,13,10,69,0,0 // vmovaps 0x450a(%rip),%ymm9 # 6160 <_sk_callback_avx+0x534>
.byte 196,193,60,84,193 // vandps %ymm9,%ymm8,%ymm0
.byte 196,193,249,126,193 // vmovq %xmm0,%r9
.byte 69,137,203 // mov %r9d,%r11d
@@ -15241,7 +15395,7 @@ _sk_load_tables_avx:
.byte 196,193,97,114,210,24 // vpsrld $0x18,%xmm10,%xmm3
.byte 196,227,61,24,219,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,67,64,0,0 // vbroadcastss 0x4043(%rip),%ymm8 # 5d5c <_sk_callback_avx+0x25c>
+ .byte 196,98,125,24,5,67,64,0,0 // vbroadcastss 0x4043(%rip),%ymm8 # 5e88 <_sk_callback_avx+0x25c>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -15256,9 +15410,9 @@ _sk_load_tables_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,211,253,255,255 // ja 1b18 <_sk_load_tables_avx+0x14>
+ .byte 15,135,211,253,255,255 // ja 1c44 <_sk_load_tables_avx+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,140,0,0,0 // lea 0x8c(%rip),%r10 # 1ddc <_sk_load_tables_avx+0x2d8>
+ .byte 76,141,21,140,0,0,0 // lea 0x8c(%rip),%r10 # 1f08 <_sk_load_tables_avx+0x2d8>
.byte 79,99,12,138 // movslq (%r10,%r9,4),%r9
.byte 77,1,209 // add %r10,%r9
.byte 65,255,225 // jmpq *%r9
@@ -15281,7 +15435,7 @@ _sk_load_tables_avx:
.byte 196,99,61,12,192,15 // vblendps $0xf,%ymm0,%ymm8,%ymm8
.byte 196,195,57,34,4,184,0 // vpinsrd $0x0,(%r8,%rdi,4),%xmm8,%xmm0
.byte 196,99,61,12,192,15 // vblendps $0xf,%ymm0,%ymm8,%ymm8
- .byte 233,62,253,255,255 // jmpq 1b18 <_sk_load_tables_avx+0x14>
+ .byte 233,62,253,255,255 // jmpq 1c44 <_sk_load_tables_avx+0x14>
.byte 102,144 // xchg %ax,%ax
.byte 236 // in (%dx),%al
.byte 255 // (bad)
@@ -15299,7 +15453,7 @@ _sk_load_tables_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 1df5 <_sk_load_tables_avx+0x2f1>
+ .byte 126,255 // jle 1f21 <_sk_load_tables_avx+0x2f1>
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -15311,7 +15465,7 @@ _sk_load_tables_u16_be_avx:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,113,2,0,0 // jne 207f <_sk_load_tables_u16_be_avx+0x287>
+ .byte 15,133,113,2,0,0 // jne 21ab <_sk_load_tables_u16_be_avx+0x287>
.byte 196,1,121,16,4,72 // vmovupd (%r8,%r9,2),%xmm8
.byte 196,129,121,16,84,72,16 // vmovupd 0x10(%r8,%r9,2),%xmm2
.byte 196,129,121,16,92,72,32 // vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -15333,7 +15487,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,177,108,208 // vpunpcklqdq %xmm0,%xmm9,%xmm2
.byte 197,177,109,200 // vpunpckhqdq %xmm0,%xmm9,%xmm1
.byte 196,65,57,108,212 // vpunpcklqdq %xmm12,%xmm8,%xmm10
- .byte 197,121,111,29,86,66,0,0 // vmovdqa 0x4256(%rip),%xmm11 # 60c0 <_sk_callback_avx+0x5c0>
+ .byte 197,121,111,29,74,66,0,0 // vmovdqa 0x424a(%rip),%xmm11 # 61e0 <_sk_callback_avx+0x5b4>
.byte 196,193,105,219,195 // vpand %xmm11,%xmm2,%xmm0
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,121,105,209 // vpunpckhwd %xmm9,%xmm0,%xmm2
@@ -15432,7 +15586,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,195,101,24,216,1 // vinsertf128 $0x1,%xmm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,244,60,0,0 // vbroadcastss 0x3cf4(%rip),%ymm8 # 5d60 <_sk_callback_avx+0x260>
+ .byte 196,98,125,24,5,244,60,0,0 // vbroadcastss 0x3cf4(%rip),%ymm8 # 5e8c <_sk_callback_avx+0x260>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -15445,29 +15599,29 @@ _sk_load_tables_u16_be_avx:
.byte 196,1,123,16,4,72 // vmovsd (%r8,%r9,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,85 // je 20e5 <_sk_load_tables_u16_be_avx+0x2ed>
+ .byte 116,85 // je 2211 <_sk_load_tables_u16_be_avx+0x2ed>
.byte 196,1,57,22,68,72,8 // vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,72 // jb 20e5 <_sk_load_tables_u16_be_avx+0x2ed>
+ .byte 114,72 // jb 2211 <_sk_load_tables_u16_be_avx+0x2ed>
.byte 196,129,123,16,84,72,16 // vmovsd 0x10(%r8,%r9,2),%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 116,72 // je 20f2 <_sk_load_tables_u16_be_avx+0x2fa>
+ .byte 116,72 // je 221e <_sk_load_tables_u16_be_avx+0x2fa>
.byte 196,129,105,22,84,72,24 // vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,59 // jb 20f2 <_sk_load_tables_u16_be_avx+0x2fa>
+ .byte 114,59 // jb 221e <_sk_load_tables_u16_be_avx+0x2fa>
.byte 196,129,123,16,92,72,32 // vmovsd 0x20(%r8,%r9,2),%xmm3
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 15,132,97,253,255,255 // je 1e29 <_sk_load_tables_u16_be_avx+0x31>
+ .byte 15,132,97,253,255,255 // je 1f55 <_sk_load_tables_u16_be_avx+0x31>
.byte 196,129,97,22,92,72,40 // vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 15,130,80,253,255,255 // jb 1e29 <_sk_load_tables_u16_be_avx+0x31>
+ .byte 15,130,80,253,255,255 // jb 1f55 <_sk_load_tables_u16_be_avx+0x31>
.byte 196,1,122,126,76,72,48 // vmovq 0x30(%r8,%r9,2),%xmm9
- .byte 233,68,253,255,255 // jmpq 1e29 <_sk_load_tables_u16_be_avx+0x31>
+ .byte 233,68,253,255,255 // jmpq 1f55 <_sk_load_tables_u16_be_avx+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,55,253,255,255 // jmpq 1e29 <_sk_load_tables_u16_be_avx+0x31>
+ .byte 233,55,253,255,255 // jmpq 1f55 <_sk_load_tables_u16_be_avx+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,46,253,255,255 // jmpq 1e29 <_sk_load_tables_u16_be_avx+0x31>
+ .byte 233,46,253,255,255 // jmpq 1f55 <_sk_load_tables_u16_be_avx+0x31>
HIDDEN _sk_load_tables_rgb_u16_be_avx
.globl _sk_load_tables_rgb_u16_be_avx
@@ -15477,7 +15631,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,127 // lea (%rdi,%rdi,2),%r9
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,93,2,0,0 // jne 236a <_sk_load_tables_rgb_u16_be_avx+0x26f>
+ .byte 15,133,93,2,0,0 // jne 2496 <_sk_load_tables_rgb_u16_be_avx+0x26f>
.byte 196,129,122,111,4,72 // vmovdqu (%r8,%r9,2),%xmm0
.byte 196,129,122,111,84,72,12 // vmovdqu 0xc(%r8,%r9,2),%xmm2
.byte 196,129,122,111,76,72,24 // vmovdqu 0x18(%r8,%r9,2),%xmm1
@@ -15504,7 +15658,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,202 // vpunpcklqdq %xmm2,%xmm8,%xmm1
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,195 // vpunpcklqdq %xmm3,%xmm0,%xmm8
- .byte 197,121,111,13,79,63,0,0 // vmovdqa 0x3f4f(%rip),%xmm9 # 60d0 <_sk_callback_avx+0x5d0>
+ .byte 197,121,111,13,67,63,0,0 // vmovdqa 0x3f43(%rip),%xmm9 # 61f0 <_sk_callback_avx+0x5c4>
.byte 196,193,113,219,193 // vpand %xmm9,%xmm1,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -15596,7 +15750,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
.byte 196,195,109,24,208,1 // vinsertf128 $0x1,%xmm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,6,58,0,0 // vbroadcastss 0x3a06(%rip),%ymm3 # 5d64 <_sk_callback_avx+0x264>
+ .byte 196,226,125,24,29,6,58,0,0 // vbroadcastss 0x3a06(%rip),%ymm3 # 5e90 <_sk_callback_avx+0x264>
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
.byte 65,93 // pop %r13
@@ -15607,36 +15761,36 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,129,121,110,4,72 // vmovd (%r8,%r9,2),%xmm0
.byte 196,129,121,196,68,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm0
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 117,5 // jne 2383 <_sk_load_tables_rgb_u16_be_avx+0x288>
- .byte 233,190,253,255,255 // jmpq 2141 <_sk_load_tables_rgb_u16_be_avx+0x46>
+ .byte 117,5 // jne 24af <_sk_load_tables_rgb_u16_be_avx+0x288>
+ .byte 233,190,253,255,255 // jmpq 226d <_sk_load_tables_rgb_u16_be_avx+0x46>
.byte 196,129,121,110,76,72,6 // vmovd 0x6(%r8,%r9,2),%xmm1
.byte 196,1,113,196,68,72,10,2 // vpinsrw $0x2,0xa(%r8,%r9,2),%xmm1,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,26 // jb 23b2 <_sk_load_tables_rgb_u16_be_avx+0x2b7>
+ .byte 114,26 // jb 24de <_sk_load_tables_rgb_u16_be_avx+0x2b7>
.byte 196,129,121,110,76,72,12 // vmovd 0xc(%r8,%r9,2),%xmm1
.byte 196,129,113,196,84,72,16,2 // vpinsrw $0x2,0x10(%r8,%r9,2),%xmm1,%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 117,10 // jne 23b7 <_sk_load_tables_rgb_u16_be_avx+0x2bc>
- .byte 233,143,253,255,255 // jmpq 2141 <_sk_load_tables_rgb_u16_be_avx+0x46>
- .byte 233,138,253,255,255 // jmpq 2141 <_sk_load_tables_rgb_u16_be_avx+0x46>
+ .byte 117,10 // jne 24e3 <_sk_load_tables_rgb_u16_be_avx+0x2bc>
+ .byte 233,143,253,255,255 // jmpq 226d <_sk_load_tables_rgb_u16_be_avx+0x46>
+ .byte 233,138,253,255,255 // jmpq 226d <_sk_load_tables_rgb_u16_be_avx+0x46>
.byte 196,129,121,110,76,72,18 // vmovd 0x12(%r8,%r9,2),%xmm1
.byte 196,1,113,196,76,72,22,2 // vpinsrw $0x2,0x16(%r8,%r9,2),%xmm1,%xmm9
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,26 // jb 23e6 <_sk_load_tables_rgb_u16_be_avx+0x2eb>
+ .byte 114,26 // jb 2512 <_sk_load_tables_rgb_u16_be_avx+0x2eb>
.byte 196,129,121,110,76,72,24 // vmovd 0x18(%r8,%r9,2),%xmm1
.byte 196,129,113,196,76,72,28,2 // vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm1,%xmm1
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 117,10 // jne 23eb <_sk_load_tables_rgb_u16_be_avx+0x2f0>
- .byte 233,91,253,255,255 // jmpq 2141 <_sk_load_tables_rgb_u16_be_avx+0x46>
- .byte 233,86,253,255,255 // jmpq 2141 <_sk_load_tables_rgb_u16_be_avx+0x46>
+ .byte 117,10 // jne 2517 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
+ .byte 233,91,253,255,255 // jmpq 226d <_sk_load_tables_rgb_u16_be_avx+0x46>
+ .byte 233,86,253,255,255 // jmpq 226d <_sk_load_tables_rgb_u16_be_avx+0x46>
.byte 196,129,121,110,92,72,30 // vmovd 0x1e(%r8,%r9,2),%xmm3
.byte 196,1,97,196,92,72,34,2 // vpinsrw $0x2,0x22(%r8,%r9,2),%xmm3,%xmm11
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,20 // jb 2414 <_sk_load_tables_rgb_u16_be_avx+0x319>
+ .byte 114,20 // jb 2540 <_sk_load_tables_rgb_u16_be_avx+0x319>
.byte 196,129,121,110,92,72,36 // vmovd 0x24(%r8,%r9,2),%xmm3
.byte 196,129,97,196,92,72,40,2 // vpinsrw $0x2,0x28(%r8,%r9,2),%xmm3,%xmm3
- .byte 233,45,253,255,255 // jmpq 2141 <_sk_load_tables_rgb_u16_be_avx+0x46>
- .byte 233,40,253,255,255 // jmpq 2141 <_sk_load_tables_rgb_u16_be_avx+0x46>
+ .byte 233,45,253,255,255 // jmpq 226d <_sk_load_tables_rgb_u16_be_avx+0x46>
+ .byte 233,40,253,255,255 // jmpq 226d <_sk_load_tables_rgb_u16_be_avx+0x46>
HIDDEN _sk_byte_tables_avx
.globl _sk_byte_tables_avx
@@ -15649,7 +15803,7 @@ _sk_byte_tables_avx:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,58,57,0,0 // vbroadcastss 0x393a(%rip),%ymm8 # 5d68 <_sk_callback_avx+0x268>
+ .byte 196,98,125,24,5,58,57,0,0 // vbroadcastss 0x393a(%rip),%ymm8 # 5e94 <_sk_callback_avx+0x268>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,195,249,22,192,1 // vpextrq $0x1,%xmm0,%r8
@@ -15686,7 +15840,7 @@ _sk_byte_tables_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,53,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,136,56,0,0 // vbroadcastss 0x3888(%rip),%ymm9 # 5d6c <_sk_callback_avx+0x26c>
+ .byte 196,98,125,24,13,136,56,0,0 // vbroadcastss 0x3888(%rip),%ymm9 # 5e98 <_sk_callback_avx+0x26c>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
@@ -15848,7 +16002,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,53,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,174,53,0,0 // vbroadcastss 0x35ae(%rip),%ymm9 # 5d70 <_sk_callback_avx+0x270>
+ .byte 196,98,125,24,13,174,53,0,0 // vbroadcastss 0x35ae(%rip),%ymm9 # 5e9c <_sk_callback_avx+0x270>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
@@ -16145,36 +16299,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,12,49,0,0 // vbroadcastss 0x310c(%rip),%ymm12 # 5d74 <_sk_callback_avx+0x274>
+ .byte 196,98,125,24,37,12,49,0,0 // vbroadcastss 0x310c(%rip),%ymm12 # 5ea0 <_sk_callback_avx+0x274>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,2,49,0,0 // vbroadcastss 0x3102(%rip),%ymm12 # 5d78 <_sk_callback_avx+0x278>
+ .byte 196,98,125,24,37,2,49,0,0 // vbroadcastss 0x3102(%rip),%ymm12 # 5ea4 <_sk_callback_avx+0x278>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,248,48,0,0 // vbroadcastss 0x30f8(%rip),%ymm12 # 5d7c <_sk_callback_avx+0x27c>
+ .byte 196,98,125,24,37,248,48,0,0 // vbroadcastss 0x30f8(%rip),%ymm12 # 5ea8 <_sk_callback_avx+0x27c>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,238,48,0,0 // vbroadcastss 0x30ee(%rip),%ymm12 # 5d80 <_sk_callback_avx+0x280>
+ .byte 196,98,125,24,37,238,48,0,0 // vbroadcastss 0x30ee(%rip),%ymm12 # 5eac <_sk_callback_avx+0x280>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,228,48,0,0 // vbroadcastss 0x30e4(%rip),%ymm12 # 5d84 <_sk_callback_avx+0x284>
+ .byte 196,98,125,24,37,228,48,0,0 // vbroadcastss 0x30e4(%rip),%ymm12 # 5eb0 <_sk_callback_avx+0x284>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,213,48,0,0 // vbroadcastss 0x30d5(%rip),%ymm12 # 5d88 <_sk_callback_avx+0x288>
+ .byte 196,98,125,24,37,213,48,0,0 // vbroadcastss 0x30d5(%rip),%ymm12 # 5eb4 <_sk_callback_avx+0x288>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,203,48,0,0 // vbroadcastss 0x30cb(%rip),%ymm12 # 5d8c <_sk_callback_avx+0x28c>
+ .byte 196,98,125,24,37,203,48,0,0 // vbroadcastss 0x30cb(%rip),%ymm12 # 5eb8 <_sk_callback_avx+0x28c>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,175,48,0,0 // vbroadcastss 0x30af(%rip),%ymm11 # 5d90 <_sk_callback_avx+0x290>
+ .byte 196,98,125,24,29,175,48,0,0 // vbroadcastss 0x30af(%rip),%ymm11 # 5ebc <_sk_callback_avx+0x290>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,165,48,0,0 // vbroadcastss 0x30a5(%rip),%ymm11 # 5d94 <_sk_callback_avx+0x294>
+ .byte 196,98,125,24,29,165,48,0,0 // vbroadcastss 0x30a5(%rip),%ymm11 # 5ec0 <_sk_callback_avx+0x294>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,150,48,0,0 // vbroadcastss 0x3096(%rip),%ymm11 # 5d98 <_sk_callback_avx+0x298>
+ .byte 196,98,125,24,29,150,48,0,0 // vbroadcastss 0x3096(%rip),%ymm11 # 5ec4 <_sk_callback_avx+0x298>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,140,48,0,0 // vbroadcastss 0x308c(%rip),%ymm11 # 5d9c <_sk_callback_avx+0x29c>
+ .byte 196,98,125,24,29,140,48,0,0 // vbroadcastss 0x308c(%rip),%ymm11 # 5ec8 <_sk_callback_avx+0x29c>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,125,48,0,0 // vbroadcastss 0x307d(%rip),%ymm10 # 5da0 <_sk_callback_avx+0x2a0>
+ .byte 196,98,125,24,21,125,48,0,0 // vbroadcastss 0x307d(%rip),%ymm10 # 5ecc <_sk_callback_avx+0x2a0>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -16182,7 +16336,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,84,48,0,0 // vbroadcastss 0x3054(%rip),%ymm8 # 5da4 <_sk_callback_avx+0x2a4>
+ .byte 196,98,125,24,5,84,48,0,0 // vbroadcastss 0x3054(%rip),%ymm8 # 5ed0 <_sk_callback_avx+0x2a4>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16204,36 +16358,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,5,48,0,0 // vbroadcastss 0x3005(%rip),%ymm12 # 5da8 <_sk_callback_avx+0x2a8>
+ .byte 196,98,125,24,37,5,48,0,0 // vbroadcastss 0x3005(%rip),%ymm12 # 5ed4 <_sk_callback_avx+0x2a8>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,251,47,0,0 // vbroadcastss 0x2ffb(%rip),%ymm12 # 5dac <_sk_callback_avx+0x2ac>
+ .byte 196,98,125,24,37,251,47,0,0 // vbroadcastss 0x2ffb(%rip),%ymm12 # 5ed8 <_sk_callback_avx+0x2ac>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,241,47,0,0 // vbroadcastss 0x2ff1(%rip),%ymm12 # 5db0 <_sk_callback_avx+0x2b0>
+ .byte 196,98,125,24,37,241,47,0,0 // vbroadcastss 0x2ff1(%rip),%ymm12 # 5edc <_sk_callback_avx+0x2b0>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,231,47,0,0 // vbroadcastss 0x2fe7(%rip),%ymm12 # 5db4 <_sk_callback_avx+0x2b4>
+ .byte 196,98,125,24,37,231,47,0,0 // vbroadcastss 0x2fe7(%rip),%ymm12 # 5ee0 <_sk_callback_avx+0x2b4>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,221,47,0,0 // vbroadcastss 0x2fdd(%rip),%ymm12 # 5db8 <_sk_callback_avx+0x2b8>
+ .byte 196,98,125,24,37,221,47,0,0 // vbroadcastss 0x2fdd(%rip),%ymm12 # 5ee4 <_sk_callback_avx+0x2b8>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,206,47,0,0 // vbroadcastss 0x2fce(%rip),%ymm12 # 5dbc <_sk_callback_avx+0x2bc>
+ .byte 196,98,125,24,37,206,47,0,0 // vbroadcastss 0x2fce(%rip),%ymm12 # 5ee8 <_sk_callback_avx+0x2bc>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,196,47,0,0 // vbroadcastss 0x2fc4(%rip),%ymm12 # 5dc0 <_sk_callback_avx+0x2c0>
+ .byte 196,98,125,24,37,196,47,0,0 // vbroadcastss 0x2fc4(%rip),%ymm12 # 5eec <_sk_callback_avx+0x2c0>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,168,47,0,0 // vbroadcastss 0x2fa8(%rip),%ymm11 # 5dc4 <_sk_callback_avx+0x2c4>
+ .byte 196,98,125,24,29,168,47,0,0 // vbroadcastss 0x2fa8(%rip),%ymm11 # 5ef0 <_sk_callback_avx+0x2c4>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,158,47,0,0 // vbroadcastss 0x2f9e(%rip),%ymm11 # 5dc8 <_sk_callback_avx+0x2c8>
+ .byte 196,98,125,24,29,158,47,0,0 // vbroadcastss 0x2f9e(%rip),%ymm11 # 5ef4 <_sk_callback_avx+0x2c8>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,143,47,0,0 // vbroadcastss 0x2f8f(%rip),%ymm11 # 5dcc <_sk_callback_avx+0x2cc>
+ .byte 196,98,125,24,29,143,47,0,0 // vbroadcastss 0x2f8f(%rip),%ymm11 # 5ef8 <_sk_callback_avx+0x2cc>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,133,47,0,0 // vbroadcastss 0x2f85(%rip),%ymm11 # 5dd0 <_sk_callback_avx+0x2d0>
+ .byte 196,98,125,24,29,133,47,0,0 // vbroadcastss 0x2f85(%rip),%ymm11 # 5efc <_sk_callback_avx+0x2d0>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,118,47,0,0 // vbroadcastss 0x2f76(%rip),%ymm10 # 5dd4 <_sk_callback_avx+0x2d4>
+ .byte 196,98,125,24,21,118,47,0,0 // vbroadcastss 0x2f76(%rip),%ymm10 # 5f00 <_sk_callback_avx+0x2d4>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -16241,7 +16395,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,77,47,0,0 // vbroadcastss 0x2f4d(%rip),%ymm8 # 5dd8 <_sk_callback_avx+0x2d8>
+ .byte 196,98,125,24,5,77,47,0,0 // vbroadcastss 0x2f4d(%rip),%ymm8 # 5f04 <_sk_callback_avx+0x2d8>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16263,36 +16417,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,254,46,0,0 // vbroadcastss 0x2efe(%rip),%ymm12 # 5ddc <_sk_callback_avx+0x2dc>
+ .byte 196,98,125,24,37,254,46,0,0 // vbroadcastss 0x2efe(%rip),%ymm12 # 5f08 <_sk_callback_avx+0x2dc>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,244,46,0,0 // vbroadcastss 0x2ef4(%rip),%ymm12 # 5de0 <_sk_callback_avx+0x2e0>
+ .byte 196,98,125,24,37,244,46,0,0 // vbroadcastss 0x2ef4(%rip),%ymm12 # 5f0c <_sk_callback_avx+0x2e0>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,234,46,0,0 // vbroadcastss 0x2eea(%rip),%ymm12 # 5de4 <_sk_callback_avx+0x2e4>
+ .byte 196,98,125,24,37,234,46,0,0 // vbroadcastss 0x2eea(%rip),%ymm12 # 5f10 <_sk_callback_avx+0x2e4>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,224,46,0,0 // vbroadcastss 0x2ee0(%rip),%ymm12 # 5de8 <_sk_callback_avx+0x2e8>
+ .byte 196,98,125,24,37,224,46,0,0 // vbroadcastss 0x2ee0(%rip),%ymm12 # 5f14 <_sk_callback_avx+0x2e8>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,214,46,0,0 // vbroadcastss 0x2ed6(%rip),%ymm12 # 5dec <_sk_callback_avx+0x2ec>
+ .byte 196,98,125,24,37,214,46,0,0 // vbroadcastss 0x2ed6(%rip),%ymm12 # 5f18 <_sk_callback_avx+0x2ec>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,199,46,0,0 // vbroadcastss 0x2ec7(%rip),%ymm12 # 5df0 <_sk_callback_avx+0x2f0>
+ .byte 196,98,125,24,37,199,46,0,0 // vbroadcastss 0x2ec7(%rip),%ymm12 # 5f1c <_sk_callback_avx+0x2f0>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,189,46,0,0 // vbroadcastss 0x2ebd(%rip),%ymm12 # 5df4 <_sk_callback_avx+0x2f4>
+ .byte 196,98,125,24,37,189,46,0,0 // vbroadcastss 0x2ebd(%rip),%ymm12 # 5f20 <_sk_callback_avx+0x2f4>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,161,46,0,0 // vbroadcastss 0x2ea1(%rip),%ymm11 # 5df8 <_sk_callback_avx+0x2f8>
+ .byte 196,98,125,24,29,161,46,0,0 // vbroadcastss 0x2ea1(%rip),%ymm11 # 5f24 <_sk_callback_avx+0x2f8>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,151,46,0,0 // vbroadcastss 0x2e97(%rip),%ymm11 # 5dfc <_sk_callback_avx+0x2fc>
+ .byte 196,98,125,24,29,151,46,0,0 // vbroadcastss 0x2e97(%rip),%ymm11 # 5f28 <_sk_callback_avx+0x2fc>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,136,46,0,0 // vbroadcastss 0x2e88(%rip),%ymm11 # 5e00 <_sk_callback_avx+0x300>
+ .byte 196,98,125,24,29,136,46,0,0 // vbroadcastss 0x2e88(%rip),%ymm11 # 5f2c <_sk_callback_avx+0x300>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,126,46,0,0 // vbroadcastss 0x2e7e(%rip),%ymm11 # 5e04 <_sk_callback_avx+0x304>
+ .byte 196,98,125,24,29,126,46,0,0 // vbroadcastss 0x2e7e(%rip),%ymm11 # 5f30 <_sk_callback_avx+0x304>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,111,46,0,0 // vbroadcastss 0x2e6f(%rip),%ymm10 # 5e08 <_sk_callback_avx+0x308>
+ .byte 196,98,125,24,21,111,46,0,0 // vbroadcastss 0x2e6f(%rip),%ymm10 # 5f34 <_sk_callback_avx+0x308>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -16300,7 +16454,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,70,46,0,0 // vbroadcastss 0x2e46(%rip),%ymm8 # 5e0c <_sk_callback_avx+0x30c>
+ .byte 196,98,125,24,5,70,46,0,0 // vbroadcastss 0x2e46(%rip),%ymm8 # 5f38 <_sk_callback_avx+0x30c>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16322,36 +16476,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,247,45,0,0 // vbroadcastss 0x2df7(%rip),%ymm12 # 5e10 <_sk_callback_avx+0x310>
+ .byte 196,98,125,24,37,247,45,0,0 // vbroadcastss 0x2df7(%rip),%ymm12 # 5f3c <_sk_callback_avx+0x310>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,237,45,0,0 // vbroadcastss 0x2ded(%rip),%ymm12 # 5e14 <_sk_callback_avx+0x314>
+ .byte 196,98,125,24,37,237,45,0,0 // vbroadcastss 0x2ded(%rip),%ymm12 # 5f40 <_sk_callback_avx+0x314>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,227,45,0,0 // vbroadcastss 0x2de3(%rip),%ymm12 # 5e18 <_sk_callback_avx+0x318>
+ .byte 196,98,125,24,37,227,45,0,0 // vbroadcastss 0x2de3(%rip),%ymm12 # 5f44 <_sk_callback_avx+0x318>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,217,45,0,0 // vbroadcastss 0x2dd9(%rip),%ymm12 # 5e1c <_sk_callback_avx+0x31c>
+ .byte 196,98,125,24,37,217,45,0,0 // vbroadcastss 0x2dd9(%rip),%ymm12 # 5f48 <_sk_callback_avx+0x31c>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,207,45,0,0 // vbroadcastss 0x2dcf(%rip),%ymm12 # 5e20 <_sk_callback_avx+0x320>
+ .byte 196,98,125,24,37,207,45,0,0 // vbroadcastss 0x2dcf(%rip),%ymm12 # 5f4c <_sk_callback_avx+0x320>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,192,45,0,0 // vbroadcastss 0x2dc0(%rip),%ymm12 # 5e24 <_sk_callback_avx+0x324>
+ .byte 196,98,125,24,37,192,45,0,0 // vbroadcastss 0x2dc0(%rip),%ymm12 # 5f50 <_sk_callback_avx+0x324>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,182,45,0,0 // vbroadcastss 0x2db6(%rip),%ymm12 # 5e28 <_sk_callback_avx+0x328>
+ .byte 196,98,125,24,37,182,45,0,0 // vbroadcastss 0x2db6(%rip),%ymm12 # 5f54 <_sk_callback_avx+0x328>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,154,45,0,0 // vbroadcastss 0x2d9a(%rip),%ymm11 # 5e2c <_sk_callback_avx+0x32c>
+ .byte 196,98,125,24,29,154,45,0,0 // vbroadcastss 0x2d9a(%rip),%ymm11 # 5f58 <_sk_callback_avx+0x32c>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,144,45,0,0 // vbroadcastss 0x2d90(%rip),%ymm11 # 5e30 <_sk_callback_avx+0x330>
+ .byte 196,98,125,24,29,144,45,0,0 // vbroadcastss 0x2d90(%rip),%ymm11 # 5f5c <_sk_callback_avx+0x330>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,129,45,0,0 // vbroadcastss 0x2d81(%rip),%ymm11 # 5e34 <_sk_callback_avx+0x334>
+ .byte 196,98,125,24,29,129,45,0,0 // vbroadcastss 0x2d81(%rip),%ymm11 # 5f60 <_sk_callback_avx+0x334>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,119,45,0,0 // vbroadcastss 0x2d77(%rip),%ymm11 # 5e38 <_sk_callback_avx+0x338>
+ .byte 196,98,125,24,29,119,45,0,0 // vbroadcastss 0x2d77(%rip),%ymm11 # 5f64 <_sk_callback_avx+0x338>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,104,45,0,0 // vbroadcastss 0x2d68(%rip),%ymm10 # 5e3c <_sk_callback_avx+0x33c>
+ .byte 196,98,125,24,21,104,45,0,0 // vbroadcastss 0x2d68(%rip),%ymm10 # 5f68 <_sk_callback_avx+0x33c>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -16359,7 +16513,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,63,45,0,0 // vbroadcastss 0x2d3f(%rip),%ymm8 # 5e40 <_sk_callback_avx+0x340>
+ .byte 196,98,125,24,5,63,45,0,0 // vbroadcastss 0x2d3f(%rip),%ymm8 # 5f6c <_sk_callback_avx+0x340>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16368,31 +16522,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,49,45,0,0 // vbroadcastss 0x2d31(%rip),%ymm8 # 5e44 <_sk_callback_avx+0x344>
+ .byte 196,98,125,24,5,49,45,0,0 // vbroadcastss 0x2d31(%rip),%ymm8 # 5f70 <_sk_callback_avx+0x344>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,39,45,0,0 // vbroadcastss 0x2d27(%rip),%ymm8 # 5e48 <_sk_callback_avx+0x348>
+ .byte 196,98,125,24,5,39,45,0,0 // vbroadcastss 0x2d27(%rip),%ymm8 # 5f74 <_sk_callback_avx+0x348>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,29,45,0,0 // vbroadcastss 0x2d1d(%rip),%ymm9 # 5e4c <_sk_callback_avx+0x34c>
+ .byte 196,98,125,24,13,29,45,0,0 // vbroadcastss 0x2d1d(%rip),%ymm9 # 5f78 <_sk_callback_avx+0x34c>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,9,45,0,0 // vbroadcastss 0x2d09(%rip),%ymm8 # 5e50 <_sk_callback_avx+0x350>
+ .byte 196,98,125,24,5,9,45,0,0 // vbroadcastss 0x2d09(%rip),%ymm8 # 5f7c <_sk_callback_avx+0x350>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,255,44,0,0 // vbroadcastss 0x2cff(%rip),%ymm8 # 5e54 <_sk_callback_avx+0x354>
+ .byte 196,98,125,24,5,255,44,0,0 // vbroadcastss 0x2cff(%rip),%ymm8 # 5f80 <_sk_callback_avx+0x354>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,245,44,0,0 // vbroadcastss 0x2cf5(%rip),%ymm8 # 5e58 <_sk_callback_avx+0x358>
+ .byte 196,98,125,24,5,245,44,0,0 // vbroadcastss 0x2cf5(%rip),%ymm8 # 5f84 <_sk_callback_avx+0x358>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,231,44,0,0 // vbroadcastss 0x2ce7(%rip),%ymm8 # 5e5c <_sk_callback_avx+0x35c>
+ .byte 196,98,125,24,5,231,44,0,0 // vbroadcastss 0x2ce7(%rip),%ymm8 # 5f88 <_sk_callback_avx+0x35c>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,208,44,0,0 // vbroadcastss 0x2cd0(%rip),%ymm9 # 5e60 <_sk_callback_avx+0x360>
+ .byte 196,98,125,24,13,208,44,0,0 // vbroadcastss 0x2cd0(%rip),%ymm9 # 5f8c <_sk_callback_avx+0x360>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,197,44,0,0 // vbroadcastss 0x2cc5(%rip),%ymm11 # 5e64 <_sk_callback_avx+0x364>
+ .byte 196,98,125,24,29,197,44,0,0 // vbroadcastss 0x2cc5(%rip),%ymm11 # 5f90 <_sk_callback_avx+0x364>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,187,44,0,0 // vbroadcastss 0x2cbb(%rip),%ymm12 # 5e68 <_sk_callback_avx+0x368>
+ .byte 196,98,125,24,37,187,44,0,0 // vbroadcastss 0x2cbb(%rip),%ymm12 # 5f94 <_sk_callback_avx+0x368>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -16407,9 +16561,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,113,44,0,0 // vbroadcastss 0x2c71(%rip),%ymm0 # 5e6c <_sk_callback_avx+0x36c>
+ .byte 196,226,125,24,5,113,44,0,0 // vbroadcastss 0x2c71(%rip),%ymm0 # 5f98 <_sk_callback_avx+0x36c>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,104,44,0,0 // vbroadcastss 0x2c68(%rip),%ymm8 # 5e70 <_sk_callback_avx+0x370>
+ .byte 196,98,125,24,5,104,44,0,0 // vbroadcastss 0x2c68(%rip),%ymm8 # 5f9c <_sk_callback_avx+0x370>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16423,14 +16577,14 @@ _sk_load_a8_avx:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,62 // jne 325f <_sk_load_a8_avx+0x4e>
+ .byte 117,62 // jne 338b <_sk_load_a8_avx+0x4e>
.byte 197,250,126,0 // vmovq (%rax),%xmm0
.byte 196,226,121,49,200 // vpmovzxbd %xmm0,%xmm1
.byte 196,227,121,4,192,229 // vpermilps $0xe5,%xmm0,%xmm0
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,44,44,0,0 // vbroadcastss 0x2c2c(%rip),%ymm1 # 5e74 <_sk_callback_avx+0x374>
+ .byte 196,226,125,24,13,44,44,0,0 // vbroadcastss 0x2c2c(%rip),%ymm1 # 5fa0 <_sk_callback_avx+0x374>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -16447,9 +16601,9 @@ _sk_load_a8_avx:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 3267 <_sk_load_a8_avx+0x56>
+ .byte 117,234 // jne 3393 <_sk_load_a8_avx+0x56>
.byte 196,193,249,110,193 // vmovq %r9,%xmm0
- .byte 235,161 // jmp 3225 <_sk_load_a8_avx+0x14>
+ .byte 235,161 // jmp 3351 <_sk_load_a8_avx+0x14>
HIDDEN _sk_gather_a8_avx
.globl _sk_gather_a8_avx
@@ -16499,7 +16653,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,33,43,0,0 // vbroadcastss 0x2b21(%rip),%ymm1 # 5e78 <_sk_callback_avx+0x378>
+ .byte 196,226,125,24,13,33,43,0,0 // vbroadcastss 0x2b21(%rip),%ymm1 # 5fa4 <_sk_callback_avx+0x378>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -16517,14 +16671,14 @@ FUNCTION(_sk_store_a8_avx)
_sk_store_a8_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 196,98,125,24,5,252,42,0,0 // vbroadcastss 0x2afc(%rip),%ymm8 # 5e7c <_sk_callback_avx+0x37c>
+ .byte 196,98,125,24,5,252,42,0,0 // vbroadcastss 0x2afc(%rip),%ymm8 # 5fa8 <_sk_callback_avx+0x37c>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,10 // jne 33a9 <_sk_store_a8_avx+0x37>
+ .byte 117,10 // jne 34d5 <_sk_store_a8_avx+0x37>
.byte 196,65,123,17,4,58 // vmovsd %xmm8,(%r10,%rdi,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16532,10 +16686,10 @@ _sk_store_a8_avx:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,236 // ja 33a5 <_sk_store_a8_avx+0x33>
+ .byte 119,236 // ja 34d1 <_sk_store_a8_avx+0x33>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 340c <_sk_store_a8_avx+0x9a>
+ .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 3538 <_sk_store_a8_avx+0x9a>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -16546,7 +16700,7 @@ _sk_store_a8_avx:
.byte 196,67,121,20,68,58,2,4 // vpextrb $0x4,%xmm8,0x2(%r10,%rdi,1)
.byte 196,67,121,20,68,58,1,2 // vpextrb $0x2,%xmm8,0x1(%r10,%rdi,1)
.byte 196,67,121,20,4,58,0 // vpextrb $0x0,%xmm8,(%r10,%rdi,1)
- .byte 235,154 // jmp 33a5 <_sk_store_a8_avx+0x33>
+ .byte 235,154 // jmp 34d1 <_sk_store_a8_avx+0x33>
.byte 144 // nop
.byte 246,255 // idiv %bh
.byte 255 // (bad)
@@ -16580,17 +16734,17 @@ _sk_load_g8_avx:
.byte 72,139,0 // mov (%rax),%rax
.byte 72,1,248 // add %rdi,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 347b <_sk_load_g8_avx+0x53>
+ .byte 117,67 // jne 35a7 <_sk_load_g8_avx+0x53>
.byte 197,250,126,0 // vmovq (%rax),%xmm0
.byte 196,226,121,49,200 // vpmovzxbd %xmm0,%xmm1
.byte 196,227,121,4,192,229 // vpermilps $0xe5,%xmm0,%xmm0
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,33,42,0,0 // vbroadcastss 0x2a21(%rip),%ymm1 # 5e80 <_sk_callback_avx+0x380>
+ .byte 196,226,125,24,13,33,42,0,0 // vbroadcastss 0x2a21(%rip),%ymm1 # 5fac <_sk_callback_avx+0x380>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,22,42,0,0 // vbroadcastss 0x2a16(%rip),%ymm3 # 5e84 <_sk_callback_avx+0x384>
+ .byte 196,226,125,24,29,22,42,0,0 // vbroadcastss 0x2a16(%rip),%ymm3 # 5fb0 <_sk_callback_avx+0x384>
.byte 76,137,193 // mov %r8,%rcx
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
@@ -16604,9 +16758,9 @@ _sk_load_g8_avx:
.byte 77,9,217 // or %r11,%r9
.byte 72,131,193,8 // add $0x8,%rcx
.byte 73,255,202 // dec %r10
- .byte 117,234 // jne 3483 <_sk_load_g8_avx+0x5b>
+ .byte 117,234 // jne 35af <_sk_load_g8_avx+0x5b>
.byte 196,193,249,110,193 // vmovq %r9,%xmm0
- .byte 235,156 // jmp 343c <_sk_load_g8_avx+0x14>
+ .byte 235,156 // jmp 3568 <_sk_load_g8_avx+0x14>
HIDDEN _sk_gather_g8_avx
.globl _sk_gather_g8_avx
@@ -16656,10 +16810,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,21,41,0,0 // vbroadcastss 0x2915(%rip),%ymm1 # 5e88 <_sk_callback_avx+0x388>
+ .byte 196,226,125,24,13,21,41,0,0 // vbroadcastss 0x2915(%rip),%ymm1 # 5fb4 <_sk_callback_avx+0x388>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,10,41,0,0 // vbroadcastss 0x290a(%rip),%ymm3 # 5e8c <_sk_callback_avx+0x38c>
+ .byte 196,226,125,24,29,10,41,0,0 // vbroadcastss 0x290a(%rip),%ymm3 # 5fb8 <_sk_callback_avx+0x38c>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -16675,9 +16829,9 @@ _sk_gather_i8_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,192 // mov %rax,%r8
.byte 77,133,192 // test %r8,%r8
- .byte 116,5 // je 35a2 <_sk_gather_i8_avx+0xf>
+ .byte 116,5 // je 36ce <_sk_gather_i8_avx+0xf>
.byte 76,137,192 // mov %r8,%rax
- .byte 235,2 // jmp 35a4 <_sk_gather_i8_avx+0x11>
+ .byte 235,2 // jmp 36d0 <_sk_gather_i8_avx+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,87 // push %r15
.byte 65,86 // push %r14
@@ -16739,10 +16893,10 @@ _sk_gather_i8_avx:
.byte 196,163,121,34,4,163,2 // vpinsrd $0x2,(%rbx,%r12,4),%xmm0,%xmm0
.byte 196,163,121,34,28,19,3 // vpinsrd $0x3,(%rbx,%r10,1),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,146,41,0,0 // vmovaps 0x2992(%rip),%ymm10 # 6060 <_sk_callback_avx+0x560>
+ .byte 197,124,40,21,134,41,0,0 // vmovaps 0x2986(%rip),%ymm10 # 6180 <_sk_callback_avx+0x554>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,176,39,0,0 // vbroadcastss 0x27b0(%rip),%ymm9 # 5e90 <_sk_callback_avx+0x390>
+ .byte 196,98,125,24,13,176,39,0,0 // vbroadcastss 0x27b0(%rip),%ymm9 # 5fbc <_sk_callback_avx+0x390>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -16776,38 +16930,38 @@ _sk_load_565_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,128,0,0,0 // jne 37d8 <_sk_load_565_avx+0x8e>
+ .byte 15,133,128,0,0,0 // jne 3904 <_sk_load_565_avx+0x8e>
.byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,26,39,0,0 // vbroadcastss 0x271a(%rip),%ymm0 # 5e94 <_sk_callback_avx+0x394>
+ .byte 196,226,125,24,5,26,39,0,0 // vbroadcastss 0x271a(%rip),%ymm0 # 5fc0 <_sk_callback_avx+0x394>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,13,39,0,0 // vbroadcastss 0x270d(%rip),%ymm1 # 5e98 <_sk_callback_avx+0x398>
+ .byte 196,226,125,24,13,13,39,0,0 // vbroadcastss 0x270d(%rip),%ymm1 # 5fc4 <_sk_callback_avx+0x398>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,4,39,0,0 // vbroadcastss 0x2704(%rip),%ymm1 # 5e9c <_sk_callback_avx+0x39c>
+ .byte 196,226,125,24,13,4,39,0,0 // vbroadcastss 0x2704(%rip),%ymm1 # 5fc8 <_sk_callback_avx+0x39c>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,247,38,0,0 // vbroadcastss 0x26f7(%rip),%ymm3 # 5ea0 <_sk_callback_avx+0x3a0>
+ .byte 196,226,125,24,29,247,38,0,0 // vbroadcastss 0x26f7(%rip),%ymm3 # 5fcc <_sk_callback_avx+0x3a0>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,238,38,0,0 // vbroadcastss 0x26ee(%rip),%ymm3 # 5ea4 <_sk_callback_avx+0x3a4>
+ .byte 196,226,125,24,29,238,38,0,0 // vbroadcastss 0x26ee(%rip),%ymm3 # 5fd0 <_sk_callback_avx+0x3a4>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,225,38,0,0 // vbroadcastss 0x26e1(%rip),%ymm3 # 5ea8 <_sk_callback_avx+0x3a8>
+ .byte 196,226,125,24,29,225,38,0,0 // vbroadcastss 0x26e1(%rip),%ymm3 # 5fd4 <_sk_callback_avx+0x3a8>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,214,38,0,0 // vbroadcastss 0x26d6(%rip),%ymm3 # 5eac <_sk_callback_avx+0x3ac>
+ .byte 196,226,125,24,29,214,38,0,0 // vbroadcastss 0x26d6(%rip),%ymm3 # 5fd8 <_sk_callback_avx+0x3ac>
.byte 255,224 // jmpq *%rax
.byte 65,137,200 // mov %ecx,%r8d
.byte 65,128,224,7 // and $0x7,%r8b
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 15,135,110,255,255,255 // ja 375e <_sk_load_565_avx+0x14>
+ .byte 15,135,110,255,255,255 // ja 388a <_sk_load_565_avx+0x14>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 3844 <_sk_load_565_avx+0xfa>
+ .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 3970 <_sk_load_565_avx+0xfa>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -16819,7 +16973,7 @@ _sk_load_565_avx:
.byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- .byte 233,26,255,255,255 // jmpq 375e <_sk_load_565_avx+0x14>
+ .byte 233,26,255,255,255 // jmpq 388a <_sk_load_565_avx+0x14>
.byte 244 // hlt
.byte 255 // (bad)
.byte 255 // (bad)
@@ -16897,23 +17051,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,118,37,0,0 // vbroadcastss 0x2576(%rip),%ymm0 # 5eb0 <_sk_callback_avx+0x3b0>
+ .byte 196,226,125,24,5,118,37,0,0 // vbroadcastss 0x2576(%rip),%ymm0 # 5fdc <_sk_callback_avx+0x3b0>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,105,37,0,0 // vbroadcastss 0x2569(%rip),%ymm1 # 5eb4 <_sk_callback_avx+0x3b4>
+ .byte 196,226,125,24,13,105,37,0,0 // vbroadcastss 0x2569(%rip),%ymm1 # 5fe0 <_sk_callback_avx+0x3b4>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,96,37,0,0 // vbroadcastss 0x2560(%rip),%ymm1 # 5eb8 <_sk_callback_avx+0x3b8>
+ .byte 196,226,125,24,13,96,37,0,0 // vbroadcastss 0x2560(%rip),%ymm1 # 5fe4 <_sk_callback_avx+0x3b8>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,83,37,0,0 // vbroadcastss 0x2553(%rip),%ymm3 # 5ebc <_sk_callback_avx+0x3bc>
+ .byte 196,226,125,24,29,83,37,0,0 // vbroadcastss 0x2553(%rip),%ymm3 # 5fe8 <_sk_callback_avx+0x3bc>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,74,37,0,0 // vbroadcastss 0x254a(%rip),%ymm3 # 5ec0 <_sk_callback_avx+0x3c0>
+ .byte 196,226,125,24,29,74,37,0,0 // vbroadcastss 0x254a(%rip),%ymm3 # 5fec <_sk_callback_avx+0x3c0>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,61,37,0,0 // vbroadcastss 0x253d(%rip),%ymm3 # 5ec4 <_sk_callback_avx+0x3c4>
+ .byte 196,226,125,24,29,61,37,0,0 // vbroadcastss 0x253d(%rip),%ymm3 # 5ff0 <_sk_callback_avx+0x3c4>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,50,37,0,0 // vbroadcastss 0x2532(%rip),%ymm3 # 5ec8 <_sk_callback_avx+0x3c8>
+ .byte 196,226,125,24,29,50,37,0,0 // vbroadcastss 0x2532(%rip),%ymm3 # 5ff4 <_sk_callback_avx+0x3c8>
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
.byte 65,94 // pop %r14
@@ -16927,14 +17081,14 @@ FUNCTION(_sk_store_565_avx)
_sk_store_565_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 196,98,125,24,5,30,37,0,0 // vbroadcastss 0x251e(%rip),%ymm8 # 5ecc <_sk_callback_avx+0x3cc>
+ .byte 196,98,125,24,5,30,37,0,0 // vbroadcastss 0x251e(%rip),%ymm8 # 5ff8 <_sk_callback_avx+0x3cc>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,247,36,0,0 // vbroadcastss 0x24f7(%rip),%ymm10 # 5ed0 <_sk_callback_avx+0x3d0>
+ .byte 196,98,125,24,21,247,36,0,0 // vbroadcastss 0x24f7(%rip),%ymm10 # 5ffc <_sk_callback_avx+0x3d0>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -16948,7 +17102,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,10 // jne 3a29 <_sk_store_565_avx+0x89>
+ .byte 117,10 // jne 3b55 <_sk_store_565_avx+0x89>
.byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16956,9 +17110,9 @@ _sk_store_565_avx:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,236 // ja 3a25 <_sk_store_565_avx+0x85>
+ .byte 119,236 // ja 3b51 <_sk_store_565_avx+0x85>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 3a88 <_sk_store_565_avx+0xe8>
+ .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 3bb4 <_sk_store_565_avx+0xe8>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -16969,7 +17123,7 @@ _sk_store_565_avx:
.byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
.byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
.byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- .byte 235,159 // jmp 3a25 <_sk_store_565_avx+0x85>
+ .byte 235,159 // jmp 3b51 <_sk_store_565_avx+0x85>
.byte 102,144 // xchg %ax,%ax
.byte 245 // cmc
.byte 255 // (bad)
@@ -17002,31 +17156,31 @@ _sk_load_4444_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,152,0,0,0 // jne 3b4a <_sk_load_4444_avx+0xa6>
+ .byte 15,133,152,0,0,0 // jne 3c76 <_sk_load_4444_avx+0xa6>
.byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,0,36,0,0 // vbroadcastss 0x2400(%rip),%ymm0 # 5ed4 <_sk_callback_avx+0x3d4>
+ .byte 196,226,125,24,5,0,36,0,0 // vbroadcastss 0x2400(%rip),%ymm0 # 6000 <_sk_callback_avx+0x3d4>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,243,35,0,0 // vbroadcastss 0x23f3(%rip),%ymm1 # 5ed8 <_sk_callback_avx+0x3d8>
+ .byte 196,226,125,24,13,243,35,0,0 // vbroadcastss 0x23f3(%rip),%ymm1 # 6004 <_sk_callback_avx+0x3d8>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,234,35,0,0 // vbroadcastss 0x23ea(%rip),%ymm1 # 5edc <_sk_callback_avx+0x3dc>
+ .byte 196,226,125,24,13,234,35,0,0 // vbroadcastss 0x23ea(%rip),%ymm1 # 6008 <_sk_callback_avx+0x3dc>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,221,35,0,0 // vbroadcastss 0x23dd(%rip),%ymm2 # 5ee0 <_sk_callback_avx+0x3e0>
+ .byte 196,226,125,24,21,221,35,0,0 // vbroadcastss 0x23dd(%rip),%ymm2 # 600c <_sk_callback_avx+0x3e0>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,212,35,0,0 // vbroadcastss 0x23d4(%rip),%ymm2 # 5ee4 <_sk_callback_avx+0x3e4>
+ .byte 196,226,125,24,21,212,35,0,0 // vbroadcastss 0x23d4(%rip),%ymm2 # 6010 <_sk_callback_avx+0x3e4>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,199,35,0,0 // vbroadcastss 0x23c7(%rip),%ymm8 # 5ee8 <_sk_callback_avx+0x3e8>
+ .byte 196,98,125,24,5,199,35,0,0 // vbroadcastss 0x23c7(%rip),%ymm8 # 6014 <_sk_callback_avx+0x3e8>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,189,35,0,0 // vbroadcastss 0x23bd(%rip),%ymm8 # 5eec <_sk_callback_avx+0x3ec>
+ .byte 196,98,125,24,5,189,35,0,0 // vbroadcastss 0x23bd(%rip),%ymm8 # 6018 <_sk_callback_avx+0x3ec>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,175,35,0,0 // vbroadcastss 0x23af(%rip),%ymm8 # 5ef0 <_sk_callback_avx+0x3f0>
+ .byte 196,98,125,24,5,175,35,0,0 // vbroadcastss 0x23af(%rip),%ymm8 # 601c <_sk_callback_avx+0x3f0>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -17035,9 +17189,9 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 15,135,86,255,255,255 // ja 3ab8 <_sk_load_4444_avx+0x14>
+ .byte 15,135,86,255,255,255 // ja 3be4 <_sk_load_4444_avx+0x14>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 3bb8 <_sk_load_4444_avx+0x114>
+ .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 3ce4 <_sk_load_4444_avx+0x114>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -17049,7 +17203,7 @@ _sk_load_4444_avx:
.byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
.byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- .byte 233,2,255,255,255 // jmpq 3ab8 <_sk_load_4444_avx+0x14>
+ .byte 233,2,255,255,255 // jmpq 3be4 <_sk_load_4444_avx+0x14>
.byte 102,144 // xchg %ax,%ax
.byte 242,255 // repnz (bad)
.byte 255 // (bad)
@@ -17128,25 +17282,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,70,34,0,0 // vbroadcastss 0x2246(%rip),%ymm0 # 5ef4 <_sk_callback_avx+0x3f4>
+ .byte 196,226,125,24,5,70,34,0,0 // vbroadcastss 0x2246(%rip),%ymm0 # 6020 <_sk_callback_avx+0x3f4>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,57,34,0,0 // vbroadcastss 0x2239(%rip),%ymm1 # 5ef8 <_sk_callback_avx+0x3f8>
+ .byte 196,226,125,24,13,57,34,0,0 // vbroadcastss 0x2239(%rip),%ymm1 # 6024 <_sk_callback_avx+0x3f8>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,48,34,0,0 // vbroadcastss 0x2230(%rip),%ymm1 # 5efc <_sk_callback_avx+0x3fc>
+ .byte 196,226,125,24,13,48,34,0,0 // vbroadcastss 0x2230(%rip),%ymm1 # 6028 <_sk_callback_avx+0x3fc>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,35,34,0,0 // vbroadcastss 0x2223(%rip),%ymm2 # 5f00 <_sk_callback_avx+0x400>
+ .byte 196,226,125,24,21,35,34,0,0 // vbroadcastss 0x2223(%rip),%ymm2 # 602c <_sk_callback_avx+0x400>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,26,34,0,0 // vbroadcastss 0x221a(%rip),%ymm2 # 5f04 <_sk_callback_avx+0x404>
+ .byte 196,226,125,24,21,26,34,0,0 // vbroadcastss 0x221a(%rip),%ymm2 # 6030 <_sk_callback_avx+0x404>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,13,34,0,0 // vbroadcastss 0x220d(%rip),%ymm8 # 5f08 <_sk_callback_avx+0x408>
+ .byte 196,98,125,24,5,13,34,0,0 // vbroadcastss 0x220d(%rip),%ymm8 # 6034 <_sk_callback_avx+0x408>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,3,34,0,0 // vbroadcastss 0x2203(%rip),%ymm8 # 5f0c <_sk_callback_avx+0x40c>
+ .byte 196,98,125,24,5,3,34,0,0 // vbroadcastss 0x2203(%rip),%ymm8 # 6038 <_sk_callback_avx+0x40c>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,245,33,0,0 // vbroadcastss 0x21f5(%rip),%ymm8 # 5f10 <_sk_callback_avx+0x410>
+ .byte 196,98,125,24,5,245,33,0,0 // vbroadcastss 0x21f5(%rip),%ymm8 # 603c <_sk_callback_avx+0x410>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -17162,7 +17316,7 @@ FUNCTION(_sk_store_4444_avx)
_sk_store_4444_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 196,98,125,24,5,218,33,0,0 // vbroadcastss 0x21da(%rip),%ymm8 # 5f14 <_sk_callback_avx+0x414>
+ .byte 196,98,125,24,5,218,33,0,0 // vbroadcastss 0x21da(%rip),%ymm8 # 6040 <_sk_callback_avx+0x414>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -17189,7 +17343,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,10 // jne 3dd3 <_sk_store_4444_avx+0xa7>
+ .byte 117,10 // jne 3eff <_sk_store_4444_avx+0xa7>
.byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -17197,9 +17351,9 @@ _sk_store_4444_avx:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,236 // ja 3dcf <_sk_store_4444_avx+0xa3>
+ .byte 119,236 // ja 3efb <_sk_store_4444_avx+0xa3>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,66,0,0,0 // lea 0x42(%rip),%r9 # 3e30 <_sk_store_4444_avx+0x104>
+ .byte 76,141,13,66,0,0,0 // lea 0x42(%rip),%r9 # 3f5c <_sk_store_4444_avx+0x104>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -17210,7 +17364,7 @@ _sk_store_4444_avx:
.byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
.byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
.byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- .byte 235,159 // jmp 3dcf <_sk_store_4444_avx+0xa3>
+ .byte 235,159 // jmp 3efb <_sk_store_4444_avx+0xa3>
.byte 247,255 // idiv %edi
.byte 255 // (bad)
.byte 255 // (bad)
@@ -17241,12 +17395,12 @@ _sk_load_8888_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,135,0,0,0 // jne 3ee1 <_sk_load_8888_avx+0x95>
+ .byte 15,133,135,0,0,0 // jne 400d <_sk_load_8888_avx+0x95>
.byte 196,65,124,16,12,186 // vmovups (%r10,%rdi,4),%ymm9
- .byte 197,124,40,21,24,34,0,0 // vmovaps 0x2218(%rip),%ymm10 # 6080 <_sk_callback_avx+0x580>
+ .byte 197,124,40,21,12,34,0,0 // vmovaps 0x220c(%rip),%ymm10 # 61a0 <_sk_callback_avx+0x574>
.byte 196,193,52,84,194 // vandps %ymm10,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,158,32,0,0 // vbroadcastss 0x209e(%rip),%ymm8 # 5f18 <_sk_callback_avx+0x418>
+ .byte 196,98,125,24,5,158,32,0,0 // vbroadcastss 0x209e(%rip),%ymm8 # 6044 <_sk_callback_avx+0x418>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -17273,9 +17427,9 @@ _sk_load_8888_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 15,135,102,255,255,255 // ja 3e60 <_sk_load_8888_avx+0x14>
+ .byte 15,135,102,255,255,255 // ja 3f8c <_sk_load_8888_avx+0x14>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,139,0,0,0 // lea 0x8b(%rip),%r9 # 3f90 <_sk_load_8888_avx+0x144>
+ .byte 76,141,13,139,0,0,0 // lea 0x8b(%rip),%r9 # 40bc <_sk_load_8888_avx+0x144>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -17298,7 +17452,7 @@ _sk_load_8888_avx:
.byte 196,99,53,12,200,15 // vblendps $0xf,%ymm0,%ymm9,%ymm9
.byte 196,195,49,34,4,186,0 // vpinsrd $0x0,(%r10,%rdi,4),%xmm9,%xmm0
.byte 196,99,53,12,200,15 // vblendps $0xf,%ymm0,%ymm9,%ymm9
- .byte 233,210,254,255,255 // jmpq 3e60 <_sk_load_8888_avx+0x14>
+ .byte 233,210,254,255,255 // jmpq 3f8c <_sk_load_8888_avx+0x14>
.byte 102,144 // xchg %ax,%ax
.byte 236 // in (%dx),%al
.byte 255 // (bad)
@@ -17316,7 +17470,7 @@ _sk_load_8888_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 3fa9 <_sk_load_8888_avx+0x15d>
+ .byte 126,255 // jle 40d5 <_sk_load_8888_avx+0x15d>
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -17361,10 +17515,10 @@ _sk_gather_8888_avx:
.byte 196,131,121,34,4,152,2 // vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
.byte 196,131,121,34,28,144,3 // vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,66,32,0,0 // vmovaps 0x2042(%rip),%ymm10 # 60a0 <_sk_callback_avx+0x5a0>
+ .byte 197,124,40,21,54,32,0,0 // vmovaps 0x2036(%rip),%ymm10 # 61c0 <_sk_callback_avx+0x594>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,172,30,0,0 // vbroadcastss 0x1eac(%rip),%ymm9 # 5f1c <_sk_callback_avx+0x41c>
+ .byte 196,98,125,24,13,172,30,0,0 // vbroadcastss 0x1eac(%rip),%ymm9 # 6048 <_sk_callback_avx+0x41c>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -17396,7 +17550,7 @@ FUNCTION(_sk_store_8888_avx)
_sk_store_8888_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 196,98,125,24,5,58,30,0,0 // vbroadcastss 0x1e3a(%rip),%ymm8 # 5f20 <_sk_callback_avx+0x420>
+ .byte 196,98,125,24,5,58,30,0,0 // vbroadcastss 0x1e3a(%rip),%ymm8 # 604c <_sk_callback_avx+0x420>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -17421,7 +17575,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,10 // jne 4174 <_sk_store_8888_avx+0x9c>
+ .byte 117,10 // jne 42a0 <_sk_store_8888_avx+0x9c>
.byte 196,65,124,17,4,186 // vmovups %ymm8,(%r10,%rdi,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -17429,9 +17583,9 @@ _sk_store_8888_avx:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,236 // ja 4170 <_sk_store_8888_avx+0x98>
+ .byte 119,236 // ja 429c <_sk_store_8888_avx+0x98>
.byte 69,15,182,192 // movzbl %r8b,%r8d
- .byte 76,141,13,85,0,0,0 // lea 0x55(%rip),%r9 # 41e4 <_sk_store_8888_avx+0x10c>
+ .byte 76,141,13,85,0,0,0 // lea 0x55(%rip),%r9 # 4310 <_sk_store_8888_avx+0x10c>
.byte 75,99,4,129 // movslq (%r9,%r8,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
@@ -17445,7 +17599,7 @@ _sk_store_8888_avx:
.byte 196,67,121,22,68,186,8,2 // vpextrd $0x2,%xmm8,0x8(%r10,%rdi,4)
.byte 196,67,121,22,68,186,4,1 // vpextrd $0x1,%xmm8,0x4(%r10,%rdi,4)
.byte 196,65,121,126,4,186 // vmovd %xmm8,(%r10,%rdi,4)
- .byte 235,143 // jmp 4170 <_sk_store_8888_avx+0x98>
+ .byte 235,143 // jmp 429c <_sk_store_8888_avx+0x98>
.byte 15,31,0 // nopl (%rax)
.byte 245 // cmc
.byte 255 // (bad)
@@ -17483,7 +17637,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,141,2,0,0 // jne 44b7 <_sk_load_f16_avx+0x2b7>
+ .byte 15,133,141,2,0,0 // jne 45e3 <_sk_load_f16_avx+0x2b7>
.byte 197,121,16,4,248 // vmovupd (%rax,%rdi,8),%xmm8
.byte 197,249,16,84,248,16 // vmovupd 0x10(%rax,%rdi,8),%xmm2
.byte 197,249,16,76,248,32 // vmovupd 0x20(%rax,%rdi,8),%xmm1
@@ -17501,13 +17655,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,161,28,0,0 // vbroadcastss 0x1ca1(%rip),%ymm12 # 5f24 <_sk_callback_avx+0x424>
+ .byte 196,98,125,24,37,161,28,0,0 // vbroadcastss 0x1ca1(%rip),%ymm12 # 6050 <_sk_callback_avx+0x424>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,141,28,0,0 // vbroadcastss 0x1c8d(%rip),%xmm11 # 5f28 <_sk_callback_avx+0x428>
+ .byte 196,98,121,24,29,141,28,0,0 // vbroadcastss 0x1c8d(%rip),%xmm11 # 6054 <_sk_callback_avx+0x428>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,131,28,0,0 // vbroadcastss 0x1c83(%rip),%xmm13 # 5f2c <_sk_callback_avx+0x42c>
+ .byte 196,98,121,24,45,131,28,0,0 // vbroadcastss 0x1c83(%rip),%xmm13 # 6058 <_sk_callback_avx+0x42c>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -17521,7 +17675,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,57,28,0,0 // vbroadcastss 0x1c39(%rip),%xmm3 # 5f30 <_sk_callback_avx+0x430>
+ .byte 196,226,121,24,29,57,28,0,0 // vbroadcastss 0x1c39(%rip),%xmm3 # 605c <_sk_callback_avx+0x430>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -17614,29 +17768,29 @@ _sk_load_f16_avx:
.byte 197,123,16,4,248 // vmovsd (%rax,%rdi,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,79 // je 4516 <_sk_load_f16_avx+0x316>
+ .byte 116,79 // je 4642 <_sk_load_f16_avx+0x316>
.byte 197,57,22,68,248,8 // vmovhpd 0x8(%rax,%rdi,8),%xmm8,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,67 // jb 4516 <_sk_load_f16_avx+0x316>
+ .byte 114,67 // jb 4642 <_sk_load_f16_avx+0x316>
.byte 197,251,16,84,248,16 // vmovsd 0x10(%rax,%rdi,8),%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 116,68 // je 4523 <_sk_load_f16_avx+0x323>
+ .byte 116,68 // je 464f <_sk_load_f16_avx+0x323>
.byte 197,233,22,84,248,24 // vmovhpd 0x18(%rax,%rdi,8),%xmm2,%xmm2
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,56 // jb 4523 <_sk_load_f16_avx+0x323>
+ .byte 114,56 // jb 464f <_sk_load_f16_avx+0x323>
.byte 197,251,16,76,248,32 // vmovsd 0x20(%rax,%rdi,8),%xmm1
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 15,132,70,253,255,255 // je 4241 <_sk_load_f16_avx+0x41>
+ .byte 15,132,70,253,255,255 // je 436d <_sk_load_f16_avx+0x41>
.byte 197,241,22,76,248,40 // vmovhpd 0x28(%rax,%rdi,8),%xmm1,%xmm1
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 15,130,54,253,255,255 // jb 4241 <_sk_load_f16_avx+0x41>
+ .byte 15,130,54,253,255,255 // jb 436d <_sk_load_f16_avx+0x41>
.byte 197,122,126,76,248,48 // vmovq 0x30(%rax,%rdi,8),%xmm9
- .byte 233,43,253,255,255 // jmpq 4241 <_sk_load_f16_avx+0x41>
+ .byte 233,43,253,255,255 // jmpq 436d <_sk_load_f16_avx+0x41>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,30,253,255,255 // jmpq 4241 <_sk_load_f16_avx+0x41>
+ .byte 233,30,253,255,255 // jmpq 436d <_sk_load_f16_avx+0x41>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,21,253,255,255 // jmpq 4241 <_sk_load_f16_avx+0x41>
+ .byte 233,21,253,255,255 // jmpq 436d <_sk_load_f16_avx+0x41>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -17700,13 +17854,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,210 // vpunpckhwd %xmm2,%xmm0,%xmm2
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
- .byte 196,98,125,24,37,253,24,0,0 // vbroadcastss 0x18fd(%rip),%ymm12 # 5f34 <_sk_callback_avx+0x434>
+ .byte 196,98,125,24,37,253,24,0,0 // vbroadcastss 0x18fd(%rip),%ymm12 # 6060 <_sk_callback_avx+0x434>
.byte 196,193,124,84,212 // vandps %ymm12,%ymm0,%ymm2
.byte 197,252,87,194 // vxorps %ymm2,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,233,24,0,0 // vbroadcastss 0x18e9(%rip),%xmm11 # 5f38 <_sk_callback_avx+0x438>
+ .byte 196,98,121,24,29,233,24,0,0 // vbroadcastss 0x18e9(%rip),%xmm11 # 6064 <_sk_callback_avx+0x438>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,223,24,0,0 // vbroadcastss 0x18df(%rip),%xmm13 # 5f3c <_sk_callback_avx+0x43c>
+ .byte 196,98,121,24,45,223,24,0,0 // vbroadcastss 0x18df(%rip),%xmm13 # 6068 <_sk_callback_avx+0x43c>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -17720,7 +17874,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,194 // vorps %ymm2,%ymm0,%ymm0
.byte 196,227,125,25,194,1 // vextractf128 $0x1,%ymm0,%xmm2
- .byte 196,226,121,24,29,149,24,0,0 // vbroadcastss 0x1895(%rip),%xmm3 # 5f40 <_sk_callback_avx+0x440>
+ .byte 196,226,121,24,29,149,24,0,0 // vbroadcastss 0x1895(%rip),%xmm3 # 606c <_sk_callback_avx+0x440>
.byte 197,233,254,211 // vpaddd %xmm3,%xmm2,%xmm2
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
@@ -17824,12 +17978,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,174,22,0,0 // vbroadcastss 0x16ae(%rip),%ymm9 # 5f44 <_sk_callback_avx+0x444>
+ .byte 196,98,125,24,13,174,22,0,0 // vbroadcastss 0x16ae(%rip),%ymm9 # 6070 <_sk_callback_avx+0x444>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,147,22,0,0 // vbroadcastss 0x1693(%rip),%xmm8 # 5f48 <_sk_callback_avx+0x448>
+ .byte 196,98,121,24,5,147,22,0,0 // vbroadcastss 0x1693(%rip),%xmm8 # 6074 <_sk_callback_avx+0x448>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -17839,7 +17993,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,90,22,0,0 // vbroadcastss 0x165a(%rip),%ymm10 # 5f4c <_sk_callback_avx+0x44c>
+ .byte 196,98,125,24,21,90,22,0,0 // vbroadcastss 0x165a(%rip),%ymm10 # 6078 <_sk_callback_avx+0x44c>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -17921,7 +18075,7 @@ _sk_store_f16_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,66 // jne 4ad0 <_sk_store_f16_avx+0x25e>
+ .byte 117,66 // jne 4bfc <_sk_store_f16_avx+0x25e>
.byte 197,120,17,28,248 // vmovups %xmm11,(%rax,%rdi,8)
.byte 197,120,17,84,248,16 // vmovups %xmm10,0x10(%rax,%rdi,8)
.byte 197,120,17,76,248,32 // vmovups %xmm9,0x20(%rax,%rdi,8)
@@ -17937,22 +18091,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 197,121,214,28,248 // vmovq %xmm11,(%rax,%rdi,8)
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,202 // je 4aa5 <_sk_store_f16_avx+0x233>
+ .byte 116,202 // je 4bd1 <_sk_store_f16_avx+0x233>
.byte 197,121,23,92,248,8 // vmovhpd %xmm11,0x8(%rax,%rdi,8)
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,190 // jb 4aa5 <_sk_store_f16_avx+0x233>
+ .byte 114,190 // jb 4bd1 <_sk_store_f16_avx+0x233>
.byte 197,121,214,84,248,16 // vmovq %xmm10,0x10(%rax,%rdi,8)
- .byte 116,182 // je 4aa5 <_sk_store_f16_avx+0x233>
+ .byte 116,182 // je 4bd1 <_sk_store_f16_avx+0x233>
.byte 197,121,23,84,248,24 // vmovhpd %xmm10,0x18(%rax,%rdi,8)
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,170 // jb 4aa5 <_sk_store_f16_avx+0x233>
+ .byte 114,170 // jb 4bd1 <_sk_store_f16_avx+0x233>
.byte 197,121,214,76,248,32 // vmovq %xmm9,0x20(%rax,%rdi,8)
- .byte 116,162 // je 4aa5 <_sk_store_f16_avx+0x233>
+ .byte 116,162 // je 4bd1 <_sk_store_f16_avx+0x233>
.byte 197,121,23,76,248,40 // vmovhpd %xmm9,0x28(%rax,%rdi,8)
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,150 // jb 4aa5 <_sk_store_f16_avx+0x233>
+ .byte 114,150 // jb 4bd1 <_sk_store_f16_avx+0x233>
.byte 197,121,214,68,248,48 // vmovq %xmm8,0x30(%rax,%rdi,8)
- .byte 235,142 // jmp 4aa5 <_sk_store_f16_avx+0x233>
+ .byte 235,142 // jmp 4bd1 <_sk_store_f16_avx+0x233>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -17962,7 +18116,7 @@ _sk_load_u16_be_avx:
.byte 76,139,0 // mov (%rax),%r8
.byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,253,0,0,0 // jne 4c2a <_sk_load_u16_be_avx+0x113>
+ .byte 15,133,253,0,0,0 // jne 4d56 <_sk_load_u16_be_avx+0x113>
.byte 196,65,121,16,4,64 // vmovupd (%r8,%rax,2),%xmm8
.byte 196,193,121,16,84,64,16 // vmovupd 0x10(%r8,%rax,2),%xmm2
.byte 196,193,121,16,92,64,32 // vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -17984,7 +18138,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,178,19,0,0 // vbroadcastss 0x13b2(%rip),%ymm11 # 5f50 <_sk_callback_avx+0x450>
+ .byte 196,98,125,24,29,178,19,0,0 // vbroadcastss 0x13b2(%rip),%ymm11 # 607c <_sk_callback_avx+0x450>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -18018,29 +18172,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,64 // vmovsd (%r8,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,85 // je 4c90 <_sk_load_u16_be_avx+0x179>
+ .byte 116,85 // je 4dbc <_sk_load_u16_be_avx+0x179>
.byte 196,65,57,22,68,64,8 // vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,72 // jb 4c90 <_sk_load_u16_be_avx+0x179>
+ .byte 114,72 // jb 4dbc <_sk_load_u16_be_avx+0x179>
.byte 196,193,123,16,84,64,16 // vmovsd 0x10(%r8,%rax,2),%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 116,72 // je 4c9d <_sk_load_u16_be_avx+0x186>
+ .byte 116,72 // je 4dc9 <_sk_load_u16_be_avx+0x186>
.byte 196,193,105,22,84,64,24 // vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,59 // jb 4c9d <_sk_load_u16_be_avx+0x186>
+ .byte 114,59 // jb 4dc9 <_sk_load_u16_be_avx+0x186>
.byte 196,193,123,16,92,64,32 // vmovsd 0x20(%r8,%rax,2),%xmm3
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 15,132,213,254,255,255 // je 4b48 <_sk_load_u16_be_avx+0x31>
+ .byte 15,132,213,254,255,255 // je 4c74 <_sk_load_u16_be_avx+0x31>
.byte 196,193,97,22,92,64,40 // vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 15,130,196,254,255,255 // jb 4b48 <_sk_load_u16_be_avx+0x31>
+ .byte 15,130,196,254,255,255 // jb 4c74 <_sk_load_u16_be_avx+0x31>
.byte 196,65,122,126,76,64,48 // vmovq 0x30(%r8,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq 4b48 <_sk_load_u16_be_avx+0x31>
+ .byte 233,184,254,255,255 // jmpq 4c74 <_sk_load_u16_be_avx+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq 4b48 <_sk_load_u16_be_avx+0x31>
+ .byte 233,171,254,255,255 // jmpq 4c74 <_sk_load_u16_be_avx+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq 4b48 <_sk_load_u16_be_avx+0x31>
+ .byte 233,162,254,255,255 // jmpq 4c74 <_sk_load_u16_be_avx+0x31>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -18050,7 +18204,7 @@ _sk_load_rgb_u16_be_avx:
.byte 76,139,0 // mov (%rax),%r8
.byte 72,141,4,127 // lea (%rdi,%rdi,2),%rax
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,133,243,0,0,0 // jne 4dab <_sk_load_rgb_u16_be_avx+0x105>
+ .byte 15,133,243,0,0,0 // jne 4ed7 <_sk_load_rgb_u16_be_avx+0x105>
.byte 196,193,122,111,4,64 // vmovdqu (%r8,%rax,2),%xmm0
.byte 196,193,122,111,84,64,12 // vmovdqu 0xc(%r8,%rax,2),%xmm2
.byte 196,193,122,111,76,64,24 // vmovdqu 0x18(%r8,%rax,2),%xmm1
@@ -18077,7 +18231,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,18,18,0,0 // vbroadcastss 0x1212(%rip),%ymm11 # 5f54 <_sk_callback_avx+0x454>
+ .byte 196,98,125,24,29,18,18,0,0 // vbroadcastss 0x1212(%rip),%ymm11 # 6080 <_sk_callback_avx+0x454>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -18098,41 +18252,41 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,175,17,0,0 // vbroadcastss 0x11af(%rip),%ymm3 # 5f58 <_sk_callback_avx+0x458>
+ .byte 196,226,125,24,29,175,17,0,0 // vbroadcastss 0x11af(%rip),%ymm3 # 6084 <_sk_callback_avx+0x458>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0
.byte 196,193,121,196,68,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 117,5 // jne 4dc4 <_sk_load_rgb_u16_be_avx+0x11e>
- .byte 233,40,255,255,255 // jmpq 4cec <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 117,5 // jne 4ef0 <_sk_load_rgb_u16_be_avx+0x11e>
+ .byte 233,40,255,255,255 // jmpq 4e18 <_sk_load_rgb_u16_be_avx+0x46>
.byte 196,193,121,110,76,64,6 // vmovd 0x6(%r8,%rax,2),%xmm1
.byte 196,65,113,196,68,64,10,2 // vpinsrw $0x2,0xa(%r8,%rax,2),%xmm1,%xmm8
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,26 // jb 4df3 <_sk_load_rgb_u16_be_avx+0x14d>
+ .byte 114,26 // jb 4f1f <_sk_load_rgb_u16_be_avx+0x14d>
.byte 196,193,121,110,76,64,12 // vmovd 0xc(%r8,%rax,2),%xmm1
.byte 196,193,113,196,84,64,16,2 // vpinsrw $0x2,0x10(%r8,%rax,2),%xmm1,%xmm2
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 117,10 // jne 4df8 <_sk_load_rgb_u16_be_avx+0x152>
- .byte 233,249,254,255,255 // jmpq 4cec <_sk_load_rgb_u16_be_avx+0x46>
- .byte 233,244,254,255,255 // jmpq 4cec <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 117,10 // jne 4f24 <_sk_load_rgb_u16_be_avx+0x152>
+ .byte 233,249,254,255,255 // jmpq 4e18 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,244,254,255,255 // jmpq 4e18 <_sk_load_rgb_u16_be_avx+0x46>
.byte 196,193,121,110,76,64,18 // vmovd 0x12(%r8,%rax,2),%xmm1
.byte 196,65,113,196,76,64,22,2 // vpinsrw $0x2,0x16(%r8,%rax,2),%xmm1,%xmm9
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,26 // jb 4e27 <_sk_load_rgb_u16_be_avx+0x181>
+ .byte 114,26 // jb 4f53 <_sk_load_rgb_u16_be_avx+0x181>
.byte 196,193,121,110,76,64,24 // vmovd 0x18(%r8,%rax,2),%xmm1
.byte 196,193,113,196,76,64,28,2 // vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm1,%xmm1
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 117,10 // jne 4e2c <_sk_load_rgb_u16_be_avx+0x186>
- .byte 233,197,254,255,255 // jmpq 4cec <_sk_load_rgb_u16_be_avx+0x46>
- .byte 233,192,254,255,255 // jmpq 4cec <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 117,10 // jne 4f58 <_sk_load_rgb_u16_be_avx+0x186>
+ .byte 233,197,254,255,255 // jmpq 4e18 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,192,254,255,255 // jmpq 4e18 <_sk_load_rgb_u16_be_avx+0x46>
.byte 196,193,121,110,92,64,30 // vmovd 0x1e(%r8,%rax,2),%xmm3
.byte 196,65,97,196,92,64,34,2 // vpinsrw $0x2,0x22(%r8,%rax,2),%xmm3,%xmm11
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,20 // jb 4e55 <_sk_load_rgb_u16_be_avx+0x1af>
+ .byte 114,20 // jb 4f81 <_sk_load_rgb_u16_be_avx+0x1af>
.byte 196,193,121,110,92,64,36 // vmovd 0x24(%r8,%rax,2),%xmm3
.byte 196,193,97,196,92,64,40,2 // vpinsrw $0x2,0x28(%r8,%rax,2),%xmm3,%xmm3
- .byte 233,151,254,255,255 // jmpq 4cec <_sk_load_rgb_u16_be_avx+0x46>
- .byte 233,146,254,255,255 // jmpq 4cec <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,151,254,255,255 // jmpq 4e18 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,146,254,255,255 // jmpq 4e18 <_sk_load_rgb_u16_be_avx+0x46>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -18141,7 +18295,7 @@ _sk_store_u16_be_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax
- .byte 196,98,125,24,5,236,16,0,0 // vbroadcastss 0x10ec(%rip),%ymm8 # 5f5c <_sk_callback_avx+0x45c>
+ .byte 196,98,125,24,5,236,16,0,0 // vbroadcastss 0x10ec(%rip),%ymm8 # 6088 <_sk_callback_avx+0x45c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -18179,7 +18333,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,31 // jne 4f54 <_sk_store_u16_be_avx+0xfa>
+ .byte 117,31 // jne 5080 <_sk_store_u16_be_avx+0xfa>
.byte 196,65,120,17,28,64 // vmovups %xmm11,(%r8,%rax,2)
.byte 196,65,120,17,84,64,16 // vmovups %xmm10,0x10(%r8,%rax,2)
.byte 196,65,120,17,76,64,32 // vmovups %xmm9,0x20(%r8,%rax,2)
@@ -18188,22 +18342,22 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,64 // vmovq %xmm11,(%r8,%rax,2)
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,240 // je 4f50 <_sk_store_u16_be_avx+0xf6>
+ .byte 116,240 // je 507c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,23,92,64,8 // vmovhpd %xmm11,0x8(%r8,%rax,2)
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,227 // jb 4f50 <_sk_store_u16_be_avx+0xf6>
+ .byte 114,227 // jb 507c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,214,84,64,16 // vmovq %xmm10,0x10(%r8,%rax,2)
- .byte 116,218 // je 4f50 <_sk_store_u16_be_avx+0xf6>
+ .byte 116,218 // je 507c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,23,84,64,24 // vmovhpd %xmm10,0x18(%r8,%rax,2)
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,205 // jb 4f50 <_sk_store_u16_be_avx+0xf6>
+ .byte 114,205 // jb 507c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,214,76,64,32 // vmovq %xmm9,0x20(%r8,%rax,2)
- .byte 116,196 // je 4f50 <_sk_store_u16_be_avx+0xf6>
+ .byte 116,196 // je 507c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,23,76,64,40 // vmovhpd %xmm9,0x28(%r8,%rax,2)
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,183 // jb 4f50 <_sk_store_u16_be_avx+0xf6>
+ .byte 114,183 // jb 507c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,214,68,64,48 // vmovq %xmm8,0x30(%r8,%rax,2)
- .byte 235,174 // jmp 4f50 <_sk_store_u16_be_avx+0xf6>
+ .byte 235,174 // jmp 507c <_sk_store_u16_be_avx+0xf6>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
@@ -18211,10 +18365,10 @@ FUNCTION(_sk_load_f32_avx)
_sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 119,110 // ja 5018 <_sk_load_f32_avx+0x76>
+ .byte 119,110 // ja 5144 <_sk_load_f32_avx+0x76>
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9
- .byte 76,141,21,132,0,0,0 // lea 0x84(%rip),%r10 # 5040 <_sk_load_f32_avx+0x9e>
+ .byte 76,141,21,132,0,0,0 // lea 0x84(%rip),%r10 # 516c <_sk_load_f32_avx+0x9e>
.byte 73,99,4,138 // movslq (%r10,%rcx,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
@@ -18273,7 +18427,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 72,133,201 // test %rcx,%rcx
- .byte 117,55 // jne 50cd <_sk_store_f32_avx+0x6d>
+ .byte 117,55 // jne 51f9 <_sk_store_f32_avx+0x6d>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -18286,22 +18440,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,128 // vmovupd %xmm10,(%r8,%rax,4)
.byte 72,131,249,1 // cmp $0x1,%rcx
- .byte 116,240 // je 50c9 <_sk_store_f32_avx+0x69>
+ .byte 116,240 // je 51f5 <_sk_store_f32_avx+0x69>
.byte 196,65,121,17,76,128,16 // vmovupd %xmm9,0x10(%r8,%rax,4)
.byte 72,131,249,3 // cmp $0x3,%rcx
- .byte 114,227 // jb 50c9 <_sk_store_f32_avx+0x69>
+ .byte 114,227 // jb 51f5 <_sk_store_f32_avx+0x69>
.byte 196,65,121,17,68,128,32 // vmovupd %xmm8,0x20(%r8,%rax,4)
- .byte 116,218 // je 50c9 <_sk_store_f32_avx+0x69>
+ .byte 116,218 // je 51f5 <_sk_store_f32_avx+0x69>
.byte 196,65,121,17,92,128,48 // vmovupd %xmm11,0x30(%r8,%rax,4)
.byte 72,131,249,5 // cmp $0x5,%rcx
- .byte 114,205 // jb 50c9 <_sk_store_f32_avx+0x69>
+ .byte 114,205 // jb 51f5 <_sk_store_f32_avx+0x69>
.byte 196,67,125,25,84,128,64,1 // vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- .byte 116,195 // je 50c9 <_sk_store_f32_avx+0x69>
+ .byte 116,195 // je 51f5 <_sk_store_f32_avx+0x69>
.byte 196,67,125,25,76,128,80,1 // vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
.byte 72,131,249,7 // cmp $0x7,%rcx
- .byte 114,181 // jb 50c9 <_sk_store_f32_avx+0x69>
+ .byte 114,181 // jb 51f5 <_sk_store_f32_avx+0x69>
.byte 196,67,125,25,68,128,96,1 // vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- .byte 235,171 // jmp 50c9 <_sk_store_f32_avx+0x69>
+ .byte 235,171 // jmp 51f5 <_sk_store_f32_avx+0x69>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -18407,12 +18561,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,19,13,0,0 // vbroadcastss 0xd13(%rip),%ymm3 # 5f60 <_sk_callback_avx+0x460>
+ .byte 196,226,125,24,29,19,13,0,0 // vbroadcastss 0xd13(%rip),%ymm3 # 608c <_sk_callback_avx+0x460>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,10,13,0,0 // vbroadcastss 0xd0a(%rip),%ymm3 # 5f64 <_sk_callback_avx+0x464>
+ .byte 196,226,125,24,29,10,13,0,0 // vbroadcastss 0xd0a(%rip),%ymm3 # 6090 <_sk_callback_avx+0x464>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,253,12,0,0 // vbroadcastss 0xcfd(%rip),%ymm1 # 5f68 <_sk_callback_avx+0x468>
+ .byte 196,226,125,24,13,253,12,0,0 // vbroadcastss 0xcfd(%rip),%ymm1 # 6094 <_sk_callback_avx+0x468>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18590,7 +18744,7 @@ _sk_gradient_avx:
.byte 196,226,125,24,88,28 // vbroadcastss 0x1c(%rax),%ymm3
.byte 76,139,0 // mov (%rax),%r8
.byte 77,133,192 // test %r8,%r8
- .byte 15,132,146,0,0,0 // je 55c1 <_sk_gradient_avx+0xb8>
+ .byte 15,132,146,0,0,0 // je 56ed <_sk_gradient_avx+0xb8>
.byte 72,139,64,8 // mov 0x8(%rax),%rax
.byte 72,131,192,32 // add $0x20,%rax
.byte 196,65,28,87,228 // vxorps %ymm12,%ymm12,%ymm12
@@ -18617,8 +18771,8 @@ _sk_gradient_avx:
.byte 196,227,13,74,219,208 // vblendvps %ymm13,%ymm3,%ymm14,%ymm3
.byte 72,131,192,36 // add $0x24,%rax
.byte 73,255,200 // dec %r8
- .byte 117,140 // jne 554b <_sk_gradient_avx+0x42>
- .byte 235,20 // jmp 55d5 <_sk_gradient_avx+0xcc>
+ .byte 117,140 // jne 5677 <_sk_gradient_avx+0x42>
+ .byte 235,20 // jmp 5701 <_sk_gradient_avx+0xcc>
.byte 196,65,36,87,219 // vxorps %ymm11,%ymm11,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
@@ -18673,27 +18827,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,226,8,0,0 // vbroadcastss 0x8e2(%rip),%ymm13 # 5f6c <_sk_callback_avx+0x46c>
+ .byte 196,98,125,24,45,226,8,0,0 // vbroadcastss 0x8e2(%rip),%ymm13 # 6098 <_sk_callback_avx+0x46c>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,216,8,0,0 // vbroadcastss 0x8d8(%rip),%ymm14 # 5f70 <_sk_callback_avx+0x470>
+ .byte 196,98,125,24,53,216,8,0,0 // vbroadcastss 0x8d8(%rip),%ymm14 # 609c <_sk_callback_avx+0x470>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,201,8,0,0 // vbroadcastss 0x8c9(%rip),%ymm14 # 5f74 <_sk_callback_avx+0x474>
+ .byte 196,98,125,24,53,201,8,0,0 // vbroadcastss 0x8c9(%rip),%ymm14 # 60a0 <_sk_callback_avx+0x474>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,186,8,0,0 // vbroadcastss 0x8ba(%rip),%ymm13 # 5f78 <_sk_callback_avx+0x478>
+ .byte 196,98,125,24,45,186,8,0,0 // vbroadcastss 0x8ba(%rip),%ymm13 # 60a4 <_sk_callback_avx+0x478>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,165,8,0,0 // vbroadcastss 0x8a5(%rip),%ymm10 # 5f7c <_sk_callback_avx+0x47c>
+ .byte 196,98,125,24,21,165,8,0,0 // vbroadcastss 0x8a5(%rip),%ymm10 # 60a8 <_sk_callback_avx+0x47c>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,143,8,0,0 // vbroadcastss 0x88f(%rip),%ymm10 # 5f80 <_sk_callback_avx+0x480>
+ .byte 196,98,125,24,21,143,8,0,0 // vbroadcastss 0x88f(%rip),%ymm10 # 60ac <_sk_callback_avx+0x480>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,121,8,0,0 // vbroadcastss 0x879(%rip),%ymm10 # 5f84 <_sk_callback_avx+0x484>
+ .byte 196,98,125,24,21,121,8,0,0 // vbroadcastss 0x879(%rip),%ymm10 # 60b0 <_sk_callback_avx+0x484>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -18718,7 +18872,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,63,8,0,0 // vbroadcastss 0x83f(%rip),%ymm8 # 5f88 <_sk_callback_avx+0x488>
+ .byte 196,98,125,24,5,63,8,0,0 // vbroadcastss 0x83f(%rip),%ymm8 # 60b4 <_sk_callback_avx+0x488>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -18755,9 +18909,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,203,7,0,0 // vbroadcastss 0x7cb(%rip),%ymm0 # 5f8c <_sk_callback_avx+0x48c>
+ .byte 196,226,125,24,5,203,7,0,0 // vbroadcastss 0x7cb(%rip),%ymm0 # 60b8 <_sk_callback_avx+0x48c>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,194,7,0,0 // vbroadcastss 0x7c2(%rip),%ymm8 # 5f90 <_sk_callback_avx+0x490>
+ .byte 196,98,125,24,5,194,7,0,0 // vbroadcastss 0x7c2(%rip),%ymm8 # 60bc <_sk_callback_avx+0x490>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18768,7 +18922,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,170,7,0,0 // vbroadcastss 0x7aa(%rip),%ymm0 # 5f94 <_sk_callback_avx+0x494>
+ .byte 196,226,125,24,5,170,7,0,0 // vbroadcastss 0x7aa(%rip),%ymm0 # 60c0 <_sk_callback_avx+0x494>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18780,9 +18934,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,142,7,0,0 // vbroadcastss 0x78e(%rip),%ymm1 # 5f98 <_sk_callback_avx+0x498>
+ .byte 196,226,125,24,13,142,7,0,0 // vbroadcastss 0x78e(%rip),%ymm1 # 60c4 <_sk_callback_avx+0x498>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,132,7,0,0 // vbroadcastss 0x784(%rip),%ymm8 # 5f9c <_sk_callback_avx+0x49c>
+ .byte 196,98,125,24,5,132,7,0,0 // vbroadcastss 0x784(%rip),%ymm8 # 60c8 <_sk_callback_avx+0x49c>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18793,7 +18947,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,108,7,0,0 // vbroadcastss 0x76c(%rip),%ymm1 # 5fa0 <_sk_callback_avx+0x4a0>
+ .byte 196,226,125,24,13,108,7,0,0 // vbroadcastss 0x76c(%rip),%ymm1 # 60cc <_sk_callback_avx+0x4a0>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18805,14 +18959,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,79,7,0,0 // vbroadcastss 0x74f(%rip),%ymm0 # 5fa4 <_sk_callback_avx+0x4a4>
+ .byte 196,226,125,24,5,79,7,0,0 // vbroadcastss 0x74f(%rip),%ymm0 # 60d0 <_sk_callback_avx+0x4a4>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,70,7,0,0 // vbroadcastss 0x746(%rip),%ymm8 # 5fa8 <_sk_callback_avx+0x4a8>
+ .byte 196,98,125,24,5,70,7,0,0 // vbroadcastss 0x746(%rip),%ymm8 # 60d4 <_sk_callback_avx+0x4a8>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,55,7,0,0 // vbroadcastss 0x737(%rip),%ymm10 # 5fac <_sk_callback_avx+0x4ac>
+ .byte 196,98,125,24,21,55,7,0,0 // vbroadcastss 0x737(%rip),%ymm10 # 60d8 <_sk_callback_avx+0x4ac>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,45,7,0,0 // vbroadcastss 0x72d(%rip),%ymm10 # 5fb0 <_sk_callback_avx+0x4b0>
+ .byte 196,98,125,24,21,45,7,0,0 // vbroadcastss 0x72d(%rip),%ymm10 # 60dc <_sk_callback_avx+0x4b0>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18824,19 +18978,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,16,7,0,0 // vbroadcastss 0x710(%rip),%ymm0 # 5fb4 <_sk_callback_avx+0x4b4>
+ .byte 196,226,125,24,5,16,7,0,0 // vbroadcastss 0x710(%rip),%ymm0 # 60e0 <_sk_callback_avx+0x4b4>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,7,7,0,0 // vbroadcastss 0x707(%rip),%ymm8 # 5fb8 <_sk_callback_avx+0x4b8>
+ .byte 196,98,125,24,5,7,7,0,0 // vbroadcastss 0x707(%rip),%ymm8 # 60e4 <_sk_callback_avx+0x4b8>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,253,6,0,0 // vbroadcastss 0x6fd(%rip),%ymm9 # 5fbc <_sk_callback_avx+0x4bc>
+ .byte 196,98,125,24,13,253,6,0,0 // vbroadcastss 0x6fd(%rip),%ymm9 # 60e8 <_sk_callback_avx+0x4bc>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm10 # 5fc0 <_sk_callback_avx+0x4c0>
+ .byte 196,98,125,24,21,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm10 # 60ec <_sk_callback_avx+0x4c0>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,228,6,0,0 // vbroadcastss 0x6e4(%rip),%ymm10 # 5fc4 <_sk_callback_avx+0x4c4>
+ .byte 196,98,125,24,21,228,6,0,0 // vbroadcastss 0x6e4(%rip),%ymm10 # 60f0 <_sk_callback_avx+0x4c4>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,213,6,0,0 // vbroadcastss 0x6d5(%rip),%ymm9 # 5fc8 <_sk_callback_avx+0x4c8>
+ .byte 196,98,125,24,13,213,6,0,0 // vbroadcastss 0x6d5(%rip),%ymm9 # 60f4 <_sk_callback_avx+0x4c8>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18847,17 +19001,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,189,6,0,0 // vbroadcastss 0x6bd(%rip),%ymm8 # 5fcc <_sk_callback_avx+0x4cc>
+ .byte 196,98,125,24,5,189,6,0,0 // vbroadcastss 0x6bd(%rip),%ymm8 # 60f8 <_sk_callback_avx+0x4cc>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,175,6,0,0 // vbroadcastss 0x6af(%rip),%ymm10 # 5fd0 <_sk_callback_avx+0x4d0>
+ .byte 196,98,125,24,21,175,6,0,0 // vbroadcastss 0x6af(%rip),%ymm10 # 60fc <_sk_callback_avx+0x4d0>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,165,6,0,0 // vbroadcastss 0x6a5(%rip),%ymm11 # 5fd4 <_sk_callback_avx+0x4d4>
+ .byte 196,98,125,24,29,165,6,0,0 // vbroadcastss 0x6a5(%rip),%ymm11 # 6100 <_sk_callback_avx+0x4d4>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,140,6,0,0 // vbroadcastss 0x68c(%rip),%ymm9 # 5fd8 <_sk_callback_avx+0x4d8>
+ .byte 196,98,125,24,13,140,6,0,0 // vbroadcastss 0x68c(%rip),%ymm9 # 6104 <_sk_callback_avx+0x4d8>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18868,13 +19022,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,116,6,0,0 // vbroadcastss 0x674(%rip),%ymm0 # 5fdc <_sk_callback_avx+0x4dc>
+ .byte 196,226,125,24,5,116,6,0,0 // vbroadcastss 0x674(%rip),%ymm0 # 6108 <_sk_callback_avx+0x4dc>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,97,6,0,0 // vbroadcastss 0x661(%rip),%ymm10 # 5fe0 <_sk_callback_avx+0x4e0>
+ .byte 196,98,125,24,21,97,6,0,0 // vbroadcastss 0x661(%rip),%ymm10 # 610c <_sk_callback_avx+0x4e0>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,87,6,0,0 // vbroadcastss 0x657(%rip),%ymm10 # 5fe4 <_sk_callback_avx+0x4e4>
+ .byte 196,98,125,24,21,87,6,0,0 // vbroadcastss 0x657(%rip),%ymm10 # 6110 <_sk_callback_avx+0x4e4>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18886,14 +19040,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm1 # 5fe8 <_sk_callback_avx+0x4e8>
+ .byte 196,226,125,24,13,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm1 # 6114 <_sk_callback_avx+0x4e8>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,48,6,0,0 // vbroadcastss 0x630(%rip),%ymm8 # 5fec <_sk_callback_avx+0x4ec>
+ .byte 196,98,125,24,5,48,6,0,0 // vbroadcastss 0x630(%rip),%ymm8 # 6118 <_sk_callback_avx+0x4ec>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm10 # 5ff0 <_sk_callback_avx+0x4f0>
+ .byte 196,98,125,24,21,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm10 # 611c <_sk_callback_avx+0x4f0>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,23,6,0,0 // vbroadcastss 0x617(%rip),%ymm10 # 5ff4 <_sk_callback_avx+0x4f4>
+ .byte 196,98,125,24,21,23,6,0,0 // vbroadcastss 0x617(%rip),%ymm10 # 6120 <_sk_callback_avx+0x4f4>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18905,19 +19059,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,250,5,0,0 // vbroadcastss 0x5fa(%rip),%ymm1 # 5ff8 <_sk_callback_avx+0x4f8>
+ .byte 196,226,125,24,13,250,5,0,0 // vbroadcastss 0x5fa(%rip),%ymm1 # 6124 <_sk_callback_avx+0x4f8>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,240,5,0,0 // vbroadcastss 0x5f0(%rip),%ymm8 # 5ffc <_sk_callback_avx+0x4fc>
+ .byte 196,98,125,24,5,240,5,0,0 // vbroadcastss 0x5f0(%rip),%ymm8 # 6128 <_sk_callback_avx+0x4fc>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,230,5,0,0 // vbroadcastss 0x5e6(%rip),%ymm9 # 6000 <_sk_callback_avx+0x500>
+ .byte 196,98,125,24,13,230,5,0,0 // vbroadcastss 0x5e6(%rip),%ymm9 # 612c <_sk_callback_avx+0x500>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,220,5,0,0 // vbroadcastss 0x5dc(%rip),%ymm10 # 6004 <_sk_callback_avx+0x504>
+ .byte 196,98,125,24,21,220,5,0,0 // vbroadcastss 0x5dc(%rip),%ymm10 # 6130 <_sk_callback_avx+0x504>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,205,5,0,0 // vbroadcastss 0x5cd(%rip),%ymm10 # 6008 <_sk_callback_avx+0x508>
+ .byte 196,98,125,24,21,205,5,0,0 // vbroadcastss 0x5cd(%rip),%ymm10 # 6134 <_sk_callback_avx+0x508>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,190,5,0,0 // vbroadcastss 0x5be(%rip),%ymm9 # 600c <_sk_callback_avx+0x50c>
+ .byte 196,98,125,24,13,190,5,0,0 // vbroadcastss 0x5be(%rip),%ymm9 # 6138 <_sk_callback_avx+0x50c>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18928,17 +19082,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,166,5,0,0 // vbroadcastss 0x5a6(%rip),%ymm8 # 6010 <_sk_callback_avx+0x510>
+ .byte 196,98,125,24,5,166,5,0,0 // vbroadcastss 0x5a6(%rip),%ymm8 # 613c <_sk_callback_avx+0x510>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,151,5,0,0 // vbroadcastss 0x597(%rip),%ymm10 # 6014 <_sk_callback_avx+0x514>
+ .byte 196,98,125,24,21,151,5,0,0 // vbroadcastss 0x597(%rip),%ymm10 # 6140 <_sk_callback_avx+0x514>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,141,5,0,0 // vbroadcastss 0x58d(%rip),%ymm11 # 6018 <_sk_callback_avx+0x518>
+ .byte 196,98,125,24,29,141,5,0,0 // vbroadcastss 0x58d(%rip),%ymm11 # 6144 <_sk_callback_avx+0x518>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,116,5,0,0 // vbroadcastss 0x574(%rip),%ymm9 # 601c <_sk_callback_avx+0x51c>
+ .byte 196,98,125,24,13,116,5,0,0 // vbroadcastss 0x574(%rip),%ymm9 # 6148 <_sk_callback_avx+0x51c>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18949,13 +19103,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,92,5,0,0 // vbroadcastss 0x55c(%rip),%ymm1 # 6020 <_sk_callback_avx+0x520>
+ .byte 196,226,125,24,13,92,5,0,0 // vbroadcastss 0x55c(%rip),%ymm1 # 614c <_sk_callback_avx+0x520>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,72,5,0,0 // vbroadcastss 0x548(%rip),%ymm10 # 6024 <_sk_callback_avx+0x524>
+ .byte 196,98,125,24,21,72,5,0,0 // vbroadcastss 0x548(%rip),%ymm10 # 6150 <_sk_callback_avx+0x524>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,62,5,0,0 // vbroadcastss 0x53e(%rip),%ymm10 # 6028 <_sk_callback_avx+0x528>
+ .byte 196,98,125,24,21,62,5,0,0 // vbroadcastss 0x53e(%rip),%ymm10 # 6154 <_sk_callback_avx+0x528>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -19075,35 +19229,35 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,191,0,0,224 // add %al,-0x1fffff41(%rax)
- .byte 64,0,0 // add %al,(%rax)
- .byte 128,63,154 // cmpb $0x9a,(%rdi)
+ .byte 64,154 // rex (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5cdd <.literal4+0xb5>
+ .byte 71,225,61 // rex.RXB loope 5e05 <.literal4+0xb1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5ced <.literal4+0xc5>
+ .byte 71,225,61 // rex.RXB loope 5e15 <.literal4+0xc1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5cfd <.literal4+0xd5>
+ .byte 71,225,61 // rex.RXB loope 5e25 <.literal4+0xd1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5d0d <.literal4+0xe5>
+ .byte 71,225,61 // rex.RXB loope 5e35 <.literal4+0xe1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
.byte 63 // (bad)
- .byte 145 // xchg %eax,%ecx
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,145 // cmpb $0x91,(%rdi)
.byte 131,158,61,154,153,153,62 // sbbl $0x3e,-0x666665c3(%rsi)
.byte 92 // pop %rsp
.byte 143 // (bad)
@@ -19147,7 +19301,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5d55 <.literal4+0x12d>
+ .byte 224,7 // loopne 5e81 <.literal4+0x12d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19163,10 +19317,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 5d7c <.literal4+0x154>
+ .byte 127,0 // jg 5ea8 <.literal4+0x154>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5df5 <.literal4+0x1cd>
+ .byte 119,115 // ja 5f21 <.literal4+0x1cd>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19180,10 +19334,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5db0 <.literal4+0x188>
+ .byte 127,0 // jg 5edc <.literal4+0x188>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5e29 <.literal4+0x201>
+ .byte 119,115 // ja 5f55 <.literal4+0x201>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19197,10 +19351,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5de4 <.literal4+0x1bc>
+ .byte 127,0 // jg 5f10 <.literal4+0x1bc>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5e5d <.literal4+0x235>
+ .byte 119,115 // ja 5f89 <.literal4+0x235>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19214,10 +19368,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5e18 <.literal4+0x1f0>
+ .byte 127,0 // jg 5f44 <.literal4+0x1f0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5e91 <.literal4+0x269>
+ .byte 119,115 // ja 5fbd <.literal4+0x269>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19230,7 +19384,7 @@ BALIGN4
.byte 0,75,0 // add %cl,0x0(%rbx)
.byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 5e8f <.literal4+0x267>
+ .byte 127,67 // jg 5fbb <.literal4+0x267>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -19242,10 +19396,10 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5eaf <.literal4+0x287>
+ .byte 118,63 // jbe 5fdb <.literal4+0x287>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 5ec3 <.literal4+0x29b>
+ .byte 127,67 // jg 5fef <.literal4+0x29b>
.byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax)
@@ -19254,7 +19408,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5ea5 <.literal4+0x27d>
+ .byte 224,7 // loopne 5fd1 <.literal4+0x27d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19266,7 +19420,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5ec1 <.literal4+0x299>
+ .byte 224,7 // loopne 5fed <.literal4+0x299>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19277,7 +19431,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 5f16 <.literal4+0x2ee>
+ .byte 124,66 // jl 6042 <.literal4+0x2ee>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -19295,9 +19449,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 5f59 <.literal4+0x331>
+ .byte 112,65 // jo 6085 <.literal4+0x331>
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 5f67 <.literal4+0x33f>
+ .byte 127,67 // jg 6093 <.literal4+0x33f>
.byte 0,128,0,0,0,0 // add %al,0x0(%rax)
.byte 0,128,0,4,0,128 // add %al,-0x7ffffc00(%rax)
.byte 0,0 // add %al,(%rax)
@@ -19313,7 +19467,7 @@ BALIGN4
.byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax)
.byte 63 // (bad)
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 5fa7 <.literal4+0x37f>
+ .byte 127,71 // jg 60d3 <.literal4+0x37f>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,89 // ds pop %rcx
@@ -19540,7 +19694,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,199 // movd %edi,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,180,66,0,0 // movaps 0x42b4(%rip),%xmm2 # 4330 <_sk_callback_sse41+0xde>
+ .byte 15,40,21,4,68,0,0 // movaps 0x4404(%rip),%xmm2 # 4480 <_sk_callback_sse41+0xdc>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,2 // movups (%rdx),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -19549,7 +19703,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,163,66,0,0 // movaps 0x42a3(%rip),%xmm2 # 4340 <_sk_callback_sse41+0xee>
+ .byte 15,40,21,243,67,0,0 // movaps 0x43f3(%rip),%xmm2 # 4490 <_sk_callback_sse41+0xec>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -19572,14 +19726,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,1 // movd (%rcx),%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,104,66,0,0 // movdqa 0x4268(%rip),%xmm10 # 4350 <_sk_callback_sse41+0xfe>
+ .byte 102,68,15,111,21,184,67,0,0 // movdqa 0x43b8(%rip),%xmm10 # 44a0 <_sk_callback_sse41+0xfc>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,84,66,0,0 // movdqa 0x4254(%rip),%xmm12 # 4360 <_sk_callback_sse41+0x10e>
- .byte 102,68,15,111,45,91,66,0,0 // movdqa 0x425b(%rip),%xmm13 # 4370 <_sk_callback_sse41+0x11e>
+ .byte 102,68,15,111,37,164,67,0,0 // movdqa 0x43a4(%rip),%xmm12 # 44b0 <_sk_callback_sse41+0x10c>
+ .byte 102,68,15,111,45,171,67,0,0 // movdqa 0x43ab(%rip),%xmm13 # 44c0 <_sk_callback_sse41+0x11c>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -19595,8 +19749,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,22,66,0,0 // mulps 0x4216(%rip),%xmm8 # 4380 <_sk_callback_sse41+0x12e>
- .byte 68,15,88,5,30,66,0,0 // addps 0x421e(%rip),%xmm8 # 4390 <_sk_callback_sse41+0x13e>
+ .byte 68,15,89,5,102,67,0,0 // mulps 0x4366(%rip),%xmm8 # 44d0 <_sk_callback_sse41+0x12c>
+ .byte 68,15,88,5,110,67,0,0 // addps 0x436e(%rip),%xmm8 # 44e0 <_sk_callback_sse41+0x13c>
.byte 243,68,15,16,72,8 // movss 0x8(%rax),%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -19638,7 +19792,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,203,65,0,0 // movaps 0x41cb(%rip),%xmm8 # 43a0 <_sk_callback_sse41+0x14e>
+ .byte 68,15,40,5,27,67,0,0 // movaps 0x431b(%rip),%xmm8 # 44f0 <_sk_callback_sse41+0x14c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -19663,7 +19817,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,142,65,0,0 // movaps 0x418e(%rip),%xmm9 # 43b0 <_sk_callback_sse41+0x15e>
+ .byte 68,15,40,13,222,66,0,0 // movaps 0x42de(%rip),%xmm9 # 4500 <_sk_callback_sse41+0x15c>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -19710,7 +19864,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,50,65,0,0 // movaps 0x4132(%rip),%xmm8 # 43c0 <_sk_callback_sse41+0x16e>
+ .byte 68,15,40,5,130,66,0,0 // movaps 0x4282(%rip),%xmm8 # 4510 <_sk_callback_sse41+0x16c>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -19723,7 +19877,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,34,65,0,0 // movaps 0x4122(%rip),%xmm8 # 43d0 <_sk_callback_sse41+0x17e>
+ .byte 68,15,40,5,114,66,0,0 // movaps 0x4272(%rip),%xmm8 # 4520 <_sk_callback_sse41+0x17c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -19740,7 +19894,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,5,65,0,0 // movaps 0x4105(%rip),%xmm8 # 43e0 <_sk_callback_sse41+0x18e>
+ .byte 68,15,40,5,85,66,0,0 // movaps 0x4255(%rip),%xmm8 # 4530 <_sk_callback_sse41+0x18c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -19760,7 +19914,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,217,64,0,0 // movaps 0x40d9(%rip),%xmm8 # 43f0 <_sk_callback_sse41+0x19e>
+ .byte 68,15,40,5,41,66,0,0 // movaps 0x4229(%rip),%xmm8 # 4540 <_sk_callback_sse41+0x19c>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -19788,7 +19942,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,173,64,0,0 // movaps 0x40ad(%rip),%xmm8 # 4400 <_sk_callback_sse41+0x1ae>
+ .byte 68,15,40,5,253,65,0,0 // movaps 0x41fd(%rip),%xmm8 # 4550 <_sk_callback_sse41+0x1ac>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -19864,7 +20018,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,222,63,0,0 // movaps 0x3fde(%rip),%xmm3 # 4410 <_sk_callback_sse41+0x1be>
+ .byte 15,40,29,46,65,0,0 // movaps 0x412e(%rip),%xmm3 # 4560 <_sk_callback_sse41+0x1bc>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -19912,7 +20066,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,73,63,0,0 // movaps 0x3f49(%rip),%xmm2 # 4420 <_sk_callback_sse41+0x1ce>
+ .byte 15,40,21,153,64,0,0 // movaps 0x4099(%rip),%xmm2 # 4570 <_sk_callback_sse41+0x1cc>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -19946,7 +20100,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,238,62,0,0 // movaps 0x3eee(%rip),%xmm2 # 4430 <_sk_callback_sse41+0x1de>
+ .byte 15,40,21,62,64,0,0 // movaps 0x403e(%rip),%xmm2 # 4580 <_sk_callback_sse41+0x1dc>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -19983,7 +20137,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,136,62,0,0 // movaps 0x3e88(%rip),%xmm2 # 4440 <_sk_callback_sse41+0x1ee>
+ .byte 15,40,21,216,63,0,0 // movaps 0x3fd8(%rip),%xmm2 # 4590 <_sk_callback_sse41+0x1ec>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -20010,7 +20164,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,202 // subps %xmm2,%xmm9
- .byte 15,40,13,73,62,0,0 // movaps 0x3e49(%rip),%xmm1 # 4450 <_sk_callback_sse41+0x1fe>
+ .byte 15,40,13,153,63,0,0 // movaps 0x3f99(%rip),%xmm1 # 45a0 <_sk_callback_sse41+0x1fc>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -20024,7 +20178,7 @@ HIDDEN _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,56,62,0,0 // movaps 0x3e38(%rip),%xmm10 # 4460 <_sk_callback_sse41+0x20e>
+ .byte 68,15,40,21,136,63,0,0 // movaps 0x3f88(%rip),%xmm10 # 45b0 <_sk_callback_sse41+0x20c>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,203 // movaps %xmm11,%xmm9
@@ -20106,7 +20260,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,22,61,0,0 // movaps 0x3d16(%rip),%xmm10 # 4470 <_sk_callback_sse41+0x21e>
+ .byte 68,15,40,21,102,62,0,0 // movaps 0x3e66(%rip),%xmm10 # 45c0 <_sk_callback_sse41+0x21c>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -20188,7 +20342,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,239,59,0,0 // movaps 0x3bef(%rip),%xmm10 # 4480 <_sk_callback_sse41+0x22e>
+ .byte 68,15,40,21,63,61,0,0 // movaps 0x3d3f(%rip),%xmm10 # 45d0 <_sk_callback_sse41+0x22c>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -20271,7 +20425,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,212,58,0,0 // movaps 0x3ad4(%rip),%xmm10 # 4490 <_sk_callback_sse41+0x23e>
+ .byte 68,15,40,21,36,60,0,0 // movaps 0x3c24(%rip),%xmm10 # 45e0 <_sk_callback_sse41+0x23c>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -20356,7 +20510,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,171,57,0,0 // movaps 0x39ab(%rip),%xmm1 # 44a0 <_sk_callback_sse41+0x24e>
+ .byte 15,40,13,251,58,0,0 // movaps 0x3afb(%rip),%xmm1 # 45f0 <_sk_callback_sse41+0x24c>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -20369,10 +20523,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,137,57,0,0 // movaps 0x3989(%rip),%xmm13 # 44b0 <_sk_callback_sse41+0x25e>
+ .byte 68,15,40,45,217,58,0,0 // movaps 0x3ad9(%rip),%xmm13 # 4600 <_sk_callback_sse41+0x25c>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,137,57,0,0 // movaps 0x3989(%rip),%xmm12 # 44c0 <_sk_callback_sse41+0x26e>
+ .byte 68,15,40,37,217,58,0,0 // movaps 0x3ad9(%rip),%xmm12 # 4610 <_sk_callback_sse41+0x26c>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -20508,158 +20662,179 @@ HIDDEN _sk_hue_sse41
.globl _sk_hue_sse41
FUNCTION(_sk_hue_sse41)
_sk_hue_sse41:
- .byte 15,41,124,36,232 // movaps %xmm7,-0x18(%rsp)
- .byte 68,15,40,214 // movaps %xmm6,%xmm10
- .byte 68,15,40,229 // movaps %xmm5,%xmm12
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 69,15,87,246 // xorps %xmm14,%xmm14
- .byte 68,15,40,45,152,55,0,0 // movaps 0x3798(%rip),%xmm13 # 44d0 <_sk_callback_sse41+0x27e>
- .byte 65,15,40,221 // movaps %xmm13,%xmm3
- .byte 15,94,222 // divps %xmm6,%xmm3
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 65,15,194,198,4 // cmpneqps %xmm14,%xmm0
- .byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,89,192 // mulps %xmm0,%xmm8
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,89,194 // mulps %xmm2,%xmm0
- .byte 69,15,40,204 // movaps %xmm12,%xmm9
- .byte 69,15,40,220 // movaps %xmm12,%xmm11
- .byte 65,15,40,228 // movaps %xmm12,%xmm4
- .byte 65,15,40,234 // movaps %xmm10,%xmm5
- .byte 15,95,229 // maxps %xmm5,%xmm4
- .byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 68,15,40,215 // movaps %xmm7,%xmm10
- .byte 15,40,223 // movaps %xmm7,%xmm3
- .byte 15,95,220 // maxps %xmm4,%xmm3
- .byte 68,15,93,205 // minps %xmm5,%xmm9
- .byte 15,41,108,36,216 // movaps %xmm5,-0x28(%rsp)
- .byte 65,15,93,209 // minps %xmm9,%xmm2
- .byte 15,92,218 // subps %xmm2,%xmm3
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,93,208 // minps %xmm0,%xmm2
- .byte 65,15,40,224 // movaps %xmm8,%xmm4
- .byte 15,93,226 // minps %xmm2,%xmm4
- .byte 68,15,40,201 // movaps %xmm1,%xmm9
- .byte 68,15,95,200 // maxps %xmm0,%xmm9
- .byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 65,15,95,209 // maxps %xmm9,%xmm2
- .byte 15,92,212 // subps %xmm4,%xmm2
- .byte 68,15,92,196 // subps %xmm4,%xmm8
- .byte 68,15,89,195 // mulps %xmm3,%xmm8
- .byte 68,15,94,194 // divps %xmm2,%xmm8
- .byte 15,92,204 // subps %xmm4,%xmm1
- .byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,94,202 // divps %xmm2,%xmm1
- .byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,94,194 // divps %xmm2,%xmm0
- .byte 65,15,194,214,4 // cmpneqps %xmm14,%xmm2
- .byte 68,15,84,194 // andps %xmm2,%xmm8
- .byte 15,84,202 // andps %xmm2,%xmm1
- .byte 15,84,194 // andps %xmm2,%xmm0
- .byte 68,15,40,13,7,55,0,0 // movaps 0x3707(%rip),%xmm9 # 44e0 <_sk_callback_sse41+0x28e>
- .byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 15,40,29,12,55,0,0 // movaps 0x370c(%rip),%xmm3 # 44f0 <_sk_callback_sse41+0x29e>
- .byte 68,15,89,219 // mulps %xmm3,%xmm11
- .byte 69,15,88,218 // addps %xmm10,%xmm11
- .byte 68,15,40,53,12,55,0,0 // movaps 0x370c(%rip),%xmm14 # 4500 <_sk_callback_sse41+0x2ae>
- .byte 68,15,40,253 // movaps %xmm5,%xmm15
+ .byte 15,41,124,36,152 // movaps %xmm7,-0x68(%rsp)
+ .byte 68,15,40,246 // movaps %xmm6,%xmm14
+ .byte 15,40,244 // movaps %xmm4,%xmm6
+ .byte 68,15,40,195 // movaps %xmm3,%xmm8
+ .byte 15,41,84,36,232 // movaps %xmm2,-0x18(%rsp)
+ .byte 15,41,76,36,216 // movaps %xmm1,-0x28(%rsp)
+ .byte 68,15,40,208 // movaps %xmm0,%xmm10
+ .byte 68,15,41,84,36,200 // movaps %xmm10,-0x38(%rsp)
+ .byte 69,15,89,208 // mulps %xmm8,%xmm10
+ .byte 65,15,89,200 // mulps %xmm8,%xmm1
+ .byte 68,15,40,234 // movaps %xmm2,%xmm13
+ .byte 69,15,89,232 // mulps %xmm8,%xmm13
+ .byte 68,15,40,205 // movaps %xmm5,%xmm9
+ .byte 68,15,40,221 // movaps %xmm5,%xmm11
+ .byte 15,41,108,36,184 // movaps %xmm5,-0x48(%rsp)
+ .byte 69,15,95,222 // maxps %xmm14,%xmm11
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 68,15,40,230 // movaps %xmm6,%xmm12
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 65,15,95,211 // maxps %xmm11,%xmm2
+ .byte 65,15,40,230 // movaps %xmm14,%xmm4
+ .byte 15,41,100,36,168 // movaps %xmm4,-0x58(%rsp)
+ .byte 68,15,93,204 // minps %xmm4,%xmm9
+ .byte 65,15,93,249 // minps %xmm9,%xmm7
+ .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,40,249 // movaps %xmm1,%xmm7
+ .byte 65,15,93,253 // minps %xmm13,%xmm7
+ .byte 65,15,40,218 // movaps %xmm10,%xmm3
+ .byte 15,93,223 // minps %xmm7,%xmm3
+ .byte 15,40,249 // movaps %xmm1,%xmm7
+ .byte 65,15,95,253 // maxps %xmm13,%xmm7
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 15,95,199 // maxps %xmm7,%xmm0
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 65,15,89,208 // mulps %xmm8,%xmm2
+ .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 68,15,92,211 // subps %xmm3,%xmm10
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 68,15,92,235 // subps %xmm3,%xmm13
+ .byte 15,87,219 // xorps %xmm3,%xmm3
+ .byte 68,15,89,210 // mulps %xmm2,%xmm10
+ .byte 68,15,94,208 // divps %xmm0,%xmm10
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,94,200 // divps %xmm0,%xmm1
+ .byte 68,15,89,234 // mulps %xmm2,%xmm13
+ .byte 68,15,94,232 // divps %xmm0,%xmm13
+ .byte 15,194,195,4 // cmpneqps %xmm3,%xmm0
+ .byte 68,15,84,208 // andps %xmm0,%xmm10
+ .byte 15,84,200 // andps %xmm0,%xmm1
+ .byte 68,15,84,232 // andps %xmm0,%xmm13
+ .byte 15,40,5,68,56,0,0 // movaps 0x3844(%rip),%xmm0 # 4620 <_sk_callback_sse41+0x27c>
+ .byte 68,15,89,224 // mulps %xmm0,%xmm12
+ .byte 15,40,21,73,56,0,0 // movaps 0x3849(%rip),%xmm2 # 4630 <_sk_callback_sse41+0x28c>
+ .byte 15,89,250 // mulps %xmm2,%xmm7
+ .byte 65,15,88,252 // addps %xmm12,%xmm7
+ .byte 68,15,40,53,74,56,0,0 // movaps 0x384a(%rip),%xmm14 # 4640 <_sk_callback_sse41+0x29c>
+ .byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
- .byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 65,15,40,224 // movaps %xmm8,%xmm4
- .byte 65,15,89,225 // mulps %xmm9,%xmm4
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,89,211 // mulps %xmm3,%xmm2
- .byte 15,88,212 // addps %xmm4,%xmm2
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 65,15,89,230 // mulps %xmm14,%xmm4
- .byte 15,88,226 // addps %xmm2,%xmm4
- .byte 68,15,92,252 // subps %xmm4,%xmm15
- .byte 69,15,88,199 // addps %xmm15,%xmm8
+ .byte 68,15,88,255 // addps %xmm7,%xmm15
+ .byte 65,15,40,218 // movaps %xmm10,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,40,249 // movaps %xmm1,%xmm7
+ .byte 15,89,250 // mulps %xmm2,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 65,15,40,221 // movaps %xmm13,%xmm3
+ .byte 65,15,89,222 // mulps %xmm14,%xmm3
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 69,15,89,248 // mulps %xmm8,%xmm15
+ .byte 68,15,92,251 // subps %xmm3,%xmm15
+ .byte 69,15,88,215 // addps %xmm15,%xmm10
.byte 65,15,88,207 // addps %xmm15,%xmm1
- .byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 65,15,93,199 // minps %xmm15,%xmm0
- .byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 15,93,208 // minps %xmm0,%xmm2
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 65,15,95,231 // maxps %xmm15,%xmm4
- .byte 69,15,89,200 // mulps %xmm8,%xmm9
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 65,15,88,217 // addps %xmm9,%xmm3
+ .byte 69,15,88,253 // addps %xmm13,%xmm15
+ .byte 15,40,217 // movaps %xmm1,%xmm3
+ .byte 65,15,93,223 // minps %xmm15,%xmm3
+ .byte 65,15,40,250 // movaps %xmm10,%xmm7
+ .byte 15,93,251 // minps %xmm3,%xmm7
+ .byte 65,15,89,194 // mulps %xmm10,%xmm0
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
.byte 69,15,89,247 // mulps %xmm15,%xmm14
- .byte 68,15,88,243 // addps %xmm3,%xmm14
- .byte 15,87,237 // xorps %xmm5,%xmm5
- .byte 15,194,234,2 // cmpleps %xmm2,%xmm5
- .byte 69,15,40,200 // movaps %xmm8,%xmm9
- .byte 69,15,92,206 // subps %xmm14,%xmm9
- .byte 69,15,89,206 // mulps %xmm14,%xmm9
+ .byte 68,15,88,242 // addps %xmm2,%xmm14
+ .byte 69,15,87,201 // xorps %xmm9,%xmm9
+ .byte 68,15,194,207,2 // cmpleps %xmm7,%xmm9
.byte 65,15,40,222 // movaps %xmm14,%xmm3
- .byte 15,92,218 // subps %xmm2,%xmm3
- .byte 68,15,94,203 // divps %xmm3,%xmm9
- .byte 69,15,88,206 // addps %xmm14,%xmm9
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 102,69,15,56,20,200 // blendvps %xmm0,%xmm8,%xmm9
- .byte 68,15,95,196 // maxps %xmm4,%xmm8
- .byte 69,15,40,213 // movaps %xmm13,%xmm10
- .byte 69,15,194,208,1 // cmpltps %xmm8,%xmm10
- .byte 65,15,40,209 // movaps %xmm9,%xmm2
- .byte 65,15,92,214 // subps %xmm14,%xmm2
+ .byte 15,92,223 // subps %xmm7,%xmm3
+ .byte 69,15,40,234 // movaps %xmm10,%xmm13
.byte 69,15,92,238 // subps %xmm14,%xmm13
- .byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 69,15,92,198 // subps %xmm14,%xmm8
- .byte 65,15,94,208 // divps %xmm8,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
- .byte 65,15,40,194 // movaps %xmm10,%xmm0
- .byte 102,68,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm9
- .byte 68,15,40,217 // movaps %xmm1,%xmm11
+ .byte 69,15,89,238 // mulps %xmm14,%xmm13
+ .byte 68,15,94,235 // divps %xmm3,%xmm13
+ .byte 69,15,88,238 // addps %xmm14,%xmm13
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,69,15,56,20,234 // blendvps %xmm0,%xmm10,%xmm13
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 65,15,95,199 // maxps %xmm15,%xmm0
+ .byte 68,15,95,208 // maxps %xmm0,%xmm10
+ .byte 65,15,40,248 // movaps %xmm8,%xmm7
+ .byte 15,40,108,36,152 // movaps -0x68(%rsp),%xmm5
+ .byte 15,89,253 // mulps %xmm5,%xmm7
+ .byte 15,40,231 // movaps %xmm7,%xmm4
+ .byte 65,15,194,226,1 // cmpltps %xmm10,%xmm4
+ .byte 65,15,40,213 // movaps %xmm13,%xmm2
+ .byte 65,15,92,214 // subps %xmm14,%xmm2
+ .byte 68,15,40,223 // movaps %xmm7,%xmm11
.byte 69,15,92,222 // subps %xmm14,%xmm11
- .byte 69,15,89,222 // mulps %xmm14,%xmm11
- .byte 68,15,94,219 // divps %xmm3,%xmm11
- .byte 69,15,88,222 // addps %xmm14,%xmm11
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 102,68,15,56,20,217 // blendvps %xmm0,%xmm1,%xmm11
- .byte 65,15,40,203 // movaps %xmm11,%xmm1
+ .byte 65,15,89,211 // mulps %xmm11,%xmm2
+ .byte 69,15,92,214 // subps %xmm14,%xmm10
+ .byte 65,15,94,210 // divps %xmm10,%xmm2
+ .byte 65,15,88,214 // addps %xmm14,%xmm2
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 102,68,15,56,20,234 // blendvps %xmm0,%xmm2,%xmm13
+ .byte 68,15,40,225 // movaps %xmm1,%xmm12
+ .byte 69,15,92,230 // subps %xmm14,%xmm12
+ .byte 69,15,89,230 // mulps %xmm14,%xmm12
+ .byte 68,15,94,227 // divps %xmm3,%xmm12
+ .byte 69,15,88,230 // addps %xmm14,%xmm12
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,68,15,56,20,225 // blendvps %xmm0,%xmm1,%xmm12
+ .byte 65,15,40,204 // movaps %xmm12,%xmm1
.byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 65,15,89,205 // mulps %xmm13,%xmm1
- .byte 65,15,94,200 // divps %xmm8,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 65,15,40,194 // movaps %xmm10,%xmm0
- .byte 102,68,15,56,20,217 // blendvps %xmm0,%xmm1,%xmm11
- .byte 65,15,40,215 // movaps %xmm15,%xmm2
- .byte 65,15,92,214 // subps %xmm14,%xmm2
- .byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 15,94,211 // divps %xmm3,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 102,65,15,56,20,215 // blendvps %xmm0,%xmm15,%xmm2
- .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 102,68,15,56,20,225 // blendvps %xmm0,%xmm1,%xmm12
+ .byte 65,15,40,207 // movaps %xmm15,%xmm1
.byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 65,15,89,205 // mulps %xmm13,%xmm1
- .byte 65,15,94,200 // divps %xmm8,%xmm1
+ .byte 65,15,89,206 // mulps %xmm14,%xmm1
+ .byte 15,94,203 // divps %xmm3,%xmm1
.byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 65,15,40,194 // movaps %xmm10,%xmm0
- .byte 102,15,56,20,209 // blendvps %xmm0,%xmm1,%xmm2
- .byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 68,15,95,200 // maxps %xmm0,%xmm9
- .byte 68,15,95,216 // maxps %xmm0,%xmm11
- .byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 68,15,40,198 // movaps %xmm6,%xmm8
- .byte 68,15,40,84,36,232 // movaps -0x18(%rsp),%xmm10
- .byte 69,15,88,194 // addps %xmm10,%xmm8
- .byte 65,15,89,242 // mulps %xmm10,%xmm6
- .byte 68,15,92,198 // subps %xmm6,%xmm8
- .byte 69,15,89,200 // mulps %xmm8,%xmm9
- .byte 69,15,89,216 // mulps %xmm8,%xmm11
- .byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,231 // movaps %xmm7,%xmm4
- .byte 65,15,40,236 // movaps %xmm12,%xmm5
- .byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
.byte 65,15,40,193 // movaps %xmm9,%xmm0
- .byte 65,15,40,203 // movaps %xmm11,%xmm1
+ .byte 102,65,15,56,20,207 // blendvps %xmm0,%xmm15,%xmm1
+ .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 65,15,92,214 // subps %xmm14,%xmm2
+ .byte 65,15,89,211 // mulps %xmm11,%xmm2
+ .byte 65,15,94,210 // divps %xmm10,%xmm2
+ .byte 65,15,88,214 // addps %xmm14,%xmm2
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
+ .byte 68,15,40,13,14,55,0,0 // movaps 0x370e(%rip),%xmm9 # 4650 <_sk_callback_sse41+0x2ac>
+ .byte 65,15,40,225 // movaps %xmm9,%xmm4
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,40,92,36,216 // movaps -0x28(%rsp),%xmm3
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 15,89,100,36,232 // mulps -0x18(%rsp),%xmm4
+ .byte 69,15,92,200 // subps %xmm8,%xmm9
+ .byte 68,15,88,197 // addps %xmm5,%xmm8
+ .byte 68,15,40,213 // movaps %xmm5,%xmm10
+ .byte 68,15,92,199 // subps %xmm7,%xmm8
+ .byte 15,87,210 // xorps %xmm2,%xmm2
+ .byte 68,15,95,234 // maxps %xmm2,%xmm13
+ .byte 68,15,95,226 // maxps %xmm2,%xmm12
+ .byte 15,95,202 // maxps %xmm2,%xmm1
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,88,194 // addps %xmm2,%xmm0
+ .byte 65,15,88,197 // addps %xmm13,%xmm0
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
+ .byte 15,40,108,36,184 // movaps -0x48(%rsp),%xmm5
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 65,15,88,220 // addps %xmm12,%xmm3
+ .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 15,40,92,36,168 // movaps -0x58(%rsp),%xmm3
+ .byte 68,15,89,203 // mulps %xmm3,%xmm9
+ .byte 68,15,88,204 // addps %xmm4,%xmm9
+ .byte 68,15,88,201 // addps %xmm1,%xmm9
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
.byte 65,15,40,216 // movaps %xmm8,%xmm3
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 255,224 // jmpq *%rax
@@ -20668,401 +20843,466 @@ HIDDEN _sk_saturation_sse41
.globl _sk_saturation_sse41
FUNCTION(_sk_saturation_sse41)
_sk_saturation_sse41:
- .byte 68,15,40,214 // movaps %xmm6,%xmm10
+ .byte 68,15,40,206 // movaps %xmm6,%xmm9
+ .byte 15,40,245 // movaps %xmm5,%xmm6
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 15,41,76,36,216 // movaps %xmm1,-0x28(%rsp)
+ .byte 15,41,68,36,200 // movaps %xmm0,-0x38(%rsp)
+ .byte 68,15,40,212 // movaps %xmm4,%xmm10
+ .byte 68,15,89,213 // mulps %xmm5,%xmm10
.byte 68,15,40,220 // movaps %xmm4,%xmm11
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 69,15,87,246 // xorps %xmm14,%xmm14
- .byte 68,15,40,37,133,53,0,0 // movaps 0x3585(%rip),%xmm12 # 4510 <_sk_callback_sse41+0x2be>
- .byte 65,15,40,220 // movaps %xmm12,%xmm3
- .byte 15,94,223 // divps %xmm7,%xmm3
- .byte 68,15,40,199 // movaps %xmm7,%xmm8
- .byte 69,15,194,198,4 // cmpneqps %xmm14,%xmm8
- .byte 68,15,84,195 // andps %xmm3,%xmm8
- .byte 69,15,40,200 // movaps %xmm8,%xmm9
- .byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 69,15,40,232 // movaps %xmm8,%xmm13
- .byte 68,15,89,237 // mulps %xmm5,%xmm13
- .byte 15,41,108,36,232 // movaps %xmm5,-0x18(%rsp)
- .byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,41,84,36,216 // movaps %xmm10,-0x28(%rsp)
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,95,226 // maxps %xmm2,%xmm4
+ .byte 68,15,89,222 // mulps %xmm6,%xmm11
+ .byte 68,15,40,196 // movaps %xmm4,%xmm8
+ .byte 69,15,89,193 // mulps %xmm9,%xmm8
+ .byte 69,15,40,241 // movaps %xmm9,%xmm14
+ .byte 68,15,41,116,36,184 // movaps %xmm14,-0x48(%rsp)
+ .byte 15,40,217 // movaps %xmm1,%xmm3
+ .byte 68,15,40,202 // movaps %xmm2,%xmm9
+ .byte 68,15,41,76,36,232 // movaps %xmm9,-0x18(%rsp)
+ .byte 65,15,95,217 // maxps %xmm9,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,95,211 // maxps %xmm3,%xmm2
+ .byte 68,15,40,225 // movaps %xmm1,%xmm12
+ .byte 69,15,93,225 // minps %xmm9,%xmm12
.byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 15,95,220 // maxps %xmm4,%xmm3
- .byte 15,93,202 // minps %xmm2,%xmm1
- .byte 15,93,193 // minps %xmm1,%xmm0
- .byte 15,92,216 // subps %xmm0,%xmm3
- .byte 65,15,40,197 // movaps %xmm13,%xmm0
+ .byte 65,15,93,220 // minps %xmm12,%xmm3
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,89,215 // mulps %xmm7,%xmm2
+ .byte 68,15,40,231 // movaps %xmm7,%xmm12
+ .byte 68,15,41,100,36,168 // movaps %xmm12,-0x58(%rsp)
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,93,192 // minps %xmm8,%xmm0
- .byte 65,15,40,201 // movaps %xmm9,%xmm1
- .byte 15,93,200 // minps %xmm0,%xmm1
- .byte 65,15,40,197 // movaps %xmm13,%xmm0
+ .byte 65,15,40,218 // movaps %xmm10,%xmm3
+ .byte 15,93,216 // minps %xmm0,%xmm3
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,95,192 // maxps %xmm8,%xmm0
- .byte 65,15,40,209 // movaps %xmm9,%xmm2
- .byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,92,209 // subps %xmm1,%xmm2
- .byte 68,15,92,201 // subps %xmm1,%xmm9
- .byte 68,15,89,203 // mulps %xmm3,%xmm9
- .byte 68,15,94,202 // divps %xmm2,%xmm9
- .byte 68,15,92,233 // subps %xmm1,%xmm13
- .byte 68,15,89,235 // mulps %xmm3,%xmm13
- .byte 68,15,94,234 // divps %xmm2,%xmm13
- .byte 68,15,92,193 // subps %xmm1,%xmm8
- .byte 68,15,89,195 // mulps %xmm3,%xmm8
- .byte 68,15,94,194 // divps %xmm2,%xmm8
- .byte 65,15,194,214,4 // cmpneqps %xmm14,%xmm2
- .byte 68,15,84,202 // andps %xmm2,%xmm9
- .byte 68,15,84,234 // andps %xmm2,%xmm13
- .byte 68,15,84,194 // andps %xmm2,%xmm8
- .byte 15,40,13,240,52,0,0 // movaps 0x34f0(%rip),%xmm1 # 4520 <_sk_callback_sse41+0x2ce>
- .byte 65,15,40,211 // movaps %xmm11,%xmm2
- .byte 15,89,209 // mulps %xmm1,%xmm2
- .byte 15,40,5,242,52,0,0 // movaps 0x34f2(%rip),%xmm0 # 4530 <_sk_callback_sse41+0x2de>
+ .byte 65,15,40,250 // movaps %xmm10,%xmm7
+ .byte 15,95,248 // maxps %xmm0,%xmm7
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 68,15,92,211 // subps %xmm3,%xmm10
+ .byte 68,15,89,210 // mulps %xmm2,%xmm10
+ .byte 68,15,94,215 // divps %xmm7,%xmm10
+ .byte 68,15,92,219 // subps %xmm3,%xmm11
+ .byte 68,15,89,218 // mulps %xmm2,%xmm11
+ .byte 68,15,94,223 // divps %xmm7,%xmm11
+ .byte 68,15,92,195 // subps %xmm3,%xmm8
+ .byte 68,15,89,194 // mulps %xmm2,%xmm8
+ .byte 68,15,94,199 // divps %xmm7,%xmm8
+ .byte 15,194,248,4 // cmpneqps %xmm0,%xmm7
+ .byte 68,15,84,215 // andps %xmm7,%xmm10
+ .byte 68,15,84,223 // andps %xmm7,%xmm11
+ .byte 68,15,84,199 // andps %xmm7,%xmm8
+ .byte 15,40,21,200,53,0,0 // movaps 0x35c8(%rip),%xmm2 # 4660 <_sk_callback_sse41+0x2bc>
.byte 15,40,221 // movaps %xmm5,%xmm3
- .byte 15,89,216 // mulps %xmm0,%xmm3
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,53,241,52,0,0 // movaps 0x34f1(%rip),%xmm14 # 4540 <_sk_callback_sse41+0x2ee>
- .byte 69,15,40,250 // movaps %xmm10,%xmm15
- .byte 69,15,89,254 // mulps %xmm14,%xmm15
- .byte 68,15,88,251 // addps %xmm3,%xmm15
- .byte 65,15,40,209 // movaps %xmm9,%xmm2
- .byte 15,89,209 // mulps %xmm1,%xmm2
- .byte 65,15,40,221 // movaps %xmm13,%xmm3
- .byte 15,89,216 // mulps %xmm0,%xmm3
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 15,88,211 // addps %xmm3,%xmm2
- .byte 68,15,92,250 // subps %xmm2,%xmm15
- .byte 69,15,88,207 // addps %xmm15,%xmm9
- .byte 69,15,88,239 // addps %xmm15,%xmm13
- .byte 69,15,88,248 // addps %xmm8,%xmm15
- .byte 65,15,40,213 // movaps %xmm13,%xmm2
- .byte 65,15,93,215 // minps %xmm15,%xmm2
- .byte 65,15,40,225 // movaps %xmm9,%xmm4
- .byte 15,93,226 // minps %xmm2,%xmm4
- .byte 65,15,40,213 // movaps %xmm13,%xmm2
- .byte 65,15,95,215 // maxps %xmm15,%xmm2
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 65,15,89,197 // mulps %xmm13,%xmm0
- .byte 15,88,193 // addps %xmm1,%xmm0
- .byte 69,15,89,247 // mulps %xmm15,%xmm14
- .byte 68,15,88,240 // addps %xmm0,%xmm14
- .byte 15,87,237 // xorps %xmm5,%xmm5
- .byte 15,194,236,2 // cmpleps %xmm4,%xmm5
- .byte 69,15,40,209 // movaps %xmm9,%xmm10
- .byte 69,15,92,214 // subps %xmm14,%xmm10
- .byte 69,15,89,214 // mulps %xmm14,%xmm10
- .byte 65,15,40,222 // movaps %xmm14,%xmm3
- .byte 15,92,220 // subps %xmm4,%xmm3
- .byte 68,15,94,211 // divps %xmm3,%xmm10
+ .byte 15,89,218 // mulps %xmm2,%xmm3
+ .byte 15,40,13,203,53,0,0 // movaps 0x35cb(%rip),%xmm1 # 4670 <_sk_callback_sse41+0x2cc>
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 68,15,40,45,202,53,0,0 // movaps 0x35ca(%rip),%xmm13 # 4680 <_sk_callback_sse41+0x2dc>
+ .byte 69,15,89,245 // mulps %xmm13,%xmm14
+ .byte 68,15,88,247 // addps %xmm7,%xmm14
+ .byte 65,15,40,218 // movaps %xmm10,%xmm3
+ .byte 15,89,218 // mulps %xmm2,%xmm3
+ .byte 65,15,40,251 // movaps %xmm11,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 65,15,89,221 // mulps %xmm13,%xmm3
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 68,15,89,244 // mulps %xmm4,%xmm14
+ .byte 68,15,92,243 // subps %xmm3,%xmm14
.byte 69,15,88,214 // addps %xmm14,%xmm10
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
- .byte 68,15,95,202 // maxps %xmm2,%xmm9
- .byte 69,15,40,196 // movaps %xmm12,%xmm8
- .byte 69,15,194,193,1 // cmpltps %xmm9,%xmm8
- .byte 65,15,40,202 // movaps %xmm10,%xmm1
- .byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 69,15,92,230 // subps %xmm14,%xmm12
- .byte 65,15,89,204 // mulps %xmm12,%xmm1
- .byte 69,15,92,206 // subps %xmm14,%xmm9
- .byte 65,15,94,201 // divps %xmm9,%xmm1
- .byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 65,15,40,192 // movaps %xmm8,%xmm0
- .byte 102,68,15,56,20,209 // blendvps %xmm0,%xmm1,%xmm10
- .byte 65,15,40,205 // movaps %xmm13,%xmm1
- .byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 65,15,89,206 // mulps %xmm14,%xmm1
- .byte 15,94,203 // divps %xmm3,%xmm1
- .byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 102,65,15,56,20,205 // blendvps %xmm0,%xmm13,%xmm1
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 65,15,92,214 // subps %xmm14,%xmm2
+ .byte 69,15,88,222 // addps %xmm14,%xmm11
+ .byte 69,15,88,240 // addps %xmm8,%xmm14
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
+ .byte 65,15,93,198 // minps %xmm14,%xmm0
+ .byte 65,15,40,218 // movaps %xmm10,%xmm3
+ .byte 15,93,216 // minps %xmm0,%xmm3
+ .byte 65,15,89,210 // mulps %xmm10,%xmm2
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 69,15,89,238 // mulps %xmm14,%xmm13
+ .byte 68,15,88,233 // addps %xmm1,%xmm13
+ .byte 69,15,87,201 // xorps %xmm9,%xmm9
+ .byte 68,15,194,203,2 // cmpleps %xmm3,%xmm9
+ .byte 65,15,40,253 // movaps %xmm13,%xmm7
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 69,15,40,250 // movaps %xmm10,%xmm15
+ .byte 69,15,92,253 // subps %xmm13,%xmm15
+ .byte 69,15,89,253 // mulps %xmm13,%xmm15
+ .byte 68,15,94,255 // divps %xmm7,%xmm15
+ .byte 69,15,88,253 // addps %xmm13,%xmm15
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,69,15,56,20,250 // blendvps %xmm0,%xmm10,%xmm15
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
+ .byte 65,15,95,198 // maxps %xmm14,%xmm0
+ .byte 68,15,95,208 // maxps %xmm0,%xmm10
+ .byte 15,40,212 // movaps %xmm4,%xmm2
.byte 65,15,89,212 // mulps %xmm12,%xmm2
- .byte 65,15,94,209 // divps %xmm9,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
+ .byte 68,15,40,194 // movaps %xmm2,%xmm8
+ .byte 69,15,194,194,1 // cmpltps %xmm10,%xmm8
+ .byte 65,15,40,223 // movaps %xmm15,%xmm3
+ .byte 65,15,92,221 // subps %xmm13,%xmm3
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 65,15,92,205 // subps %xmm13,%xmm1
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 69,15,92,213 // subps %xmm13,%xmm10
+ .byte 65,15,94,218 // divps %xmm10,%xmm3
+ .byte 65,15,88,221 // addps %xmm13,%xmm3
.byte 65,15,40,192 // movaps %xmm8,%xmm0
- .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 65,15,40,215 // movaps %xmm15,%xmm2
- .byte 65,15,92,214 // subps %xmm14,%xmm2
- .byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 15,94,211 // divps %xmm3,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 102,65,15,56,20,215 // blendvps %xmm0,%xmm15,%xmm2
- .byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 65,15,92,222 // subps %xmm14,%xmm3
- .byte 65,15,89,220 // mulps %xmm12,%xmm3
- .byte 65,15,94,217 // divps %xmm9,%xmm3
- .byte 65,15,88,222 // addps %xmm14,%xmm3
+ .byte 102,68,15,56,20,251 // blendvps %xmm0,%xmm3,%xmm15
+ .byte 69,15,40,227 // movaps %xmm11,%xmm12
+ .byte 69,15,92,229 // subps %xmm13,%xmm12
+ .byte 69,15,89,229 // mulps %xmm13,%xmm12
+ .byte 68,15,94,231 // divps %xmm7,%xmm12
+ .byte 69,15,88,229 // addps %xmm13,%xmm12
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,69,15,56,20,227 // blendvps %xmm0,%xmm11,%xmm12
+ .byte 65,15,40,220 // movaps %xmm12,%xmm3
+ .byte 65,15,92,221 // subps %xmm13,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 65,15,94,218 // divps %xmm10,%xmm3
+ .byte 65,15,88,221 // addps %xmm13,%xmm3
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 102,68,15,56,20,227 // blendvps %xmm0,%xmm3,%xmm12
+ .byte 69,15,40,222 // movaps %xmm14,%xmm11
+ .byte 69,15,92,221 // subps %xmm13,%xmm11
+ .byte 69,15,89,221 // mulps %xmm13,%xmm11
+ .byte 68,15,94,223 // divps %xmm7,%xmm11
+ .byte 69,15,88,221 // addps %xmm13,%xmm11
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,69,15,56,20,222 // blendvps %xmm0,%xmm14,%xmm11
+ .byte 65,15,40,251 // movaps %xmm11,%xmm7
+ .byte 65,15,92,253 // subps %xmm13,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 65,15,94,250 // divps %xmm10,%xmm7
+ .byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
- .byte 102,15,56,20,211 // blendvps %xmm0,%xmm3,%xmm2
+ .byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
+ .byte 68,15,40,13,144,52,0,0 // movaps 0x3490(%rip),%xmm9 # 4690 <_sk_callback_sse41+0x2ec>
+ .byte 69,15,40,193 // movaps %xmm9,%xmm8
+ .byte 68,15,92,204 // subps %xmm4,%xmm9
+ .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
+ .byte 15,88,231 // addps %xmm7,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 68,15,95,208 // maxps %xmm0,%xmm10
- .byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 68,15,40,198 // movaps %xmm6,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 68,15,92,198 // subps %xmm6,%xmm8
- .byte 69,15,89,208 // mulps %xmm8,%xmm10
- .byte 65,15,89,200 // mulps %xmm8,%xmm1
+ .byte 68,15,95,248 // maxps %xmm0,%xmm15
+ .byte 68,15,95,224 // maxps %xmm0,%xmm12
+ .byte 68,15,95,216 // maxps %xmm0,%xmm11
+ .byte 65,15,40,201 // movaps %xmm9,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 68,15,92,199 // subps %xmm7,%xmm8
+ .byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 65,15,88,199 // addps %xmm15,%xmm0
+ .byte 65,15,40,201 // movaps %xmm9,%xmm1
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,40,84,36,216 // movaps -0x28(%rsp),%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
+ .byte 15,88,209 // addps %xmm1,%xmm2
+ .byte 65,15,88,212 // addps %xmm12,%xmm2
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 68,15,89,68,36,232 // mulps -0x18(%rsp),%xmm8
+ .byte 15,40,84,36,184 // movaps -0x48(%rsp),%xmm2
+ .byte 68,15,89,202 // mulps %xmm2,%xmm9
+ .byte 69,15,88,200 // addps %xmm8,%xmm9
+ .byte 69,15,88,203 // addps %xmm11,%xmm9
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 65,15,40,227 // movaps %xmm11,%xmm4
- .byte 15,40,108,36,232 // movaps -0x18(%rsp),%xmm5
- .byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
- .byte 65,15,40,194 // movaps %xmm10,%xmm0
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,40,238 // movaps %xmm6,%xmm5
+ .byte 15,40,242 // movaps %xmm2,%xmm6
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
.byte 255,224 // jmpq *%rax
HIDDEN _sk_color_sse41
.globl _sk_color_sse41
FUNCTION(_sk_color_sse41)
_sk_color_sse41:
- .byte 15,41,116,36,216 // movaps %xmm6,-0x28(%rsp)
+ .byte 68,15,40,230 // movaps %xmm6,%xmm12
+ .byte 68,15,41,100,36,200 // movaps %xmm12,-0x38(%rsp)
.byte 68,15,40,221 // movaps %xmm5,%xmm11
- .byte 68,15,41,92,36,232 // movaps %xmm11,-0x18(%rsp)
- .byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 68,15,41,92,36,216 // movaps %xmm11,-0x28(%rsp)
+ .byte 68,15,40,212 // movaps %xmm4,%xmm10
+ .byte 68,15,41,84,36,232 // movaps %xmm10,-0x18(%rsp)
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,41,84,36,184 // movaps %xmm2,-0x48(%rsp)
+ .byte 15,40,233 // movaps %xmm1,%xmm5
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 69,15,87,201 // xorps %xmm9,%xmm9
- .byte 68,15,40,45,106,51,0,0 // movaps 0x336a(%rip),%xmm13 # 4550 <_sk_callback_sse41+0x2fe>
- .byte 65,15,40,197 // movaps %xmm13,%xmm0
- .byte 15,94,196 // divps %xmm4,%xmm0
- .byte 65,15,194,217,4 // cmpneqps %xmm9,%xmm3
- .byte 15,84,216 // andps %xmm0,%xmm3
- .byte 68,15,89,195 // mulps %xmm3,%xmm8
- .byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 68,15,40,13,89,51,0,0 // movaps 0x3359(%rip),%xmm9 # 4560 <_sk_callback_sse41+0x30e>
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 65,15,89,209 // mulps %xmm9,%xmm2
- .byte 68,15,40,21,90,51,0,0 // movaps 0x335a(%rip),%xmm10 # 4570 <_sk_callback_sse41+0x31e>
- .byte 69,15,89,218 // mulps %xmm10,%xmm11
- .byte 68,15,88,218 // addps %xmm2,%xmm11
- .byte 68,15,40,53,90,51,0,0 // movaps 0x335a(%rip),%xmm14 # 4580 <_sk_callback_sse41+0x32e>
- .byte 68,15,40,254 // movaps %xmm6,%xmm15
- .byte 69,15,89,254 // mulps %xmm14,%xmm15
- .byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 65,15,40,192 // movaps %xmm8,%xmm0
- .byte 65,15,89,193 // mulps %xmm9,%xmm0
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 65,15,89,210 // mulps %xmm10,%xmm2
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 65,15,89,198 // mulps %xmm14,%xmm0
- .byte 15,88,194 // addps %xmm2,%xmm0
- .byte 68,15,92,248 // subps %xmm0,%xmm15
- .byte 69,15,88,199 // addps %xmm15,%xmm8
- .byte 65,15,88,207 // addps %xmm15,%xmm1
- .byte 68,15,88,251 // addps %xmm3,%xmm15
+ .byte 69,15,40,240 // movaps %xmm8,%xmm14
+ .byte 15,40,231 // movaps %xmm7,%xmm4
+ .byte 68,15,89,244 // mulps %xmm4,%xmm14
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 68,15,40,13,219,51,0,0 // movaps 0x33db(%rip),%xmm9 # 46a0 <_sk_callback_sse41+0x2fc>
+ .byte 65,15,40,250 // movaps %xmm10,%xmm7
+ .byte 65,15,89,249 // mulps %xmm9,%xmm7
+ .byte 68,15,40,21,219,51,0,0 // movaps 0x33db(%rip),%xmm10 # 46b0 <_sk_callback_sse41+0x30c>
+ .byte 65,15,40,219 // movaps %xmm11,%xmm3
+ .byte 65,15,89,218 // mulps %xmm10,%xmm3
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 68,15,40,29,216,51,0,0 // movaps 0x33d8(%rip),%xmm11 # 46c0 <_sk_callback_sse41+0x31c>
+ .byte 69,15,40,236 // movaps %xmm12,%xmm13
+ .byte 69,15,89,235 // mulps %xmm11,%xmm13
+ .byte 68,15,88,235 // addps %xmm3,%xmm13
+ .byte 65,15,40,222 // movaps %xmm14,%xmm3
+ .byte 65,15,89,217 // mulps %xmm9,%xmm3
+ .byte 15,40,249 // movaps %xmm1,%xmm7
+ .byte 65,15,89,250 // mulps %xmm10,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 65,15,89,219 // mulps %xmm11,%xmm3
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 68,15,89,238 // mulps %xmm6,%xmm13
+ .byte 68,15,92,235 // subps %xmm3,%xmm13
+ .byte 69,15,88,245 // addps %xmm13,%xmm14
+ .byte 65,15,88,205 // addps %xmm13,%xmm1
+ .byte 68,15,88,232 // addps %xmm0,%xmm13
.byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 65,15,93,199 // minps %xmm15,%xmm0
- .byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 15,93,208 // minps %xmm0,%xmm2
- .byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 65,15,95,247 // maxps %xmm15,%xmm6
- .byte 69,15,89,200 // mulps %xmm8,%xmm9
+ .byte 65,15,93,197 // minps %xmm13,%xmm0
+ .byte 65,15,40,222 // movaps %xmm14,%xmm3
+ .byte 15,93,216 // minps %xmm0,%xmm3
+ .byte 69,15,89,206 // mulps %xmm14,%xmm9
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 69,15,88,209 // addps %xmm9,%xmm10
+ .byte 69,15,89,221 // mulps %xmm13,%xmm11
+ .byte 69,15,88,218 // addps %xmm10,%xmm11
+ .byte 69,15,87,201 // xorps %xmm9,%xmm9
+ .byte 68,15,194,203,2 // cmpleps %xmm3,%xmm9
+ .byte 69,15,40,230 // movaps %xmm14,%xmm12
+ .byte 69,15,92,227 // subps %xmm11,%xmm12
+ .byte 69,15,89,227 // mulps %xmm11,%xmm12
+ .byte 65,15,40,251 // movaps %xmm11,%xmm7
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 68,15,94,231 // divps %xmm7,%xmm12
+ .byte 69,15,88,227 // addps %xmm11,%xmm12
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,69,15,56,20,230 // blendvps %xmm0,%xmm14,%xmm12
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 65,15,95,197 // maxps %xmm13,%xmm0
+ .byte 65,15,40,214 // movaps %xmm14,%xmm2
+ .byte 15,95,208 // maxps %xmm0,%xmm2
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 68,15,40,211 // movaps %xmm3,%xmm10
+ .byte 68,15,194,210,1 // cmpltps %xmm2,%xmm10
+ .byte 69,15,40,244 // movaps %xmm12,%xmm14
+ .byte 69,15,92,243 // subps %xmm11,%xmm14
+ .byte 68,15,40,251 // movaps %xmm3,%xmm15
+ .byte 69,15,92,251 // subps %xmm11,%xmm15
.byte 69,15,89,247 // mulps %xmm15,%xmm14
- .byte 69,15,88,242 // addps %xmm10,%xmm14
- .byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 15,194,218,2 // cmpleps %xmm2,%xmm3
- .byte 69,15,40,200 // movaps %xmm8,%xmm9
- .byte 69,15,92,206 // subps %xmm14,%xmm9
- .byte 69,15,89,206 // mulps %xmm14,%xmm9
- .byte 69,15,40,214 // movaps %xmm14,%xmm10
- .byte 68,15,92,210 // subps %xmm2,%xmm10
- .byte 69,15,94,202 // divps %xmm10,%xmm9
- .byte 69,15,88,206 // addps %xmm14,%xmm9
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 102,69,15,56,20,200 // blendvps %xmm0,%xmm8,%xmm9
- .byte 68,15,95,198 // maxps %xmm6,%xmm8
- .byte 69,15,40,229 // movaps %xmm13,%xmm12
- .byte 69,15,194,224,1 // cmpltps %xmm8,%xmm12
+ .byte 65,15,92,211 // subps %xmm11,%xmm2
+ .byte 68,15,94,242 // divps %xmm2,%xmm14
+ .byte 69,15,88,243 // addps %xmm11,%xmm14
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 102,69,15,56,20,230 // blendvps %xmm0,%xmm14,%xmm12
+ .byte 68,15,40,241 // movaps %xmm1,%xmm14
+ .byte 69,15,92,243 // subps %xmm11,%xmm14
+ .byte 69,15,89,243 // mulps %xmm11,%xmm14
+ .byte 68,15,94,247 // divps %xmm7,%xmm14
+ .byte 69,15,88,243 // addps %xmm11,%xmm14
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,68,15,56,20,241 // blendvps %xmm0,%xmm1,%xmm14
+ .byte 65,15,40,206 // movaps %xmm14,%xmm1
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 65,15,89,207 // mulps %xmm15,%xmm1
+ .byte 15,94,202 // divps %xmm2,%xmm1
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 102,68,15,56,20,241 // blendvps %xmm0,%xmm1,%xmm14
+ .byte 65,15,40,205 // movaps %xmm13,%xmm1
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 15,94,207 // divps %xmm7,%xmm1
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 102,65,15,56,20,205 // blendvps %xmm0,%xmm13,%xmm1
+ .byte 15,40,249 // movaps %xmm1,%xmm7
+ .byte 65,15,92,251 // subps %xmm11,%xmm7
+ .byte 65,15,89,255 // mulps %xmm15,%xmm7
+ .byte 15,94,250 // divps %xmm2,%xmm7
+ .byte 65,15,88,251 // addps %xmm11,%xmm7
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
+ .byte 68,15,40,13,148,50,0,0 // movaps 0x3294(%rip),%xmm9 # 46d0 <_sk_callback_sse41+0x32c>
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 68,15,89,192 // mulps %xmm0,%xmm8
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 15,89,68,36,184 // mulps -0x48(%rsp),%xmm0
+ .byte 68,15,92,206 // subps %xmm6,%xmm9
+ .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,40,252 // movaps %xmm4,%xmm7
+ .byte 15,92,243 // subps %xmm3,%xmm6
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,87,210 // xorps %xmm2,%xmm2
+ .byte 68,15,95,226 // maxps %xmm2,%xmm12
+ .byte 68,15,95,242 // maxps %xmm2,%xmm14
+ .byte 15,95,202 // maxps %xmm2,%xmm1
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
+ .byte 15,40,100,36,232 // movaps -0x18(%rsp),%xmm4
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 68,15,88,194 // addps %xmm2,%xmm8
+ .byte 69,15,88,196 // addps %xmm12,%xmm8
.byte 65,15,40,209 // movaps %xmm9,%xmm2
- .byte 65,15,92,214 // subps %xmm14,%xmm2
- .byte 69,15,92,238 // subps %xmm14,%xmm13
- .byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 69,15,92,198 // subps %xmm14,%xmm8
- .byte 65,15,94,208 // divps %xmm8,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
- .byte 65,15,40,196 // movaps %xmm12,%xmm0
- .byte 102,68,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm9
- .byte 68,15,40,217 // movaps %xmm1,%xmm11
- .byte 69,15,92,222 // subps %xmm14,%xmm11
- .byte 69,15,89,222 // mulps %xmm14,%xmm11
- .byte 69,15,94,218 // divps %xmm10,%xmm11
- .byte 69,15,88,222 // addps %xmm14,%xmm11
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 102,68,15,56,20,217 // blendvps %xmm0,%xmm1,%xmm11
- .byte 65,15,40,203 // movaps %xmm11,%xmm1
- .byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 65,15,89,205 // mulps %xmm13,%xmm1
- .byte 65,15,94,200 // divps %xmm8,%xmm1
- .byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 65,15,40,196 // movaps %xmm12,%xmm0
- .byte 102,68,15,56,20,217 // blendvps %xmm0,%xmm1,%xmm11
- .byte 65,15,40,215 // movaps %xmm15,%xmm2
- .byte 65,15,92,214 // subps %xmm14,%xmm2
- .byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 65,15,94,210 // divps %xmm10,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 102,65,15,56,20,215 // blendvps %xmm0,%xmm15,%xmm2
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 65,15,89,205 // mulps %xmm13,%xmm1
- .byte 65,15,94,200 // divps %xmm8,%xmm1
- .byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 65,15,40,196 // movaps %xmm12,%xmm0
- .byte 102,15,56,20,209 // blendvps %xmm0,%xmm1,%xmm2
- .byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 68,15,95,200 // maxps %xmm0,%xmm9
- .byte 68,15,95,216 // maxps %xmm0,%xmm11
- .byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 68,15,40,196 // movaps %xmm4,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 68,15,92,196 // subps %xmm4,%xmm8
- .byte 69,15,89,200 // mulps %xmm8,%xmm9
- .byte 69,15,89,216 // mulps %xmm8,%xmm11
- .byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,40,108,36,232 // movaps -0x18(%rsp),%xmm5
.byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
- .byte 65,15,40,193 // movaps %xmm9,%xmm0
- .byte 65,15,40,203 // movaps %xmm11,%xmm1
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 68,15,40,213 // movaps %xmm5,%xmm10
+ .byte 68,15,88,210 // addps %xmm2,%xmm10
+ .byte 69,15,88,214 // addps %xmm14,%xmm10
+ .byte 15,40,84,36,200 // movaps -0x38(%rsp),%xmm2
+ .byte 68,15,89,202 // mulps %xmm2,%xmm9
+ .byte 68,15,88,200 // addps %xmm0,%xmm9
+ .byte 68,15,88,201 // addps %xmm1,%xmm9
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,238 // movaps %xmm6,%xmm5
+ .byte 15,40,242 // movaps %xmm2,%xmm6
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 65,15,40,202 // movaps %xmm10,%xmm1
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
.byte 255,224 // jmpq *%rax
HIDDEN _sk_luminosity_sse41
.globl _sk_luminosity_sse41
FUNCTION(_sk_luminosity_sse41)
_sk_luminosity_sse41:
- .byte 68,15,40,206 // movaps %xmm6,%xmm9
- .byte 68,15,41,76,36,216 // movaps %xmm9,-0x28(%rsp)
- .byte 68,15,40,245 // movaps %xmm5,%xmm14
- .byte 68,15,41,116,36,232 // movaps %xmm14,-0x18(%rsp)
- .byte 15,40,244 // movaps %xmm4,%xmm6
- .byte 15,40,235 // movaps %xmm3,%xmm5
- .byte 69,15,87,228 // xorps %xmm12,%xmm12
- .byte 68,15,40,45,202,49,0,0 // movaps 0x31ca(%rip),%xmm13 # 4590 <_sk_callback_sse41+0x33e>
- .byte 69,15,40,197 // movaps %xmm13,%xmm8
- .byte 68,15,94,199 // divps %xmm7,%xmm8
- .byte 15,40,223 // movaps %xmm7,%xmm3
- .byte 65,15,194,220,4 // cmpneqps %xmm12,%xmm3
- .byte 65,15,84,216 // andps %xmm8,%xmm3
- .byte 68,15,40,211 // movaps %xmm3,%xmm10
- .byte 68,15,89,214 // mulps %xmm6,%xmm10
+ .byte 15,41,116,36,200 // movaps %xmm6,-0x38(%rsp)
+ .byte 15,41,108,36,232 // movaps %xmm5,-0x18(%rsp)
+ .byte 68,15,40,196 // movaps %xmm4,%xmm8
+ .byte 68,15,41,68,36,216 // movaps %xmm8,-0x28(%rsp)
+ .byte 15,41,84,36,184 // movaps %xmm2,-0x48(%rsp)
+ .byte 15,40,224 // movaps %xmm0,%xmm4
.byte 68,15,40,219 // movaps %xmm3,%xmm11
- .byte 69,15,89,222 // mulps %xmm14,%xmm11
- .byte 65,15,89,217 // mulps %xmm9,%xmm3
- .byte 68,15,40,5,170,49,0,0 // movaps 0x31aa(%rip),%xmm8 # 45a0 <_sk_callback_sse41+0x34e>
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,13,174,49,0,0 // movaps 0x31ae(%rip),%xmm9 # 45b0 <_sk_callback_sse41+0x35e>
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 68,15,40,53,175,49,0,0 // movaps 0x31af(%rip),%xmm14 # 45c0 <_sk_callback_sse41+0x36e>
- .byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 15,88,209 // addps %xmm1,%xmm2
- .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 69,15,89,216 // mulps %xmm8,%xmm11
+ .byte 68,15,40,203 // movaps %xmm3,%xmm9
+ .byte 68,15,89,205 // mulps %xmm5,%xmm9
+ .byte 68,15,40,5,236,49,0,0 // movaps 0x31ec(%rip),%xmm8 # 46e0 <_sk_callback_sse41+0x33c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 65,15,40,203 // movaps %xmm11,%xmm1
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 68,15,40,21,240,49,0,0 // movaps 0x31f0(%rip),%xmm10 # 46f0 <_sk_callback_sse41+0x34c>
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 65,15,89,234 // mulps %xmm10,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 68,15,40,37,238,49,0,0 // movaps 0x31ee(%rip),%xmm12 # 4700 <_sk_callback_sse41+0x35c>
+ .byte 68,15,40,242 // movaps %xmm2,%xmm14
+ .byte 69,15,89,244 // mulps %xmm12,%xmm14
+ .byte 68,15,88,245 // addps %xmm5,%xmm14
+ .byte 65,15,40,235 // movaps %xmm11,%xmm5
+ .byte 65,15,89,232 // mulps %xmm8,%xmm5
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
+ .byte 65,15,89,210 // mulps %xmm10,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 65,15,89,198 // mulps %xmm14,%xmm0
- .byte 15,88,193 // addps %xmm1,%xmm0
- .byte 15,92,208 // subps %xmm0,%xmm2
- .byte 68,15,88,210 // addps %xmm2,%xmm10
- .byte 68,15,88,218 // addps %xmm2,%xmm11
- .byte 15,88,211 // addps %xmm3,%xmm2
- .byte 65,15,40,195 // movaps %xmm11,%xmm0
- .byte 15,93,194 // minps %xmm2,%xmm0
- .byte 65,15,40,202 // movaps %xmm10,%xmm1
- .byte 15,93,200 // minps %xmm0,%xmm1
- .byte 65,15,40,219 // movaps %xmm11,%xmm3
- .byte 15,95,218 // maxps %xmm2,%xmm3
- .byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 69,15,88,200 // addps %xmm8,%xmm9
- .byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 69,15,88,241 // addps %xmm9,%xmm14
- .byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,194,225,2 // cmpleps %xmm1,%xmm4
- .byte 69,15,40,194 // movaps %xmm10,%xmm8
- .byte 69,15,92,198 // subps %xmm14,%xmm8
- .byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 69,15,40,206 // movaps %xmm14,%xmm9
- .byte 68,15,92,201 // subps %xmm1,%xmm9
- .byte 69,15,94,193 // divps %xmm9,%xmm8
- .byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 102,69,15,56,20,194 // blendvps %xmm0,%xmm10,%xmm8
- .byte 69,15,40,250 // movaps %xmm10,%xmm15
- .byte 68,15,95,251 // maxps %xmm3,%xmm15
- .byte 69,15,40,213 // movaps %xmm13,%xmm10
- .byte 69,15,194,215,1 // cmpltps %xmm15,%xmm10
- .byte 65,15,40,200 // movaps %xmm8,%xmm1
- .byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 69,15,92,238 // subps %xmm14,%xmm13
- .byte 65,15,89,205 // mulps %xmm13,%xmm1
- .byte 69,15,92,254 // subps %xmm14,%xmm15
- .byte 65,15,94,207 // divps %xmm15,%xmm1
- .byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 65,15,40,194 // movaps %xmm10,%xmm0
- .byte 102,68,15,56,20,193 // blendvps %xmm0,%xmm1,%xmm8
- .byte 65,15,40,203 // movaps %xmm11,%xmm1
- .byte 65,15,92,206 // subps %xmm14,%xmm1
- .byte 65,15,89,206 // mulps %xmm14,%xmm1
- .byte 65,15,94,201 // divps %xmm9,%xmm1
- .byte 65,15,88,206 // addps %xmm14,%xmm1
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
- .byte 15,40,217 // movaps %xmm1,%xmm3
- .byte 65,15,92,222 // subps %xmm14,%xmm3
- .byte 65,15,89,221 // mulps %xmm13,%xmm3
- .byte 65,15,94,223 // divps %xmm15,%xmm3
- .byte 65,15,88,222 // addps %xmm14,%xmm3
- .byte 65,15,40,194 // movaps %xmm10,%xmm0
- .byte 102,15,56,20,203 // blendvps %xmm0,%xmm3,%xmm1
- .byte 68,15,40,218 // movaps %xmm2,%xmm11
- .byte 69,15,92,222 // subps %xmm14,%xmm11
- .byte 69,15,89,222 // mulps %xmm14,%xmm11
- .byte 69,15,94,217 // divps %xmm9,%xmm11
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 65,15,89,236 // mulps %xmm12,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 68,15,89,247 // mulps %xmm7,%xmm14
+ .byte 68,15,92,245 // subps %xmm5,%xmm14
.byte 69,15,88,222 // addps %xmm14,%xmm11
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 102,68,15,56,20,218 // blendvps %xmm0,%xmm2,%xmm11
- .byte 65,15,40,211 // movaps %xmm11,%xmm2
- .byte 65,15,92,214 // subps %xmm14,%xmm2
- .byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 65,15,94,215 // divps %xmm15,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
+ .byte 69,15,88,206 // addps %xmm14,%xmm9
+ .byte 68,15,88,240 // addps %xmm0,%xmm14
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,93,198 // minps %xmm14,%xmm0
+ .byte 65,15,40,235 // movaps %xmm11,%xmm5
+ .byte 15,93,232 // minps %xmm0,%xmm5
+ .byte 69,15,89,195 // mulps %xmm11,%xmm8
+ .byte 69,15,89,209 // mulps %xmm9,%xmm10
+ .byte 69,15,88,208 // addps %xmm8,%xmm10
+ .byte 69,15,89,230 // mulps %xmm14,%xmm12
+ .byte 69,15,88,226 // addps %xmm10,%xmm12
+ .byte 69,15,87,210 // xorps %xmm10,%xmm10
+ .byte 68,15,194,213,2 // cmpleps %xmm5,%xmm10
+ .byte 69,15,40,235 // movaps %xmm11,%xmm13
+ .byte 69,15,92,236 // subps %xmm12,%xmm13
+ .byte 69,15,89,236 // mulps %xmm12,%xmm13
+ .byte 65,15,40,244 // movaps %xmm12,%xmm6
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 68,15,94,238 // divps %xmm6,%xmm13
+ .byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
- .byte 102,68,15,56,20,218 // blendvps %xmm0,%xmm2,%xmm11
- .byte 69,15,95,196 // maxps %xmm12,%xmm8
- .byte 65,15,95,204 // maxps %xmm12,%xmm1
- .byte 69,15,95,220 // maxps %xmm12,%xmm11
- .byte 68,15,40,205 // movaps %xmm5,%xmm9
- .byte 68,15,88,207 // addps %xmm7,%xmm9
- .byte 15,89,239 // mulps %xmm7,%xmm5
- .byte 68,15,92,205 // subps %xmm5,%xmm9
- .byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 69,15,89,217 // mulps %xmm9,%xmm11
- .byte 72,173 // lods %ds:(%rsi),%rax
- .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 102,69,15,56,20,235 // blendvps %xmm0,%xmm11,%xmm13
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,95,198 // maxps %xmm14,%xmm0
.byte 65,15,40,211 // movaps %xmm11,%xmm2
- .byte 65,15,40,217 // movaps %xmm9,%xmm3
- .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,95,208 // maxps %xmm0,%xmm2
+ .byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 15,89,239 // mulps %xmm7,%xmm5
+ .byte 68,15,40,221 // movaps %xmm5,%xmm11
+ .byte 68,15,194,218,1 // cmpltps %xmm2,%xmm11
+ .byte 69,15,40,197 // movaps %xmm13,%xmm8
+ .byte 69,15,92,196 // subps %xmm12,%xmm8
+ .byte 68,15,40,253 // movaps %xmm5,%xmm15
+ .byte 69,15,92,252 // subps %xmm12,%xmm15
+ .byte 69,15,89,199 // mulps %xmm15,%xmm8
+ .byte 65,15,92,212 // subps %xmm12,%xmm2
+ .byte 68,15,94,194 // divps %xmm2,%xmm8
+ .byte 69,15,88,196 // addps %xmm12,%xmm8
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
+ .byte 102,69,15,56,20,232 // blendvps %xmm0,%xmm8,%xmm13
+ .byte 69,15,40,193 // movaps %xmm9,%xmm8
+ .byte 69,15,92,196 // subps %xmm12,%xmm8
+ .byte 69,15,89,196 // mulps %xmm12,%xmm8
+ .byte 68,15,94,198 // divps %xmm6,%xmm8
+ .byte 69,15,88,196 // addps %xmm12,%xmm8
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
+ .byte 69,15,40,200 // movaps %xmm8,%xmm9
+ .byte 69,15,92,204 // subps %xmm12,%xmm9
+ .byte 69,15,89,207 // mulps %xmm15,%xmm9
+ .byte 68,15,94,202 // divps %xmm2,%xmm9
+ .byte 69,15,88,204 // addps %xmm12,%xmm9
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
+ .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
+ .byte 69,15,40,206 // movaps %xmm14,%xmm9
+ .byte 69,15,92,204 // subps %xmm12,%xmm9
+ .byte 69,15,89,204 // mulps %xmm12,%xmm9
+ .byte 68,15,94,206 // divps %xmm6,%xmm9
+ .byte 69,15,88,204 // addps %xmm12,%xmm9
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 102,69,15,56,20,206 // blendvps %xmm0,%xmm14,%xmm9
+ .byte 65,15,40,241 // movaps %xmm9,%xmm6
+ .byte 65,15,92,244 // subps %xmm12,%xmm6
+ .byte 65,15,89,247 // mulps %xmm15,%xmm6
+ .byte 15,94,242 // divps %xmm2,%xmm6
+ .byte 65,15,88,244 // addps %xmm12,%xmm6
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
+ .byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
+ .byte 15,40,5,164,48,0,0 // movaps 0x30a4(%rip),%xmm0 # 4710 <_sk_callback_sse41+0x36c>
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,89,84,36,184 // mulps -0x48(%rsp),%xmm2
+ .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,87,237 // xorps %xmm5,%xmm5
+ .byte 68,15,95,237 // maxps %xmm5,%xmm13
+ .byte 68,15,95,197 // maxps %xmm5,%xmm8
+ .byte 68,15,95,205 // maxps %xmm5,%xmm9
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 68,15,40,84,36,216 // movaps -0x28(%rsp),%xmm10
+ .byte 65,15,89,234 // mulps %xmm10,%xmm5
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 65,15,88,229 // addps %xmm13,%xmm4
+ .byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,40,108,36,232 // movaps -0x18(%rsp),%xmm5
- .byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 65,15,88,200 // addps %xmm8,%xmm1
+ .byte 15,40,116,36,200 // movaps -0x38(%rsp),%xmm6
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,88,194 // addps %xmm2,%xmm0
+ .byte 68,15,88,200 // addps %xmm0,%xmm9
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
+ .byte 65,15,40,226 // movaps %xmm10,%xmm4
.byte 255,224 // jmpq *%rax
HIDDEN _sk_clamp_0_sse41
@@ -21081,7 +21321,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,41,48,0,0 // movaps 0x3029(%rip),%xmm8 # 45d0 <_sk_callback_sse41+0x37e>
+ .byte 68,15,40,5,39,48,0,0 // movaps 0x3027(%rip),%xmm8 # 4720 <_sk_callback_sse41+0x37c>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -21093,7 +21333,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,30,48,0,0 // minps 0x301e(%rip),%xmm3 # 45e0 <_sk_callback_sse41+0x38e>
+ .byte 15,93,29,28,48,0,0 // minps 0x301c(%rip),%xmm3 # 4730 <_sk_callback_sse41+0x38c>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -21180,7 +21420,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,137,47,0,0 // movaps 0x2f89(%rip),%xmm9 # 45f0 <_sk_callback_sse41+0x39e>
+ .byte 68,15,40,13,135,47,0,0 // movaps 0x2f87(%rip),%xmm9 # 4740 <_sk_callback_sse41+0x39c>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -21194,20 +21434,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,116,47,0,0 // movaps 0x2f74(%rip),%xmm11 # 4600 <_sk_callback_sse41+0x3ae>
+ .byte 68,15,40,29,114,47,0,0 // movaps 0x2f72(%rip),%xmm11 # 4750 <_sk_callback_sse41+0x3ac>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,108,47,0,0 // movaps 0x2f6c(%rip),%xmm12 # 4610 <_sk_callback_sse41+0x3be>
+ .byte 68,15,40,37,106,47,0,0 // movaps 0x2f6a(%rip),%xmm12 # 4760 <_sk_callback_sse41+0x3bc>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,108,47,0,0 // movaps 0x2f6c(%rip),%xmm13 # 4620 <_sk_callback_sse41+0x3ce>
+ .byte 68,15,40,45,106,47,0,0 // movaps 0x2f6a(%rip),%xmm13 # 4770 <_sk_callback_sse41+0x3cc>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,108,47,0,0 // movaps 0x2f6c(%rip),%xmm14 # 4630 <_sk_callback_sse41+0x3de>
+ .byte 68,15,40,53,106,47,0,0 // movaps 0x2f6a(%rip),%xmm14 # 4780 <_sk_callback_sse41+0x3dc>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,112,47,0,0 // movaps 0x2f70(%rip),%xmm15 # 4640 <_sk_callback_sse41+0x3ee>
+ .byte 68,15,40,61,110,47,0,0 // movaps 0x2f6e(%rip),%xmm15 # 4790 <_sk_callback_sse41+0x3ec>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -21252,20 +21492,20 @@ _sk_to_srgb_sse41:
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
.byte 69,15,83,200 // rcpps %xmm8,%xmm9
.byte 69,15,82,208 // rsqrtps %xmm8,%xmm10
- .byte 68,15,40,29,224,46,0,0 // movaps 0x2ee0(%rip),%xmm11 # 4650 <_sk_callback_sse41+0x3fe>
+ .byte 68,15,40,29,222,46,0,0 // movaps 0x2ede(%rip),%xmm11 # 47a0 <_sk_callback_sse41+0x3fc>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 65,15,89,203 // mulps %xmm11,%xmm1
- .byte 68,15,40,37,225,46,0,0 // movaps 0x2ee1(%rip),%xmm12 # 4660 <_sk_callback_sse41+0x40e>
+ .byte 68,15,40,37,223,46,0,0 // movaps 0x2edf(%rip),%xmm12 # 47b0 <_sk_callback_sse41+0x40c>
.byte 69,15,89,204 // mulps %xmm12,%xmm9
- .byte 68,15,40,45,229,46,0,0 // movaps 0x2ee5(%rip),%xmm13 # 4670 <_sk_callback_sse41+0x41e>
+ .byte 68,15,40,45,227,46,0,0 // movaps 0x2ee3(%rip),%xmm13 # 47c0 <_sk_callback_sse41+0x41c>
.byte 69,15,88,205 // addps %xmm13,%xmm9
- .byte 68,15,40,53,233,46,0,0 // movaps 0x2ee9(%rip),%xmm14 # 4680 <_sk_callback_sse41+0x42e>
+ .byte 68,15,40,53,231,46,0,0 // movaps 0x2ee7(%rip),%xmm14 # 47d0 <_sk_callback_sse41+0x42c>
.byte 69,15,89,214 // mulps %xmm14,%xmm10
.byte 69,15,88,209 // addps %xmm9,%xmm10
- .byte 68,15,40,5,233,46,0,0 // movaps 0x2ee9(%rip),%xmm8 # 4690 <_sk_callback_sse41+0x43e>
+ .byte 68,15,40,5,231,46,0,0 // movaps 0x2ee7(%rip),%xmm8 # 47e0 <_sk_callback_sse41+0x43c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,93,202 // minps %xmm10,%xmm9
- .byte 68,15,40,61,233,46,0,0 // movaps 0x2ee9(%rip),%xmm15 # 46a0 <_sk_callback_sse41+0x44e>
+ .byte 68,15,40,61,231,46,0,0 // movaps 0x2ee7(%rip),%xmm15 # 47f0 <_sk_callback_sse41+0x44c>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,68,15,56,20,201 // blendvps %xmm0,%xmm1,%xmm9
.byte 15,82,194 // rsqrtps %xmm2,%xmm0
@@ -21319,7 +21559,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,226 // minps %xmm2,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,58,46,0,0 // movaps 0x2e3a(%rip),%xmm14 # 46b0 <_sk_callback_sse41+0x45e>
+ .byte 68,15,40,53,56,46,0,0 // movaps 0x2e38(%rip),%xmm14 # 4800 <_sk_callback_sse41+0x45c>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -21328,27 +21568,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,33,46,0,0 // andps 0x2e21(%rip),%xmm15 # 46c0 <_sk_callback_sse41+0x46e>
+ .byte 68,15,84,61,31,46,0,0 // andps 0x2e1f(%rip),%xmm15 # 4810 <_sk_callback_sse41+0x46c>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,20,46,0,0 // movaps 0x2e14(%rip),%xmm13 # 46d0 <_sk_callback_sse41+0x47e>
+ .byte 68,15,40,45,18,46,0,0 // movaps 0x2e12(%rip),%xmm13 # 4820 <_sk_callback_sse41+0x47c>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,16,46,0,0 // addps 0x2e10(%rip),%xmm8 # 46e0 <_sk_callback_sse41+0x48e>
+ .byte 68,15,88,5,14,46,0,0 // addps 0x2e0e(%rip),%xmm8 # 4830 <_sk_callback_sse41+0x48c>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,8,46,0,0 // mulps 0x2e08(%rip),%xmm8 # 46f0 <_sk_callback_sse41+0x49e>
+ .byte 68,15,89,5,6,46,0,0 // mulps 0x2e06(%rip),%xmm8 # 4840 <_sk_callback_sse41+0x49c>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,252,45,0,0 // movaps 0x2dfc(%rip),%xmm0 # 4700 <_sk_callback_sse41+0x4ae>
+ .byte 15,40,5,250,45,0,0 // movaps 0x2dfa(%rip),%xmm0 # 4850 <_sk_callback_sse41+0x4ac>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -21370,7 +21610,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,194,45,0,0 // movaps 0x2dc2(%rip),%xmm9 # 4710 <_sk_callback_sse41+0x4be>
+ .byte 68,15,40,13,192,45,0,0 // movaps 0x2dc0(%rip),%xmm9 # 4860 <_sk_callback_sse41+0x4bc>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -21383,19 +21623,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,157,45,0,0 // movaps 0x2d9d(%rip),%xmm14 # 4720 <_sk_callback_sse41+0x4ce>
+ .byte 68,15,40,53,155,45,0,0 // movaps 0x2d9b(%rip),%xmm14 # 4870 <_sk_callback_sse41+0x4cc>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,150,45,0,0 // movaps 0x2d96(%rip),%xmm11 # 4730 <_sk_callback_sse41+0x4de>
+ .byte 68,15,40,29,148,45,0,0 // movaps 0x2d94(%rip),%xmm11 # 4880 <_sk_callback_sse41+0x4dc>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,143,45,0,0 // movaps 0x2d8f(%rip),%xmm7 # 4740 <_sk_callback_sse41+0x4ee>
+ .byte 15,40,61,141,45,0,0 // movaps 0x2d8d(%rip),%xmm7 # 4890 <_sk_callback_sse41+0x4ec>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,144,45,0,0 // movaps 0x2d90(%rip),%xmm3 # 4750 <_sk_callback_sse41+0x4fe>
+ .byte 15,40,29,142,45,0,0 // movaps 0x2d8e(%rip),%xmm3 # 48a0 <_sk_callback_sse41+0x4fc>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -21405,7 +21645,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,111,45,0,0 // movaps 0x2d6f(%rip),%xmm12 # 4760 <_sk_callback_sse41+0x50e>
+ .byte 68,15,40,37,109,45,0,0 // movaps 0x2d6d(%rip),%xmm12 # 48b0 <_sk_callback_sse41+0x50c>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -21439,7 +21679,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,231,44,0,0 // addps 0x2ce7(%rip),%xmm10 # 4770 <_sk_callback_sse41+0x51e>
+ .byte 68,15,88,21,229,44,0,0 // addps 0x2ce5(%rip),%xmm10 # 48c0 <_sk_callback_sse41+0x51c>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -21491,7 +21731,7 @@ _sk_scale_u8_sse41:
.byte 72,139,0 // mov (%rax),%rax
.byte 102,68,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,68,44,0,0 // mulps 0x2c44(%rip),%xmm8 # 4780 <_sk_callback_sse41+0x52e>
+ .byte 68,15,89,5,66,44,0,0 // mulps 0x2c42(%rip),%xmm8 # 48d0 <_sk_callback_sse41+0x52c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -21529,7 +21769,7 @@ _sk_lerp_u8_sse41:
.byte 72,139,0 // mov (%rax),%rax
.byte 102,68,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,240,43,0,0 // mulps 0x2bf0(%rip),%xmm8 # 4790 <_sk_callback_sse41+0x53e>
+ .byte 68,15,89,5,238,43,0,0 // mulps 0x2bee(%rip),%xmm8 # 48e0 <_sk_callback_sse41+0x53c>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -21552,17 +21792,17 @@ _sk_lerp_565_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 102,68,15,56,51,20,120 // pmovzxwd (%rax,%rdi,2),%xmm10
- .byte 102,68,15,111,5,191,43,0,0 // movdqa 0x2bbf(%rip),%xmm8 # 47a0 <_sk_callback_sse41+0x54e>
+ .byte 102,68,15,111,5,189,43,0,0 // movdqa 0x2bbd(%rip),%xmm8 # 48f0 <_sk_callback_sse41+0x54c>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,190,43,0,0 // mulps 0x2bbe(%rip),%xmm8 # 47b0 <_sk_callback_sse41+0x55e>
- .byte 102,68,15,111,13,197,43,0,0 // movdqa 0x2bc5(%rip),%xmm9 # 47c0 <_sk_callback_sse41+0x56e>
+ .byte 68,15,89,5,188,43,0,0 // mulps 0x2bbc(%rip),%xmm8 # 4900 <_sk_callback_sse41+0x55c>
+ .byte 102,68,15,111,13,195,43,0,0 // movdqa 0x2bc3(%rip),%xmm9 # 4910 <_sk_callback_sse41+0x56c>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,196,43,0,0 // mulps 0x2bc4(%rip),%xmm9 # 47d0 <_sk_callback_sse41+0x57e>
- .byte 102,68,15,219,21,203,43,0,0 // pand 0x2bcb(%rip),%xmm10 # 47e0 <_sk_callback_sse41+0x58e>
+ .byte 68,15,89,13,194,43,0,0 // mulps 0x2bc2(%rip),%xmm9 # 4920 <_sk_callback_sse41+0x57c>
+ .byte 102,68,15,219,21,201,43,0,0 // pand 0x2bc9(%rip),%xmm10 # 4930 <_sk_callback_sse41+0x58c>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,207,43,0,0 // mulps 0x2bcf(%rip),%xmm10 # 47f0 <_sk_callback_sse41+0x59e>
+ .byte 68,15,89,21,205,43,0,0 // mulps 0x2bcd(%rip),%xmm10 # 4940 <_sk_callback_sse41+0x59c>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -21593,7 +21833,7 @@ _sk_load_tables_sse41:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 243,69,15,111,4,184 // movdqu (%r8,%rdi,4),%xmm8
- .byte 102,15,111,5,128,43,0,0 // movdqa 0x2b80(%rip),%xmm0 # 4800 <_sk_callback_sse41+0x5ae>
+ .byte 102,15,111,5,126,43,0,0 // movdqa 0x2b7e(%rip),%xmm0 # 4950 <_sk_callback_sse41+0x5ac>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,192,1 // pextrq $0x1,%xmm0,%r8
.byte 102,72,15,126,193 // movq %xmm0,%rcx
@@ -21608,7 +21848,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,193,48 // insertps $0x30,%xmm1,%xmm0
.byte 76,139,64,16 // mov 0x10(%rax),%r8
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,59,43,0,0 // pshufb 0x2b3b(%rip),%xmm1 # 4810 <_sk_callback_sse41+0x5be>
+ .byte 102,15,56,0,13,57,43,0,0 // pshufb 0x2b39(%rip),%xmm1 # 4960 <_sk_callback_sse41+0x5bc>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,201 // movq %xmm1,%rcx
.byte 68,15,182,209 // movzbl %cl,%r10d
@@ -21623,7 +21863,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,64,24 // mov 0x18(%rax),%r8
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,247,42,0,0 // pshufb 0x2af7(%rip),%xmm2 # 4820 <_sk_callback_sse41+0x5ce>
+ .byte 102,15,56,0,21,245,42,0,0 // pshufb 0x2af5(%rip),%xmm2 # 4970 <_sk_callback_sse41+0x5cc>
.byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,200 // movzbl %al,%r9d
@@ -21638,7 +21878,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,180,42,0,0 // mulps 0x2ab4(%rip),%xmm3 # 4830 <_sk_callback_sse41+0x5de>
+ .byte 15,89,29,178,42,0,0 // mulps 0x2ab2(%rip),%xmm3 # 4980 <_sk_callback_sse41+0x5dc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21657,7 +21897,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,135,42,0,0 // movdqa 0x2a87(%rip),%xmm8 # 4840 <_sk_callback_sse41+0x5ee>
+ .byte 102,68,15,111,5,133,42,0,0 // movdqa 0x2a85(%rip),%xmm8 # 4990 <_sk_callback_sse41+0x5ec>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -21674,7 +21914,7 @@ _sk_load_tables_u16_be_sse41:
.byte 243,67,15,16,20,8 // movss (%r8,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
.byte 76,139,64,16 // mov 0x10(%rax),%r8
- .byte 102,15,56,0,13,58,42,0,0 // pshufb 0x2a3a(%rip),%xmm1 # 4850 <_sk_callback_sse41+0x5fe>
+ .byte 102,15,56,0,13,56,42,0,0 // pshufb 0x2a38(%rip),%xmm1 # 49a0 <_sk_callback_sse41+0x5fc>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,201 // movq %xmm1,%rcx
@@ -21710,7 +21950,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,136,41,0,0 // mulps 0x2988(%rip),%xmm3 # 4860 <_sk_callback_sse41+0x60e>
+ .byte 15,89,29,134,41,0,0 // mulps 0x2986(%rip),%xmm3 # 49b0 <_sk_callback_sse41+0x60c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21732,7 +21972,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,74,41,0,0 // movdqa 0x294a(%rip),%xmm8 # 4870 <_sk_callback_sse41+0x61e>
+ .byte 102,68,15,111,5,72,41,0,0 // movdqa 0x2948(%rip),%xmm8 # 49c0 <_sk_callback_sse41+0x61c>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -21749,7 +21989,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,67,15,16,28,8 // movss (%r8,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
.byte 76,139,64,16 // mov 0x10(%rax),%r8
- .byte 102,15,56,0,13,253,40,0,0 // pshufb 0x28fd(%rip),%xmm1 # 4880 <_sk_callback_sse41+0x62e>
+ .byte 102,15,56,0,13,251,40,0,0 // pshufb 0x28fb(%rip),%xmm1 # 49d0 <_sk_callback_sse41+0x62c>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,201 // movq %xmm1,%rcx
@@ -21780,7 +22020,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,8 // movss (%r8,%rcx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,104,40,0,0 // movaps 0x2868(%rip),%xmm3 # 4890 <_sk_callback_sse41+0x63e>
+ .byte 15,40,29,102,40,0,0 // movaps 0x2866(%rip),%xmm3 # 49e0 <_sk_callback_sse41+0x63c>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_byte_tables_sse41
@@ -21790,7 +22030,7 @@ _sk_byte_tables_sse41:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,105,40,0,0 // movaps 0x2869(%rip),%xmm8 # 48a0 <_sk_callback_sse41+0x64e>
+ .byte 68,15,40,5,103,40,0,0 // movaps 0x2867(%rip),%xmm8 # 49f0 <_sk_callback_sse41+0x64c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
@@ -21809,7 +22049,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,193,3 // pinsrb $0x3,%ecx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,26,40,0,0 // movaps 0x281a(%rip),%xmm9 # 48b0 <_sk_callback_sse41+0x65e>
+ .byte 68,15,40,13,24,40,0,0 // movaps 0x2818(%rip),%xmm9 # 4a00 <_sk_callback_sse41+0x65c>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -21900,7 +22140,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,193,3 // pinsrb $0x3,%ecx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,162,38,0,0 // movaps 0x26a2(%rip),%xmm9 # 48c0 <_sk_callback_sse41+0x66e>
+ .byte 68,15,40,13,160,38,0,0 // movaps 0x26a0(%rip),%xmm9 # 4a10 <_sk_callback_sse41+0x66c>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -22077,31 +22317,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,249,35,0,0 // mulps 0x23f9(%rip),%xmm8 # 48d0 <_sk_callback_sse41+0x67e>
- .byte 68,15,84,21,1,36,0,0 // andps 0x2401(%rip),%xmm10 # 48e0 <_sk_callback_sse41+0x68e>
- .byte 68,15,86,21,9,36,0,0 // orps 0x2409(%rip),%xmm10 # 48f0 <_sk_callback_sse41+0x69e>
- .byte 68,15,88,5,17,36,0,0 // addps 0x2411(%rip),%xmm8 # 4900 <_sk_callback_sse41+0x6ae>
- .byte 68,15,40,37,25,36,0,0 // movaps 0x2419(%rip),%xmm12 # 4910 <_sk_callback_sse41+0x6be>
+ .byte 68,15,89,5,247,35,0,0 // mulps 0x23f7(%rip),%xmm8 # 4a20 <_sk_callback_sse41+0x67c>
+ .byte 68,15,84,21,255,35,0,0 // andps 0x23ff(%rip),%xmm10 # 4a30 <_sk_callback_sse41+0x68c>
+ .byte 68,15,86,21,7,36,0,0 // orps 0x2407(%rip),%xmm10 # 4a40 <_sk_callback_sse41+0x69c>
+ .byte 68,15,88,5,15,36,0,0 // addps 0x240f(%rip),%xmm8 # 4a50 <_sk_callback_sse41+0x6ac>
+ .byte 68,15,40,37,23,36,0,0 // movaps 0x2417(%rip),%xmm12 # 4a60 <_sk_callback_sse41+0x6bc>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,25,36,0,0 // addps 0x2419(%rip),%xmm10 # 4920 <_sk_callback_sse41+0x6ce>
- .byte 68,15,40,37,33,36,0,0 // movaps 0x2421(%rip),%xmm12 # 4930 <_sk_callback_sse41+0x6de>
+ .byte 68,15,88,21,23,36,0,0 // addps 0x2417(%rip),%xmm10 # 4a70 <_sk_callback_sse41+0x6cc>
+ .byte 68,15,40,37,31,36,0,0 // movaps 0x241f(%rip),%xmm12 # 4a80 <_sk_callback_sse41+0x6dc>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,14,36,0,0 // addps 0x240e(%rip),%xmm8 # 4940 <_sk_callback_sse41+0x6ee>
- .byte 68,15,40,21,22,36,0,0 // movaps 0x2416(%rip),%xmm10 # 4950 <_sk_callback_sse41+0x6fe>
+ .byte 68,15,88,5,12,36,0,0 // addps 0x240c(%rip),%xmm8 # 4a90 <_sk_callback_sse41+0x6ec>
+ .byte 68,15,40,21,20,36,0,0 // movaps 0x2414(%rip),%xmm10 # 4aa0 <_sk_callback_sse41+0x6fc>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,22,36,0,0 // movaps 0x2416(%rip),%xmm10 # 4960 <_sk_callback_sse41+0x70e>
+ .byte 68,15,40,21,20,36,0,0 // movaps 0x2414(%rip),%xmm10 # 4ab0 <_sk_callback_sse41+0x70c>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,26,36,0,0 // movaps 0x241a(%rip),%xmm11 # 4970 <_sk_callback_sse41+0x71e>
+ .byte 68,15,40,29,24,36,0,0 // movaps 0x2418(%rip),%xmm11 # 4ac0 <_sk_callback_sse41+0x71c>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,26,36,0,0 // mulps 0x241a(%rip),%xmm11 # 4980 <_sk_callback_sse41+0x72e>
+ .byte 68,15,89,29,24,36,0,0 // mulps 0x2418(%rip),%xmm11 # 4ad0 <_sk_callback_sse41+0x72c>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -22109,7 +22349,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,1,36,0,0 // minps 0x2401(%rip),%xmm8 # 4990 <_sk_callback_sse41+0x73e>
+ .byte 68,15,93,5,255,35,0,0 // minps 0x23ff(%rip),%xmm8 # 4ae0 <_sk_callback_sse41+0x73c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -22139,31 +22379,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,162,35,0,0 // mulps 0x23a2(%rip),%xmm12 # 49a0 <_sk_callback_sse41+0x74e>
- .byte 68,15,84,29,170,35,0,0 // andps 0x23aa(%rip),%xmm11 # 49b0 <_sk_callback_sse41+0x75e>
- .byte 68,15,86,29,178,35,0,0 // orps 0x23b2(%rip),%xmm11 # 49c0 <_sk_callback_sse41+0x76e>
- .byte 68,15,88,37,186,35,0,0 // addps 0x23ba(%rip),%xmm12 # 49d0 <_sk_callback_sse41+0x77e>
- .byte 15,40,13,195,35,0,0 // movaps 0x23c3(%rip),%xmm1 # 49e0 <_sk_callback_sse41+0x78e>
+ .byte 68,15,89,37,160,35,0,0 // mulps 0x23a0(%rip),%xmm12 # 4af0 <_sk_callback_sse41+0x74c>
+ .byte 68,15,84,29,168,35,0,0 // andps 0x23a8(%rip),%xmm11 # 4b00 <_sk_callback_sse41+0x75c>
+ .byte 68,15,86,29,176,35,0,0 // orps 0x23b0(%rip),%xmm11 # 4b10 <_sk_callback_sse41+0x76c>
+ .byte 68,15,88,37,184,35,0,0 // addps 0x23b8(%rip),%xmm12 # 4b20 <_sk_callback_sse41+0x77c>
+ .byte 15,40,13,193,35,0,0 // movaps 0x23c1(%rip),%xmm1 # 4b30 <_sk_callback_sse41+0x78c>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,195,35,0,0 // addps 0x23c3(%rip),%xmm11 # 49f0 <_sk_callback_sse41+0x79e>
- .byte 15,40,13,204,35,0,0 // movaps 0x23cc(%rip),%xmm1 # 4a00 <_sk_callback_sse41+0x7ae>
+ .byte 68,15,88,29,193,35,0,0 // addps 0x23c1(%rip),%xmm11 # 4b40 <_sk_callback_sse41+0x79c>
+ .byte 15,40,13,202,35,0,0 // movaps 0x23ca(%rip),%xmm1 # 4b50 <_sk_callback_sse41+0x7ac>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,185,35,0,0 // addps 0x23b9(%rip),%xmm12 # 4a10 <_sk_callback_sse41+0x7be>
- .byte 15,40,13,194,35,0,0 // movaps 0x23c2(%rip),%xmm1 # 4a20 <_sk_callback_sse41+0x7ce>
+ .byte 68,15,88,37,183,35,0,0 // addps 0x23b7(%rip),%xmm12 # 4b60 <_sk_callback_sse41+0x7bc>
+ .byte 15,40,13,192,35,0,0 // movaps 0x23c0(%rip),%xmm1 # 4b70 <_sk_callback_sse41+0x7cc>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,194,35,0,0 // movaps 0x23c2(%rip),%xmm10 # 4a30 <_sk_callback_sse41+0x7de>
+ .byte 68,15,40,21,192,35,0,0 // movaps 0x23c0(%rip),%xmm10 # 4b80 <_sk_callback_sse41+0x7dc>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,199,35,0,0 // movaps 0x23c7(%rip),%xmm1 # 4a40 <_sk_callback_sse41+0x7ee>
+ .byte 15,40,13,197,35,0,0 // movaps 0x23c5(%rip),%xmm1 # 4b90 <_sk_callback_sse41+0x7ec>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,200,35,0,0 // mulps 0x23c8(%rip),%xmm1 # 4a50 <_sk_callback_sse41+0x7fe>
+ .byte 15,89,13,198,35,0,0 // mulps 0x23c6(%rip),%xmm1 # 4ba0 <_sk_callback_sse41+0x7fc>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -22171,7 +22411,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,179,35,0,0 // minps 0x23b3(%rip),%xmm1 # 4a60 <_sk_callback_sse41+0x80e>
+ .byte 15,93,13,177,35,0,0 // minps 0x23b1(%rip),%xmm1 # 4bb0 <_sk_callback_sse41+0x80c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -22201,31 +22441,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,84,35,0,0 // mulps 0x2354(%rip),%xmm12 # 4a70 <_sk_callback_sse41+0x81e>
- .byte 68,15,84,29,92,35,0,0 // andps 0x235c(%rip),%xmm11 # 4a80 <_sk_callback_sse41+0x82e>
- .byte 68,15,86,29,100,35,0,0 // orps 0x2364(%rip),%xmm11 # 4a90 <_sk_callback_sse41+0x83e>
- .byte 68,15,88,37,108,35,0,0 // addps 0x236c(%rip),%xmm12 # 4aa0 <_sk_callback_sse41+0x84e>
- .byte 15,40,21,117,35,0,0 // movaps 0x2375(%rip),%xmm2 # 4ab0 <_sk_callback_sse41+0x85e>
+ .byte 68,15,89,37,82,35,0,0 // mulps 0x2352(%rip),%xmm12 # 4bc0 <_sk_callback_sse41+0x81c>
+ .byte 68,15,84,29,90,35,0,0 // andps 0x235a(%rip),%xmm11 # 4bd0 <_sk_callback_sse41+0x82c>
+ .byte 68,15,86,29,98,35,0,0 // orps 0x2362(%rip),%xmm11 # 4be0 <_sk_callback_sse41+0x83c>
+ .byte 68,15,88,37,106,35,0,0 // addps 0x236a(%rip),%xmm12 # 4bf0 <_sk_callback_sse41+0x84c>
+ .byte 15,40,21,115,35,0,0 // movaps 0x2373(%rip),%xmm2 # 4c00 <_sk_callback_sse41+0x85c>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,117,35,0,0 // addps 0x2375(%rip),%xmm11 # 4ac0 <_sk_callback_sse41+0x86e>
- .byte 15,40,21,126,35,0,0 // movaps 0x237e(%rip),%xmm2 # 4ad0 <_sk_callback_sse41+0x87e>
+ .byte 68,15,88,29,115,35,0,0 // addps 0x2373(%rip),%xmm11 # 4c10 <_sk_callback_sse41+0x86c>
+ .byte 15,40,21,124,35,0,0 // movaps 0x237c(%rip),%xmm2 # 4c20 <_sk_callback_sse41+0x87c>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,107,35,0,0 // addps 0x236b(%rip),%xmm12 # 4ae0 <_sk_callback_sse41+0x88e>
- .byte 15,40,21,116,35,0,0 // movaps 0x2374(%rip),%xmm2 # 4af0 <_sk_callback_sse41+0x89e>
+ .byte 68,15,88,37,105,35,0,0 // addps 0x2369(%rip),%xmm12 # 4c30 <_sk_callback_sse41+0x88c>
+ .byte 15,40,21,114,35,0,0 // movaps 0x2372(%rip),%xmm2 # 4c40 <_sk_callback_sse41+0x89c>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,116,35,0,0 // movaps 0x2374(%rip),%xmm10 # 4b00 <_sk_callback_sse41+0x8ae>
+ .byte 68,15,40,21,114,35,0,0 // movaps 0x2372(%rip),%xmm10 # 4c50 <_sk_callback_sse41+0x8ac>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,121,35,0,0 // movaps 0x2379(%rip),%xmm2 # 4b10 <_sk_callback_sse41+0x8be>
+ .byte 15,40,21,119,35,0,0 // movaps 0x2377(%rip),%xmm2 # 4c60 <_sk_callback_sse41+0x8bc>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,122,35,0,0 // mulps 0x237a(%rip),%xmm2 # 4b20 <_sk_callback_sse41+0x8ce>
+ .byte 15,89,21,120,35,0,0 // mulps 0x2378(%rip),%xmm2 # 4c70 <_sk_callback_sse41+0x8cc>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -22233,7 +22473,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,101,35,0,0 // minps 0x2365(%rip),%xmm2 # 4b30 <_sk_callback_sse41+0x8de>
+ .byte 15,93,21,99,35,0,0 // minps 0x2363(%rip),%xmm2 # 4c80 <_sk_callback_sse41+0x8dc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -22263,31 +22503,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,6,35,0,0 // mulps 0x2306(%rip),%xmm12 # 4b40 <_sk_callback_sse41+0x8ee>
- .byte 68,15,84,29,14,35,0,0 // andps 0x230e(%rip),%xmm11 # 4b50 <_sk_callback_sse41+0x8fe>
- .byte 68,15,86,29,22,35,0,0 // orps 0x2316(%rip),%xmm11 # 4b60 <_sk_callback_sse41+0x90e>
- .byte 68,15,88,37,30,35,0,0 // addps 0x231e(%rip),%xmm12 # 4b70 <_sk_callback_sse41+0x91e>
- .byte 15,40,29,39,35,0,0 // movaps 0x2327(%rip),%xmm3 # 4b80 <_sk_callback_sse41+0x92e>
+ .byte 68,15,89,37,4,35,0,0 // mulps 0x2304(%rip),%xmm12 # 4c90 <_sk_callback_sse41+0x8ec>
+ .byte 68,15,84,29,12,35,0,0 // andps 0x230c(%rip),%xmm11 # 4ca0 <_sk_callback_sse41+0x8fc>
+ .byte 68,15,86,29,20,35,0,0 // orps 0x2314(%rip),%xmm11 # 4cb0 <_sk_callback_sse41+0x90c>
+ .byte 68,15,88,37,28,35,0,0 // addps 0x231c(%rip),%xmm12 # 4cc0 <_sk_callback_sse41+0x91c>
+ .byte 15,40,29,37,35,0,0 // movaps 0x2325(%rip),%xmm3 # 4cd0 <_sk_callback_sse41+0x92c>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,39,35,0,0 // addps 0x2327(%rip),%xmm11 # 4b90 <_sk_callback_sse41+0x93e>
- .byte 15,40,29,48,35,0,0 // movaps 0x2330(%rip),%xmm3 # 4ba0 <_sk_callback_sse41+0x94e>
+ .byte 68,15,88,29,37,35,0,0 // addps 0x2325(%rip),%xmm11 # 4ce0 <_sk_callback_sse41+0x93c>
+ .byte 15,40,29,46,35,0,0 // movaps 0x232e(%rip),%xmm3 # 4cf0 <_sk_callback_sse41+0x94c>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,29,35,0,0 // addps 0x231d(%rip),%xmm12 # 4bb0 <_sk_callback_sse41+0x95e>
- .byte 15,40,29,38,35,0,0 // movaps 0x2326(%rip),%xmm3 # 4bc0 <_sk_callback_sse41+0x96e>
+ .byte 68,15,88,37,27,35,0,0 // addps 0x231b(%rip),%xmm12 # 4d00 <_sk_callback_sse41+0x95c>
+ .byte 15,40,29,36,35,0,0 // movaps 0x2324(%rip),%xmm3 # 4d10 <_sk_callback_sse41+0x96c>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,38,35,0,0 // movaps 0x2326(%rip),%xmm10 # 4bd0 <_sk_callback_sse41+0x97e>
+ .byte 68,15,40,21,36,35,0,0 // movaps 0x2324(%rip),%xmm10 # 4d20 <_sk_callback_sse41+0x97c>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,43,35,0,0 // movaps 0x232b(%rip),%xmm3 # 4be0 <_sk_callback_sse41+0x98e>
+ .byte 15,40,29,41,35,0,0 // movaps 0x2329(%rip),%xmm3 # 4d30 <_sk_callback_sse41+0x98c>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,44,35,0,0 // mulps 0x232c(%rip),%xmm3 # 4bf0 <_sk_callback_sse41+0x99e>
+ .byte 15,89,29,42,35,0,0 // mulps 0x232a(%rip),%xmm3 # 4d40 <_sk_callback_sse41+0x99c>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -22295,7 +22535,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,23,35,0,0 // minps 0x2317(%rip),%xmm3 # 4c00 <_sk_callback_sse41+0x9ae>
+ .byte 15,93,29,21,35,0,0 // minps 0x2315(%rip),%xmm3 # 4d50 <_sk_callback_sse41+0x9ac>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -22305,29 +22545,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,19,35,0,0 // mulps 0x2313(%rip),%xmm8 # 4c10 <_sk_callback_sse41+0x9be>
- .byte 68,15,40,13,27,35,0,0 // movaps 0x231b(%rip),%xmm9 # 4c20 <_sk_callback_sse41+0x9ce>
+ .byte 68,15,89,5,17,35,0,0 // mulps 0x2311(%rip),%xmm8 # 4d60 <_sk_callback_sse41+0x9bc>
+ .byte 68,15,40,13,25,35,0,0 // movaps 0x2319(%rip),%xmm9 # 4d70 <_sk_callback_sse41+0x9cc>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,32,35,0,0 // movaps 0x2320(%rip),%xmm0 # 4c30 <_sk_callback_sse41+0x9de>
+ .byte 15,40,5,30,35,0,0 // movaps 0x231e(%rip),%xmm0 # 4d80 <_sk_callback_sse41+0x9dc>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,30,35,0,0 // addps 0x231e(%rip),%xmm8 # 4c40 <_sk_callback_sse41+0x9ee>
- .byte 68,15,89,5,38,35,0,0 // mulps 0x2326(%rip),%xmm8 # 4c50 <_sk_callback_sse41+0x9fe>
- .byte 15,89,13,47,35,0,0 // mulps 0x232f(%rip),%xmm1 # 4c60 <_sk_callback_sse41+0xa0e>
+ .byte 68,15,88,5,28,35,0,0 // addps 0x231c(%rip),%xmm8 # 4d90 <_sk_callback_sse41+0x9ec>
+ .byte 68,15,89,5,36,35,0,0 // mulps 0x2324(%rip),%xmm8 # 4da0 <_sk_callback_sse41+0x9fc>
+ .byte 15,89,13,45,35,0,0 // mulps 0x232d(%rip),%xmm1 # 4db0 <_sk_callback_sse41+0xa0c>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,52,35,0,0 // mulps 0x2334(%rip),%xmm2 # 4c70 <_sk_callback_sse41+0xa1e>
+ .byte 15,89,21,50,35,0,0 // mulps 0x2332(%rip),%xmm2 # 4dc0 <_sk_callback_sse41+0xa1c>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,40,35,0,0 // movaps 0x2328(%rip),%xmm9 # 4c80 <_sk_callback_sse41+0xa2e>
+ .byte 68,15,40,13,38,35,0,0 // movaps 0x2326(%rip),%xmm9 # 4dd0 <_sk_callback_sse41+0xa2c>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,40,35,0,0 // movaps 0x2328(%rip),%xmm2 # 4c90 <_sk_callback_sse41+0xa3e>
+ .byte 15,40,21,38,35,0,0 // movaps 0x2326(%rip),%xmm2 # 4de0 <_sk_callback_sse41+0xa3c>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,45,35,0,0 // movaps 0x232d(%rip),%xmm12 # 4ca0 <_sk_callback_sse41+0xa4e>
+ .byte 68,15,40,37,43,35,0,0 // movaps 0x232b(%rip),%xmm12 # 4df0 <_sk_callback_sse41+0xa4c>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -22346,8 +22586,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,230,34,0,0 // mulps 0x22e6(%rip),%xmm1 # 4cb0 <_sk_callback_sse41+0xa5e>
- .byte 15,89,21,239,34,0,0 // mulps 0x22ef(%rip),%xmm2 # 4cc0 <_sk_callback_sse41+0xa6e>
+ .byte 15,89,13,228,34,0,0 // mulps 0x22e4(%rip),%xmm1 # 4e00 <_sk_callback_sse41+0xa5c>
+ .byte 15,89,21,237,34,0,0 // mulps 0x22ed(%rip),%xmm2 # 4e10 <_sk_callback_sse41+0xa6c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -22361,7 +22601,7 @@ _sk_load_a8_sse41:
.byte 72,139,0 // mov (%rax),%rax
.byte 102,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,223,34,0,0 // mulps 0x22df(%rip),%xmm3 # 4cd0 <_sk_callback_sse41+0xa7e>
+ .byte 15,89,29,221,34,0,0 // mulps 0x22dd(%rip),%xmm3 # 4e20 <_sk_callback_sse41+0xa7c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
@@ -22394,7 +22634,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,115,34,0,0 // mulps 0x2273(%rip),%xmm3 # 4ce0 <_sk_callback_sse41+0xa8e>
+ .byte 15,89,29,113,34,0,0 // mulps 0x2271(%rip),%xmm3 # 4e30 <_sk_callback_sse41+0xa8c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -22407,7 +22647,7 @@ FUNCTION(_sk_store_a8_sse41)
_sk_store_a8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,103,34,0,0 // movaps 0x2267(%rip),%xmm8 # 4cf0 <_sk_callback_sse41+0xa9e>
+ .byte 68,15,40,5,101,34,0,0 // movaps 0x2265(%rip),%xmm8 # 4e40 <_sk_callback_sse41+0xa9c>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
@@ -22424,9 +22664,9 @@ _sk_load_g8_sse41:
.byte 72,139,0 // mov (%rax),%rax
.byte 102,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,68,34,0,0 // mulps 0x2244(%rip),%xmm0 # 4d00 <_sk_callback_sse41+0xaae>
+ .byte 15,89,5,66,34,0,0 // mulps 0x2242(%rip),%xmm0 # 4e50 <_sk_callback_sse41+0xaac>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,75,34,0,0 // movaps 0x224b(%rip),%xmm3 # 4d10 <_sk_callback_sse41+0xabe>
+ .byte 15,40,29,73,34,0,0 // movaps 0x2249(%rip),%xmm3 # 4e60 <_sk_callback_sse41+0xabc>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -22457,9 +22697,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,228,33,0,0 // mulps 0x21e4(%rip),%xmm0 # 4d20 <_sk_callback_sse41+0xace>
+ .byte 15,89,5,226,33,0,0 // mulps 0x21e2(%rip),%xmm0 # 4e70 <_sk_callback_sse41+0xacc>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,235,33,0,0 // movaps 0x21eb(%rip),%xmm3 # 4d30 <_sk_callback_sse41+0xade>
+ .byte 15,40,29,233,33,0,0 // movaps 0x21e9(%rip),%xmm3 # 4e80 <_sk_callback_sse41+0xadc>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -22471,9 +22711,9 @@ _sk_gather_i8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,192 // mov %rax,%r8
.byte 77,133,192 // test %r8,%r8
- .byte 116,5 // je 2b5c <_sk_gather_i8_sse41+0xf>
+ .byte 116,5 // je 2cae <_sk_gather_i8_sse41+0xf>
.byte 76,137,192 // mov %r8,%rax
- .byte 235,2 // jmp 2b5e <_sk_gather_i8_sse41+0x11>
+ .byte 235,2 // jmp 2cb0 <_sk_gather_i8_sse41+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -22504,17 +22744,17 @@ _sk_gather_i8_sse41:
.byte 102,15,58,34,28,8,1 // pinsrd $0x1,(%rax,%rcx,1),%xmm3
.byte 102,66,15,58,34,28,144,2 // pinsrd $0x2,(%rax,%r10,4),%xmm3
.byte 102,66,15,58,34,28,8,3 // pinsrd $0x3,(%rax,%r9,1),%xmm3
- .byte 102,15,111,5,66,33,0,0 // movdqa 0x2142(%rip),%xmm0 # 4d40 <_sk_callback_sse41+0xaee>
+ .byte 102,15,111,5,64,33,0,0 // movdqa 0x2140(%rip),%xmm0 # 4e90 <_sk_callback_sse41+0xaec>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,67,33,0,0 // movaps 0x2143(%rip),%xmm8 # 4d50 <_sk_callback_sse41+0xafe>
+ .byte 68,15,40,5,65,33,0,0 // movaps 0x2141(%rip),%xmm8 # 4ea0 <_sk_callback_sse41+0xafc>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,66,33,0,0 // pshufb 0x2142(%rip),%xmm1 # 4d60 <_sk_callback_sse41+0xb0e>
+ .byte 102,15,56,0,13,64,33,0,0 // pshufb 0x2140(%rip),%xmm1 # 4eb0 <_sk_callback_sse41+0xb0c>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,62,33,0,0 // pshufb 0x213e(%rip),%xmm2 # 4d70 <_sk_callback_sse41+0xb1e>
+ .byte 102,15,56,0,21,60,33,0,0 // pshufb 0x213c(%rip),%xmm2 # 4ec0 <_sk_callback_sse41+0xb1c>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -22530,19 +22770,19 @@ _sk_load_565_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 102,15,56,51,20,120 // pmovzxwd (%rax,%rdi,2),%xmm2
- .byte 102,15,111,5,36,33,0,0 // movdqa 0x2124(%rip),%xmm0 # 4d80 <_sk_callback_sse41+0xb2e>
+ .byte 102,15,111,5,34,33,0,0 // movdqa 0x2122(%rip),%xmm0 # 4ed0 <_sk_callback_sse41+0xb2c>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,38,33,0,0 // mulps 0x2126(%rip),%xmm0 # 4d90 <_sk_callback_sse41+0xb3e>
- .byte 102,15,111,13,46,33,0,0 // movdqa 0x212e(%rip),%xmm1 # 4da0 <_sk_callback_sse41+0xb4e>
+ .byte 15,89,5,36,33,0,0 // mulps 0x2124(%rip),%xmm0 # 4ee0 <_sk_callback_sse41+0xb3c>
+ .byte 102,15,111,13,44,33,0,0 // movdqa 0x212c(%rip),%xmm1 # 4ef0 <_sk_callback_sse41+0xb4c>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,48,33,0,0 // mulps 0x2130(%rip),%xmm1 # 4db0 <_sk_callback_sse41+0xb5e>
- .byte 102,15,219,21,56,33,0,0 // pand 0x2138(%rip),%xmm2 # 4dc0 <_sk_callback_sse41+0xb6e>
+ .byte 15,89,13,46,33,0,0 // mulps 0x212e(%rip),%xmm1 # 4f00 <_sk_callback_sse41+0xb5c>
+ .byte 102,15,219,21,54,33,0,0 // pand 0x2136(%rip),%xmm2 # 4f10 <_sk_callback_sse41+0xb6c>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,62,33,0,0 // mulps 0x213e(%rip),%xmm2 # 4dd0 <_sk_callback_sse41+0xb7e>
+ .byte 15,89,21,60,33,0,0 // mulps 0x213c(%rip),%xmm2 # 4f20 <_sk_callback_sse41+0xb7c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,69,33,0,0 // movaps 0x2145(%rip),%xmm3 # 4de0 <_sk_callback_sse41+0xb8e>
+ .byte 15,40,29,67,33,0,0 // movaps 0x2143(%rip),%xmm3 # 4f30 <_sk_callback_sse41+0xb8c>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_gather_565_sse41
@@ -22570,19 +22810,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,234,32,0,0 // movdqa 0x20ea(%rip),%xmm0 # 4df0 <_sk_callback_sse41+0xb9e>
+ .byte 102,15,111,5,232,32,0,0 // movdqa 0x20e8(%rip),%xmm0 # 4f40 <_sk_callback_sse41+0xb9c>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,236,32,0,0 // mulps 0x20ec(%rip),%xmm0 # 4e00 <_sk_callback_sse41+0xbae>
- .byte 102,15,111,13,244,32,0,0 // movdqa 0x20f4(%rip),%xmm1 # 4e10 <_sk_callback_sse41+0xbbe>
+ .byte 15,89,5,234,32,0,0 // mulps 0x20ea(%rip),%xmm0 # 4f50 <_sk_callback_sse41+0xbac>
+ .byte 102,15,111,13,242,32,0,0 // movdqa 0x20f2(%rip),%xmm1 # 4f60 <_sk_callback_sse41+0xbbc>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,246,32,0,0 // mulps 0x20f6(%rip),%xmm1 # 4e20 <_sk_callback_sse41+0xbce>
- .byte 102,15,219,21,254,32,0,0 // pand 0x20fe(%rip),%xmm2 # 4e30 <_sk_callback_sse41+0xbde>
+ .byte 15,89,13,244,32,0,0 // mulps 0x20f4(%rip),%xmm1 # 4f70 <_sk_callback_sse41+0xbcc>
+ .byte 102,15,219,21,252,32,0,0 // pand 0x20fc(%rip),%xmm2 # 4f80 <_sk_callback_sse41+0xbdc>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,4,33,0,0 // mulps 0x2104(%rip),%xmm2 # 4e40 <_sk_callback_sse41+0xbee>
+ .byte 15,89,21,2,33,0,0 // mulps 0x2102(%rip),%xmm2 # 4f90 <_sk_callback_sse41+0xbec>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,11,33,0,0 // movaps 0x210b(%rip),%xmm3 # 4e50 <_sk_callback_sse41+0xbfe>
+ .byte 15,40,29,9,33,0,0 // movaps 0x2109(%rip),%xmm3 # 4fa0 <_sk_callback_sse41+0xbfc>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_sse41
@@ -22591,12 +22831,12 @@ FUNCTION(_sk_store_565_sse41)
_sk_store_565_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,12,33,0,0 // movaps 0x210c(%rip),%xmm8 # 4e60 <_sk_callback_sse41+0xc0e>
+ .byte 68,15,40,5,10,33,0,0 // movaps 0x210a(%rip),%xmm8 # 4fb0 <_sk_callback_sse41+0xc0c>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,1,33,0,0 // movaps 0x2101(%rip),%xmm10 # 4e70 <_sk_callback_sse41+0xc1e>
+ .byte 68,15,40,21,255,32,0,0 // movaps 0x20ff(%rip),%xmm10 # 4fc0 <_sk_callback_sse41+0xc1c>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -22616,21 +22856,21 @@ _sk_load_4444_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 102,15,56,51,28,120 // pmovzxwd (%rax,%rdi,2),%xmm3
- .byte 102,15,111,5,204,32,0,0 // movdqa 0x20cc(%rip),%xmm0 # 4e80 <_sk_callback_sse41+0xc2e>
+ .byte 102,15,111,5,202,32,0,0 // movdqa 0x20ca(%rip),%xmm0 # 4fd0 <_sk_callback_sse41+0xc2c>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,206,32,0,0 // mulps 0x20ce(%rip),%xmm0 # 4e90 <_sk_callback_sse41+0xc3e>
- .byte 102,15,111,13,214,32,0,0 // movdqa 0x20d6(%rip),%xmm1 # 4ea0 <_sk_callback_sse41+0xc4e>
+ .byte 15,89,5,204,32,0,0 // mulps 0x20cc(%rip),%xmm0 # 4fe0 <_sk_callback_sse41+0xc3c>
+ .byte 102,15,111,13,212,32,0,0 // movdqa 0x20d4(%rip),%xmm1 # 4ff0 <_sk_callback_sse41+0xc4c>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,216,32,0,0 // mulps 0x20d8(%rip),%xmm1 # 4eb0 <_sk_callback_sse41+0xc5e>
- .byte 102,15,111,21,224,32,0,0 // movdqa 0x20e0(%rip),%xmm2 # 4ec0 <_sk_callback_sse41+0xc6e>
+ .byte 15,89,13,214,32,0,0 // mulps 0x20d6(%rip),%xmm1 # 5000 <_sk_callback_sse41+0xc5c>
+ .byte 102,15,111,21,222,32,0,0 // movdqa 0x20de(%rip),%xmm2 # 5010 <_sk_callback_sse41+0xc6c>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,226,32,0,0 // mulps 0x20e2(%rip),%xmm2 # 4ed0 <_sk_callback_sse41+0xc7e>
- .byte 102,15,219,29,234,32,0,0 // pand 0x20ea(%rip),%xmm3 # 4ee0 <_sk_callback_sse41+0xc8e>
+ .byte 15,89,21,224,32,0,0 // mulps 0x20e0(%rip),%xmm2 # 5020 <_sk_callback_sse41+0xc7c>
+ .byte 102,15,219,29,232,32,0,0 // pand 0x20e8(%rip),%xmm3 # 5030 <_sk_callback_sse41+0xc8c>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,240,32,0,0 // mulps 0x20f0(%rip),%xmm3 # 4ef0 <_sk_callback_sse41+0xc9e>
+ .byte 15,89,29,238,32,0,0 // mulps 0x20ee(%rip),%xmm3 # 5040 <_sk_callback_sse41+0xc9c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22659,21 +22899,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,147,32,0,0 // movdqa 0x2093(%rip),%xmm0 # 4f00 <_sk_callback_sse41+0xcae>
+ .byte 102,15,111,5,145,32,0,0 // movdqa 0x2091(%rip),%xmm0 # 5050 <_sk_callback_sse41+0xcac>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,149,32,0,0 // mulps 0x2095(%rip),%xmm0 # 4f10 <_sk_callback_sse41+0xcbe>
- .byte 102,15,111,13,157,32,0,0 // movdqa 0x209d(%rip),%xmm1 # 4f20 <_sk_callback_sse41+0xcce>
+ .byte 15,89,5,147,32,0,0 // mulps 0x2093(%rip),%xmm0 # 5060 <_sk_callback_sse41+0xcbc>
+ .byte 102,15,111,13,155,32,0,0 // movdqa 0x209b(%rip),%xmm1 # 5070 <_sk_callback_sse41+0xccc>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,159,32,0,0 // mulps 0x209f(%rip),%xmm1 # 4f30 <_sk_callback_sse41+0xcde>
- .byte 102,15,111,21,167,32,0,0 // movdqa 0x20a7(%rip),%xmm2 # 4f40 <_sk_callback_sse41+0xcee>
+ .byte 15,89,13,157,32,0,0 // mulps 0x209d(%rip),%xmm1 # 5080 <_sk_callback_sse41+0xcdc>
+ .byte 102,15,111,21,165,32,0,0 // movdqa 0x20a5(%rip),%xmm2 # 5090 <_sk_callback_sse41+0xcec>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,169,32,0,0 // mulps 0x20a9(%rip),%xmm2 # 4f50 <_sk_callback_sse41+0xcfe>
- .byte 102,15,219,29,177,32,0,0 // pand 0x20b1(%rip),%xmm3 # 4f60 <_sk_callback_sse41+0xd0e>
+ .byte 15,89,21,167,32,0,0 // mulps 0x20a7(%rip),%xmm2 # 50a0 <_sk_callback_sse41+0xcfc>
+ .byte 102,15,219,29,175,32,0,0 // pand 0x20af(%rip),%xmm3 # 50b0 <_sk_callback_sse41+0xd0c>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,183,32,0,0 // mulps 0x20b7(%rip),%xmm3 # 4f70 <_sk_callback_sse41+0xd1e>
+ .byte 15,89,29,181,32,0,0 // mulps 0x20b5(%rip),%xmm3 # 50c0 <_sk_callback_sse41+0xd1c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22683,7 +22923,7 @@ FUNCTION(_sk_store_4444_sse41)
_sk_store_4444_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,182,32,0,0 // movaps 0x20b6(%rip),%xmm8 # 4f80 <_sk_callback_sse41+0xd2e>
+ .byte 68,15,40,5,180,32,0,0 // movaps 0x20b4(%rip),%xmm8 # 50d0 <_sk_callback_sse41+0xd2c>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -22713,17 +22953,17 @@ _sk_load_8888_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 15,16,28,184 // movups (%rax,%rdi,4),%xmm3
- .byte 15,40,5,85,32,0,0 // movaps 0x2055(%rip),%xmm0 # 4f90 <_sk_callback_sse41+0xd3e>
+ .byte 15,40,5,83,32,0,0 // movaps 0x2053(%rip),%xmm0 # 50e0 <_sk_callback_sse41+0xd3c>
.byte 15,84,195 // andps %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,87,32,0,0 // movaps 0x2057(%rip),%xmm8 # 4fa0 <_sk_callback_sse41+0xd4e>
+ .byte 68,15,40,5,85,32,0,0 // movaps 0x2055(%rip),%xmm8 # 50f0 <_sk_callback_sse41+0xd4c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
- .byte 102,15,56,0,13,87,32,0,0 // pshufb 0x2057(%rip),%xmm1 # 4fb0 <_sk_callback_sse41+0xd5e>
+ .byte 102,15,56,0,13,85,32,0,0 // pshufb 0x2055(%rip),%xmm1 # 5100 <_sk_callback_sse41+0xd5c>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 102,15,56,0,21,84,32,0,0 // pshufb 0x2054(%rip),%xmm2 # 4fc0 <_sk_callback_sse41+0xd6e>
+ .byte 102,15,56,0,21,82,32,0,0 // pshufb 0x2052(%rip),%xmm2 # 5110 <_sk_callback_sse41+0xd6c>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -22754,17 +22994,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,67,15,58,34,28,145,2 // pinsrd $0x2,(%r9,%r10,4),%xmm3
.byte 102,65,15,58,34,28,137,3 // pinsrd $0x3,(%r9,%rcx,4),%xmm3
- .byte 102,15,111,5,237,31,0,0 // movdqa 0x1fed(%rip),%xmm0 # 4fd0 <_sk_callback_sse41+0xd7e>
+ .byte 102,15,111,5,235,31,0,0 // movdqa 0x1feb(%rip),%xmm0 # 5120 <_sk_callback_sse41+0xd7c>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,238,31,0,0 // movaps 0x1fee(%rip),%xmm8 # 4fe0 <_sk_callback_sse41+0xd8e>
+ .byte 68,15,40,5,236,31,0,0 // movaps 0x1fec(%rip),%xmm8 # 5130 <_sk_callback_sse41+0xd8c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,237,31,0,0 // pshufb 0x1fed(%rip),%xmm1 # 4ff0 <_sk_callback_sse41+0xd9e>
+ .byte 102,15,56,0,13,235,31,0,0 // pshufb 0x1feb(%rip),%xmm1 # 5140 <_sk_callback_sse41+0xd9c>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,233,31,0,0 // pshufb 0x1fe9(%rip),%xmm2 # 5000 <_sk_callback_sse41+0xdae>
+ .byte 102,15,56,0,21,231,31,0,0 // pshufb 0x1fe7(%rip),%xmm2 # 5150 <_sk_callback_sse41+0xdac>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -22779,7 +23019,7 @@ FUNCTION(_sk_store_8888_sse41)
_sk_store_8888_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,213,31,0,0 // movaps 0x1fd5(%rip),%xmm8 # 5010 <_sk_callback_sse41+0xdbe>
+ .byte 68,15,40,5,211,31,0,0 // movaps 0x1fd3(%rip),%xmm8 # 5160 <_sk_callback_sse41+0xdbc>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -22816,18 +23056,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,78,31,0,0 // movdqa 0x1f4e(%rip),%xmm8 # 5020 <_sk_callback_sse41+0xdce>
+ .byte 102,68,15,111,5,76,31,0,0 // movdqa 0x1f4c(%rip),%xmm8 # 5170 <_sk_callback_sse41+0xdcc>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,73,31,0,0 // movdqa 0x1f49(%rip),%xmm3 # 5030 <_sk_callback_sse41+0xdde>
+ .byte 102,15,111,29,71,31,0,0 // movdqa 0x1f47(%rip),%xmm3 # 5180 <_sk_callback_sse41+0xddc>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,53,31,0,0 // movdqa 0x1f35(%rip),%xmm10 # 5040 <_sk_callback_sse41+0xdee>
+ .byte 102,68,15,111,21,51,31,0,0 // movdqa 0x1f33(%rip),%xmm10 # 5190 <_sk_callback_sse41+0xdec>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -22900,18 +23140,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,243,29,0,0 // movdqa 0x1df3(%rip),%xmm8 # 5050 <_sk_callback_sse41+0xdfe>
+ .byte 102,68,15,111,5,241,29,0,0 // movdqa 0x1df1(%rip),%xmm8 # 51a0 <_sk_callback_sse41+0xdfc>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,238,29,0,0 // movdqa 0x1dee(%rip),%xmm3 # 5060 <_sk_callback_sse41+0xe0e>
+ .byte 102,15,111,29,236,29,0,0 // movdqa 0x1dec(%rip),%xmm3 # 51b0 <_sk_callback_sse41+0xe0c>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,218,29,0,0 // movdqa 0x1dda(%rip),%xmm10 # 5070 <_sk_callback_sse41+0xe1e>
+ .byte 102,68,15,111,21,216,29,0,0 // movdqa 0x1dd8(%rip),%xmm10 # 51c0 <_sk_callback_sse41+0xe1c>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -22959,17 +23199,17 @@ FUNCTION(_sk_store_f16_sse41)
_sk_store_f16_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 102,68,15,111,21,16,29,0,0 // movdqa 0x1d10(%rip),%xmm10 # 5080 <_sk_callback_sse41+0xe2e>
+ .byte 102,68,15,111,21,14,29,0,0 // movdqa 0x1d0e(%rip),%xmm10 # 51d0 <_sk_callback_sse41+0xe2c>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,219,234 // pand %xmm10,%xmm13
.byte 102,69,15,239,229 // pxor %xmm13,%xmm12
- .byte 102,68,15,111,13,3,29,0,0 // movdqa 0x1d03(%rip),%xmm9 # 5090 <_sk_callback_sse41+0xe3e>
+ .byte 102,68,15,111,13,1,29,0,0 // movdqa 0x1d01(%rip),%xmm9 # 51e0 <_sk_callback_sse41+0xe3c>
.byte 102,65,15,114,213,16 // psrld $0x10,%xmm13
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,196 // pcmpgtd %xmm12,%xmm8
.byte 102,65,15,114,212,13 // psrld $0xd,%xmm12
- .byte 102,68,15,111,29,244,28,0,0 // movdqa 0x1cf4(%rip),%xmm11 # 50a0 <_sk_callback_sse41+0xe4e>
+ .byte 102,68,15,111,29,242,28,0,0 // movdqa 0x1cf2(%rip),%xmm11 # 51f0 <_sk_callback_sse41+0xe4c>
.byte 102,69,15,235,235 // por %xmm11,%xmm13
.byte 102,69,15,254,236 // paddd %xmm12,%xmm13
.byte 102,69,15,223,197 // pandn %xmm13,%xmm8
@@ -23039,7 +23279,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,195,27,0,0 // movaps 0x1bc3(%rip),%xmm8 # 50b0 <_sk_callback_sse41+0xe5e>
+ .byte 68,15,40,5,193,27,0,0 // movaps 0x1bc1(%rip),%xmm8 # 5200 <_sk_callback_sse41+0xe5c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -23091,7 +23331,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,193 // por %xmm1,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,4,27,0,0 // movaps 0x1b04(%rip),%xmm8 # 50c0 <_sk_callback_sse41+0xe6e>
+ .byte 68,15,40,5,2,27,0,0 // movaps 0x1b02(%rip),%xmm8 # 5210 <_sk_callback_sse41+0xe6c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -23108,7 +23348,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,203,26,0,0 // movaps 0x1acb(%rip),%xmm3 # 50d0 <_sk_callback_sse41+0xe7e>
+ .byte 15,40,29,201,26,0,0 // movaps 0x1ac9(%rip),%xmm3 # 5220 <_sk_callback_sse41+0xe7c>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_u16_be_sse41
@@ -23117,7 +23357,7 @@ FUNCTION(_sk_store_u16_be_sse41)
_sk_store_u16_be_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,13,204,26,0,0 // movaps 0x1acc(%rip),%xmm9 # 50e0 <_sk_callback_sse41+0xe8e>
+ .byte 68,15,40,13,202,26,0,0 // movaps 0x1aca(%rip),%xmm9 # 5230 <_sk_callback_sse41+0xe8c>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -23328,10 +23568,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,40,24,0,0 // mulps 0x1828(%rip),%xmm0 # 50f0 <_sk_callback_sse41+0xe9e>
- .byte 15,89,13,49,24,0,0 // mulps 0x1831(%rip),%xmm1 # 5100 <_sk_callback_sse41+0xeae>
+ .byte 15,89,5,38,24,0,0 // mulps 0x1826(%rip),%xmm0 # 5240 <_sk_callback_sse41+0xe9c>
+ .byte 15,89,13,47,24,0,0 // mulps 0x182f(%rip),%xmm1 # 5250 <_sk_callback_sse41+0xeac>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,55,24,0,0 // mulps 0x1837(%rip),%xmm3 # 5110 <_sk_callback_sse41+0xebe>
+ .byte 15,89,29,53,24,0,0 // mulps 0x1835(%rip),%xmm3 # 5260 <_sk_callback_sse41+0xebc>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -23564,7 +23804,7 @@ _sk_gradient_sse41:
.byte 69,15,198,237,0 // shufps $0x0,%xmm13,%xmm13
.byte 72,139,8 // mov (%rax),%rcx
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,132,254,0,0,0 // je 3d7b <_sk_gradient_sse41+0x138>
+ .byte 15,132,254,0,0,0 // je 3ecd <_sk_gradient_sse41+0x138>
.byte 15,41,100,36,168 // movaps %xmm4,-0x58(%rsp)
.byte 15,41,108,36,184 // movaps %xmm5,-0x48(%rsp)
.byte 15,41,116,36,200 // movaps %xmm6,-0x38(%rsp)
@@ -23614,12 +23854,12 @@ _sk_gradient_sse41:
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 72,131,192,36 // add $0x24,%rax
.byte 72,255,201 // dec %rcx
- .byte 15,133,65,255,255,255 // jne 3ca6 <_sk_gradient_sse41+0x63>
+ .byte 15,133,65,255,255,255 // jne 3df8 <_sk_gradient_sse41+0x63>
.byte 15,40,124,36,216 // movaps -0x28(%rsp),%xmm7
.byte 15,40,116,36,200 // movaps -0x38(%rsp),%xmm6
.byte 15,40,108,36,184 // movaps -0x48(%rsp),%xmm5
.byte 15,40,100,36,168 // movaps -0x58(%rsp),%xmm4
- .byte 235,13 // jmp 3d88 <_sk_gradient_sse41+0x145>
+ .byte 235,13 // jmp 3eda <_sk_gradient_sse41+0x145>
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
@@ -23688,26 +23928,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,192,18,0,0 // movaps 0x12c0(%rip),%xmm10 # 5120 <_sk_callback_sse41+0xece>
+ .byte 68,15,40,21,190,18,0,0 // movaps 0x12be(%rip),%xmm10 # 5270 <_sk_callback_sse41+0xecc>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,196,18,0,0 // addps 0x12c4(%rip),%xmm10 # 5130 <_sk_callback_sse41+0xede>
+ .byte 68,15,88,21,194,18,0,0 // addps 0x12c2(%rip),%xmm10 # 5280 <_sk_callback_sse41+0xedc>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,200,18,0,0 // addps 0x12c8(%rip),%xmm10 # 5140 <_sk_callback_sse41+0xeee>
+ .byte 68,15,88,21,198,18,0,0 // addps 0x12c6(%rip),%xmm10 # 5290 <_sk_callback_sse41+0xeec>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,204,18,0,0 // addps 0x12cc(%rip),%xmm10 # 5150 <_sk_callback_sse41+0xefe>
+ .byte 68,15,88,21,202,18,0,0 // addps 0x12ca(%rip),%xmm10 # 52a0 <_sk_callback_sse41+0xefc>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,203,18,0,0 // movaps 0x12cb(%rip),%xmm11 # 5160 <_sk_callback_sse41+0xf0e>
+ .byte 68,15,40,29,201,18,0,0 // movaps 0x12c9(%rip),%xmm11 # 52b0 <_sk_callback_sse41+0xf0c>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,196,18,0,0 // movaps 0x12c4(%rip),%xmm11 # 5170 <_sk_callback_sse41+0xf1e>
+ .byte 68,15,40,29,194,18,0,0 // movaps 0x12c2(%rip),%xmm11 # 52c0 <_sk_callback_sse41+0xf1c>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,182,18,0,0 // movaps 0x12b6(%rip),%xmm9 # 5180 <_sk_callback_sse41+0xf2e>
+ .byte 68,15,40,13,180,18,0,0 // movaps 0x12b4(%rip),%xmm9 # 52d0 <_sk_callback_sse41+0xf2c>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -23734,7 +23974,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,135,18,0,0 // movaps 0x1287(%rip),%xmm8 # 5190 <_sk_callback_sse41+0xf3e>
+ .byte 68,15,40,5,133,18,0,0 // movaps 0x1285(%rip),%xmm8 # 52e0 <_sk_callback_sse41+0xf3c>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -23778,8 +24018,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,9,18,0,0 // addps 0x1209(%rip),%xmm0 # 51a0 <_sk_callback_sse41+0xf4e>
- .byte 68,15,40,13,17,18,0,0 // movaps 0x1211(%rip),%xmm9 # 51b0 <_sk_callback_sse41+0xf5e>
+ .byte 15,88,5,7,18,0,0 // addps 0x1207(%rip),%xmm0 # 52f0 <_sk_callback_sse41+0xf4c>
+ .byte 68,15,40,13,15,18,0,0 // movaps 0x120f(%rip),%xmm9 # 5300 <_sk_callback_sse41+0xf5c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23792,7 +24032,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,0,18,0,0 // addps 0x1200(%rip),%xmm0 # 51c0 <_sk_callback_sse41+0xf6e>
+ .byte 15,88,5,254,17,0,0 // addps 0x11fe(%rip),%xmm0 # 5310 <_sk_callback_sse41+0xf6c>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23804,8 +24044,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,242,17,0,0 // addps 0x11f2(%rip),%xmm1 # 51d0 <_sk_callback_sse41+0xf7e>
- .byte 68,15,40,13,250,17,0,0 // movaps 0x11fa(%rip),%xmm9 # 51e0 <_sk_callback_sse41+0xf8e>
+ .byte 15,88,13,240,17,0,0 // addps 0x11f0(%rip),%xmm1 # 5320 <_sk_callback_sse41+0xf7c>
+ .byte 68,15,40,13,248,17,0,0 // movaps 0x11f8(%rip),%xmm9 # 5330 <_sk_callback_sse41+0xf8c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23818,7 +24058,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,232,17,0,0 // addps 0x11e8(%rip),%xmm1 # 51f0 <_sk_callback_sse41+0xf9e>
+ .byte 15,88,13,230,17,0,0 // addps 0x11e6(%rip),%xmm1 # 5340 <_sk_callback_sse41+0xf9c>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23830,13 +24070,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,219,17,0,0 // addps 0x11db(%rip),%xmm0 # 5200 <_sk_callback_sse41+0xfae>
- .byte 68,15,40,13,227,17,0,0 // movaps 0x11e3(%rip),%xmm9 # 5210 <_sk_callback_sse41+0xfbe>
+ .byte 15,88,5,217,17,0,0 // addps 0x11d9(%rip),%xmm0 # 5350 <_sk_callback_sse41+0xfac>
+ .byte 68,15,40,13,225,17,0,0 // movaps 0x11e1(%rip),%xmm9 # 5360 <_sk_callback_sse41+0xfbc>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,223,17,0,0 // mulps 0x11df(%rip),%xmm9 # 5220 <_sk_callback_sse41+0xfce>
- .byte 68,15,88,13,231,17,0,0 // addps 0x11e7(%rip),%xmm9 # 5230 <_sk_callback_sse41+0xfde>
+ .byte 68,15,89,13,221,17,0,0 // mulps 0x11dd(%rip),%xmm9 # 5370 <_sk_callback_sse41+0xfcc>
+ .byte 68,15,88,13,229,17,0,0 // addps 0x11e5(%rip),%xmm9 # 5380 <_sk_callback_sse41+0xfdc>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23849,16 +24089,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,214,17,0,0 // addps 0x11d6(%rip),%xmm0 # 5240 <_sk_callback_sse41+0xfee>
- .byte 68,15,40,13,222,17,0,0 // movaps 0x11de(%rip),%xmm9 # 5250 <_sk_callback_sse41+0xffe>
+ .byte 15,88,5,212,17,0,0 // addps 0x11d4(%rip),%xmm0 # 5390 <_sk_callback_sse41+0xfec>
+ .byte 68,15,40,13,220,17,0,0 // movaps 0x11dc(%rip),%xmm9 # 53a0 <_sk_callback_sse41+0xffc>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,226,17,0,0 // movaps 0x11e2(%rip),%xmm8 # 5260 <_sk_callback_sse41+0x100e>
+ .byte 68,15,40,5,224,17,0,0 // movaps 0x11e0(%rip),%xmm8 # 53b0 <_sk_callback_sse41+0x100c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,230,17,0,0 // addps 0x11e6(%rip),%xmm8 # 5270 <_sk_callback_sse41+0x101e>
+ .byte 68,15,88,5,228,17,0,0 // addps 0x11e4(%rip),%xmm8 # 53c0 <_sk_callback_sse41+0x101c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,234,17,0,0 // addps 0x11ea(%rip),%xmm8 # 5280 <_sk_callback_sse41+0x102e>
+ .byte 68,15,88,5,232,17,0,0 // addps 0x11e8(%rip),%xmm8 # 53d0 <_sk_callback_sse41+0x102c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,238,17,0,0 // addps 0x11ee(%rip),%xmm8 # 5290 <_sk_callback_sse41+0x103e>
+ .byte 68,15,88,5,236,17,0,0 // addps 0x11ec(%rip),%xmm8 # 53e0 <_sk_callback_sse41+0x103c>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23868,17 +24108,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,232,17,0,0 // movaps 0x11e8(%rip),%xmm8 # 52a0 <_sk_callback_sse41+0x104e>
+ .byte 68,15,40,5,230,17,0,0 // movaps 0x11e6(%rip),%xmm8 # 53f0 <_sk_callback_sse41+0x104c>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,228,17,0,0 // movaps 0x11e4(%rip),%xmm10 # 52b0 <_sk_callback_sse41+0x105e>
+ .byte 68,15,40,21,226,17,0,0 // movaps 0x11e2(%rip),%xmm10 # 5400 <_sk_callback_sse41+0x105c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,232,17,0,0 // addps 0x11e8(%rip),%xmm10 # 52c0 <_sk_callback_sse41+0x106e>
+ .byte 68,15,88,21,230,17,0,0 // addps 0x11e6(%rip),%xmm10 # 5410 <_sk_callback_sse41+0x106c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,228,17,0,0 // addps 0x11e4(%rip),%xmm10 # 52d0 <_sk_callback_sse41+0x107e>
+ .byte 68,15,88,21,226,17,0,0 // addps 0x11e2(%rip),%xmm10 # 5420 <_sk_callback_sse41+0x107c>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23890,11 +24130,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,215,17,0,0 // addps 0x11d7(%rip),%xmm0 # 52e0 <_sk_callback_sse41+0x108e>
+ .byte 15,88,5,213,17,0,0 // addps 0x11d5(%rip),%xmm0 # 5430 <_sk_callback_sse41+0x108c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,215,17,0,0 // mulps 0x11d7(%rip),%xmm8 # 52f0 <_sk_callback_sse41+0x109e>
- .byte 68,15,88,5,223,17,0,0 // addps 0x11df(%rip),%xmm8 # 5300 <_sk_callback_sse41+0x10ae>
+ .byte 68,15,89,5,213,17,0,0 // mulps 0x11d5(%rip),%xmm8 # 5440 <_sk_callback_sse41+0x109c>
+ .byte 68,15,88,5,221,17,0,0 // addps 0x11dd(%rip),%xmm8 # 5450 <_sk_callback_sse41+0x10ac>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23907,13 +24147,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,205,17,0,0 // addps 0x11cd(%rip),%xmm1 # 5310 <_sk_callback_sse41+0x10be>
- .byte 68,15,40,13,213,17,0,0 // movaps 0x11d5(%rip),%xmm9 # 5320 <_sk_callback_sse41+0x10ce>
+ .byte 15,88,13,203,17,0,0 // addps 0x11cb(%rip),%xmm1 # 5460 <_sk_callback_sse41+0x10bc>
+ .byte 68,15,40,13,211,17,0,0 // movaps 0x11d3(%rip),%xmm9 # 5470 <_sk_callback_sse41+0x10cc>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,209,17,0,0 // mulps 0x11d1(%rip),%xmm9 # 5330 <_sk_callback_sse41+0x10de>
- .byte 68,15,88,13,217,17,0,0 // addps 0x11d9(%rip),%xmm9 # 5340 <_sk_callback_sse41+0x10ee>
+ .byte 68,15,89,13,207,17,0,0 // mulps 0x11cf(%rip),%xmm9 # 5480 <_sk_callback_sse41+0x10dc>
+ .byte 68,15,88,13,215,17,0,0 // addps 0x11d7(%rip),%xmm9 # 5490 <_sk_callback_sse41+0x10ec>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23926,16 +24166,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,199,17,0,0 // addps 0x11c7(%rip),%xmm1 # 5350 <_sk_callback_sse41+0x10fe>
- .byte 68,15,40,13,207,17,0,0 // movaps 0x11cf(%rip),%xmm9 # 5360 <_sk_callback_sse41+0x110e>
+ .byte 15,88,13,197,17,0,0 // addps 0x11c5(%rip),%xmm1 # 54a0 <_sk_callback_sse41+0x10fc>
+ .byte 68,15,40,13,205,17,0,0 // movaps 0x11cd(%rip),%xmm9 # 54b0 <_sk_callback_sse41+0x110c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,211,17,0,0 // movaps 0x11d3(%rip),%xmm8 # 5370 <_sk_callback_sse41+0x111e>
+ .byte 68,15,40,5,209,17,0,0 // movaps 0x11d1(%rip),%xmm8 # 54c0 <_sk_callback_sse41+0x111c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,215,17,0,0 // addps 0x11d7(%rip),%xmm8 # 5380 <_sk_callback_sse41+0x112e>
+ .byte 68,15,88,5,213,17,0,0 // addps 0x11d5(%rip),%xmm8 # 54d0 <_sk_callback_sse41+0x112c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,219,17,0,0 // addps 0x11db(%rip),%xmm8 # 5390 <_sk_callback_sse41+0x113e>
+ .byte 68,15,88,5,217,17,0,0 // addps 0x11d9(%rip),%xmm8 # 54e0 <_sk_callback_sse41+0x113c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,223,17,0,0 // addps 0x11df(%rip),%xmm8 # 53a0 <_sk_callback_sse41+0x114e>
+ .byte 68,15,88,5,221,17,0,0 // addps 0x11dd(%rip),%xmm8 # 54f0 <_sk_callback_sse41+0x114c>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23945,17 +24185,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,217,17,0,0 // movaps 0x11d9(%rip),%xmm8 # 53b0 <_sk_callback_sse41+0x115e>
+ .byte 68,15,40,5,215,17,0,0 // movaps 0x11d7(%rip),%xmm8 # 5500 <_sk_callback_sse41+0x115c>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,212,17,0,0 // movaps 0x11d4(%rip),%xmm10 # 53c0 <_sk_callback_sse41+0x116e>
+ .byte 68,15,40,21,210,17,0,0 // movaps 0x11d2(%rip),%xmm10 # 5510 <_sk_callback_sse41+0x116c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,216,17,0,0 // addps 0x11d8(%rip),%xmm10 # 53d0 <_sk_callback_sse41+0x117e>
+ .byte 68,15,88,21,214,17,0,0 // addps 0x11d6(%rip),%xmm10 # 5520 <_sk_callback_sse41+0x117c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,212,17,0,0 // addps 0x11d4(%rip),%xmm10 # 53e0 <_sk_callback_sse41+0x118e>
+ .byte 68,15,88,21,210,17,0,0 // addps 0x11d2(%rip),%xmm10 # 5530 <_sk_callback_sse41+0x118c>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23967,11 +24207,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,198,17,0,0 // addps 0x11c6(%rip),%xmm1 # 53f0 <_sk_callback_sse41+0x119e>
+ .byte 15,88,13,196,17,0,0 // addps 0x11c4(%rip),%xmm1 # 5540 <_sk_callback_sse41+0x119c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,198,17,0,0 // mulps 0x11c6(%rip),%xmm8 # 5400 <_sk_callback_sse41+0x11ae>
- .byte 68,15,88,5,206,17,0,0 // addps 0x11ce(%rip),%xmm8 # 5410 <_sk_callback_sse41+0x11be>
+ .byte 68,15,89,5,196,17,0,0 // mulps 0x11c4(%rip),%xmm8 # 5550 <_sk_callback_sse41+0x11ac>
+ .byte 68,15,88,5,204,17,0,0 // addps 0x11cc(%rip),%xmm8 # 5560 <_sk_callback_sse41+0x11bc>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24190,17 +24430,12 @@ BALIGN16
.byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 4508 <.literal16+0x1d8>
- .byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 450c <.literal16+0x1dc>
- .byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 4510 <.literal16+0x1e0>
+ .byte 224,64 // loopne 4658 <.literal16+0x1d8>
.byte 0,0 // add %al,(%rax)
- .byte 128,63,0 // cmpb $0x0,(%rdi)
- .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
- .byte 63 // (bad)
+ .byte 224,64 // loopne 465c <.literal16+0x1dc>
.byte 0,0 // add %al,(%rax)
- .byte 128,63,154 // cmpb $0x9a,(%rdi)
+ .byte 224,64 // loopne 4660 <.literal16+0x1e0>
+ .byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,154 // ds (bad)
@@ -24219,13 +24454,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4541 <.literal16+0x211>
+ .byte 71,225,61 // rex.RXB loope 4681 <.literal16+0x201>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4545 <.literal16+0x215>
+ .byte 71,225,61 // rex.RXB loope 4685 <.literal16+0x205>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4549 <.literal16+0x219>
+ .byte 71,225,61 // rex.RXB loope 4689 <.literal16+0x209>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 454d <.literal16+0x21d>
+ .byte 71,225,61 // rex.RXB loope 468d <.literal16+0x20d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -24250,13 +24485,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4581 <.literal16+0x251>
+ .byte 71,225,61 // rex.RXB loope 46c1 <.literal16+0x241>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4585 <.literal16+0x255>
+ .byte 71,225,61 // rex.RXB loope 46c5 <.literal16+0x245>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4589 <.literal16+0x259>
+ .byte 71,225,61 // rex.RXB loope 46c9 <.literal16+0x249>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 458d <.literal16+0x25d>
+ .byte 71,225,61 // rex.RXB loope 46cd <.literal16+0x24d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -24281,13 +24516,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 45c1 <.literal16+0x291>
+ .byte 71,225,61 // rex.RXB loope 4701 <.literal16+0x281>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 45c5 <.literal16+0x295>
+ .byte 71,225,61 // rex.RXB loope 4705 <.literal16+0x285>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 45c9 <.literal16+0x299>
+ .byte 71,225,61 // rex.RXB loope 4709 <.literal16+0x289>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 45cd <.literal16+0x29d>
+ .byte 71,225,61 // rex.RXB loope 470d <.literal16+0x28d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -24312,13 +24547,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4601 <.literal16+0x2d1>
+ .byte 71,225,61 // rex.RXB loope 4741 <.literal16+0x2c1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4605 <.literal16+0x2d5>
+ .byte 71,225,61 // rex.RXB loope 4745 <.literal16+0x2c5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4609 <.literal16+0x2d9>
+ .byte 71,225,61 // rex.RXB loope 4749 <.literal16+0x2c9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 460d <.literal16+0x2dd>
+ .byte 71,225,61 // rex.RXB loope 474d <.literal16+0x2cd>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -24335,7 +24570,12 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
.byte 63 // (bad)
- .byte 145 // xchg %eax,%ecx
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,0 // cmpb $0x0,(%rdi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
+ .byte 63 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,145 // cmpb $0x91,(%rdi)
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
@@ -24537,13 +24777,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 47c9 <.literal16+0x499>
+ .byte 224,7 // loopne 4919 <.literal16+0x499>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 47cd <.literal16+0x49d>
+ .byte 224,7 // loopne 491d <.literal16+0x49d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 47d1 <.literal16+0x4a1>
+ .byte 224,7 // loopne 4921 <.literal16+0x4a1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 47d5 <.literal16+0x4a5>
+ .byte 224,7 // loopne 4925 <.literal16+0x4a5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -24577,10 +24817,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004818 <_sk_callback_sse41+0xa0005c6>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004968 <_sk_callback_sse41+0xa0005c4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004820 <_sk_callback_sse41+0x30005ce>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004970 <_sk_callback_sse41+0x30005cc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -24635,11 +24875,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 48eb <.literal16+0x5bb>
+ .byte 127,67 // jg 4a3b <.literal16+0x5bb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 48ef <.literal16+0x5bf>
+ .byte 127,67 // jg 4a3f <.literal16+0x5bf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 48f3 <.literal16+0x5c3>
+ .byte 127,67 // jg 4a43 <.literal16+0x5c3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -24654,16 +24894,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 48e4 <.literal16+0x5b4>
+ .byte 127,0 // jg 4a34 <.literal16+0x5b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 48e8 <.literal16+0x5b8>
+ .byte 127,0 // jg 4a38 <.literal16+0x5b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 48ec <.literal16+0x5bc>
+ .byte 127,0 // jg 4a3c <.literal16+0x5bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 48f0 <.literal16+0x5c0>
+ .byte 127,0 // jg 4a40 <.literal16+0x5c0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -24672,7 +24912,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4975 <.literal16+0x645>
+ .byte 119,115 // ja 4ac5 <.literal16+0x645>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -24683,7 +24923,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 48d9 <.literal16+0x5a9>
+ .byte 117,191 // jne 4a29 <.literal16+0x5a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -24695,7 +24935,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3891a <_sk_callback_sse41+0xffffffffe9a346c8>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a38a6a <_sk_callback_sse41+0xffffffffe9a346c6>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -24750,16 +24990,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 49b4 <.literal16+0x684>
+ .byte 127,0 // jg 4b04 <.literal16+0x684>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 49b8 <.literal16+0x688>
+ .byte 127,0 // jg 4b08 <.literal16+0x688>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 49bc <.literal16+0x68c>
+ .byte 127,0 // jg 4b0c <.literal16+0x68c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 49c0 <.literal16+0x690>
+ .byte 127,0 // jg 4b10 <.literal16+0x690>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -24768,7 +25008,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4a45 <.literal16+0x715>
+ .byte 119,115 // ja 4b95 <.literal16+0x715>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -24779,7 +25019,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 49a9 <.literal16+0x679>
+ .byte 117,191 // jne 4af9 <.literal16+0x679>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -24791,7 +25031,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a389ea <_sk_callback_sse41+0xffffffffe9a34798>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a38b3a <_sk_callback_sse41+0xffffffffe9a34796>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -24846,16 +25086,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4a84 <.literal16+0x754>
+ .byte 127,0 // jg 4bd4 <.literal16+0x754>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4a88 <.literal16+0x758>
+ .byte 127,0 // jg 4bd8 <.literal16+0x758>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4a8c <.literal16+0x75c>
+ .byte 127,0 // jg 4bdc <.literal16+0x75c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4a90 <.literal16+0x760>
+ .byte 127,0 // jg 4be0 <.literal16+0x760>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -24864,7 +25104,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4b15 <.literal16+0x7e5>
+ .byte 119,115 // ja 4c65 <.literal16+0x7e5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -24875,7 +25115,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 4a79 <.literal16+0x749>
+ .byte 117,191 // jne 4bc9 <.literal16+0x749>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -24887,7 +25127,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a38aba <_sk_callback_sse41+0xffffffffe9a34868>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a38c0a <_sk_callback_sse41+0xffffffffe9a34866>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -24942,16 +25182,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4b54 <.literal16+0x824>
+ .byte 127,0 // jg 4ca4 <.literal16+0x824>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4b58 <.literal16+0x828>
+ .byte 127,0 // jg 4ca8 <.literal16+0x828>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4b5c <.literal16+0x82c>
+ .byte 127,0 // jg 4cac <.literal16+0x82c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4b60 <.literal16+0x830>
+ .byte 127,0 // jg 4cb0 <.literal16+0x830>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -24960,7 +25200,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4be5 <.literal16+0x8b5>
+ .byte 119,115 // ja 4d35 <.literal16+0x8b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -24971,7 +25211,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 4b49 <.literal16+0x819>
+ .byte 117,191 // jne 4c99 <.literal16+0x819>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -24983,7 +25223,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a38b8a <_sk_callback_sse41+0xffffffffe9a34938>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a38cda <_sk_callback_sse41+0xffffffffe9a34936>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -25034,13 +25274,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 4c67 <.literal16+0x937>
+ .byte 127,67 // jg 4db7 <.literal16+0x937>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4c6b <.literal16+0x93b>
+ .byte 127,67 // jg 4dbb <.literal16+0x93b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4c6f <.literal16+0x93f>
+ .byte 127,67 // jg 4dbf <.literal16+0x93f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4c73 <.literal16+0x943>
+ .byte 127,67 // jg 4dc3 <.literal16+0x943>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -25087,16 +25327,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 4cf3 <.literal16+0x9c3>
+ .byte 118,63 // jbe 4e43 <.literal16+0x9c3>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 4cf7 <.literal16+0x9c7>
+ .byte 118,63 // jbe 4e47 <.literal16+0x9c7>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 4cfb <.literal16+0x9cb>
+ .byte 118,63 // jbe 4e4b <.literal16+0x9cb>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 4cff <.literal16+0x9cf>
+ .byte 118,63 // jbe 4e4f <.literal16+0x9cf>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -25108,11 +25348,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4d3b <.literal16+0xa0b>
+ .byte 127,67 // jg 4e8b <.literal16+0xa0b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4d3f <.literal16+0xa0f>
+ .byte 127,67 // jg 4e8f <.literal16+0xa0f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4d43 <.literal16+0xa13>
+ .byte 127,67 // jg 4e93 <.literal16+0xa13>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,128,63 // addb $0x3f,-0x7fffffc5(%rax)
@@ -25141,7 +25381,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004d70 <_sk_callback_sse41+0x3000b1e>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004ec0 <_sk_callback_sse41+0x3000b1c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -25170,13 +25410,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4da9 <.literal16+0xa79>
+ .byte 224,7 // loopne 4ef9 <.literal16+0xa79>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4dad <.literal16+0xa7d>
+ .byte 224,7 // loopne 4efd <.literal16+0xa7d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4db1 <.literal16+0xa81>
+ .byte 224,7 // loopne 4f01 <.literal16+0xa81>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4db5 <.literal16+0xa85>
+ .byte 224,7 // loopne 4f05 <.literal16+0xa85>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -25222,13 +25462,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4e19 <.literal16+0xae9>
+ .byte 224,7 // loopne 4f69 <.literal16+0xae9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4e1d <.literal16+0xaed>
+ .byte 224,7 // loopne 4f6d <.literal16+0xaed>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4e21 <.literal16+0xaf1>
+ .byte 224,7 // loopne 4f71 <.literal16+0xaf1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4e25 <.literal16+0xaf5>
+ .byte 224,7 // loopne 4f75 <.literal16+0xaf5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -25266,13 +25506,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 4eb6 <.literal16+0xb86>
+ .byte 124,66 // jl 5006 <.literal16+0xb86>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 4eba <.literal16+0xb8a>
+ .byte 124,66 // jl 500a <.literal16+0xb8a>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 4ebe <.literal16+0xb8e>
+ .byte 124,66 // jl 500e <.literal16+0xb8e>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 4ec2 <.literal16+0xb92>
+ .byte 124,66 // jl 5012 <.literal16+0xb92>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -25362,13 +25602,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 4fc5 <.literal16+0xc95>
+ .byte 112,65 // jo 5115 <.literal16+0xc95>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 4fc9 <.literal16+0xc99>
+ .byte 112,65 // jo 5119 <.literal16+0xc99>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 4fcd <.literal16+0xc9d>
+ .byte 112,65 // jo 511d <.literal16+0xc9d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 4fd1 <.literal16+0xca1>
+ .byte 112,65 // jo 5121 <.literal16+0xca1>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -25383,7 +25623,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004fc0 <_sk_callback_sse41+0x3000d6e>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005110 <_sk_callback_sse41+0x3000d6c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -25410,7 +25650,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005000 <_sk_callback_sse41+0x3000dae>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005150 <_sk_callback_sse41+0x3000dac>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -25425,11 +25665,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 505b <.literal16+0xd2b>
+ .byte 127,67 // jg 51ab <.literal16+0xd2b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 505f <.literal16+0xd2f>
+ .byte 127,67 // jg 51af <.literal16+0xd2f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5063 <.literal16+0xd33>
+ .byte 127,67 // jg 51b3 <.literal16+0xd33>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -25505,13 +25745,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 512b <.literal16+0xdfb>
+ .byte 127,71 // jg 527b <.literal16+0xdfb>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 512f <.literal16+0xdff>
+ .byte 127,71 // jg 527f <.literal16+0xdff>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 5133 <.literal16+0xe03>
+ .byte 127,71 // jg 5283 <.literal16+0xe03>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 5137 <.literal16+0xe07>
+ .byte 127,71 // jg 5287 <.literal16+0xe07>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,208 // ds (bad)
@@ -25637,11 +25877,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 5242 <.literal16+0xf12>
+ .byte 62,114,28 // jb,pt 5392 <.literal16+0xf12>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5246 <.literal16+0xf16>
+ .byte 62,114,28 // jb,pt 5396 <.literal16+0xf16>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 524a <.literal16+0xf1a>
+ .byte 62,114,28 // jb,pt 539a <.literal16+0xf1a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -25685,7 +25925,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e0d5 <_sk_callback_sse41+0x3d639e83>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e225 <_sk_callback_sse41+0x3d639e81>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -25711,7 +25951,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e115 <_sk_callback_sse41+0x3d639ec3>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e265 <_sk_callback_sse41+0x3d639ec1>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -25720,13 +25960,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 530e <.literal16+0xfde>
+ .byte 114,28 // jb 545e <.literal16+0xfde>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5312 <.literal16+0xfe2>
+ .byte 62,114,28 // jb,pt 5462 <.literal16+0xfe2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5316 <.literal16+0xfe6>
+ .byte 62,114,28 // jb,pt 5466 <.literal16+0xfe6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 531a <.literal16+0xfea>
+ .byte 62,114,28 // jb,pt 546a <.literal16+0xfea>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -25747,11 +25987,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 5352 <.literal16+0x1022>
+ .byte 62,114,28 // jb,pt 54a2 <.literal16+0x1022>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5356 <.literal16+0x1026>
+ .byte 62,114,28 // jb,pt 54a6 <.literal16+0x1026>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 535a <.literal16+0x102a>
+ .byte 62,114,28 // jb,pt 54aa <.literal16+0x102a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -25795,7 +26035,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e1e5 <_sk_callback_sse41+0x3d639f93>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e335 <_sk_callback_sse41+0x3d639f91>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -25821,7 +26061,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e225 <_sk_callback_sse41+0x3d639fd3>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e375 <_sk_callback_sse41+0x3d639fd1>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -25830,13 +26070,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 541e <.literal16+0x10ee>
+ .byte 114,28 // jb 556e <.literal16+0x10ee>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5422 <_sk_callback_sse41+0x11d0>
+ .byte 62,114,28 // jb,pt 5572 <_sk_callback_sse41+0x11ce>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5426 <_sk_callback_sse41+0x11d4>
+ .byte 62,114,28 // jb,pt 5576 <_sk_callback_sse41+0x11d2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 542a <_sk_callback_sse41+0x11d8>
+ .byte 62,114,28 // jb,pt 557a <_sk_callback_sse41+0x11d6>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -25906,7 +26146,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,199 // movd %edi,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,148,71,0,0 // movaps 0x4794(%rip),%xmm2 # 4810 <_sk_callback_sse2+0xdd>
+ .byte 15,40,21,196,72,0,0 // movaps 0x48c4(%rip),%xmm2 # 4940 <_sk_callback_sse2+0xd7>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,2 // movups (%rdx),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -25915,7 +26155,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,131,71,0,0 // movaps 0x4783(%rip),%xmm2 # 4820 <_sk_callback_sse2+0xed>
+ .byte 15,40,21,179,72,0,0 // movaps 0x48b3(%rip),%xmm2 # 4950 <_sk_callback_sse2+0xe7>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -25938,14 +26178,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,1 // movd (%rcx),%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,72,71,0,0 // movdqa 0x4748(%rip),%xmm10 # 4830 <_sk_callback_sse2+0xfd>
+ .byte 102,68,15,111,21,120,72,0,0 // movdqa 0x4878(%rip),%xmm10 # 4960 <_sk_callback_sse2+0xf7>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,52,71,0,0 // movdqa 0x4734(%rip),%xmm12 # 4840 <_sk_callback_sse2+0x10d>
- .byte 102,68,15,111,45,59,71,0,0 // movdqa 0x473b(%rip),%xmm13 # 4850 <_sk_callback_sse2+0x11d>
+ .byte 102,68,15,111,37,100,72,0,0 // movdqa 0x4864(%rip),%xmm12 # 4970 <_sk_callback_sse2+0x107>
+ .byte 102,68,15,111,45,107,72,0,0 // movdqa 0x486b(%rip),%xmm13 # 4980 <_sk_callback_sse2+0x117>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -25961,8 +26201,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,246,70,0,0 // mulps 0x46f6(%rip),%xmm8 # 4860 <_sk_callback_sse2+0x12d>
- .byte 68,15,88,5,254,70,0,0 // addps 0x46fe(%rip),%xmm8 # 4870 <_sk_callback_sse2+0x13d>
+ .byte 68,15,89,5,38,72,0,0 // mulps 0x4826(%rip),%xmm8 # 4990 <_sk_callback_sse2+0x127>
+ .byte 68,15,88,5,46,72,0,0 // addps 0x482e(%rip),%xmm8 # 49a0 <_sk_callback_sse2+0x137>
.byte 243,68,15,16,72,8 // movss 0x8(%rax),%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -26004,7 +26244,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,171,70,0,0 // movaps 0x46ab(%rip),%xmm8 # 4880 <_sk_callback_sse2+0x14d>
+ .byte 68,15,40,5,219,71,0,0 // movaps 0x47db(%rip),%xmm8 # 49b0 <_sk_callback_sse2+0x147>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -26029,7 +26269,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,110,70,0,0 // movaps 0x466e(%rip),%xmm9 # 4890 <_sk_callback_sse2+0x15d>
+ .byte 68,15,40,13,158,71,0,0 // movaps 0x479e(%rip),%xmm9 # 49c0 <_sk_callback_sse2+0x157>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -26076,7 +26316,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,18,70,0,0 // movaps 0x4612(%rip),%xmm8 # 48a0 <_sk_callback_sse2+0x16d>
+ .byte 68,15,40,5,66,71,0,0 // movaps 0x4742(%rip),%xmm8 # 49d0 <_sk_callback_sse2+0x167>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -26089,7 +26329,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,2,70,0,0 // movaps 0x4602(%rip),%xmm8 # 48b0 <_sk_callback_sse2+0x17d>
+ .byte 68,15,40,5,50,71,0,0 // movaps 0x4732(%rip),%xmm8 # 49e0 <_sk_callback_sse2+0x177>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -26106,7 +26346,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,229,69,0,0 // movaps 0x45e5(%rip),%xmm8 # 48c0 <_sk_callback_sse2+0x18d>
+ .byte 68,15,40,5,21,71,0,0 // movaps 0x4715(%rip),%xmm8 # 49f0 <_sk_callback_sse2+0x187>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -26126,7 +26366,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,185,69,0,0 // movaps 0x45b9(%rip),%xmm8 # 48d0 <_sk_callback_sse2+0x19d>
+ .byte 68,15,40,5,233,70,0,0 // movaps 0x46e9(%rip),%xmm8 # 4a00 <_sk_callback_sse2+0x197>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -26154,7 +26394,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,141,69,0,0 // movaps 0x458d(%rip),%xmm8 # 48e0 <_sk_callback_sse2+0x1ad>
+ .byte 68,15,40,5,189,70,0,0 // movaps 0x46bd(%rip),%xmm8 # 4a10 <_sk_callback_sse2+0x1a7>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -26230,7 +26470,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,190,68,0,0 // movaps 0x44be(%rip),%xmm3 # 48f0 <_sk_callback_sse2+0x1bd>
+ .byte 15,40,29,238,69,0,0 // movaps 0x45ee(%rip),%xmm3 # 4a20 <_sk_callback_sse2+0x1b7>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -26278,7 +26518,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,41,68,0,0 // movaps 0x4429(%rip),%xmm2 # 4900 <_sk_callback_sse2+0x1cd>
+ .byte 15,40,21,89,69,0,0 // movaps 0x4559(%rip),%xmm2 # 4a30 <_sk_callback_sse2+0x1c7>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -26312,7 +26552,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,206,67,0,0 // movaps 0x43ce(%rip),%xmm2 # 4910 <_sk_callback_sse2+0x1dd>
+ .byte 15,40,21,254,68,0,0 // movaps 0x44fe(%rip),%xmm2 # 4a40 <_sk_callback_sse2+0x1d7>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -26349,7 +26589,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,104,67,0,0 // movaps 0x4368(%rip),%xmm2 # 4920 <_sk_callback_sse2+0x1ed>
+ .byte 15,40,21,152,68,0,0 // movaps 0x4498(%rip),%xmm2 # 4a50 <_sk_callback_sse2+0x1e7>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -26376,7 +26616,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,202 // subps %xmm2,%xmm9
- .byte 15,40,13,41,67,0,0 // movaps 0x4329(%rip),%xmm1 # 4930 <_sk_callback_sse2+0x1fd>
+ .byte 15,40,13,89,68,0,0 // movaps 0x4459(%rip),%xmm1 # 4a60 <_sk_callback_sse2+0x1f7>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -26390,7 +26630,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,24,67,0,0 // movaps 0x4318(%rip),%xmm10 # 4940 <_sk_callback_sse2+0x20d>
+ .byte 68,15,40,21,72,68,0,0 // movaps 0x4448(%rip),%xmm10 # 4a70 <_sk_callback_sse2+0x207>
.byte 69,15,40,202 // movaps %xmm10,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,217 // movaps %xmm9,%xmm11
@@ -26484,7 +26724,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,206,65,0,0 // movaps 0x41ce(%rip),%xmm10 # 4950 <_sk_callback_sse2+0x21d>
+ .byte 68,15,40,21,254,66,0,0 // movaps 0x42fe(%rip),%xmm10 # 4a80 <_sk_callback_sse2+0x217>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -26578,7 +26818,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,131,64,0,0 // movaps 0x4083(%rip),%xmm11 # 4960 <_sk_callback_sse2+0x22d>
+ .byte 68,15,40,29,179,65,0,0 // movaps 0x41b3(%rip),%xmm11 # 4a90 <_sk_callback_sse2+0x227>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -26666,7 +26906,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,81,63,0,0 // movaps 0x3f51(%rip),%xmm9 # 4970 <_sk_callback_sse2+0x23d>
+ .byte 68,15,40,13,129,64,0,0 // movaps 0x4081(%rip),%xmm9 # 4aa0 <_sk_callback_sse2+0x237>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -26757,7 +26997,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,14,62,0,0 // movaps 0x3e0e(%rip),%xmm9 # 4980 <_sk_callback_sse2+0x24d>
+ .byte 68,15,40,13,62,63,0,0 // movaps 0x3f3e(%rip),%xmm9 # 4ab0 <_sk_callback_sse2+0x247>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -26770,10 +27010,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,232,61,0,0 // movaps 0x3de8(%rip),%xmm14 # 4990 <_sk_callback_sse2+0x25d>
+ .byte 68,15,40,53,24,63,0,0 // movaps 0x3f18(%rip),%xmm14 # 4ac0 <_sk_callback_sse2+0x257>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,232,61,0,0 // movaps 0x3de8(%rip),%xmm10 # 49a0 <_sk_callback_sse2+0x26d>
+ .byte 68,15,40,21,24,63,0,0 // movaps 0x3f18(%rip),%xmm10 # 4ad0 <_sk_callback_sse2+0x267>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -26913,590 +27153,678 @@ HIDDEN _sk_hue_sse2
.globl _sk_hue_sse2
FUNCTION(_sk_hue_sse2)
_sk_hue_sse2:
- .byte 15,41,124,36,232 // movaps %xmm7,-0x18(%rsp)
+ .byte 68,15,40,200 // movaps %xmm0,%xmm9
+ .byte 68,15,89,203 // mulps %xmm3,%xmm9
+ .byte 68,15,40,209 // movaps %xmm1,%xmm10
+ .byte 68,15,40,225 // movaps %xmm1,%xmm12
+ .byte 68,15,89,211 // mulps %xmm3,%xmm10
+ .byte 68,15,40,5,91,61,0,0 // movaps 0x3d5b(%rip),%xmm8 # 4b10 <_sk_callback_sse2+0x2a7>
+ .byte 69,15,40,216 // movaps %xmm8,%xmm11
+ .byte 15,40,207 // movaps %xmm7,%xmm1
+ .byte 68,15,92,217 // subps %xmm1,%xmm11
+ .byte 65,15,89,195 // mulps %xmm11,%xmm0
+ .byte 15,41,68,36,232 // movaps %xmm0,-0x18(%rsp)
+ .byte 69,15,89,227 // mulps %xmm11,%xmm12
+ .byte 68,15,41,100,36,216 // movaps %xmm12,-0x28(%rsp)
+ .byte 68,15,89,218 // mulps %xmm2,%xmm11
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 68,15,40,229 // movaps %xmm5,%xmm12
+ .byte 68,15,40,237 // movaps %xmm5,%xmm13
.byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 68,15,95,239 // maxps %xmm7,%xmm13
+ .byte 15,41,100,36,200 // movaps %xmm4,-0x38(%rsp)
+ .byte 68,15,40,244 // movaps %xmm4,%xmm14
+ .byte 68,15,40,252 // movaps %xmm4,%xmm15
+ .byte 69,15,95,253 // maxps %xmm13,%xmm15
+ .byte 68,15,93,231 // minps %xmm7,%xmm12
+ .byte 69,15,93,244 // minps %xmm12,%xmm14
+ .byte 69,15,92,254 // subps %xmm14,%xmm15
+ .byte 69,15,40,226 // movaps %xmm10,%xmm12
+ .byte 68,15,93,226 // minps %xmm2,%xmm12
+ .byte 69,15,40,233 // movaps %xmm9,%xmm13
+ .byte 69,15,93,236 // minps %xmm12,%xmm13
+ .byte 69,15,40,226 // movaps %xmm10,%xmm12
+ .byte 68,15,95,226 // maxps %xmm2,%xmm12
+ .byte 69,15,40,241 // movaps %xmm9,%xmm14
+ .byte 69,15,95,244 // maxps %xmm12,%xmm14
+ .byte 69,15,92,245 // subps %xmm13,%xmm14
+ .byte 69,15,92,205 // subps %xmm13,%xmm9
+ .byte 69,15,92,213 // subps %xmm13,%xmm10
+ .byte 65,15,92,213 // subps %xmm13,%xmm2
.byte 15,40,245 // movaps %xmm5,%xmm6
- .byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,250,59,0,0 // movaps 0x3bfa(%rip),%xmm9 # 49b0 <_sk_callback_sse2+0x27d>
- .byte 69,15,40,209 // movaps %xmm9,%xmm10
- .byte 68,15,94,212 // divps %xmm4,%xmm10
- .byte 68,15,40,228 // movaps %xmm4,%xmm12
- .byte 69,15,194,224,4 // cmpneqps %xmm8,%xmm12
- .byte 69,15,84,226 // andps %xmm10,%xmm12
- .byte 65,15,89,196 // mulps %xmm12,%xmm0
- .byte 65,15,89,204 // mulps %xmm12,%xmm1
- .byte 68,15,89,226 // mulps %xmm2,%xmm12
- .byte 68,15,40,214 // movaps %xmm6,%xmm10
- .byte 68,15,40,238 // movaps %xmm6,%xmm13
- .byte 68,15,40,254 // movaps %xmm6,%xmm15
- .byte 68,15,95,255 // maxps %xmm7,%xmm15
- .byte 68,15,40,221 // movaps %xmm5,%xmm11
- .byte 68,15,40,245 // movaps %xmm5,%xmm14
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 65,15,95,215 // maxps %xmm15,%xmm2
- .byte 68,15,93,215 // minps %xmm7,%xmm10
- .byte 69,15,93,218 // minps %xmm10,%xmm11
- .byte 65,15,92,211 // subps %xmm11,%xmm2
- .byte 68,15,40,209 // movaps %xmm1,%xmm10
- .byte 69,15,93,212 // minps %xmm12,%xmm10
- .byte 68,15,40,216 // movaps %xmm0,%xmm11
- .byte 69,15,93,218 // minps %xmm10,%xmm11
- .byte 68,15,40,209 // movaps %xmm1,%xmm10
- .byte 69,15,95,212 // maxps %xmm12,%xmm10
- .byte 68,15,40,248 // movaps %xmm0,%xmm15
- .byte 69,15,95,250 // maxps %xmm10,%xmm15
- .byte 69,15,92,251 // subps %xmm11,%xmm15
- .byte 65,15,92,195 // subps %xmm11,%xmm0
- .byte 15,89,194 // mulps %xmm2,%xmm0
- .byte 65,15,94,199 // divps %xmm15,%xmm0
- .byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 65,15,94,207 // divps %xmm15,%xmm1
- .byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,226 // mulps %xmm2,%xmm12
- .byte 69,15,94,231 // divps %xmm15,%xmm12
- .byte 69,15,194,248,4 // cmpneqps %xmm8,%xmm15
- .byte 65,15,84,199 // andps %xmm15,%xmm0
- .byte 65,15,84,207 // andps %xmm15,%xmm1
- .byte 69,15,84,231 // andps %xmm15,%xmm12
- .byte 68,15,40,61,95,59,0,0 // movaps 0x3b5f(%rip),%xmm15 # 49c0 <_sk_callback_sse2+0x28d>
- .byte 69,15,89,247 // mulps %xmm15,%xmm14
- .byte 15,40,29,100,59,0,0 // movaps 0x3b64(%rip),%xmm3 # 49d0 <_sk_callback_sse2+0x29d>
+ .byte 68,15,89,251 // mulps %xmm3,%xmm15
+ .byte 69,15,89,207 // mulps %xmm15,%xmm9
+ .byte 69,15,89,215 // mulps %xmm15,%xmm10
+ .byte 65,15,89,215 // mulps %xmm15,%xmm2
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 69,15,94,206 // divps %xmm14,%xmm9
+ .byte 69,15,94,214 // divps %xmm14,%xmm10
+ .byte 65,15,94,214 // divps %xmm14,%xmm2
+ .byte 68,15,194,240,4 // cmpneqps %xmm0,%xmm14
+ .byte 69,15,84,206 // andps %xmm14,%xmm9
+ .byte 69,15,84,214 // andps %xmm14,%xmm10
+ .byte 65,15,84,214 // andps %xmm14,%xmm2
+ .byte 68,15,40,61,111,60,0,0 // movaps 0x3c6f(%rip),%xmm15 # 4ae0 <_sk_callback_sse2+0x277>
+ .byte 65,15,89,231 // mulps %xmm15,%xmm4
+ .byte 15,40,5,116,60,0,0 // movaps 0x3c74(%rip),%xmm0 # 4af0 <_sk_callback_sse2+0x287>
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 68,15,40,53,118,60,0,0 // movaps 0x3c76(%rip),%xmm14 # 4b00 <_sk_callback_sse2+0x297>
+ .byte 68,15,40,239 // movaps %xmm7,%xmm13
+ .byte 69,15,89,238 // mulps %xmm14,%xmm13
+ .byte 68,15,88,238 // addps %xmm6,%xmm13
+ .byte 65,15,40,225 // movaps %xmm9,%xmm4
+ .byte 65,15,89,231 // mulps %xmm15,%xmm4
+ .byte 65,15,40,242 // movaps %xmm10,%xmm6
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 65,15,89,230 // mulps %xmm14,%xmm4
+ .byte 15,88,230 // addps %xmm6,%xmm4
.byte 68,15,89,235 // mulps %xmm3,%xmm13
- .byte 69,15,88,238 // addps %xmm14,%xmm13
- .byte 68,15,40,21,100,59,0,0 // movaps 0x3b64(%rip),%xmm10 # 49e0 <_sk_callback_sse2+0x2ad>
- .byte 68,15,40,223 // movaps %xmm7,%xmm11
- .byte 69,15,89,218 // mulps %xmm10,%xmm11
- .byte 69,15,88,221 // addps %xmm13,%xmm11
- .byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,241 // movaps %xmm1,%xmm14
- .byte 68,15,89,243 // mulps %xmm3,%xmm14
- .byte 69,15,88,245 // addps %xmm13,%xmm14
- .byte 65,15,40,212 // movaps %xmm12,%xmm2
- .byte 65,15,89,210 // mulps %xmm10,%xmm2
- .byte 65,15,88,214 // addps %xmm14,%xmm2
- .byte 68,15,92,218 // subps %xmm2,%xmm11
- .byte 65,15,88,195 // addps %xmm11,%xmm0
- .byte 65,15,88,203 // addps %xmm11,%xmm1
- .byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 65,15,93,211 // minps %xmm11,%xmm2
- .byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,93,234 // minps %xmm2,%xmm13
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 65,15,95,211 // maxps %xmm11,%xmm2
- .byte 68,15,40,224 // movaps %xmm0,%xmm12
- .byte 68,15,95,226 // maxps %xmm2,%xmm12
- .byte 68,15,89,248 // mulps %xmm0,%xmm15
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 65,15,88,223 // addps %xmm15,%xmm3
- .byte 69,15,89,211 // mulps %xmm11,%xmm10
- .byte 68,15,88,211 // addps %xmm3,%xmm10
+ .byte 68,15,92,236 // subps %xmm4,%xmm13
+ .byte 69,15,88,205 // addps %xmm13,%xmm9
+ .byte 69,15,88,213 // addps %xmm13,%xmm10
+ .byte 68,15,88,234 // addps %xmm2,%xmm13
+ .byte 65,15,40,210 // movaps %xmm10,%xmm2
+ .byte 65,15,93,213 // minps %xmm13,%xmm2
+ .byte 65,15,40,241 // movaps %xmm9,%xmm6
+ .byte 15,93,242 // minps %xmm2,%xmm6
+ .byte 65,15,40,210 // movaps %xmm10,%xmm2
+ .byte 65,15,95,213 // maxps %xmm13,%xmm2
+ .byte 65,15,40,225 // movaps %xmm9,%xmm4
+ .byte 15,95,226 // maxps %xmm2,%xmm4
+ .byte 69,15,89,249 // mulps %xmm9,%xmm15
+ .byte 65,15,89,194 // mulps %xmm10,%xmm0
+ .byte 65,15,88,199 // addps %xmm15,%xmm0
+ .byte 69,15,89,245 // mulps %xmm13,%xmm14
+ .byte 68,15,88,240 // addps %xmm0,%xmm14
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 65,15,194,213,2 // cmpleps %xmm13,%xmm2
- .byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 65,15,92,218 // subps %xmm10,%xmm3
- .byte 65,15,89,218 // mulps %xmm10,%xmm3
- .byte 69,15,40,242 // movaps %xmm10,%xmm14
- .byte 69,15,92,245 // subps %xmm13,%xmm14
- .byte 65,15,94,222 // divps %xmm14,%xmm3
- .byte 65,15,88,218 // addps %xmm10,%xmm3
- .byte 68,15,40,234 // movaps %xmm2,%xmm13
- .byte 68,15,85,235 // andnps %xmm3,%xmm13
- .byte 15,84,194 // andps %xmm2,%xmm0
- .byte 65,15,86,197 // orps %xmm13,%xmm0
- .byte 69,15,40,233 // movaps %xmm9,%xmm13
- .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 65,15,40,221 // movaps %xmm13,%xmm3
- .byte 15,85,216 // andnps %xmm0,%xmm3
- .byte 65,15,92,194 // subps %xmm10,%xmm0
- .byte 69,15,92,202 // subps %xmm10,%xmm9
- .byte 65,15,89,193 // mulps %xmm9,%xmm0
- .byte 69,15,92,226 // subps %xmm10,%xmm12
- .byte 65,15,94,196 // divps %xmm12,%xmm0
- .byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 65,15,84,197 // andps %xmm13,%xmm0
- .byte 15,86,195 // orps %xmm3,%xmm0
- .byte 15,40,217 // movaps %xmm1,%xmm3
- .byte 65,15,92,218 // subps %xmm10,%xmm3
- .byte 65,15,89,218 // mulps %xmm10,%xmm3
- .byte 65,15,94,222 // divps %xmm14,%xmm3
- .byte 65,15,88,218 // addps %xmm10,%xmm3
- .byte 68,15,40,250 // movaps %xmm2,%xmm15
- .byte 68,15,85,251 // andnps %xmm3,%xmm15
- .byte 15,84,202 // andps %xmm2,%xmm1
- .byte 65,15,86,207 // orps %xmm15,%xmm1
- .byte 65,15,40,221 // movaps %xmm13,%xmm3
+ .byte 15,194,214,2 // cmpleps %xmm6,%xmm2
+ .byte 69,15,40,254 // movaps %xmm14,%xmm15
+ .byte 68,15,92,254 // subps %xmm6,%xmm15
+ .byte 65,15,40,241 // movaps %xmm9,%xmm6
+ .byte 65,15,92,246 // subps %xmm14,%xmm6
+ .byte 65,15,89,246 // mulps %xmm14,%xmm6
+ .byte 65,15,94,247 // divps %xmm15,%xmm6
+ .byte 65,15,88,246 // addps %xmm14,%xmm6
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,85,198 // andnps %xmm6,%xmm0
+ .byte 68,15,84,202 // andps %xmm2,%xmm9
+ .byte 68,15,86,200 // orps %xmm0,%xmm9
+ .byte 68,15,40,227 // movaps %xmm3,%xmm12
+ .byte 65,15,40,196 // movaps %xmm12,%xmm0
+ .byte 15,41,76,36,184 // movaps %xmm1,-0x48(%rsp)
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 69,15,92,196 // subps %xmm12,%xmm8
+ .byte 68,15,88,225 // addps %xmm1,%xmm12
+ .byte 68,15,92,224 // subps %xmm0,%xmm12
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,194,196,1 // cmpltps %xmm4,%xmm0
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 65,15,85,201 // andnps %xmm9,%xmm1
+ .byte 69,15,92,206 // subps %xmm14,%xmm9
+ .byte 65,15,92,246 // subps %xmm14,%xmm6
+ .byte 68,15,89,206 // mulps %xmm6,%xmm9
+ .byte 65,15,92,230 // subps %xmm14,%xmm4
+ .byte 68,15,94,204 // divps %xmm4,%xmm9
+ .byte 69,15,88,206 // addps %xmm14,%xmm9
+ .byte 68,15,84,200 // andps %xmm0,%xmm9
+ .byte 68,15,86,201 // orps %xmm1,%xmm9
+ .byte 65,15,40,202 // movaps %xmm10,%xmm1
+ .byte 65,15,92,206 // subps %xmm14,%xmm1
+ .byte 65,15,89,206 // mulps %xmm14,%xmm1
+ .byte 65,15,94,207 // divps %xmm15,%xmm1
+ .byte 65,15,88,206 // addps %xmm14,%xmm1
+ .byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,85,217 // andnps %xmm1,%xmm3
- .byte 65,15,92,202 // subps %xmm10,%xmm1
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 65,15,94,204 // divps %xmm12,%xmm1
+ .byte 68,15,84,210 // andps %xmm2,%xmm10
+ .byte 68,15,86,211 // orps %xmm3,%xmm10
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 65,15,85,202 // andnps %xmm10,%xmm1
+ .byte 69,15,92,214 // subps %xmm14,%xmm10
+ .byte 68,15,89,214 // mulps %xmm6,%xmm10
+ .byte 68,15,94,212 // divps %xmm4,%xmm10
+ .byte 69,15,88,214 // addps %xmm14,%xmm10
+ .byte 68,15,84,208 // andps %xmm0,%xmm10
+ .byte 68,15,86,209 // orps %xmm1,%xmm10
+ .byte 65,15,40,205 // movaps %xmm13,%xmm1
+ .byte 65,15,92,206 // subps %xmm14,%xmm1
+ .byte 65,15,89,206 // mulps %xmm14,%xmm1
+ .byte 65,15,94,207 // divps %xmm15,%xmm1
+ .byte 65,15,88,206 // addps %xmm14,%xmm1
+ .byte 68,15,84,234 // andps %xmm2,%xmm13
+ .byte 15,85,209 // andnps %xmm1,%xmm2
+ .byte 65,15,86,213 // orps %xmm13,%xmm2
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 15,85,202 // andnps %xmm2,%xmm1
+ .byte 65,15,92,214 // subps %xmm14,%xmm2
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,94,212 // divps %xmm4,%xmm2
+ .byte 65,15,88,214 // addps %xmm14,%xmm2
+ .byte 15,84,208 // andps %xmm0,%xmm2
+ .byte 15,86,209 // orps %xmm1,%xmm2
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 68,15,95,200 // maxps %xmm0,%xmm9
+ .byte 68,15,95,208 // maxps %xmm0,%xmm10
+ .byte 15,95,208 // maxps %xmm0,%xmm2
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 15,40,100,36,200 // movaps -0x38(%rsp),%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,40,76,36,232 // movaps -0x18(%rsp),%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 65,15,88,201 // addps %xmm9,%xmm1
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,40,76,36,216 // movaps -0x28(%rsp),%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 65,15,84,205 // andps %xmm13,%xmm1
- .byte 15,86,203 // orps %xmm3,%xmm1
- .byte 65,15,40,219 // movaps %xmm11,%xmm3
- .byte 65,15,92,218 // subps %xmm10,%xmm3
- .byte 65,15,89,218 // mulps %xmm10,%xmm3
- .byte 65,15,94,222 // divps %xmm14,%xmm3
- .byte 65,15,88,218 // addps %xmm10,%xmm3
- .byte 68,15,84,218 // andps %xmm2,%xmm11
- .byte 15,85,211 // andnps %xmm3,%xmm2
- .byte 65,15,86,211 // orps %xmm11,%xmm2
- .byte 65,15,40,221 // movaps %xmm13,%xmm3
- .byte 15,85,218 // andnps %xmm2,%xmm3
- .byte 65,15,92,210 // subps %xmm10,%xmm2
- .byte 65,15,89,209 // mulps %xmm9,%xmm2
- .byte 65,15,94,212 // divps %xmm12,%xmm2
- .byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 65,15,84,213 // andps %xmm13,%xmm2
- .byte 15,86,211 // orps %xmm3,%xmm2
- .byte 65,15,95,192 // maxps %xmm8,%xmm0
- .byte 65,15,95,200 // maxps %xmm8,%xmm1
- .byte 65,15,95,208 // maxps %xmm8,%xmm2
- .byte 68,15,40,196 // movaps %xmm4,%xmm8
- .byte 68,15,40,76,36,232 // movaps -0x18(%rsp),%xmm9
- .byte 69,15,88,193 // addps %xmm9,%xmm8
- .byte 65,15,89,225 // mulps %xmm9,%xmm4
- .byte 68,15,92,196 // subps %xmm4,%xmm8
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 65,15,89,208 // mulps %xmm8,%xmm2
+ .byte 68,15,89,199 // mulps %xmm7,%xmm8
+ .byte 69,15,88,195 // addps %xmm11,%xmm8
+ .byte 68,15,88,194 // addps %xmm2,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,40,247 // movaps %xmm7,%xmm6
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
- .byte 65,15,40,249 // movaps %xmm9,%xmm7
+ .byte 65,15,40,208 // movaps %xmm8,%xmm2
+ .byte 65,15,40,220 // movaps %xmm12,%xmm3
+ .byte 15,40,124,36,184 // movaps -0x48(%rsp),%xmm7
.byte 255,224 // jmpq *%rax
HIDDEN _sk_saturation_sse2
.globl _sk_saturation_sse2
FUNCTION(_sk_saturation_sse2)
_sk_saturation_sse2:
- .byte 68,15,40,214 // movaps %xmm6,%xmm10
- .byte 15,40,245 // movaps %xmm5,%xmm6
- .byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 68,15,40,193 // movaps %xmm1,%xmm8
- .byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 15,87,201 // xorps %xmm1,%xmm1
- .byte 68,15,40,29,198,57,0,0 // movaps 0x39c6(%rip),%xmm11 # 49f0 <_sk_callback_sse2+0x2bd>
- .byte 65,15,40,195 // movaps %xmm11,%xmm0
- .byte 15,94,199 // divps %xmm7,%xmm0
.byte 68,15,40,231 // movaps %xmm7,%xmm12
- .byte 68,15,194,225,4 // cmpneqps %xmm1,%xmm12
- .byte 68,15,84,224 // andps %xmm0,%xmm12
- .byte 65,15,40,196 // movaps %xmm12,%xmm0
- .byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 69,15,40,252 // movaps %xmm12,%xmm15
- .byte 68,15,89,254 // mulps %xmm6,%xmm15
- .byte 69,15,89,226 // mulps %xmm10,%xmm12
- .byte 69,15,40,240 // movaps %xmm8,%xmm14
- .byte 68,15,95,242 // maxps %xmm2,%xmm14
- .byte 69,15,40,233 // movaps %xmm9,%xmm13
- .byte 69,15,95,238 // maxps %xmm14,%xmm13
- .byte 68,15,93,194 // minps %xmm2,%xmm8
- .byte 69,15,93,200 // minps %xmm8,%xmm9
- .byte 69,15,92,233 // subps %xmm9,%xmm13
- .byte 65,15,40,215 // movaps %xmm15,%xmm2
- .byte 65,15,93,212 // minps %xmm12,%xmm2
- .byte 68,15,40,192 // movaps %xmm0,%xmm8
+ .byte 68,15,40,198 // movaps %xmm6,%xmm8
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 68,15,40,216 // movaps %xmm0,%xmm11
+ .byte 68,15,40,215 // movaps %xmm7,%xmm10
+ .byte 68,15,89,212 // mulps %xmm4,%xmm10
+ .byte 15,40,244 // movaps %xmm4,%xmm6
+ .byte 15,41,116,36,184 // movaps %xmm6,-0x48(%rsp)
+ .byte 68,15,40,207 // movaps %xmm7,%xmm9
+ .byte 68,15,89,205 // mulps %xmm5,%xmm9
+ .byte 15,41,108,36,200 // movaps %xmm5,-0x38(%rsp)
+ .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 69,15,40,232 // movaps %xmm8,%xmm13
+ .byte 68,15,41,108,36,168 // movaps %xmm13,-0x58(%rsp)
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,41,100,36,216 // movaps %xmm4,-0x28(%rsp)
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,41,84,36,232 // movaps %xmm2,-0x18(%rsp)
+ .byte 15,95,218 // maxps %xmm2,%xmm3
+ .byte 65,15,40,203 // movaps %xmm11,%xmm1
+ .byte 15,95,203 // maxps %xmm3,%xmm1
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,93,218 // minps %xmm2,%xmm3
+ .byte 65,15,40,211 // movaps %xmm11,%xmm2
+ .byte 15,93,211 // minps %xmm3,%xmm2
+ .byte 15,92,202 // subps %xmm2,%xmm1
+ .byte 65,15,89,204 // mulps %xmm12,%xmm1
+ .byte 65,15,40,228 // movaps %xmm12,%xmm4
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
+ .byte 15,93,208 // minps %xmm0,%xmm2
+ .byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 68,15,93,194 // minps %xmm2,%xmm8
- .byte 69,15,40,207 // movaps %xmm15,%xmm9
- .byte 69,15,95,204 // maxps %xmm12,%xmm9
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 65,15,95,209 // maxps %xmm9,%xmm2
- .byte 65,15,92,208 // subps %xmm8,%xmm2
- .byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 65,15,89,197 // mulps %xmm13,%xmm0
- .byte 15,94,194 // divps %xmm2,%xmm0
- .byte 69,15,92,248 // subps %xmm8,%xmm15
- .byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,94,250 // divps %xmm2,%xmm15
- .byte 69,15,92,224 // subps %xmm8,%xmm12
- .byte 69,15,89,229 // mulps %xmm13,%xmm12
- .byte 68,15,94,226 // divps %xmm2,%xmm12
- .byte 15,194,209,4 // cmpneqps %xmm1,%xmm2
- .byte 15,84,194 // andps %xmm2,%xmm0
- .byte 68,15,84,250 // andps %xmm2,%xmm15
- .byte 68,15,84,226 // andps %xmm2,%xmm12
- .byte 68,15,40,45,54,57,0,0 // movaps 0x3936(%rip),%xmm13 # 4a00 <_sk_callback_sse2+0x2cd>
- .byte 68,15,40,197 // movaps %xmm5,%xmm8
- .byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,54,57,0,0 // movaps 0x3936(%rip),%xmm14 # 4a10 <_sk_callback_sse2+0x2dd>
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 65,15,88,208 // addps %xmm8,%xmm2
- .byte 68,15,40,5,51,57,0,0 // movaps 0x3933(%rip),%xmm8 # 4a20 <_sk_callback_sse2+0x2ed>
- .byte 69,15,40,202 // movaps %xmm10,%xmm9
- .byte 69,15,89,200 // mulps %xmm8,%xmm9
- .byte 68,15,88,202 // addps %xmm2,%xmm9
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 65,15,40,207 // movaps %xmm15,%xmm1
- .byte 65,15,89,206 // mulps %xmm14,%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 65,15,40,212 // movaps %xmm12,%xmm2
- .byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,88,209 // addps %xmm1,%xmm2
- .byte 68,15,92,202 // subps %xmm2,%xmm9
- .byte 65,15,88,193 // addps %xmm9,%xmm0
- .byte 69,15,88,249 // addps %xmm9,%xmm15
- .byte 69,15,88,204 // addps %xmm12,%xmm9
- .byte 65,15,40,207 // movaps %xmm15,%xmm1
- .byte 65,15,93,201 // minps %xmm9,%xmm1
- .byte 68,15,40,224 // movaps %xmm0,%xmm12
- .byte 68,15,93,225 // minps %xmm1,%xmm12
- .byte 65,15,40,215 // movaps %xmm15,%xmm2
- .byte 65,15,95,209 // maxps %xmm9,%xmm2
- .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 65,15,40,209 // movaps %xmm9,%xmm2
+ .byte 15,95,208 // maxps %xmm0,%xmm2
+ .byte 65,15,40,218 // movaps %xmm10,%xmm3
.byte 15,95,218 // maxps %xmm2,%xmm3
- .byte 68,15,89,232 // mulps %xmm0,%xmm13
- .byte 69,15,89,247 // mulps %xmm15,%xmm14
- .byte 69,15,88,245 // addps %xmm13,%xmm14
- .byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 69,15,88,198 // addps %xmm14,%xmm8
+ .byte 65,15,92,216 // subps %xmm8,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 65,15,194,212,2 // cmpleps %xmm12,%xmm2
- .byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 69,15,92,232 // subps %xmm8,%xmm13
- .byte 69,15,89,232 // mulps %xmm8,%xmm13
- .byte 69,15,40,240 // movaps %xmm8,%xmm14
- .byte 69,15,92,244 // subps %xmm12,%xmm14
- .byte 69,15,94,238 // divps %xmm14,%xmm13
- .byte 69,15,88,232 // addps %xmm8,%xmm13
- .byte 68,15,40,226 // movaps %xmm2,%xmm12
- .byte 69,15,85,229 // andnps %xmm13,%xmm12
- .byte 15,84,194 // andps %xmm2,%xmm0
- .byte 65,15,86,196 // orps %xmm12,%xmm0
- .byte 69,15,40,235 // movaps %xmm11,%xmm13
- .byte 68,15,194,235,1 // cmpltps %xmm3,%xmm13
- .byte 69,15,40,229 // movaps %xmm13,%xmm12
- .byte 68,15,85,224 // andnps %xmm0,%xmm12
+ .byte 69,15,92,208 // subps %xmm8,%xmm10
+ .byte 68,15,89,209 // mulps %xmm1,%xmm10
+ .byte 68,15,94,211 // divps %xmm3,%xmm10
+ .byte 69,15,92,200 // subps %xmm8,%xmm9
+ .byte 68,15,89,201 // mulps %xmm1,%xmm9
+ .byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 69,15,92,216 // subps %xmm8,%xmm11
- .byte 65,15,89,195 // mulps %xmm11,%xmm0
- .byte 65,15,92,216 // subps %xmm8,%xmm3
+ .byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,94,195 // divps %xmm3,%xmm0
- .byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 65,15,84,197 // andps %xmm13,%xmm0
- .byte 65,15,86,196 // orps %xmm12,%xmm0
- .byte 69,15,40,231 // movaps %xmm15,%xmm12
- .byte 69,15,92,224 // subps %xmm8,%xmm12
- .byte 69,15,89,224 // mulps %xmm8,%xmm12
- .byte 69,15,94,230 // divps %xmm14,%xmm12
- .byte 69,15,88,224 // addps %xmm8,%xmm12
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 65,15,85,204 // andnps %xmm12,%xmm1
- .byte 68,15,84,250 // andps %xmm2,%xmm15
- .byte 68,15,86,249 // orps %xmm1,%xmm15
- .byte 65,15,40,205 // movaps %xmm13,%xmm1
- .byte 65,15,85,207 // andnps %xmm15,%xmm1
- .byte 69,15,92,248 // subps %xmm8,%xmm15
- .byte 69,15,89,251 // mulps %xmm11,%xmm15
- .byte 68,15,94,251 // divps %xmm3,%xmm15
- .byte 69,15,88,248 // addps %xmm8,%xmm15
- .byte 69,15,84,253 // andps %xmm13,%xmm15
- .byte 68,15,86,249 // orps %xmm1,%xmm15
- .byte 65,15,40,201 // movaps %xmm9,%xmm1
- .byte 65,15,92,200 // subps %xmm8,%xmm1
- .byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 65,15,94,206 // divps %xmm14,%xmm1
+ .byte 15,194,218,4 // cmpneqps %xmm2,%xmm3
+ .byte 68,15,84,211 // andps %xmm3,%xmm10
+ .byte 68,15,84,203 // andps %xmm3,%xmm9
+ .byte 15,84,195 // andps %xmm3,%xmm0
+ .byte 68,15,40,5,11,58,0,0 // movaps 0x3a0b(%rip),%xmm8 # 4b20 <_sk_callback_sse2+0x2b7>
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 65,15,89,208 // mulps %xmm8,%xmm2
+ .byte 15,40,13,13,58,0,0 // movaps 0x3a0d(%rip),%xmm1 # 4b30 <_sk_callback_sse2+0x2c7>
+ .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 68,15,40,37,12,58,0,0 // movaps 0x3a0c(%rip),%xmm12 # 4b40 <_sk_callback_sse2+0x2d7>
+ .byte 69,15,89,236 // mulps %xmm12,%xmm13
+ .byte 68,15,88,235 // addps %xmm3,%xmm13
+ .byte 65,15,40,210 // movaps %xmm10,%xmm2
+ .byte 65,15,89,208 // mulps %xmm8,%xmm2
+ .byte 65,15,40,217 // movaps %xmm9,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 65,15,89,212 // mulps %xmm12,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 68,15,89,239 // mulps %xmm7,%xmm13
+ .byte 68,15,92,234 // subps %xmm2,%xmm13
+ .byte 69,15,88,213 // addps %xmm13,%xmm10
+ .byte 69,15,88,205 // addps %xmm13,%xmm9
+ .byte 68,15,88,232 // addps %xmm0,%xmm13
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,93,197 // minps %xmm13,%xmm0
+ .byte 65,15,40,218 // movaps %xmm10,%xmm3
+ .byte 15,93,216 // minps %xmm0,%xmm3
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,95,197 // maxps %xmm13,%xmm0
+ .byte 69,15,40,242 // movaps %xmm10,%xmm14
+ .byte 68,15,95,240 // maxps %xmm0,%xmm14
+ .byte 69,15,89,194 // mulps %xmm10,%xmm8
+ .byte 65,15,89,201 // mulps %xmm9,%xmm1
.byte 65,15,88,200 // addps %xmm8,%xmm1
+ .byte 69,15,89,229 // mulps %xmm13,%xmm12
+ .byte 68,15,88,225 // addps %xmm1,%xmm12
+ .byte 15,87,210 // xorps %xmm2,%xmm2
+ .byte 15,194,211,2 // cmpleps %xmm3,%xmm2
+ .byte 65,15,40,244 // movaps %xmm12,%xmm6
+ .byte 15,92,243 // subps %xmm3,%xmm6
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 65,15,92,196 // subps %xmm12,%xmm0
+ .byte 65,15,89,196 // mulps %xmm12,%xmm0
+ .byte 15,94,198 // divps %xmm6,%xmm0
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,85,200 // andnps %xmm0,%xmm1
+ .byte 68,15,84,210 // andps %xmm2,%xmm10
+ .byte 68,15,86,209 // orps %xmm1,%xmm10
+ .byte 15,40,223 // movaps %xmm7,%xmm3
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 68,15,40,5,113,57,0,0 // movaps 0x3971(%rip),%xmm8 # 4b50 <_sk_callback_sse2+0x2e7>
+ .byte 65,15,40,224 // movaps %xmm8,%xmm4
+ .byte 68,15,92,199 // subps %xmm7,%xmm8
+ .byte 15,88,253 // addps %xmm5,%xmm7
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 65,15,194,222,1 // cmpltps %xmm14,%xmm3
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 65,15,85,194 // andnps %xmm10,%xmm0
+ .byte 69,15,92,212 // subps %xmm12,%xmm10
+ .byte 65,15,92,204 // subps %xmm12,%xmm1
+ .byte 68,15,89,209 // mulps %xmm1,%xmm10
+ .byte 69,15,92,244 // subps %xmm12,%xmm14
+ .byte 69,15,94,214 // divps %xmm14,%xmm10
+ .byte 69,15,88,212 // addps %xmm12,%xmm10
+ .byte 68,15,84,211 // andps %xmm3,%xmm10
+ .byte 68,15,86,208 // orps %xmm0,%xmm10
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,92,196 // subps %xmm12,%xmm0
+ .byte 65,15,89,196 // mulps %xmm12,%xmm0
+ .byte 15,94,198 // divps %xmm6,%xmm0
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 68,15,40,250 // movaps %xmm2,%xmm15
+ .byte 68,15,85,248 // andnps %xmm0,%xmm15
.byte 68,15,84,202 // andps %xmm2,%xmm9
- .byte 15,85,209 // andnps %xmm1,%xmm2
- .byte 65,15,86,209 // orps %xmm9,%xmm2
- .byte 65,15,40,205 // movaps %xmm13,%xmm1
- .byte 15,85,202 // andnps %xmm2,%xmm1
- .byte 65,15,92,208 // subps %xmm8,%xmm2
- .byte 65,15,89,211 // mulps %xmm11,%xmm2
- .byte 15,94,211 // divps %xmm3,%xmm2
- .byte 65,15,88,208 // addps %xmm8,%xmm2
- .byte 65,15,84,213 // andps %xmm13,%xmm2
- .byte 15,86,209 // orps %xmm1,%xmm2
- .byte 15,87,201 // xorps %xmm1,%xmm1
- .byte 15,95,193 // maxps %xmm1,%xmm0
- .byte 68,15,95,249 // maxps %xmm1,%xmm15
- .byte 15,95,209 // maxps %xmm1,%xmm2
- .byte 68,15,40,196 // movaps %xmm4,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 68,15,92,196 // subps %xmm4,%xmm8
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 65,15,89,208 // mulps %xmm8,%xmm2
+ .byte 69,15,86,207 // orps %xmm15,%xmm9
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 65,15,85,193 // andnps %xmm9,%xmm0
+ .byte 69,15,92,204 // subps %xmm12,%xmm9
+ .byte 68,15,89,201 // mulps %xmm1,%xmm9
+ .byte 69,15,94,206 // divps %xmm14,%xmm9
+ .byte 69,15,88,204 // addps %xmm12,%xmm9
+ .byte 68,15,84,203 // andps %xmm3,%xmm9
+ .byte 68,15,86,200 // orps %xmm0,%xmm9
+ .byte 65,15,40,197 // movaps %xmm13,%xmm0
+ .byte 65,15,92,196 // subps %xmm12,%xmm0
+ .byte 65,15,89,196 // mulps %xmm12,%xmm0
+ .byte 15,94,198 // divps %xmm6,%xmm0
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 68,15,84,234 // andps %xmm2,%xmm13
+ .byte 15,85,208 // andnps %xmm0,%xmm2
+ .byte 65,15,86,213 // orps %xmm13,%xmm2
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,85,194 // andnps %xmm2,%xmm0
+ .byte 65,15,92,212 // subps %xmm12,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 65,15,94,214 // divps %xmm14,%xmm2
+ .byte 65,15,88,212 // addps %xmm12,%xmm2
+ .byte 15,84,211 // andps %xmm3,%xmm2
+ .byte 15,86,208 // orps %xmm0,%xmm2
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 68,15,95,208 // maxps %xmm0,%xmm10
+ .byte 68,15,95,200 // maxps %xmm0,%xmm9
+ .byte 15,95,208 // maxps %xmm0,%xmm2
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 15,40,92,36,184 // movaps -0x48(%rsp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 68,15,40,229 // movaps %xmm5,%xmm12
+ .byte 65,15,92,228 // subps %xmm12,%xmm4
+ .byte 68,15,89,220 // mulps %xmm4,%xmm11
+ .byte 68,15,88,216 // addps %xmm0,%xmm11
+ .byte 69,15,88,218 // addps %xmm10,%xmm11
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 15,40,108,36,200 // movaps -0x38(%rsp),%xmm5
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,40,76,36,216 // movaps -0x28(%rsp),%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 65,15,88,201 // addps %xmm9,%xmm1
+ .byte 15,89,100,36,232 // mulps -0x18(%rsp),%xmm4
+ .byte 15,40,68,36,168 // movaps -0x58(%rsp),%xmm0
+ .byte 68,15,89,192 // mulps %xmm0,%xmm8
+ .byte 68,15,88,196 // addps %xmm4,%xmm8
+ .byte 68,15,88,194 // addps %xmm2,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 65,15,40,242 // movaps %xmm10,%xmm6
- .byte 65,15,40,207 // movaps %xmm15,%xmm1
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
+ .byte 65,15,40,208 // movaps %xmm8,%xmm2
+ .byte 15,40,223 // movaps %xmm7,%xmm3
+ .byte 65,15,40,252 // movaps %xmm12,%xmm7
.byte 255,224 // jmpq *%rax
HIDDEN _sk_color_sse2
.globl _sk_color_sse2
FUNCTION(_sk_color_sse2)
_sk_color_sse2:
+ .byte 68,15,40,199 // movaps %xmm7,%xmm8
+ .byte 68,15,40,230 // movaps %xmm6,%xmm12
+ .byte 68,15,41,100,36,216 // movaps %xmm12,-0x28(%rsp)
.byte 68,15,40,221 // movaps %xmm5,%xmm11
.byte 68,15,41,92,36,232 // movaps %xmm11,-0x18(%rsp)
- .byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 68,15,40,249 // movaps %xmm1,%xmm15
- .byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,152,55,0,0 // movaps 0x3798(%rip),%xmm9 # 4a30 <_sk_callback_sse2+0x2fd>
- .byte 69,15,40,209 // movaps %xmm9,%xmm10
- .byte 68,15,94,212 // divps %xmm4,%xmm10
- .byte 68,15,40,228 // movaps %xmm4,%xmm12
- .byte 69,15,194,224,4 // cmpneqps %xmm8,%xmm12
- .byte 69,15,84,226 // andps %xmm10,%xmm12
- .byte 65,15,89,196 // mulps %xmm12,%xmm0
- .byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,89,226 // mulps %xmm2,%xmm12
- .byte 68,15,40,45,127,55,0,0 // movaps 0x377f(%rip),%xmm13 # 4a40 <_sk_callback_sse2+0x30d>
+ .byte 15,40,244 // movaps %xmm4,%xmm6
+ .byte 15,41,84,36,184 // movaps %xmm2,-0x48(%rsp)
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 68,15,40,207 // movaps %xmm7,%xmm9
+ .byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,40,213 // movaps %xmm5,%xmm10
- .byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,40,53,127,55,0,0 // movaps 0x377f(%rip),%xmm14 # 4a50 <_sk_callback_sse2+0x31d>
- .byte 65,15,40,211 // movaps %xmm11,%xmm2
- .byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 68,15,40,21,123,55,0,0 // movaps 0x377b(%rip),%xmm10 # 4a60 <_sk_callback_sse2+0x32d>
- .byte 68,15,40,222 // movaps %xmm6,%xmm11
- .byte 69,15,89,218 // mulps %xmm10,%xmm11
- .byte 68,15,88,218 // addps %xmm2,%xmm11
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 65,15,40,207 // movaps %xmm15,%xmm1
- .byte 65,15,89,206 // mulps %xmm14,%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 65,15,40,212 // movaps %xmm12,%xmm2
- .byte 65,15,89,210 // mulps %xmm10,%xmm2
- .byte 15,88,209 // addps %xmm1,%xmm2
- .byte 68,15,92,218 // subps %xmm2,%xmm11
- .byte 65,15,88,195 // addps %xmm11,%xmm0
- .byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 65,15,40,207 // movaps %xmm15,%xmm1
- .byte 65,15,93,203 // minps %xmm11,%xmm1
- .byte 68,15,40,224 // movaps %xmm0,%xmm12
- .byte 68,15,93,225 // minps %xmm1,%xmm12
- .byte 65,15,40,215 // movaps %xmm15,%xmm2
- .byte 65,15,95,211 // maxps %xmm11,%xmm2
- .byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 15,95,218 // maxps %xmm2,%xmm3
- .byte 68,15,89,232 // mulps %xmm0,%xmm13
- .byte 69,15,89,247 // mulps %xmm15,%xmm14
+ .byte 69,15,89,208 // mulps %xmm8,%xmm10
+ .byte 65,15,40,208 // movaps %xmm8,%xmm2
+ .byte 68,15,40,45,15,56,0,0 // movaps 0x380f(%rip),%xmm13 # 4b60 <_sk_callback_sse2+0x2f7>
+ .byte 68,15,40,198 // movaps %xmm6,%xmm8
+ .byte 69,15,89,197 // mulps %xmm13,%xmm8
+ .byte 68,15,40,53,15,56,0,0 // movaps 0x380f(%rip),%xmm14 # 4b70 <_sk_callback_sse2+0x307>
+ .byte 65,15,40,195 // movaps %xmm11,%xmm0
+ .byte 65,15,89,198 // mulps %xmm14,%xmm0
+ .byte 65,15,88,192 // addps %xmm8,%xmm0
+ .byte 68,15,40,29,11,56,0,0 // movaps 0x380b(%rip),%xmm11 # 4b80 <_sk_callback_sse2+0x317>
+ .byte 69,15,89,227 // mulps %xmm11,%xmm12
+ .byte 68,15,88,224 // addps %xmm0,%xmm12
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,89,197 // mulps %xmm13,%xmm0
+ .byte 69,15,40,250 // movaps %xmm10,%xmm15
+ .byte 69,15,89,254 // mulps %xmm14,%xmm15
+ .byte 68,15,88,248 // addps %xmm0,%xmm15
+ .byte 68,15,40,5,247,55,0,0 // movaps 0x37f7(%rip),%xmm8 # 4b90 <_sk_callback_sse2+0x327>
+ .byte 65,15,40,224 // movaps %xmm8,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,40,76,36,184 // movaps -0x48(%rsp),%xmm1
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 65,15,89,195 // mulps %xmm11,%xmm0
+ .byte 65,15,88,199 // addps %xmm15,%xmm0
+ .byte 68,15,89,227 // mulps %xmm3,%xmm12
+ .byte 68,15,92,224 // subps %xmm0,%xmm12
+ .byte 69,15,88,204 // addps %xmm12,%xmm9
+ .byte 69,15,88,212 // addps %xmm12,%xmm10
+ .byte 68,15,88,225 // addps %xmm1,%xmm12
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 65,15,93,196 // minps %xmm12,%xmm0
+ .byte 65,15,40,201 // movaps %xmm9,%xmm1
+ .byte 15,93,200 // minps %xmm0,%xmm1
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 65,15,95,196 // maxps %xmm12,%xmm0
+ .byte 69,15,40,249 // movaps %xmm9,%xmm15
+ .byte 68,15,95,248 // maxps %xmm0,%xmm15
+ .byte 69,15,89,233 // mulps %xmm9,%xmm13
+ .byte 69,15,89,242 // mulps %xmm10,%xmm14
.byte 69,15,88,245 // addps %xmm13,%xmm14
- .byte 69,15,89,211 // mulps %xmm11,%xmm10
- .byte 69,15,88,214 // addps %xmm14,%xmm10
- .byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 65,15,194,212,2 // cmpleps %xmm12,%xmm2
- .byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 69,15,92,234 // subps %xmm10,%xmm13
- .byte 69,15,89,234 // mulps %xmm10,%xmm13
- .byte 69,15,40,242 // movaps %xmm10,%xmm14
- .byte 69,15,92,244 // subps %xmm12,%xmm14
- .byte 69,15,94,238 // divps %xmm14,%xmm13
- .byte 69,15,88,234 // addps %xmm10,%xmm13
- .byte 68,15,40,226 // movaps %xmm2,%xmm12
- .byte 69,15,85,229 // andnps %xmm13,%xmm12
- .byte 15,84,194 // andps %xmm2,%xmm0
- .byte 65,15,86,196 // orps %xmm12,%xmm0
- .byte 69,15,40,233 // movaps %xmm9,%xmm13
- .byte 68,15,194,235,1 // cmpltps %xmm3,%xmm13
- .byte 69,15,40,229 // movaps %xmm13,%xmm12
- .byte 68,15,85,224 // andnps %xmm0,%xmm12
- .byte 65,15,92,194 // subps %xmm10,%xmm0
- .byte 69,15,92,202 // subps %xmm10,%xmm9
- .byte 65,15,89,193 // mulps %xmm9,%xmm0
- .byte 65,15,92,218 // subps %xmm10,%xmm3
- .byte 15,94,195 // divps %xmm3,%xmm0
- .byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 65,15,84,197 // andps %xmm13,%xmm0
- .byte 65,15,86,196 // orps %xmm12,%xmm0
- .byte 69,15,40,231 // movaps %xmm15,%xmm12
- .byte 69,15,92,226 // subps %xmm10,%xmm12
- .byte 69,15,89,226 // mulps %xmm10,%xmm12
- .byte 69,15,94,230 // divps %xmm14,%xmm12
- .byte 69,15,88,226 // addps %xmm10,%xmm12
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 65,15,85,204 // andnps %xmm12,%xmm1
- .byte 68,15,84,250 // andps %xmm2,%xmm15
- .byte 68,15,86,249 // orps %xmm1,%xmm15
- .byte 65,15,40,205 // movaps %xmm13,%xmm1
- .byte 65,15,85,207 // andnps %xmm15,%xmm1
- .byte 69,15,92,250 // subps %xmm10,%xmm15
- .byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,94,251 // divps %xmm3,%xmm15
- .byte 69,15,88,250 // addps %xmm10,%xmm15
- .byte 69,15,84,253 // andps %xmm13,%xmm15
- .byte 68,15,86,249 // orps %xmm1,%xmm15
- .byte 65,15,40,203 // movaps %xmm11,%xmm1
- .byte 65,15,92,202 // subps %xmm10,%xmm1
- .byte 65,15,89,202 // mulps %xmm10,%xmm1
+ .byte 69,15,89,220 // mulps %xmm12,%xmm11
+ .byte 69,15,88,222 // addps %xmm14,%xmm11
+ .byte 69,15,87,237 // xorps %xmm13,%xmm13
+ .byte 68,15,194,233,2 // cmpleps %xmm1,%xmm13
+ .byte 69,15,40,243 // movaps %xmm11,%xmm14
+ .byte 68,15,92,241 // subps %xmm1,%xmm14
+ .byte 65,15,40,201 // movaps %xmm9,%xmm1
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 65,15,94,206 // divps %xmm14,%xmm1
- .byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,84,218 // andps %xmm2,%xmm11
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 65,15,40,197 // movaps %xmm13,%xmm0
+ .byte 15,85,193 // andnps %xmm1,%xmm0
+ .byte 69,15,84,205 // andps %xmm13,%xmm9
+ .byte 68,15,86,200 // orps %xmm0,%xmm9
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,41,84,36,200 // movaps %xmm2,-0x38(%rsp)
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 68,15,92,195 // subps %xmm3,%xmm8
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 15,92,216 // subps %xmm0,%xmm3
+ .byte 15,41,92,36,184 // movaps %xmm3,-0x48(%rsp)
+ .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 65,15,85,201 // andnps %xmm9,%xmm1
+ .byte 69,15,92,203 // subps %xmm11,%xmm9
+ .byte 65,15,92,219 // subps %xmm11,%xmm3
+ .byte 68,15,89,203 // mulps %xmm3,%xmm9
+ .byte 69,15,92,251 // subps %xmm11,%xmm15
+ .byte 69,15,94,207 // divps %xmm15,%xmm9
+ .byte 69,15,88,203 // addps %xmm11,%xmm9
+ .byte 68,15,84,200 // andps %xmm0,%xmm9
+ .byte 68,15,86,201 // orps %xmm1,%xmm9
+ .byte 65,15,40,202 // movaps %xmm10,%xmm1
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 65,15,94,206 // divps %xmm14,%xmm1
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 65,15,40,213 // movaps %xmm13,%xmm2
.byte 15,85,209 // andnps %xmm1,%xmm2
- .byte 65,15,86,211 // orps %xmm11,%xmm2
- .byte 65,15,40,205 // movaps %xmm13,%xmm1
- .byte 15,85,202 // andnps %xmm2,%xmm1
- .byte 65,15,92,210 // subps %xmm10,%xmm2
- .byte 65,15,89,209 // mulps %xmm9,%xmm2
- .byte 15,94,211 // divps %xmm3,%xmm2
- .byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 65,15,84,213 // andps %xmm13,%xmm2
- .byte 15,86,209 // orps %xmm1,%xmm2
- .byte 65,15,95,192 // maxps %xmm8,%xmm0
- .byte 69,15,95,248 // maxps %xmm8,%xmm15
- .byte 65,15,95,208 // maxps %xmm8,%xmm2
- .byte 68,15,40,196 // movaps %xmm4,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 68,15,92,196 // subps %xmm4,%xmm8
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 65,15,89,208 // mulps %xmm8,%xmm2
+ .byte 69,15,84,213 // andps %xmm13,%xmm10
+ .byte 68,15,86,210 // orps %xmm2,%xmm10
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 65,15,85,202 // andnps %xmm10,%xmm1
+ .byte 69,15,92,211 // subps %xmm11,%xmm10
+ .byte 68,15,89,211 // mulps %xmm3,%xmm10
+ .byte 69,15,94,215 // divps %xmm15,%xmm10
+ .byte 69,15,88,211 // addps %xmm11,%xmm10
+ .byte 68,15,84,208 // andps %xmm0,%xmm10
+ .byte 68,15,86,209 // orps %xmm1,%xmm10
+ .byte 65,15,40,204 // movaps %xmm12,%xmm1
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 65,15,94,206 // divps %xmm14,%xmm1
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 69,15,84,229 // andps %xmm13,%xmm12
+ .byte 68,15,85,233 // andnps %xmm1,%xmm13
+ .byte 69,15,86,236 // orps %xmm12,%xmm13
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 65,15,85,205 // andnps %xmm13,%xmm1
+ .byte 69,15,92,235 // subps %xmm11,%xmm13
+ .byte 68,15,89,235 // mulps %xmm3,%xmm13
+ .byte 69,15,94,239 // divps %xmm15,%xmm13
+ .byte 69,15,88,235 // addps %xmm11,%xmm13
+ .byte 68,15,84,232 // andps %xmm0,%xmm13
+ .byte 68,15,86,233 // orps %xmm1,%xmm13
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 68,15,95,200 // maxps %xmm0,%xmm9
+ .byte 68,15,95,208 // maxps %xmm0,%xmm10
+ .byte 68,15,95,232 // maxps %xmm0,%xmm13
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 65,15,88,249 // addps %xmm9,%xmm7
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 15,40,84,36,232 // movaps -0x18(%rsp),%xmm2
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 65,15,88,234 // addps %xmm10,%xmm5
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,68,36,216 // movaps -0x28(%rsp),%xmm0
+ .byte 68,15,89,192 // mulps %xmm0,%xmm8
+ .byte 68,15,88,196 // addps %xmm4,%xmm8
+ .byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,40,108,36,232 // movaps -0x18(%rsp),%xmm5
- .byte 65,15,40,207 // movaps %xmm15,%xmm1
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 65,15,40,208 // movaps %xmm8,%xmm2
+ .byte 15,40,92,36,184 // movaps -0x48(%rsp),%xmm3
+ .byte 15,40,124,36,200 // movaps -0x38(%rsp),%xmm7
.byte 255,224 // jmpq *%rax
HIDDEN _sk_luminosity_sse2
.globl _sk_luminosity_sse2
FUNCTION(_sk_luminosity_sse2)
_sk_luminosity_sse2:
- .byte 68,15,40,238 // movaps %xmm6,%xmm13
- .byte 68,15,41,108,36,232 // movaps %xmm13,-0x18(%rsp)
+ .byte 68,15,40,215 // movaps %xmm7,%xmm10
+ .byte 15,41,116,36,200 // movaps %xmm6,-0x38(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
- .byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 68,15,40,193 // movaps %xmm1,%xmm8
- .byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 69,15,87,210 // xorps %xmm10,%xmm10
- .byte 68,15,40,29,217,53,0,0 // movaps 0x35d9(%rip),%xmm11 # 4a70 <_sk_callback_sse2+0x33d>
- .byte 65,15,40,195 // movaps %xmm11,%xmm0
- .byte 15,94,199 // divps %xmm7,%xmm0
- .byte 68,15,40,231 // movaps %xmm7,%xmm12
- .byte 69,15,194,226,4 // cmpneqps %xmm10,%xmm12
- .byte 68,15,84,224 // andps %xmm0,%xmm12
- .byte 65,15,40,196 // movaps %xmm12,%xmm0
- .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
+ .byte 15,41,100,36,216 // movaps %xmm4,-0x28(%rsp)
+ .byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 68,15,40,205 // movaps %xmm5,%xmm9
+ .byte 68,15,89,204 // mulps %xmm4,%xmm9
+ .byte 15,89,222 // mulps %xmm6,%xmm3
+ .byte 68,15,40,37,14,54,0,0 // movaps 0x360e(%rip),%xmm12 # 4ba0 <_sk_callback_sse2+0x337>
+ .byte 68,15,40,199 // movaps %xmm7,%xmm8
+ .byte 69,15,89,196 // mulps %xmm12,%xmm8
+ .byte 68,15,40,45,14,54,0,0 // movaps 0x360e(%rip),%xmm13 # 4bb0 <_sk_callback_sse2+0x347>
+ .byte 68,15,40,241 // movaps %xmm1,%xmm14
+ .byte 69,15,89,245 // mulps %xmm13,%xmm14
+ .byte 69,15,88,240 // addps %xmm8,%xmm14
+ .byte 68,15,40,29,10,54,0,0 // movaps 0x360a(%rip),%xmm11 # 4bc0 <_sk_callback_sse2+0x357>
+ .byte 68,15,40,5,18,54,0,0 // movaps 0x3612(%rip),%xmm8 # 4bd0 <_sk_callback_sse2+0x367>
+ .byte 69,15,40,248 // movaps %xmm8,%xmm15
+ .byte 65,15,40,194 // movaps %xmm10,%xmm0
+ .byte 68,15,92,248 // subps %xmm0,%xmm15
+ .byte 65,15,89,255 // mulps %xmm15,%xmm7
+ .byte 65,15,89,207 // mulps %xmm15,%xmm1
+ .byte 15,41,76,36,184 // movaps %xmm1,-0x48(%rsp)
+ .byte 68,15,89,250 // mulps %xmm2,%xmm15
+ .byte 65,15,89,211 // mulps %xmm11,%xmm2
+ .byte 65,15,88,214 // addps %xmm14,%xmm2
+ .byte 69,15,40,241 // movaps %xmm9,%xmm14
+ .byte 69,15,89,244 // mulps %xmm12,%xmm14
+ .byte 68,15,40,211 // movaps %xmm3,%xmm10
+ .byte 69,15,89,213 // mulps %xmm13,%xmm10
+ .byte 69,15,88,214 // addps %xmm14,%xmm10
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,40,116,36,200 // movaps -0x38(%rsp),%xmm6
+ .byte 15,89,230 // mulps %xmm6,%xmm4
+ .byte 68,15,40,244 // movaps %xmm4,%xmm14
+ .byte 69,15,89,243 // mulps %xmm11,%xmm14
+ .byte 69,15,88,242 // addps %xmm10,%xmm14
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 65,15,92,214 // subps %xmm14,%xmm2
+ .byte 68,15,88,202 // addps %xmm2,%xmm9
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 68,15,40,211 // movaps %xmm3,%xmm10
+ .byte 68,15,93,210 // minps %xmm2,%xmm10
+ .byte 65,15,40,225 // movaps %xmm9,%xmm4
+ .byte 65,15,93,226 // minps %xmm10,%xmm4
+ .byte 68,15,40,211 // movaps %xmm3,%xmm10
+ .byte 68,15,95,210 // maxps %xmm2,%xmm10
+ .byte 69,15,40,241 // movaps %xmm9,%xmm14
+ .byte 69,15,95,242 // maxps %xmm10,%xmm14
+ .byte 69,15,89,225 // mulps %xmm9,%xmm12
+ .byte 68,15,89,235 // mulps %xmm3,%xmm13
+ .byte 69,15,88,236 // addps %xmm12,%xmm13
+ .byte 68,15,89,218 // mulps %xmm2,%xmm11
+ .byte 69,15,88,221 // addps %xmm13,%xmm11
+ .byte 69,15,87,228 // xorps %xmm12,%xmm12
+ .byte 68,15,194,228,2 // cmpleps %xmm4,%xmm12
+ .byte 69,15,40,211 // movaps %xmm11,%xmm10
+ .byte 68,15,92,212 // subps %xmm4,%xmm10
+ .byte 65,15,40,225 // movaps %xmm9,%xmm4
+ .byte 65,15,92,227 // subps %xmm11,%xmm4
+ .byte 65,15,89,227 // mulps %xmm11,%xmm4
+ .byte 65,15,94,226 // divps %xmm10,%xmm4
+ .byte 65,15,88,227 // addps %xmm11,%xmm4
+ .byte 69,15,40,236 // movaps %xmm12,%xmm13
+ .byte 68,15,85,236 // andnps %xmm4,%xmm13
+ .byte 69,15,84,204 // andps %xmm12,%xmm9
+ .byte 69,15,86,205 // orps %xmm13,%xmm9
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,41,68,36,168 // movaps %xmm0,-0x58(%rsp)
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 68,15,92,197 // subps %xmm5,%xmm8
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 68,15,40,236 // movaps %xmm4,%xmm13
+ .byte 65,15,194,230,1 // cmpltps %xmm14,%xmm4
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 65,15,85,193 // andnps %xmm9,%xmm0
+ .byte 69,15,92,203 // subps %xmm11,%xmm9
+ .byte 69,15,92,235 // subps %xmm11,%xmm13
+ .byte 69,15,89,205 // mulps %xmm13,%xmm9
+ .byte 69,15,92,243 // subps %xmm11,%xmm14
+ .byte 69,15,94,206 // divps %xmm14,%xmm9
+ .byte 69,15,88,203 // addps %xmm11,%xmm9
+ .byte 68,15,84,204 // andps %xmm4,%xmm9
+ .byte 68,15,86,200 // orps %xmm0,%xmm9
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 65,15,92,195 // subps %xmm11,%xmm0
+ .byte 65,15,89,195 // mulps %xmm11,%xmm0
+ .byte 65,15,94,194 // divps %xmm10,%xmm0
+ .byte 65,15,88,195 // addps %xmm11,%xmm0
.byte 65,15,40,204 // movaps %xmm12,%xmm1
- .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,85,200 // andnps %xmm0,%xmm1
+ .byte 65,15,84,220 // andps %xmm12,%xmm3
+ .byte 15,86,217 // orps %xmm1,%xmm3
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 15,85,195 // andnps %xmm3,%xmm0
+ .byte 65,15,92,219 // subps %xmm11,%xmm3
+ .byte 65,15,89,221 // mulps %xmm13,%xmm3
+ .byte 65,15,94,222 // divps %xmm14,%xmm3
+ .byte 65,15,88,219 // addps %xmm11,%xmm3
+ .byte 15,84,220 // andps %xmm4,%xmm3
+ .byte 15,86,216 // orps %xmm0,%xmm3
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 65,15,92,195 // subps %xmm11,%xmm0
+ .byte 65,15,89,195 // mulps %xmm11,%xmm0
+ .byte 65,15,94,194 // divps %xmm10,%xmm0
+ .byte 65,15,88,195 // addps %xmm11,%xmm0
+ .byte 65,15,84,212 // andps %xmm12,%xmm2
+ .byte 68,15,85,224 // andnps %xmm0,%xmm12
+ .byte 68,15,86,226 // orps %xmm2,%xmm12
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 65,15,85,196 // andnps %xmm12,%xmm0
+ .byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,229 // mulps %xmm13,%xmm12
- .byte 68,15,40,53,187,53,0,0 // movaps 0x35bb(%rip),%xmm14 # 4a80 <_sk_callback_sse2+0x34d>
- .byte 69,15,89,206 // mulps %xmm14,%xmm9
- .byte 68,15,40,45,191,53,0,0 // movaps 0x35bf(%rip),%xmm13 # 4a90 <_sk_callback_sse2+0x35d>
- .byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 69,15,88,193 // addps %xmm9,%xmm8
- .byte 68,15,40,13,191,53,0,0 // movaps 0x35bf(%rip),%xmm9 # 4aa0 <_sk_callback_sse2+0x36d>
- .byte 65,15,89,217 // mulps %xmm9,%xmm3
- .byte 65,15,88,216 // addps %xmm8,%xmm3
- .byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,40,249 // movaps %xmm1,%xmm15
- .byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 69,15,88,248 // addps %xmm8,%xmm15
- .byte 69,15,40,196 // movaps %xmm12,%xmm8
- .byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 69,15,88,199 // addps %xmm15,%xmm8
- .byte 65,15,92,216 // subps %xmm8,%xmm3
- .byte 15,88,195 // addps %xmm3,%xmm0
+ .byte 69,15,94,230 // divps %xmm14,%xmm12
+ .byte 69,15,88,227 // addps %xmm11,%xmm12
+ .byte 68,15,84,228 // andps %xmm4,%xmm12
+ .byte 68,15,86,224 // orps %xmm0,%xmm12
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 68,15,95,200 // maxps %xmm0,%xmm9
+ .byte 15,95,216 // maxps %xmm0,%xmm3
+ .byte 68,15,95,224 // maxps %xmm0,%xmm12
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 15,40,100,36,216 // movaps -0x28(%rsp),%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 65,15,88,249 // addps %xmm9,%xmm7
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 68,15,40,84,36,232 // movaps -0x18(%rsp),%xmm10
+ .byte 65,15,89,194 // mulps %xmm10,%xmm0
+ .byte 15,40,76,36,184 // movaps -0x48(%rsp),%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,88,203 // addps %xmm3,%xmm1
- .byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 68,15,40,193 // movaps %xmm1,%xmm8
- .byte 68,15,93,195 // minps %xmm3,%xmm8
- .byte 68,15,40,248 // movaps %xmm0,%xmm15
- .byte 69,15,93,248 // minps %xmm8,%xmm15
- .byte 68,15,40,193 // movaps %xmm1,%xmm8
- .byte 68,15,95,195 // maxps %xmm3,%xmm8
- .byte 68,15,40,224 // movaps %xmm0,%xmm12
- .byte 69,15,95,224 // maxps %xmm8,%xmm12
- .byte 68,15,89,240 // mulps %xmm0,%xmm14
- .byte 68,15,89,233 // mulps %xmm1,%xmm13
- .byte 69,15,88,238 // addps %xmm14,%xmm13
- .byte 68,15,89,203 // mulps %xmm3,%xmm9
- .byte 69,15,88,205 // addps %xmm13,%xmm9
- .byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 69,15,194,199,2 // cmpleps %xmm15,%xmm8
- .byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 69,15,92,233 // subps %xmm9,%xmm13
- .byte 69,15,89,233 // mulps %xmm9,%xmm13
- .byte 69,15,40,241 // movaps %xmm9,%xmm14
- .byte 69,15,92,247 // subps %xmm15,%xmm14
- .byte 69,15,94,238 // divps %xmm14,%xmm13
- .byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 69,15,40,248 // movaps %xmm8,%xmm15
- .byte 69,15,85,253 // andnps %xmm13,%xmm15
- .byte 65,15,84,192 // andps %xmm8,%xmm0
- .byte 65,15,86,199 // orps %xmm15,%xmm0
- .byte 69,15,40,235 // movaps %xmm11,%xmm13
- .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 69,15,40,253 // movaps %xmm13,%xmm15
- .byte 68,15,85,248 // andnps %xmm0,%xmm15
- .byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 69,15,92,217 // subps %xmm9,%xmm11
- .byte 65,15,89,195 // mulps %xmm11,%xmm0
- .byte 69,15,92,225 // subps %xmm9,%xmm12
- .byte 65,15,94,196 // divps %xmm12,%xmm0
- .byte 65,15,88,193 // addps %xmm9,%xmm0
- .byte 65,15,84,197 // andps %xmm13,%xmm0
- .byte 65,15,86,199 // orps %xmm15,%xmm0
- .byte 68,15,40,249 // movaps %xmm1,%xmm15
- .byte 69,15,92,249 // subps %xmm9,%xmm15
- .byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 69,15,94,254 // divps %xmm14,%xmm15
- .byte 69,15,88,249 // addps %xmm9,%xmm15
- .byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 65,15,85,215 // andnps %xmm15,%xmm2
- .byte 65,15,84,200 // andps %xmm8,%xmm1
- .byte 15,86,202 // orps %xmm2,%xmm1
- .byte 65,15,40,213 // movaps %xmm13,%xmm2
- .byte 15,85,209 // andnps %xmm1,%xmm2
- .byte 65,15,92,201 // subps %xmm9,%xmm1
- .byte 65,15,89,203 // mulps %xmm11,%xmm1
- .byte 65,15,94,204 // divps %xmm12,%xmm1
- .byte 65,15,88,201 // addps %xmm9,%xmm1
- .byte 65,15,84,205 // andps %xmm13,%xmm1
- .byte 15,86,202 // orps %xmm2,%xmm1
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 65,15,92,209 // subps %xmm9,%xmm2
- .byte 65,15,89,209 // mulps %xmm9,%xmm2
- .byte 65,15,94,214 // divps %xmm14,%xmm2
- .byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 65,15,84,216 // andps %xmm8,%xmm3
- .byte 68,15,85,194 // andnps %xmm2,%xmm8
- .byte 68,15,86,195 // orps %xmm3,%xmm8
- .byte 65,15,40,213 // movaps %xmm13,%xmm2
- .byte 65,15,85,208 // andnps %xmm8,%xmm2
- .byte 69,15,92,193 // subps %xmm9,%xmm8
- .byte 69,15,89,195 // mulps %xmm11,%xmm8
- .byte 69,15,94,196 // divps %xmm12,%xmm8
- .byte 69,15,88,193 // addps %xmm9,%xmm8
- .byte 69,15,84,197 // andps %xmm13,%xmm8
- .byte 68,15,86,194 // orps %xmm2,%xmm8
- .byte 65,15,95,194 // maxps %xmm10,%xmm0
- .byte 65,15,95,202 // maxps %xmm10,%xmm1
- .byte 69,15,95,194 // maxps %xmm10,%xmm8
- .byte 68,15,40,204 // movaps %xmm4,%xmm9
- .byte 68,15,88,207 // addps %xmm7,%xmm9
- .byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 68,15,92,204 // subps %xmm4,%xmm9
- .byte 65,15,89,193 // mulps %xmm9,%xmm0
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 69,15,89,193 // mulps %xmm9,%xmm8
+ .byte 68,15,89,198 // mulps %xmm6,%xmm8
+ .byte 69,15,88,199 // addps %xmm15,%xmm8
+ .byte 69,15,88,196 // addps %xmm12,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,199 // movaps %xmm7,%xmm0
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 65,15,40,217 // movaps %xmm9,%xmm3
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 15,40,116,36,232 // movaps -0x18(%rsp),%xmm6
+ .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 65,15,40,234 // movaps %xmm10,%xmm5
+ .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
.byte 255,224 // jmpq *%rax
HIDDEN _sk_clamp_0_sse2
@@ -27515,7 +27843,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,33,52,0,0 // movaps 0x3421(%rip),%xmm8 # 4ab0 <_sk_callback_sse2+0x37d>
+ .byte 68,15,40,5,27,52,0,0 // movaps 0x341b(%rip),%xmm8 # 4be0 <_sk_callback_sse2+0x377>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -27527,7 +27855,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,22,52,0,0 // minps 0x3416(%rip),%xmm3 # 4ac0 <_sk_callback_sse2+0x38d>
+ .byte 15,93,29,16,52,0,0 // minps 0x3410(%rip),%xmm3 # 4bf0 <_sk_callback_sse2+0x387>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -27614,7 +27942,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,129,51,0,0 // movaps 0x3381(%rip),%xmm9 # 4ad0 <_sk_callback_sse2+0x39d>
+ .byte 68,15,40,13,123,51,0,0 // movaps 0x337b(%rip),%xmm9 # 4c00 <_sk_callback_sse2+0x397>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -27628,20 +27956,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,108,51,0,0 // movaps 0x336c(%rip),%xmm8 # 4ae0 <_sk_callback_sse2+0x3ad>
+ .byte 68,15,40,5,102,51,0,0 // movaps 0x3366(%rip),%xmm8 # 4c10 <_sk_callback_sse2+0x3a7>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,100,51,0,0 // movaps 0x3364(%rip),%xmm9 # 4af0 <_sk_callback_sse2+0x3bd>
+ .byte 68,15,40,13,94,51,0,0 // movaps 0x335e(%rip),%xmm9 # 4c20 <_sk_callback_sse2+0x3b7>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,100,51,0,0 // movaps 0x3364(%rip),%xmm10 # 4b00 <_sk_callback_sse2+0x3cd>
+ .byte 68,15,40,21,94,51,0,0 // movaps 0x335e(%rip),%xmm10 # 4c30 <_sk_callback_sse2+0x3c7>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,100,51,0,0 // movaps 0x3364(%rip),%xmm11 # 4b10 <_sk_callback_sse2+0x3dd>
+ .byte 68,15,40,29,94,51,0,0 // movaps 0x335e(%rip),%xmm11 # 4c40 <_sk_callback_sse2+0x3d7>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,104,51,0,0 // movaps 0x3368(%rip),%xmm12 # 4b20 <_sk_callback_sse2+0x3ed>
+ .byte 68,15,40,37,98,51,0,0 // movaps 0x3362(%rip),%xmm12 # 4c50 <_sk_callback_sse2+0x3e7>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -27680,20 +28008,20 @@ _sk_to_srgb_sse2:
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
.byte 69,15,83,200 // rcpps %xmm8,%xmm9
.byte 69,15,82,232 // rsqrtps %xmm8,%xmm13
- .byte 68,15,40,5,237,50,0,0 // movaps 0x32ed(%rip),%xmm8 # 4b30 <_sk_callback_sse2+0x3fd>
+ .byte 68,15,40,5,231,50,0,0 // movaps 0x32e7(%rip),%xmm8 # 4c60 <_sk_callback_sse2+0x3f7>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,21,237,50,0,0 // movaps 0x32ed(%rip),%xmm10 # 4b40 <_sk_callback_sse2+0x40d>
+ .byte 68,15,40,21,231,50,0,0 // movaps 0x32e7(%rip),%xmm10 # 4c70 <_sk_callback_sse2+0x407>
.byte 69,15,89,202 // mulps %xmm10,%xmm9
- .byte 68,15,40,29,241,50,0,0 // movaps 0x32f1(%rip),%xmm11 # 4b50 <_sk_callback_sse2+0x41d>
+ .byte 68,15,40,29,235,50,0,0 // movaps 0x32eb(%rip),%xmm11 # 4c80 <_sk_callback_sse2+0x417>
.byte 69,15,88,203 // addps %xmm11,%xmm9
- .byte 68,15,40,37,245,50,0,0 // movaps 0x32f5(%rip),%xmm12 # 4b60 <_sk_callback_sse2+0x42d>
+ .byte 68,15,40,37,239,50,0,0 // movaps 0x32ef(%rip),%xmm12 # 4c90 <_sk_callback_sse2+0x427>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,40,13,245,50,0,0 // movaps 0x32f5(%rip),%xmm9 # 4b70 <_sk_callback_sse2+0x43d>
+ .byte 68,15,40,13,239,50,0,0 // movaps 0x32ef(%rip),%xmm9 # 4ca0 <_sk_callback_sse2+0x437>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,93,253 // minps %xmm13,%xmm15
- .byte 68,15,40,45,245,50,0,0 // movaps 0x32f5(%rip),%xmm13 # 4b80 <_sk_callback_sse2+0x44d>
+ .byte 68,15,40,45,239,50,0,0 // movaps 0x32ef(%rip),%xmm13 # 4cb0 <_sk_callback_sse2+0x447>
.byte 65,15,194,197,1 // cmpltps %xmm13,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
@@ -27743,7 +28071,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,218 // minps %xmm2,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,78,50,0,0 // movaps 0x324e(%rip),%xmm13 # 4b90 <_sk_callback_sse2+0x45d>
+ .byte 68,15,40,45,72,50,0,0 // movaps 0x3248(%rip),%xmm13 # 4cc0 <_sk_callback_sse2+0x457>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -27752,30 +28080,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,52,50,0,0 // andps 0x3234(%rip),%xmm14 # 4ba0 <_sk_callback_sse2+0x46d>
+ .byte 68,15,84,53,46,50,0,0 // andps 0x322e(%rip),%xmm14 # 4cd0 <_sk_callback_sse2+0x467>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,39,50,0,0 // movaps 0x3227(%rip),%xmm12 # 4bb0 <_sk_callback_sse2+0x47d>
+ .byte 68,15,40,37,33,50,0,0 // movaps 0x3221(%rip),%xmm12 # 4ce0 <_sk_callback_sse2+0x477>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,35,50,0,0 // addps 0x3223(%rip),%xmm8 # 4bc0 <_sk_callback_sse2+0x48d>
+ .byte 68,15,88,5,29,50,0,0 // addps 0x321d(%rip),%xmm8 # 4cf0 <_sk_callback_sse2+0x487>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,20,50,0,0 // mulps 0x3214(%rip),%xmm0 # 4bd0 <_sk_callback_sse2+0x49d>
+ .byte 15,89,5,14,50,0,0 // mulps 0x320e(%rip),%xmm0 # 4d00 <_sk_callback_sse2+0x497>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,7,50,0,0 // movaps 0x3207(%rip),%xmm9 # 4be0 <_sk_callback_sse2+0x4ad>
+ .byte 68,15,40,13,1,50,0,0 // movaps 0x3201(%rip),%xmm9 # 4d10 <_sk_callback_sse2+0x4a7>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -27799,7 +28127,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,198,49,0,0 // movaps 0x31c6(%rip),%xmm9 # 4bf0 <_sk_callback_sse2+0x4bd>
+ .byte 68,15,40,13,192,49,0,0 // movaps 0x31c0(%rip),%xmm9 # 4d20 <_sk_callback_sse2+0x4b7>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -27816,28 +28144,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,143,49,0,0 // movaps 0x318f(%rip),%xmm0 # 4c00 <_sk_callback_sse2+0x4cd>
+ .byte 15,40,5,137,49,0,0 // movaps 0x3189(%rip),%xmm0 # 4d30 <_sk_callback_sse2+0x4c7>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,135,49,0,0 // andps 0x3187(%rip),%xmm3 # 4c10 <_sk_callback_sse2+0x4dd>
+ .byte 15,84,29,129,49,0,0 // andps 0x3181(%rip),%xmm3 # 4d40 <_sk_callback_sse2+0x4d7>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,137,49,0,0 // movaps 0x3189(%rip),%xmm13 # 4c20 <_sk_callback_sse2+0x4ed>
+ .byte 68,15,40,45,131,49,0,0 // movaps 0x3183(%rip),%xmm13 # 4d50 <_sk_callback_sse2+0x4e7>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,153,49,0,0 // movaps 0x3199(%rip),%xmm2 # 4c50 <_sk_callback_sse2+0x51d>
+ .byte 15,40,21,147,49,0,0 // movaps 0x3193(%rip),%xmm2 # 4d80 <_sk_callback_sse2+0x517>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,105,49,0,0 // movaps 0x3169(%rip),%xmm1 # 4c30 <_sk_callback_sse2+0x4fd>
+ .byte 15,40,13,99,49,0,0 // movaps 0x3163(%rip),%xmm1 # 4d60 <_sk_callback_sse2+0x4f7>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,111,49,0,0 // movaps 0x316f(%rip),%xmm5 # 4c40 <_sk_callback_sse2+0x50d>
+ .byte 15,40,45,105,49,0,0 // movaps 0x3169(%rip),%xmm5 # 4d70 <_sk_callback_sse2+0x507>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -27860,7 +28188,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,228,48,0,0 // andps 0x30e4(%rip),%xmm3 # 4c10 <_sk_callback_sse2+0x4dd>
+ .byte 15,84,29,222,48,0,0 // andps 0x30de(%rip),%xmm3 # 4d40 <_sk_callback_sse2+0x4d7>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -27890,12 +28218,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,188,48,0,0 // addps 0x30bc(%rip),%xmm6 # 4c60 <_sk_callback_sse2+0x52d>
+ .byte 15,88,53,182,48,0,0 // addps 0x30b6(%rip),%xmm6 # 4d90 <_sk_callback_sse2+0x527>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,87,48,0,0 // andps 0x3057(%rip),%xmm3 # 4c10 <_sk_callback_sse2+0x4dd>
+ .byte 15,84,29,81,48,0,0 // andps 0x3051(%rip),%xmm3 # 4d40 <_sk_callback_sse2+0x4d7>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -27959,7 +28287,7 @@ _sk_scale_u8_sse2:
.byte 102,69,15,96,193 // punpcklbw %xmm9,%xmm8
.byte 102,69,15,97,193 // punpcklwd %xmm9,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,229,47,0,0 // mulps 0x2fe5(%rip),%xmm8 # 4c70 <_sk_callback_sse2+0x53d>
+ .byte 68,15,89,5,223,47,0,0 // mulps 0x2fdf(%rip),%xmm8 # 4da0 <_sk_callback_sse2+0x537>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -28000,7 +28328,7 @@ _sk_lerp_u8_sse2:
.byte 102,69,15,96,193 // punpcklbw %xmm9,%xmm8
.byte 102,69,15,97,193 // punpcklwd %xmm9,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,131,47,0,0 // mulps 0x2f83(%rip),%xmm8 # 4c80 <_sk_callback_sse2+0x54d>
+ .byte 68,15,89,5,125,47,0,0 // mulps 0x2f7d(%rip),%xmm8 # 4db0 <_sk_callback_sse2+0x547>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -28025,17 +28353,17 @@ _sk_lerp_565_sse2:
.byte 243,68,15,126,20,120 // movq (%rax,%rdi,2),%xmm10
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,69,15,97,208 // punpcklwd %xmm8,%xmm10
- .byte 102,68,15,111,5,73,47,0,0 // movdqa 0x2f49(%rip),%xmm8 # 4c90 <_sk_callback_sse2+0x55d>
+ .byte 102,68,15,111,5,67,47,0,0 // movdqa 0x2f43(%rip),%xmm8 # 4dc0 <_sk_callback_sse2+0x557>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,72,47,0,0 // mulps 0x2f48(%rip),%xmm8 # 4ca0 <_sk_callback_sse2+0x56d>
- .byte 102,68,15,111,13,79,47,0,0 // movdqa 0x2f4f(%rip),%xmm9 # 4cb0 <_sk_callback_sse2+0x57d>
+ .byte 68,15,89,5,66,47,0,0 // mulps 0x2f42(%rip),%xmm8 # 4dd0 <_sk_callback_sse2+0x567>
+ .byte 102,68,15,111,13,73,47,0,0 // movdqa 0x2f49(%rip),%xmm9 # 4de0 <_sk_callback_sse2+0x577>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,78,47,0,0 // mulps 0x2f4e(%rip),%xmm9 # 4cc0 <_sk_callback_sse2+0x58d>
- .byte 102,68,15,219,21,85,47,0,0 // pand 0x2f55(%rip),%xmm10 # 4cd0 <_sk_callback_sse2+0x59d>
+ .byte 68,15,89,13,72,47,0,0 // mulps 0x2f48(%rip),%xmm9 # 4df0 <_sk_callback_sse2+0x587>
+ .byte 102,68,15,219,21,79,47,0,0 // pand 0x2f4f(%rip),%xmm10 # 4e00 <_sk_callback_sse2+0x597>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,89,47,0,0 // mulps 0x2f59(%rip),%xmm10 # 4ce0 <_sk_callback_sse2+0x5ad>
+ .byte 68,15,89,21,83,47,0,0 // mulps 0x2f53(%rip),%xmm10 # 4e10 <_sk_callback_sse2+0x5a7>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -28066,7 +28394,7 @@ _sk_load_tables_sse2:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 243,69,15,111,12,184 // movdqu (%r8,%rdi,4),%xmm9
- .byte 102,68,15,111,5,9,47,0,0 // movdqa 0x2f09(%rip),%xmm8 # 4cf0 <_sk_callback_sse2+0x5bd>
+ .byte 102,68,15,111,5,3,47,0,0 // movdqa 0x2f03(%rip),%xmm8 # 4e20 <_sk_callback_sse2+0x5b7>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -28121,7 +28449,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,22,46,0,0 // mulps 0x2e16(%rip),%xmm3 # 4d00 <_sk_callback_sse2+0x5cd>
+ .byte 15,89,29,16,46,0,0 // mulps 0x2e10(%rip),%xmm3 # 4e30 <_sk_callback_sse2+0x5c7>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -28140,7 +28468,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,233,45,0,0 // movdqa 0x2de9(%rip),%xmm10 # 4d10 <_sk_callback_sse2+0x5dd>
+ .byte 102,68,15,111,21,227,45,0,0 // movdqa 0x2de3(%rip),%xmm10 # 4e40 <_sk_callback_sse2+0x5d7>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -28201,7 +28529,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,216,44,0,0 // mulps 0x2cd8(%rip),%xmm3 # 4d20 <_sk_callback_sse2+0x5ed>
+ .byte 15,89,29,210,44,0,0 // mulps 0x2cd2(%rip),%xmm3 # 4e50 <_sk_callback_sse2+0x5e7>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -28223,7 +28551,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,152,44,0,0 // movdqa 0x2c98(%rip),%xmm8 # 4d30 <_sk_callback_sse2+0x5fd>
+ .byte 102,68,15,111,5,146,44,0,0 // movdqa 0x2c92(%rip),%xmm8 # 4e60 <_sk_callback_sse2+0x5f7>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -28278,7 +28606,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,167,43,0,0 // movaps 0x2ba7(%rip),%xmm3 # 4d40 <_sk_callback_sse2+0x60d>
+ .byte 15,40,29,161,43,0,0 // movaps 0x2ba1(%rip),%xmm3 # 4e70 <_sk_callback_sse2+0x607>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_byte_tables_sse2
@@ -28288,7 +28616,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,168,43,0,0 // movaps 0x2ba8(%rip),%xmm8 # 4d50 <_sk_callback_sse2+0x61d>
+ .byte 68,15,40,5,162,43,0,0 // movaps 0x2ba2(%rip),%xmm8 # 4e80 <_sk_callback_sse2+0x617>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,72,15,126,193 // movq %xmm0,%rcx
@@ -28315,7 +28643,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,69,43,0,0 // movaps 0x2b45(%rip),%xmm10 # 4d60 <_sk_callback_sse2+0x62d>
+ .byte 68,15,40,21,63,43,0,0 // movaps 0x2b3f(%rip),%xmm10 # 4e90 <_sk_callback_sse2+0x627>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -28431,7 +28759,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,152,41,0,0 // movaps 0x2998(%rip),%xmm10 # 4d70 <_sk_callback_sse2+0x63d>
+ .byte 68,15,40,21,146,41,0,0 // movaps 0x2992(%rip),%xmm10 # 4ea0 <_sk_callback_sse2+0x637>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -28628,15 +28956,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,215,38,0,0 // mulps 0x26d7(%rip),%xmm9 # 4d80 <_sk_callback_sse2+0x64d>
- .byte 68,15,84,21,223,38,0,0 // andps 0x26df(%rip),%xmm10 # 4d90 <_sk_callback_sse2+0x65d>
- .byte 68,15,86,21,231,38,0,0 // orps 0x26e7(%rip),%xmm10 # 4da0 <_sk_callback_sse2+0x66d>
- .byte 68,15,88,13,239,38,0,0 // addps 0x26ef(%rip),%xmm9 # 4db0 <_sk_callback_sse2+0x67d>
- .byte 68,15,40,37,247,38,0,0 // movaps 0x26f7(%rip),%xmm12 # 4dc0 <_sk_callback_sse2+0x68d>
+ .byte 68,15,89,13,209,38,0,0 // mulps 0x26d1(%rip),%xmm9 # 4eb0 <_sk_callback_sse2+0x647>
+ .byte 68,15,84,21,217,38,0,0 // andps 0x26d9(%rip),%xmm10 # 4ec0 <_sk_callback_sse2+0x657>
+ .byte 68,15,86,21,225,38,0,0 // orps 0x26e1(%rip),%xmm10 # 4ed0 <_sk_callback_sse2+0x667>
+ .byte 68,15,88,13,233,38,0,0 // addps 0x26e9(%rip),%xmm9 # 4ee0 <_sk_callback_sse2+0x677>
+ .byte 68,15,40,37,241,38,0,0 // movaps 0x26f1(%rip),%xmm12 # 4ef0 <_sk_callback_sse2+0x687>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,247,38,0,0 // addps 0x26f7(%rip),%xmm10 # 4dd0 <_sk_callback_sse2+0x69d>
- .byte 68,15,40,37,255,38,0,0 // movaps 0x26ff(%rip),%xmm12 # 4de0 <_sk_callback_sse2+0x6ad>
+ .byte 68,15,88,21,241,38,0,0 // addps 0x26f1(%rip),%xmm10 # 4f00 <_sk_callback_sse2+0x697>
+ .byte 68,15,40,37,249,38,0,0 // movaps 0x26f9(%rip),%xmm12 # 4f10 <_sk_callback_sse2+0x6a7>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -28644,22 +28972,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,233,38,0,0 // movaps 0x26e9(%rip),%xmm10 # 4df0 <_sk_callback_sse2+0x6bd>
+ .byte 68,15,40,21,227,38,0,0 // movaps 0x26e3(%rip),%xmm10 # 4f20 <_sk_callback_sse2+0x6b7>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,221,38,0,0 // addps 0x26dd(%rip),%xmm9 # 4e00 <_sk_callback_sse2+0x6cd>
- .byte 68,15,40,37,229,38,0,0 // movaps 0x26e5(%rip),%xmm12 # 4e10 <_sk_callback_sse2+0x6dd>
+ .byte 68,15,88,13,215,38,0,0 // addps 0x26d7(%rip),%xmm9 # 4f30 <_sk_callback_sse2+0x6c7>
+ .byte 68,15,40,37,223,38,0,0 // movaps 0x26df(%rip),%xmm12 # 4f40 <_sk_callback_sse2+0x6d7>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,229,38,0,0 // movaps 0x26e5(%rip),%xmm12 # 4e20 <_sk_callback_sse2+0x6ed>
+ .byte 68,15,40,37,223,38,0,0 // movaps 0x26df(%rip),%xmm12 # 4f50 <_sk_callback_sse2+0x6e7>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,233,38,0,0 // movaps 0x26e9(%rip),%xmm13 # 4e30 <_sk_callback_sse2+0x6fd>
+ .byte 68,15,40,45,227,38,0,0 // movaps 0x26e3(%rip),%xmm13 # 4f60 <_sk_callback_sse2+0x6f7>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,233,38,0,0 // mulps 0x26e9(%rip),%xmm13 # 4e40 <_sk_callback_sse2+0x70d>
+ .byte 68,15,89,45,227,38,0,0 // mulps 0x26e3(%rip),%xmm13 # 4f70 <_sk_callback_sse2+0x707>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -28695,15 +29023,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,105,38,0,0 // mulps 0x2669(%rip),%xmm9 # 4e50 <_sk_callback_sse2+0x71d>
- .byte 68,15,84,21,113,38,0,0 // andps 0x2671(%rip),%xmm10 # 4e60 <_sk_callback_sse2+0x72d>
- .byte 68,15,86,21,121,38,0,0 // orps 0x2679(%rip),%xmm10 # 4e70 <_sk_callback_sse2+0x73d>
- .byte 68,15,88,13,129,38,0,0 // addps 0x2681(%rip),%xmm9 # 4e80 <_sk_callback_sse2+0x74d>
- .byte 68,15,40,37,137,38,0,0 // movaps 0x2689(%rip),%xmm12 # 4e90 <_sk_callback_sse2+0x75d>
+ .byte 68,15,89,13,99,38,0,0 // mulps 0x2663(%rip),%xmm9 # 4f80 <_sk_callback_sse2+0x717>
+ .byte 68,15,84,21,107,38,0,0 // andps 0x266b(%rip),%xmm10 # 4f90 <_sk_callback_sse2+0x727>
+ .byte 68,15,86,21,115,38,0,0 // orps 0x2673(%rip),%xmm10 # 4fa0 <_sk_callback_sse2+0x737>
+ .byte 68,15,88,13,123,38,0,0 // addps 0x267b(%rip),%xmm9 # 4fb0 <_sk_callback_sse2+0x747>
+ .byte 68,15,40,37,131,38,0,0 // movaps 0x2683(%rip),%xmm12 # 4fc0 <_sk_callback_sse2+0x757>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,137,38,0,0 // addps 0x2689(%rip),%xmm10 # 4ea0 <_sk_callback_sse2+0x76d>
- .byte 68,15,40,37,145,38,0,0 // movaps 0x2691(%rip),%xmm12 # 4eb0 <_sk_callback_sse2+0x77d>
+ .byte 68,15,88,21,131,38,0,0 // addps 0x2683(%rip),%xmm10 # 4fd0 <_sk_callback_sse2+0x767>
+ .byte 68,15,40,37,139,38,0,0 // movaps 0x268b(%rip),%xmm12 # 4fe0 <_sk_callback_sse2+0x777>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -28711,22 +29039,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,123,38,0,0 // movaps 0x267b(%rip),%xmm10 # 4ec0 <_sk_callback_sse2+0x78d>
+ .byte 68,15,40,21,117,38,0,0 // movaps 0x2675(%rip),%xmm10 # 4ff0 <_sk_callback_sse2+0x787>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,111,38,0,0 // addps 0x266f(%rip),%xmm9 # 4ed0 <_sk_callback_sse2+0x79d>
- .byte 68,15,40,37,119,38,0,0 // movaps 0x2677(%rip),%xmm12 # 4ee0 <_sk_callback_sse2+0x7ad>
+ .byte 68,15,88,13,105,38,0,0 // addps 0x2669(%rip),%xmm9 # 5000 <_sk_callback_sse2+0x797>
+ .byte 68,15,40,37,113,38,0,0 // movaps 0x2671(%rip),%xmm12 # 5010 <_sk_callback_sse2+0x7a7>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,119,38,0,0 // movaps 0x2677(%rip),%xmm12 # 4ef0 <_sk_callback_sse2+0x7bd>
+ .byte 68,15,40,37,113,38,0,0 // movaps 0x2671(%rip),%xmm12 # 5020 <_sk_callback_sse2+0x7b7>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,123,38,0,0 // movaps 0x267b(%rip),%xmm13 # 4f00 <_sk_callback_sse2+0x7cd>
+ .byte 68,15,40,45,117,38,0,0 // movaps 0x2675(%rip),%xmm13 # 5030 <_sk_callback_sse2+0x7c7>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,123,38,0,0 // mulps 0x267b(%rip),%xmm13 # 4f10 <_sk_callback_sse2+0x7dd>
+ .byte 68,15,89,45,117,38,0,0 // mulps 0x2675(%rip),%xmm13 # 5040 <_sk_callback_sse2+0x7d7>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -28762,15 +29090,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,251,37,0,0 // mulps 0x25fb(%rip),%xmm9 # 4f20 <_sk_callback_sse2+0x7ed>
- .byte 68,15,84,21,3,38,0,0 // andps 0x2603(%rip),%xmm10 # 4f30 <_sk_callback_sse2+0x7fd>
- .byte 68,15,86,21,11,38,0,0 // orps 0x260b(%rip),%xmm10 # 4f40 <_sk_callback_sse2+0x80d>
- .byte 68,15,88,13,19,38,0,0 // addps 0x2613(%rip),%xmm9 # 4f50 <_sk_callback_sse2+0x81d>
- .byte 68,15,40,37,27,38,0,0 // movaps 0x261b(%rip),%xmm12 # 4f60 <_sk_callback_sse2+0x82d>
+ .byte 68,15,89,13,245,37,0,0 // mulps 0x25f5(%rip),%xmm9 # 5050 <_sk_callback_sse2+0x7e7>
+ .byte 68,15,84,21,253,37,0,0 // andps 0x25fd(%rip),%xmm10 # 5060 <_sk_callback_sse2+0x7f7>
+ .byte 68,15,86,21,5,38,0,0 // orps 0x2605(%rip),%xmm10 # 5070 <_sk_callback_sse2+0x807>
+ .byte 68,15,88,13,13,38,0,0 // addps 0x260d(%rip),%xmm9 # 5080 <_sk_callback_sse2+0x817>
+ .byte 68,15,40,37,21,38,0,0 // movaps 0x2615(%rip),%xmm12 # 5090 <_sk_callback_sse2+0x827>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,27,38,0,0 // addps 0x261b(%rip),%xmm10 # 4f70 <_sk_callback_sse2+0x83d>
- .byte 68,15,40,37,35,38,0,0 // movaps 0x2623(%rip),%xmm12 # 4f80 <_sk_callback_sse2+0x84d>
+ .byte 68,15,88,21,21,38,0,0 // addps 0x2615(%rip),%xmm10 # 50a0 <_sk_callback_sse2+0x837>
+ .byte 68,15,40,37,29,38,0,0 // movaps 0x261d(%rip),%xmm12 # 50b0 <_sk_callback_sse2+0x847>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -28778,22 +29106,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,13,38,0,0 // movaps 0x260d(%rip),%xmm10 # 4f90 <_sk_callback_sse2+0x85d>
+ .byte 68,15,40,21,7,38,0,0 // movaps 0x2607(%rip),%xmm10 # 50c0 <_sk_callback_sse2+0x857>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,1,38,0,0 // addps 0x2601(%rip),%xmm9 # 4fa0 <_sk_callback_sse2+0x86d>
- .byte 68,15,40,37,9,38,0,0 // movaps 0x2609(%rip),%xmm12 # 4fb0 <_sk_callback_sse2+0x87d>
+ .byte 68,15,88,13,251,37,0,0 // addps 0x25fb(%rip),%xmm9 # 50d0 <_sk_callback_sse2+0x867>
+ .byte 68,15,40,37,3,38,0,0 // movaps 0x2603(%rip),%xmm12 # 50e0 <_sk_callback_sse2+0x877>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,9,38,0,0 // movaps 0x2609(%rip),%xmm12 # 4fc0 <_sk_callback_sse2+0x88d>
+ .byte 68,15,40,37,3,38,0,0 // movaps 0x2603(%rip),%xmm12 # 50f0 <_sk_callback_sse2+0x887>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,13,38,0,0 // movaps 0x260d(%rip),%xmm13 # 4fd0 <_sk_callback_sse2+0x89d>
+ .byte 68,15,40,45,7,38,0,0 // movaps 0x2607(%rip),%xmm13 # 5100 <_sk_callback_sse2+0x897>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,13,38,0,0 // mulps 0x260d(%rip),%xmm13 # 4fe0 <_sk_callback_sse2+0x8ad>
+ .byte 68,15,89,45,7,38,0,0 // mulps 0x2607(%rip),%xmm13 # 5110 <_sk_callback_sse2+0x8a7>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -28829,15 +29157,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,141,37,0,0 // mulps 0x258d(%rip),%xmm9 # 4ff0 <_sk_callback_sse2+0x8bd>
- .byte 68,15,84,21,149,37,0,0 // andps 0x2595(%rip),%xmm10 # 5000 <_sk_callback_sse2+0x8cd>
- .byte 68,15,86,21,157,37,0,0 // orps 0x259d(%rip),%xmm10 # 5010 <_sk_callback_sse2+0x8dd>
- .byte 68,15,88,13,165,37,0,0 // addps 0x25a5(%rip),%xmm9 # 5020 <_sk_callback_sse2+0x8ed>
- .byte 68,15,40,37,173,37,0,0 // movaps 0x25ad(%rip),%xmm12 # 5030 <_sk_callback_sse2+0x8fd>
+ .byte 68,15,89,13,135,37,0,0 // mulps 0x2587(%rip),%xmm9 # 5120 <_sk_callback_sse2+0x8b7>
+ .byte 68,15,84,21,143,37,0,0 // andps 0x258f(%rip),%xmm10 # 5130 <_sk_callback_sse2+0x8c7>
+ .byte 68,15,86,21,151,37,0,0 // orps 0x2597(%rip),%xmm10 # 5140 <_sk_callback_sse2+0x8d7>
+ .byte 68,15,88,13,159,37,0,0 // addps 0x259f(%rip),%xmm9 # 5150 <_sk_callback_sse2+0x8e7>
+ .byte 68,15,40,37,167,37,0,0 // movaps 0x25a7(%rip),%xmm12 # 5160 <_sk_callback_sse2+0x8f7>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,173,37,0,0 // addps 0x25ad(%rip),%xmm10 # 5040 <_sk_callback_sse2+0x90d>
- .byte 68,15,40,37,181,37,0,0 // movaps 0x25b5(%rip),%xmm12 # 5050 <_sk_callback_sse2+0x91d>
+ .byte 68,15,88,21,167,37,0,0 // addps 0x25a7(%rip),%xmm10 # 5170 <_sk_callback_sse2+0x907>
+ .byte 68,15,40,37,175,37,0,0 // movaps 0x25af(%rip),%xmm12 # 5180 <_sk_callback_sse2+0x917>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -28845,22 +29173,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,159,37,0,0 // movaps 0x259f(%rip),%xmm10 # 5060 <_sk_callback_sse2+0x92d>
+ .byte 68,15,40,21,153,37,0,0 // movaps 0x2599(%rip),%xmm10 # 5190 <_sk_callback_sse2+0x927>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,147,37,0,0 // addps 0x2593(%rip),%xmm9 # 5070 <_sk_callback_sse2+0x93d>
- .byte 68,15,40,37,155,37,0,0 // movaps 0x259b(%rip),%xmm12 # 5080 <_sk_callback_sse2+0x94d>
+ .byte 68,15,88,13,141,37,0,0 // addps 0x258d(%rip),%xmm9 # 51a0 <_sk_callback_sse2+0x937>
+ .byte 68,15,40,37,149,37,0,0 // movaps 0x2595(%rip),%xmm12 # 51b0 <_sk_callback_sse2+0x947>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,155,37,0,0 // movaps 0x259b(%rip),%xmm12 # 5090 <_sk_callback_sse2+0x95d>
+ .byte 68,15,40,37,149,37,0,0 // movaps 0x2595(%rip),%xmm12 # 51c0 <_sk_callback_sse2+0x957>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,159,37,0,0 // movaps 0x259f(%rip),%xmm13 # 50a0 <_sk_callback_sse2+0x96d>
+ .byte 68,15,40,45,153,37,0,0 // movaps 0x2599(%rip),%xmm13 # 51d0 <_sk_callback_sse2+0x967>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,159,37,0,0 // mulps 0x259f(%rip),%xmm13 # 50b0 <_sk_callback_sse2+0x97d>
+ .byte 68,15,89,45,153,37,0,0 // mulps 0x2599(%rip),%xmm13 # 51e0 <_sk_callback_sse2+0x977>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -28877,29 +29205,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,124,37,0,0 // mulps 0x257c(%rip),%xmm0 # 50c0 <_sk_callback_sse2+0x98d>
- .byte 68,15,40,5,132,37,0,0 // movaps 0x2584(%rip),%xmm8 # 50d0 <_sk_callback_sse2+0x99d>
+ .byte 15,89,5,118,37,0,0 // mulps 0x2576(%rip),%xmm0 # 51f0 <_sk_callback_sse2+0x987>
+ .byte 68,15,40,5,126,37,0,0 // movaps 0x257e(%rip),%xmm8 # 5200 <_sk_callback_sse2+0x997>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,136,37,0,0 // movaps 0x2588(%rip),%xmm9 # 50e0 <_sk_callback_sse2+0x9ad>
+ .byte 68,15,40,13,130,37,0,0 // movaps 0x2582(%rip),%xmm9 # 5210 <_sk_callback_sse2+0x9a7>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,133,37,0,0 // addps 0x2585(%rip),%xmm0 # 50f0 <_sk_callback_sse2+0x9bd>
- .byte 15,89,5,142,37,0,0 // mulps 0x258e(%rip),%xmm0 # 5100 <_sk_callback_sse2+0x9cd>
- .byte 15,89,13,151,37,0,0 // mulps 0x2597(%rip),%xmm1 # 5110 <_sk_callback_sse2+0x9dd>
+ .byte 15,88,5,127,37,0,0 // addps 0x257f(%rip),%xmm0 # 5220 <_sk_callback_sse2+0x9b7>
+ .byte 15,89,5,136,37,0,0 // mulps 0x2588(%rip),%xmm0 # 5230 <_sk_callback_sse2+0x9c7>
+ .byte 15,89,13,145,37,0,0 // mulps 0x2591(%rip),%xmm1 # 5240 <_sk_callback_sse2+0x9d7>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,157,37,0,0 // mulps 0x259d(%rip),%xmm2 # 5120 <_sk_callback_sse2+0x9ed>
+ .byte 15,89,21,151,37,0,0 // mulps 0x2597(%rip),%xmm2 # 5250 <_sk_callback_sse2+0x9e7>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,146,37,0,0 // movaps 0x2592(%rip),%xmm2 # 5130 <_sk_callback_sse2+0x9fd>
+ .byte 15,40,21,140,37,0,0 // movaps 0x258c(%rip),%xmm2 # 5260 <_sk_callback_sse2+0x9f7>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,145,37,0,0 // movaps 0x2591(%rip),%xmm10 # 5140 <_sk_callback_sse2+0xa0d>
+ .byte 68,15,40,21,139,37,0,0 // movaps 0x258b(%rip),%xmm10 # 5270 <_sk_callback_sse2+0xa07>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,149,37,0,0 // movaps 0x2595(%rip),%xmm11 # 5150 <_sk_callback_sse2+0xa1d>
+ .byte 68,15,40,29,143,37,0,0 // movaps 0x258f(%rip),%xmm11 # 5280 <_sk_callback_sse2+0xa17>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -28923,8 +29251,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,69,37,0,0 // mulps 0x2545(%rip),%xmm8 # 5160 <_sk_callback_sse2+0xa2d>
- .byte 15,89,21,78,37,0,0 // mulps 0x254e(%rip),%xmm2 # 5170 <_sk_callback_sse2+0xa3d>
+ .byte 68,15,89,5,63,37,0,0 // mulps 0x253f(%rip),%xmm8 # 5290 <_sk_callback_sse2+0xa27>
+ .byte 15,89,21,72,37,0,0 // mulps 0x2548(%rip),%xmm2 # 52a0 <_sk_callback_sse2+0xa37>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -28940,7 +29268,7 @@ _sk_load_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,54,37,0,0 // mulps 0x2536(%rip),%xmm3 # 5180 <_sk_callback_sse2+0xa4d>
+ .byte 15,89,29,48,37,0,0 // mulps 0x2530(%rip),%xmm3 # 52b0 <_sk_callback_sse2+0xa47>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -28985,7 +29313,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,165,36,0,0 // mulps 0x24a5(%rip),%xmm3 # 5190 <_sk_callback_sse2+0xa5d>
+ .byte 15,89,29,159,36,0,0 // mulps 0x249f(%rip),%xmm3 # 52c0 <_sk_callback_sse2+0xa57>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -28998,7 +29326,7 @@ FUNCTION(_sk_store_a8_sse2)
_sk_store_a8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,153,36,0,0 // movaps 0x2499(%rip),%xmm8 # 51a0 <_sk_callback_sse2+0xa6d>
+ .byte 68,15,40,5,147,36,0,0 // movaps 0x2493(%rip),%xmm8 # 52d0 <_sk_callback_sse2+0xa67>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -29020,9 +29348,9 @@ _sk_load_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,96,36,0,0 // mulps 0x2460(%rip),%xmm0 # 51b0 <_sk_callback_sse2+0xa7d>
+ .byte 15,89,5,90,36,0,0 // mulps 0x245a(%rip),%xmm0 # 52e0 <_sk_callback_sse2+0xa77>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,103,36,0,0 // movaps 0x2467(%rip),%xmm3 # 51c0 <_sk_callback_sse2+0xa8d>
+ .byte 15,40,29,97,36,0,0 // movaps 0x2461(%rip),%xmm3 # 52f0 <_sk_callback_sse2+0xa87>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -29065,9 +29393,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,220,35,0,0 // mulps 0x23dc(%rip),%xmm0 # 51d0 <_sk_callback_sse2+0xa9d>
+ .byte 15,89,5,214,35,0,0 // mulps 0x23d6(%rip),%xmm0 # 5300 <_sk_callback_sse2+0xa97>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,227,35,0,0 // movaps 0x23e3(%rip),%xmm3 # 51e0 <_sk_callback_sse2+0xaad>
+ .byte 15,40,29,221,35,0,0 // movaps 0x23dd(%rip),%xmm3 # 5310 <_sk_callback_sse2+0xaa7>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -29079,9 +29407,9 @@ _sk_gather_i8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,192 // mov %rax,%r8
.byte 77,133,192 // test %r8,%r8
- .byte 116,5 // je 2e14 <_sk_gather_i8_sse2+0xf>
+ .byte 116,5 // je 2f4a <_sk_gather_i8_sse2+0xf>
.byte 76,137,192 // mov %r8,%rax
- .byte 235,2 // jmp 2e16 <_sk_gather_i8_sse2+0x11>
+ .byte 235,2 // jmp 2f4c <_sk_gather_i8_sse2+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -29130,11 +29458,11 @@ _sk_gather_i8_sse2:
.byte 102,67,15,110,12,136 // movd (%r8,%r9,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,2,35,0,0 // movdqa 0x2302(%rip),%xmm2 # 51f0 <_sk_callback_sse2+0xabd>
+ .byte 102,15,111,21,252,34,0,0 // movdqa 0x22fc(%rip),%xmm2 # 5320 <_sk_callback_sse2+0xab7>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,254,34,0,0 // movaps 0x22fe(%rip),%xmm8 # 5200 <_sk_callback_sse2+0xacd>
+ .byte 68,15,40,5,248,34,0,0 // movaps 0x22f8(%rip),%xmm8 # 5330 <_sk_callback_sse2+0xac7>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -29161,19 +29489,19 @@ _sk_load_565_sse2:
.byte 243,15,126,20,120 // movq (%rax,%rdi,2),%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,180,34,0,0 // movdqa 0x22b4(%rip),%xmm0 # 5210 <_sk_callback_sse2+0xadd>
+ .byte 102,15,111,5,174,34,0,0 // movdqa 0x22ae(%rip),%xmm0 # 5340 <_sk_callback_sse2+0xad7>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,182,34,0,0 // mulps 0x22b6(%rip),%xmm0 # 5220 <_sk_callback_sse2+0xaed>
- .byte 102,15,111,13,190,34,0,0 // movdqa 0x22be(%rip),%xmm1 # 5230 <_sk_callback_sse2+0xafd>
+ .byte 15,89,5,176,34,0,0 // mulps 0x22b0(%rip),%xmm0 # 5350 <_sk_callback_sse2+0xae7>
+ .byte 102,15,111,13,184,34,0,0 // movdqa 0x22b8(%rip),%xmm1 # 5360 <_sk_callback_sse2+0xaf7>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,192,34,0,0 // mulps 0x22c0(%rip),%xmm1 # 5240 <_sk_callback_sse2+0xb0d>
- .byte 102,15,219,21,200,34,0,0 // pand 0x22c8(%rip),%xmm2 # 5250 <_sk_callback_sse2+0xb1d>
+ .byte 15,89,13,186,34,0,0 // mulps 0x22ba(%rip),%xmm1 # 5370 <_sk_callback_sse2+0xb07>
+ .byte 102,15,219,21,194,34,0,0 // pand 0x22c2(%rip),%xmm2 # 5380 <_sk_callback_sse2+0xb17>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,206,34,0,0 // mulps 0x22ce(%rip),%xmm2 # 5260 <_sk_callback_sse2+0xb2d>
+ .byte 15,89,21,200,34,0,0 // mulps 0x22c8(%rip),%xmm2 # 5390 <_sk_callback_sse2+0xb27>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,213,34,0,0 // movaps 0x22d5(%rip),%xmm3 # 5270 <_sk_callback_sse2+0xb3d>
+ .byte 15,40,29,207,34,0,0 // movaps 0x22cf(%rip),%xmm3 # 53a0 <_sk_callback_sse2+0xb37>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_gather_565_sse2
@@ -29208,19 +29536,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,94,34,0,0 // movdqa 0x225e(%rip),%xmm0 # 5280 <_sk_callback_sse2+0xb4d>
+ .byte 102,15,111,5,88,34,0,0 // movdqa 0x2258(%rip),%xmm0 # 53b0 <_sk_callback_sse2+0xb47>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,96,34,0,0 // mulps 0x2260(%rip),%xmm0 # 5290 <_sk_callback_sse2+0xb5d>
- .byte 102,15,111,13,104,34,0,0 // movdqa 0x2268(%rip),%xmm1 # 52a0 <_sk_callback_sse2+0xb6d>
+ .byte 15,89,5,90,34,0,0 // mulps 0x225a(%rip),%xmm0 # 53c0 <_sk_callback_sse2+0xb57>
+ .byte 102,15,111,13,98,34,0,0 // movdqa 0x2262(%rip),%xmm1 # 53d0 <_sk_callback_sse2+0xb67>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,106,34,0,0 // mulps 0x226a(%rip),%xmm1 # 52b0 <_sk_callback_sse2+0xb7d>
- .byte 102,15,219,21,114,34,0,0 // pand 0x2272(%rip),%xmm2 # 52c0 <_sk_callback_sse2+0xb8d>
+ .byte 15,89,13,100,34,0,0 // mulps 0x2264(%rip),%xmm1 # 53e0 <_sk_callback_sse2+0xb77>
+ .byte 102,15,219,21,108,34,0,0 // pand 0x226c(%rip),%xmm2 # 53f0 <_sk_callback_sse2+0xb87>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,120,34,0,0 // mulps 0x2278(%rip),%xmm2 # 52d0 <_sk_callback_sse2+0xb9d>
+ .byte 15,89,21,114,34,0,0 // mulps 0x2272(%rip),%xmm2 # 5400 <_sk_callback_sse2+0xb97>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,127,34,0,0 // movaps 0x227f(%rip),%xmm3 # 52e0 <_sk_callback_sse2+0xbad>
+ .byte 15,40,29,121,34,0,0 // movaps 0x2279(%rip),%xmm3 # 5410 <_sk_callback_sse2+0xba7>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_sse2
@@ -29229,12 +29557,12 @@ FUNCTION(_sk_store_565_sse2)
_sk_store_565_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,128,34,0,0 // movaps 0x2280(%rip),%xmm8 # 52f0 <_sk_callback_sse2+0xbbd>
+ .byte 68,15,40,5,122,34,0,0 // movaps 0x227a(%rip),%xmm8 # 5420 <_sk_callback_sse2+0xbb7>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,117,34,0,0 // movaps 0x2275(%rip),%xmm10 # 5300 <_sk_callback_sse2+0xbcd>
+ .byte 68,15,40,21,111,34,0,0 // movaps 0x226f(%rip),%xmm10 # 5430 <_sk_callback_sse2+0xbc7>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -29258,21 +29586,21 @@ _sk_load_4444_sse2:
.byte 243,15,126,28,120 // movq (%rax,%rdi,2),%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,46,34,0,0 // movdqa 0x222e(%rip),%xmm0 # 5310 <_sk_callback_sse2+0xbdd>
+ .byte 102,15,111,5,40,34,0,0 // movdqa 0x2228(%rip),%xmm0 # 5440 <_sk_callback_sse2+0xbd7>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,48,34,0,0 // mulps 0x2230(%rip),%xmm0 # 5320 <_sk_callback_sse2+0xbed>
- .byte 102,15,111,13,56,34,0,0 // movdqa 0x2238(%rip),%xmm1 # 5330 <_sk_callback_sse2+0xbfd>
+ .byte 15,89,5,42,34,0,0 // mulps 0x222a(%rip),%xmm0 # 5450 <_sk_callback_sse2+0xbe7>
+ .byte 102,15,111,13,50,34,0,0 // movdqa 0x2232(%rip),%xmm1 # 5460 <_sk_callback_sse2+0xbf7>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,58,34,0,0 // mulps 0x223a(%rip),%xmm1 # 5340 <_sk_callback_sse2+0xc0d>
- .byte 102,15,111,21,66,34,0,0 // movdqa 0x2242(%rip),%xmm2 # 5350 <_sk_callback_sse2+0xc1d>
+ .byte 15,89,13,52,34,0,0 // mulps 0x2234(%rip),%xmm1 # 5470 <_sk_callback_sse2+0xc07>
+ .byte 102,15,111,21,60,34,0,0 // movdqa 0x223c(%rip),%xmm2 # 5480 <_sk_callback_sse2+0xc17>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,68,34,0,0 // mulps 0x2244(%rip),%xmm2 # 5360 <_sk_callback_sse2+0xc2d>
- .byte 102,15,219,29,76,34,0,0 // pand 0x224c(%rip),%xmm3 # 5370 <_sk_callback_sse2+0xc3d>
+ .byte 15,89,21,62,34,0,0 // mulps 0x223e(%rip),%xmm2 # 5490 <_sk_callback_sse2+0xc27>
+ .byte 102,15,219,29,70,34,0,0 // pand 0x2246(%rip),%xmm3 # 54a0 <_sk_callback_sse2+0xc37>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,82,34,0,0 // mulps 0x2252(%rip),%xmm3 # 5380 <_sk_callback_sse2+0xc4d>
+ .byte 15,89,29,76,34,0,0 // mulps 0x224c(%rip),%xmm3 # 54b0 <_sk_callback_sse2+0xc47>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -29308,21 +29636,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,217,33,0,0 // movdqa 0x21d9(%rip),%xmm0 # 5390 <_sk_callback_sse2+0xc5d>
+ .byte 102,15,111,5,211,33,0,0 // movdqa 0x21d3(%rip),%xmm0 # 54c0 <_sk_callback_sse2+0xc57>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,219,33,0,0 // mulps 0x21db(%rip),%xmm0 # 53a0 <_sk_callback_sse2+0xc6d>
- .byte 102,15,111,13,227,33,0,0 // movdqa 0x21e3(%rip),%xmm1 # 53b0 <_sk_callback_sse2+0xc7d>
+ .byte 15,89,5,213,33,0,0 // mulps 0x21d5(%rip),%xmm0 # 54d0 <_sk_callback_sse2+0xc67>
+ .byte 102,15,111,13,221,33,0,0 // movdqa 0x21dd(%rip),%xmm1 # 54e0 <_sk_callback_sse2+0xc77>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,229,33,0,0 // mulps 0x21e5(%rip),%xmm1 # 53c0 <_sk_callback_sse2+0xc8d>
- .byte 102,15,111,21,237,33,0,0 // movdqa 0x21ed(%rip),%xmm2 # 53d0 <_sk_callback_sse2+0xc9d>
+ .byte 15,89,13,223,33,0,0 // mulps 0x21df(%rip),%xmm1 # 54f0 <_sk_callback_sse2+0xc87>
+ .byte 102,15,111,21,231,33,0,0 // movdqa 0x21e7(%rip),%xmm2 # 5500 <_sk_callback_sse2+0xc97>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,239,33,0,0 // mulps 0x21ef(%rip),%xmm2 # 53e0 <_sk_callback_sse2+0xcad>
- .byte 102,15,219,29,247,33,0,0 // pand 0x21f7(%rip),%xmm3 # 53f0 <_sk_callback_sse2+0xcbd>
+ .byte 15,89,21,233,33,0,0 // mulps 0x21e9(%rip),%xmm2 # 5510 <_sk_callback_sse2+0xca7>
+ .byte 102,15,219,29,241,33,0,0 // pand 0x21f1(%rip),%xmm3 # 5520 <_sk_callback_sse2+0xcb7>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,253,33,0,0 // mulps 0x21fd(%rip),%xmm3 # 5400 <_sk_callback_sse2+0xccd>
+ .byte 15,89,29,247,33,0,0 // mulps 0x21f7(%rip),%xmm3 # 5530 <_sk_callback_sse2+0xcc7>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -29332,7 +29660,7 @@ FUNCTION(_sk_store_4444_sse2)
_sk_store_4444_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,252,33,0,0 // movaps 0x21fc(%rip),%xmm8 # 5410 <_sk_callback_sse2+0xcdd>
+ .byte 68,15,40,5,246,33,0,0 // movaps 0x21f6(%rip),%xmm8 # 5540 <_sk_callback_sse2+0xcd7>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -29364,11 +29692,11 @@ _sk_load_8888_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 68,15,16,12,184 // movups (%rax,%rdi,4),%xmm9
- .byte 15,40,21,143,33,0,0 // movaps 0x218f(%rip),%xmm2 # 5420 <_sk_callback_sse2+0xced>
+ .byte 15,40,21,137,33,0,0 // movaps 0x2189(%rip),%xmm2 # 5550 <_sk_callback_sse2+0xce7>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,141,33,0,0 // movaps 0x218d(%rip),%xmm8 # 5430 <_sk_callback_sse2+0xcfd>
+ .byte 68,15,40,5,135,33,0,0 // movaps 0x2187(%rip),%xmm8 # 5560 <_sk_callback_sse2+0xcf7>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,40,201 // movaps %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -29417,11 +29745,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,129 // movd (%r9,%r8,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,222,32,0,0 // movdqa 0x20de(%rip),%xmm2 # 5440 <_sk_callback_sse2+0xd0d>
+ .byte 102,15,111,21,216,32,0,0 // movdqa 0x20d8(%rip),%xmm2 # 5570 <_sk_callback_sse2+0xd07>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,218,32,0,0 // movaps 0x20da(%rip),%xmm8 # 5450 <_sk_callback_sse2+0xd1d>
+ .byte 68,15,40,5,212,32,0,0 // movaps 0x20d4(%rip),%xmm8 # 5580 <_sk_callback_sse2+0xd17>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -29445,7 +29773,7 @@ FUNCTION(_sk_store_8888_sse2)
_sk_store_8888_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,157,32,0,0 // movaps 0x209d(%rip),%xmm8 # 5460 <_sk_callback_sse2+0xd2d>
+ .byte 68,15,40,5,151,32,0,0 // movaps 0x2097(%rip),%xmm8 # 5590 <_sk_callback_sse2+0xd27>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -29484,7 +29812,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,13,32,0,0 // movdqa 0x200d(%rip),%xmm9 # 5470 <_sk_callback_sse2+0xd3d>
+ .byte 102,68,15,111,13,7,32,0,0 // movdqa 0x2007(%rip),%xmm9 # 55a0 <_sk_callback_sse2+0xd37>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -29492,11 +29820,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,242,31,0,0 // movdqa 0x1ff2(%rip),%xmm11 # 5480 <_sk_callback_sse2+0xd4d>
+ .byte 102,68,15,111,29,236,31,0,0 // movdqa 0x1fec(%rip),%xmm11 # 55b0 <_sk_callback_sse2+0xd47>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,244,31,0,0 // movdqa 0x1ff4(%rip),%xmm12 # 5490 <_sk_callback_sse2+0xd5d>
+ .byte 102,68,15,111,37,238,31,0,0 // movdqa 0x1fee(%rip),%xmm12 # 55c0 <_sk_callback_sse2+0xd57>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,247,31,0,0 // movdqa 0x1ff7(%rip),%xmm3 # 54a0 <_sk_callback_sse2+0xd6d>
+ .byte 102,15,111,29,241,31,0,0 // movdqa 0x1ff1(%rip),%xmm3 # 55d0 <_sk_callback_sse2+0xd67>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -29582,7 +29910,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,133,30,0,0 // movdqa 0x1e85(%rip),%xmm9 # 54b0 <_sk_callback_sse2+0xd7d>
+ .byte 102,68,15,111,13,127,30,0,0 // movdqa 0x1e7f(%rip),%xmm9 # 55e0 <_sk_callback_sse2+0xd77>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -29590,11 +29918,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,106,30,0,0 // movdqa 0x1e6a(%rip),%xmm11 # 54c0 <_sk_callback_sse2+0xd8d>
+ .byte 102,68,15,111,29,100,30,0,0 // movdqa 0x1e64(%rip),%xmm11 # 55f0 <_sk_callback_sse2+0xd87>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,108,30,0,0 // movdqa 0x1e6c(%rip),%xmm12 # 54d0 <_sk_callback_sse2+0xd9d>
+ .byte 102,68,15,111,37,102,30,0,0 // movdqa 0x1e66(%rip),%xmm12 # 5600 <_sk_callback_sse2+0xd97>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,111,30,0,0 // movdqa 0x1e6f(%rip),%xmm3 # 54e0 <_sk_callback_sse2+0xdad>
+ .byte 102,15,111,29,105,30,0,0 // movdqa 0x1e69(%rip),%xmm3 # 5610 <_sk_callback_sse2+0xda7>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -29647,17 +29975,17 @@ FUNCTION(_sk_store_f16_sse2)
_sk_store_f16_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 102,68,15,111,21,151,29,0,0 // movdqa 0x1d97(%rip),%xmm10 # 54f0 <_sk_callback_sse2+0xdbd>
+ .byte 102,68,15,111,21,145,29,0,0 // movdqa 0x1d91(%rip),%xmm10 # 5620 <_sk_callback_sse2+0xdb7>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,219,234 // pand %xmm10,%xmm13
.byte 102,69,15,239,229 // pxor %xmm13,%xmm12
- .byte 102,68,15,111,13,138,29,0,0 // movdqa 0x1d8a(%rip),%xmm9 # 5500 <_sk_callback_sse2+0xdcd>
+ .byte 102,68,15,111,13,132,29,0,0 // movdqa 0x1d84(%rip),%xmm9 # 5630 <_sk_callback_sse2+0xdc7>
.byte 102,65,15,114,213,16 // psrld $0x10,%xmm13
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,196 // pcmpgtd %xmm12,%xmm8
.byte 102,65,15,114,212,13 // psrld $0xd,%xmm12
- .byte 102,68,15,111,29,123,29,0,0 // movdqa 0x1d7b(%rip),%xmm11 # 5510 <_sk_callback_sse2+0xddd>
+ .byte 102,68,15,111,29,117,29,0,0 // movdqa 0x1d75(%rip),%xmm11 # 5640 <_sk_callback_sse2+0xdd7>
.byte 102,69,15,235,235 // por %xmm11,%xmm13
.byte 102,69,15,254,236 // paddd %xmm12,%xmm13
.byte 102,65,15,114,245,16 // pslld $0x10,%xmm13
@@ -29736,7 +30064,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,25,28,0,0 // movaps 0x1c19(%rip),%xmm8 # 5520 <_sk_callback_sse2+0xded>
+ .byte 68,15,40,5,19,28,0,0 // movaps 0x1c13(%rip),%xmm8 # 5650 <_sk_callback_sse2+0xde7>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -29789,7 +30117,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,192 // punpcklwd %xmm8,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,85,27,0,0 // movaps 0x1b55(%rip),%xmm9 # 5530 <_sk_callback_sse2+0xdfd>
+ .byte 68,15,40,13,79,27,0,0 // movaps 0x1b4f(%rip),%xmm9 # 5660 <_sk_callback_sse2+0xdf7>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -29806,7 +30134,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,28,27,0,0 // movaps 0x1b1c(%rip),%xmm3 # 5540 <_sk_callback_sse2+0xe0d>
+ .byte 15,40,29,22,27,0,0 // movaps 0x1b16(%rip),%xmm3 # 5670 <_sk_callback_sse2+0xe07>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_u16_be_sse2
@@ -29815,7 +30143,7 @@ FUNCTION(_sk_store_u16_be_sse2)
_sk_store_u16_be_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,13,29,27,0,0 // movaps 0x1b1d(%rip),%xmm9 # 5550 <_sk_callback_sse2+0xe1d>
+ .byte 68,15,40,13,23,27,0,0 // movaps 0x1b17(%rip),%xmm9 # 5680 <_sk_callback_sse2+0xe17>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -29961,7 +30289,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,29,25,0,0 // andps 0x191d(%rip),%xmm9 # 5560 <_sk_callback_sse2+0xe2d>
+ .byte 68,15,84,13,23,25,0,0 // andps 0x1917(%rip),%xmm9 # 5690 <_sk_callback_sse2+0xe27>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,92,194 // subps %xmm10,%xmm0
@@ -29981,7 +30309,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,239,24,0,0 // andps 0x18ef(%rip),%xmm9 # 5570 <_sk_callback_sse2+0xe3d>
+ .byte 68,15,84,13,233,24,0,0 // andps 0x18e9(%rip),%xmm9 # 56a0 <_sk_callback_sse2+0xe37>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,92,202 // subps %xmm10,%xmm1
@@ -30005,7 +30333,7 @@ _sk_mirror_x_sse2:
.byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11
.byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,175,24,0,0 // andps 0x18af(%rip),%xmm10 # 5580 <_sk_callback_sse2+0xe4d>
+ .byte 68,15,84,21,169,24,0,0 // andps 0x18a9(%rip),%xmm10 # 56b0 <_sk_callback_sse2+0xe47>
.byte 69,15,87,228 // xorps %xmm12,%xmm12
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,89,216 // mulps %xmm8,%xmm11
@@ -30033,7 +30361,7 @@ _sk_mirror_y_sse2:
.byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11
.byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,95,24,0,0 // andps 0x185f(%rip),%xmm10 # 5590 <_sk_callback_sse2+0xe5d>
+ .byte 68,15,84,21,89,24,0,0 // andps 0x1859(%rip),%xmm10 # 56c0 <_sk_callback_sse2+0xe57>
.byte 69,15,87,228 // xorps %xmm12,%xmm12
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,89,216 // mulps %xmm8,%xmm11
@@ -30050,10 +30378,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,65,24,0,0 // mulps 0x1841(%rip),%xmm0 # 55a0 <_sk_callback_sse2+0xe6d>
- .byte 15,89,13,74,24,0,0 // mulps 0x184a(%rip),%xmm1 # 55b0 <_sk_callback_sse2+0xe7d>
+ .byte 15,89,5,59,24,0,0 // mulps 0x183b(%rip),%xmm0 # 56d0 <_sk_callback_sse2+0xe67>
+ .byte 15,89,13,68,24,0,0 // mulps 0x1844(%rip),%xmm1 # 56e0 <_sk_callback_sse2+0xe77>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,80,24,0,0 // mulps 0x1850(%rip),%xmm3 # 55c0 <_sk_callback_sse2+0xe8d>
+ .byte 15,89,29,74,24,0,0 // mulps 0x184a(%rip),%xmm3 # 56f0 <_sk_callback_sse2+0xe87>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -30286,7 +30614,7 @@ _sk_gradient_sse2:
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
.byte 72,139,8 // mov (%rax),%rcx
.byte 72,133,201 // test %rcx,%rcx
- .byte 15,132,15,1,0,0 // je 4223 <_sk_gradient_sse2+0x149>
+ .byte 15,132,15,1,0,0 // je 4359 <_sk_gradient_sse2+0x149>
.byte 72,139,64,8 // mov 0x8(%rax),%rax
.byte 72,131,192,32 // add $0x20,%rax
.byte 69,15,87,192 // xorps %xmm8,%xmm8
@@ -30347,8 +30675,8 @@ _sk_gradient_sse2:
.byte 69,15,86,231 // orps %xmm15,%xmm12
.byte 72,131,192,36 // add $0x24,%rax
.byte 72,255,201 // dec %rcx
- .byte 15,133,8,255,255,255 // jne 4129 <_sk_gradient_sse2+0x4f>
- .byte 235,13 // jmp 4230 <_sk_gradient_sse2+0x156>
+ .byte 15,133,8,255,255,255 // jne 425f <_sk_gradient_sse2+0x4f>
+ .byte 235,13 // jmp 4366 <_sk_gradient_sse2+0x156>
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
@@ -30417,29 +30745,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,200,18,0,0 // movaps 0x12c8(%rip),%xmm13 # 55d0 <_sk_callback_sse2+0xe9d>
+ .byte 68,15,40,45,194,18,0,0 // movaps 0x12c2(%rip),%xmm13 # 5700 <_sk_callback_sse2+0xe97>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,204,18,0,0 // addps 0x12cc(%rip),%xmm13 # 55e0 <_sk_callback_sse2+0xead>
+ .byte 68,15,88,45,198,18,0,0 // addps 0x12c6(%rip),%xmm13 # 5710 <_sk_callback_sse2+0xea7>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,208,18,0,0 // addps 0x12d0(%rip),%xmm13 # 55f0 <_sk_callback_sse2+0xebd>
+ .byte 68,15,88,45,202,18,0,0 // addps 0x12ca(%rip),%xmm13 # 5720 <_sk_callback_sse2+0xeb7>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,212,18,0,0 // addps 0x12d4(%rip),%xmm13 # 5600 <_sk_callback_sse2+0xecd>
+ .byte 68,15,88,45,206,18,0,0 // addps 0x12ce(%rip),%xmm13 # 5730 <_sk_callback_sse2+0xec7>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,211,18,0,0 // movaps 0x12d3(%rip),%xmm10 # 5610 <_sk_callback_sse2+0xedd>
+ .byte 68,15,40,21,205,18,0,0 // movaps 0x12cd(%rip),%xmm10 # 5740 <_sk_callback_sse2+0xed7>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,198,18,0,0 // movaps 0x12c6(%rip),%xmm10 # 5620 <_sk_callback_sse2+0xeed>
+ .byte 68,15,40,21,192,18,0,0 // movaps 0x12c0(%rip),%xmm10 # 5750 <_sk_callback_sse2+0xee7>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,181,18,0,0 // movaps 0x12b5(%rip),%xmm10 # 5630 <_sk_callback_sse2+0xefd>
+ .byte 68,15,40,21,175,18,0,0 // movaps 0x12af(%rip),%xmm10 # 5760 <_sk_callback_sse2+0xef7>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -30467,7 +30795,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,132,18,0,0 // movaps 0x1284(%rip),%xmm8 # 5640 <_sk_callback_sse2+0xf0d>
+ .byte 68,15,40,5,126,18,0,0 // movaps 0x127e(%rip),%xmm8 # 5770 <_sk_callback_sse2+0xf07>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -30475,7 +30803,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,111,18,0,0 // movaps 0x126f(%rip),%xmm12 # 5650 <_sk_callback_sse2+0xf1d>
+ .byte 68,15,40,37,105,18,0,0 // movaps 0x1269(%rip),%xmm12 # 5780 <_sk_callback_sse2+0xf17>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -30522,8 +30850,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,232,17,0,0 // addps 0x11e8(%rip),%xmm0 # 5660 <_sk_callback_sse2+0xf2d>
- .byte 68,15,40,13,240,17,0,0 // movaps 0x11f0(%rip),%xmm9 # 5670 <_sk_callback_sse2+0xf3d>
+ .byte 15,88,5,226,17,0,0 // addps 0x11e2(%rip),%xmm0 # 5790 <_sk_callback_sse2+0xf27>
+ .byte 68,15,40,13,234,17,0,0 // movaps 0x11ea(%rip),%xmm9 # 57a0 <_sk_callback_sse2+0xf37>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30536,7 +30864,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,223,17,0,0 // addps 0x11df(%rip),%xmm0 # 5680 <_sk_callback_sse2+0xf4d>
+ .byte 15,88,5,217,17,0,0 // addps 0x11d9(%rip),%xmm0 # 57b0 <_sk_callback_sse2+0xf47>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30548,8 +30876,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,209,17,0,0 // addps 0x11d1(%rip),%xmm1 # 5690 <_sk_callback_sse2+0xf5d>
- .byte 68,15,40,13,217,17,0,0 // movaps 0x11d9(%rip),%xmm9 # 56a0 <_sk_callback_sse2+0xf6d>
+ .byte 15,88,13,203,17,0,0 // addps 0x11cb(%rip),%xmm1 # 57c0 <_sk_callback_sse2+0xf57>
+ .byte 68,15,40,13,211,17,0,0 // movaps 0x11d3(%rip),%xmm9 # 57d0 <_sk_callback_sse2+0xf67>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30562,7 +30890,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,199,17,0,0 // addps 0x11c7(%rip),%xmm1 # 56b0 <_sk_callback_sse2+0xf7d>
+ .byte 15,88,13,193,17,0,0 // addps 0x11c1(%rip),%xmm1 # 57e0 <_sk_callback_sse2+0xf77>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30574,13 +30902,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,186,17,0,0 // addps 0x11ba(%rip),%xmm0 # 56c0 <_sk_callback_sse2+0xf8d>
- .byte 68,15,40,13,194,17,0,0 // movaps 0x11c2(%rip),%xmm9 # 56d0 <_sk_callback_sse2+0xf9d>
+ .byte 15,88,5,180,17,0,0 // addps 0x11b4(%rip),%xmm0 # 57f0 <_sk_callback_sse2+0xf87>
+ .byte 68,15,40,13,188,17,0,0 // movaps 0x11bc(%rip),%xmm9 # 5800 <_sk_callback_sse2+0xf97>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,190,17,0,0 // mulps 0x11be(%rip),%xmm9 # 56e0 <_sk_callback_sse2+0xfad>
- .byte 68,15,88,13,198,17,0,0 // addps 0x11c6(%rip),%xmm9 # 56f0 <_sk_callback_sse2+0xfbd>
+ .byte 68,15,89,13,184,17,0,0 // mulps 0x11b8(%rip),%xmm9 # 5810 <_sk_callback_sse2+0xfa7>
+ .byte 68,15,88,13,192,17,0,0 // addps 0x11c0(%rip),%xmm9 # 5820 <_sk_callback_sse2+0xfb7>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30593,16 +30921,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,181,17,0,0 // addps 0x11b5(%rip),%xmm0 # 5700 <_sk_callback_sse2+0xfcd>
- .byte 68,15,40,13,189,17,0,0 // movaps 0x11bd(%rip),%xmm9 # 5710 <_sk_callback_sse2+0xfdd>
+ .byte 15,88,5,175,17,0,0 // addps 0x11af(%rip),%xmm0 # 5830 <_sk_callback_sse2+0xfc7>
+ .byte 68,15,40,13,183,17,0,0 // movaps 0x11b7(%rip),%xmm9 # 5840 <_sk_callback_sse2+0xfd7>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,193,17,0,0 // movaps 0x11c1(%rip),%xmm8 # 5720 <_sk_callback_sse2+0xfed>
+ .byte 68,15,40,5,187,17,0,0 // movaps 0x11bb(%rip),%xmm8 # 5850 <_sk_callback_sse2+0xfe7>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,197,17,0,0 // addps 0x11c5(%rip),%xmm8 # 5730 <_sk_callback_sse2+0xffd>
+ .byte 68,15,88,5,191,17,0,0 // addps 0x11bf(%rip),%xmm8 # 5860 <_sk_callback_sse2+0xff7>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,201,17,0,0 // addps 0x11c9(%rip),%xmm8 # 5740 <_sk_callback_sse2+0x100d>
+ .byte 68,15,88,5,195,17,0,0 // addps 0x11c3(%rip),%xmm8 # 5870 <_sk_callback_sse2+0x1007>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,205,17,0,0 // addps 0x11cd(%rip),%xmm8 # 5750 <_sk_callback_sse2+0x101d>
+ .byte 68,15,88,5,199,17,0,0 // addps 0x11c7(%rip),%xmm8 # 5880 <_sk_callback_sse2+0x1017>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30612,17 +30940,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,199,17,0,0 // movaps 0x11c7(%rip),%xmm8 # 5760 <_sk_callback_sse2+0x102d>
+ .byte 68,15,40,5,193,17,0,0 // movaps 0x11c1(%rip),%xmm8 # 5890 <_sk_callback_sse2+0x1027>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,195,17,0,0 // movaps 0x11c3(%rip),%xmm10 # 5770 <_sk_callback_sse2+0x103d>
+ .byte 68,15,40,21,189,17,0,0 // movaps 0x11bd(%rip),%xmm10 # 58a0 <_sk_callback_sse2+0x1037>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,199,17,0,0 // addps 0x11c7(%rip),%xmm10 # 5780 <_sk_callback_sse2+0x104d>
+ .byte 68,15,88,21,193,17,0,0 // addps 0x11c1(%rip),%xmm10 # 58b0 <_sk_callback_sse2+0x1047>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,195,17,0,0 // addps 0x11c3(%rip),%xmm10 # 5790 <_sk_callback_sse2+0x105d>
+ .byte 68,15,88,21,189,17,0,0 // addps 0x11bd(%rip),%xmm10 # 58c0 <_sk_callback_sse2+0x1057>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30634,11 +30962,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,182,17,0,0 // addps 0x11b6(%rip),%xmm0 # 57a0 <_sk_callback_sse2+0x106d>
+ .byte 15,88,5,176,17,0,0 // addps 0x11b0(%rip),%xmm0 # 58d0 <_sk_callback_sse2+0x1067>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,182,17,0,0 // mulps 0x11b6(%rip),%xmm8 # 57b0 <_sk_callback_sse2+0x107d>
- .byte 68,15,88,5,190,17,0,0 // addps 0x11be(%rip),%xmm8 # 57c0 <_sk_callback_sse2+0x108d>
+ .byte 68,15,89,5,176,17,0,0 // mulps 0x11b0(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0x1077>
+ .byte 68,15,88,5,184,17,0,0 // addps 0x11b8(%rip),%xmm8 # 58f0 <_sk_callback_sse2+0x1087>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30651,13 +30979,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,172,17,0,0 // addps 0x11ac(%rip),%xmm1 # 57d0 <_sk_callback_sse2+0x109d>
- .byte 68,15,40,13,180,17,0,0 // movaps 0x11b4(%rip),%xmm9 # 57e0 <_sk_callback_sse2+0x10ad>
+ .byte 15,88,13,166,17,0,0 // addps 0x11a6(%rip),%xmm1 # 5900 <_sk_callback_sse2+0x1097>
+ .byte 68,15,40,13,174,17,0,0 // movaps 0x11ae(%rip),%xmm9 # 5910 <_sk_callback_sse2+0x10a7>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,176,17,0,0 // mulps 0x11b0(%rip),%xmm9 # 57f0 <_sk_callback_sse2+0x10bd>
- .byte 68,15,88,13,184,17,0,0 // addps 0x11b8(%rip),%xmm9 # 5800 <_sk_callback_sse2+0x10cd>
+ .byte 68,15,89,13,170,17,0,0 // mulps 0x11aa(%rip),%xmm9 # 5920 <_sk_callback_sse2+0x10b7>
+ .byte 68,15,88,13,178,17,0,0 // addps 0x11b2(%rip),%xmm9 # 5930 <_sk_callback_sse2+0x10c7>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30670,16 +30998,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,166,17,0,0 // addps 0x11a6(%rip),%xmm1 # 5810 <_sk_callback_sse2+0x10dd>
- .byte 68,15,40,13,174,17,0,0 // movaps 0x11ae(%rip),%xmm9 # 5820 <_sk_callback_sse2+0x10ed>
+ .byte 15,88,13,160,17,0,0 // addps 0x11a0(%rip),%xmm1 # 5940 <_sk_callback_sse2+0x10d7>
+ .byte 68,15,40,13,168,17,0,0 // movaps 0x11a8(%rip),%xmm9 # 5950 <_sk_callback_sse2+0x10e7>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,178,17,0,0 // movaps 0x11b2(%rip),%xmm8 # 5830 <_sk_callback_sse2+0x10fd>
+ .byte 68,15,40,5,172,17,0,0 // movaps 0x11ac(%rip),%xmm8 # 5960 <_sk_callback_sse2+0x10f7>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,182,17,0,0 // addps 0x11b6(%rip),%xmm8 # 5840 <_sk_callback_sse2+0x110d>
+ .byte 68,15,88,5,176,17,0,0 // addps 0x11b0(%rip),%xmm8 # 5970 <_sk_callback_sse2+0x1107>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,186,17,0,0 // addps 0x11ba(%rip),%xmm8 # 5850 <_sk_callback_sse2+0x111d>
+ .byte 68,15,88,5,180,17,0,0 // addps 0x11b4(%rip),%xmm8 # 5980 <_sk_callback_sse2+0x1117>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,190,17,0,0 // addps 0x11be(%rip),%xmm8 # 5860 <_sk_callback_sse2+0x112d>
+ .byte 68,15,88,5,184,17,0,0 // addps 0x11b8(%rip),%xmm8 # 5990 <_sk_callback_sse2+0x1127>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30689,17 +31017,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,184,17,0,0 // movaps 0x11b8(%rip),%xmm8 # 5870 <_sk_callback_sse2+0x113d>
+ .byte 68,15,40,5,178,17,0,0 // movaps 0x11b2(%rip),%xmm8 # 59a0 <_sk_callback_sse2+0x1137>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,179,17,0,0 // movaps 0x11b3(%rip),%xmm10 # 5880 <_sk_callback_sse2+0x114d>
+ .byte 68,15,40,21,173,17,0,0 // movaps 0x11ad(%rip),%xmm10 # 59b0 <_sk_callback_sse2+0x1147>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,183,17,0,0 // addps 0x11b7(%rip),%xmm10 # 5890 <_sk_callback_sse2+0x115d>
+ .byte 68,15,88,21,177,17,0,0 // addps 0x11b1(%rip),%xmm10 # 59c0 <_sk_callback_sse2+0x1157>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,179,17,0,0 // addps 0x11b3(%rip),%xmm10 # 58a0 <_sk_callback_sse2+0x116d>
+ .byte 68,15,88,21,173,17,0,0 // addps 0x11ad(%rip),%xmm10 # 59d0 <_sk_callback_sse2+0x1167>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30711,11 +31039,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,165,17,0,0 // addps 0x11a5(%rip),%xmm1 # 58b0 <_sk_callback_sse2+0x117d>
+ .byte 15,88,13,159,17,0,0 // addps 0x119f(%rip),%xmm1 # 59e0 <_sk_callback_sse2+0x1177>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,165,17,0,0 // mulps 0x11a5(%rip),%xmm8 # 58c0 <_sk_callback_sse2+0x118d>
- .byte 68,15,88,5,173,17,0,0 // addps 0x11ad(%rip),%xmm8 # 58d0 <_sk_callback_sse2+0x119d>
+ .byte 68,15,89,5,159,17,0,0 // mulps 0x119f(%rip),%xmm8 # 59f0 <_sk_callback_sse2+0x1187>
+ .byte 68,15,88,5,167,17,0,0 // addps 0x11a7(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0x1197>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30934,17 +31262,12 @@ BALIGN16
.byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 49e8 <.literal16+0x1d8>
- .byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 49ec <.literal16+0x1dc>
- .byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 49f0 <.literal16+0x1e0>
+ .byte 224,64 // loopne 4b18 <.literal16+0x1d8>
.byte 0,0 // add %al,(%rax)
- .byte 128,63,0 // cmpb $0x0,(%rdi)
- .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
- .byte 63 // (bad)
+ .byte 224,64 // loopne 4b1c <.literal16+0x1dc>
.byte 0,0 // add %al,(%rax)
- .byte 128,63,154 // cmpb $0x9a,(%rdi)
+ .byte 224,64 // loopne 4b20 <.literal16+0x1e0>
+ .byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,154 // ds (bad)
@@ -30963,13 +31286,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a21 <.literal16+0x211>
+ .byte 71,225,61 // rex.RXB loope 4b41 <.literal16+0x201>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a25 <.literal16+0x215>
+ .byte 71,225,61 // rex.RXB loope 4b45 <.literal16+0x205>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a29 <.literal16+0x219>
+ .byte 71,225,61 // rex.RXB loope 4b49 <.literal16+0x209>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a2d <.literal16+0x21d>
+ .byte 71,225,61 // rex.RXB loope 4b4d <.literal16+0x20d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -30994,13 +31317,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a61 <.literal16+0x251>
+ .byte 71,225,61 // rex.RXB loope 4b81 <.literal16+0x241>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a65 <.literal16+0x255>
+ .byte 71,225,61 // rex.RXB loope 4b85 <.literal16+0x245>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a69 <.literal16+0x259>
+ .byte 71,225,61 // rex.RXB loope 4b89 <.literal16+0x249>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4a6d <.literal16+0x25d>
+ .byte 71,225,61 // rex.RXB loope 4b8d <.literal16+0x24d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -31025,13 +31348,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4aa1 <.literal16+0x291>
+ .byte 71,225,61 // rex.RXB loope 4bc1 <.literal16+0x281>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4aa5 <.literal16+0x295>
+ .byte 71,225,61 // rex.RXB loope 4bc5 <.literal16+0x285>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4aa9 <.literal16+0x299>
+ .byte 71,225,61 // rex.RXB loope 4bc9 <.literal16+0x289>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4aad <.literal16+0x29d>
+ .byte 71,225,61 // rex.RXB loope 4bcd <.literal16+0x28d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -31056,13 +31379,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4ae1 <.literal16+0x2d1>
+ .byte 71,225,61 // rex.RXB loope 4c01 <.literal16+0x2c1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4ae5 <.literal16+0x2d5>
+ .byte 71,225,61 // rex.RXB loope 4c05 <.literal16+0x2c5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4ae9 <.literal16+0x2d9>
+ .byte 71,225,61 // rex.RXB loope 4c09 <.literal16+0x2c9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 4aed <.literal16+0x2dd>
+ .byte 71,225,61 // rex.RXB loope 4c0d <.literal16+0x2cd>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -31079,7 +31402,12 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
.byte 63 // (bad)
- .byte 145 // xchg %eax,%ecx
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,0 // cmpb $0x0,(%rdi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
+ .byte 63 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,145 // cmpb $0x91,(%rdi)
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
@@ -31286,13 +31614,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4cb9 <.literal16+0x4a9>
+ .byte 224,7 // loopne 4de9 <.literal16+0x4a9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4cbd <.literal16+0x4ad>
+ .byte 224,7 // loopne 4ded <.literal16+0x4ad>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4cc1 <.literal16+0x4b1>
+ .byte 224,7 // loopne 4df1 <.literal16+0x4b1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 4cc5 <.literal16+0x4b5>
+ .byte 224,7 // loopne 4df5 <.literal16+0x4b5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -31357,11 +31685,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4d9b <.literal16+0x58b>
+ .byte 127,67 // jg 4ecb <.literal16+0x58b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4d9f <.literal16+0x58f>
+ .byte 127,67 // jg 4ecf <.literal16+0x58f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 4da3 <.literal16+0x593>
+ .byte 127,67 // jg 4ed3 <.literal16+0x593>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -31376,16 +31704,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4d94 <.literal16+0x584>
+ .byte 127,0 // jg 4ec4 <.literal16+0x584>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4d98 <.literal16+0x588>
+ .byte 127,0 // jg 4ec8 <.literal16+0x588>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4d9c <.literal16+0x58c>
+ .byte 127,0 // jg 4ecc <.literal16+0x58c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4da0 <.literal16+0x590>
+ .byte 127,0 // jg 4ed0 <.literal16+0x590>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -31394,7 +31722,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4e25 <.literal16+0x615>
+ .byte 119,115 // ja 4f55 <.literal16+0x615>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -31405,7 +31733,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 4d89 <.literal16+0x579>
+ .byte 117,191 // jne 4eb9 <.literal16+0x579>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -31417,7 +31745,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a38dca <_sk_callback_sse2+0xffffffffe9a34697>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a38efa <_sk_callback_sse2+0xffffffffe9a34691>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -31471,16 +31799,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4e64 <.literal16+0x654>
+ .byte 127,0 // jg 4f94 <.literal16+0x654>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4e68 <.literal16+0x658>
+ .byte 127,0 // jg 4f98 <.literal16+0x658>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4e6c <.literal16+0x65c>
+ .byte 127,0 // jg 4f9c <.literal16+0x65c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4e70 <.literal16+0x660>
+ .byte 127,0 // jg 4fa0 <.literal16+0x660>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -31489,7 +31817,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4ef5 <.literal16+0x6e5>
+ .byte 119,115 // ja 5025 <.literal16+0x6e5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -31500,7 +31828,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 4e59 <.literal16+0x649>
+ .byte 117,191 // jne 4f89 <.literal16+0x649>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -31512,7 +31840,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a38e9a <_sk_callback_sse2+0xffffffffe9a34767>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a38fca <_sk_callback_sse2+0xffffffffe9a34761>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -31566,16 +31894,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4f34 <.literal16+0x724>
+ .byte 127,0 // jg 5064 <.literal16+0x724>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4f38 <.literal16+0x728>
+ .byte 127,0 // jg 5068 <.literal16+0x728>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4f3c <.literal16+0x72c>
+ .byte 127,0 // jg 506c <.literal16+0x72c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 4f40 <.literal16+0x730>
+ .byte 127,0 // jg 5070 <.literal16+0x730>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -31584,7 +31912,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4fc5 <.literal16+0x7b5>
+ .byte 119,115 // ja 50f5 <.literal16+0x7b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -31595,7 +31923,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 4f29 <.literal16+0x719>
+ .byte 117,191 // jne 5059 <.literal16+0x719>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -31607,7 +31935,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a38f6a <_sk_callback_sse2+0xffffffffe9a34837>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3909a <_sk_callback_sse2+0xffffffffe9a34831>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -31661,16 +31989,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5004 <.literal16+0x7f4>
+ .byte 127,0 // jg 5134 <.literal16+0x7f4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5008 <.literal16+0x7f8>
+ .byte 127,0 // jg 5138 <.literal16+0x7f8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 500c <.literal16+0x7fc>
+ .byte 127,0 // jg 513c <.literal16+0x7fc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5010 <.literal16+0x800>
+ .byte 127,0 // jg 5140 <.literal16+0x800>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -31679,7 +32007,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5095 <.literal16+0x885>
+ .byte 119,115 // ja 51c5 <.literal16+0x885>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -31690,7 +32018,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 4ff9 <.literal16+0x7e9>
+ .byte 117,191 // jne 5129 <.literal16+0x7e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -31702,7 +32030,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3903a <_sk_callback_sse2+0xffffffffe9a34907>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3916a <_sk_callback_sse2+0xffffffffe9a34901>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -31752,13 +32080,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 5117 <.literal16+0x907>
+ .byte 127,67 // jg 5247 <.literal16+0x907>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 511b <.literal16+0x90b>
+ .byte 127,67 // jg 524b <.literal16+0x90b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 511f <.literal16+0x90f>
+ .byte 127,67 // jg 524f <.literal16+0x90f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5123 <.literal16+0x913>
+ .byte 127,67 // jg 5253 <.literal16+0x913>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -31805,16 +32133,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 51a3 <.literal16+0x993>
+ .byte 118,63 // jbe 52d3 <.literal16+0x993>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 51a7 <.literal16+0x997>
+ .byte 118,63 // jbe 52d7 <.literal16+0x997>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 51ab <.literal16+0x99b>
+ .byte 118,63 // jbe 52db <.literal16+0x99b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 51af <.literal16+0x99f>
+ .byte 118,63 // jbe 52df <.literal16+0x99f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -31826,11 +32154,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 51eb <.literal16+0x9db>
+ .byte 127,67 // jg 531b <.literal16+0x9db>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 51ef <.literal16+0x9df>
+ .byte 127,67 // jg 531f <.literal16+0x9df>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 51f3 <.literal16+0x9e3>
+ .byte 127,67 // jg 5323 <.literal16+0x9e3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,128,63 // addb $0x3f,-0x7fffffc5(%rax)
@@ -31870,13 +32198,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5239 <.literal16+0xa29>
+ .byte 224,7 // loopne 5369 <.literal16+0xa29>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 523d <.literal16+0xa2d>
+ .byte 224,7 // loopne 536d <.literal16+0xa2d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5241 <.literal16+0xa31>
+ .byte 224,7 // loopne 5371 <.literal16+0xa31>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5245 <.literal16+0xa35>
+ .byte 224,7 // loopne 5375 <.literal16+0xa35>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -31922,13 +32250,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 52a9 <.literal16+0xa99>
+ .byte 224,7 // loopne 53d9 <.literal16+0xa99>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 52ad <.literal16+0xa9d>
+ .byte 224,7 // loopne 53dd <.literal16+0xa9d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 52b1 <.literal16+0xaa1>
+ .byte 224,7 // loopne 53e1 <.literal16+0xaa1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 52b5 <.literal16+0xaa5>
+ .byte 224,7 // loopne 53e5 <.literal16+0xaa5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -31966,13 +32294,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 5346 <.literal16+0xb36>
+ .byte 124,66 // jl 5476 <.literal16+0xb36>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 534a <.literal16+0xb3a>
+ .byte 124,66 // jl 547a <.literal16+0xb3a>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 534e <.literal16+0xb3e>
+ .byte 124,66 // jl 547e <.literal16+0xb3e>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 5352 <.literal16+0xb42>
+ .byte 124,66 // jl 5482 <.literal16+0xb42>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -32062,13 +32390,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 5455 <.literal16+0xc45>
+ .byte 112,65 // jo 5585 <.literal16+0xc45>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 5459 <.literal16+0xc49>
+ .byte 112,65 // jo 5589 <.literal16+0xc49>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 545d <.literal16+0xc4d>
+ .byte 112,65 // jo 558d <.literal16+0xc4d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 5461 <.literal16+0xc51>
+ .byte 112,65 // jo 5591 <.literal16+0xc51>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -32090,11 +32418,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 54ab <.literal16+0xc9b>
+ .byte 127,67 // jg 55db <.literal16+0xc9b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 54af <.literal16+0xc9f>
+ .byte 127,67 // jg 55df <.literal16+0xc9f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 54b3 <.literal16+0xca3>
+ .byte 127,67 // jg 55e3 <.literal16+0xca3>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -32170,13 +32498,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 559b <.literal16+0xd8b>
+ .byte 127,71 // jg 56cb <.literal16+0xd8b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 559f <.literal16+0xd8f>
+ .byte 127,71 // jg 56cf <.literal16+0xd8f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 55a3 <.literal16+0xd93>
+ .byte 127,71 // jg 56d3 <.literal16+0xd93>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 55a7 <.literal16+0xd97>
+ .byte 127,71 // jg 56d7 <.literal16+0xd97>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -32329,11 +32657,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 5702 <.literal16+0xef2>
+ .byte 62,114,28 // jb,pt 5832 <.literal16+0xef2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5706 <.literal16+0xef6>
+ .byte 62,114,28 // jb,pt 5836 <.literal16+0xef6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 570a <.literal16+0xefa>
+ .byte 62,114,28 // jb,pt 583a <.literal16+0xefa>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -32377,7 +32705,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e595 <_sk_callback_sse2+0x3d639e62>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e6c5 <_sk_callback_sse2+0x3d639e5c>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -32403,7 +32731,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e5d5 <_sk_callback_sse2+0x3d639ea2>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e705 <_sk_callback_sse2+0x3d639e9c>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -32412,13 +32740,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 57ce <.literal16+0xfbe>
+ .byte 114,28 // jb 58fe <.literal16+0xfbe>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 57d2 <.literal16+0xfc2>
+ .byte 62,114,28 // jb,pt 5902 <.literal16+0xfc2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 57d6 <.literal16+0xfc6>
+ .byte 62,114,28 // jb,pt 5906 <.literal16+0xfc6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 57da <.literal16+0xfca>
+ .byte 62,114,28 // jb,pt 590a <.literal16+0xfca>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -32439,11 +32767,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 5812 <.literal16+0x1002>
+ .byte 62,114,28 // jb,pt 5942 <.literal16+0x1002>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 5816 <.literal16+0x1006>
+ .byte 62,114,28 // jb,pt 5946 <.literal16+0x1006>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 581a <.literal16+0x100a>
+ .byte 62,114,28 // jb,pt 594a <.literal16+0x100a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -32487,7 +32815,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e6a5 <_sk_callback_sse2+0x3d639f72>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e7d5 <_sk_callback_sse2+0x3d639f6c>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -32513,7 +32841,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e6e5 <_sk_callback_sse2+0x3d639fb2>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e815 <_sk_callback_sse2+0x3d639fac>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -32522,13 +32850,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 58de <.literal16+0x10ce>
+ .byte 114,28 // jb 5a0e <.literal16+0x10ce>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 58e2 <_sk_callback_sse2+0x11af>
+ .byte 62,114,28 // jb,pt 5a12 <_sk_callback_sse2+0x11a9>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 58e6 <_sk_callback_sse2+0x11b3>
+ .byte 62,114,28 // jb,pt 5a16 <_sk_callback_sse2+0x11ad>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 58ea <_sk_callback_sse2+0x11b7>
+ .byte 62,114,28 // jb,pt 5a1a <_sk_callback_sse2+0x11b1>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 8cfbc62fca..88904242da 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -106,14 +106,14 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,199 ; vmovd %edi,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,34,68,0,0 ; vbroadcastss 0x4422(%rip),%ymm1 # 457c <_sk_callback_hsw+0x11b>
+ DB 196,226,125,24,13,74,69,0,0 ; vbroadcastss 0x454a(%rip),%ymm1 # 46a4 <_sk_callback_hsw+0x11b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,2 ; vaddps (%rdx),%ymm0,%ymm0
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,6,68,0,0 ; vbroadcastss 0x4406(%rip),%ymm2 # 4580 <_sk_callback_hsw+0x11f>
+ DB 196,226,125,24,21,46,69,0,0 ; vbroadcastss 0x452e(%rip),%ymm2 # 46a8 <_sk_callback_hsw+0x11f>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -132,13 +132,13 @@ _sk_dither_hsw LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 196,66,125,88,8 ; vpbroadcastd (%r8),%ymm9
DB 196,65,61,239,201 ; vpxor %ymm9,%ymm8,%ymm9
- DB 196,98,125,88,21,197,67,0,0 ; vpbroadcastd 0x43c5(%rip),%ymm10 # 4584 <_sk_callback_hsw+0x123>
+ DB 196,98,125,88,21,237,68,0,0 ; vpbroadcastd 0x44ed(%rip),%ymm10 # 46ac <_sk_callback_hsw+0x123>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,170,67,0,0 ; vpbroadcastd 0x43aa(%rip),%ymm12 # 4588 <_sk_callback_hsw+0x127>
- DB 196,98,125,88,45,165,67,0,0 ; vpbroadcastd 0x43a5(%rip),%ymm13 # 458c <_sk_callback_hsw+0x12b>
+ DB 196,98,125,88,37,210,68,0,0 ; vpbroadcastd 0x44d2(%rip),%ymm12 # 46b0 <_sk_callback_hsw+0x127>
+ DB 196,98,125,88,45,205,68,0,0 ; vpbroadcastd 0x44cd(%rip),%ymm13 # 46b4 <_sk_callback_hsw+0x12b>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -153,8 +153,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,87,67,0,0 ; vbroadcastss 0x4357(%rip),%ymm9 # 4590 <_sk_callback_hsw+0x12f>
- DB 196,98,125,24,21,82,67,0,0 ; vbroadcastss 0x4352(%rip),%ymm10 # 4594 <_sk_callback_hsw+0x133>
+ DB 196,98,125,24,13,127,68,0,0 ; vbroadcastss 0x447f(%rip),%ymm9 # 46b8 <_sk_callback_hsw+0x12f>
+ DB 196,98,125,24,21,122,68,0,0 ; vbroadcastss 0x447a(%rip),%ymm10 # 46bc <_sk_callback_hsw+0x133>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,64,8 ; vbroadcastss 0x8(%rax),%ymm8
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
@@ -186,7 +186,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,248,66,0,0 ; vbroadcastss 0x42f8(%rip),%ymm8 # 4598 <_sk_callback_hsw+0x137>
+ DB 196,98,125,24,5,32,68,0,0 ; vbroadcastss 0x4420(%rip),%ymm8 # 46c0 <_sk_callback_hsw+0x137>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -200,7 +200,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,203,66,0,0 ; vbroadcastss 0x42cb(%rip),%ymm8 # 459c <_sk_callback_hsw+0x13b>
+ DB 196,98,125,24,5,243,67,0,0 ; vbroadcastss 0x43f3(%rip),%ymm8 # 46c4 <_sk_callback_hsw+0x13b>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -233,7 +233,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,114,66,0,0 ; vbroadcastss 0x4272(%rip),%ymm8 # 45a0 <_sk_callback_hsw+0x13f>
+ DB 196,98,125,24,5,154,67,0,0 ; vbroadcastss 0x439a(%rip),%ymm8 # 46c8 <_sk_callback_hsw+0x13f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -244,7 +244,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,85,66,0,0 ; vbroadcastss 0x4255(%rip),%ymm0 # 45a4 <_sk_callback_hsw+0x143>
+ DB 196,226,125,24,5,125,67,0,0 ; vbroadcastss 0x437d(%rip),%ymm0 # 46cc <_sk_callback_hsw+0x143>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -255,7 +255,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,56,66,0,0 ; vbroadcastss 0x4238(%rip),%ymm8 # 45a8 <_sk_callback_hsw+0x147>
+ DB 196,98,125,24,5,96,67,0,0 ; vbroadcastss 0x4360(%rip),%ymm8 # 46d0 <_sk_callback_hsw+0x147>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -266,7 +266,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,23,66,0,0 ; vbroadcastss 0x4217(%rip),%ymm8 # 45ac <_sk_callback_hsw+0x14b>
+ DB 196,98,125,24,5,63,67,0,0 ; vbroadcastss 0x433f(%rip),%ymm8 # 46d4 <_sk_callback_hsw+0x14b>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -286,7 +286,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,226,65,0,0 ; vbroadcastss 0x41e2(%rip),%ymm8 # 45b0 <_sk_callback_hsw+0x14f>
+ DB 196,98,125,24,5,10,67,0,0 ; vbroadcastss 0x430a(%rip),%ymm8 # 46d8 <_sk_callback_hsw+0x14f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -328,7 +328,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,93,65,0,0 ; vbroadcastss 0x415d(%rip),%ymm8 # 45b4 <_sk_callback_hsw+0x153>
+ DB 196,98,125,24,5,133,66,0,0 ; vbroadcastss 0x4285(%rip),%ymm8 # 46dc <_sk_callback_hsw+0x153>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -360,7 +360,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,229,64,0,0 ; vbroadcastss 0x40e5(%rip),%ymm8 # 45b8 <_sk_callback_hsw+0x157>
+ DB 196,98,125,24,5,13,66,0,0 ; vbroadcastss 0x420d(%rip),%ymm8 # 46e0 <_sk_callback_hsw+0x157>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -383,7 +383,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,148,64,0,0 ; vbroadcastss 0x4094(%rip),%ymm8 # 45bc <_sk_callback_hsw+0x15b>
+ DB 196,98,125,24,5,188,65,0,0 ; vbroadcastss 0x41bc(%rip),%ymm8 # 46e4 <_sk_callback_hsw+0x15b>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -409,7 +409,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,55,64,0,0 ; vbroadcastss 0x4037(%rip),%ymm8 # 45c0 <_sk_callback_hsw+0x15f>
+ DB 196,98,125,24,5,95,65,0,0 ; vbroadcastss 0x415f(%rip),%ymm8 # 46e8 <_sk_callback_hsw+0x15f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -429,7 +429,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,245,63,0,0 ; vbroadcastss 0x3ff5(%rip),%ymm8 # 45c4 <_sk_callback_hsw+0x163>
+ DB 196,98,125,24,5,29,65,0,0 ; vbroadcastss 0x411d(%rip),%ymm8 # 46ec <_sk_callback_hsw+0x163>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -437,7 +437,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,227,63,0,0 ; vbroadcastss 0x3fe3(%rip),%ymm8 # 45c8 <_sk_callback_hsw+0x167>
+ DB 196,98,125,24,5,11,65,0,0 ; vbroadcastss 0x410b(%rip),%ymm8 # 46f0 <_sk_callback_hsw+0x167>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -493,7 +493,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,238,62,0,0 ; vbroadcastss 0x3eee(%rip),%ymm9 # 45cc <_sk_callback_hsw+0x16b>
+ DB 196,98,125,24,13,22,64,0,0 ; vbroadcastss 0x4016(%rip),%ymm9 # 46f4 <_sk_callback_hsw+0x16b>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -544,7 +544,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,15,62,0,0 ; vbroadcastss 0x3e0f(%rip),%ymm8 # 45d0 <_sk_callback_hsw+0x16f>
+ DB 196,98,125,24,5,55,63,0,0 ; vbroadcastss 0x3f37(%rip),%ymm8 # 46f8 <_sk_callback_hsw+0x16f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -593,7 +593,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,71,61,0,0 ; vbroadcastss 0x3d47(%rip),%ymm8 # 45d4 <_sk_callback_hsw+0x173>
+ DB 196,98,125,24,5,111,62,0,0 ; vbroadcastss 0x3e6f(%rip),%ymm8 # 46fc <_sk_callback_hsw+0x173>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -653,10 +653,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,78,60,0,0 ; vbroadcastss 0x3c4e(%rip),%ymm11 # 45dc <_sk_callback_hsw+0x17b>
+ DB 196,98,125,24,29,118,61,0,0 ; vbroadcastss 0x3d76(%rip),%ymm11 # 4704 <_sk_callback_hsw+0x17b>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,63,60,0,0 ; vbroadcastss 0x3c3f(%rip),%ymm12 # 45e0 <_sk_callback_hsw+0x17f>
+ DB 196,98,125,24,37,103,61,0,0 ; vbroadcastss 0x3d67(%rip),%ymm12 # 4708 <_sk_callback_hsw+0x17f>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -666,7 +666,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,2,60,0,0 ; vbroadcastss 0x3c02(%rip),%ymm8 # 45d8 <_sk_callback_hsw+0x177>
+ DB 196,98,125,24,5,42,61,0,0 ; vbroadcastss 0x3d2a(%rip),%ymm8 # 4700 <_sk_callback_hsw+0x177>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -746,352 +746,403 @@ _sk_softlight_hsw LABEL PROC
PUBLIC _sk_hue_hsw
_sk_hue_hsw LABEL PROC
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 197,124,40,194 ; vmovaps %ymm2,%ymm8
+ DB 197,124,17,68,36,32 ; vmovups %ymm8,0x20(%rsp)
+ DB 197,252,17,12,36 ; vmovups %ymm1,(%rsp)
+ DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
+ DB 197,108,89,203 ; vmulps %ymm3,%ymm2,%ymm9
+ DB 197,116,89,211 ; vmulps %ymm3,%ymm1,%ymm10
+ DB 197,60,89,219 ; vmulps %ymm3,%ymm8,%ymm11
+ DB 197,84,95,198 ; vmaxps %ymm6,%ymm5,%ymm8
+ DB 196,65,92,95,192 ; vmaxps %ymm8,%ymm4,%ymm8
+ DB 197,84,93,230 ; vminps %ymm6,%ymm5,%ymm12
+ DB 196,65,92,93,228 ; vminps %ymm12,%ymm4,%ymm12
+ DB 196,65,60,92,196 ; vsubps %ymm12,%ymm8,%ymm8
+ DB 197,60,89,227 ; vmulps %ymm3,%ymm8,%ymm12
+ DB 196,65,44,93,195 ; vminps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,93,232 ; vminps %ymm8,%ymm9,%ymm13
+ DB 196,65,44,95,195 ; vmaxps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,95,192 ; vmaxps %ymm8,%ymm9,%ymm8
+ DB 196,65,60,92,245 ; vsubps %ymm13,%ymm8,%ymm14
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,100,194,208,0 ; vcmpeqps %ymm8,%ymm3,%ymm10
- DB 196,98,125,24,13,151,58,0,0 ; vbroadcastss 0x3a97(%rip),%ymm9 # 45e4 <_sk_callback_hsw+0x183>
- DB 197,52,94,219 ; vdivps %ymm3,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
- DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
- DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
- DB 197,84,95,214 ; vmaxps %ymm6,%ymm5,%ymm10
- DB 196,65,92,95,210 ; vmaxps %ymm10,%ymm4,%ymm10
- DB 197,84,93,222 ; vminps %ymm6,%ymm5,%ymm11
- DB 196,65,92,93,219 ; vminps %ymm11,%ymm4,%ymm11
- DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
- DB 197,116,93,218 ; vminps %ymm2,%ymm1,%ymm11
- DB 196,65,124,93,219 ; vminps %ymm11,%ymm0,%ymm11
- DB 197,116,95,226 ; vmaxps %ymm2,%ymm1,%ymm12
- DB 196,65,124,95,228 ; vmaxps %ymm12,%ymm0,%ymm12
- DB 196,65,28,92,227 ; vsubps %ymm11,%ymm12,%ymm12
- DB 196,65,28,194,232,0 ; vcmpeqps %ymm8,%ymm12,%ymm13
- DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
- DB 196,193,124,94,196 ; vdivps %ymm12,%ymm0,%ymm0
- DB 196,195,125,74,192,208 ; vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
- DB 196,193,116,94,204 ; vdivps %ymm12,%ymm1,%ymm1
- DB 196,195,117,74,200,208 ; vblendvps %ymm13,%ymm8,%ymm1,%ymm1
- DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
- DB 196,193,108,94,212 ; vdivps %ymm12,%ymm2,%ymm2
- DB 196,195,109,74,208,208 ; vblendvps %ymm13,%ymm8,%ymm2,%ymm2
- DB 196,98,125,24,21,12,58,0,0 ; vbroadcastss 0x3a0c(%rip),%ymm10 # 45e8 <_sk_callback_hsw+0x187>
- DB 196,98,125,24,29,7,58,0,0 ; vbroadcastss 0x3a07(%rip),%ymm11 # 45ec <_sk_callback_hsw+0x18b>
- DB 196,65,84,89,227 ; vmulps %ymm11,%ymm5,%ymm12
- DB 196,66,93,184,226 ; vfmadd231ps %ymm10,%ymm4,%ymm12
- DB 196,98,125,24,45,248,57,0,0 ; vbroadcastss 0x39f8(%rip),%ymm13 # 45f0 <_sk_callback_hsw+0x18f>
- DB 196,66,77,184,229 ; vfmadd231ps %ymm13,%ymm6,%ymm12
- DB 196,65,116,89,243 ; vmulps %ymm11,%ymm1,%ymm14
- DB 196,66,125,184,242 ; vfmadd231ps %ymm10,%ymm0,%ymm14
- DB 196,66,109,184,245 ; vfmadd231ps %ymm13,%ymm2,%ymm14
- DB 196,65,28,92,230 ; vsubps %ymm14,%ymm12,%ymm12
- DB 196,65,124,88,244 ; vaddps %ymm12,%ymm0,%ymm14
- DB 196,65,116,88,252 ; vaddps %ymm12,%ymm1,%ymm15
- DB 196,193,108,88,196 ; vaddps %ymm12,%ymm2,%ymm0
- DB 197,132,93,200 ; vminps %ymm0,%ymm15,%ymm1
- DB 197,140,93,209 ; vminps %ymm1,%ymm14,%ymm2
- DB 197,132,95,200 ; vmaxps %ymm0,%ymm15,%ymm1
- DB 197,12,95,225 ; vmaxps %ymm1,%ymm14,%ymm12
- DB 196,193,4,89,203 ; vmulps %ymm11,%ymm15,%ymm1
- DB 196,194,13,184,202 ; vfmadd231ps %ymm10,%ymm14,%ymm1
- DB 196,194,125,184,205 ; vfmadd231ps %ymm13,%ymm0,%ymm1
- DB 197,60,194,210,2 ; vcmpleps %ymm2,%ymm8,%ymm10
- DB 197,12,92,217 ; vsubps %ymm1,%ymm14,%ymm11
- DB 196,65,116,89,219 ; vmulps %ymm11,%ymm1,%ymm11
- DB 197,244,92,210 ; vsubps %ymm2,%ymm1,%ymm2
- DB 197,36,94,218 ; vdivps %ymm2,%ymm11,%ymm11
- DB 196,65,116,88,219 ; vaddps %ymm11,%ymm1,%ymm11
- DB 196,67,37,74,222,160 ; vblendvps %ymm10,%ymm14,%ymm11,%ymm11
- DB 196,65,52,194,236,1 ; vcmpltps %ymm12,%ymm9,%ymm13
- DB 197,36,92,241 ; vsubps %ymm1,%ymm11,%ymm14
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
+ DB 196,65,12,194,248,0 ; vcmpeqps %ymm8,%ymm14,%ymm15
+ DB 196,65,52,92,205 ; vsubps %ymm13,%ymm9,%ymm9
+ DB 196,65,28,89,201 ; vmulps %ymm9,%ymm12,%ymm9
+ DB 196,65,52,94,206 ; vdivps %ymm14,%ymm9,%ymm9
+ DB 196,67,53,74,200,240 ; vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ DB 196,65,44,92,213 ; vsubps %ymm13,%ymm10,%ymm10
+ DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
+ DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
+ DB 196,195,45,74,200,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm1
+ DB 196,65,36,92,213 ; vsubps %ymm13,%ymm11,%ymm10
+ DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
+ DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
+ DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
+ DB 196,98,125,24,53,41,59,0,0 ; vbroadcastss 0x3b29(%rip),%ymm14 # 470c <_sk_callback_hsw+0x183>
+ DB 196,98,125,24,61,36,59,0,0 ; vbroadcastss 0x3b24(%rip),%ymm15 # 4710 <_sk_callback_hsw+0x187>
+ DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
+ DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
+ DB 196,226,125,24,5,21,59,0,0 ; vbroadcastss 0x3b15(%rip),%ymm0 # 4714 <_sk_callback_hsw+0x18b>
+ DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
+ DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
+ DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
+ DB 196,98,29,184,208 ; vfmadd231ps %ymm0,%ymm12,%ymm10
+ DB 196,66,101,170,234 ; vfmsub213ps %ymm10,%ymm3,%ymm13
+ DB 196,65,52,88,213 ; vaddps %ymm13,%ymm9,%ymm10
+ DB 196,65,116,88,221 ; vaddps %ymm13,%ymm1,%ymm11
+ DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
+ DB 196,193,36,93,204 ; vminps %ymm12,%ymm11,%ymm1
+ DB 197,44,93,233 ; vminps %ymm1,%ymm10,%ymm13
+ DB 196,65,36,89,207 ; vmulps %ymm15,%ymm11,%ymm9
+ DB 196,66,45,184,206 ; vfmadd231ps %ymm14,%ymm10,%ymm9
+ DB 196,98,29,184,200 ; vfmadd231ps %ymm0,%ymm12,%ymm9
+ DB 196,193,44,92,193 ; vsubps %ymm9,%ymm10,%ymm0
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 196,193,52,92,205 ; vsubps %ymm13,%ymm9,%ymm1
+ DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
+ DB 196,65,36,92,241 ; vsubps %ymm9,%ymm11,%ymm14
DB 196,65,52,89,246 ; vmulps %ymm14,%ymm9,%ymm14
- DB 197,28,92,225 ; vsubps %ymm1,%ymm12,%ymm12
- DB 196,65,12,94,244 ; vdivps %ymm12,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,37,74,222,208 ; vblendvps %ymm13,%ymm14,%ymm11,%ymm11
- DB 196,65,36,95,216 ; vmaxps %ymm8,%ymm11,%ymm11
- DB 197,4,92,241 ; vsubps %ymm1,%ymm15,%ymm14
- DB 196,65,116,89,246 ; vmulps %ymm14,%ymm1,%ymm14
- DB 197,12,94,242 ; vdivps %ymm2,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,13,74,247,160 ; vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- DB 197,12,92,249 ; vsubps %ymm1,%ymm14,%ymm15
+ DB 197,12,94,241 ; vdivps %ymm1,%ymm14,%ymm14
+ DB 196,65,28,92,249 ; vsubps %ymm9,%ymm12,%ymm15
DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,252 ; vdivps %ymm12,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,13,74,247,208 ; vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- DB 196,65,12,95,240 ; vmaxps %ymm8,%ymm14,%ymm14
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 197,132,94,210 ; vdivps %ymm2,%ymm15,%ymm2
- DB 197,244,88,210 ; vaddps %ymm2,%ymm1,%ymm2
- DB 196,227,109,74,192,160 ; vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- DB 197,252,92,209 ; vsubps %ymm1,%ymm0,%ymm2
- DB 197,180,89,210 ; vmulps %ymm2,%ymm9,%ymm2
- DB 196,193,108,94,212 ; vdivps %ymm12,%ymm2,%ymm2
- DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,227,125,74,193,208 ; vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- DB 196,193,124,95,208 ; vmaxps %ymm8,%ymm0,%ymm2
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 196,226,69,172,216 ; vfnmadd213ps %ymm0,%ymm7,%ymm3
- DB 196,193,100,89,195 ; vmulps %ymm11,%ymm3,%ymm0
- DB 196,193,100,89,206 ; vmulps %ymm14,%ymm3,%ymm1
- DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,132,94,201 ; vdivps %ymm1,%ymm15,%ymm1
+ DB 196,65,60,194,237,2 ; vcmpleps %ymm13,%ymm8,%ymm13
+ DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
+ DB 196,67,13,74,243,208 ; vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ DB 196,65,36,95,220 ; vmaxps %ymm12,%ymm11,%ymm11
+ DB 197,180,88,201 ; vaddps %ymm1,%ymm9,%ymm1
+ DB 196,195,117,74,204,208 ; vblendvps %ymm13,%ymm12,%ymm1,%ymm1
+ DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
+ DB 196,195,125,74,194,208 ; vblendvps %ymm13,%ymm10,%ymm0,%ymm0
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,44,95,211 ; vmaxps %ymm11,%ymm10,%ymm10
+ DB 196,65,124,92,217 ; vsubps %ymm9,%ymm0,%ymm11
+ DB 196,65,28,92,233 ; vsubps %ymm9,%ymm12,%ymm13
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,28,194,250,1 ; vcmpltps %ymm10,%ymm12,%ymm15
+ DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
+ DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
+ DB 196,65,52,88,219 ; vaddps %ymm11,%ymm9,%ymm11
+ DB 196,195,125,74,195,240 ; vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ DB 196,65,12,92,217 ; vsubps %ymm9,%ymm14,%ymm11
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
+ DB 196,65,52,88,219 ; vaddps %ymm11,%ymm9,%ymm11
+ DB 196,67,13,74,219,240 ; vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ DB 196,65,116,92,241 ; vsubps %ymm9,%ymm1,%ymm14
+ DB 196,65,20,89,238 ; vmulps %ymm14,%ymm13,%ymm13
+ DB 196,65,20,94,210 ; vdivps %ymm10,%ymm13,%ymm10
+ DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
+ DB 196,195,117,74,201,240 ; vblendvps %ymm15,%ymm9,%ymm1,%ymm1
+ DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
+ DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
+ DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
+ DB 196,226,125,24,13,2,58,0,0 ; vbroadcastss 0x3a02(%rip),%ymm1 # 4718 <_sk_callback_hsw+0x18f>
+ DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
+ DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
+ DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
+ DB 196,226,37,184,212 ; vfmadd231ps %ymm4,%ymm11,%ymm2
+ DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
+ DB 197,172,89,12,36 ; vmulps (%rsp),%ymm10,%ymm1
+ DB 196,226,37,184,205 ; vfmadd231ps %ymm5,%ymm11,%ymm1
+ DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
+ DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
+ DB 196,98,77,168,218 ; vfmadd213ps %ymm2,%ymm6,%ymm11
+ DB 196,193,36,88,208 ; vaddps %ymm8,%ymm11,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_saturation_hsw
_sk_saturation_hsw LABEL PROC
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 197,124,40,194 ; vmovaps %ymm2,%ymm8
+ DB 197,252,17,12,36 ; vmovups %ymm1,(%rsp)
+ DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
+ DB 197,100,89,204 ; vmulps %ymm4,%ymm3,%ymm9
+ DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
+ DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
+ DB 197,124,41,192 ; vmovaps %ymm8,%ymm0
+ DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
+ DB 197,116,95,192 ; vmaxps %ymm0,%ymm1,%ymm8
+ DB 196,65,108,95,192 ; vmaxps %ymm8,%ymm2,%ymm8
+ DB 197,116,93,224 ; vminps %ymm0,%ymm1,%ymm12
+ DB 196,65,108,93,228 ; vminps %ymm12,%ymm2,%ymm12
+ DB 196,65,60,92,196 ; vsubps %ymm12,%ymm8,%ymm8
+ DB 197,60,89,231 ; vmulps %ymm7,%ymm8,%ymm12
+ DB 196,65,44,93,195 ; vminps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,93,232 ; vminps %ymm8,%ymm9,%ymm13
+ DB 196,65,44,95,195 ; vmaxps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,95,192 ; vmaxps %ymm8,%ymm9,%ymm8
+ DB 196,65,60,92,245 ; vsubps %ymm13,%ymm8,%ymm14
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,68,194,208,0 ; vcmpeqps %ymm8,%ymm7,%ymm10
- DB 196,98,125,24,13,208,56,0,0 ; vbroadcastss 0x38d0(%rip),%ymm9 # 45f4 <_sk_callback_hsw+0x193>
- DB 197,52,94,223 ; vdivps %ymm7,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,44,89,220 ; vmulps %ymm4,%ymm10,%ymm11
- DB 197,44,89,229 ; vmulps %ymm5,%ymm10,%ymm12
- DB 197,44,89,214 ; vmulps %ymm6,%ymm10,%ymm10
- DB 197,116,95,234 ; vmaxps %ymm2,%ymm1,%ymm13
- DB 196,65,124,95,237 ; vmaxps %ymm13,%ymm0,%ymm13
- DB 197,244,93,202 ; vminps %ymm2,%ymm1,%ymm1
- DB 197,252,93,193 ; vminps %ymm1,%ymm0,%ymm0
- DB 197,148,92,192 ; vsubps %ymm0,%ymm13,%ymm0
- DB 196,193,28,93,202 ; vminps %ymm10,%ymm12,%ymm1
- DB 197,164,93,201 ; vminps %ymm1,%ymm11,%ymm1
- DB 196,193,28,95,210 ; vmaxps %ymm10,%ymm12,%ymm2
- DB 197,164,95,210 ; vmaxps %ymm2,%ymm11,%ymm2
- DB 197,236,92,209 ; vsubps %ymm1,%ymm2,%ymm2
- DB 196,65,108,194,232,0 ; vcmpeqps %ymm8,%ymm2,%ymm13
- DB 197,36,92,217 ; vsubps %ymm1,%ymm11,%ymm11
- DB 196,65,124,89,219 ; vmulps %ymm11,%ymm0,%ymm11
- DB 197,36,94,218 ; vdivps %ymm2,%ymm11,%ymm11
- DB 196,67,37,74,216,208 ; vblendvps %ymm13,%ymm8,%ymm11,%ymm11
- DB 197,28,92,225 ; vsubps %ymm1,%ymm12,%ymm12
- DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
- DB 197,28,94,226 ; vdivps %ymm2,%ymm12,%ymm12
- DB 196,67,29,74,224,208 ; vblendvps %ymm13,%ymm8,%ymm12,%ymm12
- DB 197,172,92,201 ; vsubps %ymm1,%ymm10,%ymm1
- DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 197,252,94,194 ; vdivps %ymm2,%ymm0,%ymm0
- DB 196,195,125,74,192,208 ; vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- DB 196,226,125,24,21,76,56,0,0 ; vbroadcastss 0x384c(%rip),%ymm2 # 45f8 <_sk_callback_hsw+0x197>
- DB 196,226,125,24,13,71,56,0,0 ; vbroadcastss 0x3847(%rip),%ymm1 # 45fc <_sk_callback_hsw+0x19b>
- DB 197,84,89,209 ; vmulps %ymm1,%ymm5,%ymm10
- DB 196,98,93,184,210 ; vfmadd231ps %ymm2,%ymm4,%ymm10
- DB 196,98,125,24,45,57,56,0,0 ; vbroadcastss 0x3839(%rip),%ymm13 # 4600 <_sk_callback_hsw+0x19f>
- DB 196,66,77,184,213 ; vfmadd231ps %ymm13,%ymm6,%ymm10
- DB 197,28,89,241 ; vmulps %ymm1,%ymm12,%ymm14
- DB 196,98,37,184,242 ; vfmadd231ps %ymm2,%ymm11,%ymm14
- DB 196,66,125,184,245 ; vfmadd231ps %ymm13,%ymm0,%ymm14
- DB 196,65,44,92,214 ; vsubps %ymm14,%ymm10,%ymm10
- DB 196,65,36,88,218 ; vaddps %ymm10,%ymm11,%ymm11
- DB 196,65,28,88,226 ; vaddps %ymm10,%ymm12,%ymm12
- DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 197,28,93,208 ; vminps %ymm0,%ymm12,%ymm10
- DB 196,65,36,93,210 ; vminps %ymm10,%ymm11,%ymm10
- DB 197,28,95,240 ; vmaxps %ymm0,%ymm12,%ymm14
- DB 196,65,36,95,246 ; vmaxps %ymm14,%ymm11,%ymm14
- DB 197,156,89,201 ; vmulps %ymm1,%ymm12,%ymm1
- DB 196,226,37,184,202 ; vfmadd231ps %ymm2,%ymm11,%ymm1
- DB 196,194,125,184,205 ; vfmadd231ps %ymm13,%ymm0,%ymm1
- DB 196,193,60,194,210,2 ; vcmpleps %ymm10,%ymm8,%ymm2
- DB 197,36,92,233 ; vsubps %ymm1,%ymm11,%ymm13
- DB 196,65,116,89,237 ; vmulps %ymm13,%ymm1,%ymm13
- DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,65,20,94,234 ; vdivps %ymm10,%ymm13,%ymm13
- DB 196,65,116,88,237 ; vaddps %ymm13,%ymm1,%ymm13
- DB 196,67,21,74,219,32 ; vblendvps %ymm2,%ymm11,%ymm13,%ymm11
- DB 196,65,52,194,238,1 ; vcmpltps %ymm14,%ymm9,%ymm13
- DB 197,36,92,249 ; vsubps %ymm1,%ymm11,%ymm15
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 197,12,92,241 ; vsubps %ymm1,%ymm14,%ymm14
- DB 196,65,4,94,254 ; vdivps %ymm14,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,37,74,223,208 ; vblendvps %ymm13,%ymm15,%ymm11,%ymm11
- DB 196,65,36,95,216 ; vmaxps %ymm8,%ymm11,%ymm11
- DB 197,28,92,249 ; vsubps %ymm1,%ymm12,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 196,65,4,94,250 ; vdivps %ymm10,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,5,74,228,32 ; vblendvps %ymm2,%ymm12,%ymm15,%ymm12
- DB 197,28,92,249 ; vsubps %ymm1,%ymm12,%ymm15
+ DB 196,65,12,194,248,0 ; vcmpeqps %ymm8,%ymm14,%ymm15
+ DB 196,65,52,92,205 ; vsubps %ymm13,%ymm9,%ymm9
+ DB 196,65,28,89,201 ; vmulps %ymm9,%ymm12,%ymm9
+ DB 196,65,52,94,206 ; vdivps %ymm14,%ymm9,%ymm9
+ DB 196,67,53,74,200,240 ; vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ DB 196,65,44,92,213 ; vsubps %ymm13,%ymm10,%ymm10
+ DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
+ DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
+ DB 196,195,45,74,200,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm1
+ DB 196,65,36,92,213 ; vsubps %ymm13,%ymm11,%ymm10
+ DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
+ DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
+ DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
+ DB 196,98,125,24,53,19,57,0,0 ; vbroadcastss 0x3913(%rip),%ymm14 # 471c <_sk_callback_hsw+0x193>
+ DB 196,98,125,24,61,14,57,0,0 ; vbroadcastss 0x390e(%rip),%ymm15 # 4720 <_sk_callback_hsw+0x197>
+ DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
+ DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
+ DB 196,226,125,24,5,255,56,0,0 ; vbroadcastss 0x38ff(%rip),%ymm0 # 4724 <_sk_callback_hsw+0x19b>
+ DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
+ DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
+ DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
+ DB 196,98,29,184,208 ; vfmadd231ps %ymm0,%ymm12,%ymm10
+ DB 196,66,101,170,234 ; vfmsub213ps %ymm10,%ymm3,%ymm13
+ DB 196,65,52,88,213 ; vaddps %ymm13,%ymm9,%ymm10
+ DB 196,65,116,88,221 ; vaddps %ymm13,%ymm1,%ymm11
+ DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
+ DB 196,193,36,93,204 ; vminps %ymm12,%ymm11,%ymm1
+ DB 197,44,93,233 ; vminps %ymm1,%ymm10,%ymm13
+ DB 196,65,36,89,207 ; vmulps %ymm15,%ymm11,%ymm9
+ DB 196,66,45,184,206 ; vfmadd231ps %ymm14,%ymm10,%ymm9
+ DB 196,98,29,184,200 ; vfmadd231ps %ymm0,%ymm12,%ymm9
+ DB 196,193,44,92,193 ; vsubps %ymm9,%ymm10,%ymm0
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 196,193,52,92,205 ; vsubps %ymm13,%ymm9,%ymm1
+ DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
+ DB 196,65,36,92,241 ; vsubps %ymm9,%ymm11,%ymm14
+ DB 196,65,52,89,246 ; vmulps %ymm14,%ymm9,%ymm14
+ DB 197,12,94,241 ; vdivps %ymm1,%ymm14,%ymm14
+ DB 196,65,28,92,249 ; vsubps %ymm9,%ymm12,%ymm15
DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,254 ; vdivps %ymm14,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,29,74,231,208 ; vblendvps %ymm13,%ymm15,%ymm12,%ymm12
- DB 196,65,28,95,224 ; vmaxps %ymm8,%ymm12,%ymm12
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 196,65,4,94,210 ; vdivps %ymm10,%ymm15,%ymm10
- DB 196,65,116,88,210 ; vaddps %ymm10,%ymm1,%ymm10
- DB 196,227,45,74,192,32 ; vblendvps %ymm2,%ymm0,%ymm10,%ymm0
- DB 197,252,92,209 ; vsubps %ymm1,%ymm0,%ymm2
- DB 197,180,89,210 ; vmulps %ymm2,%ymm9,%ymm2
- DB 196,193,108,94,214 ; vdivps %ymm14,%ymm2,%ymm2
- DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,227,125,74,193,208 ; vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- DB 196,193,124,95,208 ; vmaxps %ymm8,%ymm0,%ymm2
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 196,226,69,172,216 ; vfnmadd213ps %ymm0,%ymm7,%ymm3
- DB 196,193,100,89,195 ; vmulps %ymm11,%ymm3,%ymm0
- DB 196,193,100,89,204 ; vmulps %ymm12,%ymm3,%ymm1
- DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,132,94,201 ; vdivps %ymm1,%ymm15,%ymm1
+ DB 196,65,60,194,237,2 ; vcmpleps %ymm13,%ymm8,%ymm13
+ DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
+ DB 196,67,13,74,243,208 ; vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ DB 196,65,36,95,220 ; vmaxps %ymm12,%ymm11,%ymm11
+ DB 197,180,88,201 ; vaddps %ymm1,%ymm9,%ymm1
+ DB 196,195,117,74,204,208 ; vblendvps %ymm13,%ymm12,%ymm1,%ymm1
+ DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
+ DB 196,195,125,74,194,208 ; vblendvps %ymm13,%ymm10,%ymm0,%ymm0
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,44,95,211 ; vmaxps %ymm11,%ymm10,%ymm10
+ DB 196,65,124,92,217 ; vsubps %ymm9,%ymm0,%ymm11
+ DB 196,65,28,92,233 ; vsubps %ymm9,%ymm12,%ymm13
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,28,194,250,1 ; vcmpltps %ymm10,%ymm12,%ymm15
+ DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
+ DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
+ DB 196,65,52,88,219 ; vaddps %ymm11,%ymm9,%ymm11
+ DB 196,195,125,74,195,240 ; vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ DB 196,65,12,92,217 ; vsubps %ymm9,%ymm14,%ymm11
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
+ DB 196,65,52,88,219 ; vaddps %ymm11,%ymm9,%ymm11
+ DB 196,67,13,74,219,240 ; vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ DB 196,65,116,92,241 ; vsubps %ymm9,%ymm1,%ymm14
+ DB 196,65,20,89,238 ; vmulps %ymm14,%ymm13,%ymm13
+ DB 196,65,20,94,210 ; vdivps %ymm10,%ymm13,%ymm10
+ DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
+ DB 196,195,117,74,201,240 ; vblendvps %ymm15,%ymm9,%ymm1,%ymm1
+ DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
+ DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
+ DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
+ DB 196,226,125,24,13,236,55,0,0 ; vbroadcastss 0x37ec(%rip),%ymm1 # 4728 <_sk_callback_hsw+0x19f>
+ DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
+ DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
+ DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
+ DB 196,226,37,184,212 ; vfmadd231ps %ymm4,%ymm11,%ymm2
+ DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
+ DB 197,172,89,12,36 ; vmulps (%rsp),%ymm10,%ymm1
+ DB 196,226,37,184,205 ; vfmadd231ps %ymm5,%ymm11,%ymm1
+ DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
+ DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
+ DB 196,98,77,168,218 ; vfmadd213ps %ymm2,%ymm6,%ymm11
+ DB 196,193,36,88,208 ; vaddps %ymm8,%ymm11,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_color_hsw
_sk_color_hsw LABEL PROC
- DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,100,194,208,0 ; vcmpeqps %ymm8,%ymm3,%ymm10
- DB 196,98,125,24,13,11,55,0,0 ; vbroadcastss 0x370b(%rip),%ymm9 # 4604 <_sk_callback_hsw+0x1a3>
- DB 197,52,94,219 ; vdivps %ymm3,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
- DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 197,124,40,202 ; vmovaps %ymm2,%ymm9
+ DB 197,124,17,76,36,32 ; vmovups %ymm9,0x20(%rsp)
+ DB 197,252,17,12,36 ; vmovups %ymm1,(%rsp)
+ DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
+ DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
+ DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
+ DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
+ DB 196,98,125,24,45,127,55,0,0 ; vbroadcastss 0x377f(%rip),%ymm13 # 472c <_sk_callback_hsw+0x1a3>
+ DB 196,98,125,24,53,122,55,0,0 ; vbroadcastss 0x377a(%rip),%ymm14 # 4730 <_sk_callback_hsw+0x1a7>
+ DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
+ DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
+ DB 196,98,125,24,61,107,55,0,0 ; vbroadcastss 0x376b(%rip),%ymm15 # 4734 <_sk_callback_hsw+0x1ab>
+ DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
+ DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
+ DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
+ DB 196,66,37,184,207 ; vfmadd231ps %ymm15,%ymm11,%ymm9
+ DB 196,66,101,170,225 ; vfmsub213ps %ymm9,%ymm3,%ymm12
+ DB 196,65,60,88,204 ; vaddps %ymm12,%ymm8,%ymm9
+ DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
+ DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
+ DB 196,65,44,93,195 ; vminps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,93,224 ; vminps %ymm8,%ymm9,%ymm12
+ DB 196,65,44,89,198 ; vmulps %ymm14,%ymm10,%ymm8
+ DB 196,66,53,184,197 ; vfmadd231ps %ymm13,%ymm9,%ymm8
+ DB 196,66,37,184,199 ; vfmadd231ps %ymm15,%ymm11,%ymm8
+ DB 196,65,52,92,232 ; vsubps %ymm8,%ymm9,%ymm13
+ DB 196,65,60,89,237 ; vmulps %ymm13,%ymm8,%ymm13
+ DB 196,65,60,92,244 ; vsubps %ymm12,%ymm8,%ymm14
+ DB 196,193,20,94,198 ; vdivps %ymm14,%ymm13,%ymm0
+ DB 196,65,44,92,248 ; vsubps %ymm8,%ymm10,%ymm15
+ DB 196,65,60,89,255 ; vmulps %ymm15,%ymm8,%ymm15
+ DB 196,65,4,94,254 ; vdivps %ymm14,%ymm15,%ymm15
+ DB 196,65,36,92,232 ; vsubps %ymm8,%ymm11,%ymm13
+ DB 196,65,60,89,237 ; vmulps %ymm13,%ymm8,%ymm13
+ DB 196,65,20,94,238 ; vdivps %ymm14,%ymm13,%ymm13
+ DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
+ DB 196,65,12,194,228,2 ; vcmpleps %ymm12,%ymm14,%ymm12
+ DB 196,65,60,88,255 ; vaddps %ymm15,%ymm8,%ymm15
+ DB 196,67,5,74,250,192 ; vblendvps %ymm12,%ymm10,%ymm15,%ymm15
+ DB 196,65,44,95,211 ; vmaxps %ymm11,%ymm10,%ymm10
+ DB 196,65,60,88,237 ; vaddps %ymm13,%ymm8,%ymm13
+ DB 196,67,21,74,219,192 ; vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
+ DB 196,195,125,74,201,192 ; vblendvps %ymm12,%ymm9,%ymm0,%ymm1
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,52,95,202 ; vmaxps %ymm10,%ymm9,%ymm9
+ DB 196,65,116,92,208 ; vsubps %ymm8,%ymm1,%ymm10
+ DB 196,65,28,92,232 ; vsubps %ymm8,%ymm12,%ymm13
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,193,28,194,193,1 ; vcmpltps %ymm9,%ymm12,%ymm0
+ DB 196,65,52,92,200 ; vsubps %ymm8,%ymm9,%ymm9
+ DB 196,65,44,94,209 ; vdivps %ymm9,%ymm10,%ymm10
+ DB 196,65,60,88,210 ; vaddps %ymm10,%ymm8,%ymm10
+ DB 196,195,117,74,202,0 ; vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ DB 196,65,4,92,208 ; vsubps %ymm8,%ymm15,%ymm10
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,65,44,94,209 ; vdivps %ymm9,%ymm10,%ymm10
+ DB 196,65,60,88,210 ; vaddps %ymm10,%ymm8,%ymm10
+ DB 196,67,5,74,210,0 ; vblendvps %ymm0,%ymm10,%ymm15,%ymm10
+ DB 196,65,36,92,248 ; vsubps %ymm8,%ymm11,%ymm15
+ DB 196,65,20,89,239 ; vmulps %ymm15,%ymm13,%ymm13
+ DB 196,65,20,94,201 ; vdivps %ymm9,%ymm13,%ymm9
+ DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
+ DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
+ DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
+ DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
+ DB 196,226,125,24,5,77,54,0,0 ; vbroadcastss 0x364d(%rip),%ymm0 # 4738 <_sk_callback_hsw+0x1af>
+ DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
- DB 196,98,125,24,21,240,54,0,0 ; vbroadcastss 0x36f0(%rip),%ymm10 # 4608 <_sk_callback_hsw+0x1a7>
- DB 196,98,125,24,29,235,54,0,0 ; vbroadcastss 0x36eb(%rip),%ymm11 # 460c <_sk_callback_hsw+0x1ab>
- DB 196,65,84,89,227 ; vmulps %ymm11,%ymm5,%ymm12
- DB 196,66,93,184,226 ; vfmadd231ps %ymm10,%ymm4,%ymm12
- DB 196,98,125,24,45,220,54,0,0 ; vbroadcastss 0x36dc(%rip),%ymm13 # 4610 <_sk_callback_hsw+0x1af>
- DB 196,66,77,184,229 ; vfmadd231ps %ymm13,%ymm6,%ymm12
- DB 196,65,116,89,243 ; vmulps %ymm11,%ymm1,%ymm14
- DB 196,66,125,184,242 ; vfmadd231ps %ymm10,%ymm0,%ymm14
- DB 196,66,109,184,245 ; vfmadd231ps %ymm13,%ymm2,%ymm14
- DB 196,65,28,92,230 ; vsubps %ymm14,%ymm12,%ymm12
- DB 196,65,124,88,244 ; vaddps %ymm12,%ymm0,%ymm14
- DB 196,65,116,88,252 ; vaddps %ymm12,%ymm1,%ymm15
- DB 196,193,108,88,196 ; vaddps %ymm12,%ymm2,%ymm0
- DB 197,132,93,200 ; vminps %ymm0,%ymm15,%ymm1
- DB 197,140,93,209 ; vminps %ymm1,%ymm14,%ymm2
- DB 197,132,95,200 ; vmaxps %ymm0,%ymm15,%ymm1
- DB 197,12,95,225 ; vmaxps %ymm1,%ymm14,%ymm12
- DB 196,193,4,89,203 ; vmulps %ymm11,%ymm15,%ymm1
- DB 196,194,13,184,202 ; vfmadd231ps %ymm10,%ymm14,%ymm1
- DB 196,194,125,184,205 ; vfmadd231ps %ymm13,%ymm0,%ymm1
- DB 197,60,194,210,2 ; vcmpleps %ymm2,%ymm8,%ymm10
- DB 197,12,92,217 ; vsubps %ymm1,%ymm14,%ymm11
- DB 196,65,116,89,219 ; vmulps %ymm11,%ymm1,%ymm11
- DB 197,244,92,210 ; vsubps %ymm2,%ymm1,%ymm2
- DB 197,36,94,218 ; vdivps %ymm2,%ymm11,%ymm11
- DB 196,65,116,88,219 ; vaddps %ymm11,%ymm1,%ymm11
- DB 196,67,37,74,222,160 ; vblendvps %ymm10,%ymm14,%ymm11,%ymm11
- DB 196,65,52,194,236,1 ; vcmpltps %ymm12,%ymm9,%ymm13
- DB 197,36,92,241 ; vsubps %ymm1,%ymm11,%ymm14
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
- DB 196,65,52,89,246 ; vmulps %ymm14,%ymm9,%ymm14
- DB 197,28,92,225 ; vsubps %ymm1,%ymm12,%ymm12
- DB 196,65,12,94,244 ; vdivps %ymm12,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,37,74,222,208 ; vblendvps %ymm13,%ymm14,%ymm11,%ymm11
- DB 196,65,36,95,216 ; vmaxps %ymm8,%ymm11,%ymm11
- DB 197,4,92,241 ; vsubps %ymm1,%ymm15,%ymm14
- DB 196,65,116,89,246 ; vmulps %ymm14,%ymm1,%ymm14
- DB 197,12,94,242 ; vdivps %ymm2,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,13,74,247,160 ; vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- DB 197,12,92,249 ; vsubps %ymm1,%ymm14,%ymm15
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,252 ; vdivps %ymm12,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,13,74,247,208 ; vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- DB 196,65,12,95,240 ; vmaxps %ymm8,%ymm14,%ymm14
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 197,132,94,210 ; vdivps %ymm2,%ymm15,%ymm2
- DB 197,244,88,210 ; vaddps %ymm2,%ymm1,%ymm2
- DB 196,227,109,74,192,160 ; vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- DB 197,252,92,209 ; vsubps %ymm1,%ymm0,%ymm2
- DB 197,180,89,210 ; vmulps %ymm2,%ymm9,%ymm2
- DB 196,193,108,94,212 ; vdivps %ymm12,%ymm2,%ymm2
- DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,227,125,74,193,208 ; vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- DB 196,193,124,95,208 ; vmaxps %ymm8,%ymm0,%ymm2
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 196,226,69,172,216 ; vfnmadd213ps %ymm0,%ymm7,%ymm3
- DB 196,193,100,89,195 ; vmulps %ymm11,%ymm3,%ymm0
- DB 196,193,100,89,206 ; vmulps %ymm14,%ymm3,%ymm1
- DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
+ DB 196,226,37,184,212 ; vfmadd231ps %ymm4,%ymm11,%ymm2
+ DB 197,236,88,193 ; vaddps %ymm1,%ymm2,%ymm0
+ DB 197,172,89,12,36 ; vmulps (%rsp),%ymm10,%ymm1
+ DB 196,226,37,184,205 ; vfmadd231ps %ymm5,%ymm11,%ymm1
+ DB 196,193,116,88,200 ; vaddps %ymm8,%ymm1,%ymm1
+ DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
+ DB 196,98,77,168,218 ; vfmadd213ps %ymm2,%ymm6,%ymm11
+ DB 196,193,36,88,209 ; vaddps %ymm9,%ymm11,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_luminosity_hsw
_sk_luminosity_hsw LABEL PROC
- DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,68,194,208,0 ; vcmpeqps %ymm8,%ymm7,%ymm10
- DB 196,98,125,24,13,180,53,0,0 ; vbroadcastss 0x35b4(%rip),%ymm9 # 4614 <_sk_callback_hsw+0x1b3>
- DB 197,52,94,223 ; vdivps %ymm7,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,44,89,220 ; vmulps %ymm4,%ymm10,%ymm11
- DB 197,44,89,229 ; vmulps %ymm5,%ymm10,%ymm12
- DB 197,44,89,214 ; vmulps %ymm6,%ymm10,%ymm10
- DB 196,98,125,24,45,153,53,0,0 ; vbroadcastss 0x3599(%rip),%ymm13 # 4618 <_sk_callback_hsw+0x1b7>
- DB 196,98,125,24,53,148,53,0,0 ; vbroadcastss 0x3594(%rip),%ymm14 # 461c <_sk_callback_hsw+0x1bb>
- DB 196,193,116,89,206 ; vmulps %ymm14,%ymm1,%ymm1
- DB 196,226,21,168,193 ; vfmadd213ps %ymm1,%ymm13,%ymm0
- DB 196,98,125,24,61,133,53,0,0 ; vbroadcastss 0x3585(%rip),%ymm15 # 4620 <_sk_callback_hsw+0x1bf>
- DB 196,226,5,168,208 ; vfmadd213ps %ymm0,%ymm15,%ymm2
- DB 196,193,28,89,198 ; vmulps %ymm14,%ymm12,%ymm0
- DB 196,194,37,184,197 ; vfmadd231ps %ymm13,%ymm11,%ymm0
- DB 196,194,45,184,199 ; vfmadd231ps %ymm15,%ymm10,%ymm0
- DB 197,236,92,192 ; vsubps %ymm0,%ymm2,%ymm0
- DB 197,164,88,208 ; vaddps %ymm0,%ymm11,%ymm2
- DB 197,28,88,216 ; vaddps %ymm0,%ymm12,%ymm11
- DB 197,172,88,192 ; vaddps %ymm0,%ymm10,%ymm0
- DB 197,164,93,200 ; vminps %ymm0,%ymm11,%ymm1
- DB 197,108,93,209 ; vminps %ymm1,%ymm2,%ymm10
- DB 197,164,95,200 ; vmaxps %ymm0,%ymm11,%ymm1
- DB 197,108,95,225 ; vmaxps %ymm1,%ymm2,%ymm12
- DB 196,193,36,89,206 ; vmulps %ymm14,%ymm11,%ymm1
- DB 196,194,109,184,205 ; vfmadd231ps %ymm13,%ymm2,%ymm1
- DB 196,194,125,184,207 ; vfmadd231ps %ymm15,%ymm0,%ymm1
- DB 196,65,60,194,234,2 ; vcmpleps %ymm10,%ymm8,%ymm13
- DB 197,108,92,241 ; vsubps %ymm1,%ymm2,%ymm14
- DB 196,65,116,89,246 ; vmulps %ymm14,%ymm1,%ymm14
- DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,65,12,94,242 ; vdivps %ymm10,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
- DB 196,65,52,194,244,1 ; vcmpltps %ymm12,%ymm9,%ymm14
- DB 197,108,92,249 ; vsubps %ymm1,%ymm2,%ymm15
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 197,28,92,225 ; vsubps %ymm1,%ymm12,%ymm12
- DB 196,65,4,94,252 ; vdivps %ymm12,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,195,109,74,215,224 ; vblendvps %ymm14,%ymm15,%ymm2,%ymm2
- DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 197,36,92,249 ; vsubps %ymm1,%ymm11,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 196,65,4,94,250 ; vdivps %ymm10,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,5,74,219,208 ; vblendvps %ymm13,%ymm11,%ymm15,%ymm11
- DB 197,36,92,249 ; vsubps %ymm1,%ymm11,%ymm15
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,252 ; vdivps %ymm12,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,37,74,223,224 ; vblendvps %ymm14,%ymm15,%ymm11,%ymm11
- DB 196,65,36,95,216 ; vmaxps %ymm8,%ymm11,%ymm11
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 196,65,4,94,210 ; vdivps %ymm10,%ymm15,%ymm10
- DB 196,65,116,88,210 ; vaddps %ymm10,%ymm1,%ymm10
- DB 196,227,45,74,192,208 ; vblendvps %ymm13,%ymm0,%ymm10,%ymm0
- DB 197,124,92,209 ; vsubps %ymm1,%ymm0,%ymm10
- DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,65,52,94,204 ; vdivps %ymm12,%ymm9,%ymm9
- DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
- DB 196,227,125,74,193,224 ; vblendvps %ymm14,%ymm1,%ymm0,%ymm0
- DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 196,226,69,172,216 ; vfnmadd213ps %ymm0,%ymm7,%ymm3
- DB 197,228,89,194 ; vmulps %ymm2,%ymm3,%ymm0
- DB 196,193,100,89,203 ; vmulps %ymm11,%ymm3,%ymm1
- DB 196,193,100,89,208 ; vmulps %ymm8,%ymm3,%ymm2
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 197,124,40,202 ; vmovaps %ymm2,%ymm9
+ DB 197,124,17,12,36 ; vmovups %ymm9,(%rsp)
+ DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp)
+ DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
+ DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
+ DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
+ DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
+ DB 196,98,125,24,45,224,53,0,0 ; vbroadcastss 0x35e0(%rip),%ymm13 # 473c <_sk_callback_hsw+0x1b3>
+ DB 196,98,125,24,53,219,53,0,0 ; vbroadcastss 0x35db(%rip),%ymm14 # 4740 <_sk_callback_hsw+0x1b7>
+ DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
+ DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
+ DB 196,98,125,24,61,204,53,0,0 ; vbroadcastss 0x35cc(%rip),%ymm15 # 4744 <_sk_callback_hsw+0x1bb>
+ DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
+ DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
+ DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
+ DB 196,66,37,184,207 ; vfmadd231ps %ymm15,%ymm11,%ymm9
+ DB 196,66,69,170,225 ; vfmsub213ps %ymm9,%ymm7,%ymm12
+ DB 196,65,60,88,204 ; vaddps %ymm12,%ymm8,%ymm9
+ DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
+ DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
+ DB 196,65,44,93,195 ; vminps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,93,224 ; vminps %ymm8,%ymm9,%ymm12
+ DB 196,65,44,89,198 ; vmulps %ymm14,%ymm10,%ymm8
+ DB 196,66,53,184,197 ; vfmadd231ps %ymm13,%ymm9,%ymm8
+ DB 196,66,37,184,199 ; vfmadd231ps %ymm15,%ymm11,%ymm8
+ DB 196,65,52,92,232 ; vsubps %ymm8,%ymm9,%ymm13
+ DB 196,65,60,89,237 ; vmulps %ymm13,%ymm8,%ymm13
+ DB 196,65,60,92,244 ; vsubps %ymm12,%ymm8,%ymm14
+ DB 196,193,20,94,198 ; vdivps %ymm14,%ymm13,%ymm0
+ DB 196,65,44,92,248 ; vsubps %ymm8,%ymm10,%ymm15
+ DB 196,65,60,89,255 ; vmulps %ymm15,%ymm8,%ymm15
+ DB 196,65,4,94,254 ; vdivps %ymm14,%ymm15,%ymm15
+ DB 196,65,36,92,232 ; vsubps %ymm8,%ymm11,%ymm13
+ DB 196,65,60,89,237 ; vmulps %ymm13,%ymm8,%ymm13
+ DB 196,65,20,94,238 ; vdivps %ymm14,%ymm13,%ymm13
+ DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
+ DB 196,65,12,194,228,2 ; vcmpleps %ymm12,%ymm14,%ymm12
+ DB 196,65,60,88,255 ; vaddps %ymm15,%ymm8,%ymm15
+ DB 196,67,5,74,250,192 ; vblendvps %ymm12,%ymm10,%ymm15,%ymm15
+ DB 196,65,44,95,211 ; vmaxps %ymm11,%ymm10,%ymm10
+ DB 196,65,60,88,237 ; vaddps %ymm13,%ymm8,%ymm13
+ DB 196,67,21,74,219,192 ; vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
+ DB 196,195,125,74,201,192 ; vblendvps %ymm12,%ymm9,%ymm0,%ymm1
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,52,95,202 ; vmaxps %ymm10,%ymm9,%ymm9
+ DB 196,65,116,92,208 ; vsubps %ymm8,%ymm1,%ymm10
+ DB 196,65,28,92,232 ; vsubps %ymm8,%ymm12,%ymm13
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,193,28,194,193,1 ; vcmpltps %ymm9,%ymm12,%ymm0
+ DB 196,65,52,92,200 ; vsubps %ymm8,%ymm9,%ymm9
+ DB 196,65,44,94,209 ; vdivps %ymm9,%ymm10,%ymm10
+ DB 196,65,60,88,210 ; vaddps %ymm10,%ymm8,%ymm10
+ DB 196,195,117,74,202,0 ; vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ DB 196,65,4,92,208 ; vsubps %ymm8,%ymm15,%ymm10
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,65,44,94,209 ; vdivps %ymm9,%ymm10,%ymm10
+ DB 196,65,60,88,210 ; vaddps %ymm10,%ymm8,%ymm10
+ DB 196,67,5,74,210,0 ; vblendvps %ymm0,%ymm10,%ymm15,%ymm10
+ DB 196,65,36,92,248 ; vsubps %ymm8,%ymm11,%ymm15
+ DB 196,65,20,89,239 ; vmulps %ymm15,%ymm13,%ymm13
+ DB 196,65,20,94,201 ; vdivps %ymm9,%ymm13,%ymm9
+ DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
+ DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
+ DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
+ DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
+ DB 196,226,125,24,5,174,52,0,0 ; vbroadcastss 0x34ae(%rip),%ymm0 # 4748 <_sk_callback_hsw+0x1bf>
+ DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
+ DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
+ DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
+ DB 196,226,37,184,212 ; vfmadd231ps %ymm4,%ymm11,%ymm2
+ DB 197,236,88,193 ; vaddps %ymm1,%ymm2,%ymm0
+ DB 197,172,89,76,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm1
+ DB 196,226,37,184,205 ; vfmadd231ps %ymm5,%ymm11,%ymm1
+ DB 196,193,116,88,200 ; vaddps %ymm8,%ymm1,%ymm1
+ DB 197,172,89,20,36 ; vmulps (%rsp),%ymm10,%ymm2
+ DB 196,98,77,168,218 ; vfmadd213ps %ymm2,%ymm6,%ymm11
+ DB 196,193,36,88,209 ; vaddps %ymm9,%ymm11,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_clamp_0_hsw
@@ -1106,7 +1157,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,71,52,0,0 ; vbroadcastss 0x3447(%rip),%ymm8 # 4624 <_sk_callback_hsw+0x1c3>
+ DB 196,98,125,24,5,71,52,0,0 ; vbroadcastss 0x3447(%rip),%ymm8 # 474c <_sk_callback_hsw+0x1c3>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1116,7 +1167,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,42,52,0,0 ; vbroadcastss 0x342a(%rip),%ymm8 # 4628 <_sk_callback_hsw+0x1c7>
+ DB 196,98,125,24,5,42,52,0,0 ; vbroadcastss 0x342a(%rip),%ymm8 # 4750 <_sk_callback_hsw+0x1c7>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1188,7 +1239,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,114,51,0,0 ; vbroadcastss 0x3372(%rip),%ymm10 # 462c <_sk_callback_hsw+0x1cb>
+ DB 196,98,125,24,21,114,51,0,0 ; vbroadcastss 0x3372(%rip),%ymm10 # 4754 <_sk_callback_hsw+0x1cb>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1199,16 +1250,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,83,51,0,0 ; vbroadcastss 0x3353(%rip),%ymm8 # 4630 <_sk_callback_hsw+0x1cf>
+ DB 196,98,125,24,5,83,51,0,0 ; vbroadcastss 0x3353(%rip),%ymm8 # 4758 <_sk_callback_hsw+0x1cf>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,69,51,0,0 ; vbroadcastss 0x3345(%rip),%ymm11 # 4634 <_sk_callback_hsw+0x1d3>
- DB 196,98,125,24,37,64,51,0,0 ; vbroadcastss 0x3340(%rip),%ymm12 # 4638 <_sk_callback_hsw+0x1d7>
+ DB 196,98,125,24,29,69,51,0,0 ; vbroadcastss 0x3345(%rip),%ymm11 # 475c <_sk_callback_hsw+0x1d3>
+ DB 196,98,125,24,37,64,51,0,0 ; vbroadcastss 0x3340(%rip),%ymm12 # 4760 <_sk_callback_hsw+0x1d7>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,49,51,0,0 ; vbroadcastss 0x3331(%rip),%ymm14 # 463c <_sk_callback_hsw+0x1db>
+ DB 196,98,125,24,53,49,51,0,0 ; vbroadcastss 0x3331(%rip),%ymm14 # 4764 <_sk_callback_hsw+0x1db>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,39,51,0,0 ; vbroadcastss 0x3327(%rip),%ymm10 # 4640 <_sk_callback_hsw+0x1df>
+ DB 196,98,125,24,21,39,51,0,0 ; vbroadcastss 0x3327(%rip),%ymm10 # 4768 <_sk_callback_hsw+0x1df>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1232,16 +1283,16 @@ _sk_to_srgb_hsw LABEL PROC
DB 197,124,82,192 ; vrsqrtps %ymm0,%ymm8
DB 196,65,124,83,200 ; vrcpps %ymm8,%ymm9
DB 196,65,124,82,208 ; vrsqrtps %ymm8,%ymm10
- DB 196,98,125,24,5,193,50,0,0 ; vbroadcastss 0x32c1(%rip),%ymm8 # 4644 <_sk_callback_hsw+0x1e3>
+ DB 196,98,125,24,5,193,50,0,0 ; vbroadcastss 0x32c1(%rip),%ymm8 # 476c <_sk_callback_hsw+0x1e3>
DB 196,65,124,89,216 ; vmulps %ymm8,%ymm0,%ymm11
- DB 196,98,125,24,37,183,50,0,0 ; vbroadcastss 0x32b7(%rip),%ymm12 # 4648 <_sk_callback_hsw+0x1e7>
- DB 196,98,125,24,45,178,50,0,0 ; vbroadcastss 0x32b2(%rip),%ymm13 # 464c <_sk_callback_hsw+0x1eb>
+ DB 196,98,125,24,37,183,50,0,0 ; vbroadcastss 0x32b7(%rip),%ymm12 # 4770 <_sk_callback_hsw+0x1e7>
+ DB 196,98,125,24,45,178,50,0,0 ; vbroadcastss 0x32b2(%rip),%ymm13 # 4774 <_sk_callback_hsw+0x1eb>
DB 196,66,21,168,204 ; vfmadd213ps %ymm12,%ymm13,%ymm9
- DB 196,98,125,24,53,168,50,0,0 ; vbroadcastss 0x32a8(%rip),%ymm14 # 4650 <_sk_callback_hsw+0x1ef>
+ DB 196,98,125,24,53,168,50,0,0 ; vbroadcastss 0x32a8(%rip),%ymm14 # 4778 <_sk_callback_hsw+0x1ef>
DB 196,66,13,184,202 ; vfmadd231ps %ymm10,%ymm14,%ymm9
- DB 196,98,125,24,21,158,50,0,0 ; vbroadcastss 0x329e(%rip),%ymm10 # 4654 <_sk_callback_hsw+0x1f3>
+ DB 196,98,125,24,21,158,50,0,0 ; vbroadcastss 0x329e(%rip),%ymm10 # 477c <_sk_callback_hsw+0x1f3>
DB 196,65,44,93,201 ; vminps %ymm9,%ymm10,%ymm9
- DB 196,98,125,24,61,148,50,0,0 ; vbroadcastss 0x3294(%rip),%ymm15 # 4658 <_sk_callback_hsw+0x1f7>
+ DB 196,98,125,24,61,148,50,0,0 ; vbroadcastss 0x3294(%rip),%ymm15 # 4780 <_sk_callback_hsw+0x1f7>
DB 196,193,124,194,199,1 ; vcmpltps %ymm15,%ymm0,%ymm0
DB 196,195,53,74,195,0 ; vblendvps %ymm0,%ymm11,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1272,26 +1323,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,14,50,0,0 ; vbroadcastss 0x320e(%rip),%ymm11 # 465c <_sk_callback_hsw+0x1fb>
+ DB 196,98,125,24,29,14,50,0,0 ; vbroadcastss 0x320e(%rip),%ymm11 # 4784 <_sk_callback_hsw+0x1fb>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,251,49,0,0 ; vbroadcastss 0x31fb(%rip),%ymm14 # 4660 <_sk_callback_hsw+0x1ff>
+ DB 196,98,125,24,53,251,49,0,0 ; vbroadcastss 0x31fb(%rip),%ymm14 # 4788 <_sk_callback_hsw+0x1ff>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,226,49,0,0 ; vbroadcastss 0x31e2(%rip),%ymm14 # 4668 <_sk_callback_hsw+0x207>
+ DB 196,98,125,24,53,226,49,0,0 ; vbroadcastss 0x31e2(%rip),%ymm14 # 4790 <_sk_callback_hsw+0x207>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,208,49,0,0 ; vbroadcastss 0x31d0(%rip),%ymm14 # 4664 <_sk_callback_hsw+0x203>
+ DB 196,98,125,24,53,208,49,0,0 ; vbroadcastss 0x31d0(%rip),%ymm14 # 478c <_sk_callback_hsw+0x203>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,179,49,0,0 ; vbroadcastss 0x31b3(%rip),%ymm11 # 4670 <_sk_callback_hsw+0x20f>
+ DB 196,98,125,24,29,179,49,0,0 ; vbroadcastss 0x31b3(%rip),%ymm11 # 4798 <_sk_callback_hsw+0x20f>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1301,7 +1352,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,118,49,0,0 ; vbroadcastss 0x3176(%rip),%ymm8 # 466c <_sk_callback_hsw+0x20b>
+ DB 196,98,125,24,5,118,49,0,0 ; vbroadcastss 0x3176(%rip),%ymm8 # 4794 <_sk_callback_hsw+0x20b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1316,30 +1367,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,61,49,0,0 ; vbroadcastss 0x313d(%rip),%ymm8 # 4674 <_sk_callback_hsw+0x213>
+ DB 196,98,125,24,5,61,49,0,0 ; vbroadcastss 0x313d(%rip),%ymm8 # 479c <_sk_callback_hsw+0x213>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,32,49,0,0 ; vbroadcastss 0x3120(%rip),%ymm9 # 4678 <_sk_callback_hsw+0x217>
+ DB 196,98,125,24,13,32,49,0,0 ; vbroadcastss 0x3120(%rip),%ymm9 # 47a0 <_sk_callback_hsw+0x217>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,22,49,0,0 ; vbroadcastss 0x3116(%rip),%ymm11 # 467c <_sk_callback_hsw+0x21b>
+ DB 196,98,125,24,29,22,49,0,0 ; vbroadcastss 0x3116(%rip),%ymm11 # 47a4 <_sk_callback_hsw+0x21b>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,0,49,0,0 ; vbroadcastss 0x3100(%rip),%ymm13 # 4684 <_sk_callback_hsw+0x223>
+ DB 196,98,125,24,45,0,49,0,0 ; vbroadcastss 0x3100(%rip),%ymm13 # 47ac <_sk_callback_hsw+0x223>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,246,48,0,0 ; vbroadcastss 0x30f6(%rip),%ymm14 # 4688 <_sk_callback_hsw+0x227>
+ DB 196,98,125,24,53,246,48,0,0 ; vbroadcastss 0x30f6(%rip),%ymm14 # 47b0 <_sk_callback_hsw+0x227>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,220,48,0,0 ; vbroadcastss 0x30dc(%rip),%ymm3 # 4680 <_sk_callback_hsw+0x21f>
+ DB 196,226,125,24,29,220,48,0,0 ; vbroadcastss 0x30dc(%rip),%ymm3 # 47a8 <_sk_callback_hsw+0x21f>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,199,48,0,0 ; vbroadcastss 0x30c7(%rip),%ymm12 # 468c <_sk_callback_hsw+0x22b>
+ DB 196,98,125,24,37,199,48,0,0 ; vbroadcastss 0x30c7(%rip),%ymm12 # 47b4 <_sk_callback_hsw+0x22b>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1355,7 +1406,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,115,48,0,0 ; vbroadcastss 0x3073(%rip),%ymm0 # 4690 <_sk_callback_hsw+0x22f>
+ DB 196,226,125,24,5,115,48,0,0 ; vbroadcastss 0x3073(%rip),%ymm0 # 47b8 <_sk_callback_hsw+0x22f>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1401,11 +1452,11 @@ _sk_scale_u8_hsw LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,51 ; jne 1703 <_sk_scale_u8_hsw+0x43>
+ DB 117,51 ; jne 182b <_sk_scale_u8_hsw+0x43>
DB 197,122,126,0 ; vmovq (%rax),%xmm8
DB 196,66,125,49,192 ; vpmovzxbd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,173,47,0,0 ; vbroadcastss 0x2fad(%rip),%ymm9 # 4694 <_sk_callback_hsw+0x233>
+ DB 196,98,125,24,13,173,47,0,0 ; vbroadcastss 0x2fad(%rip),%ymm9 # 47bc <_sk_callback_hsw+0x233>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1423,9 +1474,9 @@ _sk_scale_u8_hsw LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 170b <_sk_scale_u8_hsw+0x4b>
+ DB 117,234 ; jne 1833 <_sk_scale_u8_hsw+0x4b>
DB 196,65,249,110,193 ; vmovq %r9,%xmm8
- DB 235,172 ; jmp 16d4 <_sk_scale_u8_hsw+0x14>
+ DB 235,172 ; jmp 17fc <_sk_scale_u8_hsw+0x14>
PUBLIC _sk_lerp_1_float_hsw
_sk_lerp_1_float_hsw LABEL PROC
@@ -1449,11 +1500,11 @@ _sk_lerp_u8_hsw LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,71 ; jne 17ae <_sk_lerp_u8_hsw+0x57>
+ DB 117,71 ; jne 18d6 <_sk_lerp_u8_hsw+0x57>
DB 197,122,126,0 ; vmovq (%rax),%xmm8
DB 196,66,125,49,192 ; vpmovzxbd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,26,47,0,0 ; vbroadcastss 0x2f1a(%rip),%ymm9 # 4698 <_sk_callback_hsw+0x237>
+ DB 196,98,125,24,13,26,47,0,0 ; vbroadcastss 0x2f1a(%rip),%ymm9 # 47c0 <_sk_callback_hsw+0x237>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1475,32 +1526,32 @@ _sk_lerp_u8_hsw LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 17b6 <_sk_lerp_u8_hsw+0x5f>
+ DB 117,234 ; jne 18de <_sk_lerp_u8_hsw+0x5f>
DB 196,65,249,110,193 ; vmovq %r9,%xmm8
- DB 235,152 ; jmp 176b <_sk_lerp_u8_hsw+0x14>
+ DB 235,152 ; jmp 1893 <_sk_lerp_u8_hsw+0x14>
PUBLIC _sk_lerp_565_hsw
_sk_lerp_565_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,169,0,0,0 ; jne 188a <_sk_lerp_565_hsw+0xb7>
+ DB 15,133,169,0,0,0 ; jne 19b2 <_sk_lerp_565_hsw+0xb7>
DB 196,65,122,111,4,122 ; vmovdqu (%r10,%rdi,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,167,46,0,0 ; vpbroadcastd 0x2ea7(%rip),%ymm9 # 469c <_sk_callback_hsw+0x23b>
+ DB 196,98,125,88,13,167,46,0,0 ; vpbroadcastd 0x2ea7(%rip),%ymm9 # 47c4 <_sk_callback_hsw+0x23b>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,152,46,0,0 ; vbroadcastss 0x2e98(%rip),%ymm10 # 46a0 <_sk_callback_hsw+0x23f>
+ DB 196,98,125,24,21,152,46,0,0 ; vbroadcastss 0x2e98(%rip),%ymm10 # 47c8 <_sk_callback_hsw+0x23f>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,142,46,0,0 ; vpbroadcastd 0x2e8e(%rip),%ymm10 # 46a4 <_sk_callback_hsw+0x243>
+ DB 196,98,125,88,21,142,46,0,0 ; vpbroadcastd 0x2e8e(%rip),%ymm10 # 47cc <_sk_callback_hsw+0x243>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,127,46,0,0 ; vbroadcastss 0x2e7f(%rip),%ymm11 # 46a8 <_sk_callback_hsw+0x247>
+ DB 196,98,125,24,29,127,46,0,0 ; vbroadcastss 0x2e7f(%rip),%ymm11 # 47d0 <_sk_callback_hsw+0x247>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,117,46,0,0 ; vpbroadcastd 0x2e75(%rip),%ymm11 # 46ac <_sk_callback_hsw+0x24b>
+ DB 196,98,125,88,29,117,46,0,0 ; vpbroadcastd 0x2e75(%rip),%ymm11 # 47d4 <_sk_callback_hsw+0x24b>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,102,46,0,0 ; vbroadcastss 0x2e66(%rip),%ymm11 # 46b0 <_sk_callback_hsw+0x24f>
+ DB 196,98,125,24,29,102,46,0,0 ; vbroadcastss 0x2e66(%rip),%ymm11 # 47d8 <_sk_callback_hsw+0x24f>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -1521,9 +1572,9 @@ _sk_lerp_565_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 15,135,68,255,255,255 ; ja 17e7 <_sk_lerp_565_hsw+0x14>
+ DB 15,135,68,255,255,255 ; ja 190f <_sk_lerp_565_hsw+0x14>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,74,0,0,0 ; lea 0x4a(%rip),%r9 # 18f8 <_sk_lerp_565_hsw+0x125>
+ DB 76,141,13,74,0,0,0 ; lea 0x4a(%rip),%r9 # 1a20 <_sk_lerp_565_hsw+0x125>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -1535,7 +1586,7 @@ _sk_lerp_565_hsw LABEL PROC
DB 196,65,57,196,68,122,4,2 ; vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm8,%xmm8
DB 196,65,57,196,68,122,2,1 ; vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm8,%xmm8
DB 196,65,57,196,4,122,0 ; vpinsrw $0x0,(%r10,%rdi,2),%xmm8,%xmm8
- DB 233,239,254,255,255 ; jmpq 17e7 <_sk_lerp_565_hsw+0x14>
+ DB 233,239,254,255,255 ; jmpq 190f <_sk_lerp_565_hsw+0x14>
DB 244 ; hlt
DB 255 ; (bad)
DB 255 ; (bad)
@@ -1568,23 +1619,23 @@ _sk_load_tables_hsw LABEL PROC
DB 76,141,12,189,0,0,0,0 ; lea 0x0(,%rdi,4),%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 117,105 ; jne 1992 <_sk_load_tables_hsw+0x7e>
+ DB 117,105 ; jne 1aba <_sk_load_tables_hsw+0x7e>
DB 196,193,126,111,25 ; vmovdqu (%r9),%ymm3
- DB 197,229,219,13,42,48,0,0 ; vpand 0x302a(%rip),%ymm3,%ymm1 # 4960 <_sk_callback_hsw+0x4ff>
+ DB 197,229,219,13,34,48,0,0 ; vpand 0x3022(%rip),%ymm3,%ymm1 # 4a80 <_sk_callback_hsw+0x4f7>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 72,139,72,8 ; mov 0x8(%rax),%rcx
DB 76,139,72,16 ; mov 0x10(%rax),%r9
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,226,109,146,4,137 ; vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- DB 196,226,101,0,21,42,48,0,0 ; vpshufb 0x302a(%rip),%ymm3,%ymm2 # 4980 <_sk_callback_hsw+0x51f>
+ DB 196,226,101,0,21,34,48,0,0 ; vpshufb 0x3022(%rip),%ymm3,%ymm2 # 4aa0 <_sk_callback_hsw+0x517>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,145 ; vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,50,48,0,0 ; vpshufb 0x3032(%rip),%ymm3,%ymm9 # 49a0 <_sk_callback_hsw+0x53f>
+ DB 196,98,101,0,13,42,48,0,0 ; vpshufb 0x302a(%rip),%ymm3,%ymm9 # 4ac0 <_sk_callback_hsw+0x537>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,46,45,0,0 ; vbroadcastss 0x2d2e(%rip),%ymm8 # 46b4 <_sk_callback_hsw+0x253>
+ DB 196,98,125,24,5,46,45,0,0 ; vbroadcastss 0x2d2e(%rip),%ymm8 # 47dc <_sk_callback_hsw+0x253>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,193 ; mov %r8,%rcx
@@ -1597,7 +1648,7 @@ _sk_load_tables_hsw LABEL PROC
DB 196,193,249,110,194 ; vmovq %r10,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,194,125,140,25 ; vpmaskmovd (%r9),%ymm0,%ymm3
- DB 233,115,255,255,255 ; jmpq 192e <_sk_load_tables_hsw+0x1a>
+ DB 233,115,255,255,255 ; jmpq 1a56 <_sk_load_tables_hsw+0x1a>
PUBLIC _sk_load_tables_u16_be_hsw
_sk_load_tables_u16_be_hsw LABEL PROC
@@ -1605,7 +1656,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,189,0,0,0,0 ; lea 0x0(,%rdi,4),%r9
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,201,0,0,0 ; jne 1a9a <_sk_load_tables_u16_be_hsw+0xdf>
+ DB 15,133,201,0,0,0 ; jne 1bc2 <_sk_load_tables_u16_be_hsw+0xdf>
DB 196,1,121,16,4,72 ; vmovupd (%r8,%r9,2),%xmm8
DB 196,129,121,16,84,72,16 ; vmovupd 0x10(%r8,%r9,2),%xmm2
DB 196,129,121,16,92,72,32 ; vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -1621,7 +1672,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,190,48,0,0 ; vmovdqa 0x30be(%rip),%xmm10 # 4ae0 <_sk_callback_hsw+0x67f>
+ DB 197,121,111,21,182,48,0,0 ; vmovdqa 0x30b6(%rip),%xmm10 # 4c00 <_sk_callback_hsw+0x677>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -1643,36 +1694,36 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,39,44,0,0 ; vbroadcastss 0x2c27(%rip),%ymm8 # 46b8 <_sk_callback_hsw+0x257>
+ DB 196,98,125,24,5,39,44,0,0 ; vbroadcastss 0x2c27(%rip),%ymm8 # 47e0 <_sk_callback_hsw+0x257>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 196,1,123,16,4,72 ; vmovsd (%r8,%r9,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,85 ; je 1b00 <_sk_load_tables_u16_be_hsw+0x145>
+ DB 116,85 ; je 1c28 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,1,57,22,68,72,8 ; vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,72 ; jb 1b00 <_sk_load_tables_u16_be_hsw+0x145>
+ DB 114,72 ; jb 1c28 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,129,123,16,84,72,16 ; vmovsd 0x10(%r8,%r9,2),%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 116,72 ; je 1b0d <_sk_load_tables_u16_be_hsw+0x152>
+ DB 116,72 ; je 1c35 <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,105,22,84,72,24 ; vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,59 ; jb 1b0d <_sk_load_tables_u16_be_hsw+0x152>
+ DB 114,59 ; jb 1c35 <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,123,16,92,72,32 ; vmovsd 0x20(%r8,%r9,2),%xmm3
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 15,132,9,255,255,255 ; je 19ec <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,132,9,255,255,255 ; je 1b14 <_sk_load_tables_u16_be_hsw+0x31>
DB 196,129,97,22,92,72,40 ; vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 15,130,248,254,255,255 ; jb 19ec <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,130,248,254,255,255 ; jb 1b14 <_sk_load_tables_u16_be_hsw+0x31>
DB 196,1,122,126,76,72,48 ; vmovq 0x30(%r8,%r9,2),%xmm9
- DB 233,236,254,255,255 ; jmpq 19ec <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,236,254,255,255 ; jmpq 1b14 <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,223,254,255,255 ; jmpq 19ec <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,223,254,255,255 ; jmpq 1b14 <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,214,254,255,255 ; jmpq 19ec <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,214,254,255,255 ; jmpq 1b14 <_sk_load_tables_u16_be_hsw+0x31>
PUBLIC _sk_load_tables_rgb_u16_be_hsw
_sk_load_tables_rgb_u16_be_hsw LABEL PROC
@@ -1680,7 +1731,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,127 ; lea (%rdi,%rdi,2),%r9
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,193,0,0,0 ; jne 1be9 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ DB 15,133,193,0,0,0 ; jne 1d11 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
DB 196,129,122,111,4,72 ; vmovdqu (%r8,%r9,2),%xmm0
DB 196,129,122,111,84,72,12 ; vmovdqu 0xc(%r8,%r9,2),%xmm2
DB 196,129,122,111,76,72,24 ; vmovdqu 0x18(%r8,%r9,2),%xmm1
@@ -1701,7 +1752,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,94,47,0,0 ; vmovdqa 0x2f5e(%rip),%xmm9 # 4af0 <_sk_callback_hsw+0x68f>
+ DB 197,121,111,13,86,47,0,0 ; vmovdqa 0x2f56(%rip),%xmm9 # 4c10 <_sk_callback_hsw+0x687>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -1718,41 +1769,41 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8
DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,213,42,0,0 ; vbroadcastss 0x2ad5(%rip),%ymm3 # 46bc <_sk_callback_hsw+0x25b>
+ DB 196,226,125,24,29,213,42,0,0 ; vbroadcastss 0x2ad5(%rip),%ymm3 # 47e4 <_sk_callback_hsw+0x25b>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,72 ; vmovd (%r8,%r9,2),%xmm0
DB 196,129,121,196,68,72,4,2 ; vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm0
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 117,5 ; jne 1c02 <_sk_load_tables_rgb_u16_be_hsw+0xec>
- DB 233,90,255,255,255 ; jmpq 1b5c <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,5 ; jne 1d2a <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ DB 233,90,255,255,255 ; jmpq 1c84 <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,72,6 ; vmovd 0x6(%r8,%r9,2),%xmm1
DB 196,1,113,196,68,72,10,2 ; vpinsrw $0x2,0xa(%r8,%r9,2),%xmm1,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,26 ; jb 1c31 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ DB 114,26 ; jb 1d59 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
DB 196,129,121,110,76,72,12 ; vmovd 0xc(%r8,%r9,2),%xmm1
DB 196,129,113,196,84,72,16,2 ; vpinsrw $0x2,0x10(%r8,%r9,2),%xmm1,%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 117,10 ; jne 1c36 <_sk_load_tables_rgb_u16_be_hsw+0x120>
- DB 233,43,255,255,255 ; jmpq 1b5c <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,38,255,255,255 ; jmpq 1b5c <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 1d5e <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ DB 233,43,255,255,255 ; jmpq 1c84 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,38,255,255,255 ; jmpq 1c84 <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,72,18 ; vmovd 0x12(%r8,%r9,2),%xmm1
DB 196,1,113,196,76,72,22,2 ; vpinsrw $0x2,0x16(%r8,%r9,2),%xmm1,%xmm9
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,26 ; jb 1c65 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ DB 114,26 ; jb 1d8d <_sk_load_tables_rgb_u16_be_hsw+0x14f>
DB 196,129,121,110,76,72,24 ; vmovd 0x18(%r8,%r9,2),%xmm1
DB 196,129,113,196,76,72,28,2 ; vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm1,%xmm1
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 117,10 ; jne 1c6a <_sk_load_tables_rgb_u16_be_hsw+0x154>
- DB 233,247,254,255,255 ; jmpq 1b5c <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,242,254,255,255 ; jmpq 1b5c <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 1d92 <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ DB 233,247,254,255,255 ; jmpq 1c84 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,242,254,255,255 ; jmpq 1c84 <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,92,72,30 ; vmovd 0x1e(%r8,%r9,2),%xmm3
DB 196,1,97,196,92,72,34,2 ; vpinsrw $0x2,0x22(%r8,%r9,2),%xmm3,%xmm11
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,20 ; jb 1c93 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ DB 114,20 ; jb 1dbb <_sk_load_tables_rgb_u16_be_hsw+0x17d>
DB 196,129,121,110,92,72,36 ; vmovd 0x24(%r8,%r9,2),%xmm3
DB 196,129,97,196,92,72,40,2 ; vpinsrw $0x2,0x28(%r8,%r9,2),%xmm3,%xmm3
- DB 233,201,254,255,255 ; jmpq 1b5c <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,196,254,255,255 ; jmpq 1b5c <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,201,254,255,255 ; jmpq 1c84 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,196,254,255,255 ; jmpq 1c84 <_sk_load_tables_rgb_u16_be_hsw+0x46>
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
@@ -1763,7 +1814,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,19,42,0,0 ; vbroadcastss 0x2a13(%rip),%ymm8 # 46c0 <_sk_callback_hsw+0x25f>
+ DB 196,98,125,24,5,19,42,0,0 ; vbroadcastss 0x2a13(%rip),%ymm8 # 47e8 <_sk_callback_hsw+0x25f>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,195,249,22,192,1 ; vpextrq $0x1,%xmm0,%r8
@@ -1800,7 +1851,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 196,227,121,32,197,7 ; vpinsrb $0x7,%ebp,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,100,41,0,0 ; vbroadcastss 0x2964(%rip),%ymm9 # 46c4 <_sk_callback_hsw+0x263>
+ DB 196,98,125,24,13,100,41,0,0 ; vbroadcastss 0x2964(%rip),%ymm9 # 47ec <_sk_callback_hsw+0x263>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
@@ -1959,7 +2010,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 196,227,121,32,197,7 ; vpinsrb $0x7,%ebp,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,157,38,0,0 ; vbroadcastss 0x269d(%rip),%ymm9 # 46c8 <_sk_callback_hsw+0x267>
+ DB 196,98,125,24,13,157,38,0,0 ; vbroadcastss 0x269d(%rip),%ymm9 # 47f0 <_sk_callback_hsw+0x267>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
@@ -2112,33 +2163,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,80,36,0,0 ; vbroadcastss 0x2450(%rip),%ymm12 # 46cc <_sk_callback_hsw+0x26b>
- DB 196,98,125,24,45,75,36,0,0 ; vbroadcastss 0x244b(%rip),%ymm13 # 46d0 <_sk_callback_hsw+0x26f>
+ DB 196,98,125,24,37,80,36,0,0 ; vbroadcastss 0x2450(%rip),%ymm12 # 47f4 <_sk_callback_hsw+0x26b>
+ DB 196,98,125,24,45,75,36,0,0 ; vbroadcastss 0x244b(%rip),%ymm13 # 47f8 <_sk_callback_hsw+0x26f>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,65,36,0,0 ; vbroadcastss 0x2441(%rip),%ymm13 # 46d4 <_sk_callback_hsw+0x273>
+ DB 196,98,125,24,45,65,36,0,0 ; vbroadcastss 0x2441(%rip),%ymm13 # 47fc <_sk_callback_hsw+0x273>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,55,36,0,0 ; vbroadcastss 0x2437(%rip),%ymm13 # 46d8 <_sk_callback_hsw+0x277>
+ DB 196,98,125,24,45,55,36,0,0 ; vbroadcastss 0x2437(%rip),%ymm13 # 4800 <_sk_callback_hsw+0x277>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,45,36,0,0 ; vbroadcastss 0x242d(%rip),%ymm11 # 46dc <_sk_callback_hsw+0x27b>
+ DB 196,98,125,24,29,45,36,0,0 ; vbroadcastss 0x242d(%rip),%ymm11 # 4804 <_sk_callback_hsw+0x27b>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,35,36,0,0 ; vbroadcastss 0x2423(%rip),%ymm12 # 46e0 <_sk_callback_hsw+0x27f>
+ DB 196,98,125,24,37,35,36,0,0 ; vbroadcastss 0x2423(%rip),%ymm12 # 4808 <_sk_callback_hsw+0x27f>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,25,36,0,0 ; vbroadcastss 0x2419(%rip),%ymm12 # 46e4 <_sk_callback_hsw+0x283>
+ DB 196,98,125,24,37,25,36,0,0 ; vbroadcastss 0x2419(%rip),%ymm12 # 480c <_sk_callback_hsw+0x283>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,250,35,0,0 ; vbroadcastss 0x23fa(%rip),%ymm11 # 46e8 <_sk_callback_hsw+0x287>
+ DB 196,98,125,24,29,250,35,0,0 ; vbroadcastss 0x23fa(%rip),%ymm11 # 4810 <_sk_callback_hsw+0x287>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,240,35,0,0 ; vbroadcastss 0x23f0(%rip),%ymm11 # 46ec <_sk_callback_hsw+0x28b>
+ DB 196,98,125,24,29,240,35,0,0 ; vbroadcastss 0x23f0(%rip),%ymm11 # 4814 <_sk_callback_hsw+0x28b>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,230,35,0,0 ; vbroadcastss 0x23e6(%rip),%ymm0 # 46f0 <_sk_callback_hsw+0x28f>
+ DB 196,226,125,24,5,230,35,0,0 ; vbroadcastss 0x23e6(%rip),%ymm0 # 4818 <_sk_callback_hsw+0x28f>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,220,35,0,0 ; vbroadcastss 0x23dc(%rip),%ymm10 # 46f4 <_sk_callback_hsw+0x293>
+ DB 196,98,125,24,21,220,35,0,0 ; vbroadcastss 0x23dc(%rip),%ymm10 # 481c <_sk_callback_hsw+0x293>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,207,35,0,0 ; vbroadcastss 0x23cf(%rip),%ymm10 # 46f8 <_sk_callback_hsw+0x297>
+ DB 196,98,125,24,21,207,35,0,0 ; vbroadcastss 0x23cf(%rip),%ymm10 # 4820 <_sk_callback_hsw+0x297>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2146,7 +2197,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,166,35,0,0 ; vbroadcastss 0x23a6(%rip),%ymm8 # 46fc <_sk_callback_hsw+0x29b>
+ DB 196,98,125,24,5,166,35,0,0 ; vbroadcastss 0x23a6(%rip),%ymm8 # 4824 <_sk_callback_hsw+0x29b>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2164,33 +2215,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,94,35,0,0 ; vbroadcastss 0x235e(%rip),%ymm12 # 4700 <_sk_callback_hsw+0x29f>
- DB 196,98,125,24,45,89,35,0,0 ; vbroadcastss 0x2359(%rip),%ymm13 # 4704 <_sk_callback_hsw+0x2a3>
+ DB 196,98,125,24,37,94,35,0,0 ; vbroadcastss 0x235e(%rip),%ymm12 # 4828 <_sk_callback_hsw+0x29f>
+ DB 196,98,125,24,45,89,35,0,0 ; vbroadcastss 0x2359(%rip),%ymm13 # 482c <_sk_callback_hsw+0x2a3>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,79,35,0,0 ; vbroadcastss 0x234f(%rip),%ymm13 # 4708 <_sk_callback_hsw+0x2a7>
+ DB 196,98,125,24,45,79,35,0,0 ; vbroadcastss 0x234f(%rip),%ymm13 # 4830 <_sk_callback_hsw+0x2a7>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,69,35,0,0 ; vbroadcastss 0x2345(%rip),%ymm13 # 470c <_sk_callback_hsw+0x2ab>
+ DB 196,98,125,24,45,69,35,0,0 ; vbroadcastss 0x2345(%rip),%ymm13 # 4834 <_sk_callback_hsw+0x2ab>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,59,35,0,0 ; vbroadcastss 0x233b(%rip),%ymm11 # 4710 <_sk_callback_hsw+0x2af>
+ DB 196,98,125,24,29,59,35,0,0 ; vbroadcastss 0x233b(%rip),%ymm11 # 4838 <_sk_callback_hsw+0x2af>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,49,35,0,0 ; vbroadcastss 0x2331(%rip),%ymm12 # 4714 <_sk_callback_hsw+0x2b3>
+ DB 196,98,125,24,37,49,35,0,0 ; vbroadcastss 0x2331(%rip),%ymm12 # 483c <_sk_callback_hsw+0x2b3>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,39,35,0,0 ; vbroadcastss 0x2327(%rip),%ymm12 # 4718 <_sk_callback_hsw+0x2b7>
+ DB 196,98,125,24,37,39,35,0,0 ; vbroadcastss 0x2327(%rip),%ymm12 # 4840 <_sk_callback_hsw+0x2b7>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,8,35,0,0 ; vbroadcastss 0x2308(%rip),%ymm11 # 471c <_sk_callback_hsw+0x2bb>
+ DB 196,98,125,24,29,8,35,0,0 ; vbroadcastss 0x2308(%rip),%ymm11 # 4844 <_sk_callback_hsw+0x2bb>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,254,34,0,0 ; vbroadcastss 0x22fe(%rip),%ymm11 # 4720 <_sk_callback_hsw+0x2bf>
+ DB 196,98,125,24,29,254,34,0,0 ; vbroadcastss 0x22fe(%rip),%ymm11 # 4848 <_sk_callback_hsw+0x2bf>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,244,34,0,0 ; vbroadcastss 0x22f4(%rip),%ymm1 # 4724 <_sk_callback_hsw+0x2c3>
+ DB 196,226,125,24,13,244,34,0,0 ; vbroadcastss 0x22f4(%rip),%ymm1 # 484c <_sk_callback_hsw+0x2c3>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,234,34,0,0 ; vbroadcastss 0x22ea(%rip),%ymm10 # 4728 <_sk_callback_hsw+0x2c7>
+ DB 196,98,125,24,21,234,34,0,0 ; vbroadcastss 0x22ea(%rip),%ymm10 # 4850 <_sk_callback_hsw+0x2c7>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,221,34,0,0 ; vbroadcastss 0x22dd(%rip),%ymm10 # 472c <_sk_callback_hsw+0x2cb>
+ DB 196,98,125,24,21,221,34,0,0 ; vbroadcastss 0x22dd(%rip),%ymm10 # 4854 <_sk_callback_hsw+0x2cb>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2198,7 +2249,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,180,34,0,0 ; vbroadcastss 0x22b4(%rip),%ymm8 # 4730 <_sk_callback_hsw+0x2cf>
+ DB 196,98,125,24,5,180,34,0,0 ; vbroadcastss 0x22b4(%rip),%ymm8 # 4858 <_sk_callback_hsw+0x2cf>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2216,33 +2267,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,108,34,0,0 ; vbroadcastss 0x226c(%rip),%ymm12 # 4734 <_sk_callback_hsw+0x2d3>
- DB 196,98,125,24,45,103,34,0,0 ; vbroadcastss 0x2267(%rip),%ymm13 # 4738 <_sk_callback_hsw+0x2d7>
+ DB 196,98,125,24,37,108,34,0,0 ; vbroadcastss 0x226c(%rip),%ymm12 # 485c <_sk_callback_hsw+0x2d3>
+ DB 196,98,125,24,45,103,34,0,0 ; vbroadcastss 0x2267(%rip),%ymm13 # 4860 <_sk_callback_hsw+0x2d7>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,93,34,0,0 ; vbroadcastss 0x225d(%rip),%ymm13 # 473c <_sk_callback_hsw+0x2db>
+ DB 196,98,125,24,45,93,34,0,0 ; vbroadcastss 0x225d(%rip),%ymm13 # 4864 <_sk_callback_hsw+0x2db>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,83,34,0,0 ; vbroadcastss 0x2253(%rip),%ymm13 # 4740 <_sk_callback_hsw+0x2df>
+ DB 196,98,125,24,45,83,34,0,0 ; vbroadcastss 0x2253(%rip),%ymm13 # 4868 <_sk_callback_hsw+0x2df>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,73,34,0,0 ; vbroadcastss 0x2249(%rip),%ymm11 # 4744 <_sk_callback_hsw+0x2e3>
+ DB 196,98,125,24,29,73,34,0,0 ; vbroadcastss 0x2249(%rip),%ymm11 # 486c <_sk_callback_hsw+0x2e3>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,63,34,0,0 ; vbroadcastss 0x223f(%rip),%ymm12 # 4748 <_sk_callback_hsw+0x2e7>
+ DB 196,98,125,24,37,63,34,0,0 ; vbroadcastss 0x223f(%rip),%ymm12 # 4870 <_sk_callback_hsw+0x2e7>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,53,34,0,0 ; vbroadcastss 0x2235(%rip),%ymm12 # 474c <_sk_callback_hsw+0x2eb>
+ DB 196,98,125,24,37,53,34,0,0 ; vbroadcastss 0x2235(%rip),%ymm12 # 4874 <_sk_callback_hsw+0x2eb>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,22,34,0,0 ; vbroadcastss 0x2216(%rip),%ymm11 # 4750 <_sk_callback_hsw+0x2ef>
+ DB 196,98,125,24,29,22,34,0,0 ; vbroadcastss 0x2216(%rip),%ymm11 # 4878 <_sk_callback_hsw+0x2ef>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,12,34,0,0 ; vbroadcastss 0x220c(%rip),%ymm11 # 4754 <_sk_callback_hsw+0x2f3>
+ DB 196,98,125,24,29,12,34,0,0 ; vbroadcastss 0x220c(%rip),%ymm11 # 487c <_sk_callback_hsw+0x2f3>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,2,34,0,0 ; vbroadcastss 0x2202(%rip),%ymm2 # 4758 <_sk_callback_hsw+0x2f7>
+ DB 196,226,125,24,21,2,34,0,0 ; vbroadcastss 0x2202(%rip),%ymm2 # 4880 <_sk_callback_hsw+0x2f7>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,248,33,0,0 ; vbroadcastss 0x21f8(%rip),%ymm10 # 475c <_sk_callback_hsw+0x2fb>
+ DB 196,98,125,24,21,248,33,0,0 ; vbroadcastss 0x21f8(%rip),%ymm10 # 4884 <_sk_callback_hsw+0x2fb>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,235,33,0,0 ; vbroadcastss 0x21eb(%rip),%ymm10 # 4760 <_sk_callback_hsw+0x2ff>
+ DB 196,98,125,24,21,235,33,0,0 ; vbroadcastss 0x21eb(%rip),%ymm10 # 4888 <_sk_callback_hsw+0x2ff>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2250,7 +2301,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,194,33,0,0 ; vbroadcastss 0x21c2(%rip),%ymm8 # 4764 <_sk_callback_hsw+0x303>
+ DB 196,98,125,24,5,194,33,0,0 ; vbroadcastss 0x21c2(%rip),%ymm8 # 488c <_sk_callback_hsw+0x303>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2268,33 +2319,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,122,33,0,0 ; vbroadcastss 0x217a(%rip),%ymm12 # 4768 <_sk_callback_hsw+0x307>
- DB 196,98,125,24,45,117,33,0,0 ; vbroadcastss 0x2175(%rip),%ymm13 # 476c <_sk_callback_hsw+0x30b>
+ DB 196,98,125,24,37,122,33,0,0 ; vbroadcastss 0x217a(%rip),%ymm12 # 4890 <_sk_callback_hsw+0x307>
+ DB 196,98,125,24,45,117,33,0,0 ; vbroadcastss 0x2175(%rip),%ymm13 # 4894 <_sk_callback_hsw+0x30b>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,107,33,0,0 ; vbroadcastss 0x216b(%rip),%ymm13 # 4770 <_sk_callback_hsw+0x30f>
+ DB 196,98,125,24,45,107,33,0,0 ; vbroadcastss 0x216b(%rip),%ymm13 # 4898 <_sk_callback_hsw+0x30f>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,97,33,0,0 ; vbroadcastss 0x2161(%rip),%ymm13 # 4774 <_sk_callback_hsw+0x313>
+ DB 196,98,125,24,45,97,33,0,0 ; vbroadcastss 0x2161(%rip),%ymm13 # 489c <_sk_callback_hsw+0x313>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,87,33,0,0 ; vbroadcastss 0x2157(%rip),%ymm11 # 4778 <_sk_callback_hsw+0x317>
+ DB 196,98,125,24,29,87,33,0,0 ; vbroadcastss 0x2157(%rip),%ymm11 # 48a0 <_sk_callback_hsw+0x317>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,77,33,0,0 ; vbroadcastss 0x214d(%rip),%ymm12 # 477c <_sk_callback_hsw+0x31b>
+ DB 196,98,125,24,37,77,33,0,0 ; vbroadcastss 0x214d(%rip),%ymm12 # 48a4 <_sk_callback_hsw+0x31b>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,67,33,0,0 ; vbroadcastss 0x2143(%rip),%ymm12 # 4780 <_sk_callback_hsw+0x31f>
+ DB 196,98,125,24,37,67,33,0,0 ; vbroadcastss 0x2143(%rip),%ymm12 # 48a8 <_sk_callback_hsw+0x31f>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,36,33,0,0 ; vbroadcastss 0x2124(%rip),%ymm11 # 4784 <_sk_callback_hsw+0x323>
+ DB 196,98,125,24,29,36,33,0,0 ; vbroadcastss 0x2124(%rip),%ymm11 # 48ac <_sk_callback_hsw+0x323>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,26,33,0,0 ; vbroadcastss 0x211a(%rip),%ymm11 # 4788 <_sk_callback_hsw+0x327>
+ DB 196,98,125,24,29,26,33,0,0 ; vbroadcastss 0x211a(%rip),%ymm11 # 48b0 <_sk_callback_hsw+0x327>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,16,33,0,0 ; vbroadcastss 0x2110(%rip),%ymm3 # 478c <_sk_callback_hsw+0x32b>
+ DB 196,226,125,24,29,16,33,0,0 ; vbroadcastss 0x2110(%rip),%ymm3 # 48b4 <_sk_callback_hsw+0x32b>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,6,33,0,0 ; vbroadcastss 0x2106(%rip),%ymm10 # 4790 <_sk_callback_hsw+0x32f>
+ DB 196,98,125,24,21,6,33,0,0 ; vbroadcastss 0x2106(%rip),%ymm10 # 48b8 <_sk_callback_hsw+0x32f>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,249,32,0,0 ; vbroadcastss 0x20f9(%rip),%ymm10 # 4794 <_sk_callback_hsw+0x333>
+ DB 196,98,125,24,21,249,32,0,0 ; vbroadcastss 0x20f9(%rip),%ymm10 # 48bc <_sk_callback_hsw+0x333>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2302,33 +2353,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,208,32,0,0 ; vbroadcastss 0x20d0(%rip),%ymm8 # 4798 <_sk_callback_hsw+0x337>
+ DB 196,98,125,24,5,208,32,0,0 ; vbroadcastss 0x20d0(%rip),%ymm8 # 48c0 <_sk_callback_hsw+0x337>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,194,32,0,0 ; vbroadcastss 0x20c2(%rip),%ymm8 # 479c <_sk_callback_hsw+0x33b>
- DB 196,98,125,24,13,189,32,0,0 ; vbroadcastss 0x20bd(%rip),%ymm9 # 47a0 <_sk_callback_hsw+0x33f>
- DB 196,98,125,24,21,184,32,0,0 ; vbroadcastss 0x20b8(%rip),%ymm10 # 47a4 <_sk_callback_hsw+0x343>
+ DB 196,98,125,24,5,194,32,0,0 ; vbroadcastss 0x20c2(%rip),%ymm8 # 48c4 <_sk_callback_hsw+0x33b>
+ DB 196,98,125,24,13,189,32,0,0 ; vbroadcastss 0x20bd(%rip),%ymm9 # 48c8 <_sk_callback_hsw+0x33f>
+ DB 196,98,125,24,21,184,32,0,0 ; vbroadcastss 0x20b8(%rip),%ymm10 # 48cc <_sk_callback_hsw+0x343>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,169,32,0,0 ; vbroadcastss 0x20a9(%rip),%ymm9 # 47a8 <_sk_callback_hsw+0x347>
+ DB 196,98,125,24,13,169,32,0,0 ; vbroadcastss 0x20a9(%rip),%ymm9 # 48d0 <_sk_callback_hsw+0x347>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,159,32,0,0 ; vbroadcastss 0x209f(%rip),%ymm0 # 47ac <_sk_callback_hsw+0x34b>
+ DB 196,226,125,24,5,159,32,0,0 ; vbroadcastss 0x209f(%rip),%ymm0 # 48d4 <_sk_callback_hsw+0x34b>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,150,32,0,0 ; vbroadcastss 0x2096(%rip),%ymm8 # 47b0 <_sk_callback_hsw+0x34f>
+ DB 196,98,125,24,5,150,32,0,0 ; vbroadcastss 0x2096(%rip),%ymm8 # 48d8 <_sk_callback_hsw+0x34f>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,140,32,0,0 ; vbroadcastss 0x208c(%rip),%ymm9 # 47b4 <_sk_callback_hsw+0x353>
+ DB 196,98,125,24,13,140,32,0,0 ; vbroadcastss 0x208c(%rip),%ymm9 # 48dc <_sk_callback_hsw+0x353>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,121,32,0,0 ; vbroadcastss 0x2079(%rip),%ymm2 # 47b8 <_sk_callback_hsw+0x357>
+ DB 196,226,125,24,21,121,32,0,0 ; vbroadcastss 0x2079(%rip),%ymm2 # 48e0 <_sk_callback_hsw+0x357>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,111,32,0,0 ; vbroadcastss 0x206f(%rip),%ymm11 # 47bc <_sk_callback_hsw+0x35b>
+ DB 196,98,125,24,29,111,32,0,0 ; vbroadcastss 0x206f(%rip),%ymm11 # 48e4 <_sk_callback_hsw+0x35b>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,101,32,0,0 ; vbroadcastss 0x2065(%rip),%ymm12 # 47c0 <_sk_callback_hsw+0x35f>
+ DB 196,98,125,24,37,101,32,0,0 ; vbroadcastss 0x2065(%rip),%ymm12 # 48e8 <_sk_callback_hsw+0x35f>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2343,9 +2394,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,26,32,0,0 ; vbroadcastss 0x201a(%rip),%ymm0 # 47c4 <_sk_callback_hsw+0x363>
+ DB 196,226,125,24,5,26,32,0,0 ; vbroadcastss 0x201a(%rip),%ymm0 # 48ec <_sk_callback_hsw+0x363>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,17,32,0,0 ; vbroadcastss 0x2011(%rip),%ymm8 # 47c8 <_sk_callback_hsw+0x367>
+ DB 196,98,125,24,5,17,32,0,0 ; vbroadcastss 0x2011(%rip),%ymm8 # 48f0 <_sk_callback_hsw+0x367>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2357,11 +2408,11 @@ _sk_load_a8_hsw LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,45 ; jne 27fd <_sk_load_a8_hsw+0x3d>
+ DB 117,45 ; jne 2925 <_sk_load_a8_hsw+0x3d>
DB 197,250,126,0 ; vmovq (%rax),%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,230,31,0,0 ; vbroadcastss 0x1fe6(%rip),%ymm1 # 47cc <_sk_callback_hsw+0x36b>
+ DB 196,226,125,24,13,230,31,0,0 ; vbroadcastss 0x1fe6(%rip),%ymm1 # 48f4 <_sk_callback_hsw+0x36b>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2378,9 +2429,9 @@ _sk_load_a8_hsw LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 2805 <_sk_load_a8_hsw+0x45>
+ DB 117,234 ; jne 292d <_sk_load_a8_hsw+0x45>
DB 196,193,249,110,193 ; vmovq %r9,%xmm0
- DB 235,178 ; jmp 27d4 <_sk_load_a8_hsw+0x14>
+ DB 235,178 ; jmp 28fc <_sk_load_a8_hsw+0x14>
PUBLIC _sk_gather_a8_hsw
_sk_gather_a8_hsw LABEL PROC
@@ -2424,7 +2475,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,241,30,0,0 ; vbroadcastss 0x1ef1(%rip),%ymm1 # 47d0 <_sk_callback_hsw+0x36f>
+ DB 196,226,125,24,13,241,30,0,0 ; vbroadcastss 0x1ef1(%rip),%ymm1 # 48f8 <_sk_callback_hsw+0x36f>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2440,14 +2491,14 @@ PUBLIC _sk_store_a8_hsw
_sk_store_a8_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 196,98,125,24,5,204,30,0,0 ; vbroadcastss 0x1ecc(%rip),%ymm8 # 47d4 <_sk_callback_hsw+0x373>
+ DB 196,98,125,24,5,204,30,0,0 ; vbroadcastss 0x1ecc(%rip),%ymm8 # 48fc <_sk_callback_hsw+0x373>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,10 ; jne 2931 <_sk_store_a8_hsw+0x37>
+ DB 117,10 ; jne 2a59 <_sk_store_a8_hsw+0x37>
DB 196,65,123,17,4,58 ; vmovsd %xmm8,(%r10,%rdi,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2455,10 +2506,10 @@ _sk_store_a8_hsw LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,236 ; ja 292d <_sk_store_a8_hsw+0x33>
+ DB 119,236 ; ja 2a55 <_sk_store_a8_hsw+0x33>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,67,0,0,0 ; lea 0x43(%rip),%r9 # 2994 <_sk_store_a8_hsw+0x9a>
+ DB 76,141,13,67,0,0,0 ; lea 0x43(%rip),%r9 # 2abc <_sk_store_a8_hsw+0x9a>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -2469,7 +2520,7 @@ _sk_store_a8_hsw LABEL PROC
DB 196,67,121,20,68,58,2,4 ; vpextrb $0x4,%xmm8,0x2(%r10,%rdi,1)
DB 196,67,121,20,68,58,1,2 ; vpextrb $0x2,%xmm8,0x1(%r10,%rdi,1)
DB 196,67,121,20,4,58,0 ; vpextrb $0x0,%xmm8,(%r10,%rdi,1)
- DB 235,154 ; jmp 292d <_sk_store_a8_hsw+0x33>
+ DB 235,154 ; jmp 2a55 <_sk_store_a8_hsw+0x33>
DB 144 ; nop
DB 246,255 ; idiv %bh
DB 255 ; (bad)
@@ -2501,14 +2552,14 @@ _sk_load_g8_hsw LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,50 ; jne 29f2 <_sk_load_g8_hsw+0x42>
+ DB 117,50 ; jne 2b1a <_sk_load_g8_hsw+0x42>
DB 197,250,126,0 ; vmovq (%rax),%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,2,30,0,0 ; vbroadcastss 0x1e02(%rip),%ymm1 # 47d8 <_sk_callback_hsw+0x377>
+ DB 196,226,125,24,13,2,30,0,0 ; vbroadcastss 0x1e02(%rip),%ymm1 # 4900 <_sk_callback_hsw+0x377>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,247,29,0,0 ; vbroadcastss 0x1df7(%rip),%ymm3 # 47dc <_sk_callback_hsw+0x37b>
+ DB 196,226,125,24,29,247,29,0,0 ; vbroadcastss 0x1df7(%rip),%ymm3 # 4904 <_sk_callback_hsw+0x37b>
DB 76,137,193 ; mov %r8,%rcx
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
@@ -2522,9 +2573,9 @@ _sk_load_g8_hsw LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 29fa <_sk_load_g8_hsw+0x4a>
+ DB 117,234 ; jne 2b22 <_sk_load_g8_hsw+0x4a>
DB 196,193,249,110,193 ; vmovq %r9,%xmm0
- DB 235,173 ; jmp 29c4 <_sk_load_g8_hsw+0x14>
+ DB 235,173 ; jmp 2aec <_sk_load_g8_hsw+0x14>
PUBLIC _sk_gather_g8_hsw
_sk_gather_g8_hsw LABEL PROC
@@ -2568,10 +2619,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,12,29,0,0 ; vbroadcastss 0x1d0c(%rip),%ymm1 # 47e0 <_sk_callback_hsw+0x37f>
+ DB 196,226,125,24,13,12,29,0,0 ; vbroadcastss 0x1d0c(%rip),%ymm1 # 4908 <_sk_callback_hsw+0x37f>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,1,29,0,0 ; vbroadcastss 0x1d01(%rip),%ymm3 # 47e4 <_sk_callback_hsw+0x383>
+ DB 196,226,125,24,29,1,29,0,0 ; vbroadcastss 0x1d01(%rip),%ymm3 # 490c <_sk_callback_hsw+0x383>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -2585,9 +2636,9 @@ _sk_gather_i8_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,192 ; mov %rax,%r8
DB 77,133,192 ; test %r8,%r8
- DB 116,5 ; je 2b03 <_sk_gather_i8_hsw+0xf>
+ DB 116,5 ; je 2c2b <_sk_gather_i8_hsw+0xf>
DB 76,137,192 ; mov %r8,%rax
- DB 235,2 ; jmp 2b05 <_sk_gather_i8_hsw+0x11>
+ DB 235,2 ; jmp 2c2d <_sk_gather_i8_hsw+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,87 ; push %r15
DB 65,86 ; push %r14
@@ -2625,14 +2676,14 @@ _sk_gather_i8_hsw LABEL PROC
DB 73,139,64,8 ; mov 0x8(%r8),%rax
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,226,117,144,28,128 ; vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3
- DB 197,229,219,5,13,30,0,0 ; vpand 0x1e0d(%rip),%ymm3,%ymm0 # 49c0 <_sk_callback_hsw+0x55f>
+ DB 197,229,219,5,5,30,0,0 ; vpand 0x1e05(%rip),%ymm3,%ymm0 # 4ae0 <_sk_callback_hsw+0x557>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,40,28,0,0 ; vbroadcastss 0x1c28(%rip),%ymm8 # 47e8 <_sk_callback_hsw+0x387>
+ DB 196,98,125,24,5,40,28,0,0 ; vbroadcastss 0x1c28(%rip),%ymm8 # 4910 <_sk_callback_hsw+0x387>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,18,30,0,0 ; vpshufb 0x1e12(%rip),%ymm3,%ymm1 # 49e0 <_sk_callback_hsw+0x57f>
+ DB 196,226,101,0,13,10,30,0,0 ; vpshufb 0x1e0a(%rip),%ymm3,%ymm1 # 4b00 <_sk_callback_hsw+0x577>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,32,30,0,0 ; vpshufb 0x1e20(%rip),%ymm3,%ymm2 # 4a00 <_sk_callback_hsw+0x59f>
+ DB 196,226,101,0,21,24,30,0,0 ; vpshufb 0x1e18(%rip),%ymm3,%ymm2 # 4b20 <_sk_callback_hsw+0x597>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -2651,35 +2702,35 @@ _sk_load_565_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 72,133,201 ; test %rcx,%rcx
- DB 117,114 ; jne 2c80 <_sk_load_565_hsw+0x7c>
+ DB 117,114 ; jne 2da8 <_sk_load_565_hsw+0x7c>
DB 196,193,122,111,4,122 ; vmovdqu (%r10,%rdi,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,202,27,0,0 ; vpbroadcastd 0x1bca(%rip),%ymm0 # 47ec <_sk_callback_hsw+0x38b>
+ DB 196,226,125,88,5,202,27,0,0 ; vpbroadcastd 0x1bca(%rip),%ymm0 # 4914 <_sk_callback_hsw+0x38b>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,189,27,0,0 ; vbroadcastss 0x1bbd(%rip),%ymm1 # 47f0 <_sk_callback_hsw+0x38f>
+ DB 196,226,125,24,13,189,27,0,0 ; vbroadcastss 0x1bbd(%rip),%ymm1 # 4918 <_sk_callback_hsw+0x38f>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,180,27,0,0 ; vpbroadcastd 0x1bb4(%rip),%ymm1 # 47f4 <_sk_callback_hsw+0x393>
+ DB 196,226,125,88,13,180,27,0,0 ; vpbroadcastd 0x1bb4(%rip),%ymm1 # 491c <_sk_callback_hsw+0x393>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,167,27,0,0 ; vbroadcastss 0x1ba7(%rip),%ymm3 # 47f8 <_sk_callback_hsw+0x397>
+ DB 196,226,125,24,29,167,27,0,0 ; vbroadcastss 0x1ba7(%rip),%ymm3 # 4920 <_sk_callback_hsw+0x397>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,158,27,0,0 ; vpbroadcastd 0x1b9e(%rip),%ymm3 # 47fc <_sk_callback_hsw+0x39b>
+ DB 196,226,125,88,29,158,27,0,0 ; vpbroadcastd 0x1b9e(%rip),%ymm3 # 4924 <_sk_callback_hsw+0x39b>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,145,27,0,0 ; vbroadcastss 0x1b91(%rip),%ymm3 # 4800 <_sk_callback_hsw+0x39f>
+ DB 196,226,125,24,29,145,27,0,0 ; vbroadcastss 0x1b91(%rip),%ymm3 # 4928 <_sk_callback_hsw+0x39f>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,134,27,0,0 ; vbroadcastss 0x1b86(%rip),%ymm3 # 4804 <_sk_callback_hsw+0x3a3>
+ DB 196,226,125,24,29,134,27,0,0 ; vbroadcastss 0x1b86(%rip),%ymm3 # 492c <_sk_callback_hsw+0x3a3>
DB 255,224 ; jmpq *%rax
DB 65,137,200 ; mov %ecx,%r8d
DB 65,128,224,7 ; and $0x7,%r8b
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,128 ; ja 2c14 <_sk_load_565_hsw+0x10>
+ DB 119,128 ; ja 2d3c <_sk_load_565_hsw+0x10>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,73,0,0,0 ; lea 0x49(%rip),%r9 # 2ce8 <_sk_load_565_hsw+0xe4>
+ DB 76,141,13,73,0,0,0 ; lea 0x49(%rip),%r9 # 2e10 <_sk_load_565_hsw+0xe4>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -2691,7 +2742,7 @@ _sk_load_565_hsw LABEL PROC
DB 196,193,121,196,68,122,4,2 ; vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,68,122,2,1 ; vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,4,122,0 ; vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- DB 233,44,255,255,255 ; jmpq 2c14 <_sk_load_565_hsw+0x10>
+ DB 233,44,255,255,255 ; jmpq 2d3c <_sk_load_565_hsw+0x10>
DB 244 ; hlt
DB 255 ; (bad)
DB 255 ; (bad)
@@ -2759,23 +2810,23 @@ _sk_gather_565_hsw LABEL PROC
DB 65,15,183,4,88 ; movzwl (%r8,%rbx,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,73,26,0,0 ; vpbroadcastd 0x1a49(%rip),%ymm0 # 4808 <_sk_callback_hsw+0x3a7>
+ DB 196,226,125,88,5,73,26,0,0 ; vpbroadcastd 0x1a49(%rip),%ymm0 # 4930 <_sk_callback_hsw+0x3a7>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,60,26,0,0 ; vbroadcastss 0x1a3c(%rip),%ymm1 # 480c <_sk_callback_hsw+0x3ab>
+ DB 196,226,125,24,13,60,26,0,0 ; vbroadcastss 0x1a3c(%rip),%ymm1 # 4934 <_sk_callback_hsw+0x3ab>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,51,26,0,0 ; vpbroadcastd 0x1a33(%rip),%ymm1 # 4810 <_sk_callback_hsw+0x3af>
+ DB 196,226,125,88,13,51,26,0,0 ; vpbroadcastd 0x1a33(%rip),%ymm1 # 4938 <_sk_callback_hsw+0x3af>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,38,26,0,0 ; vbroadcastss 0x1a26(%rip),%ymm3 # 4814 <_sk_callback_hsw+0x3b3>
+ DB 196,226,125,24,29,38,26,0,0 ; vbroadcastss 0x1a26(%rip),%ymm3 # 493c <_sk_callback_hsw+0x3b3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,29,26,0,0 ; vpbroadcastd 0x1a1d(%rip),%ymm3 # 4818 <_sk_callback_hsw+0x3b7>
+ DB 196,226,125,88,29,29,26,0,0 ; vpbroadcastd 0x1a1d(%rip),%ymm3 # 4940 <_sk_callback_hsw+0x3b7>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,16,26,0,0 ; vbroadcastss 0x1a10(%rip),%ymm3 # 481c <_sk_callback_hsw+0x3bb>
+ DB 196,226,125,24,29,16,26,0,0 ; vbroadcastss 0x1a10(%rip),%ymm3 # 4944 <_sk_callback_hsw+0x3bb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,5,26,0,0 ; vbroadcastss 0x1a05(%rip),%ymm3 # 4820 <_sk_callback_hsw+0x3bf>
+ DB 196,226,125,24,29,5,26,0,0 ; vbroadcastss 0x1a05(%rip),%ymm3 # 4948 <_sk_callback_hsw+0x3bf>
DB 91 ; pop %rbx
DB 65,92 ; pop %r12
DB 65,94 ; pop %r14
@@ -2786,11 +2837,11 @@ PUBLIC _sk_store_565_hsw
_sk_store_565_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 196,98,125,24,5,242,25,0,0 ; vbroadcastss 0x19f2(%rip),%ymm8 # 4824 <_sk_callback_hsw+0x3c3>
+ DB 196,98,125,24,5,242,25,0,0 ; vbroadcastss 0x19f2(%rip),%ymm8 # 494c <_sk_callback_hsw+0x3c3>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,221,25,0,0 ; vbroadcastss 0x19dd(%rip),%ymm10 # 4828 <_sk_callback_hsw+0x3c7>
+ DB 196,98,125,24,21,221,25,0,0 ; vbroadcastss 0x19dd(%rip),%ymm10 # 4950 <_sk_callback_hsw+0x3c7>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -2801,7 +2852,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,10 ; jne 2e89 <_sk_store_565_hsw+0x65>
+ DB 117,10 ; jne 2fb1 <_sk_store_565_hsw+0x65>
DB 196,65,122,127,4,122 ; vmovdqu %xmm8,(%r10,%rdi,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2809,9 +2860,9 @@ _sk_store_565_hsw LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,236 ; ja 2e85 <_sk_store_565_hsw+0x61>
+ DB 119,236 ; ja 2fad <_sk_store_565_hsw+0x61>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,68,0,0,0 ; lea 0x44(%rip),%r9 # 2ee8 <_sk_store_565_hsw+0xc4>
+ DB 76,141,13,68,0,0,0 ; lea 0x44(%rip),%r9 # 3010 <_sk_store_565_hsw+0xc4>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -2822,7 +2873,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,121,21,68,122,4,2 ; vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
DB 196,67,121,21,68,122,2,1 ; vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
DB 196,67,121,21,4,122,0 ; vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- DB 235,159 ; jmp 2e85 <_sk_store_565_hsw+0x61>
+ DB 235,159 ; jmp 2fad <_sk_store_565_hsw+0x61>
DB 102,144 ; xchg %ax,%ax
DB 245 ; cmc
DB 255 ; (bad)
@@ -2853,28 +2904,28 @@ _sk_load_4444_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,138,0,0,0 ; jne 2f9c <_sk_load_4444_hsw+0x98>
+ DB 15,133,138,0,0,0 ; jne 30c4 <_sk_load_4444_hsw+0x98>
DB 196,193,122,111,4,122 ; vmovdqu (%r10,%rdi,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,6,25,0,0 ; vpbroadcastd 0x1906(%rip),%ymm0 # 482c <_sk_callback_hsw+0x3cb>
+ DB 196,226,125,88,5,6,25,0,0 ; vpbroadcastd 0x1906(%rip),%ymm0 # 4954 <_sk_callback_hsw+0x3cb>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,249,24,0,0 ; vbroadcastss 0x18f9(%rip),%ymm1 # 4830 <_sk_callback_hsw+0x3cf>
+ DB 196,226,125,24,13,249,24,0,0 ; vbroadcastss 0x18f9(%rip),%ymm1 # 4958 <_sk_callback_hsw+0x3cf>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,240,24,0,0 ; vpbroadcastd 0x18f0(%rip),%ymm1 # 4834 <_sk_callback_hsw+0x3d3>
+ DB 196,226,125,88,13,240,24,0,0 ; vpbroadcastd 0x18f0(%rip),%ymm1 # 495c <_sk_callback_hsw+0x3d3>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,227,24,0,0 ; vbroadcastss 0x18e3(%rip),%ymm2 # 4838 <_sk_callback_hsw+0x3d7>
+ DB 196,226,125,24,21,227,24,0,0 ; vbroadcastss 0x18e3(%rip),%ymm2 # 4960 <_sk_callback_hsw+0x3d7>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,218,24,0,0 ; vpbroadcastd 0x18da(%rip),%ymm2 # 483c <_sk_callback_hsw+0x3db>
+ DB 196,226,125,88,21,218,24,0,0 ; vpbroadcastd 0x18da(%rip),%ymm2 # 4964 <_sk_callback_hsw+0x3db>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,205,24,0,0 ; vbroadcastss 0x18cd(%rip),%ymm8 # 4840 <_sk_callback_hsw+0x3df>
+ DB 196,98,125,24,5,205,24,0,0 ; vbroadcastss 0x18cd(%rip),%ymm8 # 4968 <_sk_callback_hsw+0x3df>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,195,24,0,0 ; vpbroadcastd 0x18c3(%rip),%ymm8 # 4844 <_sk_callback_hsw+0x3e3>
+ DB 196,98,125,88,5,195,24,0,0 ; vpbroadcastd 0x18c3(%rip),%ymm8 # 496c <_sk_callback_hsw+0x3e3>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,181,24,0,0 ; vbroadcastss 0x18b5(%rip),%ymm8 # 4848 <_sk_callback_hsw+0x3e7>
+ DB 196,98,125,24,5,181,24,0,0 ; vbroadcastss 0x18b5(%rip),%ymm8 # 4970 <_sk_callback_hsw+0x3e7>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2883,9 +2934,9 @@ _sk_load_4444_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 15,135,100,255,255,255 ; ja 2f18 <_sk_load_4444_hsw+0x14>
+ DB 15,135,100,255,255,255 ; ja 3040 <_sk_load_4444_hsw+0x14>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,73,0,0,0 ; lea 0x49(%rip),%r9 # 3008 <_sk_load_4444_hsw+0x104>
+ DB 76,141,13,73,0,0,0 ; lea 0x49(%rip),%r9 # 3130 <_sk_load_4444_hsw+0x104>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -2897,7 +2948,7 @@ _sk_load_4444_hsw LABEL PROC
DB 196,193,121,196,68,122,4,2 ; vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,68,122,2,1 ; vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,4,122,0 ; vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- DB 233,16,255,255,255 ; jmpq 2f18 <_sk_load_4444_hsw+0x14>
+ DB 233,16,255,255,255 ; jmpq 3040 <_sk_load_4444_hsw+0x14>
DB 244 ; hlt
DB 255 ; (bad)
DB 255 ; (bad)
@@ -2965,25 +3016,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 65,15,183,4,88 ; movzwl (%r8,%rbx,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,109,23,0,0 ; vpbroadcastd 0x176d(%rip),%ymm0 # 484c <_sk_callback_hsw+0x3eb>
+ DB 196,226,125,88,5,109,23,0,0 ; vpbroadcastd 0x176d(%rip),%ymm0 # 4974 <_sk_callback_hsw+0x3eb>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,96,23,0,0 ; vbroadcastss 0x1760(%rip),%ymm1 # 4850 <_sk_callback_hsw+0x3ef>
+ DB 196,226,125,24,13,96,23,0,0 ; vbroadcastss 0x1760(%rip),%ymm1 # 4978 <_sk_callback_hsw+0x3ef>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,87,23,0,0 ; vpbroadcastd 0x1757(%rip),%ymm1 # 4854 <_sk_callback_hsw+0x3f3>
+ DB 196,226,125,88,13,87,23,0,0 ; vpbroadcastd 0x1757(%rip),%ymm1 # 497c <_sk_callback_hsw+0x3f3>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,74,23,0,0 ; vbroadcastss 0x174a(%rip),%ymm2 # 4858 <_sk_callback_hsw+0x3f7>
+ DB 196,226,125,24,21,74,23,0,0 ; vbroadcastss 0x174a(%rip),%ymm2 # 4980 <_sk_callback_hsw+0x3f7>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,65,23,0,0 ; vpbroadcastd 0x1741(%rip),%ymm2 # 485c <_sk_callback_hsw+0x3fb>
+ DB 196,226,125,88,21,65,23,0,0 ; vpbroadcastd 0x1741(%rip),%ymm2 # 4984 <_sk_callback_hsw+0x3fb>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,52,23,0,0 ; vbroadcastss 0x1734(%rip),%ymm8 # 4860 <_sk_callback_hsw+0x3ff>
+ DB 196,98,125,24,5,52,23,0,0 ; vbroadcastss 0x1734(%rip),%ymm8 # 4988 <_sk_callback_hsw+0x3ff>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,42,23,0,0 ; vpbroadcastd 0x172a(%rip),%ymm8 # 4864 <_sk_callback_hsw+0x403>
+ DB 196,98,125,88,5,42,23,0,0 ; vpbroadcastd 0x172a(%rip),%ymm8 # 498c <_sk_callback_hsw+0x403>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,28,23,0,0 ; vbroadcastss 0x171c(%rip),%ymm8 # 4868 <_sk_callback_hsw+0x407>
+ DB 196,98,125,24,5,28,23,0,0 ; vbroadcastss 0x171c(%rip),%ymm8 # 4990 <_sk_callback_hsw+0x407>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -2996,7 +3047,7 @@ PUBLIC _sk_store_4444_hsw
_sk_store_4444_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 196,98,125,24,5,2,23,0,0 ; vbroadcastss 0x1702(%rip),%ymm8 # 486c <_sk_callback_hsw+0x40b>
+ DB 196,98,125,24,5,2,23,0,0 ; vbroadcastss 0x1702(%rip),%ymm8 # 4994 <_sk_callback_hsw+0x40b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3014,7 +3065,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,10 ; jne 31cd <_sk_store_4444_hsw+0x71>
+ DB 117,10 ; jne 32f5 <_sk_store_4444_hsw+0x71>
DB 196,65,122,127,4,122 ; vmovdqu %xmm8,(%r10,%rdi,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3022,9 +3073,9 @@ _sk_store_4444_hsw LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,236 ; ja 31c9 <_sk_store_4444_hsw+0x6d>
+ DB 119,236 ; ja 32f1 <_sk_store_4444_hsw+0x6d>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,68,0,0,0 ; lea 0x44(%rip),%r9 # 322c <_sk_store_4444_hsw+0xd0>
+ DB 76,141,13,68,0,0,0 ; lea 0x44(%rip),%r9 # 3354 <_sk_store_4444_hsw+0xd0>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -3035,7 +3086,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,121,21,68,122,4,2 ; vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
DB 196,67,121,21,68,122,2,1 ; vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
DB 196,67,121,21,4,122,0 ; vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- DB 235,159 ; jmp 31c9 <_sk_store_4444_hsw+0x6d>
+ DB 235,159 ; jmp 32f1 <_sk_store_4444_hsw+0x6d>
DB 102,144 ; xchg %ax,%ax
DB 245 ; cmc
DB 255 ; (bad)
@@ -3068,16 +3119,16 @@ _sk_load_8888_hsw LABEL PROC
DB 76,141,12,189,0,0,0,0 ; lea 0x0(,%rdi,4),%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 117,88 ; jne 32b5 <_sk_load_8888_hsw+0x6d>
+ DB 117,88 ; jne 33dd <_sk_load_8888_hsw+0x6d>
DB 196,193,126,111,25 ; vmovdqu (%r9),%ymm3
- DB 197,229,219,5,182,23,0,0 ; vpand 0x17b6(%rip),%ymm3,%ymm0 # 4a20 <_sk_callback_hsw+0x5bf>
+ DB 197,229,219,5,174,23,0,0 ; vpand 0x17ae(%rip),%ymm3,%ymm0 # 4b40 <_sk_callback_hsw+0x5b7>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,249,21,0,0 ; vbroadcastss 0x15f9(%rip),%ymm8 # 4870 <_sk_callback_hsw+0x40f>
+ DB 196,98,125,24,5,249,21,0,0 ; vbroadcastss 0x15f9(%rip),%ymm8 # 4998 <_sk_callback_hsw+0x40f>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,187,23,0,0 ; vpshufb 0x17bb(%rip),%ymm3,%ymm1 # 4a40 <_sk_callback_hsw+0x5df>
+ DB 196,226,101,0,13,179,23,0,0 ; vpshufb 0x17b3(%rip),%ymm3,%ymm1 # 4b60 <_sk_callback_hsw+0x5d7>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,201,23,0,0 ; vpshufb 0x17c9(%rip),%ymm3,%ymm2 # 4a60 <_sk_callback_hsw+0x5ff>
+ DB 196,226,101,0,21,193,23,0,0 ; vpshufb 0x17c1(%rip),%ymm3,%ymm2 # 4b80 <_sk_callback_hsw+0x5f7>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3094,7 +3145,7 @@ _sk_load_8888_hsw LABEL PROC
DB 196,225,249,110,192 ; vmovq %rax,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,194,125,140,25 ; vpmaskmovd (%r9),%ymm0,%ymm3
- DB 235,135 ; jmp 3262 <_sk_load_8888_hsw+0x1a>
+ DB 235,135 ; jmp 338a <_sk_load_8888_hsw+0x1a>
PUBLIC _sk_gather_8888_hsw
_sk_gather_8888_hsw LABEL PROC
@@ -3107,14 +3158,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,128 ; vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- DB 197,229,219,5,119,23,0,0 ; vpand 0x1777(%rip),%ymm3,%ymm0 # 4a80 <_sk_callback_hsw+0x61f>
+ DB 197,229,219,5,111,23,0,0 ; vpand 0x176f(%rip),%ymm3,%ymm0 # 4ba0 <_sk_callback_hsw+0x617>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,94,21,0,0 ; vbroadcastss 0x155e(%rip),%ymm8 # 4874 <_sk_callback_hsw+0x413>
+ DB 196,98,125,24,5,94,21,0,0 ; vbroadcastss 0x155e(%rip),%ymm8 # 499c <_sk_callback_hsw+0x413>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,124,23,0,0 ; vpshufb 0x177c(%rip),%ymm3,%ymm1 # 4aa0 <_sk_callback_hsw+0x63f>
+ DB 196,226,101,0,13,116,23,0,0 ; vpshufb 0x1774(%rip),%ymm3,%ymm1 # 4bc0 <_sk_callback_hsw+0x637>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,138,23,0,0 ; vpshufb 0x178a(%rip),%ymm3,%ymm2 # 4ac0 <_sk_callback_hsw+0x65f>
+ DB 196,226,101,0,21,130,23,0,0 ; vpshufb 0x1782(%rip),%ymm3,%ymm2 # 4be0 <_sk_callback_hsw+0x657>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3129,7 +3180,7 @@ _sk_store_8888_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,141,12,189,0,0,0,0 ; lea 0x0(,%rdi,4),%r9
DB 76,3,8 ; add (%rax),%r9
- DB 196,98,125,24,5,14,21,0,0 ; vbroadcastss 0x150e(%rip),%ymm8 # 4878 <_sk_callback_hsw+0x417>
+ DB 196,98,125,24,5,14,21,0,0 ; vbroadcastss 0x150e(%rip),%ymm8 # 49a0 <_sk_callback_hsw+0x417>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -3145,7 +3196,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,12 ; jne 33c4 <_sk_store_8888_hsw+0x73>
+ DB 117,12 ; jne 34ec <_sk_store_8888_hsw+0x73>
DB 196,65,126,127,1 ; vmovdqu %ymm8,(%r9)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,193 ; mov %r8,%rcx
@@ -3158,14 +3209,14 @@ _sk_store_8888_hsw LABEL PROC
DB 196,97,249,110,200 ; vmovq %rax,%xmm9
DB 196,66,125,33,201 ; vpmovsxbd %xmm9,%ymm9
DB 196,66,53,142,1 ; vpmaskmovd %ymm8,%ymm9,(%r9)
- DB 235,211 ; jmp 33bd <_sk_store_8888_hsw+0x6c>
+ DB 235,211 ; jmp 34e5 <_sk_store_8888_hsw+0x6c>
PUBLIC _sk_load_f16_hsw
_sk_load_f16_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 72,133,201 ; test %rcx,%rcx
- DB 117,97 ; jne 3455 <_sk_load_f16_hsw+0x6b>
+ DB 117,97 ; jne 357d <_sk_load_f16_hsw+0x6b>
DB 197,121,16,4,248 ; vmovupd (%rax,%rdi,8),%xmm8
DB 197,249,16,84,248,16 ; vmovupd 0x10(%rax,%rdi,8),%xmm2
DB 197,249,16,92,248,32 ; vmovupd 0x20(%rax,%rdi,8),%xmm3
@@ -3191,29 +3242,29 @@ _sk_load_f16_hsw LABEL PROC
DB 197,123,16,4,248 ; vmovsd (%rax,%rdi,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,79 ; je 34b4 <_sk_load_f16_hsw+0xca>
+ DB 116,79 ; je 35dc <_sk_load_f16_hsw+0xca>
DB 197,57,22,68,248,8 ; vmovhpd 0x8(%rax,%rdi,8),%xmm8,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,67 ; jb 34b4 <_sk_load_f16_hsw+0xca>
+ DB 114,67 ; jb 35dc <_sk_load_f16_hsw+0xca>
DB 197,251,16,84,248,16 ; vmovsd 0x10(%rax,%rdi,8),%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 116,68 ; je 34c1 <_sk_load_f16_hsw+0xd7>
+ DB 116,68 ; je 35e9 <_sk_load_f16_hsw+0xd7>
DB 197,233,22,84,248,24 ; vmovhpd 0x18(%rax,%rdi,8),%xmm2,%xmm2
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,56 ; jb 34c1 <_sk_load_f16_hsw+0xd7>
+ DB 114,56 ; jb 35e9 <_sk_load_f16_hsw+0xd7>
DB 197,251,16,92,248,32 ; vmovsd 0x20(%rax,%rdi,8),%xmm3
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 15,132,114,255,255,255 ; je 340b <_sk_load_f16_hsw+0x21>
+ DB 15,132,114,255,255,255 ; je 3533 <_sk_load_f16_hsw+0x21>
DB 197,225,22,92,248,40 ; vmovhpd 0x28(%rax,%rdi,8),%xmm3,%xmm3
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 15,130,98,255,255,255 ; jb 340b <_sk_load_f16_hsw+0x21>
+ DB 15,130,98,255,255,255 ; jb 3533 <_sk_load_f16_hsw+0x21>
DB 197,122,126,76,248,48 ; vmovq 0x30(%rax,%rdi,8),%xmm9
- DB 233,87,255,255,255 ; jmpq 340b <_sk_load_f16_hsw+0x21>
+ DB 233,87,255,255,255 ; jmpq 3533 <_sk_load_f16_hsw+0x21>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,74,255,255,255 ; jmpq 340b <_sk_load_f16_hsw+0x21>
+ DB 233,74,255,255,255 ; jmpq 3533 <_sk_load_f16_hsw+0x21>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,65,255,255,255 ; jmpq 340b <_sk_load_f16_hsw+0x21>
+ DB 233,65,255,255,255 ; jmpq 3533 <_sk_load_f16_hsw+0x21>
PUBLIC _sk_gather_f16_hsw
_sk_gather_f16_hsw LABEL PROC
@@ -3267,7 +3318,7 @@ _sk_store_f16_hsw LABEL PROC
DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9
DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,27 ; jne 35b9 <_sk_store_f16_hsw+0x65>
+ DB 117,27 ; jne 36e1 <_sk_store_f16_hsw+0x65>
DB 197,120,17,28,248 ; vmovups %xmm11,(%rax,%rdi,8)
DB 197,120,17,84,248,16 ; vmovups %xmm10,0x10(%rax,%rdi,8)
DB 197,120,17,76,248,32 ; vmovups %xmm9,0x20(%rax,%rdi,8)
@@ -3276,22 +3327,22 @@ _sk_store_f16_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 197,121,214,28,248 ; vmovq %xmm11,(%rax,%rdi,8)
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,241 ; je 35b5 <_sk_store_f16_hsw+0x61>
+ DB 116,241 ; je 36dd <_sk_store_f16_hsw+0x61>
DB 197,121,23,92,248,8 ; vmovhpd %xmm11,0x8(%rax,%rdi,8)
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,229 ; jb 35b5 <_sk_store_f16_hsw+0x61>
+ DB 114,229 ; jb 36dd <_sk_store_f16_hsw+0x61>
DB 197,121,214,84,248,16 ; vmovq %xmm10,0x10(%rax,%rdi,8)
- DB 116,221 ; je 35b5 <_sk_store_f16_hsw+0x61>
+ DB 116,221 ; je 36dd <_sk_store_f16_hsw+0x61>
DB 197,121,23,84,248,24 ; vmovhpd %xmm10,0x18(%rax,%rdi,8)
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,209 ; jb 35b5 <_sk_store_f16_hsw+0x61>
+ DB 114,209 ; jb 36dd <_sk_store_f16_hsw+0x61>
DB 197,121,214,76,248,32 ; vmovq %xmm9,0x20(%rax,%rdi,8)
- DB 116,201 ; je 35b5 <_sk_store_f16_hsw+0x61>
+ DB 116,201 ; je 36dd <_sk_store_f16_hsw+0x61>
DB 197,121,23,76,248,40 ; vmovhpd %xmm9,0x28(%rax,%rdi,8)
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,189 ; jb 35b5 <_sk_store_f16_hsw+0x61>
+ DB 114,189 ; jb 36dd <_sk_store_f16_hsw+0x61>
DB 197,121,214,68,248,48 ; vmovq %xmm8,0x30(%rax,%rdi,8)
- DB 235,181 ; jmp 35b5 <_sk_store_f16_hsw+0x61>
+ DB 235,181 ; jmp 36dd <_sk_store_f16_hsw+0x61>
PUBLIC _sk_load_u16_be_hsw
_sk_load_u16_be_hsw LABEL PROC
@@ -3299,7 +3350,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 72,141,4,189,0,0,0,0 ; lea 0x0(,%rdi,4),%rax
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,204,0,0,0 ; jne 36e2 <_sk_load_u16_be_hsw+0xe2>
+ DB 15,133,204,0,0,0 ; jne 380a <_sk_load_u16_be_hsw+0xe2>
DB 196,65,121,16,4,64 ; vmovupd (%r8,%rax,2),%xmm8
DB 196,193,121,16,84,64,16 ; vmovupd 0x10(%r8,%rax,2),%xmm2
DB 196,193,121,16,92,64,32 ; vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -3318,7 +3369,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,5,18,0,0 ; vbroadcastss 0x1205(%rip),%ymm10 # 487c <_sk_callback_hsw+0x41b>
+ DB 196,98,125,24,21,5,18,0,0 ; vbroadcastss 0x1205(%rip),%ymm10 # 49a4 <_sk_callback_hsw+0x41b>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -3346,29 +3397,29 @@ _sk_load_u16_be_hsw LABEL PROC
DB 196,65,123,16,4,64 ; vmovsd (%r8,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,85 ; je 3748 <_sk_load_u16_be_hsw+0x148>
+ DB 116,85 ; je 3870 <_sk_load_u16_be_hsw+0x148>
DB 196,65,57,22,68,64,8 ; vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,72 ; jb 3748 <_sk_load_u16_be_hsw+0x148>
+ DB 114,72 ; jb 3870 <_sk_load_u16_be_hsw+0x148>
DB 196,193,123,16,84,64,16 ; vmovsd 0x10(%r8,%rax,2),%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 116,72 ; je 3755 <_sk_load_u16_be_hsw+0x155>
+ DB 116,72 ; je 387d <_sk_load_u16_be_hsw+0x155>
DB 196,193,105,22,84,64,24 ; vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,59 ; jb 3755 <_sk_load_u16_be_hsw+0x155>
+ DB 114,59 ; jb 387d <_sk_load_u16_be_hsw+0x155>
DB 196,193,123,16,92,64,32 ; vmovsd 0x20(%r8,%rax,2),%xmm3
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 15,132,6,255,255,255 ; je 3631 <_sk_load_u16_be_hsw+0x31>
+ DB 15,132,6,255,255,255 ; je 3759 <_sk_load_u16_be_hsw+0x31>
DB 196,193,97,22,92,64,40 ; vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 15,130,245,254,255,255 ; jb 3631 <_sk_load_u16_be_hsw+0x31>
+ DB 15,130,245,254,255,255 ; jb 3759 <_sk_load_u16_be_hsw+0x31>
DB 196,65,122,126,76,64,48 ; vmovq 0x30(%r8,%rax,2),%xmm9
- DB 233,233,254,255,255 ; jmpq 3631 <_sk_load_u16_be_hsw+0x31>
+ DB 233,233,254,255,255 ; jmpq 3759 <_sk_load_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,220,254,255,255 ; jmpq 3631 <_sk_load_u16_be_hsw+0x31>
+ DB 233,220,254,255,255 ; jmpq 3759 <_sk_load_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,211,254,255,255 ; jmpq 3631 <_sk_load_u16_be_hsw+0x31>
+ DB 233,211,254,255,255 ; jmpq 3759 <_sk_load_u16_be_hsw+0x31>
PUBLIC _sk_load_rgb_u16_be_hsw
_sk_load_rgb_u16_be_hsw LABEL PROC
@@ -3376,7 +3427,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 72,141,4,127 ; lea (%rdi,%rdi,2),%rax
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,204,0,0,0 ; jne 383c <_sk_load_rgb_u16_be_hsw+0xde>
+ DB 15,133,204,0,0,0 ; jne 3964 <_sk_load_rgb_u16_be_hsw+0xde>
DB 196,193,122,111,4,64 ; vmovdqu (%r8,%rax,2),%xmm0
DB 196,193,122,111,84,64,12 ; vmovdqu 0xc(%r8,%rax,2),%xmm2
DB 196,193,122,111,76,64,24 ; vmovdqu 0x18(%r8,%rax,2),%xmm1
@@ -3400,7 +3451,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,150,16,0,0 ; vbroadcastss 0x1096(%rip),%ymm10 # 4880 <_sk_callback_hsw+0x41f>
+ DB 196,98,125,24,21,150,16,0,0 ; vbroadcastss 0x1096(%rip),%ymm10 # 49a8 <_sk_callback_hsw+0x41f>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -3417,48 +3468,48 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,74,16,0,0 ; vbroadcastss 0x104a(%rip),%ymm3 # 4884 <_sk_callback_hsw+0x423>
+ DB 196,226,125,24,29,74,16,0,0 ; vbroadcastss 0x104a(%rip),%ymm3 # 49ac <_sk_callback_hsw+0x423>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,64 ; vmovd (%r8,%rax,2),%xmm0
DB 196,193,121,196,68,64,4,2 ; vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 117,5 ; jne 3855 <_sk_load_rgb_u16_be_hsw+0xf7>
- DB 233,79,255,255,255 ; jmpq 37a4 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 117,5 ; jne 397d <_sk_load_rgb_u16_be_hsw+0xf7>
+ DB 233,79,255,255,255 ; jmpq 38cc <_sk_load_rgb_u16_be_hsw+0x46>
DB 196,193,121,110,76,64,6 ; vmovd 0x6(%r8,%rax,2),%xmm1
DB 196,65,113,196,68,64,10,2 ; vpinsrw $0x2,0xa(%r8,%rax,2),%xmm1,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,26 ; jb 3884 <_sk_load_rgb_u16_be_hsw+0x126>
+ DB 114,26 ; jb 39ac <_sk_load_rgb_u16_be_hsw+0x126>
DB 196,193,121,110,76,64,12 ; vmovd 0xc(%r8,%rax,2),%xmm1
DB 196,193,113,196,84,64,16,2 ; vpinsrw $0x2,0x10(%r8,%rax,2),%xmm1,%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 117,10 ; jne 3889 <_sk_load_rgb_u16_be_hsw+0x12b>
- DB 233,32,255,255,255 ; jmpq 37a4 <_sk_load_rgb_u16_be_hsw+0x46>
- DB 233,27,255,255,255 ; jmpq 37a4 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 39b1 <_sk_load_rgb_u16_be_hsw+0x12b>
+ DB 233,32,255,255,255 ; jmpq 38cc <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,27,255,255,255 ; jmpq 38cc <_sk_load_rgb_u16_be_hsw+0x46>
DB 196,193,121,110,76,64,18 ; vmovd 0x12(%r8,%rax,2),%xmm1
DB 196,65,113,196,76,64,22,2 ; vpinsrw $0x2,0x16(%r8,%rax,2),%xmm1,%xmm9
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,26 ; jb 38b8 <_sk_load_rgb_u16_be_hsw+0x15a>
+ DB 114,26 ; jb 39e0 <_sk_load_rgb_u16_be_hsw+0x15a>
DB 196,193,121,110,76,64,24 ; vmovd 0x18(%r8,%rax,2),%xmm1
DB 196,193,113,196,76,64,28,2 ; vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm1,%xmm1
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 117,10 ; jne 38bd <_sk_load_rgb_u16_be_hsw+0x15f>
- DB 233,236,254,255,255 ; jmpq 37a4 <_sk_load_rgb_u16_be_hsw+0x46>
- DB 233,231,254,255,255 ; jmpq 37a4 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 39e5 <_sk_load_rgb_u16_be_hsw+0x15f>
+ DB 233,236,254,255,255 ; jmpq 38cc <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,231,254,255,255 ; jmpq 38cc <_sk_load_rgb_u16_be_hsw+0x46>
DB 196,193,121,110,92,64,30 ; vmovd 0x1e(%r8,%rax,2),%xmm3
DB 196,65,97,196,92,64,34,2 ; vpinsrw $0x2,0x22(%r8,%rax,2),%xmm3,%xmm11
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,20 ; jb 38e6 <_sk_load_rgb_u16_be_hsw+0x188>
+ DB 114,20 ; jb 3a0e <_sk_load_rgb_u16_be_hsw+0x188>
DB 196,193,121,110,92,64,36 ; vmovd 0x24(%r8,%rax,2),%xmm3
DB 196,193,97,196,92,64,40,2 ; vpinsrw $0x2,0x28(%r8,%rax,2),%xmm3,%xmm3
- DB 233,190,254,255,255 ; jmpq 37a4 <_sk_load_rgb_u16_be_hsw+0x46>
- DB 233,185,254,255,255 ; jmpq 37a4 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,190,254,255,255 ; jmpq 38cc <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,185,254,255,255 ; jmpq 38cc <_sk_load_rgb_u16_be_hsw+0x46>
PUBLIC _sk_store_u16_be_hsw
_sk_store_u16_be_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 72,141,4,189,0,0,0,0 ; lea 0x0(,%rdi,4),%rax
- DB 196,98,125,24,5,135,15,0,0 ; vbroadcastss 0xf87(%rip),%ymm8 # 4888 <_sk_callback_hsw+0x427>
+ DB 196,98,125,24,5,135,15,0,0 ; vbroadcastss 0xf87(%rip),%ymm8 # 49b0 <_sk_callback_hsw+0x427>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -3496,7 +3547,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,31 ; jne 39e5 <_sk_store_u16_be_hsw+0xfa>
+ DB 117,31 ; jne 3b0d <_sk_store_u16_be_hsw+0xfa>
DB 196,65,120,17,28,64 ; vmovups %xmm11,(%r8,%rax,2)
DB 196,65,120,17,84,64,16 ; vmovups %xmm10,0x10(%r8,%rax,2)
DB 196,65,120,17,76,64,32 ; vmovups %xmm9,0x20(%r8,%rax,2)
@@ -3505,31 +3556,31 @@ _sk_store_u16_be_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,64 ; vmovq %xmm11,(%r8,%rax,2)
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,240 ; je 39e1 <_sk_store_u16_be_hsw+0xf6>
+ DB 116,240 ; je 3b09 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,23,92,64,8 ; vmovhpd %xmm11,0x8(%r8,%rax,2)
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,227 ; jb 39e1 <_sk_store_u16_be_hsw+0xf6>
+ DB 114,227 ; jb 3b09 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,214,84,64,16 ; vmovq %xmm10,0x10(%r8,%rax,2)
- DB 116,218 ; je 39e1 <_sk_store_u16_be_hsw+0xf6>
+ DB 116,218 ; je 3b09 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,23,84,64,24 ; vmovhpd %xmm10,0x18(%r8,%rax,2)
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,205 ; jb 39e1 <_sk_store_u16_be_hsw+0xf6>
+ DB 114,205 ; jb 3b09 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,214,76,64,32 ; vmovq %xmm9,0x20(%r8,%rax,2)
- DB 116,196 ; je 39e1 <_sk_store_u16_be_hsw+0xf6>
+ DB 116,196 ; je 3b09 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,23,76,64,40 ; vmovhpd %xmm9,0x28(%r8,%rax,2)
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,183 ; jb 39e1 <_sk_store_u16_be_hsw+0xf6>
+ DB 114,183 ; jb 3b09 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,214,68,64,48 ; vmovq %xmm8,0x30(%r8,%rax,2)
- DB 235,174 ; jmp 39e1 <_sk_store_u16_be_hsw+0xf6>
+ DB 235,174 ; jmp 3b09 <_sk_store_u16_be_hsw+0xf6>
PUBLIC _sk_load_f32_hsw
_sk_load_f32_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 119,110 ; ja 3aa9 <_sk_load_f32_hsw+0x76>
+ DB 119,110 ; ja 3bd1 <_sk_load_f32_hsw+0x76>
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,189,0,0,0,0 ; lea 0x0(,%rdi,4),%r9
- DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 3ad4 <_sk_load_f32_hsw+0xa1>
+ DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 3bfc <_sk_load_f32_hsw+0xa1>
DB 73,99,4,138 ; movslq (%r10,%rcx,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
@@ -3588,7 +3639,7 @@ _sk_store_f32_hsw LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 72,133,201 ; test %rcx,%rcx
- DB 117,55 ; jne 3b61 <_sk_store_f32_hsw+0x6d>
+ DB 117,55 ; jne 3c89 <_sk_store_f32_hsw+0x6d>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -3601,22 +3652,22 @@ _sk_store_f32_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,128 ; vmovupd %xmm10,(%r8,%rax,4)
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,240 ; je 3b5d <_sk_store_f32_hsw+0x69>
+ DB 116,240 ; je 3c85 <_sk_store_f32_hsw+0x69>
DB 196,65,121,17,76,128,16 ; vmovupd %xmm9,0x10(%r8,%rax,4)
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,227 ; jb 3b5d <_sk_store_f32_hsw+0x69>
+ DB 114,227 ; jb 3c85 <_sk_store_f32_hsw+0x69>
DB 196,65,121,17,68,128,32 ; vmovupd %xmm8,0x20(%r8,%rax,4)
- DB 116,218 ; je 3b5d <_sk_store_f32_hsw+0x69>
+ DB 116,218 ; je 3c85 <_sk_store_f32_hsw+0x69>
DB 196,65,121,17,92,128,48 ; vmovupd %xmm11,0x30(%r8,%rax,4)
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,205 ; jb 3b5d <_sk_store_f32_hsw+0x69>
+ DB 114,205 ; jb 3c85 <_sk_store_f32_hsw+0x69>
DB 196,67,125,25,84,128,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- DB 116,195 ; je 3b5d <_sk_store_f32_hsw+0x69>
+ DB 116,195 ; je 3c85 <_sk_store_f32_hsw+0x69>
DB 196,67,125,25,76,128,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,181 ; jb 3b5d <_sk_store_f32_hsw+0x69>
+ DB 114,181 ; jb 3c85 <_sk_store_f32_hsw+0x69>
DB 196,67,125,25,68,128,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- DB 235,171 ; jmp 3b5d <_sk_store_f32_hsw+0x69>
+ DB 235,171 ; jmp 3c85 <_sk_store_f32_hsw+0x69>
PUBLIC _sk_clamp_x_hsw
_sk_clamp_x_hsw LABEL PROC
@@ -3700,11 +3751,11 @@ _sk_mirror_y_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,215,11,0,0 ; vbroadcastss 0xbd7(%rip),%ymm3 # 488c <_sk_callback_hsw+0x42b>
- DB 196,98,125,24,5,210,11,0,0 ; vbroadcastss 0xbd2(%rip),%ymm8 # 4890 <_sk_callback_hsw+0x42f>
+ DB 196,226,125,24,29,215,11,0,0 ; vbroadcastss 0xbd7(%rip),%ymm3 # 49b4 <_sk_callback_hsw+0x42b>
+ DB 196,98,125,24,5,210,11,0,0 ; vbroadcastss 0xbd2(%rip),%ymm8 # 49b8 <_sk_callback_hsw+0x42f>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,195,11,0,0 ; vbroadcastss 0xbc3(%rip),%ymm3 # 4894 <_sk_callback_hsw+0x433>
+ DB 196,226,125,24,29,195,11,0,0 ; vbroadcastss 0xbc3(%rip),%ymm3 # 49bc <_sk_callback_hsw+0x433>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -3839,7 +3890,7 @@ _sk_gradient_hsw LABEL PROC
DB 196,98,125,24,72,28 ; vbroadcastss 0x1c(%rax),%ymm9
DB 76,139,0 ; mov (%rax),%r8
DB 77,133,192 ; test %r8,%r8
- DB 15,132,143,0,0,0 ; je 3fa9 <_sk_gradient_hsw+0xb5>
+ DB 15,132,143,0,0,0 ; je 40d1 <_sk_gradient_hsw+0xb5>
DB 72,139,64,8 ; mov 0x8(%rax),%rax
DB 72,131,192,32 ; add $0x20,%rax
DB 196,65,28,87,228 ; vxorps %ymm12,%ymm12,%ymm12
@@ -3866,8 +3917,8 @@ _sk_gradient_hsw LABEL PROC
DB 196,67,13,74,201,208 ; vblendvps %ymm13,%ymm9,%ymm14,%ymm9
DB 72,131,192,36 ; add $0x24,%rax
DB 73,255,200 ; dec %r8
- DB 117,140 ; jne 3f33 <_sk_gradient_hsw+0x3f>
- DB 235,17 ; jmp 3fba <_sk_gradient_hsw+0xc6>
+ DB 117,140 ; jne 405b <_sk_gradient_hsw+0x3f>
+ DB 235,17 ; jmp 40e2 <_sk_gradient_hsw+0xc6>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
@@ -3910,24 +3961,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,67,8,0,0 ; vbroadcastss 0x843(%rip),%ymm13 # 4898 <_sk_callback_hsw+0x437>
- DB 196,98,125,24,53,62,8,0,0 ; vbroadcastss 0x83e(%rip),%ymm14 # 489c <_sk_callback_hsw+0x43b>
+ DB 196,98,125,24,45,67,8,0,0 ; vbroadcastss 0x843(%rip),%ymm13 # 49c0 <_sk_callback_hsw+0x437>
+ DB 196,98,125,24,53,62,8,0,0 ; vbroadcastss 0x83e(%rip),%ymm14 # 49c4 <_sk_callback_hsw+0x43b>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,52,8,0,0 ; vbroadcastss 0x834(%rip),%ymm13 # 48a0 <_sk_callback_hsw+0x43f>
+ DB 196,98,125,24,45,52,8,0,0 ; vbroadcastss 0x834(%rip),%ymm13 # 49c8 <_sk_callback_hsw+0x43f>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,42,8,0,0 ; vbroadcastss 0x82a(%rip),%ymm14 # 48a4 <_sk_callback_hsw+0x443>
+ DB 196,98,125,24,53,42,8,0,0 ; vbroadcastss 0x82a(%rip),%ymm14 # 49cc <_sk_callback_hsw+0x443>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,21,8,0,0 ; vbroadcastss 0x815(%rip),%ymm10 # 48a8 <_sk_callback_hsw+0x447>
+ DB 196,98,125,24,21,21,8,0,0 ; vbroadcastss 0x815(%rip),%ymm10 # 49d0 <_sk_callback_hsw+0x447>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,255,7,0,0 ; vbroadcastss 0x7ff(%rip),%ymm10 # 48ac <_sk_callback_hsw+0x44b>
+ DB 196,98,125,24,21,255,7,0,0 ; vbroadcastss 0x7ff(%rip),%ymm10 # 49d4 <_sk_callback_hsw+0x44b>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,233,7,0,0 ; vbroadcastss 0x7e9(%rip),%ymm10 # 48b0 <_sk_callback_hsw+0x44f>
+ DB 196,98,125,24,21,233,7,0,0 ; vbroadcastss 0x7e9(%rip),%ymm10 # 49d8 <_sk_callback_hsw+0x44f>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -3947,7 +3998,7 @@ _sk_xy_to_radius_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,178,7,0,0 ; vbroadcastss 0x7b2(%rip),%ymm8 # 48b4 <_sk_callback_hsw+0x453>
+ DB 196,98,125,24,5,178,7,0,0 ; vbroadcastss 0x7b2(%rip),%ymm8 # 49dc <_sk_callback_hsw+0x453>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -3977,9 +4028,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,70,7,0,0 ; vbroadcastss 0x746(%rip),%ymm0 # 48b8 <_sk_callback_hsw+0x457>
+ DB 196,226,125,24,5,70,7,0,0 ; vbroadcastss 0x746(%rip),%ymm0 # 49e0 <_sk_callback_hsw+0x457>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm8 # 48bc <_sk_callback_hsw+0x45b>
+ DB 196,98,125,24,5,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm8 # 49e4 <_sk_callback_hsw+0x45b>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -3988,7 +4039,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,37,7,0,0 ; vbroadcastss 0x725(%rip),%ymm0 # 48c0 <_sk_callback_hsw+0x45f>
+ DB 196,226,125,24,5,37,7,0,0 ; vbroadcastss 0x725(%rip),%ymm0 # 49e8 <_sk_callback_hsw+0x45f>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -3998,9 +4049,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,9,7,0,0 ; vbroadcastss 0x709(%rip),%ymm1 # 48c4 <_sk_callback_hsw+0x463>
+ DB 196,226,125,24,13,9,7,0,0 ; vbroadcastss 0x709(%rip),%ymm1 # 49ec <_sk_callback_hsw+0x463>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,255,6,0,0 ; vbroadcastss 0x6ff(%rip),%ymm8 # 48c8 <_sk_callback_hsw+0x467>
+ DB 196,98,125,24,5,255,6,0,0 ; vbroadcastss 0x6ff(%rip),%ymm8 # 49f0 <_sk_callback_hsw+0x467>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4009,7 +4060,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,231,6,0,0 ; vbroadcastss 0x6e7(%rip),%ymm1 # 48cc <_sk_callback_hsw+0x46b>
+ DB 196,226,125,24,13,231,6,0,0 ; vbroadcastss 0x6e7(%rip),%ymm1 # 49f4 <_sk_callback_hsw+0x46b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -4019,13 +4070,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,202,6,0,0 ; vbroadcastss 0x6ca(%rip),%ymm0 # 48d0 <_sk_callback_hsw+0x46f>
+ DB 196,226,125,24,5,202,6,0,0 ; vbroadcastss 0x6ca(%rip),%ymm0 # 49f8 <_sk_callback_hsw+0x46f>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,193,6,0,0 ; vbroadcastss 0x6c1(%rip),%ymm8 # 48d4 <_sk_callback_hsw+0x473>
+ DB 196,98,125,24,5,193,6,0,0 ; vbroadcastss 0x6c1(%rip),%ymm8 # 49fc <_sk_callback_hsw+0x473>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,178,6,0,0 ; vbroadcastss 0x6b2(%rip),%ymm10 # 48d8 <_sk_callback_hsw+0x477>
- DB 196,98,125,24,29,173,6,0,0 ; vbroadcastss 0x6ad(%rip),%ymm11 # 48dc <_sk_callback_hsw+0x47b>
+ DB 196,98,125,24,21,178,6,0,0 ; vbroadcastss 0x6b2(%rip),%ymm10 # 4a00 <_sk_callback_hsw+0x477>
+ DB 196,98,125,24,29,173,6,0,0 ; vbroadcastss 0x6ad(%rip),%ymm11 # 4a04 <_sk_callback_hsw+0x47b>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -4035,16 +4086,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,144,6,0,0 ; vbroadcastss 0x690(%rip),%ymm0 # 48e0 <_sk_callback_hsw+0x47f>
+ DB 196,226,125,24,5,144,6,0,0 ; vbroadcastss 0x690(%rip),%ymm0 # 4a08 <_sk_callback_hsw+0x47f>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,135,6,0,0 ; vbroadcastss 0x687(%rip),%ymm8 # 48e4 <_sk_callback_hsw+0x483>
+ DB 196,98,125,24,5,135,6,0,0 ; vbroadcastss 0x687(%rip),%ymm8 # 4a0c <_sk_callback_hsw+0x483>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,125,6,0,0 ; vbroadcastss 0x67d(%rip),%ymm9 # 48e8 <_sk_callback_hsw+0x487>
- DB 196,98,125,24,21,120,6,0,0 ; vbroadcastss 0x678(%rip),%ymm10 # 48ec <_sk_callback_hsw+0x48b>
+ DB 196,98,125,24,13,125,6,0,0 ; vbroadcastss 0x67d(%rip),%ymm9 # 4a10 <_sk_callback_hsw+0x487>
+ DB 196,98,125,24,21,120,6,0,0 ; vbroadcastss 0x678(%rip),%ymm10 # 4a14 <_sk_callback_hsw+0x48b>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,110,6,0,0 ; vbroadcastss 0x66e(%rip),%ymm9 # 48f0 <_sk_callback_hsw+0x48f>
+ DB 196,98,125,24,13,110,6,0,0 ; vbroadcastss 0x66e(%rip),%ymm9 # 4a18 <_sk_callback_hsw+0x48f>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,100,6,0,0 ; vbroadcastss 0x664(%rip),%ymm10 # 48f4 <_sk_callback_hsw+0x493>
+ DB 196,98,125,24,21,100,6,0,0 ; vbroadcastss 0x664(%rip),%ymm10 # 4a1c <_sk_callback_hsw+0x493>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4053,14 +4104,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,76,6,0,0 ; vbroadcastss 0x64c(%rip),%ymm8 # 48f8 <_sk_callback_hsw+0x497>
+ DB 196,98,125,24,5,76,6,0,0 ; vbroadcastss 0x64c(%rip),%ymm8 # 4a20 <_sk_callback_hsw+0x497>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,62,6,0,0 ; vbroadcastss 0x63e(%rip),%ymm10 # 48fc <_sk_callback_hsw+0x49b>
- DB 196,98,125,24,29,57,6,0,0 ; vbroadcastss 0x639(%rip),%ymm11 # 4900 <_sk_callback_hsw+0x49f>
+ DB 196,98,125,24,21,62,6,0,0 ; vbroadcastss 0x63e(%rip),%ymm10 # 4a24 <_sk_callback_hsw+0x49b>
+ DB 196,98,125,24,29,57,6,0,0 ; vbroadcastss 0x639(%rip),%ymm11 # 4a28 <_sk_callback_hsw+0x49f>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,42,6,0,0 ; vbroadcastss 0x62a(%rip),%ymm8 # 4904 <_sk_callback_hsw+0x4a3>
+ DB 196,98,125,24,5,42,6,0,0 ; vbroadcastss 0x62a(%rip),%ymm8 # 4a2c <_sk_callback_hsw+0x4a3>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4069,12 +4120,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,18,6,0,0 ; vbroadcastss 0x612(%rip),%ymm0 # 4908 <_sk_callback_hsw+0x4a7>
+ DB 196,226,125,24,5,18,6,0,0 ; vbroadcastss 0x612(%rip),%ymm0 # 4a30 <_sk_callback_hsw+0x4a7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,255,5,0,0 ; vbroadcastss 0x5ff(%rip),%ymm10 # 490c <_sk_callback_hsw+0x4ab>
- DB 196,98,125,24,29,250,5,0,0 ; vbroadcastss 0x5fa(%rip),%ymm11 # 4910 <_sk_callback_hsw+0x4af>
+ DB 196,98,125,24,21,255,5,0,0 ; vbroadcastss 0x5ff(%rip),%ymm10 # 4a34 <_sk_callback_hsw+0x4ab>
+ DB 196,98,125,24,29,250,5,0,0 ; vbroadcastss 0x5fa(%rip),%ymm11 # 4a38 <_sk_callback_hsw+0x4af>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -4084,13 +4135,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,221,5,0,0 ; vbroadcastss 0x5dd(%rip),%ymm1 # 4914 <_sk_callback_hsw+0x4b3>
+ DB 196,226,125,24,13,221,5,0,0 ; vbroadcastss 0x5dd(%rip),%ymm1 # 4a3c <_sk_callback_hsw+0x4b3>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,211,5,0,0 ; vbroadcastss 0x5d3(%rip),%ymm8 # 4918 <_sk_callback_hsw+0x4b7>
+ DB 196,98,125,24,5,211,5,0,0 ; vbroadcastss 0x5d3(%rip),%ymm8 # 4a40 <_sk_callback_hsw+0x4b7>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,196,5,0,0 ; vbroadcastss 0x5c4(%rip),%ymm10 # 491c <_sk_callback_hsw+0x4bb>
- DB 196,98,125,24,29,191,5,0,0 ; vbroadcastss 0x5bf(%rip),%ymm11 # 4920 <_sk_callback_hsw+0x4bf>
+ DB 196,98,125,24,21,196,5,0,0 ; vbroadcastss 0x5c4(%rip),%ymm10 # 4a44 <_sk_callback_hsw+0x4bb>
+ DB 196,98,125,24,29,191,5,0,0 ; vbroadcastss 0x5bf(%rip),%ymm11 # 4a48 <_sk_callback_hsw+0x4bf>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -4100,16 +4151,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,162,5,0,0 ; vbroadcastss 0x5a2(%rip),%ymm1 # 4924 <_sk_callback_hsw+0x4c3>
+ DB 196,226,125,24,13,162,5,0,0 ; vbroadcastss 0x5a2(%rip),%ymm1 # 4a4c <_sk_callback_hsw+0x4c3>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,152,5,0,0 ; vbroadcastss 0x598(%rip),%ymm8 # 4928 <_sk_callback_hsw+0x4c7>
+ DB 196,98,125,24,5,152,5,0,0 ; vbroadcastss 0x598(%rip),%ymm8 # 4a50 <_sk_callback_hsw+0x4c7>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,142,5,0,0 ; vbroadcastss 0x58e(%rip),%ymm9 # 492c <_sk_callback_hsw+0x4cb>
- DB 196,98,125,24,21,137,5,0,0 ; vbroadcastss 0x589(%rip),%ymm10 # 4930 <_sk_callback_hsw+0x4cf>
+ DB 196,98,125,24,13,142,5,0,0 ; vbroadcastss 0x58e(%rip),%ymm9 # 4a54 <_sk_callback_hsw+0x4cb>
+ DB 196,98,125,24,21,137,5,0,0 ; vbroadcastss 0x589(%rip),%ymm10 # 4a58 <_sk_callback_hsw+0x4cf>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,127,5,0,0 ; vbroadcastss 0x57f(%rip),%ymm9 # 4934 <_sk_callback_hsw+0x4d3>
+ DB 196,98,125,24,13,127,5,0,0 ; vbroadcastss 0x57f(%rip),%ymm9 # 4a5c <_sk_callback_hsw+0x4d3>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,117,5,0,0 ; vbroadcastss 0x575(%rip),%ymm10 # 4938 <_sk_callback_hsw+0x4d7>
+ DB 196,98,125,24,21,117,5,0,0 ; vbroadcastss 0x575(%rip),%ymm10 # 4a60 <_sk_callback_hsw+0x4d7>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4118,14 +4169,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,93,5,0,0 ; vbroadcastss 0x55d(%rip),%ymm8 # 493c <_sk_callback_hsw+0x4db>
+ DB 196,98,125,24,5,93,5,0,0 ; vbroadcastss 0x55d(%rip),%ymm8 # 4a64 <_sk_callback_hsw+0x4db>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,78,5,0,0 ; vbroadcastss 0x54e(%rip),%ymm10 # 4940 <_sk_callback_hsw+0x4df>
- DB 196,98,125,24,29,73,5,0,0 ; vbroadcastss 0x549(%rip),%ymm11 # 4944 <_sk_callback_hsw+0x4e3>
+ DB 196,98,125,24,21,78,5,0,0 ; vbroadcastss 0x54e(%rip),%ymm10 # 4a68 <_sk_callback_hsw+0x4df>
+ DB 196,98,125,24,29,73,5,0,0 ; vbroadcastss 0x549(%rip),%ymm11 # 4a6c <_sk_callback_hsw+0x4e3>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,58,5,0,0 ; vbroadcastss 0x53a(%rip),%ymm8 # 4948 <_sk_callback_hsw+0x4e7>
+ DB 196,98,125,24,5,58,5,0,0 ; vbroadcastss 0x53a(%rip),%ymm8 # 4a70 <_sk_callback_hsw+0x4e7>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4134,12 +4185,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,34,5,0,0 ; vbroadcastss 0x522(%rip),%ymm1 # 494c <_sk_callback_hsw+0x4eb>
+ DB 196,226,125,24,13,34,5,0,0 ; vbroadcastss 0x522(%rip),%ymm1 # 4a74 <_sk_callback_hsw+0x4eb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,14,5,0,0 ; vbroadcastss 0x50e(%rip),%ymm10 # 4950 <_sk_callback_hsw+0x4ef>
- DB 196,98,125,24,29,9,5,0,0 ; vbroadcastss 0x509(%rip),%ymm11 # 4954 <_sk_callback_hsw+0x4f3>
+ DB 196,98,125,24,21,14,5,0,0 ; vbroadcastss 0x50e(%rip),%ymm10 # 4a78 <_sk_callback_hsw+0x4ef>
+ DB 196,98,125,24,29,9,5,0,0 ; vbroadcastss 0x509(%rip),%ymm11 # 4a7c <_sk_callback_hsw+0x4f3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -4249,35 +4300,35 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,191,0,0,224 ; add %al,-0x1fffff41(%rax)
- DB 64,0,0 ; add %al,(%rax)
- DB 128,63,154 ; cmpb $0x9a,(%rdi)
+ DB 64,154 ; rex (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4631 <.literal4+0xb5>
+ DB 71,225,61 ; rex.RXB loope 4755 <.literal4+0xb1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4641 <.literal4+0xc5>
+ DB 71,225,61 ; rex.RXB loope 4765 <.literal4+0xc1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4651 <.literal4+0xd5>
+ DB 71,225,61 ; rex.RXB loope 4775 <.literal4+0xd1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4661 <.literal4+0xe5>
+ DB 71,225,61 ; rex.RXB loope 4785 <.literal4+0xe1>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
DB 63 ; (bad)
- DB 145 ; xchg %eax,%ecx
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,145 ; cmpb $0x91,(%rdi)
DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi)
DB 154 ; (bad)
DB 153 ; cltd
@@ -4321,7 +4372,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 46ad <.literal4+0x131>
+ DB 224,7 ; loopne 47d5 <.literal4+0x131>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -4337,10 +4388,10 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 46d4 <.literal4+0x158>
+ DB 127,0 ; jg 47fc <.literal4+0x158>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 474d <.literal4+0x1d1>
+ DB 119,115 ; ja 4875 <.literal4+0x1d1>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4354,10 +4405,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4708 <.literal4+0x18c>
+ DB 127,0 ; jg 4830 <.literal4+0x18c>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4781 <.literal4+0x205>
+ DB 119,115 ; ja 48a9 <.literal4+0x205>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4371,10 +4422,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 473c <.literal4+0x1c0>
+ DB 127,0 ; jg 4864 <.literal4+0x1c0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 47b5 <.literal4+0x239>
+ DB 119,115 ; ja 48dd <.literal4+0x239>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4388,10 +4439,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4770 <.literal4+0x1f4>
+ DB 127,0 ; jg 4898 <.literal4+0x1f4>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 47e9 <.literal4+0x26d>
+ DB 119,115 ; ja 4911 <.literal4+0x26d>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4404,7 +4455,7 @@ ALIGN 4
DB 0,75,0 ; add %cl,0x0(%rbx)
DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax)
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 47e7 <.literal4+0x26b>
+ DB 127,67 ; jg 490f <.literal4+0x26b>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -4416,10 +4467,10 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 4807 <.literal4+0x28b>
+ DB 118,63 ; jbe 492f <.literal4+0x28b>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 481b <.literal4+0x29f>
+ DB 127,67 ; jg 4943 <.literal4+0x29f>
DB 129,128,128,59,0,0,128,63,129,128 ; addl $0x80813f80,0x3b80(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,128,63,129,128,128 ; add %al,-0x7f7f7ec1(%rax)
@@ -4428,7 +4479,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 47fd <.literal4+0x281>
+ DB 224,7 ; loopne 4925 <.literal4+0x281>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -4440,7 +4491,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4819 <.literal4+0x29d>
+ DB 224,7 ; loopne 4941 <.literal4+0x29d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -4451,7 +4502,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 486e <.literal4+0x2f2>
+ DB 124,66 ; jl 4996 <.literal4+0x2f2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -4469,9 +4520,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 48b1 <.literal4+0x335>
+ DB 112,65 ; jo 49d9 <.literal4+0x335>
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 48bf <.literal4+0x343>
+ DB 127,67 ; jg 49e7 <.literal4+0x343>
DB 128,0,128 ; addb $0x80,(%rax)
DB 55 ; (bad)
DB 128,0,128 ; addb $0x80,(%rax)
@@ -4479,7 +4530,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 48d3 <.literal4+0x357>
+ DB 127,71 ; jg 49fb <.literal4+0x357>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,89 ; ds pop %rcx
@@ -4576,16 +4627,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004988 <_sk_callback_hsw+0xa000527>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004aa8 <_sk_callback_hsw+0xa00051f>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12004990 <_sk_callback_hsw+0x1200052f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12004ab0 <_sk_callback_hsw+0x12000527>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a004998 <_sk_callback_hsw+0x1a000537>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a004ab8 <_sk_callback_hsw+0x1a00052f>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30049a0 <_sk_callback_hsw+0x300053f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3004ac0 <_sk_callback_hsw+0x3000537>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -4628,16 +4679,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0049e8 <_sk_callback_hsw+0xa000587>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004b08 <_sk_callback_hsw+0xa00057f>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120049f0 <_sk_callback_hsw+0x1200058f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12004b10 <_sk_callback_hsw+0x12000587>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0049f8 <_sk_callback_hsw+0x1a000597>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a004b18 <_sk_callback_hsw+0x1a00058f>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3004a00 <_sk_callback_hsw+0x300059f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3004b20 <_sk_callback_hsw+0x3000597>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -4680,16 +4731,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004a48 <_sk_callback_hsw+0xa0005e7>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004b68 <_sk_callback_hsw+0xa0005df>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12004a50 <_sk_callback_hsw+0x120005ef>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12004b70 <_sk_callback_hsw+0x120005e7>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a004a58 <_sk_callback_hsw+0x1a0005f7>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a004b78 <_sk_callback_hsw+0x1a0005ef>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3004a60 <_sk_callback_hsw+0x30005ff>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3004b80 <_sk_callback_hsw+0x30005f7>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -4732,16 +4783,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004aa8 <_sk_callback_hsw+0xa000647>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004bc8 <_sk_callback_hsw+0xa00063f>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12004ab0 <_sk_callback_hsw+0x1200064f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12004bd0 <_sk_callback_hsw+0x12000647>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a004ab8 <_sk_callback_hsw+0x1a000657>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a004bd8 <_sk_callback_hsw+0x1a00064f>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3004ac0 <_sk_callback_hsw+0x300065f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3004be0 <_sk_callback_hsw+0x3000657>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -4883,14 +4934,14 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,132,91,0,0 ; vbroadcastss 0x5b84(%rip),%ymm1 # 5ce4 <_sk_callback_avx+0x11c>
+ DB 196,226,125,24,13,196,92,0,0 ; vbroadcastss 0x5cc4(%rip),%ymm1 # 5e24 <_sk_callback_avx+0x11c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,2 ; vaddps (%rdx),%ymm0,%ymm0
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,104,91,0,0 ; vbroadcastss 0x5b68(%rip),%ymm2 # 5ce8 <_sk_callback_avx+0x120>
+ DB 196,226,125,24,21,168,92,0,0 ; vbroadcastss 0x5ca8(%rip),%ymm2 # 5e28 <_sk_callback_avx+0x120>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -4910,7 +4961,7 @@ _sk_dither_avx LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 196,66,125,24,8 ; vbroadcastss (%r8),%ymm9
DB 196,65,60,87,209 ; vxorps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,32,91,0,0 ; vbroadcastss 0x5b20(%rip),%ymm11 # 5cec <_sk_callback_avx+0x124>
+ DB 196,98,125,24,29,96,92,0,0 ; vbroadcastss 0x5c60(%rip),%ymm11 # 5e2c <_sk_callback_avx+0x124>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -4921,8 +4972,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,225,90,0,0 ; vbroadcastss 0x5ae1(%rip),%ymm12 # 5cf0 <_sk_callback_avx+0x128>
- DB 196,98,125,24,45,220,90,0,0 ; vbroadcastss 0x5adc(%rip),%ymm13 # 5cf4 <_sk_callback_avx+0x12c>
+ DB 196,98,125,24,37,33,92,0,0 ; vbroadcastss 0x5c21(%rip),%ymm12 # 5e30 <_sk_callback_avx+0x128>
+ DB 196,98,125,24,45,28,92,0,0 ; vbroadcastss 0x5c1c(%rip),%ymm13 # 5e34 <_sk_callback_avx+0x12c>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -4949,9 +5000,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,71,90,0,0 ; vbroadcastss 0x5a47(%rip),%ymm9 # 5cf8 <_sk_callback_avx+0x130>
+ DB 196,98,125,24,13,135,91,0,0 ; vbroadcastss 0x5b87(%rip),%ymm9 # 5e38 <_sk_callback_avx+0x130>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,61,90,0,0 ; vbroadcastss 0x5a3d(%rip),%ymm9 # 5cfc <_sk_callback_avx+0x134>
+ DB 196,98,125,24,13,125,91,0,0 ; vbroadcastss 0x5b7d(%rip),%ymm9 # 5e3c <_sk_callback_avx+0x134>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,72,8 ; vbroadcastss 0x8(%rax),%ymm9
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
@@ -4983,7 +5034,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,227,89,0,0 ; vbroadcastss 0x59e3(%rip),%ymm8 # 5d00 <_sk_callback_avx+0x138>
+ DB 196,98,125,24,5,35,91,0,0 ; vbroadcastss 0x5b23(%rip),%ymm8 # 5e40 <_sk_callback_avx+0x138>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -5002,7 +5053,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,165,89,0,0 ; vbroadcastss 0x59a5(%rip),%ymm9 # 5d04 <_sk_callback_avx+0x13c>
+ DB 196,98,125,24,13,229,90,0,0 ; vbroadcastss 0x5ae5(%rip),%ymm9 # 5e44 <_sk_callback_avx+0x13c>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -5038,7 +5089,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,68,89,0,0 ; vbroadcastss 0x5944(%rip),%ymm8 # 5d08 <_sk_callback_avx+0x140>
+ DB 196,98,125,24,5,132,90,0,0 ; vbroadcastss 0x5a84(%rip),%ymm8 # 5e48 <_sk_callback_avx+0x140>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -5049,7 +5100,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,39,89,0,0 ; vbroadcastss 0x5927(%rip),%ymm0 # 5d0c <_sk_callback_avx+0x144>
+ DB 196,226,125,24,5,103,90,0,0 ; vbroadcastss 0x5a67(%rip),%ymm0 # 5e4c <_sk_callback_avx+0x144>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -5060,7 +5111,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,10,89,0,0 ; vbroadcastss 0x590a(%rip),%ymm8 # 5d10 <_sk_callback_avx+0x148>
+ DB 196,98,125,24,5,74,90,0,0 ; vbroadcastss 0x5a4a(%rip),%ymm8 # 5e50 <_sk_callback_avx+0x148>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -5075,7 +5126,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,221,88,0,0 ; vbroadcastss 0x58dd(%rip),%ymm8 # 5d14 <_sk_callback_avx+0x14c>
+ DB 196,98,125,24,5,29,90,0,0 ; vbroadcastss 0x5a1d(%rip),%ymm8 # 5e54 <_sk_callback_avx+0x14c>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -5099,7 +5150,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,156,88,0,0 ; vbroadcastss 0x589c(%rip),%ymm8 # 5d18 <_sk_callback_avx+0x150>
+ DB 196,98,125,24,5,220,89,0,0 ; vbroadcastss 0x59dc(%rip),%ymm8 # 5e58 <_sk_callback_avx+0x150>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -5153,7 +5204,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,235,87,0,0 ; vbroadcastss 0x57eb(%rip),%ymm8 # 5d1c <_sk_callback_avx+0x154>
+ DB 196,98,125,24,5,43,89,0,0 ; vbroadcastss 0x592b(%rip),%ymm8 # 5e5c <_sk_callback_avx+0x154>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -5188,7 +5239,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,107,87,0,0 ; vbroadcastss 0x576b(%rip),%ymm8 # 5d20 <_sk_callback_avx+0x158>
+ DB 196,98,125,24,5,171,88,0,0 ; vbroadcastss 0x58ab(%rip),%ymm8 # 5e60 <_sk_callback_avx+0x158>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5212,7 +5263,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,23,87,0,0 ; vbroadcastss 0x5717(%rip),%ymm8 # 5d24 <_sk_callback_avx+0x15c>
+ DB 196,98,125,24,5,87,88,0,0 ; vbroadcastss 0x5857(%rip),%ymm8 # 5e64 <_sk_callback_avx+0x15c>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5239,7 +5290,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,183,86,0,0 ; vbroadcastss 0x56b7(%rip),%ymm8 # 5d28 <_sk_callback_avx+0x160>
+ DB 196,98,125,24,5,247,87,0,0 ; vbroadcastss 0x57f7(%rip),%ymm8 # 5e68 <_sk_callback_avx+0x160>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5260,7 +5311,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,114,86,0,0 ; vbroadcastss 0x5672(%rip),%ymm8 # 5d2c <_sk_callback_avx+0x164>
+ DB 196,98,125,24,5,178,87,0,0 ; vbroadcastss 0x57b2(%rip),%ymm8 # 5e6c <_sk_callback_avx+0x164>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5269,7 +5320,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,93,86,0,0 ; vbroadcastss 0x565d(%rip),%ymm8 # 5d30 <_sk_callback_avx+0x168>
+ DB 196,98,125,24,5,157,87,0,0 ; vbroadcastss 0x579d(%rip),%ymm8 # 5e70 <_sk_callback_avx+0x168>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -5329,7 +5380,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,89,85,0,0 ; vbroadcastss 0x5559(%rip),%ymm9 # 5d34 <_sk_callback_avx+0x16c>
+ DB 196,98,125,24,13,153,86,0,0 ; vbroadcastss 0x5699(%rip),%ymm9 # 5e74 <_sk_callback_avx+0x16c>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -5384,7 +5435,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,107,84,0,0 ; vbroadcastss 0x546b(%rip),%ymm8 # 5d38 <_sk_callback_avx+0x170>
+ DB 196,98,125,24,5,171,85,0,0 ; vbroadcastss 0x55ab(%rip),%ymm8 # 5e78 <_sk_callback_avx+0x170>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -5437,7 +5488,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,148,83,0,0 ; vbroadcastss 0x5394(%rip),%ymm8 # 5d3c <_sk_callback_avx+0x174>
+ DB 196,98,125,24,5,212,84,0,0 ; vbroadcastss 0x54d4(%rip),%ymm8 # 5e7c <_sk_callback_avx+0x174>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -5502,10 +5553,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,135,82,0,0 ; vbroadcastss 0x5287(%rip),%ymm11 # 5d44 <_sk_callback_avx+0x17c>
+ DB 196,98,125,24,29,199,83,0,0 ; vbroadcastss 0x53c7(%rip),%ymm11 # 5e84 <_sk_callback_avx+0x17c>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,120,82,0,0 ; vbroadcastss 0x5278(%rip),%ymm13 # 5d48 <_sk_callback_avx+0x180>
+ DB 196,98,125,24,45,184,83,0,0 ; vbroadcastss 0x53b8(%rip),%ymm13 # 5e88 <_sk_callback_avx+0x180>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -5516,7 +5567,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,54,82,0,0 ; vbroadcastss 0x5236(%rip),%ymm8 # 5d40 <_sk_callback_avx+0x178>
+ DB 196,98,125,24,5,118,83,0,0 ; vbroadcastss 0x5376(%rip),%ymm8 # 5e80 <_sk_callback_avx+0x178>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -5610,380 +5661,442 @@ _sk_softlight_avx LABEL PROC
PUBLIC _sk_hue_avx
_sk_hue_avx LABEL PROC
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 197,252,17,84,36,32 ; vmovups %ymm2,0x20(%rsp)
+ DB 197,124,40,193 ; vmovaps %ymm1,%ymm8
+ DB 197,124,17,4,36 ; vmovups %ymm8,(%rsp)
+ DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
+ DB 197,116,89,203 ; vmulps %ymm3,%ymm1,%ymm9
+ DB 197,60,89,211 ; vmulps %ymm3,%ymm8,%ymm10
+ DB 197,108,89,219 ; vmulps %ymm3,%ymm2,%ymm11
+ DB 197,84,95,198 ; vmaxps %ymm6,%ymm5,%ymm8
+ DB 196,65,92,95,192 ; vmaxps %ymm8,%ymm4,%ymm8
+ DB 197,84,93,230 ; vminps %ymm6,%ymm5,%ymm12
+ DB 196,65,92,93,228 ; vminps %ymm12,%ymm4,%ymm12
+ DB 196,65,60,92,196 ; vsubps %ymm12,%ymm8,%ymm8
+ DB 197,60,89,227 ; vmulps %ymm3,%ymm8,%ymm12
+ DB 196,65,44,93,195 ; vminps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,93,232 ; vminps %ymm8,%ymm9,%ymm13
+ DB 196,65,44,95,195 ; vmaxps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,95,192 ; vmaxps %ymm8,%ymm9,%ymm8
+ DB 196,65,60,92,245 ; vsubps %ymm13,%ymm8,%ymm14
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,100,194,208,0 ; vcmpeqps %ymm8,%ymm3,%ymm10
- DB 196,98,125,24,13,150,80,0,0 ; vbroadcastss 0x5096(%rip),%ymm9 # 5d4c <_sk_callback_avx+0x184>
- DB 197,52,94,219 ; vdivps %ymm3,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
- DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
- DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
- DB 197,84,95,214 ; vmaxps %ymm6,%ymm5,%ymm10
- DB 196,65,92,95,210 ; vmaxps %ymm10,%ymm4,%ymm10
- DB 197,84,93,222 ; vminps %ymm6,%ymm5,%ymm11
- DB 196,65,92,93,219 ; vminps %ymm11,%ymm4,%ymm11
- DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
- DB 197,116,93,218 ; vminps %ymm2,%ymm1,%ymm11
- DB 196,65,124,93,219 ; vminps %ymm11,%ymm0,%ymm11
- DB 197,116,95,226 ; vmaxps %ymm2,%ymm1,%ymm12
- DB 196,65,124,95,228 ; vmaxps %ymm12,%ymm0,%ymm12
- DB 196,65,28,92,227 ; vsubps %ymm11,%ymm12,%ymm12
- DB 196,65,28,194,232,0 ; vcmpeqps %ymm8,%ymm12,%ymm13
- DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
- DB 196,193,124,94,196 ; vdivps %ymm12,%ymm0,%ymm0
- DB 196,195,125,74,192,208 ; vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
- DB 196,193,116,94,204 ; vdivps %ymm12,%ymm1,%ymm1
- DB 196,195,117,74,200,208 ; vblendvps %ymm13,%ymm8,%ymm1,%ymm1
- DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
- DB 196,193,108,94,212 ; vdivps %ymm12,%ymm2,%ymm2
- DB 196,195,109,74,208,208 ; vblendvps %ymm13,%ymm8,%ymm2,%ymm2
- DB 196,98,125,24,21,11,80,0,0 ; vbroadcastss 0x500b(%rip),%ymm10 # 5d50 <_sk_callback_avx+0x188>
- DB 196,65,92,89,218 ; vmulps %ymm10,%ymm4,%ymm11
- DB 196,98,125,24,37,1,80,0,0 ; vbroadcastss 0x5001(%rip),%ymm12 # 5d54 <_sk_callback_avx+0x18c>
- DB 196,65,84,89,236 ; vmulps %ymm12,%ymm5,%ymm13
+ DB 196,65,12,194,248,0 ; vcmpeqps %ymm8,%ymm14,%ymm15
+ DB 196,65,52,92,205 ; vsubps %ymm13,%ymm9,%ymm9
+ DB 196,65,28,89,201 ; vmulps %ymm9,%ymm12,%ymm9
+ DB 196,65,52,94,206 ; vdivps %ymm14,%ymm9,%ymm9
+ DB 196,67,53,74,200,240 ; vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ DB 196,65,44,92,213 ; vsubps %ymm13,%ymm10,%ymm10
+ DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
+ DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
+ DB 196,67,45,74,208,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm10
+ DB 196,65,36,92,221 ; vsubps %ymm13,%ymm11,%ymm11
+ DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
+ DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
+ DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
+ DB 196,98,125,24,53,64,81,0,0 ; vbroadcastss 0x5140(%rip),%ymm14 # 5e8c <_sk_callback_avx+0x184>
+ DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
+ DB 196,98,125,24,61,54,81,0,0 ; vbroadcastss 0x5136(%rip),%ymm15 # 5e90 <_sk_callback_avx+0x188>
+ DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,98,125,24,45,242,79,0,0 ; vbroadcastss 0x4ff2(%rip),%ymm13 # 5d58 <_sk_callback_avx+0x190>
- DB 196,65,76,89,245 ; vmulps %ymm13,%ymm6,%ymm14
- DB 196,65,36,88,222 ; vaddps %ymm14,%ymm11,%ymm11
- DB 196,65,124,89,242 ; vmulps %ymm10,%ymm0,%ymm14
- DB 196,65,116,89,252 ; vmulps %ymm12,%ymm1,%ymm15
- DB 196,65,12,88,247 ; vaddps %ymm15,%ymm14,%ymm14
- DB 196,65,108,89,253 ; vmulps %ymm13,%ymm2,%ymm15
- DB 196,65,12,88,247 ; vaddps %ymm15,%ymm14,%ymm14
- DB 196,65,36,92,222 ; vsubps %ymm14,%ymm11,%ymm11
- DB 196,65,124,88,243 ; vaddps %ymm11,%ymm0,%ymm14
- DB 196,65,116,88,251 ; vaddps %ymm11,%ymm1,%ymm15
- DB 196,193,108,88,195 ; vaddps %ymm11,%ymm2,%ymm0
- DB 197,132,93,200 ; vminps %ymm0,%ymm15,%ymm1
- DB 197,140,93,209 ; vminps %ymm1,%ymm14,%ymm2
- DB 197,132,95,200 ; vmaxps %ymm0,%ymm15,%ymm1
- DB 197,12,95,217 ; vmaxps %ymm1,%ymm14,%ymm11
- DB 196,193,12,89,202 ; vmulps %ymm10,%ymm14,%ymm1
- DB 196,65,4,89,212 ; vmulps %ymm12,%ymm15,%ymm10
- DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,65,124,89,213 ; vmulps %ymm13,%ymm0,%ymm10
- DB 197,172,88,201 ; vaddps %ymm1,%ymm10,%ymm1
- DB 197,60,194,210,2 ; vcmpleps %ymm2,%ymm8,%ymm10
- DB 197,12,92,225 ; vsubps %ymm1,%ymm14,%ymm12
- DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
- DB 197,244,92,210 ; vsubps %ymm2,%ymm1,%ymm2
- DB 197,28,94,226 ; vdivps %ymm2,%ymm12,%ymm12
- DB 196,65,116,88,228 ; vaddps %ymm12,%ymm1,%ymm12
- DB 196,67,29,74,230,160 ; vblendvps %ymm10,%ymm14,%ymm12,%ymm12
- DB 196,65,52,194,235,1 ; vcmpltps %ymm11,%ymm9,%ymm13
- DB 197,28,92,241 ; vsubps %ymm1,%ymm12,%ymm14
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
- DB 196,65,52,89,246 ; vmulps %ymm14,%ymm9,%ymm14
- DB 197,36,92,217 ; vsubps %ymm1,%ymm11,%ymm11
- DB 196,65,12,94,243 ; vdivps %ymm11,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,29,74,230,208 ; vblendvps %ymm13,%ymm14,%ymm12,%ymm12
- DB 196,65,28,95,224 ; vmaxps %ymm8,%ymm12,%ymm12
- DB 197,4,92,241 ; vsubps %ymm1,%ymm15,%ymm14
- DB 196,65,116,89,246 ; vmulps %ymm14,%ymm1,%ymm14
+ DB 196,226,125,24,5,39,81,0,0 ; vbroadcastss 0x5127(%rip),%ymm0 # 5e94 <_sk_callback_avx+0x18c>
+ DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
+ DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
+ DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
+ DB 196,193,44,89,215 ; vmulps %ymm15,%ymm10,%ymm2
+ DB 197,148,88,210 ; vaddps %ymm2,%ymm13,%ymm2
+ DB 197,28,89,232 ; vmulps %ymm0,%ymm12,%ymm13
+ DB 196,193,108,88,213 ; vaddps %ymm13,%ymm2,%ymm2
+ DB 197,36,89,219 ; vmulps %ymm3,%ymm11,%ymm11
+ DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
+ DB 197,52,88,202 ; vaddps %ymm2,%ymm9,%ymm9
+ DB 197,44,88,218 ; vaddps %ymm2,%ymm10,%ymm11
+ DB 197,28,88,226 ; vaddps %ymm2,%ymm12,%ymm12
+ DB 196,193,36,93,212 ; vminps %ymm12,%ymm11,%ymm2
+ DB 197,52,93,234 ; vminps %ymm2,%ymm9,%ymm13
+ DB 196,193,52,89,214 ; vmulps %ymm14,%ymm9,%ymm2
+ DB 196,65,36,89,215 ; vmulps %ymm15,%ymm11,%ymm10
+ DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
+ DB 197,156,89,192 ; vmulps %ymm0,%ymm12,%ymm0
+ DB 197,124,88,210 ; vaddps %ymm2,%ymm0,%ymm10
+ DB 196,193,52,92,194 ; vsubps %ymm10,%ymm9,%ymm0
+ DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
+ DB 196,193,44,92,213 ; vsubps %ymm13,%ymm10,%ymm2
+ DB 197,252,94,194 ; vdivps %ymm2,%ymm0,%ymm0
+ DB 196,65,36,92,242 ; vsubps %ymm10,%ymm11,%ymm14
+ DB 196,65,44,89,246 ; vmulps %ymm14,%ymm10,%ymm14
DB 197,12,94,242 ; vdivps %ymm2,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,13,74,247,160 ; vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- DB 197,12,92,249 ; vsubps %ymm1,%ymm14,%ymm15
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,251 ; vdivps %ymm11,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,13,74,247,208 ; vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- DB 196,65,12,95,240 ; vmaxps %ymm8,%ymm14,%ymm14
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
+ DB 196,65,28,92,250 ; vsubps %ymm10,%ymm12,%ymm15
+ DB 196,65,44,89,255 ; vmulps %ymm15,%ymm10,%ymm15
DB 197,132,94,210 ; vdivps %ymm2,%ymm15,%ymm2
- DB 197,244,88,210 ; vaddps %ymm2,%ymm1,%ymm2
- DB 196,227,109,74,192,160 ; vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- DB 197,252,92,209 ; vsubps %ymm1,%ymm0,%ymm2
- DB 197,180,89,210 ; vmulps %ymm2,%ymm9,%ymm2
- DB 196,193,108,94,211 ; vdivps %ymm11,%ymm2,%ymm2
- DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,227,125,74,193,208 ; vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- DB 196,193,124,95,208 ; vmaxps %ymm8,%ymm0,%ymm2
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 197,228,89,207 ; vmulps %ymm7,%ymm3,%ymm1
- DB 197,252,92,217 ; vsubps %ymm1,%ymm0,%ymm3
- DB 196,193,100,89,196 ; vmulps %ymm12,%ymm3,%ymm0
- DB 196,193,100,89,206 ; vmulps %ymm14,%ymm3,%ymm1
- DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 196,65,60,194,237,2 ; vcmpleps %ymm13,%ymm8,%ymm13
+ DB 196,65,44,88,246 ; vaddps %ymm14,%ymm10,%ymm14
+ DB 196,67,13,74,243,208 ; vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ DB 196,65,36,95,220 ; vmaxps %ymm12,%ymm11,%ymm11
+ DB 197,172,88,210 ; vaddps %ymm2,%ymm10,%ymm2
+ DB 196,195,109,74,212,208 ; vblendvps %ymm13,%ymm12,%ymm2,%ymm2
+ DB 197,172,88,192 ; vaddps %ymm0,%ymm10,%ymm0
+ DB 196,195,125,74,193,208 ; vblendvps %ymm13,%ymm9,%ymm0,%ymm0
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,52,95,203 ; vmaxps %ymm11,%ymm9,%ymm9
+ DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
+ DB 196,65,28,92,234 ; vsubps %ymm10,%ymm12,%ymm13
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,28,194,249,1 ; vcmpltps %ymm9,%ymm12,%ymm15
+ DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
+ DB 196,65,36,94,217 ; vdivps %ymm9,%ymm11,%ymm11
+ DB 196,65,44,88,219 ; vaddps %ymm11,%ymm10,%ymm11
+ DB 196,195,125,74,195,240 ; vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ DB 196,65,12,92,218 ; vsubps %ymm10,%ymm14,%ymm11
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,36,94,217 ; vdivps %ymm9,%ymm11,%ymm11
+ DB 196,65,44,88,219 ; vaddps %ymm11,%ymm10,%ymm11
+ DB 196,67,13,74,219,240 ; vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ DB 196,65,108,92,242 ; vsubps %ymm10,%ymm2,%ymm14
+ DB 196,65,20,89,238 ; vmulps %ymm14,%ymm13,%ymm13
+ DB 196,65,20,94,201 ; vdivps %ymm9,%ymm13,%ymm9
+ DB 196,65,44,88,201 ; vaddps %ymm9,%ymm10,%ymm9
+ DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
+ DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
+ DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
+ DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
+ DB 196,98,125,24,5,0,80,0,0 ; vbroadcastss 0x5000(%rip),%ymm8 # 5e98 <_sk_callback_avx+0x190>
+ DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
+ DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
+ DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
+ DB 197,60,89,220 ; vmulps %ymm4,%ymm8,%ymm11
+ DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
+ DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
+ DB 197,180,89,12,36 ; vmulps (%rsp),%ymm9,%ymm1
+ DB 197,60,89,221 ; vmulps %ymm5,%ymm8,%ymm11
+ DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
+ DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
+ DB 197,52,89,76,36,32 ; vmulps 0x20(%rsp),%ymm9,%ymm9
+ DB 197,60,89,198 ; vmulps %ymm6,%ymm8,%ymm8
+ DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
+ DB 197,188,88,210 ; vaddps %ymm2,%ymm8,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_saturation_avx
_sk_saturation_avx LABEL PROC
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 197,124,40,193 ; vmovaps %ymm1,%ymm8
+ DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
+ DB 197,100,89,204 ; vmulps %ymm4,%ymm3,%ymm9
+ DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
+ DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
+ DB 197,252,17,84,36,32 ; vmovups %ymm2,0x20(%rsp)
+ DB 197,124,41,192 ; vmovaps %ymm8,%ymm0
+ DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
+ DB 197,124,95,194 ; vmaxps %ymm2,%ymm0,%ymm8
+ DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
+ DB 197,124,93,226 ; vminps %ymm2,%ymm0,%ymm12
+ DB 196,65,116,93,228 ; vminps %ymm12,%ymm1,%ymm12
+ DB 196,65,60,92,196 ; vsubps %ymm12,%ymm8,%ymm8
+ DB 197,60,89,231 ; vmulps %ymm7,%ymm8,%ymm12
+ DB 196,65,44,93,195 ; vminps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,93,232 ; vminps %ymm8,%ymm9,%ymm13
+ DB 196,65,44,95,195 ; vmaxps %ymm11,%ymm10,%ymm8
+ DB 196,65,52,95,192 ; vmaxps %ymm8,%ymm9,%ymm8
+ DB 196,65,60,92,245 ; vsubps %ymm13,%ymm8,%ymm14
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,68,194,208,0 ; vcmpeqps %ymm8,%ymm7,%ymm10
- DB 196,98,125,24,13,175,78,0,0 ; vbroadcastss 0x4eaf(%rip),%ymm9 # 5d5c <_sk_callback_avx+0x194>
- DB 197,52,94,223 ; vdivps %ymm7,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,44,89,220 ; vmulps %ymm4,%ymm10,%ymm11
- DB 197,44,89,229 ; vmulps %ymm5,%ymm10,%ymm12
- DB 197,44,89,214 ; vmulps %ymm6,%ymm10,%ymm10
- DB 197,116,95,234 ; vmaxps %ymm2,%ymm1,%ymm13
- DB 196,65,124,95,237 ; vmaxps %ymm13,%ymm0,%ymm13
- DB 197,244,93,202 ; vminps %ymm2,%ymm1,%ymm1
- DB 197,252,93,193 ; vminps %ymm1,%ymm0,%ymm0
- DB 197,148,92,192 ; vsubps %ymm0,%ymm13,%ymm0
- DB 196,193,28,93,202 ; vminps %ymm10,%ymm12,%ymm1
- DB 197,164,93,201 ; vminps %ymm1,%ymm11,%ymm1
- DB 196,193,28,95,210 ; vmaxps %ymm10,%ymm12,%ymm2
- DB 197,164,95,210 ; vmaxps %ymm2,%ymm11,%ymm2
- DB 197,236,92,209 ; vsubps %ymm1,%ymm2,%ymm2
- DB 196,65,108,194,232,0 ; vcmpeqps %ymm8,%ymm2,%ymm13
- DB 197,36,92,217 ; vsubps %ymm1,%ymm11,%ymm11
- DB 196,65,124,89,219 ; vmulps %ymm11,%ymm0,%ymm11
- DB 197,36,94,218 ; vdivps %ymm2,%ymm11,%ymm11
- DB 196,67,37,74,216,208 ; vblendvps %ymm13,%ymm8,%ymm11,%ymm11
- DB 197,28,92,225 ; vsubps %ymm1,%ymm12,%ymm12
- DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
- DB 197,28,94,226 ; vdivps %ymm2,%ymm12,%ymm12
- DB 196,67,29,74,224,208 ; vblendvps %ymm13,%ymm8,%ymm12,%ymm12
- DB 197,172,92,201 ; vsubps %ymm1,%ymm10,%ymm1
- DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 197,252,94,194 ; vdivps %ymm2,%ymm0,%ymm0
- DB 196,195,125,74,192,208 ; vblendvps %ymm13,%ymm8,%ymm0,%ymm0
- DB 196,226,125,24,13,43,78,0,0 ; vbroadcastss 0x4e2b(%rip),%ymm1 # 5d60 <_sk_callback_avx+0x198>
- DB 197,220,89,209 ; vmulps %ymm1,%ymm4,%ymm2
- DB 196,98,125,24,21,34,78,0,0 ; vbroadcastss 0x4e22(%rip),%ymm10 # 5d64 <_sk_callback_avx+0x19c>
- DB 196,65,84,89,234 ; vmulps %ymm10,%ymm5,%ymm13
+ DB 196,65,12,194,248,0 ; vcmpeqps %ymm8,%ymm14,%ymm15
+ DB 196,65,52,92,205 ; vsubps %ymm13,%ymm9,%ymm9
+ DB 196,65,28,89,201 ; vmulps %ymm9,%ymm12,%ymm9
+ DB 196,65,52,94,206 ; vdivps %ymm14,%ymm9,%ymm9
+ DB 196,67,53,74,200,240 ; vblendvps %ymm15,%ymm8,%ymm9,%ymm9
+ DB 196,65,44,92,213 ; vsubps %ymm13,%ymm10,%ymm10
+ DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
+ DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
+ DB 196,67,45,74,208,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm10
+ DB 196,65,36,92,221 ; vsubps %ymm13,%ymm11,%ymm11
+ DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
+ DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
+ DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
+ DB 196,98,125,24,53,8,79,0,0 ; vbroadcastss 0x4f08(%rip),%ymm14 # 5e9c <_sk_callback_avx+0x194>
+ DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
+ DB 196,98,125,24,61,254,78,0,0 ; vbroadcastss 0x4efe(%rip),%ymm15 # 5ea0 <_sk_callback_avx+0x198>
+ DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
+ DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
+ DB 196,226,125,24,5,239,78,0,0 ; vbroadcastss 0x4eef(%rip),%ymm0 # 5ea4 <_sk_callback_avx+0x19c>
+ DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
+ DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
+ DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
+ DB 196,193,44,89,215 ; vmulps %ymm15,%ymm10,%ymm2
+ DB 197,148,88,210 ; vaddps %ymm2,%ymm13,%ymm2
+ DB 197,28,89,232 ; vmulps %ymm0,%ymm12,%ymm13
DB 196,193,108,88,213 ; vaddps %ymm13,%ymm2,%ymm2
- DB 196,98,125,24,45,19,78,0,0 ; vbroadcastss 0x4e13(%rip),%ymm13 # 5d68 <_sk_callback_avx+0x1a0>
- DB 196,65,76,89,245 ; vmulps %ymm13,%ymm6,%ymm14
- DB 196,193,108,88,214 ; vaddps %ymm14,%ymm2,%ymm2
- DB 197,36,89,241 ; vmulps %ymm1,%ymm11,%ymm14
- DB 196,65,28,89,250 ; vmulps %ymm10,%ymm12,%ymm15
- DB 196,65,12,88,247 ; vaddps %ymm15,%ymm14,%ymm14
- DB 196,65,124,89,253 ; vmulps %ymm13,%ymm0,%ymm15
- DB 196,65,12,88,247 ; vaddps %ymm15,%ymm14,%ymm14
- DB 196,193,108,92,214 ; vsubps %ymm14,%ymm2,%ymm2
- DB 197,36,88,218 ; vaddps %ymm2,%ymm11,%ymm11
+ DB 197,36,89,219 ; vmulps %ymm3,%ymm11,%ymm11
+ DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
+ DB 197,52,88,202 ; vaddps %ymm2,%ymm9,%ymm9
+ DB 197,44,88,218 ; vaddps %ymm2,%ymm10,%ymm11
DB 197,28,88,226 ; vaddps %ymm2,%ymm12,%ymm12
- DB 197,252,88,194 ; vaddps %ymm2,%ymm0,%ymm0
- DB 197,156,93,208 ; vminps %ymm0,%ymm12,%ymm2
- DB 197,164,93,210 ; vminps %ymm2,%ymm11,%ymm2
- DB 197,28,95,240 ; vmaxps %ymm0,%ymm12,%ymm14
- DB 196,65,36,95,246 ; vmaxps %ymm14,%ymm11,%ymm14
- DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
- DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
- DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,65,124,89,213 ; vmulps %ymm13,%ymm0,%ymm10
- DB 197,172,88,201 ; vaddps %ymm1,%ymm10,%ymm1
- DB 197,60,194,210,2 ; vcmpleps %ymm2,%ymm8,%ymm10
- DB 197,36,92,233 ; vsubps %ymm1,%ymm11,%ymm13
- DB 196,65,116,89,237 ; vmulps %ymm13,%ymm1,%ymm13
- DB 197,244,92,210 ; vsubps %ymm2,%ymm1,%ymm2
- DB 197,20,94,234 ; vdivps %ymm2,%ymm13,%ymm13
- DB 196,65,116,88,237 ; vaddps %ymm13,%ymm1,%ymm13
- DB 196,67,21,74,219,160 ; vblendvps %ymm10,%ymm11,%ymm13,%ymm11
- DB 196,65,52,194,238,1 ; vcmpltps %ymm14,%ymm9,%ymm13
- DB 197,36,92,249 ; vsubps %ymm1,%ymm11,%ymm15
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 197,12,92,241 ; vsubps %ymm1,%ymm14,%ymm14
- DB 196,65,4,94,254 ; vdivps %ymm14,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,37,74,223,208 ; vblendvps %ymm13,%ymm15,%ymm11,%ymm11
- DB 196,65,36,95,216 ; vmaxps %ymm8,%ymm11,%ymm11
- DB 197,28,92,249 ; vsubps %ymm1,%ymm12,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 197,4,94,250 ; vdivps %ymm2,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,5,74,228,160 ; vblendvps %ymm10,%ymm12,%ymm15,%ymm12
- DB 197,28,92,249 ; vsubps %ymm1,%ymm12,%ymm15
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,254 ; vdivps %ymm14,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,29,74,231,208 ; vblendvps %ymm13,%ymm15,%ymm12,%ymm12
- DB 196,65,28,95,224 ; vmaxps %ymm8,%ymm12,%ymm12
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
+ DB 196,193,36,93,212 ; vminps %ymm12,%ymm11,%ymm2
+ DB 197,52,93,234 ; vminps %ymm2,%ymm9,%ymm13
+ DB 196,193,52,89,214 ; vmulps %ymm14,%ymm9,%ymm2
+ DB 196,65,36,89,215 ; vmulps %ymm15,%ymm11,%ymm10
+ DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
+ DB 197,156,89,192 ; vmulps %ymm0,%ymm12,%ymm0
+ DB 197,124,88,210 ; vaddps %ymm2,%ymm0,%ymm10
+ DB 196,193,52,92,194 ; vsubps %ymm10,%ymm9,%ymm0
+ DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
+ DB 196,193,44,92,213 ; vsubps %ymm13,%ymm10,%ymm2
+ DB 197,252,94,194 ; vdivps %ymm2,%ymm0,%ymm0
+ DB 196,65,36,92,242 ; vsubps %ymm10,%ymm11,%ymm14
+ DB 196,65,44,89,246 ; vmulps %ymm14,%ymm10,%ymm14
+ DB 197,12,94,242 ; vdivps %ymm2,%ymm14,%ymm14
+ DB 196,65,28,92,250 ; vsubps %ymm10,%ymm12,%ymm15
+ DB 196,65,44,89,255 ; vmulps %ymm15,%ymm10,%ymm15
DB 197,132,94,210 ; vdivps %ymm2,%ymm15,%ymm2
- DB 197,244,88,210 ; vaddps %ymm2,%ymm1,%ymm2
- DB 196,227,109,74,192,160 ; vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- DB 197,252,92,209 ; vsubps %ymm1,%ymm0,%ymm2
- DB 197,180,89,210 ; vmulps %ymm2,%ymm9,%ymm2
- DB 196,193,108,94,214 ; vdivps %ymm14,%ymm2,%ymm2
- DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,227,125,74,193,208 ; vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- DB 196,193,124,95,208 ; vmaxps %ymm8,%ymm0,%ymm2
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 197,228,89,207 ; vmulps %ymm7,%ymm3,%ymm1
- DB 197,252,92,217 ; vsubps %ymm1,%ymm0,%ymm3
- DB 196,193,100,89,195 ; vmulps %ymm11,%ymm3,%ymm0
- DB 196,193,100,89,204 ; vmulps %ymm12,%ymm3,%ymm1
- DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 196,65,60,194,237,2 ; vcmpleps %ymm13,%ymm8,%ymm13
+ DB 196,65,44,88,246 ; vaddps %ymm14,%ymm10,%ymm14
+ DB 196,67,13,74,243,208 ; vblendvps %ymm13,%ymm11,%ymm14,%ymm14
+ DB 196,65,36,95,220 ; vmaxps %ymm12,%ymm11,%ymm11
+ DB 197,172,88,210 ; vaddps %ymm2,%ymm10,%ymm2
+ DB 196,195,109,74,212,208 ; vblendvps %ymm13,%ymm12,%ymm2,%ymm2
+ DB 197,172,88,192 ; vaddps %ymm0,%ymm10,%ymm0
+ DB 196,195,125,74,193,208 ; vblendvps %ymm13,%ymm9,%ymm0,%ymm0
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,52,95,203 ; vmaxps %ymm11,%ymm9,%ymm9
+ DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
+ DB 196,65,28,92,234 ; vsubps %ymm10,%ymm12,%ymm13
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,28,194,249,1 ; vcmpltps %ymm9,%ymm12,%ymm15
+ DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
+ DB 196,65,36,94,217 ; vdivps %ymm9,%ymm11,%ymm11
+ DB 196,65,44,88,219 ; vaddps %ymm11,%ymm10,%ymm11
+ DB 196,195,125,74,195,240 ; vblendvps %ymm15,%ymm11,%ymm0,%ymm0
+ DB 196,65,12,92,218 ; vsubps %ymm10,%ymm14,%ymm11
+ DB 196,65,20,89,219 ; vmulps %ymm11,%ymm13,%ymm11
+ DB 196,65,36,94,217 ; vdivps %ymm9,%ymm11,%ymm11
+ DB 196,65,44,88,219 ; vaddps %ymm11,%ymm10,%ymm11
+ DB 196,67,13,74,219,240 ; vblendvps %ymm15,%ymm11,%ymm14,%ymm11
+ DB 196,65,108,92,242 ; vsubps %ymm10,%ymm2,%ymm14
+ DB 196,65,20,89,238 ; vmulps %ymm14,%ymm13,%ymm13
+ DB 196,65,20,94,201 ; vdivps %ymm9,%ymm13,%ymm9
+ DB 196,65,44,88,201 ; vaddps %ymm9,%ymm10,%ymm9
+ DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
+ DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
+ DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
+ DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
+ DB 196,98,125,24,5,200,77,0,0 ; vbroadcastss 0x4dc8(%rip),%ymm8 # 5ea8 <_sk_callback_avx+0x1a0>
+ DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
+ DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
+ DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
+ DB 197,60,89,220 ; vmulps %ymm4,%ymm8,%ymm11
+ DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
+ DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
+ DB 197,180,89,12,36 ; vmulps (%rsp),%ymm9,%ymm1
+ DB 197,60,89,221 ; vmulps %ymm5,%ymm8,%ymm11
+ DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
+ DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
+ DB 197,52,89,76,36,32 ; vmulps 0x20(%rsp),%ymm9,%ymm9
+ DB 197,60,89,198 ; vmulps %ymm6,%ymm8,%ymm8
+ DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
+ DB 197,188,88,210 ; vaddps %ymm2,%ymm8,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_color_avx
_sk_color_avx LABEL PROC
- DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,100,194,208,0 ; vcmpeqps %ymm8,%ymm3,%ymm10
- DB 196,98,125,24,13,212,76,0,0 ; vbroadcastss 0x4cd4(%rip),%ymm9 # 5d6c <_sk_callback_avx+0x1a4>
- DB 197,52,94,219 ; vdivps %ymm3,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
- DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
- DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
- DB 196,98,125,24,21,185,76,0,0 ; vbroadcastss 0x4cb9(%rip),%ymm10 # 5d70 <_sk_callback_avx+0x1a8>
- DB 196,65,92,89,218 ; vmulps %ymm10,%ymm4,%ymm11
- DB 196,98,125,24,37,175,76,0,0 ; vbroadcastss 0x4caf(%rip),%ymm12 # 5d74 <_sk_callback_avx+0x1ac>
- DB 196,65,84,89,236 ; vmulps %ymm12,%ymm5,%ymm13
- DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,98,125,24,45,160,76,0,0 ; vbroadcastss 0x4ca0(%rip),%ymm13 # 5d78 <_sk_callback_avx+0x1b0>
- DB 196,65,76,89,245 ; vmulps %ymm13,%ymm6,%ymm14
- DB 196,65,36,88,222 ; vaddps %ymm14,%ymm11,%ymm11
- DB 196,65,124,89,242 ; vmulps %ymm10,%ymm0,%ymm14
- DB 196,65,116,89,252 ; vmulps %ymm12,%ymm1,%ymm15
- DB 196,65,12,88,247 ; vaddps %ymm15,%ymm14,%ymm14
- DB 196,65,108,89,253 ; vmulps %ymm13,%ymm2,%ymm15
- DB 196,65,4,88,246 ; vaddps %ymm14,%ymm15,%ymm14
- DB 196,65,36,92,222 ; vsubps %ymm14,%ymm11,%ymm11
- DB 196,65,124,88,243 ; vaddps %ymm11,%ymm0,%ymm14
- DB 196,65,116,88,251 ; vaddps %ymm11,%ymm1,%ymm15
- DB 196,193,108,88,195 ; vaddps %ymm11,%ymm2,%ymm0
- DB 197,132,93,200 ; vminps %ymm0,%ymm15,%ymm1
- DB 197,140,93,209 ; vminps %ymm1,%ymm14,%ymm2
- DB 197,132,95,200 ; vmaxps %ymm0,%ymm15,%ymm1
- DB 197,12,95,217 ; vmaxps %ymm1,%ymm14,%ymm11
- DB 196,193,12,89,202 ; vmulps %ymm10,%ymm14,%ymm1
- DB 196,65,4,89,212 ; vmulps %ymm12,%ymm15,%ymm10
- DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,65,124,89,213 ; vmulps %ymm13,%ymm0,%ymm10
- DB 197,172,88,201 ; vaddps %ymm1,%ymm10,%ymm1
- DB 197,60,194,210,2 ; vcmpleps %ymm2,%ymm8,%ymm10
- DB 197,12,92,225 ; vsubps %ymm1,%ymm14,%ymm12
- DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
- DB 197,244,92,210 ; vsubps %ymm2,%ymm1,%ymm2
- DB 197,28,94,226 ; vdivps %ymm2,%ymm12,%ymm12
- DB 196,65,116,88,228 ; vaddps %ymm12,%ymm1,%ymm12
- DB 196,67,29,74,230,160 ; vblendvps %ymm10,%ymm14,%ymm12,%ymm12
- DB 196,65,52,194,235,1 ; vcmpltps %ymm11,%ymm9,%ymm13
- DB 197,28,92,241 ; vsubps %ymm1,%ymm12,%ymm14
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
+ DB 72,131,236,120 ; sub $0x78,%rsp
+ DB 197,252,17,20,36 ; vmovups %ymm2,(%rsp)
+ DB 197,252,17,76,36,64 ; vmovups %ymm1,0x40(%rsp)
+ DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
+ DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
+ DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
+ DB 196,98,125,24,45,88,77,0,0 ; vbroadcastss 0x4d58(%rip),%ymm13 # 5eac <_sk_callback_avx+0x1a4>
+ DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
+ DB 196,98,125,24,53,78,77,0,0 ; vbroadcastss 0x4d4e(%rip),%ymm14 # 5eb0 <_sk_callback_avx+0x1a8>
+ DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
+ DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
+ DB 196,98,125,24,61,63,77,0,0 ; vbroadcastss 0x4d3f(%rip),%ymm15 # 5eb4 <_sk_callback_avx+0x1ac>
+ DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
+ DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
+ DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
+ DB 196,65,52,89,230 ; vmulps %ymm14,%ymm9,%ymm12
+ DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
+ DB 197,108,89,231 ; vmulps %ymm7,%ymm2,%ymm12
+ DB 196,65,28,89,215 ; vmulps %ymm15,%ymm12,%ymm10
+ DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
+ DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
+ DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
+ DB 197,60,88,192 ; vaddps %ymm0,%ymm8,%ymm8
+ DB 197,52,88,208 ; vaddps %ymm0,%ymm9,%ymm10
+ DB 197,28,88,216 ; vaddps %ymm0,%ymm12,%ymm11
+ DB 196,193,44,93,195 ; vminps %ymm11,%ymm10,%ymm0
+ DB 197,60,93,224 ; vminps %ymm0,%ymm8,%ymm12
+ DB 196,193,60,89,197 ; vmulps %ymm13,%ymm8,%ymm0
+ DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
+ DB 196,193,124,88,193 ; vaddps %ymm9,%ymm0,%ymm0
+ DB 196,65,36,89,207 ; vmulps %ymm15,%ymm11,%ymm9
+ DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
+ DB 196,193,60,92,193 ; vsubps %ymm9,%ymm8,%ymm0
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 196,65,52,92,236 ; vsubps %ymm12,%ymm9,%ymm13
+ DB 196,193,124,94,197 ; vdivps %ymm13,%ymm0,%ymm0
+ DB 196,65,44,92,241 ; vsubps %ymm9,%ymm10,%ymm14
DB 196,65,52,89,246 ; vmulps %ymm14,%ymm9,%ymm14
- DB 197,36,92,217 ; vsubps %ymm1,%ymm11,%ymm11
- DB 196,65,12,94,243 ; vdivps %ymm11,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,29,74,230,208 ; vblendvps %ymm13,%ymm14,%ymm12,%ymm12
- DB 196,65,28,95,224 ; vmaxps %ymm8,%ymm12,%ymm12
- DB 197,4,92,241 ; vsubps %ymm1,%ymm15,%ymm14
- DB 196,65,116,89,246 ; vmulps %ymm14,%ymm1,%ymm14
- DB 197,12,94,242 ; vdivps %ymm2,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,67,13,74,247,160 ; vblendvps %ymm10,%ymm15,%ymm14,%ymm14
- DB 197,12,92,249 ; vsubps %ymm1,%ymm14,%ymm15
+ DB 196,65,12,94,245 ; vdivps %ymm13,%ymm14,%ymm14
+ DB 196,65,36,92,249 ; vsubps %ymm9,%ymm11,%ymm15
DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,251 ; vdivps %ymm11,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,13,74,247,208 ; vblendvps %ymm13,%ymm15,%ymm14,%ymm14
- DB 196,65,12,95,240 ; vmaxps %ymm8,%ymm14,%ymm14
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 197,132,94,210 ; vdivps %ymm2,%ymm15,%ymm2
- DB 197,244,88,210 ; vaddps %ymm2,%ymm1,%ymm2
- DB 196,227,109,74,192,160 ; vblendvps %ymm10,%ymm0,%ymm2,%ymm0
- DB 197,252,92,209 ; vsubps %ymm1,%ymm0,%ymm2
- DB 197,180,89,210 ; vmulps %ymm2,%ymm9,%ymm2
- DB 196,193,108,94,211 ; vdivps %ymm11,%ymm2,%ymm2
- DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,227,125,74,193,208 ; vblendvps %ymm13,%ymm1,%ymm0,%ymm0
- DB 196,193,124,95,208 ; vmaxps %ymm8,%ymm0,%ymm2
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 197,228,89,207 ; vmulps %ymm7,%ymm3,%ymm1
- DB 197,252,92,217 ; vsubps %ymm1,%ymm0,%ymm3
- DB 196,193,100,89,196 ; vmulps %ymm12,%ymm3,%ymm0
- DB 196,193,100,89,206 ; vmulps %ymm14,%ymm3,%ymm1
- DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 196,65,4,94,237 ; vdivps %ymm13,%ymm15,%ymm13
+ DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
+ DB 196,65,4,194,228,2 ; vcmpleps %ymm12,%ymm15,%ymm12
+ DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
+ DB 196,67,13,74,242,192 ; vblendvps %ymm12,%ymm10,%ymm14,%ymm14
+ DB 196,65,44,95,211 ; vmaxps %ymm11,%ymm10,%ymm10
+ DB 196,65,52,88,237 ; vaddps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,219,192 ; vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
+ DB 196,195,125,74,200,192 ; vblendvps %ymm12,%ymm8,%ymm0,%ymm1
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,60,95,194 ; vmaxps %ymm10,%ymm8,%ymm8
+ DB 196,65,116,92,209 ; vsubps %ymm9,%ymm1,%ymm10
+ DB 196,65,28,92,233 ; vsubps %ymm9,%ymm12,%ymm13
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,193,28,194,192,1 ; vcmpltps %ymm8,%ymm12,%ymm0
+ DB 196,65,60,92,193 ; vsubps %ymm9,%ymm8,%ymm8
+ DB 196,65,44,94,208 ; vdivps %ymm8,%ymm10,%ymm10
+ DB 196,65,52,88,210 ; vaddps %ymm10,%ymm9,%ymm10
+ DB 196,195,117,74,202,0 ; vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ DB 196,65,12,92,209 ; vsubps %ymm9,%ymm14,%ymm10
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,65,44,94,208 ; vdivps %ymm8,%ymm10,%ymm10
+ DB 196,65,52,88,210 ; vaddps %ymm10,%ymm9,%ymm10
+ DB 196,67,13,74,210,0 ; vblendvps %ymm0,%ymm10,%ymm14,%ymm10
+ DB 196,65,36,92,241 ; vsubps %ymm9,%ymm11,%ymm14
+ DB 196,65,20,89,238 ; vmulps %ymm14,%ymm13,%ymm13
+ DB 196,65,20,94,192 ; vdivps %ymm8,%ymm13,%ymm8
+ DB 196,65,52,88,192 ; vaddps %ymm8,%ymm9,%ymm8
+ DB 196,193,116,95,207 ; vmaxps %ymm15,%ymm1,%ymm1
+ DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
+ DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
+ DB 196,226,125,24,5,6,76,0,0 ; vbroadcastss 0x4c06(%rip),%ymm0 # 5eb8 <_sk_callback_avx+0x1b0>
+ DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
+ DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
+ DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
+ DB 197,164,89,196 ; vmulps %ymm4,%ymm11,%ymm0
+ DB 197,252,88,194 ; vaddps %ymm2,%ymm0,%ymm0
+ DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
+ DB 197,172,89,76,36,64 ; vmulps 0x40(%rsp),%ymm10,%ymm1
+ DB 197,164,89,213 ; vmulps %ymm5,%ymm11,%ymm2
+ DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
+ DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
+ DB 197,172,89,20,36 ; vmulps (%rsp),%ymm10,%ymm2
+ DB 197,36,89,206 ; vmulps %ymm6,%ymm11,%ymm9
+ DB 197,180,88,210 ; vaddps %ymm2,%ymm9,%ymm2
+ DB 196,193,108,88,208 ; vaddps %ymm8,%ymm2,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,120 ; add $0x78,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_luminosity_avx
_sk_luminosity_avx LABEL PROC
- DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,65,68,194,208,0 ; vcmpeqps %ymm8,%ymm7,%ymm10
- DB 196,98,125,24,13,93,75,0,0 ; vbroadcastss 0x4b5d(%rip),%ymm9 # 5d7c <_sk_callback_avx+0x1b4>
- DB 197,52,94,223 ; vdivps %ymm7,%ymm9,%ymm11
- DB 196,67,37,74,208,160 ; vblendvps %ymm10,%ymm8,%ymm11,%ymm10
- DB 197,44,89,220 ; vmulps %ymm4,%ymm10,%ymm11
- DB 197,44,89,229 ; vmulps %ymm5,%ymm10,%ymm12
- DB 197,44,89,214 ; vmulps %ymm6,%ymm10,%ymm10
- DB 196,98,125,24,45,66,75,0,0 ; vbroadcastss 0x4b42(%rip),%ymm13 # 5d80 <_sk_callback_avx+0x1b8>
- DB 196,193,124,89,197 ; vmulps %ymm13,%ymm0,%ymm0
- DB 196,98,125,24,53,56,75,0,0 ; vbroadcastss 0x4b38(%rip),%ymm14 # 5d84 <_sk_callback_avx+0x1bc>
- DB 196,193,116,89,206 ; vmulps %ymm14,%ymm1,%ymm1
- DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,42,75,0,0 ; vbroadcastss 0x4b2a(%rip),%ymm1 # 5d88 <_sk_callback_avx+0x1c0>
- DB 197,236,89,209 ; vmulps %ymm1,%ymm2,%ymm2
- DB 197,252,88,194 ; vaddps %ymm2,%ymm0,%ymm0
- DB 196,193,36,89,213 ; vmulps %ymm13,%ymm11,%ymm2
- DB 196,65,28,89,254 ; vmulps %ymm14,%ymm12,%ymm15
- DB 196,193,108,88,215 ; vaddps %ymm15,%ymm2,%ymm2
- DB 197,44,89,249 ; vmulps %ymm1,%ymm10,%ymm15
- DB 197,132,88,210 ; vaddps %ymm2,%ymm15,%ymm2
- DB 197,252,92,194 ; vsubps %ymm2,%ymm0,%ymm0
- DB 197,164,88,208 ; vaddps %ymm0,%ymm11,%ymm2
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 197,124,40,226 ; vmovaps %ymm2,%ymm12
+ DB 197,124,17,36,36 ; vmovups %ymm12,(%rsp)
+ DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp)
+ DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
+ DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
+ DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
+ DB 196,98,125,24,45,146,75,0,0 ; vbroadcastss 0x4b92(%rip),%ymm13 # 5ebc <_sk_callback_avx+0x1b4>
+ DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
+ DB 196,98,125,24,53,136,75,0,0 ; vbroadcastss 0x4b88(%rip),%ymm14 # 5ec0 <_sk_callback_avx+0x1b8>
+ DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
+ DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
+ DB 196,98,125,24,61,121,75,0,0 ; vbroadcastss 0x4b79(%rip),%ymm15 # 5ec4 <_sk_callback_avx+0x1bc>
+ DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
+ DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
+ DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
+ DB 196,65,52,89,230 ; vmulps %ymm14,%ymm9,%ymm12
+ DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
+ DB 197,100,89,230 ; vmulps %ymm6,%ymm3,%ymm12
+ DB 196,65,28,89,215 ; vmulps %ymm15,%ymm12,%ymm10
+ DB 196,65,36,88,210 ; vaddps %ymm10,%ymm11,%ymm10
+ DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
+ DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
+ DB 197,60,88,192 ; vaddps %ymm0,%ymm8,%ymm8
+ DB 197,52,88,208 ; vaddps %ymm0,%ymm9,%ymm10
DB 197,28,88,216 ; vaddps %ymm0,%ymm12,%ymm11
- DB 197,172,88,192 ; vaddps %ymm0,%ymm10,%ymm0
- DB 197,36,93,208 ; vminps %ymm0,%ymm11,%ymm10
- DB 196,65,108,93,210 ; vminps %ymm10,%ymm2,%ymm10
- DB 197,36,95,224 ; vmaxps %ymm0,%ymm11,%ymm12
- DB 196,65,108,95,228 ; vmaxps %ymm12,%ymm2,%ymm12
- DB 196,65,108,89,237 ; vmulps %ymm13,%ymm2,%ymm13
- DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
- DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
- DB 197,252,89,201 ; vmulps %ymm1,%ymm0,%ymm1
- DB 196,193,116,88,205 ; vaddps %ymm13,%ymm1,%ymm1
- DB 196,65,60,194,234,2 ; vcmpleps %ymm10,%ymm8,%ymm13
- DB 197,108,92,241 ; vsubps %ymm1,%ymm2,%ymm14
- DB 196,65,116,89,246 ; vmulps %ymm14,%ymm1,%ymm14
- DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,65,12,94,242 ; vdivps %ymm10,%ymm14,%ymm14
- DB 196,65,116,88,246 ; vaddps %ymm14,%ymm1,%ymm14
- DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
- DB 196,65,52,194,244,1 ; vcmpltps %ymm12,%ymm9,%ymm14
- DB 197,108,92,249 ; vsubps %ymm1,%ymm2,%ymm15
- DB 197,52,92,201 ; vsubps %ymm1,%ymm9,%ymm9
- DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 197,28,92,225 ; vsubps %ymm1,%ymm12,%ymm12
- DB 196,65,4,94,252 ; vdivps %ymm12,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,195,109,74,215,224 ; vblendvps %ymm14,%ymm15,%ymm2,%ymm2
- DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 197,36,92,249 ; vsubps %ymm1,%ymm11,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 196,65,4,94,250 ; vdivps %ymm10,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,5,74,219,208 ; vblendvps %ymm13,%ymm11,%ymm15,%ymm11
- DB 197,36,92,249 ; vsubps %ymm1,%ymm11,%ymm15
+ DB 196,193,44,93,195 ; vminps %ymm11,%ymm10,%ymm0
+ DB 197,60,93,224 ; vminps %ymm0,%ymm8,%ymm12
+ DB 196,193,60,89,197 ; vmulps %ymm13,%ymm8,%ymm0
+ DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
+ DB 196,193,124,88,193 ; vaddps %ymm9,%ymm0,%ymm0
+ DB 196,65,36,89,207 ; vmulps %ymm15,%ymm11,%ymm9
+ DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
+ DB 196,193,60,92,193 ; vsubps %ymm9,%ymm8,%ymm0
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 196,65,52,92,236 ; vsubps %ymm12,%ymm9,%ymm13
+ DB 196,193,124,94,197 ; vdivps %ymm13,%ymm0,%ymm0
+ DB 196,65,44,92,241 ; vsubps %ymm9,%ymm10,%ymm14
+ DB 196,65,52,89,246 ; vmulps %ymm14,%ymm9,%ymm14
+ DB 196,65,12,94,245 ; vdivps %ymm13,%ymm14,%ymm14
+ DB 196,65,36,92,249 ; vsubps %ymm9,%ymm11,%ymm15
DB 196,65,52,89,255 ; vmulps %ymm15,%ymm9,%ymm15
- DB 196,65,4,94,252 ; vdivps %ymm12,%ymm15,%ymm15
- DB 196,65,116,88,255 ; vaddps %ymm15,%ymm1,%ymm15
- DB 196,67,37,74,223,224 ; vblendvps %ymm14,%ymm15,%ymm11,%ymm11
- DB 196,65,36,95,216 ; vmaxps %ymm8,%ymm11,%ymm11
- DB 197,124,92,249 ; vsubps %ymm1,%ymm0,%ymm15
- DB 196,65,116,89,255 ; vmulps %ymm15,%ymm1,%ymm15
- DB 196,65,4,94,210 ; vdivps %ymm10,%ymm15,%ymm10
- DB 196,65,116,88,210 ; vaddps %ymm10,%ymm1,%ymm10
- DB 196,227,45,74,192,208 ; vblendvps %ymm13,%ymm0,%ymm10,%ymm0
- DB 197,124,92,209 ; vsubps %ymm1,%ymm0,%ymm10
- DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,65,52,94,204 ; vdivps %ymm12,%ymm9,%ymm9
+ DB 196,65,4,94,237 ; vdivps %ymm13,%ymm15,%ymm13
+ DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
+ DB 196,65,4,194,228,2 ; vcmpleps %ymm12,%ymm15,%ymm12
+ DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
+ DB 196,67,13,74,242,192 ; vblendvps %ymm12,%ymm10,%ymm14,%ymm14
+ DB 196,65,44,95,211 ; vmaxps %ymm11,%ymm10,%ymm10
+ DB 196,65,52,88,237 ; vaddps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,219,192 ; vblendvps %ymm12,%ymm11,%ymm13,%ymm11
+ DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
+ DB 196,195,125,74,200,192 ; vblendvps %ymm12,%ymm8,%ymm0,%ymm1
+ DB 197,100,89,231 ; vmulps %ymm7,%ymm3,%ymm12
+ DB 196,65,60,95,194 ; vmaxps %ymm10,%ymm8,%ymm8
+ DB 196,65,116,92,209 ; vsubps %ymm9,%ymm1,%ymm10
+ DB 196,65,28,92,233 ; vsubps %ymm9,%ymm12,%ymm13
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,193,28,194,192,1 ; vcmpltps %ymm8,%ymm12,%ymm0
+ DB 196,65,60,92,193 ; vsubps %ymm9,%ymm8,%ymm8
+ DB 196,65,44,94,208 ; vdivps %ymm8,%ymm10,%ymm10
+ DB 196,65,52,88,210 ; vaddps %ymm10,%ymm9,%ymm10
+ DB 196,195,117,74,202,0 ; vblendvps %ymm0,%ymm10,%ymm1,%ymm1
+ DB 196,65,12,92,209 ; vsubps %ymm9,%ymm14,%ymm10
+ DB 196,65,20,89,210 ; vmulps %ymm10,%ymm13,%ymm10
+ DB 196,65,44,94,208 ; vdivps %ymm8,%ymm10,%ymm10
+ DB 196,65,52,88,210 ; vaddps %ymm10,%ymm9,%ymm10
+ DB 196,67,13,74,210,0 ; vblendvps %ymm0,%ymm10,%ymm14,%ymm10
+ DB 196,65,36,92,241 ; vsubps %ymm9,%ymm11,%ymm14
+ DB 196,65,20,89,238 ; vmulps %ymm14,%ymm13,%ymm13
+ DB 196,65,20,94,192 ; vdivps %ymm8,%ymm13,%ymm8
+ DB 196,65,52,88,192 ; vaddps %ymm8,%ymm9,%ymm8
+ DB 196,193,116,95,207 ; vmaxps %ymm15,%ymm1,%ymm1
+ DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
+ DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
+ DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
+ DB 196,226,125,24,5,64,74,0,0 ; vbroadcastss 0x4a40(%rip),%ymm0 # 5ec8 <_sk_callback_avx+0x1c0>
+ DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
+ DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
+ DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
+ DB 197,164,89,196 ; vmulps %ymm4,%ymm11,%ymm0
+ DB 197,252,88,194 ; vaddps %ymm2,%ymm0,%ymm0
+ DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
+ DB 197,172,89,76,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm1
+ DB 197,164,89,213 ; vmulps %ymm5,%ymm11,%ymm2
+ DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
- DB 196,227,125,74,193,224 ; vblendvps %ymm14,%ymm1,%ymm0,%ymm0
- DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8
- DB 197,228,88,199 ; vaddps %ymm7,%ymm3,%ymm0
- DB 197,228,89,207 ; vmulps %ymm7,%ymm3,%ymm1
- DB 197,252,92,217 ; vsubps %ymm1,%ymm0,%ymm3
- DB 197,228,89,194 ; vmulps %ymm2,%ymm3,%ymm0
- DB 196,193,100,89,203 ; vmulps %ymm11,%ymm3,%ymm1
- DB 196,193,100,89,208 ; vmulps %ymm8,%ymm3,%ymm2
+ DB 197,172,89,20,36 ; vmulps (%rsp),%ymm10,%ymm2
+ DB 197,36,89,206 ; vmulps %ymm6,%ymm11,%ymm9
+ DB 197,180,88,210 ; vaddps %ymm2,%ymm9,%ymm2
+ DB 196,193,108,88,208 ; vaddps %ymm8,%ymm2,%ymm2
+ DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,92,220 ; vsubps %ymm12,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_clamp_0_avx
@@ -5998,7 +6111,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,211,73,0,0 ; vbroadcastss 0x49d3(%rip),%ymm8 # 5d8c <_sk_callback_avx+0x1c4>
+ DB 196,98,125,24,5,208,73,0,0 ; vbroadcastss 0x49d0(%rip),%ymm8 # 5ecc <_sk_callback_avx+0x1c4>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -6008,7 +6121,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,182,73,0,0 ; vbroadcastss 0x49b6(%rip),%ymm8 # 5d90 <_sk_callback_avx+0x1c8>
+ DB 196,98,125,24,5,179,73,0,0 ; vbroadcastss 0x49b3(%rip),%ymm8 # 5ed0 <_sk_callback_avx+0x1c8>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -6080,7 +6193,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,254,72,0,0 ; vbroadcastss 0x48fe(%rip),%ymm10 # 5d94 <_sk_callback_avx+0x1cc>
+ DB 196,98,125,24,21,251,72,0,0 ; vbroadcastss 0x48fb(%rip),%ymm10 # 5ed4 <_sk_callback_avx+0x1cc>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -6091,17 +6204,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,223,72,0,0 ; vbroadcastss 0x48df(%rip),%ymm8 # 5d98 <_sk_callback_avx+0x1d0>
+ DB 196,98,125,24,5,220,72,0,0 ; vbroadcastss 0x48dc(%rip),%ymm8 # 5ed8 <_sk_callback_avx+0x1d0>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,209,72,0,0 ; vbroadcastss 0x48d1(%rip),%ymm11 # 5d9c <_sk_callback_avx+0x1d4>
+ DB 196,98,125,24,29,206,72,0,0 ; vbroadcastss 0x48ce(%rip),%ymm11 # 5edc <_sk_callback_avx+0x1d4>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,199,72,0,0 ; vbroadcastss 0x48c7(%rip),%ymm13 # 5da0 <_sk_callback_avx+0x1d8>
+ DB 196,98,125,24,45,196,72,0,0 ; vbroadcastss 0x48c4(%rip),%ymm13 # 5ee0 <_sk_callback_avx+0x1d8>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,184,72,0,0 ; vbroadcastss 0x48b8(%rip),%ymm12 # 5da4 <_sk_callback_avx+0x1dc>
+ DB 196,98,125,24,37,181,72,0,0 ; vbroadcastss 0x48b5(%rip),%ymm12 # 5ee4 <_sk_callback_avx+0x1dc>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,174,72,0,0 ; vbroadcastss 0x48ae(%rip),%ymm14 # 5da8 <_sk_callback_avx+0x1e0>
+ DB 196,98,125,24,53,171,72,0,0 ; vbroadcastss 0x48ab(%rip),%ymm14 # 5ee8 <_sk_callback_avx+0x1e0>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -6128,18 +6241,18 @@ _sk_to_srgb_avx LABEL PROC
DB 197,124,82,192 ; vrsqrtps %ymm0,%ymm8
DB 196,65,124,83,200 ; vrcpps %ymm8,%ymm9
DB 196,65,124,82,208 ; vrsqrtps %ymm8,%ymm10
- DB 196,98,125,24,5,57,72,0,0 ; vbroadcastss 0x4839(%rip),%ymm8 # 5dac <_sk_callback_avx+0x1e4>
+ DB 196,98,125,24,5,54,72,0,0 ; vbroadcastss 0x4836(%rip),%ymm8 # 5eec <_sk_callback_avx+0x1e4>
DB 196,65,124,89,216 ; vmulps %ymm8,%ymm0,%ymm11
- DB 196,98,125,24,37,47,72,0,0 ; vbroadcastss 0x482f(%rip),%ymm12 # 5db0 <_sk_callback_avx+0x1e8>
+ DB 196,98,125,24,37,44,72,0,0 ; vbroadcastss 0x482c(%rip),%ymm12 # 5ef0 <_sk_callback_avx+0x1e8>
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,45,37,72,0,0 ; vbroadcastss 0x4825(%rip),%ymm13 # 5db4 <_sk_callback_avx+0x1ec>
+ DB 196,98,125,24,45,34,72,0,0 ; vbroadcastss 0x4822(%rip),%ymm13 # 5ef4 <_sk_callback_avx+0x1ec>
DB 196,65,52,88,205 ; vaddps %ymm13,%ymm9,%ymm9
- DB 196,98,125,24,53,27,72,0,0 ; vbroadcastss 0x481b(%rip),%ymm14 # 5db8 <_sk_callback_avx+0x1f0>
+ DB 196,98,125,24,53,24,72,0,0 ; vbroadcastss 0x4818(%rip),%ymm14 # 5ef8 <_sk_callback_avx+0x1f0>
DB 196,65,44,89,214 ; vmulps %ymm14,%ymm10,%ymm10
DB 196,65,44,88,201 ; vaddps %ymm9,%ymm10,%ymm9
- DB 196,98,125,24,21,12,72,0,0 ; vbroadcastss 0x480c(%rip),%ymm10 # 5dbc <_sk_callback_avx+0x1f4>
+ DB 196,98,125,24,21,9,72,0,0 ; vbroadcastss 0x4809(%rip),%ymm10 # 5efc <_sk_callback_avx+0x1f4>
DB 196,65,44,93,201 ; vminps %ymm9,%ymm10,%ymm9
- DB 196,98,125,24,61,2,72,0,0 ; vbroadcastss 0x4802(%rip),%ymm15 # 5dc0 <_sk_callback_avx+0x1f8>
+ DB 196,98,125,24,61,255,71,0,0 ; vbroadcastss 0x47ff(%rip),%ymm15 # 5f00 <_sk_callback_avx+0x1f8>
DB 196,193,124,194,199,1 ; vcmpltps %ymm15,%ymm0,%ymm0
DB 196,195,53,74,195,0 ; vblendvps %ymm0,%ymm11,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -6174,7 +6287,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,104,71,0,0 ; vbroadcastss 0x4768(%rip),%ymm11 # 5dc4 <_sk_callback_avx+0x1fc>
+ DB 196,98,125,24,29,101,71,0,0 ; vbroadcastss 0x4765(%rip),%ymm11 # 5f04 <_sk_callback_avx+0x1fc>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -6184,19 +6297,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,65,71,0,0 ; vbroadcastss 0x4741(%rip),%ymm11 # 5dd0 <_sk_callback_avx+0x208>
+ DB 196,98,125,24,29,62,71,0,0 ; vbroadcastss 0x473e(%rip),%ymm11 # 5f10 <_sk_callback_avx+0x208>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,47,71,0,0 ; vbroadcastss 0x472f(%rip),%ymm11 # 5dcc <_sk_callback_avx+0x204>
+ DB 196,98,125,24,29,44,71,0,0 ; vbroadcastss 0x472c(%rip),%ymm11 # 5f0c <_sk_callback_avx+0x204>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,23,71,0,0 ; vbroadcastss 0x4717(%rip),%ymm2 # 5dc8 <_sk_callback_avx+0x200>
+ DB 196,226,125,24,21,20,71,0,0 ; vbroadcastss 0x4714(%rip),%ymm2 # 5f08 <_sk_callback_avx+0x200>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,254,70,0,0 ; vbroadcastss 0x46fe(%rip),%ymm12 # 5dd8 <_sk_callback_avx+0x210>
+ DB 196,98,125,24,37,251,70,0,0 ; vbroadcastss 0x46fb(%rip),%ymm12 # 5f18 <_sk_callback_avx+0x210>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -6206,7 +6319,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,193,70,0,0 ; vbroadcastss 0x46c1(%rip),%ymm8 # 5dd4 <_sk_callback_avx+0x20c>
+ DB 196,98,125,24,5,190,70,0,0 ; vbroadcastss 0x46be(%rip),%ymm8 # 5f14 <_sk_callback_avx+0x20c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -6221,7 +6334,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,136,70,0,0 ; vbroadcastss 0x4688(%rip),%ymm8 # 5ddc <_sk_callback_avx+0x214>
+ DB 196,98,125,24,5,133,70,0,0 ; vbroadcastss 0x4685(%rip),%ymm8 # 5f1c <_sk_callback_avx+0x214>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -6229,23 +6342,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,98,70,0,0 ; vbroadcastss 0x4662(%rip),%ymm11 # 5de0 <_sk_callback_avx+0x218>
+ DB 196,98,125,24,29,95,70,0,0 ; vbroadcastss 0x465f(%rip),%ymm11 # 5f20 <_sk_callback_avx+0x218>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,76,70,0,0 ; vbroadcastss 0x464c(%rip),%ymm12 # 5de8 <_sk_callback_avx+0x220>
+ DB 196,98,125,24,37,73,70,0,0 ; vbroadcastss 0x4649(%rip),%ymm12 # 5f28 <_sk_callback_avx+0x220>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,66,70,0,0 ; vbroadcastss 0x4642(%rip),%ymm13 # 5dec <_sk_callback_avx+0x224>
+ DB 196,98,125,24,45,63,70,0,0 ; vbroadcastss 0x463f(%rip),%ymm13 # 5f2c <_sk_callback_avx+0x224>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,35,70,0,0 ; vbroadcastss 0x4623(%rip),%ymm1 # 5de4 <_sk_callback_avx+0x21c>
+ DB 196,226,125,24,13,32,70,0,0 ; vbroadcastss 0x4620(%rip),%ymm1 # 5f24 <_sk_callback_avx+0x21c>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,14,70,0,0 ; vbroadcastss 0x460e(%rip),%ymm14 # 5df0 <_sk_callback_avx+0x228>
+ DB 196,98,125,24,53,11,70,0,0 ; vbroadcastss 0x460b(%rip),%ymm14 # 5f30 <_sk_callback_avx+0x228>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6264,7 +6377,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,176,69,0,0 ; vbroadcastss 0x45b0(%rip),%ymm0 # 5df4 <_sk_callback_avx+0x22c>
+ DB 196,226,125,24,5,173,69,0,0 ; vbroadcastss 0x45ad(%rip),%ymm0 # 5f34 <_sk_callback_avx+0x22c>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -6312,14 +6425,14 @@ _sk_scale_u8_avx LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,68 ; jne 1941 <_sk_scale_u8_avx+0x54>
+ DB 117,68 ; jne 1a84 <_sk_scale_u8_avx+0x54>
DB 197,122,126,0 ; vmovq (%rax),%xmm8
DB 196,66,121,49,200 ; vpmovzxbd %xmm8,%xmm9
DB 196,67,121,4,192,229 ; vpermilps $0xe5,%xmm8,%xmm8
DB 196,66,121,49,192 ; vpmovzxbd %xmm8,%xmm8
DB 196,67,53,24,192,1 ; vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,211,68,0,0 ; vbroadcastss 0x44d3(%rip),%ymm9 # 5df8 <_sk_callback_avx+0x230>
+ DB 196,98,125,24,13,208,68,0,0 ; vbroadcastss 0x44d0(%rip),%ymm9 # 5f38 <_sk_callback_avx+0x230>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -6337,9 +6450,9 @@ _sk_scale_u8_avx LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 1949 <_sk_scale_u8_avx+0x5c>
+ DB 117,234 ; jne 1a8c <_sk_scale_u8_avx+0x5c>
DB 196,65,249,110,193 ; vmovq %r9,%xmm8
- DB 235,155 ; jmp 1901 <_sk_scale_u8_avx+0x14>
+ DB 235,155 ; jmp 1a44 <_sk_scale_u8_avx+0x14>
PUBLIC _sk_lerp_1_float_avx
_sk_lerp_1_float_avx LABEL PROC
@@ -6367,14 +6480,14 @@ _sk_lerp_u8_avx LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,104 ; jne 1a1d <_sk_lerp_u8_avx+0x78>
+ DB 117,104 ; jne 1b60 <_sk_lerp_u8_avx+0x78>
DB 197,122,126,0 ; vmovq (%rax),%xmm8
DB 196,66,121,49,200 ; vpmovzxbd %xmm8,%xmm9
DB 196,67,121,4,192,229 ; vpermilps $0xe5,%xmm8,%xmm8
DB 196,66,121,49,192 ; vpmovzxbd %xmm8,%xmm8
DB 196,67,53,24,192,1 ; vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,31,68,0,0 ; vbroadcastss 0x441f(%rip),%ymm9 # 5dfc <_sk_callback_avx+0x234>
+ DB 196,98,125,24,13,28,68,0,0 ; vbroadcastss 0x441c(%rip),%ymm9 # 5f3c <_sk_callback_avx+0x234>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -6400,35 +6513,35 @@ _sk_lerp_u8_avx LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 1a25 <_sk_lerp_u8_avx+0x80>
+ DB 117,234 ; jne 1b68 <_sk_lerp_u8_avx+0x80>
DB 196,65,249,110,193 ; vmovq %r9,%xmm8
- DB 233,116,255,255,255 ; jmpq 19b9 <_sk_lerp_u8_avx+0x14>
+ DB 233,116,255,255,255 ; jmpq 1afc <_sk_lerp_u8_avx+0x14>
PUBLIC _sk_lerp_565_avx
_sk_lerp_565_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,208,0,0,0 ; jne 1b23 <_sk_lerp_565_avx+0xde>
+ DB 15,133,208,0,0,0 ; jne 1c66 <_sk_lerp_565_avx+0xde>
DB 196,65,122,111,4,122 ; vmovdqu (%r10,%rdi,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,137,67,0,0 ; vbroadcastss 0x4389(%rip),%ymm9 # 5e00 <_sk_callback_avx+0x238>
+ DB 196,98,125,24,13,134,67,0,0 ; vbroadcastss 0x4386(%rip),%ymm9 # 5f40 <_sk_callback_avx+0x238>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,122,67,0,0 ; vbroadcastss 0x437a(%rip),%ymm10 # 5e04 <_sk_callback_avx+0x23c>
+ DB 196,98,125,24,21,119,67,0,0 ; vbroadcastss 0x4377(%rip),%ymm10 # 5f44 <_sk_callback_avx+0x23c>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,112,67,0,0 ; vbroadcastss 0x4370(%rip),%ymm10 # 5e08 <_sk_callback_avx+0x240>
+ DB 196,98,125,24,21,109,67,0,0 ; vbroadcastss 0x436d(%rip),%ymm10 # 5f48 <_sk_callback_avx+0x240>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,97,67,0,0 ; vbroadcastss 0x4361(%rip),%ymm11 # 5e0c <_sk_callback_avx+0x244>
+ DB 196,98,125,24,29,94,67,0,0 ; vbroadcastss 0x435e(%rip),%ymm11 # 5f4c <_sk_callback_avx+0x244>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,87,67,0,0 ; vbroadcastss 0x4357(%rip),%ymm11 # 5e10 <_sk_callback_avx+0x248>
+ DB 196,98,125,24,29,84,67,0,0 ; vbroadcastss 0x4354(%rip),%ymm11 # 5f50 <_sk_callback_avx+0x248>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,72,67,0,0 ; vbroadcastss 0x4348(%rip),%ymm11 # 5e14 <_sk_callback_avx+0x24c>
+ DB 196,98,125,24,29,69,67,0,0 ; vbroadcastss 0x4345(%rip),%ymm11 # 5f54 <_sk_callback_avx+0x24c>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
@@ -6455,9 +6568,9 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 15,135,29,255,255,255 ; ja 1a59 <_sk_lerp_565_avx+0x14>
+ DB 15,135,29,255,255,255 ; ja 1b9c <_sk_lerp_565_avx+0x14>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,77,0,0,0 ; lea 0x4d(%rip),%r9 # 1b94 <_sk_lerp_565_avx+0x14f>
+ DB 76,141,13,74,0,0,0 ; lea 0x4a(%rip),%r9 # 1cd4 <_sk_lerp_565_avx+0x14c>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -6469,26 +6582,28 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,196,68,122,4,2 ; vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm8,%xmm8
DB 196,65,57,196,68,122,2,1 ; vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm8,%xmm8
DB 196,65,57,196,4,122,0 ; vpinsrw $0x0,(%r10,%rdi,2),%xmm8,%xmm8
- DB 233,200,254,255,255 ; jmpq 1a59 <_sk_lerp_565_avx+0x14>
- DB 15,31,0 ; nopl (%rax)
- DB 241 ; icebp
+ DB 233,200,254,255,255 ; jmpq 1b9c <_sk_lerp_565_avx+0x14>
+ DB 244 ; hlt
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,225 ; jmpq ffffffffe2001b9c <_sk_callback_avx+0xffffffffe1ffbfd4>
+ DB 236 ; in (%dx),%al
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
- DB 217,255 ; fcos
DB 255 ; (bad)
- DB 255,209 ; callq *%rcx
DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,212 ; callq *%rsp
DB 255 ; (bad)
- DB 255,201 ; dec %ecx
+ DB 255 ; (bad)
+ DB 255,204 ; dec %esp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 188 ; .byte 0xbc
+ DB 191 ; .byte 0xbf
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -6498,7 +6613,7 @@ _sk_load_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,26,2,0,0 ; jne 1dd8 <_sk_load_tables_avx+0x228>
+ DB 15,133,26,2,0,0 ; jne 1f18 <_sk_load_tables_avx+0x228>
DB 196,65,124,16,4,184 ; vmovups (%r8,%rdi,4),%ymm8
DB 85 ; push %rbp
DB 65,87 ; push %r15
@@ -6506,7 +6621,7 @@ _sk_load_tables_avx LABEL PROC
DB 65,85 ; push %r13
DB 65,84 ; push %r12
DB 83 ; push %rbx
- DB 197,124,40,13,42,69,0,0 ; vmovaps 0x452a(%rip),%ymm9 # 6100 <_sk_callback_avx+0x538>
+ DB 197,124,40,13,42,69,0,0 ; vmovaps 0x452a(%rip),%ymm9 # 6240 <_sk_callback_avx+0x538>
DB 196,193,60,84,193 ; vandps %ymm9,%ymm8,%ymm0
DB 196,193,249,126,193 ; vmovq %xmm0,%r9
DB 69,137,203 ; mov %r9d,%r11d
@@ -6598,7 +6713,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,97,114,210,24 ; vpsrld $0x18,%xmm10,%xmm3
DB 196,227,61,24,219,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,83,64,0,0 ; vbroadcastss 0x4053(%rip),%ymm8 # 5e18 <_sk_callback_avx+0x250>
+ DB 196,98,125,24,5,83,64,0,0 ; vbroadcastss 0x4053(%rip),%ymm8 # 5f58 <_sk_callback_avx+0x250>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -6613,9 +6728,9 @@ _sk_load_tables_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,211,253,255,255 ; ja 1bc4 <_sk_load_tables_avx+0x14>
+ DB 15,135,211,253,255,255 ; ja 1d04 <_sk_load_tables_avx+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,140,0,0,0 ; lea 0x8c(%rip),%r10 # 1e88 <_sk_load_tables_avx+0x2d8>
+ DB 76,141,21,140,0,0,0 ; lea 0x8c(%rip),%r10 # 1fc8 <_sk_load_tables_avx+0x2d8>
DB 79,99,12,138 ; movslq (%r10,%r9,4),%r9
DB 77,1,209 ; add %r10,%r9
DB 65,255,225 ; jmpq *%r9
@@ -6638,7 +6753,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,99,61,12,192,15 ; vblendps $0xf,%ymm0,%ymm8,%ymm8
DB 196,195,57,34,4,184,0 ; vpinsrd $0x0,(%r8,%rdi,4),%xmm8,%xmm0
DB 196,99,61,12,192,15 ; vblendps $0xf,%ymm0,%ymm8,%ymm8
- DB 233,62,253,255,255 ; jmpq 1bc4 <_sk_load_tables_avx+0x14>
+ DB 233,62,253,255,255 ; jmpq 1d04 <_sk_load_tables_avx+0x14>
DB 102,144 ; xchg %ax,%ax
DB 236 ; in (%dx),%al
DB 255 ; (bad)
@@ -6656,7 +6771,7 @@ _sk_load_tables_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 1ea1 <_sk_load_tables_avx+0x2f1>
+ DB 126,255 ; jle 1fe1 <_sk_load_tables_avx+0x2f1>
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -6666,7 +6781,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,189,0,0,0,0 ; lea 0x0(,%rdi,4),%r9
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,113,2,0,0 ; jne 212b <_sk_load_tables_u16_be_avx+0x287>
+ DB 15,133,113,2,0,0 ; jne 226b <_sk_load_tables_u16_be_avx+0x287>
DB 196,1,121,16,4,72 ; vmovupd (%r8,%r9,2),%xmm8
DB 196,129,121,16,84,72,16 ; vmovupd 0x10(%r8,%r9,2),%xmm2
DB 196,129,121,16,92,72,32 ; vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -6688,7 +6803,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,177,108,208 ; vpunpcklqdq %xmm0,%xmm9,%xmm2
DB 197,177,109,200 ; vpunpckhqdq %xmm0,%xmm9,%xmm1
DB 196,65,57,108,212 ; vpunpcklqdq %xmm12,%xmm8,%xmm10
- DB 197,121,111,29,106,66,0,0 ; vmovdqa 0x426a(%rip),%xmm11 # 6180 <_sk_callback_avx+0x5b8>
+ DB 197,121,111,29,106,66,0,0 ; vmovdqa 0x426a(%rip),%xmm11 # 62c0 <_sk_callback_avx+0x5b8>
DB 196,193,105,219,195 ; vpand %xmm11,%xmm2,%xmm0
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,121,105,209 ; vpunpckhwd %xmm9,%xmm0,%xmm2
@@ -6787,7 +6902,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,195,101,24,216,1 ; vinsertf128 $0x1,%xmm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,4,61,0,0 ; vbroadcastss 0x3d04(%rip),%ymm8 # 5e1c <_sk_callback_avx+0x254>
+ DB 196,98,125,24,5,4,61,0,0 ; vbroadcastss 0x3d04(%rip),%ymm8 # 5f5c <_sk_callback_avx+0x254>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -6800,29 +6915,29 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,1,123,16,4,72 ; vmovsd (%r8,%r9,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,85 ; je 2191 <_sk_load_tables_u16_be_avx+0x2ed>
+ DB 116,85 ; je 22d1 <_sk_load_tables_u16_be_avx+0x2ed>
DB 196,1,57,22,68,72,8 ; vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,72 ; jb 2191 <_sk_load_tables_u16_be_avx+0x2ed>
+ DB 114,72 ; jb 22d1 <_sk_load_tables_u16_be_avx+0x2ed>
DB 196,129,123,16,84,72,16 ; vmovsd 0x10(%r8,%r9,2),%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 116,72 ; je 219e <_sk_load_tables_u16_be_avx+0x2fa>
+ DB 116,72 ; je 22de <_sk_load_tables_u16_be_avx+0x2fa>
DB 196,129,105,22,84,72,24 ; vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,59 ; jb 219e <_sk_load_tables_u16_be_avx+0x2fa>
+ DB 114,59 ; jb 22de <_sk_load_tables_u16_be_avx+0x2fa>
DB 196,129,123,16,92,72,32 ; vmovsd 0x20(%r8,%r9,2),%xmm3
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 15,132,97,253,255,255 ; je 1ed5 <_sk_load_tables_u16_be_avx+0x31>
+ DB 15,132,97,253,255,255 ; je 2015 <_sk_load_tables_u16_be_avx+0x31>
DB 196,129,97,22,92,72,40 ; vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 15,130,80,253,255,255 ; jb 1ed5 <_sk_load_tables_u16_be_avx+0x31>
+ DB 15,130,80,253,255,255 ; jb 2015 <_sk_load_tables_u16_be_avx+0x31>
DB 196,1,122,126,76,72,48 ; vmovq 0x30(%r8,%r9,2),%xmm9
- DB 233,68,253,255,255 ; jmpq 1ed5 <_sk_load_tables_u16_be_avx+0x31>
+ DB 233,68,253,255,255 ; jmpq 2015 <_sk_load_tables_u16_be_avx+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,55,253,255,255 ; jmpq 1ed5 <_sk_load_tables_u16_be_avx+0x31>
+ DB 233,55,253,255,255 ; jmpq 2015 <_sk_load_tables_u16_be_avx+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,46,253,255,255 ; jmpq 1ed5 <_sk_load_tables_u16_be_avx+0x31>
+ DB 233,46,253,255,255 ; jmpq 2015 <_sk_load_tables_u16_be_avx+0x31>
PUBLIC _sk_load_tables_rgb_u16_be_avx
_sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -6830,7 +6945,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,127 ; lea (%rdi,%rdi,2),%r9
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,93,2,0,0 ; jne 2416 <_sk_load_tables_rgb_u16_be_avx+0x26f>
+ DB 15,133,93,2,0,0 ; jne 2556 <_sk_load_tables_rgb_u16_be_avx+0x26f>
DB 196,129,122,111,4,72 ; vmovdqu (%r8,%r9,2),%xmm0
DB 196,129,122,111,84,72,12 ; vmovdqu 0xc(%r8,%r9,2),%xmm2
DB 196,129,122,111,76,72,24 ; vmovdqu 0x18(%r8,%r9,2),%xmm1
@@ -6857,7 +6972,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,202 ; vpunpcklqdq %xmm2,%xmm8,%xmm1
DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
DB 197,121,108,195 ; vpunpcklqdq %xmm3,%xmm0,%xmm8
- DB 197,121,111,13,99,63,0,0 ; vmovdqa 0x3f63(%rip),%xmm9 # 6190 <_sk_callback_avx+0x5c8>
+ DB 197,121,111,13,99,63,0,0 ; vmovdqa 0x3f63(%rip),%xmm9 # 62d0 <_sk_callback_avx+0x5c8>
DB 196,193,113,219,193 ; vpand %xmm9,%xmm1,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -6949,7 +7064,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
DB 196,195,109,24,208,1 ; vinsertf128 $0x1,%xmm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,22,58,0,0 ; vbroadcastss 0x3a16(%rip),%ymm3 # 5e20 <_sk_callback_avx+0x258>
+ DB 196,226,125,24,29,22,58,0,0 ; vbroadcastss 0x3a16(%rip),%ymm3 # 5f60 <_sk_callback_avx+0x258>
DB 91 ; pop %rbx
DB 65,92 ; pop %r12
DB 65,93 ; pop %r13
@@ -6960,36 +7075,36 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,129,121,110,4,72 ; vmovd (%r8,%r9,2),%xmm0
DB 196,129,121,196,68,72,4,2 ; vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm0
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 117,5 ; jne 242f <_sk_load_tables_rgb_u16_be_avx+0x288>
- DB 233,190,253,255,255 ; jmpq 21ed <_sk_load_tables_rgb_u16_be_avx+0x46>
+ DB 117,5 ; jne 256f <_sk_load_tables_rgb_u16_be_avx+0x288>
+ DB 233,190,253,255,255 ; jmpq 232d <_sk_load_tables_rgb_u16_be_avx+0x46>
DB 196,129,121,110,76,72,6 ; vmovd 0x6(%r8,%r9,2),%xmm1
DB 196,1,113,196,68,72,10,2 ; vpinsrw $0x2,0xa(%r8,%r9,2),%xmm1,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,26 ; jb 245e <_sk_load_tables_rgb_u16_be_avx+0x2b7>
+ DB 114,26 ; jb 259e <_sk_load_tables_rgb_u16_be_avx+0x2b7>
DB 196,129,121,110,76,72,12 ; vmovd 0xc(%r8,%r9,2),%xmm1
DB 196,129,113,196,84,72,16,2 ; vpinsrw $0x2,0x10(%r8,%r9,2),%xmm1,%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 117,10 ; jne 2463 <_sk_load_tables_rgb_u16_be_avx+0x2bc>
- DB 233,143,253,255,255 ; jmpq 21ed <_sk_load_tables_rgb_u16_be_avx+0x46>
- DB 233,138,253,255,255 ; jmpq 21ed <_sk_load_tables_rgb_u16_be_avx+0x46>
+ DB 117,10 ; jne 25a3 <_sk_load_tables_rgb_u16_be_avx+0x2bc>
+ DB 233,143,253,255,255 ; jmpq 232d <_sk_load_tables_rgb_u16_be_avx+0x46>
+ DB 233,138,253,255,255 ; jmpq 232d <_sk_load_tables_rgb_u16_be_avx+0x46>
DB 196,129,121,110,76,72,18 ; vmovd 0x12(%r8,%r9,2),%xmm1
DB 196,1,113,196,76,72,22,2 ; vpinsrw $0x2,0x16(%r8,%r9,2),%xmm1,%xmm9
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,26 ; jb 2492 <_sk_load_tables_rgb_u16_be_avx+0x2eb>
+ DB 114,26 ; jb 25d2 <_sk_load_tables_rgb_u16_be_avx+0x2eb>
DB 196,129,121,110,76,72,24 ; vmovd 0x18(%r8,%r9,2),%xmm1
DB 196,129,113,196,76,72,28,2 ; vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm1,%xmm1
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 117,10 ; jne 2497 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
- DB 233,91,253,255,255 ; jmpq 21ed <_sk_load_tables_rgb_u16_be_avx+0x46>
- DB 233,86,253,255,255 ; jmpq 21ed <_sk_load_tables_rgb_u16_be_avx+0x46>
+ DB 117,10 ; jne 25d7 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
+ DB 233,91,253,255,255 ; jmpq 232d <_sk_load_tables_rgb_u16_be_avx+0x46>
+ DB 233,86,253,255,255 ; jmpq 232d <_sk_load_tables_rgb_u16_be_avx+0x46>
DB 196,129,121,110,92,72,30 ; vmovd 0x1e(%r8,%r9,2),%xmm3
DB 196,1,97,196,92,72,34,2 ; vpinsrw $0x2,0x22(%r8,%r9,2),%xmm3,%xmm11
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,20 ; jb 24c0 <_sk_load_tables_rgb_u16_be_avx+0x319>
+ DB 114,20 ; jb 2600 <_sk_load_tables_rgb_u16_be_avx+0x319>
DB 196,129,121,110,92,72,36 ; vmovd 0x24(%r8,%r9,2),%xmm3
DB 196,129,97,196,92,72,40,2 ; vpinsrw $0x2,0x28(%r8,%r9,2),%xmm3,%xmm3
- DB 233,45,253,255,255 ; jmpq 21ed <_sk_load_tables_rgb_u16_be_avx+0x46>
- DB 233,40,253,255,255 ; jmpq 21ed <_sk_load_tables_rgb_u16_be_avx+0x46>
+ DB 233,45,253,255,255 ; jmpq 232d <_sk_load_tables_rgb_u16_be_avx+0x46>
+ DB 233,40,253,255,255 ; jmpq 232d <_sk_load_tables_rgb_u16_be_avx+0x46>
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
@@ -7000,7 +7115,7 @@ _sk_byte_tables_avx LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,74,57,0,0 ; vbroadcastss 0x394a(%rip),%ymm8 # 5e24 <_sk_callback_avx+0x25c>
+ DB 196,98,125,24,5,74,57,0,0 ; vbroadcastss 0x394a(%rip),%ymm8 # 5f64 <_sk_callback_avx+0x25c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,195,249,22,192,1 ; vpextrq $0x1,%xmm0,%r8
@@ -7037,7 +7152,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,53,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,152,56,0,0 ; vbroadcastss 0x3898(%rip),%ymm9 # 5e28 <_sk_callback_avx+0x260>
+ DB 196,98,125,24,13,152,56,0,0 ; vbroadcastss 0x3898(%rip),%ymm9 # 5f68 <_sk_callback_avx+0x260>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
@@ -7197,7 +7312,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,53,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,190,53,0,0 ; vbroadcastss 0x35be(%rip),%ymm9 # 5e2c <_sk_callback_avx+0x264>
+ DB 196,98,125,24,13,190,53,0,0 ; vbroadcastss 0x35be(%rip),%ymm9 # 5f6c <_sk_callback_avx+0x264>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
@@ -7484,36 +7599,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,28,49,0,0 ; vbroadcastss 0x311c(%rip),%ymm12 # 5e30 <_sk_callback_avx+0x268>
+ DB 196,98,125,24,37,28,49,0,0 ; vbroadcastss 0x311c(%rip),%ymm12 # 5f70 <_sk_callback_avx+0x268>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,18,49,0,0 ; vbroadcastss 0x3112(%rip),%ymm12 # 5e34 <_sk_callback_avx+0x26c>
+ DB 196,98,125,24,37,18,49,0,0 ; vbroadcastss 0x3112(%rip),%ymm12 # 5f74 <_sk_callback_avx+0x26c>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,8,49,0,0 ; vbroadcastss 0x3108(%rip),%ymm12 # 5e38 <_sk_callback_avx+0x270>
+ DB 196,98,125,24,37,8,49,0,0 ; vbroadcastss 0x3108(%rip),%ymm12 # 5f78 <_sk_callback_avx+0x270>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,254,48,0,0 ; vbroadcastss 0x30fe(%rip),%ymm12 # 5e3c <_sk_callback_avx+0x274>
+ DB 196,98,125,24,37,254,48,0,0 ; vbroadcastss 0x30fe(%rip),%ymm12 # 5f7c <_sk_callback_avx+0x274>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,244,48,0,0 ; vbroadcastss 0x30f4(%rip),%ymm12 # 5e40 <_sk_callback_avx+0x278>
+ DB 196,98,125,24,37,244,48,0,0 ; vbroadcastss 0x30f4(%rip),%ymm12 # 5f80 <_sk_callback_avx+0x278>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,229,48,0,0 ; vbroadcastss 0x30e5(%rip),%ymm12 # 5e44 <_sk_callback_avx+0x27c>
+ DB 196,98,125,24,37,229,48,0,0 ; vbroadcastss 0x30e5(%rip),%ymm12 # 5f84 <_sk_callback_avx+0x27c>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,219,48,0,0 ; vbroadcastss 0x30db(%rip),%ymm12 # 5e48 <_sk_callback_avx+0x280>
+ DB 196,98,125,24,37,219,48,0,0 ; vbroadcastss 0x30db(%rip),%ymm12 # 5f88 <_sk_callback_avx+0x280>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,191,48,0,0 ; vbroadcastss 0x30bf(%rip),%ymm11 # 5e4c <_sk_callback_avx+0x284>
+ DB 196,98,125,24,29,191,48,0,0 ; vbroadcastss 0x30bf(%rip),%ymm11 # 5f8c <_sk_callback_avx+0x284>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,181,48,0,0 ; vbroadcastss 0x30b5(%rip),%ymm11 # 5e50 <_sk_callback_avx+0x288>
+ DB 196,98,125,24,29,181,48,0,0 ; vbroadcastss 0x30b5(%rip),%ymm11 # 5f90 <_sk_callback_avx+0x288>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,166,48,0,0 ; vbroadcastss 0x30a6(%rip),%ymm11 # 5e54 <_sk_callback_avx+0x28c>
+ DB 196,98,125,24,29,166,48,0,0 ; vbroadcastss 0x30a6(%rip),%ymm11 # 5f94 <_sk_callback_avx+0x28c>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,156,48,0,0 ; vbroadcastss 0x309c(%rip),%ymm11 # 5e58 <_sk_callback_avx+0x290>
+ DB 196,98,125,24,29,156,48,0,0 ; vbroadcastss 0x309c(%rip),%ymm11 # 5f98 <_sk_callback_avx+0x290>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,141,48,0,0 ; vbroadcastss 0x308d(%rip),%ymm10 # 5e5c <_sk_callback_avx+0x294>
+ DB 196,98,125,24,21,141,48,0,0 ; vbroadcastss 0x308d(%rip),%ymm10 # 5f9c <_sk_callback_avx+0x294>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -7521,7 +7636,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,100,48,0,0 ; vbroadcastss 0x3064(%rip),%ymm8 # 5e60 <_sk_callback_avx+0x298>
+ DB 196,98,125,24,5,100,48,0,0 ; vbroadcastss 0x3064(%rip),%ymm8 # 5fa0 <_sk_callback_avx+0x298>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -7541,36 +7656,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,21,48,0,0 ; vbroadcastss 0x3015(%rip),%ymm12 # 5e64 <_sk_callback_avx+0x29c>
+ DB 196,98,125,24,37,21,48,0,0 ; vbroadcastss 0x3015(%rip),%ymm12 # 5fa4 <_sk_callback_avx+0x29c>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,11,48,0,0 ; vbroadcastss 0x300b(%rip),%ymm12 # 5e68 <_sk_callback_avx+0x2a0>
+ DB 196,98,125,24,37,11,48,0,0 ; vbroadcastss 0x300b(%rip),%ymm12 # 5fa8 <_sk_callback_avx+0x2a0>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,1,48,0,0 ; vbroadcastss 0x3001(%rip),%ymm12 # 5e6c <_sk_callback_avx+0x2a4>
+ DB 196,98,125,24,37,1,48,0,0 ; vbroadcastss 0x3001(%rip),%ymm12 # 5fac <_sk_callback_avx+0x2a4>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,247,47,0,0 ; vbroadcastss 0x2ff7(%rip),%ymm12 # 5e70 <_sk_callback_avx+0x2a8>
+ DB 196,98,125,24,37,247,47,0,0 ; vbroadcastss 0x2ff7(%rip),%ymm12 # 5fb0 <_sk_callback_avx+0x2a8>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,237,47,0,0 ; vbroadcastss 0x2fed(%rip),%ymm12 # 5e74 <_sk_callback_avx+0x2ac>
+ DB 196,98,125,24,37,237,47,0,0 ; vbroadcastss 0x2fed(%rip),%ymm12 # 5fb4 <_sk_callback_avx+0x2ac>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,222,47,0,0 ; vbroadcastss 0x2fde(%rip),%ymm12 # 5e78 <_sk_callback_avx+0x2b0>
+ DB 196,98,125,24,37,222,47,0,0 ; vbroadcastss 0x2fde(%rip),%ymm12 # 5fb8 <_sk_callback_avx+0x2b0>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,212,47,0,0 ; vbroadcastss 0x2fd4(%rip),%ymm12 # 5e7c <_sk_callback_avx+0x2b4>
+ DB 196,98,125,24,37,212,47,0,0 ; vbroadcastss 0x2fd4(%rip),%ymm12 # 5fbc <_sk_callback_avx+0x2b4>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,184,47,0,0 ; vbroadcastss 0x2fb8(%rip),%ymm11 # 5e80 <_sk_callback_avx+0x2b8>
+ DB 196,98,125,24,29,184,47,0,0 ; vbroadcastss 0x2fb8(%rip),%ymm11 # 5fc0 <_sk_callback_avx+0x2b8>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,174,47,0,0 ; vbroadcastss 0x2fae(%rip),%ymm11 # 5e84 <_sk_callback_avx+0x2bc>
+ DB 196,98,125,24,29,174,47,0,0 ; vbroadcastss 0x2fae(%rip),%ymm11 # 5fc4 <_sk_callback_avx+0x2bc>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,159,47,0,0 ; vbroadcastss 0x2f9f(%rip),%ymm11 # 5e88 <_sk_callback_avx+0x2c0>
+ DB 196,98,125,24,29,159,47,0,0 ; vbroadcastss 0x2f9f(%rip),%ymm11 # 5fc8 <_sk_callback_avx+0x2c0>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,149,47,0,0 ; vbroadcastss 0x2f95(%rip),%ymm11 # 5e8c <_sk_callback_avx+0x2c4>
+ DB 196,98,125,24,29,149,47,0,0 ; vbroadcastss 0x2f95(%rip),%ymm11 # 5fcc <_sk_callback_avx+0x2c4>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,134,47,0,0 ; vbroadcastss 0x2f86(%rip),%ymm10 # 5e90 <_sk_callback_avx+0x2c8>
+ DB 196,98,125,24,21,134,47,0,0 ; vbroadcastss 0x2f86(%rip),%ymm10 # 5fd0 <_sk_callback_avx+0x2c8>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -7578,7 +7693,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,93,47,0,0 ; vbroadcastss 0x2f5d(%rip),%ymm8 # 5e94 <_sk_callback_avx+0x2cc>
+ DB 196,98,125,24,5,93,47,0,0 ; vbroadcastss 0x2f5d(%rip),%ymm8 # 5fd4 <_sk_callback_avx+0x2cc>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -7598,36 +7713,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,14,47,0,0 ; vbroadcastss 0x2f0e(%rip),%ymm12 # 5e98 <_sk_callback_avx+0x2d0>
+ DB 196,98,125,24,37,14,47,0,0 ; vbroadcastss 0x2f0e(%rip),%ymm12 # 5fd8 <_sk_callback_avx+0x2d0>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,4,47,0,0 ; vbroadcastss 0x2f04(%rip),%ymm12 # 5e9c <_sk_callback_avx+0x2d4>
+ DB 196,98,125,24,37,4,47,0,0 ; vbroadcastss 0x2f04(%rip),%ymm12 # 5fdc <_sk_callback_avx+0x2d4>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,250,46,0,0 ; vbroadcastss 0x2efa(%rip),%ymm12 # 5ea0 <_sk_callback_avx+0x2d8>
+ DB 196,98,125,24,37,250,46,0,0 ; vbroadcastss 0x2efa(%rip),%ymm12 # 5fe0 <_sk_callback_avx+0x2d8>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,240,46,0,0 ; vbroadcastss 0x2ef0(%rip),%ymm12 # 5ea4 <_sk_callback_avx+0x2dc>
+ DB 196,98,125,24,37,240,46,0,0 ; vbroadcastss 0x2ef0(%rip),%ymm12 # 5fe4 <_sk_callback_avx+0x2dc>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,230,46,0,0 ; vbroadcastss 0x2ee6(%rip),%ymm12 # 5ea8 <_sk_callback_avx+0x2e0>
+ DB 196,98,125,24,37,230,46,0,0 ; vbroadcastss 0x2ee6(%rip),%ymm12 # 5fe8 <_sk_callback_avx+0x2e0>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,215,46,0,0 ; vbroadcastss 0x2ed7(%rip),%ymm12 # 5eac <_sk_callback_avx+0x2e4>
+ DB 196,98,125,24,37,215,46,0,0 ; vbroadcastss 0x2ed7(%rip),%ymm12 # 5fec <_sk_callback_avx+0x2e4>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,205,46,0,0 ; vbroadcastss 0x2ecd(%rip),%ymm12 # 5eb0 <_sk_callback_avx+0x2e8>
+ DB 196,98,125,24,37,205,46,0,0 ; vbroadcastss 0x2ecd(%rip),%ymm12 # 5ff0 <_sk_callback_avx+0x2e8>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,177,46,0,0 ; vbroadcastss 0x2eb1(%rip),%ymm11 # 5eb4 <_sk_callback_avx+0x2ec>
+ DB 196,98,125,24,29,177,46,0,0 ; vbroadcastss 0x2eb1(%rip),%ymm11 # 5ff4 <_sk_callback_avx+0x2ec>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,167,46,0,0 ; vbroadcastss 0x2ea7(%rip),%ymm11 # 5eb8 <_sk_callback_avx+0x2f0>
+ DB 196,98,125,24,29,167,46,0,0 ; vbroadcastss 0x2ea7(%rip),%ymm11 # 5ff8 <_sk_callback_avx+0x2f0>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,152,46,0,0 ; vbroadcastss 0x2e98(%rip),%ymm11 # 5ebc <_sk_callback_avx+0x2f4>
+ DB 196,98,125,24,29,152,46,0,0 ; vbroadcastss 0x2e98(%rip),%ymm11 # 5ffc <_sk_callback_avx+0x2f4>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,142,46,0,0 ; vbroadcastss 0x2e8e(%rip),%ymm11 # 5ec0 <_sk_callback_avx+0x2f8>
+ DB 196,98,125,24,29,142,46,0,0 ; vbroadcastss 0x2e8e(%rip),%ymm11 # 6000 <_sk_callback_avx+0x2f8>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,127,46,0,0 ; vbroadcastss 0x2e7f(%rip),%ymm10 # 5ec4 <_sk_callback_avx+0x2fc>
+ DB 196,98,125,24,21,127,46,0,0 ; vbroadcastss 0x2e7f(%rip),%ymm10 # 6004 <_sk_callback_avx+0x2fc>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -7635,7 +7750,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,86,46,0,0 ; vbroadcastss 0x2e56(%rip),%ymm8 # 5ec8 <_sk_callback_avx+0x300>
+ DB 196,98,125,24,5,86,46,0,0 ; vbroadcastss 0x2e56(%rip),%ymm8 # 6008 <_sk_callback_avx+0x300>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -7655,36 +7770,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,7,46,0,0 ; vbroadcastss 0x2e07(%rip),%ymm12 # 5ecc <_sk_callback_avx+0x304>
+ DB 196,98,125,24,37,7,46,0,0 ; vbroadcastss 0x2e07(%rip),%ymm12 # 600c <_sk_callback_avx+0x304>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,253,45,0,0 ; vbroadcastss 0x2dfd(%rip),%ymm12 # 5ed0 <_sk_callback_avx+0x308>
+ DB 196,98,125,24,37,253,45,0,0 ; vbroadcastss 0x2dfd(%rip),%ymm12 # 6010 <_sk_callback_avx+0x308>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,243,45,0,0 ; vbroadcastss 0x2df3(%rip),%ymm12 # 5ed4 <_sk_callback_avx+0x30c>
+ DB 196,98,125,24,37,243,45,0,0 ; vbroadcastss 0x2df3(%rip),%ymm12 # 6014 <_sk_callback_avx+0x30c>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,233,45,0,0 ; vbroadcastss 0x2de9(%rip),%ymm12 # 5ed8 <_sk_callback_avx+0x310>
+ DB 196,98,125,24,37,233,45,0,0 ; vbroadcastss 0x2de9(%rip),%ymm12 # 6018 <_sk_callback_avx+0x310>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,223,45,0,0 ; vbroadcastss 0x2ddf(%rip),%ymm12 # 5edc <_sk_callback_avx+0x314>
+ DB 196,98,125,24,37,223,45,0,0 ; vbroadcastss 0x2ddf(%rip),%ymm12 # 601c <_sk_callback_avx+0x314>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,208,45,0,0 ; vbroadcastss 0x2dd0(%rip),%ymm12 # 5ee0 <_sk_callback_avx+0x318>
+ DB 196,98,125,24,37,208,45,0,0 ; vbroadcastss 0x2dd0(%rip),%ymm12 # 6020 <_sk_callback_avx+0x318>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,198,45,0,0 ; vbroadcastss 0x2dc6(%rip),%ymm12 # 5ee4 <_sk_callback_avx+0x31c>
+ DB 196,98,125,24,37,198,45,0,0 ; vbroadcastss 0x2dc6(%rip),%ymm12 # 6024 <_sk_callback_avx+0x31c>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,170,45,0,0 ; vbroadcastss 0x2daa(%rip),%ymm11 # 5ee8 <_sk_callback_avx+0x320>
+ DB 196,98,125,24,29,170,45,0,0 ; vbroadcastss 0x2daa(%rip),%ymm11 # 6028 <_sk_callback_avx+0x320>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,160,45,0,0 ; vbroadcastss 0x2da0(%rip),%ymm11 # 5eec <_sk_callback_avx+0x324>
+ DB 196,98,125,24,29,160,45,0,0 ; vbroadcastss 0x2da0(%rip),%ymm11 # 602c <_sk_callback_avx+0x324>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,145,45,0,0 ; vbroadcastss 0x2d91(%rip),%ymm11 # 5ef0 <_sk_callback_avx+0x328>
+ DB 196,98,125,24,29,145,45,0,0 ; vbroadcastss 0x2d91(%rip),%ymm11 # 6030 <_sk_callback_avx+0x328>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,135,45,0,0 ; vbroadcastss 0x2d87(%rip),%ymm11 # 5ef4 <_sk_callback_avx+0x32c>
+ DB 196,98,125,24,29,135,45,0,0 ; vbroadcastss 0x2d87(%rip),%ymm11 # 6034 <_sk_callback_avx+0x32c>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,120,45,0,0 ; vbroadcastss 0x2d78(%rip),%ymm10 # 5ef8 <_sk_callback_avx+0x330>
+ DB 196,98,125,24,21,120,45,0,0 ; vbroadcastss 0x2d78(%rip),%ymm10 # 6038 <_sk_callback_avx+0x330>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -7692,38 +7807,38 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,79,45,0,0 ; vbroadcastss 0x2d4f(%rip),%ymm8 # 5efc <_sk_callback_avx+0x334>
+ DB 196,98,125,24,5,79,45,0,0 ; vbroadcastss 0x2d4f(%rip),%ymm8 # 603c <_sk_callback_avx+0x334>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,65,45,0,0 ; vbroadcastss 0x2d41(%rip),%ymm8 # 5f00 <_sk_callback_avx+0x338>
+ DB 196,98,125,24,5,65,45,0,0 ; vbroadcastss 0x2d41(%rip),%ymm8 # 6040 <_sk_callback_avx+0x338>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,55,45,0,0 ; vbroadcastss 0x2d37(%rip),%ymm8 # 5f04 <_sk_callback_avx+0x33c>
+ DB 196,98,125,24,5,55,45,0,0 ; vbroadcastss 0x2d37(%rip),%ymm8 # 6044 <_sk_callback_avx+0x33c>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,45,45,0,0 ; vbroadcastss 0x2d2d(%rip),%ymm9 # 5f08 <_sk_callback_avx+0x340>
+ DB 196,98,125,24,13,45,45,0,0 ; vbroadcastss 0x2d2d(%rip),%ymm9 # 6048 <_sk_callback_avx+0x340>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,25,45,0,0 ; vbroadcastss 0x2d19(%rip),%ymm8 # 5f0c <_sk_callback_avx+0x344>
+ DB 196,98,125,24,5,25,45,0,0 ; vbroadcastss 0x2d19(%rip),%ymm8 # 604c <_sk_callback_avx+0x344>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,15,45,0,0 ; vbroadcastss 0x2d0f(%rip),%ymm8 # 5f10 <_sk_callback_avx+0x348>
+ DB 196,98,125,24,5,15,45,0,0 ; vbroadcastss 0x2d0f(%rip),%ymm8 # 6050 <_sk_callback_avx+0x348>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,5,45,0,0 ; vbroadcastss 0x2d05(%rip),%ymm8 # 5f14 <_sk_callback_avx+0x34c>
+ DB 196,98,125,24,5,5,45,0,0 ; vbroadcastss 0x2d05(%rip),%ymm8 # 6054 <_sk_callback_avx+0x34c>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,247,44,0,0 ; vbroadcastss 0x2cf7(%rip),%ymm8 # 5f18 <_sk_callback_avx+0x350>
+ DB 196,98,125,24,5,247,44,0,0 ; vbroadcastss 0x2cf7(%rip),%ymm8 # 6058 <_sk_callback_avx+0x350>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,224,44,0,0 ; vbroadcastss 0x2ce0(%rip),%ymm9 # 5f1c <_sk_callback_avx+0x354>
+ DB 196,98,125,24,13,224,44,0,0 ; vbroadcastss 0x2ce0(%rip),%ymm9 # 605c <_sk_callback_avx+0x354>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,213,44,0,0 ; vbroadcastss 0x2cd5(%rip),%ymm11 # 5f20 <_sk_callback_avx+0x358>
+ DB 196,98,125,24,29,213,44,0,0 ; vbroadcastss 0x2cd5(%rip),%ymm11 # 6060 <_sk_callback_avx+0x358>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,203,44,0,0 ; vbroadcastss 0x2ccb(%rip),%ymm12 # 5f24 <_sk_callback_avx+0x35c>
+ DB 196,98,125,24,37,203,44,0,0 ; vbroadcastss 0x2ccb(%rip),%ymm12 # 6064 <_sk_callback_avx+0x35c>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -7738,9 +7853,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,129,44,0,0 ; vbroadcastss 0x2c81(%rip),%ymm0 # 5f28 <_sk_callback_avx+0x360>
+ DB 196,226,125,24,5,129,44,0,0 ; vbroadcastss 0x2c81(%rip),%ymm0 # 6068 <_sk_callback_avx+0x360>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,120,44,0,0 ; vbroadcastss 0x2c78(%rip),%ymm8 # 5f2c <_sk_callback_avx+0x364>
+ DB 196,98,125,24,5,120,44,0,0 ; vbroadcastss 0x2c78(%rip),%ymm8 # 606c <_sk_callback_avx+0x364>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -7752,14 +7867,14 @@ _sk_load_a8_avx LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,62 ; jne 330b <_sk_load_a8_avx+0x4e>
+ DB 117,62 ; jne 344b <_sk_load_a8_avx+0x4e>
DB 197,250,126,0 ; vmovq (%rax),%xmm0
DB 196,226,121,49,200 ; vpmovzxbd %xmm0,%xmm1
DB 196,227,121,4,192,229 ; vpermilps $0xe5,%xmm0,%xmm0
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,60,44,0,0 ; vbroadcastss 0x2c3c(%rip),%ymm1 # 5f30 <_sk_callback_avx+0x368>
+ DB 196,226,125,24,13,60,44,0,0 ; vbroadcastss 0x2c3c(%rip),%ymm1 # 6070 <_sk_callback_avx+0x368>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -7776,9 +7891,9 @@ _sk_load_a8_avx LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 3313 <_sk_load_a8_avx+0x56>
+ DB 117,234 ; jne 3453 <_sk_load_a8_avx+0x56>
DB 196,193,249,110,193 ; vmovq %r9,%xmm0
- DB 235,161 ; jmp 32d1 <_sk_load_a8_avx+0x14>
+ DB 235,161 ; jmp 3411 <_sk_load_a8_avx+0x14>
PUBLIC _sk_gather_a8_avx
_sk_gather_a8_avx LABEL PROC
@@ -7826,7 +7941,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,201 ; vpmovzxbd %xmm1,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,49,43,0,0 ; vbroadcastss 0x2b31(%rip),%ymm1 # 5f34 <_sk_callback_avx+0x36c>
+ DB 196,226,125,24,13,49,43,0,0 ; vbroadcastss 0x2b31(%rip),%ymm1 # 6074 <_sk_callback_avx+0x36c>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -7842,14 +7957,14 @@ PUBLIC _sk_store_a8_avx
_sk_store_a8_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 196,98,125,24,5,12,43,0,0 ; vbroadcastss 0x2b0c(%rip),%ymm8 # 5f38 <_sk_callback_avx+0x370>
+ DB 196,98,125,24,5,12,43,0,0 ; vbroadcastss 0x2b0c(%rip),%ymm8 # 6078 <_sk_callback_avx+0x370>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,10 ; jne 3455 <_sk_store_a8_avx+0x37>
+ DB 117,10 ; jne 3595 <_sk_store_a8_avx+0x37>
DB 196,65,123,17,4,58 ; vmovsd %xmm8,(%r10,%rdi,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -7857,10 +7972,10 @@ _sk_store_a8_avx LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,236 ; ja 3451 <_sk_store_a8_avx+0x33>
+ DB 119,236 ; ja 3591 <_sk_store_a8_avx+0x33>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,67,0,0,0 ; lea 0x43(%rip),%r9 # 34b8 <_sk_store_a8_avx+0x9a>
+ DB 76,141,13,67,0,0,0 ; lea 0x43(%rip),%r9 # 35f8 <_sk_store_a8_avx+0x9a>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -7871,7 +7986,7 @@ _sk_store_a8_avx LABEL PROC
DB 196,67,121,20,68,58,2,4 ; vpextrb $0x4,%xmm8,0x2(%r10,%rdi,1)
DB 196,67,121,20,68,58,1,2 ; vpextrb $0x2,%xmm8,0x1(%r10,%rdi,1)
DB 196,67,121,20,4,58,0 ; vpextrb $0x0,%xmm8,(%r10,%rdi,1)
- DB 235,154 ; jmp 3451 <_sk_store_a8_avx+0x33>
+ DB 235,154 ; jmp 3591 <_sk_store_a8_avx+0x33>
DB 144 ; nop
DB 246,255 ; idiv %bh
DB 255 ; (bad)
@@ -7903,17 +8018,17 @@ _sk_load_g8_avx LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 72,1,248 ; add %rdi,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne 3527 <_sk_load_g8_avx+0x53>
+ DB 117,67 ; jne 3667 <_sk_load_g8_avx+0x53>
DB 197,250,126,0 ; vmovq (%rax),%xmm0
DB 196,226,121,49,200 ; vpmovzxbd %xmm0,%xmm1
DB 196,227,121,4,192,229 ; vpermilps $0xe5,%xmm0,%xmm0
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,49,42,0,0 ; vbroadcastss 0x2a31(%rip),%ymm1 # 5f3c <_sk_callback_avx+0x374>
+ DB 196,226,125,24,13,49,42,0,0 ; vbroadcastss 0x2a31(%rip),%ymm1 # 607c <_sk_callback_avx+0x374>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,38,42,0,0 ; vbroadcastss 0x2a26(%rip),%ymm3 # 5f40 <_sk_callback_avx+0x378>
+ DB 196,226,125,24,29,38,42,0,0 ; vbroadcastss 0x2a26(%rip),%ymm3 # 6080 <_sk_callback_avx+0x378>
DB 76,137,193 ; mov %r8,%rcx
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
@@ -7927,9 +8042,9 @@ _sk_load_g8_avx LABEL PROC
DB 77,9,217 ; or %r11,%r9
DB 72,131,193,8 ; add $0x8,%rcx
DB 73,255,202 ; dec %r10
- DB 117,234 ; jne 352f <_sk_load_g8_avx+0x5b>
+ DB 117,234 ; jne 366f <_sk_load_g8_avx+0x5b>
DB 196,193,249,110,193 ; vmovq %r9,%xmm0
- DB 235,156 ; jmp 34e8 <_sk_load_g8_avx+0x14>
+ DB 235,156 ; jmp 3628 <_sk_load_g8_avx+0x14>
PUBLIC _sk_gather_g8_avx
_sk_gather_g8_avx LABEL PROC
@@ -7977,10 +8092,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,201 ; vpmovzxbd %xmm1,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,37,41,0,0 ; vbroadcastss 0x2925(%rip),%ymm1 # 5f44 <_sk_callback_avx+0x37c>
+ DB 196,226,125,24,13,37,41,0,0 ; vbroadcastss 0x2925(%rip),%ymm1 # 6084 <_sk_callback_avx+0x37c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,26,41,0,0 ; vbroadcastss 0x291a(%rip),%ymm3 # 5f48 <_sk_callback_avx+0x380>
+ DB 196,226,125,24,29,26,41,0,0 ; vbroadcastss 0x291a(%rip),%ymm3 # 6088 <_sk_callback_avx+0x380>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -7994,9 +8109,9 @@ _sk_gather_i8_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,192 ; mov %rax,%r8
DB 77,133,192 ; test %r8,%r8
- DB 116,5 ; je 364e <_sk_gather_i8_avx+0xf>
+ DB 116,5 ; je 378e <_sk_gather_i8_avx+0xf>
DB 76,137,192 ; mov %r8,%rax
- DB 235,2 ; jmp 3650 <_sk_gather_i8_avx+0x11>
+ DB 235,2 ; jmp 3790 <_sk_gather_i8_avx+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,87 ; push %r15
DB 65,86 ; push %r14
@@ -8058,10 +8173,10 @@ _sk_gather_i8_avx LABEL PROC
DB 196,163,121,34,4,163,2 ; vpinsrd $0x2,(%rbx,%r12,4),%xmm0,%xmm0
DB 196,163,121,34,28,19,3 ; vpinsrd $0x3,(%rbx,%r10,1),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,166,41,0,0 ; vmovaps 0x29a6(%rip),%ymm10 # 6120 <_sk_callback_avx+0x558>
+ DB 197,124,40,21,166,41,0,0 ; vmovaps 0x29a6(%rip),%ymm10 # 6260 <_sk_callback_avx+0x558>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,192,39,0,0 ; vbroadcastss 0x27c0(%rip),%ymm9 # 5f4c <_sk_callback_avx+0x384>
+ DB 196,98,125,24,13,192,39,0,0 ; vbroadcastss 0x27c0(%rip),%ymm9 # 608c <_sk_callback_avx+0x384>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -8093,38 +8208,38 @@ _sk_load_565_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,128,0,0,0 ; jne 3884 <_sk_load_565_avx+0x8e>
+ DB 15,133,128,0,0,0 ; jne 39c4 <_sk_load_565_avx+0x8e>
DB 196,193,122,111,4,122 ; vmovdqu (%r10,%rdi,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,42,39,0,0 ; vbroadcastss 0x272a(%rip),%ymm0 # 5f50 <_sk_callback_avx+0x388>
+ DB 196,226,125,24,5,42,39,0,0 ; vbroadcastss 0x272a(%rip),%ymm0 # 6090 <_sk_callback_avx+0x388>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,29,39,0,0 ; vbroadcastss 0x271d(%rip),%ymm1 # 5f54 <_sk_callback_avx+0x38c>
+ DB 196,226,125,24,13,29,39,0,0 ; vbroadcastss 0x271d(%rip),%ymm1 # 6094 <_sk_callback_avx+0x38c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,20,39,0,0 ; vbroadcastss 0x2714(%rip),%ymm1 # 5f58 <_sk_callback_avx+0x390>
+ DB 196,226,125,24,13,20,39,0,0 ; vbroadcastss 0x2714(%rip),%ymm1 # 6098 <_sk_callback_avx+0x390>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,7,39,0,0 ; vbroadcastss 0x2707(%rip),%ymm3 # 5f5c <_sk_callback_avx+0x394>
+ DB 196,226,125,24,29,7,39,0,0 ; vbroadcastss 0x2707(%rip),%ymm3 # 609c <_sk_callback_avx+0x394>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,254,38,0,0 ; vbroadcastss 0x26fe(%rip),%ymm3 # 5f60 <_sk_callback_avx+0x398>
+ DB 196,226,125,24,29,254,38,0,0 ; vbroadcastss 0x26fe(%rip),%ymm3 # 60a0 <_sk_callback_avx+0x398>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,241,38,0,0 ; vbroadcastss 0x26f1(%rip),%ymm3 # 5f64 <_sk_callback_avx+0x39c>
+ DB 196,226,125,24,29,241,38,0,0 ; vbroadcastss 0x26f1(%rip),%ymm3 # 60a4 <_sk_callback_avx+0x39c>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,230,38,0,0 ; vbroadcastss 0x26e6(%rip),%ymm3 # 5f68 <_sk_callback_avx+0x3a0>
+ DB 196,226,125,24,29,230,38,0,0 ; vbroadcastss 0x26e6(%rip),%ymm3 # 60a8 <_sk_callback_avx+0x3a0>
DB 255,224 ; jmpq *%rax
DB 65,137,200 ; mov %ecx,%r8d
DB 65,128,224,7 ; and $0x7,%r8b
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 15,135,110,255,255,255 ; ja 380a <_sk_load_565_avx+0x14>
+ DB 15,135,110,255,255,255 ; ja 394a <_sk_load_565_avx+0x14>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,73,0,0,0 ; lea 0x49(%rip),%r9 # 38f0 <_sk_load_565_avx+0xfa>
+ DB 76,141,13,73,0,0,0 ; lea 0x49(%rip),%r9 # 3a30 <_sk_load_565_avx+0xfa>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -8136,7 +8251,7 @@ _sk_load_565_avx LABEL PROC
DB 196,193,121,196,68,122,4,2 ; vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,68,122,2,1 ; vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,4,122,0 ; vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- DB 233,26,255,255,255 ; jmpq 380a <_sk_load_565_avx+0x14>
+ DB 233,26,255,255,255 ; jmpq 394a <_sk_load_565_avx+0x14>
DB 244 ; hlt
DB 255 ; (bad)
DB 255 ; (bad)
@@ -8212,23 +8327,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,134,37,0,0 ; vbroadcastss 0x2586(%rip),%ymm0 # 5f6c <_sk_callback_avx+0x3a4>
+ DB 196,226,125,24,5,134,37,0,0 ; vbroadcastss 0x2586(%rip),%ymm0 # 60ac <_sk_callback_avx+0x3a4>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,121,37,0,0 ; vbroadcastss 0x2579(%rip),%ymm1 # 5f70 <_sk_callback_avx+0x3a8>
+ DB 196,226,125,24,13,121,37,0,0 ; vbroadcastss 0x2579(%rip),%ymm1 # 60b0 <_sk_callback_avx+0x3a8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,112,37,0,0 ; vbroadcastss 0x2570(%rip),%ymm1 # 5f74 <_sk_callback_avx+0x3ac>
+ DB 196,226,125,24,13,112,37,0,0 ; vbroadcastss 0x2570(%rip),%ymm1 # 60b4 <_sk_callback_avx+0x3ac>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,99,37,0,0 ; vbroadcastss 0x2563(%rip),%ymm3 # 5f78 <_sk_callback_avx+0x3b0>
+ DB 196,226,125,24,29,99,37,0,0 ; vbroadcastss 0x2563(%rip),%ymm3 # 60b8 <_sk_callback_avx+0x3b0>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,90,37,0,0 ; vbroadcastss 0x255a(%rip),%ymm3 # 5f7c <_sk_callback_avx+0x3b4>
+ DB 196,226,125,24,29,90,37,0,0 ; vbroadcastss 0x255a(%rip),%ymm3 # 60bc <_sk_callback_avx+0x3b4>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,77,37,0,0 ; vbroadcastss 0x254d(%rip),%ymm3 # 5f80 <_sk_callback_avx+0x3b8>
+ DB 196,226,125,24,29,77,37,0,0 ; vbroadcastss 0x254d(%rip),%ymm3 # 60c0 <_sk_callback_avx+0x3b8>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,66,37,0,0 ; vbroadcastss 0x2542(%rip),%ymm3 # 5f84 <_sk_callback_avx+0x3bc>
+ DB 196,226,125,24,29,66,37,0,0 ; vbroadcastss 0x2542(%rip),%ymm3 # 60c4 <_sk_callback_avx+0x3bc>
DB 91 ; pop %rbx
DB 65,92 ; pop %r12
DB 65,94 ; pop %r14
@@ -8240,14 +8355,14 @@ PUBLIC _sk_store_565_avx
_sk_store_565_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 196,98,125,24,5,46,37,0,0 ; vbroadcastss 0x252e(%rip),%ymm8 # 5f88 <_sk_callback_avx+0x3c0>
+ DB 196,98,125,24,5,46,37,0,0 ; vbroadcastss 0x252e(%rip),%ymm8 # 60c8 <_sk_callback_avx+0x3c0>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,7,37,0,0 ; vbroadcastss 0x2507(%rip),%ymm10 # 5f8c <_sk_callback_avx+0x3c4>
+ DB 196,98,125,24,21,7,37,0,0 ; vbroadcastss 0x2507(%rip),%ymm10 # 60cc <_sk_callback_avx+0x3c4>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -8261,7 +8376,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,10 ; jne 3ad5 <_sk_store_565_avx+0x89>
+ DB 117,10 ; jne 3c15 <_sk_store_565_avx+0x89>
DB 196,65,122,127,4,122 ; vmovdqu %xmm8,(%r10,%rdi,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8269,9 +8384,9 @@ _sk_store_565_avx LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,236 ; ja 3ad1 <_sk_store_565_avx+0x85>
+ DB 119,236 ; ja 3c11 <_sk_store_565_avx+0x85>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,68,0,0,0 ; lea 0x44(%rip),%r9 # 3b34 <_sk_store_565_avx+0xe8>
+ DB 76,141,13,68,0,0,0 ; lea 0x44(%rip),%r9 # 3c74 <_sk_store_565_avx+0xe8>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -8282,7 +8397,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,121,21,68,122,4,2 ; vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
DB 196,67,121,21,68,122,2,1 ; vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
DB 196,67,121,21,4,122,0 ; vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- DB 235,159 ; jmp 3ad1 <_sk_store_565_avx+0x85>
+ DB 235,159 ; jmp 3c11 <_sk_store_565_avx+0x85>
DB 102,144 ; xchg %ax,%ax
DB 245 ; cmc
DB 255 ; (bad)
@@ -8313,31 +8428,31 @@ _sk_load_4444_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,152,0,0,0 ; jne 3bf6 <_sk_load_4444_avx+0xa6>
+ DB 15,133,152,0,0,0 ; jne 3d36 <_sk_load_4444_avx+0xa6>
DB 196,193,122,111,4,122 ; vmovdqu (%r10,%rdi,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,16,36,0,0 ; vbroadcastss 0x2410(%rip),%ymm0 # 5f90 <_sk_callback_avx+0x3c8>
+ DB 196,226,125,24,5,16,36,0,0 ; vbroadcastss 0x2410(%rip),%ymm0 # 60d0 <_sk_callback_avx+0x3c8>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,3,36,0,0 ; vbroadcastss 0x2403(%rip),%ymm1 # 5f94 <_sk_callback_avx+0x3cc>
+ DB 196,226,125,24,13,3,36,0,0 ; vbroadcastss 0x2403(%rip),%ymm1 # 60d4 <_sk_callback_avx+0x3cc>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,250,35,0,0 ; vbroadcastss 0x23fa(%rip),%ymm1 # 5f98 <_sk_callback_avx+0x3d0>
+ DB 196,226,125,24,13,250,35,0,0 ; vbroadcastss 0x23fa(%rip),%ymm1 # 60d8 <_sk_callback_avx+0x3d0>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,237,35,0,0 ; vbroadcastss 0x23ed(%rip),%ymm2 # 5f9c <_sk_callback_avx+0x3d4>
+ DB 196,226,125,24,21,237,35,0,0 ; vbroadcastss 0x23ed(%rip),%ymm2 # 60dc <_sk_callback_avx+0x3d4>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,228,35,0,0 ; vbroadcastss 0x23e4(%rip),%ymm2 # 5fa0 <_sk_callback_avx+0x3d8>
+ DB 196,226,125,24,21,228,35,0,0 ; vbroadcastss 0x23e4(%rip),%ymm2 # 60e0 <_sk_callback_avx+0x3d8>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,215,35,0,0 ; vbroadcastss 0x23d7(%rip),%ymm8 # 5fa4 <_sk_callback_avx+0x3dc>
+ DB 196,98,125,24,5,215,35,0,0 ; vbroadcastss 0x23d7(%rip),%ymm8 # 60e4 <_sk_callback_avx+0x3dc>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,205,35,0,0 ; vbroadcastss 0x23cd(%rip),%ymm8 # 5fa8 <_sk_callback_avx+0x3e0>
+ DB 196,98,125,24,5,205,35,0,0 ; vbroadcastss 0x23cd(%rip),%ymm8 # 60e8 <_sk_callback_avx+0x3e0>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,191,35,0,0 ; vbroadcastss 0x23bf(%rip),%ymm8 # 5fac <_sk_callback_avx+0x3e4>
+ DB 196,98,125,24,5,191,35,0,0 ; vbroadcastss 0x23bf(%rip),%ymm8 # 60ec <_sk_callback_avx+0x3e4>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8346,9 +8461,9 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 15,135,86,255,255,255 ; ja 3b64 <_sk_load_4444_avx+0x14>
+ DB 15,135,86,255,255,255 ; ja 3ca4 <_sk_load_4444_avx+0x14>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,75,0,0,0 ; lea 0x4b(%rip),%r9 # 3c64 <_sk_load_4444_avx+0x114>
+ DB 76,141,13,75,0,0,0 ; lea 0x4b(%rip),%r9 # 3da4 <_sk_load_4444_avx+0x114>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -8360,7 +8475,7 @@ _sk_load_4444_avx LABEL PROC
DB 196,193,121,196,68,122,4,2 ; vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,68,122,2,1 ; vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0
DB 196,193,121,196,4,122,0 ; vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0
- DB 233,2,255,255,255 ; jmpq 3b64 <_sk_load_4444_avx+0x14>
+ DB 233,2,255,255,255 ; jmpq 3ca4 <_sk_load_4444_avx+0x14>
DB 102,144 ; xchg %ax,%ax
DB 242,255 ; repnz (bad)
DB 255 ; (bad)
@@ -8437,25 +8552,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,86,34,0,0 ; vbroadcastss 0x2256(%rip),%ymm0 # 5fb0 <_sk_callback_avx+0x3e8>
+ DB 196,226,125,24,5,86,34,0,0 ; vbroadcastss 0x2256(%rip),%ymm0 # 60f0 <_sk_callback_avx+0x3e8>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,73,34,0,0 ; vbroadcastss 0x2249(%rip),%ymm1 # 5fb4 <_sk_callback_avx+0x3ec>
+ DB 196,226,125,24,13,73,34,0,0 ; vbroadcastss 0x2249(%rip),%ymm1 # 60f4 <_sk_callback_avx+0x3ec>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,64,34,0,0 ; vbroadcastss 0x2240(%rip),%ymm1 # 5fb8 <_sk_callback_avx+0x3f0>
+ DB 196,226,125,24,13,64,34,0,0 ; vbroadcastss 0x2240(%rip),%ymm1 # 60f8 <_sk_callback_avx+0x3f0>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,51,34,0,0 ; vbroadcastss 0x2233(%rip),%ymm2 # 5fbc <_sk_callback_avx+0x3f4>
+ DB 196,226,125,24,21,51,34,0,0 ; vbroadcastss 0x2233(%rip),%ymm2 # 60fc <_sk_callback_avx+0x3f4>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,42,34,0,0 ; vbroadcastss 0x222a(%rip),%ymm2 # 5fc0 <_sk_callback_avx+0x3f8>
+ DB 196,226,125,24,21,42,34,0,0 ; vbroadcastss 0x222a(%rip),%ymm2 # 6100 <_sk_callback_avx+0x3f8>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,29,34,0,0 ; vbroadcastss 0x221d(%rip),%ymm8 # 5fc4 <_sk_callback_avx+0x3fc>
+ DB 196,98,125,24,5,29,34,0,0 ; vbroadcastss 0x221d(%rip),%ymm8 # 6104 <_sk_callback_avx+0x3fc>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,19,34,0,0 ; vbroadcastss 0x2213(%rip),%ymm8 # 5fc8 <_sk_callback_avx+0x400>
+ DB 196,98,125,24,5,19,34,0,0 ; vbroadcastss 0x2213(%rip),%ymm8 # 6108 <_sk_callback_avx+0x400>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,5,34,0,0 ; vbroadcastss 0x2205(%rip),%ymm8 # 5fcc <_sk_callback_avx+0x404>
+ DB 196,98,125,24,5,5,34,0,0 ; vbroadcastss 0x2205(%rip),%ymm8 # 610c <_sk_callback_avx+0x404>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -8469,7 +8584,7 @@ PUBLIC _sk_store_4444_avx
_sk_store_4444_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 196,98,125,24,5,234,33,0,0 ; vbroadcastss 0x21ea(%rip),%ymm8 # 5fd0 <_sk_callback_avx+0x408>
+ DB 196,98,125,24,5,234,33,0,0 ; vbroadcastss 0x21ea(%rip),%ymm8 # 6110 <_sk_callback_avx+0x408>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -8496,7 +8611,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,10 ; jne 3e7f <_sk_store_4444_avx+0xa7>
+ DB 117,10 ; jne 3fbf <_sk_store_4444_avx+0xa7>
DB 196,65,122,127,4,122 ; vmovdqu %xmm8,(%r10,%rdi,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8504,9 +8619,9 @@ _sk_store_4444_avx LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,236 ; ja 3e7b <_sk_store_4444_avx+0xa3>
+ DB 119,236 ; ja 3fbb <_sk_store_4444_avx+0xa3>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,66,0,0,0 ; lea 0x42(%rip),%r9 # 3edc <_sk_store_4444_avx+0x104>
+ DB 76,141,13,66,0,0,0 ; lea 0x42(%rip),%r9 # 401c <_sk_store_4444_avx+0x104>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -8517,7 +8632,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,121,21,68,122,4,2 ; vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2)
DB 196,67,121,21,68,122,2,1 ; vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2)
DB 196,67,121,21,4,122,0 ; vpextrw $0x0,%xmm8,(%r10,%rdi,2)
- DB 235,159 ; jmp 3e7b <_sk_store_4444_avx+0xa3>
+ DB 235,159 ; jmp 3fbb <_sk_store_4444_avx+0xa3>
DB 247,255 ; idiv %edi
DB 255 ; (bad)
DB 255 ; (bad)
@@ -8546,12 +8661,12 @@ _sk_load_8888_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,135,0,0,0 ; jne 3f8d <_sk_load_8888_avx+0x95>
+ DB 15,133,135,0,0,0 ; jne 40cd <_sk_load_8888_avx+0x95>
DB 196,65,124,16,12,186 ; vmovups (%r10,%rdi,4),%ymm9
- DB 197,124,40,21,44,34,0,0 ; vmovaps 0x222c(%rip),%ymm10 # 6140 <_sk_callback_avx+0x578>
+ DB 197,124,40,21,44,34,0,0 ; vmovaps 0x222c(%rip),%ymm10 # 6280 <_sk_callback_avx+0x578>
DB 196,193,52,84,194 ; vandps %ymm10,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,174,32,0,0 ; vbroadcastss 0x20ae(%rip),%ymm8 # 5fd4 <_sk_callback_avx+0x40c>
+ DB 196,98,125,24,5,174,32,0,0 ; vbroadcastss 0x20ae(%rip),%ymm8 # 6114 <_sk_callback_avx+0x40c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -8578,9 +8693,9 @@ _sk_load_8888_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 15,135,102,255,255,255 ; ja 3f0c <_sk_load_8888_avx+0x14>
+ DB 15,135,102,255,255,255 ; ja 404c <_sk_load_8888_avx+0x14>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,139,0,0,0 ; lea 0x8b(%rip),%r9 # 403c <_sk_load_8888_avx+0x144>
+ DB 76,141,13,139,0,0,0 ; lea 0x8b(%rip),%r9 # 417c <_sk_load_8888_avx+0x144>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -8603,7 +8718,7 @@ _sk_load_8888_avx LABEL PROC
DB 196,99,53,12,200,15 ; vblendps $0xf,%ymm0,%ymm9,%ymm9
DB 196,195,49,34,4,186,0 ; vpinsrd $0x0,(%r10,%rdi,4),%xmm9,%xmm0
DB 196,99,53,12,200,15 ; vblendps $0xf,%ymm0,%ymm9,%ymm9
- DB 233,210,254,255,255 ; jmpq 3f0c <_sk_load_8888_avx+0x14>
+ DB 233,210,254,255,255 ; jmpq 404c <_sk_load_8888_avx+0x14>
DB 102,144 ; xchg %ax,%ax
DB 236 ; in (%dx),%al
DB 255 ; (bad)
@@ -8621,7 +8736,7 @@ _sk_load_8888_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 4055 <_sk_load_8888_avx+0x15d>
+ DB 126,255 ; jle 4195 <_sk_load_8888_avx+0x15d>
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8664,10 +8779,10 @@ _sk_gather_8888_avx LABEL PROC
DB 196,131,121,34,4,152,2 ; vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
DB 196,131,121,34,28,144,3 ; vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,86,32,0,0 ; vmovaps 0x2056(%rip),%ymm10 # 6160 <_sk_callback_avx+0x598>
+ DB 197,124,40,21,86,32,0,0 ; vmovaps 0x2056(%rip),%ymm10 # 62a0 <_sk_callback_avx+0x598>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,188,30,0,0 ; vbroadcastss 0x1ebc(%rip),%ymm9 # 5fd8 <_sk_callback_avx+0x410>
+ DB 196,98,125,24,13,188,30,0,0 ; vbroadcastss 0x1ebc(%rip),%ymm9 # 6118 <_sk_callback_avx+0x410>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -8697,7 +8812,7 @@ PUBLIC _sk_store_8888_avx
_sk_store_8888_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 196,98,125,24,5,74,30,0,0 ; vbroadcastss 0x1e4a(%rip),%ymm8 # 5fdc <_sk_callback_avx+0x414>
+ DB 196,98,125,24,5,74,30,0,0 ; vbroadcastss 0x1e4a(%rip),%ymm8 # 611c <_sk_callback_avx+0x414>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -8722,7 +8837,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,10 ; jne 4220 <_sk_store_8888_avx+0x9c>
+ DB 117,10 ; jne 4360 <_sk_store_8888_avx+0x9c>
DB 196,65,124,17,4,186 ; vmovups %ymm8,(%r10,%rdi,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8730,9 +8845,9 @@ _sk_store_8888_avx LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,236 ; ja 421c <_sk_store_8888_avx+0x98>
+ DB 119,236 ; ja 435c <_sk_store_8888_avx+0x98>
DB 69,15,182,192 ; movzbl %r8b,%r8d
- DB 76,141,13,85,0,0,0 ; lea 0x55(%rip),%r9 # 4290 <_sk_store_8888_avx+0x10c>
+ DB 76,141,13,85,0,0,0 ; lea 0x55(%rip),%r9 # 43d0 <_sk_store_8888_avx+0x10c>
DB 75,99,4,129 ; movslq (%r9,%r8,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
@@ -8746,7 +8861,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,67,121,22,68,186,8,2 ; vpextrd $0x2,%xmm8,0x8(%r10,%rdi,4)
DB 196,67,121,22,68,186,4,1 ; vpextrd $0x1,%xmm8,0x4(%r10,%rdi,4)
DB 196,65,121,126,4,186 ; vmovd %xmm8,(%r10,%rdi,4)
- DB 235,143 ; jmp 421c <_sk_store_8888_avx+0x98>
+ DB 235,143 ; jmp 435c <_sk_store_8888_avx+0x98>
DB 15,31,0 ; nopl (%rax)
DB 245 ; cmc
DB 255 ; (bad)
@@ -8782,7 +8897,7 @@ _sk_load_f16_avx LABEL PROC
DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp)
DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp)
DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp)
- DB 15,133,143,2,0,0 ; jne 4567 <_sk_load_f16_avx+0x2bb>
+ DB 15,133,143,2,0,0 ; jne 46a7 <_sk_load_f16_avx+0x2bb>
DB 197,121,16,4,248 ; vmovupd (%rax,%rdi,8),%xmm8
DB 197,249,16,84,248,16 ; vmovupd 0x10(%rax,%rdi,8),%xmm2
DB 197,249,16,76,248,32 ; vmovupd 0x20(%rax,%rdi,8),%xmm1
@@ -8800,13 +8915,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,175,28,0,0 ; vbroadcastss 0x1caf(%rip),%ymm12 # 5fe0 <_sk_callback_avx+0x418>
+ DB 196,98,125,24,37,175,28,0,0 ; vbroadcastss 0x1caf(%rip),%ymm12 # 6120 <_sk_callback_avx+0x418>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,155,28,0,0 ; vbroadcastss 0x1c9b(%rip),%xmm11 # 5fe4 <_sk_callback_avx+0x41c>
+ DB 196,98,121,24,29,155,28,0,0 ; vbroadcastss 0x1c9b(%rip),%xmm11 # 6124 <_sk_callback_avx+0x41c>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,145,28,0,0 ; vbroadcastss 0x1c91(%rip),%xmm13 # 5fe8 <_sk_callback_avx+0x420>
+ DB 196,98,121,24,45,145,28,0,0 ; vbroadcastss 0x1c91(%rip),%xmm13 # 6128 <_sk_callback_avx+0x420>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -8820,7 +8935,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,71,28,0,0 ; vbroadcastss 0x1c47(%rip),%xmm3 # 5fec <_sk_callback_avx+0x424>
+ DB 196,226,121,24,29,71,28,0,0 ; vbroadcastss 0x1c47(%rip),%xmm3 # 612c <_sk_callback_avx+0x424>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -8913,29 +9028,29 @@ _sk_load_f16_avx LABEL PROC
DB 197,123,16,4,248 ; vmovsd (%rax,%rdi,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,79 ; je 45c6 <_sk_load_f16_avx+0x31a>
+ DB 116,79 ; je 4706 <_sk_load_f16_avx+0x31a>
DB 197,57,22,68,248,8 ; vmovhpd 0x8(%rax,%rdi,8),%xmm8,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,67 ; jb 45c6 <_sk_load_f16_avx+0x31a>
+ DB 114,67 ; jb 4706 <_sk_load_f16_avx+0x31a>
DB 197,251,16,84,248,16 ; vmovsd 0x10(%rax,%rdi,8),%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 116,68 ; je 45d3 <_sk_load_f16_avx+0x327>
+ DB 116,68 ; je 4713 <_sk_load_f16_avx+0x327>
DB 197,233,22,84,248,24 ; vmovhpd 0x18(%rax,%rdi,8),%xmm2,%xmm2
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,56 ; jb 45d3 <_sk_load_f16_avx+0x327>
+ DB 114,56 ; jb 4713 <_sk_load_f16_avx+0x327>
DB 197,251,16,76,248,32 ; vmovsd 0x20(%rax,%rdi,8),%xmm1
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 15,132,68,253,255,255 ; je 42ef <_sk_load_f16_avx+0x43>
+ DB 15,132,68,253,255,255 ; je 442f <_sk_load_f16_avx+0x43>
DB 197,241,22,76,248,40 ; vmovhpd 0x28(%rax,%rdi,8),%xmm1,%xmm1
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 15,130,52,253,255,255 ; jb 42ef <_sk_load_f16_avx+0x43>
+ DB 15,130,52,253,255,255 ; jb 442f <_sk_load_f16_avx+0x43>
DB 197,122,126,76,248,48 ; vmovq 0x30(%rax,%rdi,8),%xmm9
- DB 233,41,253,255,255 ; jmpq 42ef <_sk_load_f16_avx+0x43>
+ DB 233,41,253,255,255 ; jmpq 442f <_sk_load_f16_avx+0x43>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,28,253,255,255 ; jmpq 42ef <_sk_load_f16_avx+0x43>
+ DB 233,28,253,255,255 ; jmpq 442f <_sk_load_f16_avx+0x43>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
- DB 233,19,253,255,255 ; jmpq 42ef <_sk_load_f16_avx+0x43>
+ DB 233,19,253,255,255 ; jmpq 442f <_sk_load_f16_avx+0x43>
PUBLIC _sk_gather_f16_avx
_sk_gather_f16_avx LABEL PROC
@@ -8997,13 +9112,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,210 ; vpunpckhwd %xmm2,%xmm0,%xmm2
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
- DB 196,98,125,24,37,7,25,0,0 ; vbroadcastss 0x1907(%rip),%ymm12 # 5ff0 <_sk_callback_avx+0x428>
+ DB 196,98,125,24,37,7,25,0,0 ; vbroadcastss 0x1907(%rip),%ymm12 # 6130 <_sk_callback_avx+0x428>
DB 196,193,124,84,212 ; vandps %ymm12,%ymm0,%ymm2
DB 197,252,87,194 ; vxorps %ymm2,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,243,24,0,0 ; vbroadcastss 0x18f3(%rip),%xmm11 # 5ff4 <_sk_callback_avx+0x42c>
+ DB 196,98,121,24,29,243,24,0,0 ; vbroadcastss 0x18f3(%rip),%xmm11 # 6134 <_sk_callback_avx+0x42c>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,233,24,0,0 ; vbroadcastss 0x18e9(%rip),%xmm13 # 5ff8 <_sk_callback_avx+0x430>
+ DB 196,98,121,24,45,233,24,0,0 ; vbroadcastss 0x18e9(%rip),%xmm13 # 6138 <_sk_callback_avx+0x430>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -9017,7 +9132,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,194 ; vorps %ymm2,%ymm0,%ymm0
DB 196,227,125,25,194,1 ; vextractf128 $0x1,%ymm0,%xmm2
- DB 196,226,121,24,29,159,24,0,0 ; vbroadcastss 0x189f(%rip),%xmm3 # 5ffc <_sk_callback_avx+0x434>
+ DB 196,226,121,24,29,159,24,0,0 ; vbroadcastss 0x189f(%rip),%xmm3 # 613c <_sk_callback_avx+0x434>
DB 197,233,254,211 ; vpaddd %xmm3,%xmm2,%xmm2
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
@@ -9119,12 +9234,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,172,22,0,0 ; vbroadcastss 0x16ac(%rip),%ymm9 # 6000 <_sk_callback_avx+0x438>
+ DB 196,98,125,24,13,172,22,0,0 ; vbroadcastss 0x16ac(%rip),%ymm9 # 6140 <_sk_callback_avx+0x438>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,146,22,0,0 ; vbroadcastss 0x1692(%rip),%xmm8 # 6004 <_sk_callback_avx+0x43c>
+ DB 196,98,121,24,5,146,22,0,0 ; vbroadcastss 0x1692(%rip),%xmm8 # 6144 <_sk_callback_avx+0x43c>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -9134,7 +9249,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,89,22,0,0 ; vbroadcastss 0x1659(%rip),%ymm10 # 6008 <_sk_callback_avx+0x440>
+ DB 196,98,125,24,21,89,22,0,0 ; vbroadcastss 0x1659(%rip),%ymm10 # 6148 <_sk_callback_avx+0x440>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -9216,7 +9331,7 @@ _sk_store_f16_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 72,133,201 ; test %rcx,%rcx
- DB 117,75 ; jne 4b96 <_sk_store_f16_avx+0x270>
+ DB 117,75 ; jne 4cd6 <_sk_store_f16_avx+0x270>
DB 197,120,17,28,248 ; vmovups %xmm11,(%rax,%rdi,8)
DB 197,120,17,84,248,16 ; vmovups %xmm10,0x10(%rax,%rdi,8)
DB 197,120,17,76,248,32 ; vmovups %xmm9,0x20(%rax,%rdi,8)
@@ -9232,22 +9347,22 @@ _sk_store_f16_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 197,121,214,28,248 ; vmovq %xmm11,(%rax,%rdi,8)
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,193 ; je 4b62 <_sk_store_f16_avx+0x23c>
+ DB 116,193 ; je 4ca2 <_sk_store_f16_avx+0x23c>
DB 197,121,23,92,248,8 ; vmovhpd %xmm11,0x8(%rax,%rdi,8)
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,181 ; jb 4b62 <_sk_store_f16_avx+0x23c>
+ DB 114,181 ; jb 4ca2 <_sk_store_f16_avx+0x23c>
DB 197,121,214,84,248,16 ; vmovq %xmm10,0x10(%rax,%rdi,8)
- DB 116,173 ; je 4b62 <_sk_store_f16_avx+0x23c>
+ DB 116,173 ; je 4ca2 <_sk_store_f16_avx+0x23c>
DB 197,121,23,84,248,24 ; vmovhpd %xmm10,0x18(%rax,%rdi,8)
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,161 ; jb 4b62 <_sk_store_f16_avx+0x23c>
+ DB 114,161 ; jb 4ca2 <_sk_store_f16_avx+0x23c>
DB 197,121,214,76,248,32 ; vmovq %xmm9,0x20(%rax,%rdi,8)
- DB 116,153 ; je 4b62 <_sk_store_f16_avx+0x23c>
+ DB 116,153 ; je 4ca2 <_sk_store_f16_avx+0x23c>
DB 197,121,23,76,248,40 ; vmovhpd %xmm9,0x28(%rax,%rdi,8)
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,141 ; jb 4b62 <_sk_store_f16_avx+0x23c>
+ DB 114,141 ; jb 4ca2 <_sk_store_f16_avx+0x23c>
DB 197,121,214,68,248,48 ; vmovq %xmm8,0x30(%rax,%rdi,8)
- DB 235,133 ; jmp 4b62 <_sk_store_f16_avx+0x23c>
+ DB 235,133 ; jmp 4ca2 <_sk_store_f16_avx+0x23c>
PUBLIC _sk_load_u16_be_avx
_sk_load_u16_be_avx LABEL PROC
@@ -9255,7 +9370,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 72,141,4,189,0,0,0,0 ; lea 0x0(,%rdi,4),%rax
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,253,0,0,0 ; jne 4cf0 <_sk_load_u16_be_avx+0x113>
+ DB 15,133,253,0,0,0 ; jne 4e30 <_sk_load_u16_be_avx+0x113>
DB 196,65,121,16,4,64 ; vmovupd (%r8,%rax,2),%xmm8
DB 196,193,121,16,84,64,16 ; vmovupd 0x10(%r8,%rax,2),%xmm2
DB 196,193,121,16,92,64,32 ; vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -9277,7 +9392,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,168,19,0,0 ; vbroadcastss 0x13a8(%rip),%ymm11 # 600c <_sk_callback_avx+0x444>
+ DB 196,98,125,24,29,168,19,0,0 ; vbroadcastss 0x13a8(%rip),%ymm11 # 614c <_sk_callback_avx+0x444>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -9311,29 +9426,29 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,65,123,16,4,64 ; vmovsd (%r8,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,85 ; je 4d56 <_sk_load_u16_be_avx+0x179>
+ DB 116,85 ; je 4e96 <_sk_load_u16_be_avx+0x179>
DB 196,65,57,22,68,64,8 ; vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,72 ; jb 4d56 <_sk_load_u16_be_avx+0x179>
+ DB 114,72 ; jb 4e96 <_sk_load_u16_be_avx+0x179>
DB 196,193,123,16,84,64,16 ; vmovsd 0x10(%r8,%rax,2),%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 116,72 ; je 4d63 <_sk_load_u16_be_avx+0x186>
+ DB 116,72 ; je 4ea3 <_sk_load_u16_be_avx+0x186>
DB 196,193,105,22,84,64,24 ; vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,59 ; jb 4d63 <_sk_load_u16_be_avx+0x186>
+ DB 114,59 ; jb 4ea3 <_sk_load_u16_be_avx+0x186>
DB 196,193,123,16,92,64,32 ; vmovsd 0x20(%r8,%rax,2),%xmm3
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 15,132,213,254,255,255 ; je 4c0e <_sk_load_u16_be_avx+0x31>
+ DB 15,132,213,254,255,255 ; je 4d4e <_sk_load_u16_be_avx+0x31>
DB 196,193,97,22,92,64,40 ; vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 15,130,196,254,255,255 ; jb 4c0e <_sk_load_u16_be_avx+0x31>
+ DB 15,130,196,254,255,255 ; jb 4d4e <_sk_load_u16_be_avx+0x31>
DB 196,65,122,126,76,64,48 ; vmovq 0x30(%r8,%rax,2),%xmm9
- DB 233,184,254,255,255 ; jmpq 4c0e <_sk_load_u16_be_avx+0x31>
+ DB 233,184,254,255,255 ; jmpq 4d4e <_sk_load_u16_be_avx+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,171,254,255,255 ; jmpq 4c0e <_sk_load_u16_be_avx+0x31>
+ DB 233,171,254,255,255 ; jmpq 4d4e <_sk_load_u16_be_avx+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,162,254,255,255 ; jmpq 4c0e <_sk_load_u16_be_avx+0x31>
+ DB 233,162,254,255,255 ; jmpq 4d4e <_sk_load_u16_be_avx+0x31>
PUBLIC _sk_load_rgb_u16_be_avx
_sk_load_rgb_u16_be_avx LABEL PROC
@@ -9341,7 +9456,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 72,141,4,127 ; lea (%rdi,%rdi,2),%rax
DB 72,133,201 ; test %rcx,%rcx
- DB 15,133,243,0,0,0 ; jne 4e71 <_sk_load_rgb_u16_be_avx+0x105>
+ DB 15,133,243,0,0,0 ; jne 4fb1 <_sk_load_rgb_u16_be_avx+0x105>
DB 196,193,122,111,4,64 ; vmovdqu (%r8,%rax,2),%xmm0
DB 196,193,122,111,84,64,12 ; vmovdqu 0xc(%r8,%rax,2),%xmm2
DB 196,193,122,111,76,64,24 ; vmovdqu 0x18(%r8,%rax,2),%xmm1
@@ -9368,7 +9483,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,8,18,0,0 ; vbroadcastss 0x1208(%rip),%ymm11 # 6010 <_sk_callback_avx+0x448>
+ DB 196,98,125,24,29,8,18,0,0 ; vbroadcastss 0x1208(%rip),%ymm11 # 6150 <_sk_callback_avx+0x448>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -9389,48 +9504,48 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,165,17,0,0 ; vbroadcastss 0x11a5(%rip),%ymm3 # 6014 <_sk_callback_avx+0x44c>
+ DB 196,226,125,24,29,165,17,0,0 ; vbroadcastss 0x11a5(%rip),%ymm3 # 6154 <_sk_callback_avx+0x44c>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,64 ; vmovd (%r8,%rax,2),%xmm0
DB 196,193,121,196,68,64,4,2 ; vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 117,5 ; jne 4e8a <_sk_load_rgb_u16_be_avx+0x11e>
- DB 233,40,255,255,255 ; jmpq 4db2 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 117,5 ; jne 4fca <_sk_load_rgb_u16_be_avx+0x11e>
+ DB 233,40,255,255,255 ; jmpq 4ef2 <_sk_load_rgb_u16_be_avx+0x46>
DB 196,193,121,110,76,64,6 ; vmovd 0x6(%r8,%rax,2),%xmm1
DB 196,65,113,196,68,64,10,2 ; vpinsrw $0x2,0xa(%r8,%rax,2),%xmm1,%xmm8
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,26 ; jb 4eb9 <_sk_load_rgb_u16_be_avx+0x14d>
+ DB 114,26 ; jb 4ff9 <_sk_load_rgb_u16_be_avx+0x14d>
DB 196,193,121,110,76,64,12 ; vmovd 0xc(%r8,%rax,2),%xmm1
DB 196,193,113,196,84,64,16,2 ; vpinsrw $0x2,0x10(%r8,%rax,2),%xmm1,%xmm2
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 117,10 ; jne 4ebe <_sk_load_rgb_u16_be_avx+0x152>
- DB 233,249,254,255,255 ; jmpq 4db2 <_sk_load_rgb_u16_be_avx+0x46>
- DB 233,244,254,255,255 ; jmpq 4db2 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 117,10 ; jne 4ffe <_sk_load_rgb_u16_be_avx+0x152>
+ DB 233,249,254,255,255 ; jmpq 4ef2 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,244,254,255,255 ; jmpq 4ef2 <_sk_load_rgb_u16_be_avx+0x46>
DB 196,193,121,110,76,64,18 ; vmovd 0x12(%r8,%rax,2),%xmm1
DB 196,65,113,196,76,64,22,2 ; vpinsrw $0x2,0x16(%r8,%rax,2),%xmm1,%xmm9
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,26 ; jb 4eed <_sk_load_rgb_u16_be_avx+0x181>
+ DB 114,26 ; jb 502d <_sk_load_rgb_u16_be_avx+0x181>
DB 196,193,121,110,76,64,24 ; vmovd 0x18(%r8,%rax,2),%xmm1
DB 196,193,113,196,76,64,28,2 ; vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm1,%xmm1
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 117,10 ; jne 4ef2 <_sk_load_rgb_u16_be_avx+0x186>
- DB 233,197,254,255,255 ; jmpq 4db2 <_sk_load_rgb_u16_be_avx+0x46>
- DB 233,192,254,255,255 ; jmpq 4db2 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 117,10 ; jne 5032 <_sk_load_rgb_u16_be_avx+0x186>
+ DB 233,197,254,255,255 ; jmpq 4ef2 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,192,254,255,255 ; jmpq 4ef2 <_sk_load_rgb_u16_be_avx+0x46>
DB 196,193,121,110,92,64,30 ; vmovd 0x1e(%r8,%rax,2),%xmm3
DB 196,65,97,196,92,64,34,2 ; vpinsrw $0x2,0x22(%r8,%rax,2),%xmm3,%xmm11
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,20 ; jb 4f1b <_sk_load_rgb_u16_be_avx+0x1af>
+ DB 114,20 ; jb 505b <_sk_load_rgb_u16_be_avx+0x1af>
DB 196,193,121,110,92,64,36 ; vmovd 0x24(%r8,%rax,2),%xmm3
DB 196,193,97,196,92,64,40,2 ; vpinsrw $0x2,0x28(%r8,%rax,2),%xmm3,%xmm3
- DB 233,151,254,255,255 ; jmpq 4db2 <_sk_load_rgb_u16_be_avx+0x46>
- DB 233,146,254,255,255 ; jmpq 4db2 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,151,254,255,255 ; jmpq 4ef2 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,146,254,255,255 ; jmpq 4ef2 <_sk_load_rgb_u16_be_avx+0x46>
PUBLIC _sk_store_u16_be_avx
_sk_store_u16_be_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 72,141,4,189,0,0,0,0 ; lea 0x0(,%rdi,4),%rax
- DB 196,98,125,24,5,226,16,0,0 ; vbroadcastss 0x10e2(%rip),%ymm8 # 6018 <_sk_callback_avx+0x450>
+ DB 196,98,125,24,5,226,16,0,0 ; vbroadcastss 0x10e2(%rip),%ymm8 # 6158 <_sk_callback_avx+0x450>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -9468,7 +9583,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 72,133,201 ; test %rcx,%rcx
- DB 117,31 ; jne 501a <_sk_store_u16_be_avx+0xfa>
+ DB 117,31 ; jne 515a <_sk_store_u16_be_avx+0xfa>
DB 196,65,120,17,28,64 ; vmovups %xmm11,(%r8,%rax,2)
DB 196,65,120,17,84,64,16 ; vmovups %xmm10,0x10(%r8,%rax,2)
DB 196,65,120,17,76,64,32 ; vmovups %xmm9,0x20(%r8,%rax,2)
@@ -9477,31 +9592,31 @@ _sk_store_u16_be_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,64 ; vmovq %xmm11,(%r8,%rax,2)
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,240 ; je 5016 <_sk_store_u16_be_avx+0xf6>
+ DB 116,240 ; je 5156 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,23,92,64,8 ; vmovhpd %xmm11,0x8(%r8,%rax,2)
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,227 ; jb 5016 <_sk_store_u16_be_avx+0xf6>
+ DB 114,227 ; jb 5156 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,214,84,64,16 ; vmovq %xmm10,0x10(%r8,%rax,2)
- DB 116,218 ; je 5016 <_sk_store_u16_be_avx+0xf6>
+ DB 116,218 ; je 5156 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,23,84,64,24 ; vmovhpd %xmm10,0x18(%r8,%rax,2)
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,205 ; jb 5016 <_sk_store_u16_be_avx+0xf6>
+ DB 114,205 ; jb 5156 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,214,76,64,32 ; vmovq %xmm9,0x20(%r8,%rax,2)
- DB 116,196 ; je 5016 <_sk_store_u16_be_avx+0xf6>
+ DB 116,196 ; je 5156 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,23,76,64,40 ; vmovhpd %xmm9,0x28(%r8,%rax,2)
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,183 ; jb 5016 <_sk_store_u16_be_avx+0xf6>
+ DB 114,183 ; jb 5156 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,214,68,64,48 ; vmovq %xmm8,0x30(%r8,%rax,2)
- DB 235,174 ; jmp 5016 <_sk_store_u16_be_avx+0xf6>
+ DB 235,174 ; jmp 5156 <_sk_store_u16_be_avx+0xf6>
PUBLIC _sk_load_f32_avx
_sk_load_f32_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 119,110 ; ja 50de <_sk_load_f32_avx+0x76>
+ DB 119,110 ; ja 521e <_sk_load_f32_avx+0x76>
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,189,0,0,0,0 ; lea 0x0(,%rdi,4),%r9
- DB 76,141,21,134,0,0,0 ; lea 0x86(%rip),%r10 # 5108 <_sk_load_f32_avx+0xa0>
+ DB 76,141,21,134,0,0,0 ; lea 0x86(%rip),%r10 # 5248 <_sk_load_f32_avx+0xa0>
DB 73,99,4,138 ; movslq (%r10,%rcx,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
@@ -9558,7 +9673,7 @@ _sk_store_f32_avx LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 72,133,201 ; test %rcx,%rcx
- DB 117,55 ; jne 5195 <_sk_store_f32_avx+0x6d>
+ DB 117,55 ; jne 52d5 <_sk_store_f32_avx+0x6d>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -9571,22 +9686,22 @@ _sk_store_f32_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,128 ; vmovupd %xmm10,(%r8,%rax,4)
DB 72,131,249,1 ; cmp $0x1,%rcx
- DB 116,240 ; je 5191 <_sk_store_f32_avx+0x69>
+ DB 116,240 ; je 52d1 <_sk_store_f32_avx+0x69>
DB 196,65,121,17,76,128,16 ; vmovupd %xmm9,0x10(%r8,%rax,4)
DB 72,131,249,3 ; cmp $0x3,%rcx
- DB 114,227 ; jb 5191 <_sk_store_f32_avx+0x69>
+ DB 114,227 ; jb 52d1 <_sk_store_f32_avx+0x69>
DB 196,65,121,17,68,128,32 ; vmovupd %xmm8,0x20(%r8,%rax,4)
- DB 116,218 ; je 5191 <_sk_store_f32_avx+0x69>
+ DB 116,218 ; je 52d1 <_sk_store_f32_avx+0x69>
DB 196,65,121,17,92,128,48 ; vmovupd %xmm11,0x30(%r8,%rax,4)
DB 72,131,249,5 ; cmp $0x5,%rcx
- DB 114,205 ; jb 5191 <_sk_store_f32_avx+0x69>
+ DB 114,205 ; jb 52d1 <_sk_store_f32_avx+0x69>
DB 196,67,125,25,84,128,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- DB 116,195 ; je 5191 <_sk_store_f32_avx+0x69>
+ DB 116,195 ; je 52d1 <_sk_store_f32_avx+0x69>
DB 196,67,125,25,76,128,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
DB 72,131,249,7 ; cmp $0x7,%rcx
- DB 114,181 ; jb 5191 <_sk_store_f32_avx+0x69>
+ DB 114,181 ; jb 52d1 <_sk_store_f32_avx+0x69>
DB 196,67,125,25,68,128,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- DB 235,171 ; jmp 5191 <_sk_store_f32_avx+0x69>
+ DB 235,171 ; jmp 52d1 <_sk_store_f32_avx+0x69>
PUBLIC _sk_clamp_x_avx
_sk_clamp_x_avx LABEL PROC
@@ -9678,12 +9793,12 @@ _sk_mirror_y_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,7,13,0,0 ; vbroadcastss 0xd07(%rip),%ymm3 # 601c <_sk_callback_avx+0x454>
+ DB 196,226,125,24,29,7,13,0,0 ; vbroadcastss 0xd07(%rip),%ymm3 # 615c <_sk_callback_avx+0x454>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,254,12,0,0 ; vbroadcastss 0xcfe(%rip),%ymm3 # 6020 <_sk_callback_avx+0x458>
+ DB 196,226,125,24,29,254,12,0,0 ; vbroadcastss 0xcfe(%rip),%ymm3 # 6160 <_sk_callback_avx+0x458>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,241,12,0,0 ; vbroadcastss 0xcf1(%rip),%ymm1 # 6024 <_sk_callback_avx+0x45c>
+ DB 196,226,125,24,13,241,12,0,0 ; vbroadcastss 0xcf1(%rip),%ymm1 # 6164 <_sk_callback_avx+0x45c>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -9851,7 +9966,7 @@ _sk_gradient_avx LABEL PROC
DB 196,226,125,24,88,28 ; vbroadcastss 0x1c(%rax),%ymm3
DB 76,139,0 ; mov (%rax),%r8
DB 77,133,192 ; test %r8,%r8
- DB 15,132,146,0,0,0 ; je 5689 <_sk_gradient_avx+0xb8>
+ DB 15,132,146,0,0,0 ; je 57c9 <_sk_gradient_avx+0xb8>
DB 72,139,64,8 ; mov 0x8(%rax),%rax
DB 72,131,192,32 ; add $0x20,%rax
DB 196,65,28,87,228 ; vxorps %ymm12,%ymm12,%ymm12
@@ -9878,8 +9993,8 @@ _sk_gradient_avx LABEL PROC
DB 196,227,13,74,219,208 ; vblendvps %ymm13,%ymm3,%ymm14,%ymm3
DB 72,131,192,36 ; add $0x24,%rax
DB 73,255,200 ; dec %r8
- DB 117,140 ; jne 5613 <_sk_gradient_avx+0x42>
- DB 235,20 ; jmp 569d <_sk_gradient_avx+0xcc>
+ DB 117,140 ; jne 5753 <_sk_gradient_avx+0x42>
+ DB 235,20 ; jmp 57dd <_sk_gradient_avx+0xcc>
DB 196,65,36,87,219 ; vxorps %ymm11,%ymm11,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
@@ -9930,27 +10045,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,214,8,0,0 ; vbroadcastss 0x8d6(%rip),%ymm13 # 6028 <_sk_callback_avx+0x460>
+ DB 196,98,125,24,45,214,8,0,0 ; vbroadcastss 0x8d6(%rip),%ymm13 # 6168 <_sk_callback_avx+0x460>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,204,8,0,0 ; vbroadcastss 0x8cc(%rip),%ymm14 # 602c <_sk_callback_avx+0x464>
+ DB 196,98,125,24,53,204,8,0,0 ; vbroadcastss 0x8cc(%rip),%ymm14 # 616c <_sk_callback_avx+0x464>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,189,8,0,0 ; vbroadcastss 0x8bd(%rip),%ymm14 # 6030 <_sk_callback_avx+0x468>
+ DB 196,98,125,24,53,189,8,0,0 ; vbroadcastss 0x8bd(%rip),%ymm14 # 6170 <_sk_callback_avx+0x468>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,174,8,0,0 ; vbroadcastss 0x8ae(%rip),%ymm13 # 6034 <_sk_callback_avx+0x46c>
+ DB 196,98,125,24,45,174,8,0,0 ; vbroadcastss 0x8ae(%rip),%ymm13 # 6174 <_sk_callback_avx+0x46c>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,153,8,0,0 ; vbroadcastss 0x899(%rip),%ymm10 # 6038 <_sk_callback_avx+0x470>
+ DB 196,98,125,24,21,153,8,0,0 ; vbroadcastss 0x899(%rip),%ymm10 # 6178 <_sk_callback_avx+0x470>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,131,8,0,0 ; vbroadcastss 0x883(%rip),%ymm10 # 603c <_sk_callback_avx+0x474>
+ DB 196,98,125,24,21,131,8,0,0 ; vbroadcastss 0x883(%rip),%ymm10 # 617c <_sk_callback_avx+0x474>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,109,8,0,0 ; vbroadcastss 0x86d(%rip),%ymm10 # 6040 <_sk_callback_avx+0x478>
+ DB 196,98,125,24,21,109,8,0,0 ; vbroadcastss 0x86d(%rip),%ymm10 # 6180 <_sk_callback_avx+0x478>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -9971,7 +10086,7 @@ _sk_xy_to_radius_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,51,8,0,0 ; vbroadcastss 0x833(%rip),%ymm8 # 6044 <_sk_callback_avx+0x47c>
+ DB 196,98,125,24,5,51,8,0,0 ; vbroadcastss 0x833(%rip),%ymm8 # 6184 <_sk_callback_avx+0x47c>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -10004,9 +10119,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,191,7,0,0 ; vbroadcastss 0x7bf(%rip),%ymm0 # 6048 <_sk_callback_avx+0x480>
+ DB 196,226,125,24,5,191,7,0,0 ; vbroadcastss 0x7bf(%rip),%ymm0 # 6188 <_sk_callback_avx+0x480>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,182,7,0,0 ; vbroadcastss 0x7b6(%rip),%ymm8 # 604c <_sk_callback_avx+0x484>
+ DB 196,98,125,24,5,182,7,0,0 ; vbroadcastss 0x7b6(%rip),%ymm8 # 618c <_sk_callback_avx+0x484>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -10015,7 +10130,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,158,7,0,0 ; vbroadcastss 0x79e(%rip),%ymm0 # 6050 <_sk_callback_avx+0x488>
+ DB 196,226,125,24,5,158,7,0,0 ; vbroadcastss 0x79e(%rip),%ymm0 # 6190 <_sk_callback_avx+0x488>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -10025,9 +10140,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,130,7,0,0 ; vbroadcastss 0x782(%rip),%ymm1 # 6054 <_sk_callback_avx+0x48c>
+ DB 196,226,125,24,13,130,7,0,0 ; vbroadcastss 0x782(%rip),%ymm1 # 6194 <_sk_callback_avx+0x48c>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,120,7,0,0 ; vbroadcastss 0x778(%rip),%ymm8 # 6058 <_sk_callback_avx+0x490>
+ DB 196,98,125,24,5,120,7,0,0 ; vbroadcastss 0x778(%rip),%ymm8 # 6198 <_sk_callback_avx+0x490>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -10036,7 +10151,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,96,7,0,0 ; vbroadcastss 0x760(%rip),%ymm1 # 605c <_sk_callback_avx+0x494>
+ DB 196,226,125,24,13,96,7,0,0 ; vbroadcastss 0x760(%rip),%ymm1 # 619c <_sk_callback_avx+0x494>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -10046,14 +10161,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,67,7,0,0 ; vbroadcastss 0x743(%rip),%ymm0 # 6060 <_sk_callback_avx+0x498>
+ DB 196,226,125,24,5,67,7,0,0 ; vbroadcastss 0x743(%rip),%ymm0 # 61a0 <_sk_callback_avx+0x498>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,58,7,0,0 ; vbroadcastss 0x73a(%rip),%ymm8 # 6064 <_sk_callback_avx+0x49c>
+ DB 196,98,125,24,5,58,7,0,0 ; vbroadcastss 0x73a(%rip),%ymm8 # 61a4 <_sk_callback_avx+0x49c>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,43,7,0,0 ; vbroadcastss 0x72b(%rip),%ymm10 # 6068 <_sk_callback_avx+0x4a0>
+ DB 196,98,125,24,21,43,7,0,0 ; vbroadcastss 0x72b(%rip),%ymm10 # 61a8 <_sk_callback_avx+0x4a0>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,33,7,0,0 ; vbroadcastss 0x721(%rip),%ymm10 # 606c <_sk_callback_avx+0x4a4>
+ DB 196,98,125,24,21,33,7,0,0 ; vbroadcastss 0x721(%rip),%ymm10 # 61ac <_sk_callback_avx+0x4a4>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -10063,19 +10178,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,4,7,0,0 ; vbroadcastss 0x704(%rip),%ymm0 # 6070 <_sk_callback_avx+0x4a8>
+ DB 196,226,125,24,5,4,7,0,0 ; vbroadcastss 0x704(%rip),%ymm0 # 61b0 <_sk_callback_avx+0x4a8>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,251,6,0,0 ; vbroadcastss 0x6fb(%rip),%ymm8 # 6074 <_sk_callback_avx+0x4ac>
+ DB 196,98,125,24,5,251,6,0,0 ; vbroadcastss 0x6fb(%rip),%ymm8 # 61b4 <_sk_callback_avx+0x4ac>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,241,6,0,0 ; vbroadcastss 0x6f1(%rip),%ymm9 # 6078 <_sk_callback_avx+0x4b0>
+ DB 196,98,125,24,13,241,6,0,0 ; vbroadcastss 0x6f1(%rip),%ymm9 # 61b8 <_sk_callback_avx+0x4b0>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,231,6,0,0 ; vbroadcastss 0x6e7(%rip),%ymm10 # 607c <_sk_callback_avx+0x4b4>
+ DB 196,98,125,24,21,231,6,0,0 ; vbroadcastss 0x6e7(%rip),%ymm10 # 61bc <_sk_callback_avx+0x4b4>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,216,6,0,0 ; vbroadcastss 0x6d8(%rip),%ymm10 # 6080 <_sk_callback_avx+0x4b8>
+ DB 196,98,125,24,21,216,6,0,0 ; vbroadcastss 0x6d8(%rip),%ymm10 # 61c0 <_sk_callback_avx+0x4b8>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,201,6,0,0 ; vbroadcastss 0x6c9(%rip),%ymm9 # 6084 <_sk_callback_avx+0x4bc>
+ DB 196,98,125,24,13,201,6,0,0 ; vbroadcastss 0x6c9(%rip),%ymm9 # 61c4 <_sk_callback_avx+0x4bc>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -10084,17 +10199,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,177,6,0,0 ; vbroadcastss 0x6b1(%rip),%ymm8 # 6088 <_sk_callback_avx+0x4c0>
+ DB 196,98,125,24,5,177,6,0,0 ; vbroadcastss 0x6b1(%rip),%ymm8 # 61c8 <_sk_callback_avx+0x4c0>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,163,6,0,0 ; vbroadcastss 0x6a3(%rip),%ymm10 # 608c <_sk_callback_avx+0x4c4>
+ DB 196,98,125,24,21,163,6,0,0 ; vbroadcastss 0x6a3(%rip),%ymm10 # 61cc <_sk_callback_avx+0x4c4>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,153,6,0,0 ; vbroadcastss 0x699(%rip),%ymm11 # 6090 <_sk_callback_avx+0x4c8>
+ DB 196,98,125,24,29,153,6,0,0 ; vbroadcastss 0x699(%rip),%ymm11 # 61d0 <_sk_callback_avx+0x4c8>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,128,6,0,0 ; vbroadcastss 0x680(%rip),%ymm9 # 6094 <_sk_callback_avx+0x4cc>
+ DB 196,98,125,24,13,128,6,0,0 ; vbroadcastss 0x680(%rip),%ymm9 # 61d4 <_sk_callback_avx+0x4cc>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -10103,13 +10218,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,104,6,0,0 ; vbroadcastss 0x668(%rip),%ymm0 # 6098 <_sk_callback_avx+0x4d0>
+ DB 196,226,125,24,5,104,6,0,0 ; vbroadcastss 0x668(%rip),%ymm0 # 61d8 <_sk_callback_avx+0x4d0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,85,6,0,0 ; vbroadcastss 0x655(%rip),%ymm10 # 609c <_sk_callback_avx+0x4d4>
+ DB 196,98,125,24,21,85,6,0,0 ; vbroadcastss 0x655(%rip),%ymm10 # 61dc <_sk_callback_avx+0x4d4>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,75,6,0,0 ; vbroadcastss 0x64b(%rip),%ymm10 # 60a0 <_sk_callback_avx+0x4d8>
+ DB 196,98,125,24,21,75,6,0,0 ; vbroadcastss 0x64b(%rip),%ymm10 # 61e0 <_sk_callback_avx+0x4d8>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -10119,14 +10234,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,46,6,0,0 ; vbroadcastss 0x62e(%rip),%ymm1 # 60a4 <_sk_callback_avx+0x4dc>
+ DB 196,226,125,24,13,46,6,0,0 ; vbroadcastss 0x62e(%rip),%ymm1 # 61e4 <_sk_callback_avx+0x4dc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,36,6,0,0 ; vbroadcastss 0x624(%rip),%ymm8 # 60a8 <_sk_callback_avx+0x4e0>
+ DB 196,98,125,24,5,36,6,0,0 ; vbroadcastss 0x624(%rip),%ymm8 # 61e8 <_sk_callback_avx+0x4e0>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,21,6,0,0 ; vbroadcastss 0x615(%rip),%ymm10 # 60ac <_sk_callback_avx+0x4e4>
+ DB 196,98,125,24,21,21,6,0,0 ; vbroadcastss 0x615(%rip),%ymm10 # 61ec <_sk_callback_avx+0x4e4>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,11,6,0,0 ; vbroadcastss 0x60b(%rip),%ymm10 # 60b0 <_sk_callback_avx+0x4e8>
+ DB 196,98,125,24,21,11,6,0,0 ; vbroadcastss 0x60b(%rip),%ymm10 # 61f0 <_sk_callback_avx+0x4e8>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -10136,19 +10251,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,238,5,0,0 ; vbroadcastss 0x5ee(%rip),%ymm1 # 60b4 <_sk_callback_avx+0x4ec>
+ DB 196,226,125,24,13,238,5,0,0 ; vbroadcastss 0x5ee(%rip),%ymm1 # 61f4 <_sk_callback_avx+0x4ec>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,228,5,0,0 ; vbroadcastss 0x5e4(%rip),%ymm8 # 60b8 <_sk_callback_avx+0x4f0>
+ DB 196,98,125,24,5,228,5,0,0 ; vbroadcastss 0x5e4(%rip),%ymm8 # 61f8 <_sk_callback_avx+0x4f0>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,218,5,0,0 ; vbroadcastss 0x5da(%rip),%ymm9 # 60bc <_sk_callback_avx+0x4f4>
+ DB 196,98,125,24,13,218,5,0,0 ; vbroadcastss 0x5da(%rip),%ymm9 # 61fc <_sk_callback_avx+0x4f4>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,208,5,0,0 ; vbroadcastss 0x5d0(%rip),%ymm10 # 60c0 <_sk_callback_avx+0x4f8>
+ DB 196,98,125,24,21,208,5,0,0 ; vbroadcastss 0x5d0(%rip),%ymm10 # 6200 <_sk_callback_avx+0x4f8>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,193,5,0,0 ; vbroadcastss 0x5c1(%rip),%ymm10 # 60c4 <_sk_callback_avx+0x4fc>
+ DB 196,98,125,24,21,193,5,0,0 ; vbroadcastss 0x5c1(%rip),%ymm10 # 6204 <_sk_callback_avx+0x4fc>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,178,5,0,0 ; vbroadcastss 0x5b2(%rip),%ymm9 # 60c8 <_sk_callback_avx+0x500>
+ DB 196,98,125,24,13,178,5,0,0 ; vbroadcastss 0x5b2(%rip),%ymm9 # 6208 <_sk_callback_avx+0x500>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -10157,17 +10272,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,154,5,0,0 ; vbroadcastss 0x59a(%rip),%ymm8 # 60cc <_sk_callback_avx+0x504>
+ DB 196,98,125,24,5,154,5,0,0 ; vbroadcastss 0x59a(%rip),%ymm8 # 620c <_sk_callback_avx+0x504>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,139,5,0,0 ; vbroadcastss 0x58b(%rip),%ymm10 # 60d0 <_sk_callback_avx+0x508>
+ DB 196,98,125,24,21,139,5,0,0 ; vbroadcastss 0x58b(%rip),%ymm10 # 6210 <_sk_callback_avx+0x508>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,129,5,0,0 ; vbroadcastss 0x581(%rip),%ymm11 # 60d4 <_sk_callback_avx+0x50c>
+ DB 196,98,125,24,29,129,5,0,0 ; vbroadcastss 0x581(%rip),%ymm11 # 6214 <_sk_callback_avx+0x50c>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,104,5,0,0 ; vbroadcastss 0x568(%rip),%ymm9 # 60d8 <_sk_callback_avx+0x510>
+ DB 196,98,125,24,13,104,5,0,0 ; vbroadcastss 0x568(%rip),%ymm9 # 6218 <_sk_callback_avx+0x510>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -10176,13 +10291,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,80,5,0,0 ; vbroadcastss 0x550(%rip),%ymm1 # 60dc <_sk_callback_avx+0x514>
+ DB 196,226,125,24,13,80,5,0,0 ; vbroadcastss 0x550(%rip),%ymm1 # 621c <_sk_callback_avx+0x514>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,60,5,0,0 ; vbroadcastss 0x53c(%rip),%ymm10 # 60e0 <_sk_callback_avx+0x518>
+ DB 196,98,125,24,21,60,5,0,0 ; vbroadcastss 0x53c(%rip),%ymm10 # 6220 <_sk_callback_avx+0x518>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,50,5,0,0 ; vbroadcastss 0x532(%rip),%ymm10 # 60e4 <_sk_callback_avx+0x51c>
+ DB 196,98,125,24,21,50,5,0,0 ; vbroadcastss 0x532(%rip),%ymm10 # 6224 <_sk_callback_avx+0x51c>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -10292,35 +10407,35 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,191,0,0,224 ; add %al,-0x1fffff41(%rax)
- DB 64,0,0 ; add %al,(%rax)
- DB 128,63,154 ; cmpb $0x9a,(%rdi)
+ DB 64,154 ; rex (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5d99 <.literal4+0xb5>
+ DB 71,225,61 ; rex.RXB loope 5ed5 <.literal4+0xb1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5da9 <.literal4+0xc5>
+ DB 71,225,61 ; rex.RXB loope 5ee5 <.literal4+0xc1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5db9 <.literal4+0xd5>
+ DB 71,225,61 ; rex.RXB loope 5ef5 <.literal4+0xd1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5dc9 <.literal4+0xe5>
+ DB 71,225,61 ; rex.RXB loope 5f05 <.literal4+0xe1>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
DB 63 ; (bad)
- DB 145 ; xchg %eax,%ecx
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,145 ; cmpb $0x91,(%rdi)
DB 131,158,61,154,153,153,62 ; sbbl $0x3e,-0x666665c3(%rsi)
DB 92 ; pop %rsp
DB 143 ; (bad)
@@ -10364,7 +10479,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5e11 <.literal4+0x12d>
+ DB 224,7 ; loopne 5f51 <.literal4+0x12d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -10380,10 +10495,10 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 5e38 <.literal4+0x154>
+ DB 127,0 ; jg 5f78 <.literal4+0x154>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5eb1 <.literal4+0x1cd>
+ DB 119,115 ; ja 5ff1 <.literal4+0x1cd>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -10397,10 +10512,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5e6c <.literal4+0x188>
+ DB 127,0 ; jg 5fac <.literal4+0x188>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5ee5 <.literal4+0x201>
+ DB 119,115 ; ja 6025 <.literal4+0x201>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -10414,10 +10529,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5ea0 <.literal4+0x1bc>
+ DB 127,0 ; jg 5fe0 <.literal4+0x1bc>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5f19 <.literal4+0x235>
+ DB 119,115 ; ja 6059 <.literal4+0x235>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -10431,10 +10546,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5ed4 <.literal4+0x1f0>
+ DB 127,0 ; jg 6014 <.literal4+0x1f0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5f4d <.literal4+0x269>
+ DB 119,115 ; ja 608d <.literal4+0x269>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -10447,7 +10562,7 @@ ALIGN 4
DB 0,75,0 ; add %cl,0x0(%rbx)
DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax)
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 5f4b <.literal4+0x267>
+ DB 127,67 ; jg 608b <.literal4+0x267>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -10459,10 +10574,10 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5f6b <.literal4+0x287>
+ DB 118,63 ; jbe 60ab <.literal4+0x287>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 5f7f <.literal4+0x29b>
+ DB 127,67 ; jg 60bf <.literal4+0x29b>
DB 129,128,128,59,0,0,128,63,129,128 ; addl $0x80813f80,0x3b80(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,128,63,129,128,128 ; add %al,-0x7f7f7ec1(%rax)
@@ -10471,7 +10586,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5f61 <.literal4+0x27d>
+ DB 224,7 ; loopne 60a1 <.literal4+0x27d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -10483,7 +10598,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5f7d <.literal4+0x299>
+ DB 224,7 ; loopne 60bd <.literal4+0x299>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -10494,7 +10609,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 5fd2 <.literal4+0x2ee>
+ DB 124,66 ; jl 6112 <.literal4+0x2ee>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -10512,9 +10627,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 6015 <.literal4+0x331>
+ DB 112,65 ; jo 6155 <.literal4+0x331>
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 6023 <.literal4+0x33f>
+ DB 127,67 ; jg 6163 <.literal4+0x33f>
DB 0,128,0,0,0,0 ; add %al,0x0(%rax)
DB 0,128,0,4,0,128 ; add %al,-0x7ffffc00(%rax)
DB 0,0 ; add %al,(%rax)
@@ -10530,7 +10645,7 @@ ALIGN 4
DB 0,128,55,0,0,128 ; add %al,-0x7fffffc9(%rax)
DB 63 ; (bad)
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 6063 <.literal4+0x37f>
+ DB 127,71 ; jg 61a3 <.literal4+0x37f>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,89 ; ds pop %rcx
@@ -10778,7 +10893,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,199 ; movd %edi,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,193,66,0,0 ; movaps 0x42c1(%rip),%xmm2 # 43d0 <_sk_callback_sse41+0xb5>
+ DB 15,40,21,17,68,0,0 ; movaps 0x4411(%rip),%xmm2 # 4520 <_sk_callback_sse41+0xb3>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,2 ; movups (%rdx),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -10787,7 +10902,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,176,66,0,0 ; movaps 0x42b0(%rip),%xmm2 # 43e0 <_sk_callback_sse41+0xc5>
+ DB 15,40,21,0,68,0,0 ; movaps 0x4400(%rip),%xmm2 # 4530 <_sk_callback_sse41+0xc3>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -10808,14 +10923,14 @@ _sk_dither_sse41 LABEL PROC
DB 102,68,15,110,1 ; movd (%rcx),%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,117,66,0,0 ; movdqa 0x4275(%rip),%xmm10 # 43f0 <_sk_callback_sse41+0xd5>
+ DB 102,68,15,111,21,197,67,0,0 ; movdqa 0x43c5(%rip),%xmm10 # 4540 <_sk_callback_sse41+0xd3>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,97,66,0,0 ; movdqa 0x4261(%rip),%xmm12 # 4400 <_sk_callback_sse41+0xe5>
- DB 102,68,15,111,45,104,66,0,0 ; movdqa 0x4268(%rip),%xmm13 # 4410 <_sk_callback_sse41+0xf5>
+ DB 102,68,15,111,37,177,67,0,0 ; movdqa 0x43b1(%rip),%xmm12 # 4550 <_sk_callback_sse41+0xe3>
+ DB 102,68,15,111,45,184,67,0,0 ; movdqa 0x43b8(%rip),%xmm13 # 4560 <_sk_callback_sse41+0xf3>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -10831,8 +10946,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,35,66,0,0 ; mulps 0x4223(%rip),%xmm8 # 4420 <_sk_callback_sse41+0x105>
- DB 68,15,88,5,43,66,0,0 ; addps 0x422b(%rip),%xmm8 # 4430 <_sk_callback_sse41+0x115>
+ DB 68,15,89,5,115,67,0,0 ; mulps 0x4373(%rip),%xmm8 # 4570 <_sk_callback_sse41+0x103>
+ DB 68,15,88,5,123,67,0,0 ; addps 0x437b(%rip),%xmm8 # 4580 <_sk_callback_sse41+0x113>
DB 243,68,15,16,72,8 ; movss 0x8(%rax),%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -10868,7 +10983,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,216,65,0,0 ; movaps 0x41d8(%rip),%xmm8 # 4440 <_sk_callback_sse41+0x125>
+ DB 68,15,40,5,40,67,0,0 ; movaps 0x4328(%rip),%xmm8 # 4590 <_sk_callback_sse41+0x123>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -10891,7 +11006,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,155,65,0,0 ; movaps 0x419b(%rip),%xmm9 # 4450 <_sk_callback_sse41+0x135>
+ DB 68,15,40,13,235,66,0,0 ; movaps 0x42eb(%rip),%xmm9 # 45a0 <_sk_callback_sse41+0x133>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -10932,7 +11047,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,63,65,0,0 ; movaps 0x413f(%rip),%xmm8 # 4460 <_sk_callback_sse41+0x145>
+ DB 68,15,40,5,143,66,0,0 ; movaps 0x428f(%rip),%xmm8 # 45b0 <_sk_callback_sse41+0x143>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -10943,7 +11058,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,47,65,0,0 ; movaps 0x412f(%rip),%xmm8 # 4470 <_sk_callback_sse41+0x155>
+ DB 68,15,40,5,127,66,0,0 ; movaps 0x427f(%rip),%xmm8 # 45c0 <_sk_callback_sse41+0x153>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -10958,7 +11073,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,18,65,0,0 ; movaps 0x4112(%rip),%xmm8 # 4480 <_sk_callback_sse41+0x165>
+ DB 68,15,40,5,98,66,0,0 ; movaps 0x4262(%rip),%xmm8 # 45d0 <_sk_callback_sse41+0x163>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -10976,7 +11091,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,230,64,0,0 ; movaps 0x40e6(%rip),%xmm8 # 4490 <_sk_callback_sse41+0x175>
+ DB 68,15,40,5,54,66,0,0 ; movaps 0x4236(%rip),%xmm8 # 45e0 <_sk_callback_sse41+0x173>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -11000,7 +11115,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,186,64,0,0 ; movaps 0x40ba(%rip),%xmm8 # 44a0 <_sk_callback_sse41+0x185>
+ DB 68,15,40,5,10,66,0,0 ; movaps 0x420a(%rip),%xmm8 # 45f0 <_sk_callback_sse41+0x183>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -11070,7 +11185,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,235,63,0,0 ; movaps 0x3feb(%rip),%xmm3 # 44b0 <_sk_callback_sse41+0x195>
+ DB 15,40,29,59,65,0,0 ; movaps 0x413b(%rip),%xmm3 # 4600 <_sk_callback_sse41+0x193>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -11116,7 +11231,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,86,63,0,0 ; movaps 0x3f56(%rip),%xmm2 # 44c0 <_sk_callback_sse41+0x1a5>
+ DB 15,40,21,166,64,0,0 ; movaps 0x40a6(%rip),%xmm2 # 4610 <_sk_callback_sse41+0x1a3>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -11148,7 +11263,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,251,62,0,0 ; movaps 0x3efb(%rip),%xmm2 # 44d0 <_sk_callback_sse41+0x1b5>
+ DB 15,40,21,75,64,0,0 ; movaps 0x404b(%rip),%xmm2 # 4620 <_sk_callback_sse41+0x1b3>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -11183,7 +11298,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,149,62,0,0 ; movaps 0x3e95(%rip),%xmm2 # 44e0 <_sk_callback_sse41+0x1c5>
+ DB 15,40,21,229,63,0,0 ; movaps 0x3fe5(%rip),%xmm2 # 4630 <_sk_callback_sse41+0x1c3>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -11208,7 +11323,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,202 ; subps %xmm2,%xmm9
- DB 15,40,13,86,62,0,0 ; movaps 0x3e56(%rip),%xmm1 # 44f0 <_sk_callback_sse41+0x1d5>
+ DB 15,40,13,166,63,0,0 ; movaps 0x3fa6(%rip),%xmm1 # 4640 <_sk_callback_sse41+0x1d3>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -11220,7 +11335,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,69,62,0,0 ; movaps 0x3e45(%rip),%xmm10 # 4500 <_sk_callback_sse41+0x1e5>
+ DB 68,15,40,21,149,63,0,0 ; movaps 0x3f95(%rip),%xmm10 # 4650 <_sk_callback_sse41+0x1e3>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,203 ; movaps %xmm11,%xmm9
@@ -11300,7 +11415,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,35,61,0,0 ; movaps 0x3d23(%rip),%xmm10 # 4510 <_sk_callback_sse41+0x1f5>
+ DB 68,15,40,21,115,62,0,0 ; movaps 0x3e73(%rip),%xmm10 # 4660 <_sk_callback_sse41+0x1f3>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -11381,7 +11496,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,249,59,0,0 ; movaps 0x3bf9(%rip),%xmm10 # 4520 <_sk_callback_sse41+0x205>
+ DB 68,15,40,21,73,61,0,0 ; movaps 0x3d49(%rip),%xmm10 # 4670 <_sk_callback_sse41+0x203>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -11463,7 +11578,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,219,58,0,0 ; movaps 0x3adb(%rip),%xmm10 # 4530 <_sk_callback_sse41+0x215>
+ DB 68,15,40,21,43,60,0,0 ; movaps 0x3c2b(%rip),%xmm10 # 4680 <_sk_callback_sse41+0x213>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -11547,7 +11662,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,174,57,0,0 ; movaps 0x39ae(%rip),%xmm1 # 4540 <_sk_callback_sse41+0x225>
+ DB 15,40,13,254,58,0,0 ; movaps 0x3afe(%rip),%xmm1 # 4690 <_sk_callback_sse41+0x223>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -11560,10 +11675,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,140,57,0,0 ; movaps 0x398c(%rip),%xmm13 # 4550 <_sk_callback_sse41+0x235>
+ DB 68,15,40,45,220,58,0,0 ; movaps 0x3adc(%rip),%xmm13 # 46a0 <_sk_callback_sse41+0x233>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,140,57,0,0 ; movaps 0x398c(%rip),%xmm12 # 4560 <_sk_callback_sse41+0x245>
+ DB 68,15,40,37,220,58,0,0 ; movaps 0x3adc(%rip),%xmm12 # 46b0 <_sk_callback_sse41+0x243>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -11698,563 +11813,649 @@ _sk_softlight_sse41 LABEL PROC
PUBLIC _sk_hue_sse41
_sk_hue_sse41 LABEL PROC
- DB 72,131,236,40 ; sub $0x28,%rsp
- DB 15,41,124,36,16 ; movaps %xmm7,0x10(%rsp)
- DB 68,15,40,214 ; movaps %xmm6,%xmm10
- DB 68,15,40,229 ; movaps %xmm5,%xmm12
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 69,15,87,246 ; xorps %xmm14,%xmm14
- DB 68,15,40,45,149,55,0,0 ; movaps 0x3795(%rip),%xmm13 # 4570 <_sk_callback_sse41+0x255>
- DB 65,15,40,221 ; movaps %xmm13,%xmm3
- DB 15,94,222 ; divps %xmm6,%xmm3
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 65,15,194,198,4 ; cmpneqps %xmm14,%xmm0
- DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,89,192 ; mulps %xmm0,%xmm8
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,89,194 ; mulps %xmm2,%xmm0
- DB 69,15,40,204 ; movaps %xmm12,%xmm9
- DB 69,15,40,220 ; movaps %xmm12,%xmm11
- DB 65,15,40,228 ; movaps %xmm12,%xmm4
- DB 65,15,40,234 ; movaps %xmm10,%xmm5
- DB 15,95,229 ; maxps %xmm5,%xmm4
- DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 68,15,40,215 ; movaps %xmm7,%xmm10
- DB 15,40,223 ; movaps %xmm7,%xmm3
- DB 15,95,220 ; maxps %xmm4,%xmm3
- DB 68,15,93,205 ; minps %xmm5,%xmm9
- DB 15,41,44,36 ; movaps %xmm5,(%rsp)
- DB 65,15,93,209 ; minps %xmm9,%xmm2
- DB 15,92,218 ; subps %xmm2,%xmm3
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,93,208 ; minps %xmm0,%xmm2
- DB 65,15,40,224 ; movaps %xmm8,%xmm4
- DB 15,93,226 ; minps %xmm2,%xmm4
- DB 68,15,40,201 ; movaps %xmm1,%xmm9
- DB 68,15,95,200 ; maxps %xmm0,%xmm9
- DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 65,15,95,209 ; maxps %xmm9,%xmm2
- DB 15,92,212 ; subps %xmm4,%xmm2
- DB 68,15,92,196 ; subps %xmm4,%xmm8
- DB 68,15,89,195 ; mulps %xmm3,%xmm8
- DB 68,15,94,194 ; divps %xmm2,%xmm8
- DB 15,92,204 ; subps %xmm4,%xmm1
- DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,94,202 ; divps %xmm2,%xmm1
- DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,94,194 ; divps %xmm2,%xmm0
- DB 65,15,194,214,4 ; cmpneqps %xmm14,%xmm2
- DB 68,15,84,194 ; andps %xmm2,%xmm8
- DB 15,84,202 ; andps %xmm2,%xmm1
- DB 15,84,194 ; andps %xmm2,%xmm0
- DB 68,15,40,13,5,55,0,0 ; movaps 0x3705(%rip),%xmm9 # 4580 <_sk_callback_sse41+0x265>
- DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 15,40,29,10,55,0,0 ; movaps 0x370a(%rip),%xmm3 # 4590 <_sk_callback_sse41+0x275>
- DB 68,15,89,219 ; mulps %xmm3,%xmm11
- DB 69,15,88,218 ; addps %xmm10,%xmm11
- DB 68,15,40,53,10,55,0,0 ; movaps 0x370a(%rip),%xmm14 # 45a0 <_sk_callback_sse41+0x285>
- DB 68,15,40,253 ; movaps %xmm5,%xmm15
+ DB 72,131,236,104 ; sub $0x68,%rsp
+ DB 15,41,60,36 ; movaps %xmm7,(%rsp)
+ DB 68,15,40,246 ; movaps %xmm6,%xmm14
+ DB 15,40,244 ; movaps %xmm4,%xmm6
+ DB 68,15,40,195 ; movaps %xmm3,%xmm8
+ DB 15,41,84,36,80 ; movaps %xmm2,0x50(%rsp)
+ DB 15,41,76,36,64 ; movaps %xmm1,0x40(%rsp)
+ DB 68,15,40,208 ; movaps %xmm0,%xmm10
+ DB 68,15,41,84,36,48 ; movaps %xmm10,0x30(%rsp)
+ DB 69,15,89,208 ; mulps %xmm8,%xmm10
+ DB 65,15,89,200 ; mulps %xmm8,%xmm1
+ DB 68,15,40,234 ; movaps %xmm2,%xmm13
+ DB 69,15,89,232 ; mulps %xmm8,%xmm13
+ DB 68,15,40,205 ; movaps %xmm5,%xmm9
+ DB 68,15,40,221 ; movaps %xmm5,%xmm11
+ DB 15,41,108,36,32 ; movaps %xmm5,0x20(%rsp)
+ DB 69,15,95,222 ; maxps %xmm14,%xmm11
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 68,15,40,230 ; movaps %xmm6,%xmm12
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 65,15,95,211 ; maxps %xmm11,%xmm2
+ DB 65,15,40,230 ; movaps %xmm14,%xmm4
+ DB 15,41,100,36,16 ; movaps %xmm4,0x10(%rsp)
+ DB 68,15,93,204 ; minps %xmm4,%xmm9
+ DB 65,15,93,249 ; minps %xmm9,%xmm7
+ DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,40,249 ; movaps %xmm1,%xmm7
+ DB 65,15,93,253 ; minps %xmm13,%xmm7
+ DB 65,15,40,218 ; movaps %xmm10,%xmm3
+ DB 15,93,223 ; minps %xmm7,%xmm3
+ DB 15,40,249 ; movaps %xmm1,%xmm7
+ DB 65,15,95,253 ; maxps %xmm13,%xmm7
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 15,95,199 ; maxps %xmm7,%xmm0
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 68,15,92,211 ; subps %xmm3,%xmm10
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 68,15,92,235 ; subps %xmm3,%xmm13
+ DB 15,87,219 ; xorps %xmm3,%xmm3
+ DB 68,15,89,210 ; mulps %xmm2,%xmm10
+ DB 68,15,94,208 ; divps %xmm0,%xmm10
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,94,200 ; divps %xmm0,%xmm1
+ DB 68,15,89,234 ; mulps %xmm2,%xmm13
+ DB 68,15,94,232 ; divps %xmm0,%xmm13
+ DB 15,194,195,4 ; cmpneqps %xmm3,%xmm0
+ DB 68,15,84,208 ; andps %xmm0,%xmm10
+ DB 15,84,200 ; andps %xmm0,%xmm1
+ DB 68,15,84,232 ; andps %xmm0,%xmm13
+ DB 15,40,5,66,56,0,0 ; movaps 0x3842(%rip),%xmm0 # 46c0 <_sk_callback_sse41+0x253>
+ DB 68,15,89,224 ; mulps %xmm0,%xmm12
+ DB 15,40,21,71,56,0,0 ; movaps 0x3847(%rip),%xmm2 # 46d0 <_sk_callback_sse41+0x263>
+ DB 15,89,250 ; mulps %xmm2,%xmm7
+ DB 65,15,88,252 ; addps %xmm12,%xmm7
+ DB 68,15,40,53,72,56,0,0 ; movaps 0x3848(%rip),%xmm14 # 46e0 <_sk_callback_sse41+0x273>
+ DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
- DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 65,15,40,224 ; movaps %xmm8,%xmm4
- DB 65,15,89,225 ; mulps %xmm9,%xmm4
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,89,211 ; mulps %xmm3,%xmm2
- DB 15,88,212 ; addps %xmm4,%xmm2
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 65,15,89,230 ; mulps %xmm14,%xmm4
- DB 15,88,226 ; addps %xmm2,%xmm4
- DB 68,15,92,252 ; subps %xmm4,%xmm15
- DB 69,15,88,199 ; addps %xmm15,%xmm8
+ DB 68,15,88,255 ; addps %xmm7,%xmm15
+ DB 65,15,40,218 ; movaps %xmm10,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,40,249 ; movaps %xmm1,%xmm7
+ DB 15,89,250 ; mulps %xmm2,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 65,15,40,221 ; movaps %xmm13,%xmm3
+ DB 65,15,89,222 ; mulps %xmm14,%xmm3
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 69,15,89,248 ; mulps %xmm8,%xmm15
+ DB 68,15,92,251 ; subps %xmm3,%xmm15
+ DB 69,15,88,215 ; addps %xmm15,%xmm10
DB 65,15,88,207 ; addps %xmm15,%xmm1
- DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 65,15,93,199 ; minps %xmm15,%xmm0
- DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 15,93,208 ; minps %xmm0,%xmm2
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 65,15,95,231 ; maxps %xmm15,%xmm4
- DB 69,15,89,200 ; mulps %xmm8,%xmm9
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 65,15,88,217 ; addps %xmm9,%xmm3
+ DB 69,15,88,253 ; addps %xmm13,%xmm15
+ DB 15,40,217 ; movaps %xmm1,%xmm3
+ DB 65,15,93,223 ; minps %xmm15,%xmm3
+ DB 65,15,40,250 ; movaps %xmm10,%xmm7
+ DB 15,93,251 ; minps %xmm3,%xmm7
+ DB 65,15,89,194 ; mulps %xmm10,%xmm0
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
DB 69,15,89,247 ; mulps %xmm15,%xmm14
- DB 68,15,88,243 ; addps %xmm3,%xmm14
- DB 15,87,237 ; xorps %xmm5,%xmm5
- DB 15,194,234,2 ; cmpleps %xmm2,%xmm5
- DB 69,15,40,200 ; movaps %xmm8,%xmm9
- DB 69,15,92,206 ; subps %xmm14,%xmm9
- DB 69,15,89,206 ; mulps %xmm14,%xmm9
+ DB 68,15,88,242 ; addps %xmm2,%xmm14
+ DB 69,15,87,201 ; xorps %xmm9,%xmm9
+ DB 68,15,194,207,2 ; cmpleps %xmm7,%xmm9
DB 65,15,40,222 ; movaps %xmm14,%xmm3
- DB 15,92,218 ; subps %xmm2,%xmm3
- DB 68,15,94,203 ; divps %xmm3,%xmm9
- DB 69,15,88,206 ; addps %xmm14,%xmm9
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 102,69,15,56,20,200 ; blendvps %xmm0,%xmm8,%xmm9
- DB 68,15,95,196 ; maxps %xmm4,%xmm8
- DB 69,15,40,213 ; movaps %xmm13,%xmm10
- DB 69,15,194,208,1 ; cmpltps %xmm8,%xmm10
- DB 65,15,40,209 ; movaps %xmm9,%xmm2
- DB 65,15,92,214 ; subps %xmm14,%xmm2
+ DB 15,92,223 ; subps %xmm7,%xmm3
+ DB 69,15,40,234 ; movaps %xmm10,%xmm13
DB 69,15,92,238 ; subps %xmm14,%xmm13
- DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 69,15,92,198 ; subps %xmm14,%xmm8
- DB 65,15,94,208 ; divps %xmm8,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
- DB 65,15,40,194 ; movaps %xmm10,%xmm0
- DB 102,68,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm9
- DB 68,15,40,217 ; movaps %xmm1,%xmm11
+ DB 69,15,89,238 ; mulps %xmm14,%xmm13
+ DB 68,15,94,235 ; divps %xmm3,%xmm13
+ DB 69,15,88,238 ; addps %xmm14,%xmm13
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,69,15,56,20,234 ; blendvps %xmm0,%xmm10,%xmm13
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 65,15,95,199 ; maxps %xmm15,%xmm0
+ DB 68,15,95,208 ; maxps %xmm0,%xmm10
+ DB 65,15,40,248 ; movaps %xmm8,%xmm7
+ DB 15,40,44,36 ; movaps (%rsp),%xmm5
+ DB 15,89,253 ; mulps %xmm5,%xmm7
+ DB 15,40,231 ; movaps %xmm7,%xmm4
+ DB 65,15,194,226,1 ; cmpltps %xmm10,%xmm4
+ DB 65,15,40,213 ; movaps %xmm13,%xmm2
+ DB 65,15,92,214 ; subps %xmm14,%xmm2
+ DB 68,15,40,223 ; movaps %xmm7,%xmm11
DB 69,15,92,222 ; subps %xmm14,%xmm11
- DB 69,15,89,222 ; mulps %xmm14,%xmm11
- DB 68,15,94,219 ; divps %xmm3,%xmm11
- DB 69,15,88,222 ; addps %xmm14,%xmm11
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 102,68,15,56,20,217 ; blendvps %xmm0,%xmm1,%xmm11
- DB 65,15,40,203 ; movaps %xmm11,%xmm1
+ DB 65,15,89,211 ; mulps %xmm11,%xmm2
+ DB 69,15,92,214 ; subps %xmm14,%xmm10
+ DB 65,15,94,210 ; divps %xmm10,%xmm2
+ DB 65,15,88,214 ; addps %xmm14,%xmm2
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 102,68,15,56,20,234 ; blendvps %xmm0,%xmm2,%xmm13
+ DB 68,15,40,225 ; movaps %xmm1,%xmm12
+ DB 69,15,92,230 ; subps %xmm14,%xmm12
+ DB 69,15,89,230 ; mulps %xmm14,%xmm12
+ DB 68,15,94,227 ; divps %xmm3,%xmm12
+ DB 69,15,88,230 ; addps %xmm14,%xmm12
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,68,15,56,20,225 ; blendvps %xmm0,%xmm1,%xmm12
+ DB 65,15,40,204 ; movaps %xmm12,%xmm1
DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 65,15,89,205 ; mulps %xmm13,%xmm1
- DB 65,15,94,200 ; divps %xmm8,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 65,15,40,194 ; movaps %xmm10,%xmm0
- DB 102,68,15,56,20,217 ; blendvps %xmm0,%xmm1,%xmm11
- DB 65,15,40,215 ; movaps %xmm15,%xmm2
- DB 65,15,92,214 ; subps %xmm14,%xmm2
- DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 15,94,211 ; divps %xmm3,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 102,65,15,56,20,215 ; blendvps %xmm0,%xmm15,%xmm2
- DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 102,68,15,56,20,225 ; blendvps %xmm0,%xmm1,%xmm12
+ DB 65,15,40,207 ; movaps %xmm15,%xmm1
DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 65,15,89,205 ; mulps %xmm13,%xmm1
- DB 65,15,94,200 ; divps %xmm8,%xmm1
+ DB 65,15,89,206 ; mulps %xmm14,%xmm1
+ DB 15,94,203 ; divps %xmm3,%xmm1
DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 65,15,40,194 ; movaps %xmm10,%xmm0
- DB 102,15,56,20,209 ; blendvps %xmm0,%xmm1,%xmm2
- DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 68,15,95,200 ; maxps %xmm0,%xmm9
- DB 68,15,95,216 ; maxps %xmm0,%xmm11
- DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 68,15,40,198 ; movaps %xmm6,%xmm8
- DB 68,15,40,84,36,16 ; movaps 0x10(%rsp),%xmm10
- DB 69,15,88,194 ; addps %xmm10,%xmm8
- DB 65,15,89,242 ; mulps %xmm10,%xmm6
- DB 68,15,92,198 ; subps %xmm6,%xmm8
- DB 69,15,89,200 ; mulps %xmm8,%xmm9
- DB 69,15,89,216 ; mulps %xmm8,%xmm11
- DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,231 ; movaps %xmm7,%xmm4
- DB 65,15,40,236 ; movaps %xmm12,%xmm5
- DB 15,40,52,36 ; movaps (%rsp),%xmm6
DB 65,15,40,193 ; movaps %xmm9,%xmm0
- DB 65,15,40,203 ; movaps %xmm11,%xmm1
+ DB 102,65,15,56,20,207 ; blendvps %xmm0,%xmm15,%xmm1
+ DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 65,15,92,214 ; subps %xmm14,%xmm2
+ DB 65,15,89,211 ; mulps %xmm11,%xmm2
+ DB 65,15,94,210 ; divps %xmm10,%xmm2
+ DB 65,15,88,214 ; addps %xmm14,%xmm2
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
+ DB 68,15,40,13,13,55,0,0 ; movaps 0x370d(%rip),%xmm9 # 46f0 <_sk_callback_sse41+0x283>
+ DB 65,15,40,225 ; movaps %xmm9,%xmm4
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,40,92,36,64 ; movaps 0x40(%rsp),%xmm3
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 15,89,100,36,80 ; mulps 0x50(%rsp),%xmm4
+ DB 69,15,92,200 ; subps %xmm8,%xmm9
+ DB 68,15,88,197 ; addps %xmm5,%xmm8
+ DB 68,15,40,213 ; movaps %xmm5,%xmm10
+ DB 68,15,92,199 ; subps %xmm7,%xmm8
+ DB 15,87,210 ; xorps %xmm2,%xmm2
+ DB 68,15,95,234 ; maxps %xmm2,%xmm13
+ DB 68,15,95,226 ; maxps %xmm2,%xmm12
+ DB 15,95,202 ; maxps %xmm2,%xmm1
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,88,194 ; addps %xmm2,%xmm0
+ DB 65,15,88,197 ; addps %xmm13,%xmm0
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 15,40,108,36,32 ; movaps 0x20(%rsp),%xmm5
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 65,15,88,220 ; addps %xmm12,%xmm3
+ DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 15,40,92,36,16 ; movaps 0x10(%rsp),%xmm3
+ DB 68,15,89,203 ; mulps %xmm3,%xmm9
+ DB 68,15,88,204 ; addps %xmm4,%xmm9
+ DB 68,15,88,201 ; addps %xmm1,%xmm9
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
DB 65,15,40,216 ; movaps %xmm8,%xmm3
DB 65,15,40,250 ; movaps %xmm10,%xmm7
- DB 72,131,196,40 ; add $0x28,%rsp
+ DB 72,131,196,104 ; add $0x68,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_saturation_sse41
_sk_saturation_sse41 LABEL PROC
- DB 72,131,236,40 ; sub $0x28,%rsp
- DB 68,15,40,214 ; movaps %xmm6,%xmm10
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 68,15,40,206 ; movaps %xmm6,%xmm9
+ DB 15,40,245 ; movaps %xmm5,%xmm6
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 15,40,227 ; movaps %xmm3,%xmm4
+ DB 15,41,76,36,48 ; movaps %xmm1,0x30(%rsp)
+ DB 15,41,68,36,32 ; movaps %xmm0,0x20(%rsp)
+ DB 68,15,40,212 ; movaps %xmm4,%xmm10
+ DB 68,15,89,213 ; mulps %xmm5,%xmm10
DB 68,15,40,220 ; movaps %xmm4,%xmm11
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 69,15,87,246 ; xorps %xmm14,%xmm14
- DB 68,15,40,37,124,53,0,0 ; movaps 0x357c(%rip),%xmm12 # 45b0 <_sk_callback_sse41+0x295>
- DB 65,15,40,220 ; movaps %xmm12,%xmm3
- DB 15,94,223 ; divps %xmm7,%xmm3
- DB 68,15,40,199 ; movaps %xmm7,%xmm8
- DB 69,15,194,198,4 ; cmpneqps %xmm14,%xmm8
- DB 68,15,84,195 ; andps %xmm3,%xmm8
- DB 69,15,40,200 ; movaps %xmm8,%xmm9
- DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 69,15,40,232 ; movaps %xmm8,%xmm13
- DB 68,15,89,237 ; mulps %xmm5,%xmm13
- DB 15,41,108,36,16 ; movaps %xmm5,0x10(%rsp)
- DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,41,20,36 ; movaps %xmm10,(%rsp)
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,95,226 ; maxps %xmm2,%xmm4
+ DB 68,15,89,222 ; mulps %xmm6,%xmm11
+ DB 68,15,40,196 ; movaps %xmm4,%xmm8
+ DB 69,15,89,193 ; mulps %xmm9,%xmm8
+ DB 69,15,40,241 ; movaps %xmm9,%xmm14
+ DB 68,15,41,116,36,16 ; movaps %xmm14,0x10(%rsp)
+ DB 15,40,217 ; movaps %xmm1,%xmm3
+ DB 68,15,40,202 ; movaps %xmm2,%xmm9
+ DB 68,15,41,76,36,64 ; movaps %xmm9,0x40(%rsp)
+ DB 65,15,95,217 ; maxps %xmm9,%xmm3
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,95,211 ; maxps %xmm3,%xmm2
+ DB 68,15,40,225 ; movaps %xmm1,%xmm12
+ DB 69,15,93,225 ; minps %xmm9,%xmm12
DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 15,95,220 ; maxps %xmm4,%xmm3
- DB 15,93,202 ; minps %xmm2,%xmm1
- DB 15,93,193 ; minps %xmm1,%xmm0
- DB 15,92,216 ; subps %xmm0,%xmm3
- DB 65,15,40,197 ; movaps %xmm13,%xmm0
+ DB 65,15,93,220 ; minps %xmm12,%xmm3
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,89,215 ; mulps %xmm7,%xmm2
+ DB 68,15,40,231 ; movaps %xmm7,%xmm12
+ DB 68,15,41,36,36 ; movaps %xmm12,(%rsp)
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,93,192 ; minps %xmm8,%xmm0
- DB 65,15,40,201 ; movaps %xmm9,%xmm1
- DB 15,93,200 ; minps %xmm0,%xmm1
- DB 65,15,40,197 ; movaps %xmm13,%xmm0
+ DB 65,15,40,218 ; movaps %xmm10,%xmm3
+ DB 15,93,216 ; minps %xmm0,%xmm3
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,95,192 ; maxps %xmm8,%xmm0
- DB 65,15,40,209 ; movaps %xmm9,%xmm2
- DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,92,209 ; subps %xmm1,%xmm2
- DB 68,15,92,201 ; subps %xmm1,%xmm9
- DB 68,15,89,203 ; mulps %xmm3,%xmm9
- DB 68,15,94,202 ; divps %xmm2,%xmm9
- DB 68,15,92,233 ; subps %xmm1,%xmm13
- DB 68,15,89,235 ; mulps %xmm3,%xmm13
- DB 68,15,94,234 ; divps %xmm2,%xmm13
- DB 68,15,92,193 ; subps %xmm1,%xmm8
- DB 68,15,89,195 ; mulps %xmm3,%xmm8
- DB 68,15,94,194 ; divps %xmm2,%xmm8
- DB 65,15,194,214,4 ; cmpneqps %xmm14,%xmm2
- DB 68,15,84,202 ; andps %xmm2,%xmm9
- DB 68,15,84,234 ; andps %xmm2,%xmm13
- DB 68,15,84,194 ; andps %xmm2,%xmm8
- DB 15,40,13,232,52,0,0 ; movaps 0x34e8(%rip),%xmm1 # 45c0 <_sk_callback_sse41+0x2a5>
- DB 65,15,40,211 ; movaps %xmm11,%xmm2
- DB 15,89,209 ; mulps %xmm1,%xmm2
- DB 15,40,5,234,52,0,0 ; movaps 0x34ea(%rip),%xmm0 # 45d0 <_sk_callback_sse41+0x2b5>
+ DB 65,15,40,250 ; movaps %xmm10,%xmm7
+ DB 15,95,248 ; maxps %xmm0,%xmm7
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 68,15,92,211 ; subps %xmm3,%xmm10
+ DB 68,15,89,210 ; mulps %xmm2,%xmm10
+ DB 68,15,94,215 ; divps %xmm7,%xmm10
+ DB 68,15,92,219 ; subps %xmm3,%xmm11
+ DB 68,15,89,218 ; mulps %xmm2,%xmm11
+ DB 68,15,94,223 ; divps %xmm7,%xmm11
+ DB 68,15,92,195 ; subps %xmm3,%xmm8
+ DB 68,15,89,194 ; mulps %xmm2,%xmm8
+ DB 68,15,94,199 ; divps %xmm7,%xmm8
+ DB 15,194,248,4 ; cmpneqps %xmm0,%xmm7
+ DB 68,15,84,215 ; andps %xmm7,%xmm10
+ DB 68,15,84,223 ; andps %xmm7,%xmm11
+ DB 68,15,84,199 ; andps %xmm7,%xmm8
+ DB 15,40,21,192,53,0,0 ; movaps 0x35c0(%rip),%xmm2 # 4700 <_sk_callback_sse41+0x293>
DB 15,40,221 ; movaps %xmm5,%xmm3
- DB 15,89,216 ; mulps %xmm0,%xmm3
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,53,233,52,0,0 ; movaps 0x34e9(%rip),%xmm14 # 45e0 <_sk_callback_sse41+0x2c5>
- DB 69,15,40,250 ; movaps %xmm10,%xmm15
- DB 69,15,89,254 ; mulps %xmm14,%xmm15
- DB 68,15,88,251 ; addps %xmm3,%xmm15
- DB 65,15,40,209 ; movaps %xmm9,%xmm2
- DB 15,89,209 ; mulps %xmm1,%xmm2
- DB 65,15,40,221 ; movaps %xmm13,%xmm3
- DB 15,89,216 ; mulps %xmm0,%xmm3
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 15,88,211 ; addps %xmm3,%xmm2
- DB 68,15,92,250 ; subps %xmm2,%xmm15
- DB 69,15,88,207 ; addps %xmm15,%xmm9
- DB 69,15,88,239 ; addps %xmm15,%xmm13
- DB 69,15,88,248 ; addps %xmm8,%xmm15
- DB 65,15,40,213 ; movaps %xmm13,%xmm2
- DB 65,15,93,215 ; minps %xmm15,%xmm2
- DB 65,15,40,225 ; movaps %xmm9,%xmm4
- DB 15,93,226 ; minps %xmm2,%xmm4
- DB 65,15,40,213 ; movaps %xmm13,%xmm2
- DB 65,15,95,215 ; maxps %xmm15,%xmm2
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 65,15,89,197 ; mulps %xmm13,%xmm0
- DB 15,88,193 ; addps %xmm1,%xmm0
- DB 69,15,89,247 ; mulps %xmm15,%xmm14
- DB 68,15,88,240 ; addps %xmm0,%xmm14
- DB 15,87,237 ; xorps %xmm5,%xmm5
- DB 15,194,236,2 ; cmpleps %xmm4,%xmm5
- DB 69,15,40,209 ; movaps %xmm9,%xmm10
- DB 69,15,92,214 ; subps %xmm14,%xmm10
- DB 69,15,89,214 ; mulps %xmm14,%xmm10
- DB 65,15,40,222 ; movaps %xmm14,%xmm3
- DB 15,92,220 ; subps %xmm4,%xmm3
- DB 68,15,94,211 ; divps %xmm3,%xmm10
+ DB 15,89,218 ; mulps %xmm2,%xmm3
+ DB 15,40,13,195,53,0,0 ; movaps 0x35c3(%rip),%xmm1 # 4710 <_sk_callback_sse41+0x2a3>
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 68,15,40,45,194,53,0,0 ; movaps 0x35c2(%rip),%xmm13 # 4720 <_sk_callback_sse41+0x2b3>
+ DB 69,15,89,245 ; mulps %xmm13,%xmm14
+ DB 68,15,88,247 ; addps %xmm7,%xmm14
+ DB 65,15,40,218 ; movaps %xmm10,%xmm3
+ DB 15,89,218 ; mulps %xmm2,%xmm3
+ DB 65,15,40,251 ; movaps %xmm11,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 65,15,40,216 ; movaps %xmm8,%xmm3
+ DB 65,15,89,221 ; mulps %xmm13,%xmm3
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 68,15,89,244 ; mulps %xmm4,%xmm14
+ DB 68,15,92,243 ; subps %xmm3,%xmm14
DB 69,15,88,214 ; addps %xmm14,%xmm10
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
- DB 68,15,95,202 ; maxps %xmm2,%xmm9
- DB 69,15,40,196 ; movaps %xmm12,%xmm8
- DB 69,15,194,193,1 ; cmpltps %xmm9,%xmm8
- DB 65,15,40,202 ; movaps %xmm10,%xmm1
- DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 69,15,92,230 ; subps %xmm14,%xmm12
- DB 65,15,89,204 ; mulps %xmm12,%xmm1
- DB 69,15,92,206 ; subps %xmm14,%xmm9
- DB 65,15,94,201 ; divps %xmm9,%xmm1
- DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 65,15,40,192 ; movaps %xmm8,%xmm0
- DB 102,68,15,56,20,209 ; blendvps %xmm0,%xmm1,%xmm10
- DB 65,15,40,205 ; movaps %xmm13,%xmm1
- DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 65,15,89,206 ; mulps %xmm14,%xmm1
- DB 15,94,203 ; divps %xmm3,%xmm1
- DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 102,65,15,56,20,205 ; blendvps %xmm0,%xmm13,%xmm1
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 65,15,92,214 ; subps %xmm14,%xmm2
+ DB 69,15,88,222 ; addps %xmm14,%xmm11
+ DB 69,15,88,240 ; addps %xmm8,%xmm14
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
+ DB 65,15,93,198 ; minps %xmm14,%xmm0
+ DB 65,15,40,218 ; movaps %xmm10,%xmm3
+ DB 15,93,216 ; minps %xmm0,%xmm3
+ DB 65,15,89,210 ; mulps %xmm10,%xmm2
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 69,15,89,238 ; mulps %xmm14,%xmm13
+ DB 68,15,88,233 ; addps %xmm1,%xmm13
+ DB 69,15,87,201 ; xorps %xmm9,%xmm9
+ DB 68,15,194,203,2 ; cmpleps %xmm3,%xmm9
+ DB 65,15,40,253 ; movaps %xmm13,%xmm7
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 69,15,40,250 ; movaps %xmm10,%xmm15
+ DB 69,15,92,253 ; subps %xmm13,%xmm15
+ DB 69,15,89,253 ; mulps %xmm13,%xmm15
+ DB 68,15,94,255 ; divps %xmm7,%xmm15
+ DB 69,15,88,253 ; addps %xmm13,%xmm15
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,69,15,56,20,250 ; blendvps %xmm0,%xmm10,%xmm15
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
+ DB 65,15,95,198 ; maxps %xmm14,%xmm0
+ DB 68,15,95,208 ; maxps %xmm0,%xmm10
+ DB 15,40,212 ; movaps %xmm4,%xmm2
DB 65,15,89,212 ; mulps %xmm12,%xmm2
- DB 65,15,94,209 ; divps %xmm9,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
+ DB 68,15,40,194 ; movaps %xmm2,%xmm8
+ DB 69,15,194,194,1 ; cmpltps %xmm10,%xmm8
+ DB 65,15,40,223 ; movaps %xmm15,%xmm3
+ DB 65,15,92,221 ; subps %xmm13,%xmm3
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 65,15,92,205 ; subps %xmm13,%xmm1
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 69,15,92,213 ; subps %xmm13,%xmm10
+ DB 65,15,94,218 ; divps %xmm10,%xmm3
+ DB 65,15,88,221 ; addps %xmm13,%xmm3
DB 65,15,40,192 ; movaps %xmm8,%xmm0
- DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 65,15,40,215 ; movaps %xmm15,%xmm2
- DB 65,15,92,214 ; subps %xmm14,%xmm2
- DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 15,94,211 ; divps %xmm3,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 102,65,15,56,20,215 ; blendvps %xmm0,%xmm15,%xmm2
- DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 65,15,92,222 ; subps %xmm14,%xmm3
- DB 65,15,89,220 ; mulps %xmm12,%xmm3
- DB 65,15,94,217 ; divps %xmm9,%xmm3
- DB 65,15,88,222 ; addps %xmm14,%xmm3
+ DB 102,68,15,56,20,251 ; blendvps %xmm0,%xmm3,%xmm15
+ DB 69,15,40,227 ; movaps %xmm11,%xmm12
+ DB 69,15,92,229 ; subps %xmm13,%xmm12
+ DB 69,15,89,229 ; mulps %xmm13,%xmm12
+ DB 68,15,94,231 ; divps %xmm7,%xmm12
+ DB 69,15,88,229 ; addps %xmm13,%xmm12
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,69,15,56,20,227 ; blendvps %xmm0,%xmm11,%xmm12
+ DB 65,15,40,220 ; movaps %xmm12,%xmm3
+ DB 65,15,92,221 ; subps %xmm13,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 65,15,94,218 ; divps %xmm10,%xmm3
+ DB 65,15,88,221 ; addps %xmm13,%xmm3
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 102,68,15,56,20,227 ; blendvps %xmm0,%xmm3,%xmm12
+ DB 69,15,40,222 ; movaps %xmm14,%xmm11
+ DB 69,15,92,221 ; subps %xmm13,%xmm11
+ DB 69,15,89,221 ; mulps %xmm13,%xmm11
+ DB 68,15,94,223 ; divps %xmm7,%xmm11
+ DB 69,15,88,221 ; addps %xmm13,%xmm11
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,69,15,56,20,222 ; blendvps %xmm0,%xmm14,%xmm11
+ DB 65,15,40,251 ; movaps %xmm11,%xmm7
+ DB 65,15,92,253 ; subps %xmm13,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 65,15,94,250 ; divps %xmm10,%xmm7
+ DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
- DB 102,15,56,20,211 ; blendvps %xmm0,%xmm3,%xmm2
+ DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
+ DB 68,15,40,13,136,52,0,0 ; movaps 0x3488(%rip),%xmm9 # 4730 <_sk_callback_sse41+0x2c3>
+ DB 69,15,40,193 ; movaps %xmm9,%xmm8
+ DB 68,15,92,204 ; subps %xmm4,%xmm9
+ DB 15,40,60,36 ; movaps (%rsp),%xmm7
+ DB 15,88,231 ; addps %xmm7,%xmm4
+ DB 15,92,226 ; subps %xmm2,%xmm4
+ DB 15,40,220 ; movaps %xmm4,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 68,15,95,208 ; maxps %xmm0,%xmm10
- DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 68,15,40,198 ; movaps %xmm6,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 68,15,92,198 ; subps %xmm6,%xmm8
- DB 69,15,89,208 ; mulps %xmm8,%xmm10
- DB 65,15,89,200 ; mulps %xmm8,%xmm1
+ DB 68,15,95,248 ; maxps %xmm0,%xmm15
+ DB 68,15,95,224 ; maxps %xmm0,%xmm12
+ DB 68,15,95,216 ; maxps %xmm0,%xmm11
+ DB 65,15,40,201 ; movaps %xmm9,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 68,15,92,199 ; subps %xmm7,%xmm8
+ DB 15,40,68,36,32 ; movaps 0x20(%rsp),%xmm0
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 65,15,88,199 ; addps %xmm15,%xmm0
+ DB 65,15,40,201 ; movaps %xmm9,%xmm1
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,40,84,36,48 ; movaps 0x30(%rsp),%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 15,88,209 ; addps %xmm1,%xmm2
+ DB 65,15,88,212 ; addps %xmm12,%xmm2
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 68,15,89,68,36,64 ; mulps 0x40(%rsp),%xmm8
+ DB 15,40,84,36,16 ; movaps 0x10(%rsp),%xmm2
+ DB 68,15,89,202 ; mulps %xmm2,%xmm9
+ DB 69,15,88,200 ; addps %xmm8,%xmm9
+ DB 69,15,88,203 ; addps %xmm11,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 65,15,40,227 ; movaps %xmm11,%xmm4
- DB 15,40,108,36,16 ; movaps 0x10(%rsp),%xmm5
- DB 15,40,52,36 ; movaps (%rsp),%xmm6
- DB 65,15,40,194 ; movaps %xmm10,%xmm0
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
- DB 72,131,196,40 ; add $0x28,%rsp
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,40,238 ; movaps %xmm6,%xmm5
+ DB 15,40,242 ; movaps %xmm2,%xmm6
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_color_sse41
_sk_color_sse41 LABEL PROC
- DB 72,131,236,40 ; sub $0x28,%rsp
- DB 15,41,52,36 ; movaps %xmm6,(%rsp)
+ DB 72,131,236,72 ; sub $0x48,%rsp
+ DB 68,15,40,230 ; movaps %xmm6,%xmm12
+ DB 68,15,41,100,36,16 ; movaps %xmm12,0x10(%rsp)
DB 68,15,40,221 ; movaps %xmm5,%xmm11
- DB 68,15,41,92,36,16 ; movaps %xmm11,0x10(%rsp)
- DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,40,227 ; movaps %xmm3,%xmm4
+ DB 68,15,41,92,36,32 ; movaps %xmm11,0x20(%rsp)
+ DB 68,15,40,212 ; movaps %xmm4,%xmm10
+ DB 68,15,41,84,36,48 ; movaps %xmm10,0x30(%rsp)
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,41,20,36 ; movaps %xmm2,(%rsp)
+ DB 15,40,233 ; movaps %xmm1,%xmm5
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 69,15,87,201 ; xorps %xmm9,%xmm9
- DB 68,15,40,45,92,51,0,0 ; movaps 0x335c(%rip),%xmm13 # 45f0 <_sk_callback_sse41+0x2d5>
- DB 65,15,40,197 ; movaps %xmm13,%xmm0
- DB 15,94,196 ; divps %xmm4,%xmm0
- DB 65,15,194,217,4 ; cmpneqps %xmm9,%xmm3
- DB 15,84,216 ; andps %xmm0,%xmm3
- DB 68,15,89,195 ; mulps %xmm3,%xmm8
- DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 68,15,40,13,75,51,0,0 ; movaps 0x334b(%rip),%xmm9 # 4600 <_sk_callback_sse41+0x2e5>
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 65,15,89,209 ; mulps %xmm9,%xmm2
- DB 68,15,40,21,76,51,0,0 ; movaps 0x334c(%rip),%xmm10 # 4610 <_sk_callback_sse41+0x2f5>
- DB 69,15,89,218 ; mulps %xmm10,%xmm11
- DB 68,15,88,218 ; addps %xmm2,%xmm11
- DB 68,15,40,53,76,51,0,0 ; movaps 0x334c(%rip),%xmm14 # 4620 <_sk_callback_sse41+0x305>
- DB 68,15,40,254 ; movaps %xmm6,%xmm15
- DB 69,15,89,254 ; mulps %xmm14,%xmm15
- DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 65,15,40,192 ; movaps %xmm8,%xmm0
- DB 65,15,89,193 ; mulps %xmm9,%xmm0
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 65,15,89,210 ; mulps %xmm10,%xmm2
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 65,15,89,198 ; mulps %xmm14,%xmm0
- DB 15,88,194 ; addps %xmm2,%xmm0
- DB 68,15,92,248 ; subps %xmm0,%xmm15
- DB 69,15,88,199 ; addps %xmm15,%xmm8
- DB 65,15,88,207 ; addps %xmm15,%xmm1
- DB 68,15,88,251 ; addps %xmm3,%xmm15
+ DB 69,15,40,240 ; movaps %xmm8,%xmm14
+ DB 15,40,231 ; movaps %xmm7,%xmm4
+ DB 68,15,89,244 ; mulps %xmm4,%xmm14
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 68,15,40,13,205,51,0,0 ; movaps 0x33cd(%rip),%xmm9 # 4740 <_sk_callback_sse41+0x2d3>
+ DB 65,15,40,250 ; movaps %xmm10,%xmm7
+ DB 65,15,89,249 ; mulps %xmm9,%xmm7
+ DB 68,15,40,21,205,51,0,0 ; movaps 0x33cd(%rip),%xmm10 # 4750 <_sk_callback_sse41+0x2e3>
+ DB 65,15,40,219 ; movaps %xmm11,%xmm3
+ DB 65,15,89,218 ; mulps %xmm10,%xmm3
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 68,15,40,29,202,51,0,0 ; movaps 0x33ca(%rip),%xmm11 # 4760 <_sk_callback_sse41+0x2f3>
+ DB 69,15,40,236 ; movaps %xmm12,%xmm13
+ DB 69,15,89,235 ; mulps %xmm11,%xmm13
+ DB 68,15,88,235 ; addps %xmm3,%xmm13
+ DB 65,15,40,222 ; movaps %xmm14,%xmm3
+ DB 65,15,89,217 ; mulps %xmm9,%xmm3
+ DB 15,40,249 ; movaps %xmm1,%xmm7
+ DB 65,15,89,250 ; mulps %xmm10,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 65,15,89,219 ; mulps %xmm11,%xmm3
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 68,15,89,238 ; mulps %xmm6,%xmm13
+ DB 68,15,92,235 ; subps %xmm3,%xmm13
+ DB 69,15,88,245 ; addps %xmm13,%xmm14
+ DB 65,15,88,205 ; addps %xmm13,%xmm1
+ DB 68,15,88,232 ; addps %xmm0,%xmm13
DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 65,15,93,199 ; minps %xmm15,%xmm0
- DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 15,93,208 ; minps %xmm0,%xmm2
- DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 65,15,95,247 ; maxps %xmm15,%xmm6
- DB 69,15,89,200 ; mulps %xmm8,%xmm9
+ DB 65,15,93,197 ; minps %xmm13,%xmm0
+ DB 65,15,40,222 ; movaps %xmm14,%xmm3
+ DB 15,93,216 ; minps %xmm0,%xmm3
+ DB 69,15,89,206 ; mulps %xmm14,%xmm9
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 69,15,88,209 ; addps %xmm9,%xmm10
+ DB 69,15,89,221 ; mulps %xmm13,%xmm11
+ DB 69,15,88,218 ; addps %xmm10,%xmm11
+ DB 69,15,87,201 ; xorps %xmm9,%xmm9
+ DB 68,15,194,203,2 ; cmpleps %xmm3,%xmm9
+ DB 69,15,40,230 ; movaps %xmm14,%xmm12
+ DB 69,15,92,227 ; subps %xmm11,%xmm12
+ DB 69,15,89,227 ; mulps %xmm11,%xmm12
+ DB 65,15,40,251 ; movaps %xmm11,%xmm7
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 68,15,94,231 ; divps %xmm7,%xmm12
+ DB 69,15,88,227 ; addps %xmm11,%xmm12
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,69,15,56,20,230 ; blendvps %xmm0,%xmm14,%xmm12
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 65,15,95,197 ; maxps %xmm13,%xmm0
+ DB 65,15,40,214 ; movaps %xmm14,%xmm2
+ DB 15,95,208 ; maxps %xmm0,%xmm2
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 68,15,40,211 ; movaps %xmm3,%xmm10
+ DB 68,15,194,210,1 ; cmpltps %xmm2,%xmm10
+ DB 69,15,40,244 ; movaps %xmm12,%xmm14
+ DB 69,15,92,243 ; subps %xmm11,%xmm14
+ DB 68,15,40,251 ; movaps %xmm3,%xmm15
+ DB 69,15,92,251 ; subps %xmm11,%xmm15
DB 69,15,89,247 ; mulps %xmm15,%xmm14
- DB 69,15,88,242 ; addps %xmm10,%xmm14
- DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
- DB 69,15,40,200 ; movaps %xmm8,%xmm9
- DB 69,15,92,206 ; subps %xmm14,%xmm9
- DB 69,15,89,206 ; mulps %xmm14,%xmm9
- DB 69,15,40,214 ; movaps %xmm14,%xmm10
- DB 68,15,92,210 ; subps %xmm2,%xmm10
- DB 69,15,94,202 ; divps %xmm10,%xmm9
- DB 69,15,88,206 ; addps %xmm14,%xmm9
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 102,69,15,56,20,200 ; blendvps %xmm0,%xmm8,%xmm9
- DB 68,15,95,198 ; maxps %xmm6,%xmm8
- DB 69,15,40,229 ; movaps %xmm13,%xmm12
- DB 69,15,194,224,1 ; cmpltps %xmm8,%xmm12
+ DB 65,15,92,211 ; subps %xmm11,%xmm2
+ DB 68,15,94,242 ; divps %xmm2,%xmm14
+ DB 69,15,88,243 ; addps %xmm11,%xmm14
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 102,69,15,56,20,230 ; blendvps %xmm0,%xmm14,%xmm12
+ DB 68,15,40,241 ; movaps %xmm1,%xmm14
+ DB 69,15,92,243 ; subps %xmm11,%xmm14
+ DB 69,15,89,243 ; mulps %xmm11,%xmm14
+ DB 68,15,94,247 ; divps %xmm7,%xmm14
+ DB 69,15,88,243 ; addps %xmm11,%xmm14
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,68,15,56,20,241 ; blendvps %xmm0,%xmm1,%xmm14
+ DB 65,15,40,206 ; movaps %xmm14,%xmm1
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 65,15,89,207 ; mulps %xmm15,%xmm1
+ DB 15,94,202 ; divps %xmm2,%xmm1
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 102,68,15,56,20,241 ; blendvps %xmm0,%xmm1,%xmm14
+ DB 65,15,40,205 ; movaps %xmm13,%xmm1
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 15,94,207 ; divps %xmm7,%xmm1
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 102,65,15,56,20,205 ; blendvps %xmm0,%xmm13,%xmm1
+ DB 15,40,249 ; movaps %xmm1,%xmm7
+ DB 65,15,92,251 ; subps %xmm11,%xmm7
+ DB 65,15,89,255 ; mulps %xmm15,%xmm7
+ DB 15,94,250 ; divps %xmm2,%xmm7
+ DB 65,15,88,251 ; addps %xmm11,%xmm7
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
+ DB 68,15,40,13,134,50,0,0 ; movaps 0x3286(%rip),%xmm9 # 4770 <_sk_callback_sse41+0x303>
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 68,15,89,192 ; mulps %xmm0,%xmm8
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 15,89,4,36 ; mulps (%rsp),%xmm0
+ DB 68,15,92,206 ; subps %xmm6,%xmm9
+ DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,40,252 ; movaps %xmm4,%xmm7
+ DB 15,92,243 ; subps %xmm3,%xmm6
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,87,210 ; xorps %xmm2,%xmm2
+ DB 68,15,95,226 ; maxps %xmm2,%xmm12
+ DB 68,15,95,242 ; maxps %xmm2,%xmm14
+ DB 15,95,202 ; maxps %xmm2,%xmm1
DB 65,15,40,209 ; movaps %xmm9,%xmm2
- DB 65,15,92,214 ; subps %xmm14,%xmm2
- DB 69,15,92,238 ; subps %xmm14,%xmm13
- DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 69,15,92,198 ; subps %xmm14,%xmm8
- DB 65,15,94,208 ; divps %xmm8,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
- DB 65,15,40,196 ; movaps %xmm12,%xmm0
- DB 102,68,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm9
- DB 68,15,40,217 ; movaps %xmm1,%xmm11
- DB 69,15,92,222 ; subps %xmm14,%xmm11
- DB 69,15,89,222 ; mulps %xmm14,%xmm11
- DB 69,15,94,218 ; divps %xmm10,%xmm11
- DB 69,15,88,222 ; addps %xmm14,%xmm11
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 102,68,15,56,20,217 ; blendvps %xmm0,%xmm1,%xmm11
- DB 65,15,40,203 ; movaps %xmm11,%xmm1
- DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 65,15,89,205 ; mulps %xmm13,%xmm1
- DB 65,15,94,200 ; divps %xmm8,%xmm1
- DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 65,15,40,196 ; movaps %xmm12,%xmm0
- DB 102,68,15,56,20,217 ; blendvps %xmm0,%xmm1,%xmm11
- DB 65,15,40,215 ; movaps %xmm15,%xmm2
- DB 65,15,92,214 ; subps %xmm14,%xmm2
- DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 65,15,94,210 ; divps %xmm10,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 102,65,15,56,20,215 ; blendvps %xmm0,%xmm15,%xmm2
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 65,15,89,205 ; mulps %xmm13,%xmm1
- DB 65,15,94,200 ; divps %xmm8,%xmm1
- DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 65,15,40,196 ; movaps %xmm12,%xmm0
- DB 102,15,56,20,209 ; blendvps %xmm0,%xmm1,%xmm2
- DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 68,15,95,200 ; maxps %xmm0,%xmm9
- DB 68,15,95,216 ; maxps %xmm0,%xmm11
- DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 68,15,40,196 ; movaps %xmm4,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 68,15,92,196 ; subps %xmm4,%xmm8
- DB 69,15,89,200 ; mulps %xmm8,%xmm9
- DB 69,15,89,216 ; mulps %xmm8,%xmm11
- DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 15,40,100,36,48 ; movaps 0x30(%rsp),%xmm4
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 68,15,88,194 ; addps %xmm2,%xmm8
+ DB 69,15,88,196 ; addps %xmm12,%xmm8
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 15,40,116,36,32 ; movaps 0x20(%rsp),%xmm6
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 68,15,40,213 ; movaps %xmm5,%xmm10
+ DB 68,15,88,210 ; addps %xmm2,%xmm10
+ DB 69,15,88,214 ; addps %xmm14,%xmm10
+ DB 15,40,84,36,16 ; movaps 0x10(%rsp),%xmm2
+ DB 68,15,89,202 ; mulps %xmm2,%xmm9
+ DB 68,15,88,200 ; addps %xmm0,%xmm9
+ DB 68,15,88,201 ; addps %xmm1,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,40,108,36,16 ; movaps 0x10(%rsp),%xmm5
- DB 15,40,52,36 ; movaps (%rsp),%xmm6
- DB 65,15,40,193 ; movaps %xmm9,%xmm0
- DB 65,15,40,203 ; movaps %xmm11,%xmm1
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
- DB 72,131,196,40 ; add $0x28,%rsp
+ DB 15,40,238 ; movaps %xmm6,%xmm5
+ DB 15,40,242 ; movaps %xmm2,%xmm6
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 65,15,40,202 ; movaps %xmm10,%xmm1
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 72,131,196,72 ; add $0x48,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_luminosity_sse41
_sk_luminosity_sse41 LABEL PROC
- DB 72,131,236,40 ; sub $0x28,%rsp
- DB 68,15,40,206 ; movaps %xmm6,%xmm9
- DB 68,15,41,12,36 ; movaps %xmm9,(%rsp)
- DB 68,15,40,245 ; movaps %xmm5,%xmm14
- DB 68,15,41,116,36,16 ; movaps %xmm14,0x10(%rsp)
- DB 15,40,244 ; movaps %xmm4,%xmm6
- DB 15,40,235 ; movaps %xmm3,%xmm5
- DB 69,15,87,228 ; xorps %xmm12,%xmm12
- DB 68,15,40,45,182,49,0,0 ; movaps 0x31b6(%rip),%xmm13 # 4630 <_sk_callback_sse41+0x315>
- DB 69,15,40,197 ; movaps %xmm13,%xmm8
- DB 68,15,94,199 ; divps %xmm7,%xmm8
- DB 15,40,223 ; movaps %xmm7,%xmm3
- DB 65,15,194,220,4 ; cmpneqps %xmm12,%xmm3
- DB 65,15,84,216 ; andps %xmm8,%xmm3
- DB 68,15,40,211 ; movaps %xmm3,%xmm10
- DB 68,15,89,214 ; mulps %xmm6,%xmm10
+ DB 72,131,236,72 ; sub $0x48,%rsp
+ DB 15,41,116,36,16 ; movaps %xmm6,0x10(%rsp)
+ DB 15,41,108,36,48 ; movaps %xmm5,0x30(%rsp)
+ DB 68,15,40,196 ; movaps %xmm4,%xmm8
+ DB 68,15,41,68,36,32 ; movaps %xmm8,0x20(%rsp)
+ DB 15,41,20,36 ; movaps %xmm2,(%rsp)
+ DB 15,40,224 ; movaps %xmm0,%xmm4
DB 68,15,40,219 ; movaps %xmm3,%xmm11
- DB 69,15,89,222 ; mulps %xmm14,%xmm11
- DB 65,15,89,217 ; mulps %xmm9,%xmm3
- DB 68,15,40,5,150,49,0,0 ; movaps 0x3196(%rip),%xmm8 # 4640 <_sk_callback_sse41+0x325>
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,13,154,49,0,0 ; movaps 0x319a(%rip),%xmm9 # 4650 <_sk_callback_sse41+0x335>
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 68,15,40,53,155,49,0,0 ; movaps 0x319b(%rip),%xmm14 # 4660 <_sk_callback_sse41+0x345>
- DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 15,88,209 ; addps %xmm1,%xmm2
- DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 69,15,89,216 ; mulps %xmm8,%xmm11
+ DB 68,15,40,203 ; movaps %xmm3,%xmm9
+ DB 68,15,89,205 ; mulps %xmm5,%xmm9
+ DB 68,15,40,5,216,49,0,0 ; movaps 0x31d8(%rip),%xmm8 # 4780 <_sk_callback_sse41+0x313>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 65,15,40,203 ; movaps %xmm11,%xmm1
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 68,15,40,21,220,49,0,0 ; movaps 0x31dc(%rip),%xmm10 # 4790 <_sk_callback_sse41+0x323>
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 65,15,89,234 ; mulps %xmm10,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 68,15,40,37,218,49,0,0 ; movaps 0x31da(%rip),%xmm12 # 47a0 <_sk_callback_sse41+0x333>
+ DB 68,15,40,242 ; movaps %xmm2,%xmm14
+ DB 69,15,89,244 ; mulps %xmm12,%xmm14
+ DB 68,15,88,245 ; addps %xmm5,%xmm14
+ DB 65,15,40,235 ; movaps %xmm11,%xmm5
+ DB 65,15,89,232 ; mulps %xmm8,%xmm5
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 65,15,89,210 ; mulps %xmm10,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 65,15,89,198 ; mulps %xmm14,%xmm0
- DB 15,88,193 ; addps %xmm1,%xmm0
- DB 15,92,208 ; subps %xmm0,%xmm2
- DB 68,15,88,210 ; addps %xmm2,%xmm10
- DB 68,15,88,218 ; addps %xmm2,%xmm11
- DB 15,88,211 ; addps %xmm3,%xmm2
- DB 65,15,40,195 ; movaps %xmm11,%xmm0
- DB 15,93,194 ; minps %xmm2,%xmm0
- DB 65,15,40,202 ; movaps %xmm10,%xmm1
- DB 15,93,200 ; minps %xmm0,%xmm1
- DB 65,15,40,219 ; movaps %xmm11,%xmm3
- DB 15,95,218 ; maxps %xmm2,%xmm3
- DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 69,15,88,200 ; addps %xmm8,%xmm9
- DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 69,15,88,241 ; addps %xmm9,%xmm14
- DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
- DB 69,15,40,194 ; movaps %xmm10,%xmm8
- DB 69,15,92,198 ; subps %xmm14,%xmm8
- DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 69,15,40,206 ; movaps %xmm14,%xmm9
- DB 68,15,92,201 ; subps %xmm1,%xmm9
- DB 69,15,94,193 ; divps %xmm9,%xmm8
- DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 102,69,15,56,20,194 ; blendvps %xmm0,%xmm10,%xmm8
- DB 69,15,40,250 ; movaps %xmm10,%xmm15
- DB 68,15,95,251 ; maxps %xmm3,%xmm15
- DB 69,15,40,213 ; movaps %xmm13,%xmm10
- DB 69,15,194,215,1 ; cmpltps %xmm15,%xmm10
- DB 65,15,40,200 ; movaps %xmm8,%xmm1
- DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 69,15,92,238 ; subps %xmm14,%xmm13
- DB 65,15,89,205 ; mulps %xmm13,%xmm1
- DB 69,15,92,254 ; subps %xmm14,%xmm15
- DB 65,15,94,207 ; divps %xmm15,%xmm1
- DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 65,15,40,194 ; movaps %xmm10,%xmm0
- DB 102,68,15,56,20,193 ; blendvps %xmm0,%xmm1,%xmm8
- DB 65,15,40,203 ; movaps %xmm11,%xmm1
- DB 65,15,92,206 ; subps %xmm14,%xmm1
- DB 65,15,89,206 ; mulps %xmm14,%xmm1
- DB 65,15,94,201 ; divps %xmm9,%xmm1
- DB 65,15,88,206 ; addps %xmm14,%xmm1
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
- DB 15,40,217 ; movaps %xmm1,%xmm3
- DB 65,15,92,222 ; subps %xmm14,%xmm3
- DB 65,15,89,221 ; mulps %xmm13,%xmm3
- DB 65,15,94,223 ; divps %xmm15,%xmm3
- DB 65,15,88,222 ; addps %xmm14,%xmm3
- DB 65,15,40,194 ; movaps %xmm10,%xmm0
- DB 102,15,56,20,203 ; blendvps %xmm0,%xmm3,%xmm1
- DB 68,15,40,218 ; movaps %xmm2,%xmm11
- DB 69,15,92,222 ; subps %xmm14,%xmm11
- DB 69,15,89,222 ; mulps %xmm14,%xmm11
- DB 69,15,94,217 ; divps %xmm9,%xmm11
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 65,15,89,236 ; mulps %xmm12,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 68,15,89,247 ; mulps %xmm7,%xmm14
+ DB 68,15,92,245 ; subps %xmm5,%xmm14
DB 69,15,88,222 ; addps %xmm14,%xmm11
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 102,68,15,56,20,218 ; blendvps %xmm0,%xmm2,%xmm11
- DB 65,15,40,211 ; movaps %xmm11,%xmm2
- DB 65,15,92,214 ; subps %xmm14,%xmm2
- DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 65,15,94,215 ; divps %xmm15,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
+ DB 69,15,88,206 ; addps %xmm14,%xmm9
+ DB 68,15,88,240 ; addps %xmm0,%xmm14
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,93,198 ; minps %xmm14,%xmm0
+ DB 65,15,40,235 ; movaps %xmm11,%xmm5
+ DB 15,93,232 ; minps %xmm0,%xmm5
+ DB 69,15,89,195 ; mulps %xmm11,%xmm8
+ DB 69,15,89,209 ; mulps %xmm9,%xmm10
+ DB 69,15,88,208 ; addps %xmm8,%xmm10
+ DB 69,15,89,230 ; mulps %xmm14,%xmm12
+ DB 69,15,88,226 ; addps %xmm10,%xmm12
+ DB 69,15,87,210 ; xorps %xmm10,%xmm10
+ DB 68,15,194,213,2 ; cmpleps %xmm5,%xmm10
+ DB 69,15,40,235 ; movaps %xmm11,%xmm13
+ DB 69,15,92,236 ; subps %xmm12,%xmm13
+ DB 69,15,89,236 ; mulps %xmm12,%xmm13
+ DB 65,15,40,244 ; movaps %xmm12,%xmm6
+ DB 15,92,245 ; subps %xmm5,%xmm6
+ DB 68,15,94,238 ; divps %xmm6,%xmm13
+ DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
- DB 102,68,15,56,20,218 ; blendvps %xmm0,%xmm2,%xmm11
- DB 69,15,95,196 ; maxps %xmm12,%xmm8
- DB 65,15,95,204 ; maxps %xmm12,%xmm1
- DB 69,15,95,220 ; maxps %xmm12,%xmm11
- DB 68,15,40,205 ; movaps %xmm5,%xmm9
- DB 68,15,88,207 ; addps %xmm7,%xmm9
+ DB 102,69,15,56,20,235 ; blendvps %xmm0,%xmm11,%xmm13
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,95,198 ; maxps %xmm14,%xmm0
+ DB 65,15,40,211 ; movaps %xmm11,%xmm2
+ DB 15,95,208 ; maxps %xmm0,%xmm2
+ DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,239 ; mulps %xmm7,%xmm5
- DB 68,15,92,205 ; subps %xmm5,%xmm9
- DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 69,15,89,217 ; mulps %xmm9,%xmm11
+ DB 68,15,40,221 ; movaps %xmm5,%xmm11
+ DB 68,15,194,218,1 ; cmpltps %xmm2,%xmm11
+ DB 69,15,40,197 ; movaps %xmm13,%xmm8
+ DB 69,15,92,196 ; subps %xmm12,%xmm8
+ DB 68,15,40,253 ; movaps %xmm5,%xmm15
+ DB 69,15,92,252 ; subps %xmm12,%xmm15
+ DB 69,15,89,199 ; mulps %xmm15,%xmm8
+ DB 65,15,92,212 ; subps %xmm12,%xmm2
+ DB 68,15,94,194 ; divps %xmm2,%xmm8
+ DB 69,15,88,196 ; addps %xmm12,%xmm8
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
+ DB 102,69,15,56,20,232 ; blendvps %xmm0,%xmm8,%xmm13
+ DB 69,15,40,193 ; movaps %xmm9,%xmm8
+ DB 69,15,92,196 ; subps %xmm12,%xmm8
+ DB 69,15,89,196 ; mulps %xmm12,%xmm8
+ DB 68,15,94,198 ; divps %xmm6,%xmm8
+ DB 69,15,88,196 ; addps %xmm12,%xmm8
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
+ DB 69,15,40,200 ; movaps %xmm8,%xmm9
+ DB 69,15,92,204 ; subps %xmm12,%xmm9
+ DB 69,15,89,207 ; mulps %xmm15,%xmm9
+ DB 68,15,94,202 ; divps %xmm2,%xmm9
+ DB 69,15,88,204 ; addps %xmm12,%xmm9
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
+ DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
+ DB 69,15,40,206 ; movaps %xmm14,%xmm9
+ DB 69,15,92,204 ; subps %xmm12,%xmm9
+ DB 69,15,89,204 ; mulps %xmm12,%xmm9
+ DB 68,15,94,206 ; divps %xmm6,%xmm9
+ DB 69,15,88,204 ; addps %xmm12,%xmm9
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 102,69,15,56,20,206 ; blendvps %xmm0,%xmm14,%xmm9
+ DB 65,15,40,241 ; movaps %xmm9,%xmm6
+ DB 65,15,92,244 ; subps %xmm12,%xmm6
+ DB 65,15,89,247 ; mulps %xmm15,%xmm6
+ DB 15,94,242 ; divps %xmm2,%xmm6
+ DB 65,15,88,244 ; addps %xmm12,%xmm6
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
+ DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
+ DB 15,40,5,144,48,0,0 ; movaps 0x3090(%rip),%xmm0 # 47b0 <_sk_callback_sse41+0x343>
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,89,20,36 ; mulps (%rsp),%xmm2
+ DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,87,237 ; xorps %xmm5,%xmm5
+ DB 68,15,95,237 ; maxps %xmm5,%xmm13
+ DB 68,15,95,197 ; maxps %xmm5,%xmm8
+ DB 68,15,95,205 ; maxps %xmm5,%xmm9
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 68,15,40,84,36,32 ; movaps 0x20(%rsp),%xmm10
+ DB 65,15,89,234 ; mulps %xmm10,%xmm5
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 65,15,88,229 ; addps %xmm13,%xmm4
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,40,108,36,48 ; movaps 0x30(%rsp),%xmm5
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 65,15,88,200 ; addps %xmm8,%xmm1
+ DB 15,40,116,36,16 ; movaps 0x10(%rsp),%xmm6
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,88,194 ; addps %xmm2,%xmm0
+ DB 68,15,88,200 ; addps %xmm0,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 65,15,40,192 ; movaps %xmm8,%xmm0
- DB 65,15,40,211 ; movaps %xmm11,%xmm2
- DB 65,15,40,217 ; movaps %xmm9,%xmm3
- DB 15,40,230 ; movaps %xmm6,%xmm4
- DB 15,40,108,36,16 ; movaps 0x10(%rsp),%xmm5
- DB 15,40,52,36 ; movaps (%rsp),%xmm6
- DB 72,131,196,40 ; add $0x28,%rsp
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 65,15,40,226 ; movaps %xmm10,%xmm4
+ DB 72,131,196,72 ; add $0x48,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_clamp_0_sse41
@@ -12269,7 +12470,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,18,48,0,0 ; movaps 0x3012(%rip),%xmm8 # 4670 <_sk_callback_sse41+0x355>
+ DB 68,15,40,5,16,48,0,0 ; movaps 0x3010(%rip),%xmm8 # 47c0 <_sk_callback_sse41+0x353>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -12279,7 +12480,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,7,48,0,0 ; minps 0x3007(%rip),%xmm3 # 4680 <_sk_callback_sse41+0x365>
+ DB 15,93,29,5,48,0,0 ; minps 0x3005(%rip),%xmm3 # 47d0 <_sk_callback_sse41+0x363>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -12352,7 +12553,7 @@ _sk_premul_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,114,47,0,0 ; movaps 0x2f72(%rip),%xmm9 # 4690 <_sk_callback_sse41+0x375>
+ DB 68,15,40,13,112,47,0,0 ; movaps 0x2f70(%rip),%xmm9 # 47e0 <_sk_callback_sse41+0x373>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -12364,20 +12565,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,93,47,0,0 ; movaps 0x2f5d(%rip),%xmm11 # 46a0 <_sk_callback_sse41+0x385>
+ DB 68,15,40,29,91,47,0,0 ; movaps 0x2f5b(%rip),%xmm11 # 47f0 <_sk_callback_sse41+0x383>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,85,47,0,0 ; movaps 0x2f55(%rip),%xmm12 # 46b0 <_sk_callback_sse41+0x395>
+ DB 68,15,40,37,83,47,0,0 ; movaps 0x2f53(%rip),%xmm12 # 4800 <_sk_callback_sse41+0x393>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,85,47,0,0 ; movaps 0x2f55(%rip),%xmm13 # 46c0 <_sk_callback_sse41+0x3a5>
+ DB 68,15,40,45,83,47,0,0 ; movaps 0x2f53(%rip),%xmm13 # 4810 <_sk_callback_sse41+0x3a3>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,85,47,0,0 ; movaps 0x2f55(%rip),%xmm14 # 46d0 <_sk_callback_sse41+0x3b5>
+ DB 68,15,40,53,83,47,0,0 ; movaps 0x2f53(%rip),%xmm14 # 4820 <_sk_callback_sse41+0x3b3>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,89,47,0,0 ; movaps 0x2f59(%rip),%xmm15 # 46e0 <_sk_callback_sse41+0x3c5>
+ DB 68,15,40,61,87,47,0,0 ; movaps 0x2f57(%rip),%xmm15 # 4830 <_sk_callback_sse41+0x3c3>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -12421,20 +12622,20 @@ _sk_to_srgb_sse41 LABEL PROC
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
DB 69,15,83,200 ; rcpps %xmm8,%xmm9
DB 69,15,82,208 ; rsqrtps %xmm8,%xmm10
- DB 68,15,40,29,198,46,0,0 ; movaps 0x2ec6(%rip),%xmm11 # 46f0 <_sk_callback_sse41+0x3d5>
+ DB 68,15,40,29,196,46,0,0 ; movaps 0x2ec4(%rip),%xmm11 # 4840 <_sk_callback_sse41+0x3d3>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 65,15,89,203 ; mulps %xmm11,%xmm1
- DB 68,15,40,37,199,46,0,0 ; movaps 0x2ec7(%rip),%xmm12 # 4700 <_sk_callback_sse41+0x3e5>
+ DB 68,15,40,37,197,46,0,0 ; movaps 0x2ec5(%rip),%xmm12 # 4850 <_sk_callback_sse41+0x3e3>
DB 69,15,89,204 ; mulps %xmm12,%xmm9
- DB 68,15,40,45,203,46,0,0 ; movaps 0x2ecb(%rip),%xmm13 # 4710 <_sk_callback_sse41+0x3f5>
+ DB 68,15,40,45,201,46,0,0 ; movaps 0x2ec9(%rip),%xmm13 # 4860 <_sk_callback_sse41+0x3f3>
DB 69,15,88,205 ; addps %xmm13,%xmm9
- DB 68,15,40,53,207,46,0,0 ; movaps 0x2ecf(%rip),%xmm14 # 4720 <_sk_callback_sse41+0x405>
+ DB 68,15,40,53,205,46,0,0 ; movaps 0x2ecd(%rip),%xmm14 # 4870 <_sk_callback_sse41+0x403>
DB 69,15,89,214 ; mulps %xmm14,%xmm10
DB 69,15,88,209 ; addps %xmm9,%xmm10
- DB 68,15,40,5,207,46,0,0 ; movaps 0x2ecf(%rip),%xmm8 # 4730 <_sk_callback_sse41+0x415>
+ DB 68,15,40,5,205,46,0,0 ; movaps 0x2ecd(%rip),%xmm8 # 4880 <_sk_callback_sse41+0x413>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,93,202 ; minps %xmm10,%xmm9
- DB 68,15,40,61,207,46,0,0 ; movaps 0x2ecf(%rip),%xmm15 # 4740 <_sk_callback_sse41+0x425>
+ DB 68,15,40,61,205,46,0,0 ; movaps 0x2ecd(%rip),%xmm15 # 4890 <_sk_callback_sse41+0x423>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,68,15,56,20,201 ; blendvps %xmm0,%xmm1,%xmm9
DB 15,82,194 ; rsqrtps %xmm2,%xmm0
@@ -12487,7 +12688,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,93,226 ; minps %xmm2,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,29,46,0,0 ; movaps 0x2e1d(%rip),%xmm14 # 4750 <_sk_callback_sse41+0x435>
+ DB 68,15,40,53,27,46,0,0 ; movaps 0x2e1b(%rip),%xmm14 # 48a0 <_sk_callback_sse41+0x433>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -12496,27 +12697,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,4,46,0,0 ; andps 0x2e04(%rip),%xmm15 # 4760 <_sk_callback_sse41+0x445>
+ DB 68,15,84,61,2,46,0,0 ; andps 0x2e02(%rip),%xmm15 # 48b0 <_sk_callback_sse41+0x443>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,247,45,0,0 ; movaps 0x2df7(%rip),%xmm13 # 4770 <_sk_callback_sse41+0x455>
+ DB 68,15,40,45,245,45,0,0 ; movaps 0x2df5(%rip),%xmm13 # 48c0 <_sk_callback_sse41+0x453>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,243,45,0,0 ; addps 0x2df3(%rip),%xmm8 # 4780 <_sk_callback_sse41+0x465>
+ DB 68,15,88,5,241,45,0,0 ; addps 0x2df1(%rip),%xmm8 # 48d0 <_sk_callback_sse41+0x463>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,235,45,0,0 ; mulps 0x2deb(%rip),%xmm8 # 4790 <_sk_callback_sse41+0x475>
+ DB 68,15,89,5,233,45,0,0 ; mulps 0x2de9(%rip),%xmm8 # 48e0 <_sk_callback_sse41+0x473>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,223,45,0,0 ; movaps 0x2ddf(%rip),%xmm0 # 47a0 <_sk_callback_sse41+0x485>
+ DB 15,40,5,221,45,0,0 ; movaps 0x2ddd(%rip),%xmm0 # 48f0 <_sk_callback_sse41+0x483>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -12537,7 +12738,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,161,45,0,0 ; movaps 0x2da1(%rip),%xmm9 # 47b0 <_sk_callback_sse41+0x495>
+ DB 68,15,40,13,159,45,0,0 ; movaps 0x2d9f(%rip),%xmm9 # 4900 <_sk_callback_sse41+0x493>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -12550,19 +12751,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,125,45,0,0 ; movaps 0x2d7d(%rip),%xmm14 # 47c0 <_sk_callback_sse41+0x4a5>
+ DB 68,15,40,53,123,45,0,0 ; movaps 0x2d7b(%rip),%xmm14 # 4910 <_sk_callback_sse41+0x4a3>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,118,45,0,0 ; movaps 0x2d76(%rip),%xmm11 # 47d0 <_sk_callback_sse41+0x4b5>
+ DB 68,15,40,29,116,45,0,0 ; movaps 0x2d74(%rip),%xmm11 # 4920 <_sk_callback_sse41+0x4b3>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,111,45,0,0 ; movaps 0x2d6f(%rip),%xmm7 # 47e0 <_sk_callback_sse41+0x4c5>
+ DB 15,40,61,109,45,0,0 ; movaps 0x2d6d(%rip),%xmm7 # 4930 <_sk_callback_sse41+0x4c3>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,112,45,0,0 ; movaps 0x2d70(%rip),%xmm3 # 47f0 <_sk_callback_sse41+0x4d5>
+ DB 15,40,29,110,45,0,0 ; movaps 0x2d6e(%rip),%xmm3 # 4940 <_sk_callback_sse41+0x4d3>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -12572,7 +12773,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,79,45,0,0 ; movaps 0x2d4f(%rip),%xmm12 # 4800 <_sk_callback_sse41+0x4e5>
+ DB 68,15,40,37,77,45,0,0 ; movaps 0x2d4d(%rip),%xmm12 # 4950 <_sk_callback_sse41+0x4e3>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -12606,7 +12807,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,200,44,0,0 ; addps 0x2cc8(%rip),%xmm10 # 4810 <_sk_callback_sse41+0x4f5>
+ DB 68,15,88,21,198,44,0,0 ; addps 0x2cc6(%rip),%xmm10 # 4960 <_sk_callback_sse41+0x4f3>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -12655,7 +12856,7 @@ _sk_scale_u8_sse41 LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 102,68,15,56,49,4,56 ; pmovzxbd (%rax,%rdi,1),%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,33,44,0,0 ; mulps 0x2c21(%rip),%xmm8 # 4820 <_sk_callback_sse41+0x505>
+ DB 68,15,89,5,31,44,0,0 ; mulps 0x2c1f(%rip),%xmm8 # 4970 <_sk_callback_sse41+0x503>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -12689,7 +12890,7 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 102,68,15,56,49,4,56 ; pmovzxbd (%rax,%rdi,1),%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,205,43,0,0 ; mulps 0x2bcd(%rip),%xmm8 # 4830 <_sk_callback_sse41+0x515>
+ DB 68,15,89,5,203,43,0,0 ; mulps 0x2bcb(%rip),%xmm8 # 4980 <_sk_callback_sse41+0x513>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -12710,17 +12911,17 @@ _sk_lerp_565_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 102,68,15,56,51,20,120 ; pmovzxwd (%rax,%rdi,2),%xmm10
- DB 102,68,15,111,5,156,43,0,0 ; movdqa 0x2b9c(%rip),%xmm8 # 4840 <_sk_callback_sse41+0x525>
+ DB 102,68,15,111,5,154,43,0,0 ; movdqa 0x2b9a(%rip),%xmm8 # 4990 <_sk_callback_sse41+0x523>
DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,155,43,0,0 ; mulps 0x2b9b(%rip),%xmm8 # 4850 <_sk_callback_sse41+0x535>
- DB 102,68,15,111,13,162,43,0,0 ; movdqa 0x2ba2(%rip),%xmm9 # 4860 <_sk_callback_sse41+0x545>
+ DB 68,15,89,5,153,43,0,0 ; mulps 0x2b99(%rip),%xmm8 # 49a0 <_sk_callback_sse41+0x533>
+ DB 102,68,15,111,13,160,43,0,0 ; movdqa 0x2ba0(%rip),%xmm9 # 49b0 <_sk_callback_sse41+0x543>
DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,161,43,0,0 ; mulps 0x2ba1(%rip),%xmm9 # 4870 <_sk_callback_sse41+0x555>
- DB 102,68,15,219,21,168,43,0,0 ; pand 0x2ba8(%rip),%xmm10 # 4880 <_sk_callback_sse41+0x565>
+ DB 68,15,89,13,159,43,0,0 ; mulps 0x2b9f(%rip),%xmm9 # 49c0 <_sk_callback_sse41+0x553>
+ DB 102,68,15,219,21,166,43,0,0 ; pand 0x2ba6(%rip),%xmm10 # 49d0 <_sk_callback_sse41+0x563>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,172,43,0,0 ; mulps 0x2bac(%rip),%xmm10 # 4890 <_sk_callback_sse41+0x575>
+ DB 68,15,89,21,170,43,0,0 ; mulps 0x2baa(%rip),%xmm10 # 49e0 <_sk_callback_sse41+0x573>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -12749,7 +12950,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 243,69,15,111,4,184 ; movdqu (%r8,%rdi,4),%xmm8
- DB 102,15,111,5,93,43,0,0 ; movdqa 0x2b5d(%rip),%xmm0 # 48a0 <_sk_callback_sse41+0x585>
+ DB 102,15,111,5,91,43,0,0 ; movdqa 0x2b5b(%rip),%xmm0 # 49f0 <_sk_callback_sse41+0x583>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,192,1 ; pextrq $0x1,%xmm0,%r8
DB 102,72,15,126,193 ; movq %xmm0,%rcx
@@ -12764,7 +12965,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,193,48 ; insertps $0x30,%xmm1,%xmm0
DB 76,139,64,16 ; mov 0x10(%rax),%r8
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,24,43,0,0 ; pshufb 0x2b18(%rip),%xmm1 # 48b0 <_sk_callback_sse41+0x595>
+ DB 102,15,56,0,13,22,43,0,0 ; pshufb 0x2b16(%rip),%xmm1 # 4a00 <_sk_callback_sse41+0x593>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,201 ; movq %xmm1,%rcx
DB 68,15,182,209 ; movzbl %cl,%r10d
@@ -12779,7 +12980,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,64,24 ; mov 0x18(%rax),%r8
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,212,42,0,0 ; pshufb 0x2ad4(%rip),%xmm2 # 48c0 <_sk_callback_sse41+0x5a5>
+ DB 102,15,56,0,21,210,42,0,0 ; pshufb 0x2ad2(%rip),%xmm2 # 4a10 <_sk_callback_sse41+0x5a3>
DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,200 ; movzbl %al,%r9d
@@ -12794,7 +12995,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,145,42,0,0 ; mulps 0x2a91(%rip),%xmm3 # 48d0 <_sk_callback_sse41+0x5b5>
+ DB 15,89,29,143,42,0,0 ; mulps 0x2a8f(%rip),%xmm3 # 4a20 <_sk_callback_sse41+0x5b3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -12811,7 +13012,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,100,42,0,0 ; movdqa 0x2a64(%rip),%xmm8 # 48e0 <_sk_callback_sse41+0x5c5>
+ DB 102,68,15,111,5,98,42,0,0 ; movdqa 0x2a62(%rip),%xmm8 # 4a30 <_sk_callback_sse41+0x5c3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -12828,7 +13029,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 243,67,15,16,20,8 ; movss (%r8,%r9,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
DB 76,139,64,16 ; mov 0x10(%rax),%r8
- DB 102,15,56,0,13,23,42,0,0 ; pshufb 0x2a17(%rip),%xmm1 # 48f0 <_sk_callback_sse41+0x5d5>
+ DB 102,15,56,0,13,21,42,0,0 ; pshufb 0x2a15(%rip),%xmm1 # 4a40 <_sk_callback_sse41+0x5d3>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,201 ; movq %xmm1,%rcx
@@ -12864,7 +13065,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,101,41,0,0 ; mulps 0x2965(%rip),%xmm3 # 4900 <_sk_callback_sse41+0x5e5>
+ DB 15,89,29,99,41,0,0 ; mulps 0x2963(%rip),%xmm3 # 4a50 <_sk_callback_sse41+0x5e3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -12884,7 +13085,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,39,41,0,0 ; movdqa 0x2927(%rip),%xmm8 # 4910 <_sk_callback_sse41+0x5f5>
+ DB 102,68,15,111,5,37,41,0,0 ; movdqa 0x2925(%rip),%xmm8 # 4a60 <_sk_callback_sse41+0x5f3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -12901,7 +13102,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,67,15,16,28,8 ; movss (%r8,%r9,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
DB 76,139,64,16 ; mov 0x10(%rax),%r8
- DB 102,15,56,0,13,218,40,0,0 ; pshufb 0x28da(%rip),%xmm1 # 4920 <_sk_callback_sse41+0x605>
+ DB 102,15,56,0,13,216,40,0,0 ; pshufb 0x28d8(%rip),%xmm1 # 4a70 <_sk_callback_sse41+0x603>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,201 ; movq %xmm1,%rcx
@@ -12932,7 +13133,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,8 ; movss (%r8,%rcx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,69,40,0,0 ; movaps 0x2845(%rip),%xmm3 # 4930 <_sk_callback_sse41+0x615>
+ DB 15,40,29,67,40,0,0 ; movaps 0x2843(%rip),%xmm3 # 4a80 <_sk_callback_sse41+0x613>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_byte_tables_sse41
@@ -12940,7 +13141,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,70,40,0,0 ; movaps 0x2846(%rip),%xmm8 # 4940 <_sk_callback_sse41+0x625>
+ DB 68,15,40,5,68,40,0,0 ; movaps 0x2844(%rip),%xmm8 # 4a90 <_sk_callback_sse41+0x623>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
@@ -12959,7 +13160,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,193,3 ; pinsrb $0x3,%ecx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,247,39,0,0 ; movaps 0x27f7(%rip),%xmm9 # 4950 <_sk_callback_sse41+0x635>
+ DB 68,15,40,13,245,39,0,0 ; movaps 0x27f5(%rip),%xmm9 # 4aa0 <_sk_callback_sse41+0x633>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -13048,7 +13249,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,193,3 ; pinsrb $0x3,%ecx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,127,38,0,0 ; movaps 0x267f(%rip),%xmm9 # 4960 <_sk_callback_sse41+0x645>
+ DB 68,15,40,13,125,38,0,0 ; movaps 0x267d(%rip),%xmm9 # 4ab0 <_sk_callback_sse41+0x643>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -13215,31 +13416,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,214,35,0,0 ; mulps 0x23d6(%rip),%xmm8 # 4970 <_sk_callback_sse41+0x655>
- DB 68,15,84,21,222,35,0,0 ; andps 0x23de(%rip),%xmm10 # 4980 <_sk_callback_sse41+0x665>
- DB 68,15,86,21,230,35,0,0 ; orps 0x23e6(%rip),%xmm10 # 4990 <_sk_callback_sse41+0x675>
- DB 68,15,88,5,238,35,0,0 ; addps 0x23ee(%rip),%xmm8 # 49a0 <_sk_callback_sse41+0x685>
- DB 68,15,40,37,246,35,0,0 ; movaps 0x23f6(%rip),%xmm12 # 49b0 <_sk_callback_sse41+0x695>
+ DB 68,15,89,5,212,35,0,0 ; mulps 0x23d4(%rip),%xmm8 # 4ac0 <_sk_callback_sse41+0x653>
+ DB 68,15,84,21,220,35,0,0 ; andps 0x23dc(%rip),%xmm10 # 4ad0 <_sk_callback_sse41+0x663>
+ DB 68,15,86,21,228,35,0,0 ; orps 0x23e4(%rip),%xmm10 # 4ae0 <_sk_callback_sse41+0x673>
+ DB 68,15,88,5,236,35,0,0 ; addps 0x23ec(%rip),%xmm8 # 4af0 <_sk_callback_sse41+0x683>
+ DB 68,15,40,37,244,35,0,0 ; movaps 0x23f4(%rip),%xmm12 # 4b00 <_sk_callback_sse41+0x693>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,246,35,0,0 ; addps 0x23f6(%rip),%xmm10 # 49c0 <_sk_callback_sse41+0x6a5>
- DB 68,15,40,37,254,35,0,0 ; movaps 0x23fe(%rip),%xmm12 # 49d0 <_sk_callback_sse41+0x6b5>
+ DB 68,15,88,21,244,35,0,0 ; addps 0x23f4(%rip),%xmm10 # 4b10 <_sk_callback_sse41+0x6a3>
+ DB 68,15,40,37,252,35,0,0 ; movaps 0x23fc(%rip),%xmm12 # 4b20 <_sk_callback_sse41+0x6b3>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,235,35,0,0 ; addps 0x23eb(%rip),%xmm8 # 49e0 <_sk_callback_sse41+0x6c5>
- DB 68,15,40,21,243,35,0,0 ; movaps 0x23f3(%rip),%xmm10 # 49f0 <_sk_callback_sse41+0x6d5>
+ DB 68,15,88,5,233,35,0,0 ; addps 0x23e9(%rip),%xmm8 # 4b30 <_sk_callback_sse41+0x6c3>
+ DB 68,15,40,21,241,35,0,0 ; movaps 0x23f1(%rip),%xmm10 # 4b40 <_sk_callback_sse41+0x6d3>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,243,35,0,0 ; movaps 0x23f3(%rip),%xmm10 # 4a00 <_sk_callback_sse41+0x6e5>
+ DB 68,15,40,21,241,35,0,0 ; movaps 0x23f1(%rip),%xmm10 # 4b50 <_sk_callback_sse41+0x6e3>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,247,35,0,0 ; movaps 0x23f7(%rip),%xmm11 # 4a10 <_sk_callback_sse41+0x6f5>
+ DB 68,15,40,29,245,35,0,0 ; movaps 0x23f5(%rip),%xmm11 # 4b60 <_sk_callback_sse41+0x6f3>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,247,35,0,0 ; mulps 0x23f7(%rip),%xmm11 # 4a20 <_sk_callback_sse41+0x705>
+ DB 68,15,89,29,245,35,0,0 ; mulps 0x23f5(%rip),%xmm11 # 4b70 <_sk_callback_sse41+0x703>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -13247,7 +13448,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,222,35,0,0 ; minps 0x23de(%rip),%xmm8 # 4a30 <_sk_callback_sse41+0x715>
+ DB 68,15,93,5,220,35,0,0 ; minps 0x23dc(%rip),%xmm8 # 4b80 <_sk_callback_sse41+0x713>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -13275,31 +13476,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,127,35,0,0 ; mulps 0x237f(%rip),%xmm12 # 4a40 <_sk_callback_sse41+0x725>
- DB 68,15,84,29,135,35,0,0 ; andps 0x2387(%rip),%xmm11 # 4a50 <_sk_callback_sse41+0x735>
- DB 68,15,86,29,143,35,0,0 ; orps 0x238f(%rip),%xmm11 # 4a60 <_sk_callback_sse41+0x745>
- DB 68,15,88,37,151,35,0,0 ; addps 0x2397(%rip),%xmm12 # 4a70 <_sk_callback_sse41+0x755>
- DB 15,40,13,160,35,0,0 ; movaps 0x23a0(%rip),%xmm1 # 4a80 <_sk_callback_sse41+0x765>
+ DB 68,15,89,37,125,35,0,0 ; mulps 0x237d(%rip),%xmm12 # 4b90 <_sk_callback_sse41+0x723>
+ DB 68,15,84,29,133,35,0,0 ; andps 0x2385(%rip),%xmm11 # 4ba0 <_sk_callback_sse41+0x733>
+ DB 68,15,86,29,141,35,0,0 ; orps 0x238d(%rip),%xmm11 # 4bb0 <_sk_callback_sse41+0x743>
+ DB 68,15,88,37,149,35,0,0 ; addps 0x2395(%rip),%xmm12 # 4bc0 <_sk_callback_sse41+0x753>
+ DB 15,40,13,158,35,0,0 ; movaps 0x239e(%rip),%xmm1 # 4bd0 <_sk_callback_sse41+0x763>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,160,35,0,0 ; addps 0x23a0(%rip),%xmm11 # 4a90 <_sk_callback_sse41+0x775>
- DB 15,40,13,169,35,0,0 ; movaps 0x23a9(%rip),%xmm1 # 4aa0 <_sk_callback_sse41+0x785>
+ DB 68,15,88,29,158,35,0,0 ; addps 0x239e(%rip),%xmm11 # 4be0 <_sk_callback_sse41+0x773>
+ DB 15,40,13,167,35,0,0 ; movaps 0x23a7(%rip),%xmm1 # 4bf0 <_sk_callback_sse41+0x783>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,150,35,0,0 ; addps 0x2396(%rip),%xmm12 # 4ab0 <_sk_callback_sse41+0x795>
- DB 15,40,13,159,35,0,0 ; movaps 0x239f(%rip),%xmm1 # 4ac0 <_sk_callback_sse41+0x7a5>
+ DB 68,15,88,37,148,35,0,0 ; addps 0x2394(%rip),%xmm12 # 4c00 <_sk_callback_sse41+0x793>
+ DB 15,40,13,157,35,0,0 ; movaps 0x239d(%rip),%xmm1 # 4c10 <_sk_callback_sse41+0x7a3>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,159,35,0,0 ; movaps 0x239f(%rip),%xmm10 # 4ad0 <_sk_callback_sse41+0x7b5>
+ DB 68,15,40,21,157,35,0,0 ; movaps 0x239d(%rip),%xmm10 # 4c20 <_sk_callback_sse41+0x7b3>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,164,35,0,0 ; movaps 0x23a4(%rip),%xmm1 # 4ae0 <_sk_callback_sse41+0x7c5>
+ DB 15,40,13,162,35,0,0 ; movaps 0x23a2(%rip),%xmm1 # 4c30 <_sk_callback_sse41+0x7c3>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,165,35,0,0 ; mulps 0x23a5(%rip),%xmm1 # 4af0 <_sk_callback_sse41+0x7d5>
+ DB 15,89,13,163,35,0,0 ; mulps 0x23a3(%rip),%xmm1 # 4c40 <_sk_callback_sse41+0x7d3>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -13307,7 +13508,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,144,35,0,0 ; minps 0x2390(%rip),%xmm1 # 4b00 <_sk_callback_sse41+0x7e5>
+ DB 15,93,13,142,35,0,0 ; minps 0x238e(%rip),%xmm1 # 4c50 <_sk_callback_sse41+0x7e3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -13335,31 +13536,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,49,35,0,0 ; mulps 0x2331(%rip),%xmm12 # 4b10 <_sk_callback_sse41+0x7f5>
- DB 68,15,84,29,57,35,0,0 ; andps 0x2339(%rip),%xmm11 # 4b20 <_sk_callback_sse41+0x805>
- DB 68,15,86,29,65,35,0,0 ; orps 0x2341(%rip),%xmm11 # 4b30 <_sk_callback_sse41+0x815>
- DB 68,15,88,37,73,35,0,0 ; addps 0x2349(%rip),%xmm12 # 4b40 <_sk_callback_sse41+0x825>
- DB 15,40,21,82,35,0,0 ; movaps 0x2352(%rip),%xmm2 # 4b50 <_sk_callback_sse41+0x835>
+ DB 68,15,89,37,47,35,0,0 ; mulps 0x232f(%rip),%xmm12 # 4c60 <_sk_callback_sse41+0x7f3>
+ DB 68,15,84,29,55,35,0,0 ; andps 0x2337(%rip),%xmm11 # 4c70 <_sk_callback_sse41+0x803>
+ DB 68,15,86,29,63,35,0,0 ; orps 0x233f(%rip),%xmm11 # 4c80 <_sk_callback_sse41+0x813>
+ DB 68,15,88,37,71,35,0,0 ; addps 0x2347(%rip),%xmm12 # 4c90 <_sk_callback_sse41+0x823>
+ DB 15,40,21,80,35,0,0 ; movaps 0x2350(%rip),%xmm2 # 4ca0 <_sk_callback_sse41+0x833>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,82,35,0,0 ; addps 0x2352(%rip),%xmm11 # 4b60 <_sk_callback_sse41+0x845>
- DB 15,40,21,91,35,0,0 ; movaps 0x235b(%rip),%xmm2 # 4b70 <_sk_callback_sse41+0x855>
+ DB 68,15,88,29,80,35,0,0 ; addps 0x2350(%rip),%xmm11 # 4cb0 <_sk_callback_sse41+0x843>
+ DB 15,40,21,89,35,0,0 ; movaps 0x2359(%rip),%xmm2 # 4cc0 <_sk_callback_sse41+0x853>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,72,35,0,0 ; addps 0x2348(%rip),%xmm12 # 4b80 <_sk_callback_sse41+0x865>
- DB 15,40,21,81,35,0,0 ; movaps 0x2351(%rip),%xmm2 # 4b90 <_sk_callback_sse41+0x875>
+ DB 68,15,88,37,70,35,0,0 ; addps 0x2346(%rip),%xmm12 # 4cd0 <_sk_callback_sse41+0x863>
+ DB 15,40,21,79,35,0,0 ; movaps 0x234f(%rip),%xmm2 # 4ce0 <_sk_callback_sse41+0x873>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,81,35,0,0 ; movaps 0x2351(%rip),%xmm10 # 4ba0 <_sk_callback_sse41+0x885>
+ DB 68,15,40,21,79,35,0,0 ; movaps 0x234f(%rip),%xmm10 # 4cf0 <_sk_callback_sse41+0x883>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,86,35,0,0 ; movaps 0x2356(%rip),%xmm2 # 4bb0 <_sk_callback_sse41+0x895>
+ DB 15,40,21,84,35,0,0 ; movaps 0x2354(%rip),%xmm2 # 4d00 <_sk_callback_sse41+0x893>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,87,35,0,0 ; mulps 0x2357(%rip),%xmm2 # 4bc0 <_sk_callback_sse41+0x8a5>
+ DB 15,89,21,85,35,0,0 ; mulps 0x2355(%rip),%xmm2 # 4d10 <_sk_callback_sse41+0x8a3>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -13367,7 +13568,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,66,35,0,0 ; minps 0x2342(%rip),%xmm2 # 4bd0 <_sk_callback_sse41+0x8b5>
+ DB 15,93,21,64,35,0,0 ; minps 0x2340(%rip),%xmm2 # 4d20 <_sk_callback_sse41+0x8b3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -13395,31 +13596,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,227,34,0,0 ; mulps 0x22e3(%rip),%xmm12 # 4be0 <_sk_callback_sse41+0x8c5>
- DB 68,15,84,29,235,34,0,0 ; andps 0x22eb(%rip),%xmm11 # 4bf0 <_sk_callback_sse41+0x8d5>
- DB 68,15,86,29,243,34,0,0 ; orps 0x22f3(%rip),%xmm11 # 4c00 <_sk_callback_sse41+0x8e5>
- DB 68,15,88,37,251,34,0,0 ; addps 0x22fb(%rip),%xmm12 # 4c10 <_sk_callback_sse41+0x8f5>
- DB 15,40,29,4,35,0,0 ; movaps 0x2304(%rip),%xmm3 # 4c20 <_sk_callback_sse41+0x905>
+ DB 68,15,89,37,225,34,0,0 ; mulps 0x22e1(%rip),%xmm12 # 4d30 <_sk_callback_sse41+0x8c3>
+ DB 68,15,84,29,233,34,0,0 ; andps 0x22e9(%rip),%xmm11 # 4d40 <_sk_callback_sse41+0x8d3>
+ DB 68,15,86,29,241,34,0,0 ; orps 0x22f1(%rip),%xmm11 # 4d50 <_sk_callback_sse41+0x8e3>
+ DB 68,15,88,37,249,34,0,0 ; addps 0x22f9(%rip),%xmm12 # 4d60 <_sk_callback_sse41+0x8f3>
+ DB 15,40,29,2,35,0,0 ; movaps 0x2302(%rip),%xmm3 # 4d70 <_sk_callback_sse41+0x903>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,4,35,0,0 ; addps 0x2304(%rip),%xmm11 # 4c30 <_sk_callback_sse41+0x915>
- DB 15,40,29,13,35,0,0 ; movaps 0x230d(%rip),%xmm3 # 4c40 <_sk_callback_sse41+0x925>
+ DB 68,15,88,29,2,35,0,0 ; addps 0x2302(%rip),%xmm11 # 4d80 <_sk_callback_sse41+0x913>
+ DB 15,40,29,11,35,0,0 ; movaps 0x230b(%rip),%xmm3 # 4d90 <_sk_callback_sse41+0x923>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,250,34,0,0 ; addps 0x22fa(%rip),%xmm12 # 4c50 <_sk_callback_sse41+0x935>
- DB 15,40,29,3,35,0,0 ; movaps 0x2303(%rip),%xmm3 # 4c60 <_sk_callback_sse41+0x945>
+ DB 68,15,88,37,248,34,0,0 ; addps 0x22f8(%rip),%xmm12 # 4da0 <_sk_callback_sse41+0x933>
+ DB 15,40,29,1,35,0,0 ; movaps 0x2301(%rip),%xmm3 # 4db0 <_sk_callback_sse41+0x943>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,3,35,0,0 ; movaps 0x2303(%rip),%xmm10 # 4c70 <_sk_callback_sse41+0x955>
+ DB 68,15,40,21,1,35,0,0 ; movaps 0x2301(%rip),%xmm10 # 4dc0 <_sk_callback_sse41+0x953>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,8,35,0,0 ; movaps 0x2308(%rip),%xmm3 # 4c80 <_sk_callback_sse41+0x965>
+ DB 15,40,29,6,35,0,0 ; movaps 0x2306(%rip),%xmm3 # 4dd0 <_sk_callback_sse41+0x963>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,9,35,0,0 ; mulps 0x2309(%rip),%xmm3 # 4c90 <_sk_callback_sse41+0x975>
+ DB 15,89,29,7,35,0,0 ; mulps 0x2307(%rip),%xmm3 # 4de0 <_sk_callback_sse41+0x973>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -13427,7 +13628,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,244,34,0,0 ; minps 0x22f4(%rip),%xmm3 # 4ca0 <_sk_callback_sse41+0x985>
+ DB 15,93,29,242,34,0,0 ; minps 0x22f2(%rip),%xmm3 # 4df0 <_sk_callback_sse41+0x983>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -13435,29 +13636,29 @@ _sk_parametric_a_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,240,34,0,0 ; mulps 0x22f0(%rip),%xmm8 # 4cb0 <_sk_callback_sse41+0x995>
- DB 68,15,40,13,248,34,0,0 ; movaps 0x22f8(%rip),%xmm9 # 4cc0 <_sk_callback_sse41+0x9a5>
+ DB 68,15,89,5,238,34,0,0 ; mulps 0x22ee(%rip),%xmm8 # 4e00 <_sk_callback_sse41+0x993>
+ DB 68,15,40,13,246,34,0,0 ; movaps 0x22f6(%rip),%xmm9 # 4e10 <_sk_callback_sse41+0x9a3>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,253,34,0,0 ; movaps 0x22fd(%rip),%xmm0 # 4cd0 <_sk_callback_sse41+0x9b5>
+ DB 15,40,5,251,34,0,0 ; movaps 0x22fb(%rip),%xmm0 # 4e20 <_sk_callback_sse41+0x9b3>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,251,34,0,0 ; addps 0x22fb(%rip),%xmm8 # 4ce0 <_sk_callback_sse41+0x9c5>
- DB 68,15,89,5,3,35,0,0 ; mulps 0x2303(%rip),%xmm8 # 4cf0 <_sk_callback_sse41+0x9d5>
- DB 15,89,13,12,35,0,0 ; mulps 0x230c(%rip),%xmm1 # 4d00 <_sk_callback_sse41+0x9e5>
+ DB 68,15,88,5,249,34,0,0 ; addps 0x22f9(%rip),%xmm8 # 4e30 <_sk_callback_sse41+0x9c3>
+ DB 68,15,89,5,1,35,0,0 ; mulps 0x2301(%rip),%xmm8 # 4e40 <_sk_callback_sse41+0x9d3>
+ DB 15,89,13,10,35,0,0 ; mulps 0x230a(%rip),%xmm1 # 4e50 <_sk_callback_sse41+0x9e3>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,17,35,0,0 ; mulps 0x2311(%rip),%xmm2 # 4d10 <_sk_callback_sse41+0x9f5>
+ DB 15,89,21,15,35,0,0 ; mulps 0x230f(%rip),%xmm2 # 4e60 <_sk_callback_sse41+0x9f3>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,5,35,0,0 ; movaps 0x2305(%rip),%xmm9 # 4d20 <_sk_callback_sse41+0xa05>
+ DB 68,15,40,13,3,35,0,0 ; movaps 0x2303(%rip),%xmm9 # 4e70 <_sk_callback_sse41+0xa03>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,5,35,0,0 ; movaps 0x2305(%rip),%xmm2 # 4d30 <_sk_callback_sse41+0xa15>
+ DB 15,40,21,3,35,0,0 ; movaps 0x2303(%rip),%xmm2 # 4e80 <_sk_callback_sse41+0xa13>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,10,35,0,0 ; movaps 0x230a(%rip),%xmm12 # 4d40 <_sk_callback_sse41+0xa25>
+ DB 68,15,40,37,8,35,0,0 ; movaps 0x2308(%rip),%xmm12 # 4e90 <_sk_callback_sse41+0xa23>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -13476,8 +13677,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,195,34,0,0 ; mulps 0x22c3(%rip),%xmm1 # 4d50 <_sk_callback_sse41+0xa35>
- DB 15,89,21,204,34,0,0 ; mulps 0x22cc(%rip),%xmm2 # 4d60 <_sk_callback_sse41+0xa45>
+ DB 15,89,13,193,34,0,0 ; mulps 0x22c1(%rip),%xmm1 # 4ea0 <_sk_callback_sse41+0xa33>
+ DB 15,89,21,202,34,0,0 ; mulps 0x22ca(%rip),%xmm2 # 4eb0 <_sk_callback_sse41+0xa43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -13489,7 +13690,7 @@ _sk_load_a8_sse41 LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 102,15,56,49,4,56 ; pmovzxbd (%rax,%rdi,1),%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,188,34,0,0 ; mulps 0x22bc(%rip),%xmm3 # 4d70 <_sk_callback_sse41+0xa55>
+ DB 15,89,29,186,34,0,0 ; mulps 0x22ba(%rip),%xmm3 # 4ec0 <_sk_callback_sse41+0xa53>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
@@ -13520,7 +13721,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,80,34,0,0 ; mulps 0x2250(%rip),%xmm3 # 4d80 <_sk_callback_sse41+0xa65>
+ DB 15,89,29,78,34,0,0 ; mulps 0x224e(%rip),%xmm3 # 4ed0 <_sk_callback_sse41+0xa63>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -13531,7 +13732,7 @@ PUBLIC _sk_store_a8_sse41
_sk_store_a8_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,68,34,0,0 ; movaps 0x2244(%rip),%xmm8 # 4d90 <_sk_callback_sse41+0xa75>
+ DB 68,15,40,5,66,34,0,0 ; movaps 0x2242(%rip),%xmm8 # 4ee0 <_sk_callback_sse41+0xa73>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
@@ -13546,9 +13747,9 @@ _sk_load_g8_sse41 LABEL PROC
DB 72,139,0 ; mov (%rax),%rax
DB 102,15,56,49,4,56 ; pmovzxbd (%rax,%rdi,1),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,33,34,0,0 ; mulps 0x2221(%rip),%xmm0 # 4da0 <_sk_callback_sse41+0xa85>
+ DB 15,89,5,31,34,0,0 ; mulps 0x221f(%rip),%xmm0 # 4ef0 <_sk_callback_sse41+0xa83>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,40,34,0,0 ; movaps 0x2228(%rip),%xmm3 # 4db0 <_sk_callback_sse41+0xa95>
+ DB 15,40,29,38,34,0,0 ; movaps 0x2226(%rip),%xmm3 # 4f00 <_sk_callback_sse41+0xa93>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -13577,9 +13778,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,193,33,0,0 ; mulps 0x21c1(%rip),%xmm0 # 4dc0 <_sk_callback_sse41+0xaa5>
+ DB 15,89,5,191,33,0,0 ; mulps 0x21bf(%rip),%xmm0 # 4f10 <_sk_callback_sse41+0xaa3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,200,33,0,0 ; movaps 0x21c8(%rip),%xmm3 # 4dd0 <_sk_callback_sse41+0xab5>
+ DB 15,40,29,198,33,0,0 ; movaps 0x21c6(%rip),%xmm3 # 4f20 <_sk_callback_sse41+0xab3>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -13589,9 +13790,9 @@ _sk_gather_i8_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,192 ; mov %rax,%r8
DB 77,133,192 ; test %r8,%r8
- DB 116,5 ; je 2c1f <_sk_gather_i8_sse41+0xf>
+ DB 116,5 ; je 2d71 <_sk_gather_i8_sse41+0xf>
DB 76,137,192 ; mov %r8,%rax
- DB 235,2 ; jmp 2c21 <_sk_gather_i8_sse41+0x11>
+ DB 235,2 ; jmp 2d73 <_sk_gather_i8_sse41+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -13622,17 +13823,17 @@ _sk_gather_i8_sse41 LABEL PROC
DB 102,15,58,34,28,8,1 ; pinsrd $0x1,(%rax,%rcx,1),%xmm3
DB 102,66,15,58,34,28,144,2 ; pinsrd $0x2,(%rax,%r10,4),%xmm3
DB 102,66,15,58,34,28,8,3 ; pinsrd $0x3,(%rax,%r9,1),%xmm3
- DB 102,15,111,5,31,33,0,0 ; movdqa 0x211f(%rip),%xmm0 # 4de0 <_sk_callback_sse41+0xac5>
+ DB 102,15,111,5,29,33,0,0 ; movdqa 0x211d(%rip),%xmm0 # 4f30 <_sk_callback_sse41+0xac3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,32,33,0,0 ; movaps 0x2120(%rip),%xmm8 # 4df0 <_sk_callback_sse41+0xad5>
+ DB 68,15,40,5,30,33,0,0 ; movaps 0x211e(%rip),%xmm8 # 4f40 <_sk_callback_sse41+0xad3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,31,33,0,0 ; pshufb 0x211f(%rip),%xmm1 # 4e00 <_sk_callback_sse41+0xae5>
+ DB 102,15,56,0,13,29,33,0,0 ; pshufb 0x211d(%rip),%xmm1 # 4f50 <_sk_callback_sse41+0xae3>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,27,33,0,0 ; pshufb 0x211b(%rip),%xmm2 # 4e10 <_sk_callback_sse41+0xaf5>
+ DB 102,15,56,0,21,25,33,0,0 ; pshufb 0x2119(%rip),%xmm2 # 4f60 <_sk_callback_sse41+0xaf3>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -13646,19 +13847,19 @@ _sk_load_565_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 102,15,56,51,20,120 ; pmovzxwd (%rax,%rdi,2),%xmm2
- DB 102,15,111,5,1,33,0,0 ; movdqa 0x2101(%rip),%xmm0 # 4e20 <_sk_callback_sse41+0xb05>
+ DB 102,15,111,5,255,32,0,0 ; movdqa 0x20ff(%rip),%xmm0 # 4f70 <_sk_callback_sse41+0xb03>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,3,33,0,0 ; mulps 0x2103(%rip),%xmm0 # 4e30 <_sk_callback_sse41+0xb15>
- DB 102,15,111,13,11,33,0,0 ; movdqa 0x210b(%rip),%xmm1 # 4e40 <_sk_callback_sse41+0xb25>
+ DB 15,89,5,1,33,0,0 ; mulps 0x2101(%rip),%xmm0 # 4f80 <_sk_callback_sse41+0xb13>
+ DB 102,15,111,13,9,33,0,0 ; movdqa 0x2109(%rip),%xmm1 # 4f90 <_sk_callback_sse41+0xb23>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,13,33,0,0 ; mulps 0x210d(%rip),%xmm1 # 4e50 <_sk_callback_sse41+0xb35>
- DB 102,15,219,21,21,33,0,0 ; pand 0x2115(%rip),%xmm2 # 4e60 <_sk_callback_sse41+0xb45>
+ DB 15,89,13,11,33,0,0 ; mulps 0x210b(%rip),%xmm1 # 4fa0 <_sk_callback_sse41+0xb33>
+ DB 102,15,219,21,19,33,0,0 ; pand 0x2113(%rip),%xmm2 # 4fb0 <_sk_callback_sse41+0xb43>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,27,33,0,0 ; mulps 0x211b(%rip),%xmm2 # 4e70 <_sk_callback_sse41+0xb55>
+ DB 15,89,21,25,33,0,0 ; mulps 0x2119(%rip),%xmm2 # 4fc0 <_sk_callback_sse41+0xb53>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,34,33,0,0 ; movaps 0x2122(%rip),%xmm3 # 4e80 <_sk_callback_sse41+0xb65>
+ DB 15,40,29,32,33,0,0 ; movaps 0x2120(%rip),%xmm3 # 4fd0 <_sk_callback_sse41+0xb63>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_gather_565_sse41
@@ -13684,31 +13885,31 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,199,32,0,0 ; movdqa 0x20c7(%rip),%xmm0 # 4e90 <_sk_callback_sse41+0xb75>
+ DB 102,15,111,5,197,32,0,0 ; movdqa 0x20c5(%rip),%xmm0 # 4fe0 <_sk_callback_sse41+0xb73>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,201,32,0,0 ; mulps 0x20c9(%rip),%xmm0 # 4ea0 <_sk_callback_sse41+0xb85>
- DB 102,15,111,13,209,32,0,0 ; movdqa 0x20d1(%rip),%xmm1 # 4eb0 <_sk_callback_sse41+0xb95>
+ DB 15,89,5,199,32,0,0 ; mulps 0x20c7(%rip),%xmm0 # 4ff0 <_sk_callback_sse41+0xb83>
+ DB 102,15,111,13,207,32,0,0 ; movdqa 0x20cf(%rip),%xmm1 # 5000 <_sk_callback_sse41+0xb93>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,211,32,0,0 ; mulps 0x20d3(%rip),%xmm1 # 4ec0 <_sk_callback_sse41+0xba5>
- DB 102,15,219,21,219,32,0,0 ; pand 0x20db(%rip),%xmm2 # 4ed0 <_sk_callback_sse41+0xbb5>
+ DB 15,89,13,209,32,0,0 ; mulps 0x20d1(%rip),%xmm1 # 5010 <_sk_callback_sse41+0xba3>
+ DB 102,15,219,21,217,32,0,0 ; pand 0x20d9(%rip),%xmm2 # 5020 <_sk_callback_sse41+0xbb3>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,225,32,0,0 ; mulps 0x20e1(%rip),%xmm2 # 4ee0 <_sk_callback_sse41+0xbc5>
+ DB 15,89,21,223,32,0,0 ; mulps 0x20df(%rip),%xmm2 # 5030 <_sk_callback_sse41+0xbc3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,232,32,0,0 ; movaps 0x20e8(%rip),%xmm3 # 4ef0 <_sk_callback_sse41+0xbd5>
+ DB 15,40,29,230,32,0,0 ; movaps 0x20e6(%rip),%xmm3 # 5040 <_sk_callback_sse41+0xbd3>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_sse41
_sk_store_565_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,233,32,0,0 ; movaps 0x20e9(%rip),%xmm8 # 4f00 <_sk_callback_sse41+0xbe5>
+ DB 68,15,40,5,231,32,0,0 ; movaps 0x20e7(%rip),%xmm8 # 5050 <_sk_callback_sse41+0xbe3>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,222,32,0,0 ; movaps 0x20de(%rip),%xmm10 # 4f10 <_sk_callback_sse41+0xbf5>
+ DB 68,15,40,21,220,32,0,0 ; movaps 0x20dc(%rip),%xmm10 # 5060 <_sk_callback_sse41+0xbf3>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -13726,21 +13927,21 @@ _sk_load_4444_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 102,15,56,51,28,120 ; pmovzxwd (%rax,%rdi,2),%xmm3
- DB 102,15,111,5,169,32,0,0 ; movdqa 0x20a9(%rip),%xmm0 # 4f20 <_sk_callback_sse41+0xc05>
+ DB 102,15,111,5,167,32,0,0 ; movdqa 0x20a7(%rip),%xmm0 # 5070 <_sk_callback_sse41+0xc03>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,171,32,0,0 ; mulps 0x20ab(%rip),%xmm0 # 4f30 <_sk_callback_sse41+0xc15>
- DB 102,15,111,13,179,32,0,0 ; movdqa 0x20b3(%rip),%xmm1 # 4f40 <_sk_callback_sse41+0xc25>
+ DB 15,89,5,169,32,0,0 ; mulps 0x20a9(%rip),%xmm0 # 5080 <_sk_callback_sse41+0xc13>
+ DB 102,15,111,13,177,32,0,0 ; movdqa 0x20b1(%rip),%xmm1 # 5090 <_sk_callback_sse41+0xc23>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,181,32,0,0 ; mulps 0x20b5(%rip),%xmm1 # 4f50 <_sk_callback_sse41+0xc35>
- DB 102,15,111,21,189,32,0,0 ; movdqa 0x20bd(%rip),%xmm2 # 4f60 <_sk_callback_sse41+0xc45>
+ DB 15,89,13,179,32,0,0 ; mulps 0x20b3(%rip),%xmm1 # 50a0 <_sk_callback_sse41+0xc33>
+ DB 102,15,111,21,187,32,0,0 ; movdqa 0x20bb(%rip),%xmm2 # 50b0 <_sk_callback_sse41+0xc43>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,191,32,0,0 ; mulps 0x20bf(%rip),%xmm2 # 4f70 <_sk_callback_sse41+0xc55>
- DB 102,15,219,29,199,32,0,0 ; pand 0x20c7(%rip),%xmm3 # 4f80 <_sk_callback_sse41+0xc65>
+ DB 15,89,21,189,32,0,0 ; mulps 0x20bd(%rip),%xmm2 # 50c0 <_sk_callback_sse41+0xc53>
+ DB 102,15,219,29,197,32,0,0 ; pand 0x20c5(%rip),%xmm3 # 50d0 <_sk_callback_sse41+0xc63>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,205,32,0,0 ; mulps 0x20cd(%rip),%xmm3 # 4f90 <_sk_callback_sse41+0xc75>
+ DB 15,89,29,203,32,0,0 ; mulps 0x20cb(%rip),%xmm3 # 50e0 <_sk_callback_sse41+0xc73>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -13767,21 +13968,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,112,32,0,0 ; movdqa 0x2070(%rip),%xmm0 # 4fa0 <_sk_callback_sse41+0xc85>
+ DB 102,15,111,5,110,32,0,0 ; movdqa 0x206e(%rip),%xmm0 # 50f0 <_sk_callback_sse41+0xc83>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,114,32,0,0 ; mulps 0x2072(%rip),%xmm0 # 4fb0 <_sk_callback_sse41+0xc95>
- DB 102,15,111,13,122,32,0,0 ; movdqa 0x207a(%rip),%xmm1 # 4fc0 <_sk_callback_sse41+0xca5>
+ DB 15,89,5,112,32,0,0 ; mulps 0x2070(%rip),%xmm0 # 5100 <_sk_callback_sse41+0xc93>
+ DB 102,15,111,13,120,32,0,0 ; movdqa 0x2078(%rip),%xmm1 # 5110 <_sk_callback_sse41+0xca3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,124,32,0,0 ; mulps 0x207c(%rip),%xmm1 # 4fd0 <_sk_callback_sse41+0xcb5>
- DB 102,15,111,21,132,32,0,0 ; movdqa 0x2084(%rip),%xmm2 # 4fe0 <_sk_callback_sse41+0xcc5>
+ DB 15,89,13,122,32,0,0 ; mulps 0x207a(%rip),%xmm1 # 5120 <_sk_callback_sse41+0xcb3>
+ DB 102,15,111,21,130,32,0,0 ; movdqa 0x2082(%rip),%xmm2 # 5130 <_sk_callback_sse41+0xcc3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,134,32,0,0 ; mulps 0x2086(%rip),%xmm2 # 4ff0 <_sk_callback_sse41+0xcd5>
- DB 102,15,219,29,142,32,0,0 ; pand 0x208e(%rip),%xmm3 # 5000 <_sk_callback_sse41+0xce5>
+ DB 15,89,21,132,32,0,0 ; mulps 0x2084(%rip),%xmm2 # 5140 <_sk_callback_sse41+0xcd3>
+ DB 102,15,219,29,140,32,0,0 ; pand 0x208c(%rip),%xmm3 # 5150 <_sk_callback_sse41+0xce3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,148,32,0,0 ; mulps 0x2094(%rip),%xmm3 # 5010 <_sk_callback_sse41+0xcf5>
+ DB 15,89,29,146,32,0,0 ; mulps 0x2092(%rip),%xmm3 # 5160 <_sk_callback_sse41+0xcf3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -13789,7 +13990,7 @@ PUBLIC _sk_store_4444_sse41
_sk_store_4444_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,147,32,0,0 ; movaps 0x2093(%rip),%xmm8 # 5020 <_sk_callback_sse41+0xd05>
+ DB 68,15,40,5,145,32,0,0 ; movaps 0x2091(%rip),%xmm8 # 5170 <_sk_callback_sse41+0xd03>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -13817,17 +14018,17 @@ _sk_load_8888_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 15,16,28,184 ; movups (%rax,%rdi,4),%xmm3
- DB 15,40,5,50,32,0,0 ; movaps 0x2032(%rip),%xmm0 # 5030 <_sk_callback_sse41+0xd15>
+ DB 15,40,5,48,32,0,0 ; movaps 0x2030(%rip),%xmm0 # 5180 <_sk_callback_sse41+0xd13>
DB 15,84,195 ; andps %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,52,32,0,0 ; movaps 0x2034(%rip),%xmm8 # 5040 <_sk_callback_sse41+0xd25>
+ DB 68,15,40,5,50,32,0,0 ; movaps 0x2032(%rip),%xmm8 # 5190 <_sk_callback_sse41+0xd23>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
- DB 102,15,56,0,13,52,32,0,0 ; pshufb 0x2034(%rip),%xmm1 # 5050 <_sk_callback_sse41+0xd35>
+ DB 102,15,56,0,13,50,32,0,0 ; pshufb 0x2032(%rip),%xmm1 # 51a0 <_sk_callback_sse41+0xd33>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 102,15,56,0,21,49,32,0,0 ; pshufb 0x2031(%rip),%xmm2 # 5060 <_sk_callback_sse41+0xd45>
+ DB 102,15,56,0,21,47,32,0,0 ; pshufb 0x202f(%rip),%xmm2 # 51b0 <_sk_callback_sse41+0xd43>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -13856,17 +14057,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,67,15,58,34,28,145,2 ; pinsrd $0x2,(%r9,%r10,4),%xmm3
DB 102,65,15,58,34,28,137,3 ; pinsrd $0x3,(%r9,%rcx,4),%xmm3
- DB 102,15,111,5,202,31,0,0 ; movdqa 0x1fca(%rip),%xmm0 # 5070 <_sk_callback_sse41+0xd55>
+ DB 102,15,111,5,200,31,0,0 ; movdqa 0x1fc8(%rip),%xmm0 # 51c0 <_sk_callback_sse41+0xd53>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,203,31,0,0 ; movaps 0x1fcb(%rip),%xmm8 # 5080 <_sk_callback_sse41+0xd65>
+ DB 68,15,40,5,201,31,0,0 ; movaps 0x1fc9(%rip),%xmm8 # 51d0 <_sk_callback_sse41+0xd63>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,202,31,0,0 ; pshufb 0x1fca(%rip),%xmm1 # 5090 <_sk_callback_sse41+0xd75>
+ DB 102,15,56,0,13,200,31,0,0 ; pshufb 0x1fc8(%rip),%xmm1 # 51e0 <_sk_callback_sse41+0xd73>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,198,31,0,0 ; pshufb 0x1fc6(%rip),%xmm2 # 50a0 <_sk_callback_sse41+0xd85>
+ DB 102,15,56,0,21,196,31,0,0 ; pshufb 0x1fc4(%rip),%xmm2 # 51f0 <_sk_callback_sse41+0xd83>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -13879,7 +14080,7 @@ PUBLIC _sk_store_8888_sse41
_sk_store_8888_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,178,31,0,0 ; movaps 0x1fb2(%rip),%xmm8 # 50b0 <_sk_callback_sse41+0xd95>
+ DB 68,15,40,5,176,31,0,0 ; movaps 0x1fb0(%rip),%xmm8 # 5200 <_sk_callback_sse41+0xd93>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -13914,18 +14115,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,43,31,0,0 ; movdqa 0x1f2b(%rip),%xmm8 # 50c0 <_sk_callback_sse41+0xda5>
+ DB 102,68,15,111,5,41,31,0,0 ; movdqa 0x1f29(%rip),%xmm8 # 5210 <_sk_callback_sse41+0xda3>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,38,31,0,0 ; movdqa 0x1f26(%rip),%xmm3 # 50d0 <_sk_callback_sse41+0xdb5>
+ DB 102,15,111,29,36,31,0,0 ; movdqa 0x1f24(%rip),%xmm3 # 5220 <_sk_callback_sse41+0xdb3>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,18,31,0,0 ; movdqa 0x1f12(%rip),%xmm10 # 50e0 <_sk_callback_sse41+0xdc5>
+ DB 102,68,15,111,21,16,31,0,0 ; movdqa 0x1f10(%rip),%xmm10 # 5230 <_sk_callback_sse41+0xdc3>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -13996,18 +14197,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,208,29,0,0 ; movdqa 0x1dd0(%rip),%xmm8 # 50f0 <_sk_callback_sse41+0xdd5>
+ DB 102,68,15,111,5,206,29,0,0 ; movdqa 0x1dce(%rip),%xmm8 # 5240 <_sk_callback_sse41+0xdd3>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,203,29,0,0 ; movdqa 0x1dcb(%rip),%xmm3 # 5100 <_sk_callback_sse41+0xde5>
+ DB 102,15,111,29,201,29,0,0 ; movdqa 0x1dc9(%rip),%xmm3 # 5250 <_sk_callback_sse41+0xde3>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,183,29,0,0 ; movdqa 0x1db7(%rip),%xmm10 # 5110 <_sk_callback_sse41+0xdf5>
+ DB 102,68,15,111,21,181,29,0,0 ; movdqa 0x1db5(%rip),%xmm10 # 5260 <_sk_callback_sse41+0xdf3>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -14053,17 +14254,17 @@ PUBLIC _sk_store_f16_sse41
_sk_store_f16_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 102,68,15,111,21,237,28,0,0 ; movdqa 0x1ced(%rip),%xmm10 # 5120 <_sk_callback_sse41+0xe05>
+ DB 102,68,15,111,21,235,28,0,0 ; movdqa 0x1ceb(%rip),%xmm10 # 5270 <_sk_callback_sse41+0xe03>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,219,234 ; pand %xmm10,%xmm13
DB 102,69,15,239,229 ; pxor %xmm13,%xmm12
- DB 102,68,15,111,13,224,28,0,0 ; movdqa 0x1ce0(%rip),%xmm9 # 5130 <_sk_callback_sse41+0xe15>
+ DB 102,68,15,111,13,222,28,0,0 ; movdqa 0x1cde(%rip),%xmm9 # 5280 <_sk_callback_sse41+0xe13>
DB 102,65,15,114,213,16 ; psrld $0x10,%xmm13
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,196 ; pcmpgtd %xmm12,%xmm8
DB 102,65,15,114,212,13 ; psrld $0xd,%xmm12
- DB 102,68,15,111,29,209,28,0,0 ; movdqa 0x1cd1(%rip),%xmm11 # 5140 <_sk_callback_sse41+0xe25>
+ DB 102,68,15,111,29,207,28,0,0 ; movdqa 0x1ccf(%rip),%xmm11 # 5290 <_sk_callback_sse41+0xe23>
DB 102,69,15,235,235 ; por %xmm11,%xmm13
DB 102,69,15,254,236 ; paddd %xmm12,%xmm13
DB 102,69,15,223,197 ; pandn %xmm13,%xmm8
@@ -14131,7 +14332,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,160,27,0,0 ; movaps 0x1ba0(%rip),%xmm8 # 5150 <_sk_callback_sse41+0xe35>
+ DB 68,15,40,5,158,27,0,0 ; movaps 0x1b9e(%rip),%xmm8 # 52a0 <_sk_callback_sse41+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -14181,7 +14382,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,193 ; por %xmm1,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,225,26,0,0 ; movaps 0x1ae1(%rip),%xmm8 # 5160 <_sk_callback_sse41+0xe45>
+ DB 68,15,40,5,223,26,0,0 ; movaps 0x1adf(%rip),%xmm8 # 52b0 <_sk_callback_sse41+0xe43>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -14198,14 +14399,14 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,168,26,0,0 ; movaps 0x1aa8(%rip),%xmm3 # 5170 <_sk_callback_sse41+0xe55>
+ DB 15,40,29,166,26,0,0 ; movaps 0x1aa6(%rip),%xmm3 # 52c0 <_sk_callback_sse41+0xe53>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_u16_be_sse41
_sk_store_u16_be_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,13,169,26,0,0 ; movaps 0x1aa9(%rip),%xmm9 # 5180 <_sk_callback_sse41+0xe65>
+ DB 68,15,40,13,167,26,0,0 ; movaps 0x1aa7(%rip),%xmm9 # 52d0 <_sk_callback_sse41+0xe63>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -14398,10 +14599,10 @@ _sk_mirror_y_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,5,24,0,0 ; mulps 0x1805(%rip),%xmm0 # 5190 <_sk_callback_sse41+0xe75>
- DB 15,89,13,14,24,0,0 ; mulps 0x180e(%rip),%xmm1 # 51a0 <_sk_callback_sse41+0xe85>
+ DB 15,89,5,3,24,0,0 ; mulps 0x1803(%rip),%xmm0 # 52e0 <_sk_callback_sse41+0xe73>
+ DB 15,89,13,12,24,0,0 ; mulps 0x180c(%rip),%xmm1 # 52f0 <_sk_callback_sse41+0xe83>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,20,24,0,0 ; mulps 0x1814(%rip),%xmm3 # 51b0 <_sk_callback_sse41+0xe95>
+ DB 15,89,29,18,24,0,0 ; mulps 0x1812(%rip),%xmm3 # 5300 <_sk_callback_sse41+0xe93>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -14624,7 +14825,7 @@ _sk_gradient_sse41 LABEL PROC
DB 69,15,198,237,0 ; shufps $0x0,%xmm13,%xmm13
DB 72,139,8 ; mov (%rax),%rcx
DB 72,133,201 ; test %rcx,%rcx
- DB 15,132,4,1,0,0 ; je 3e44 <_sk_gradient_sse41+0x13e>
+ DB 15,132,4,1,0,0 ; je 3f96 <_sk_gradient_sse41+0x13e>
DB 72,131,236,88 ; sub $0x58,%rsp
DB 15,41,36,36 ; movaps %xmm4,(%rsp)
DB 15,41,108,36,16 ; movaps %xmm5,0x10(%rsp)
@@ -14675,13 +14876,13 @@ _sk_gradient_sse41 LABEL PROC
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 72,131,192,36 ; add $0x24,%rax
DB 72,255,201 ; dec %rcx
- DB 15,133,65,255,255,255 ; jne 3d6c <_sk_gradient_sse41+0x66>
+ DB 15,133,65,255,255,255 ; jne 3ebe <_sk_gradient_sse41+0x66>
DB 15,40,124,36,48 ; movaps 0x30(%rsp),%xmm7
DB 15,40,116,36,32 ; movaps 0x20(%rsp),%xmm6
DB 15,40,108,36,16 ; movaps 0x10(%rsp),%xmm5
DB 15,40,36,36 ; movaps (%rsp),%xmm4
DB 72,131,196,88 ; add $0x58,%rsp
- DB 235,13 ; jmp 3e51 <_sk_gradient_sse41+0x14b>
+ DB 235,13 ; jmp 3fa3 <_sk_gradient_sse41+0x14b>
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
@@ -14746,26 +14947,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,151,18,0,0 ; movaps 0x1297(%rip),%xmm10 # 51c0 <_sk_callback_sse41+0xea5>
+ DB 68,15,40,21,149,18,0,0 ; movaps 0x1295(%rip),%xmm10 # 5310 <_sk_callback_sse41+0xea3>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,155,18,0,0 ; addps 0x129b(%rip),%xmm10 # 51d0 <_sk_callback_sse41+0xeb5>
+ DB 68,15,88,21,153,18,0,0 ; addps 0x1299(%rip),%xmm10 # 5320 <_sk_callback_sse41+0xeb3>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,159,18,0,0 ; addps 0x129f(%rip),%xmm10 # 51e0 <_sk_callback_sse41+0xec5>
+ DB 68,15,88,21,157,18,0,0 ; addps 0x129d(%rip),%xmm10 # 5330 <_sk_callback_sse41+0xec3>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,163,18,0,0 ; addps 0x12a3(%rip),%xmm10 # 51f0 <_sk_callback_sse41+0xed5>
+ DB 68,15,88,21,161,18,0,0 ; addps 0x12a1(%rip),%xmm10 # 5340 <_sk_callback_sse41+0xed3>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,162,18,0,0 ; movaps 0x12a2(%rip),%xmm11 # 5200 <_sk_callback_sse41+0xee5>
+ DB 68,15,40,29,160,18,0,0 ; movaps 0x12a0(%rip),%xmm11 # 5350 <_sk_callback_sse41+0xee3>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,155,18,0,0 ; movaps 0x129b(%rip),%xmm11 # 5210 <_sk_callback_sse41+0xef5>
+ DB 68,15,40,29,153,18,0,0 ; movaps 0x1299(%rip),%xmm11 # 5360 <_sk_callback_sse41+0xef3>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,141,18,0,0 ; movaps 0x128d(%rip),%xmm9 # 5220 <_sk_callback_sse41+0xf05>
+ DB 68,15,40,13,139,18,0,0 ; movaps 0x128b(%rip),%xmm9 # 5370 <_sk_callback_sse41+0xf03>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -14788,7 +14989,7 @@ _sk_xy_to_radius_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,94,18,0,0 ; movaps 0x125e(%rip),%xmm8 # 5230 <_sk_callback_sse41+0xf15>
+ DB 68,15,40,5,92,18,0,0 ; movaps 0x125c(%rip),%xmm8 # 5380 <_sk_callback_sse41+0xf13>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -14828,8 +15029,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,224,17,0,0 ; addps 0x11e0(%rip),%xmm0 # 5240 <_sk_callback_sse41+0xf25>
- DB 68,15,40,13,232,17,0,0 ; movaps 0x11e8(%rip),%xmm9 # 5250 <_sk_callback_sse41+0xf35>
+ DB 15,88,5,222,17,0,0 ; addps 0x11de(%rip),%xmm0 # 5390 <_sk_callback_sse41+0xf23>
+ DB 68,15,40,13,230,17,0,0 ; movaps 0x11e6(%rip),%xmm9 # 53a0 <_sk_callback_sse41+0xf33>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14840,7 +15041,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,215,17,0,0 ; addps 0x11d7(%rip),%xmm0 # 5260 <_sk_callback_sse41+0xf45>
+ DB 15,88,5,213,17,0,0 ; addps 0x11d5(%rip),%xmm0 # 53b0 <_sk_callback_sse41+0xf43>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -14850,8 +15051,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,201,17,0,0 ; addps 0x11c9(%rip),%xmm1 # 5270 <_sk_callback_sse41+0xf55>
- DB 68,15,40,13,209,17,0,0 ; movaps 0x11d1(%rip),%xmm9 # 5280 <_sk_callback_sse41+0xf65>
+ DB 15,88,13,199,17,0,0 ; addps 0x11c7(%rip),%xmm1 # 53c0 <_sk_callback_sse41+0xf53>
+ DB 68,15,40,13,207,17,0,0 ; movaps 0x11cf(%rip),%xmm9 # 53d0 <_sk_callback_sse41+0xf63>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14862,7 +15063,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,191,17,0,0 ; addps 0x11bf(%rip),%xmm1 # 5290 <_sk_callback_sse41+0xf75>
+ DB 15,88,13,189,17,0,0 ; addps 0x11bd(%rip),%xmm1 # 53e0 <_sk_callback_sse41+0xf73>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -14872,13 +15073,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,178,17,0,0 ; addps 0x11b2(%rip),%xmm0 # 52a0 <_sk_callback_sse41+0xf85>
- DB 68,15,40,13,186,17,0,0 ; movaps 0x11ba(%rip),%xmm9 # 52b0 <_sk_callback_sse41+0xf95>
+ DB 15,88,5,176,17,0,0 ; addps 0x11b0(%rip),%xmm0 # 53f0 <_sk_callback_sse41+0xf83>
+ DB 68,15,40,13,184,17,0,0 ; movaps 0x11b8(%rip),%xmm9 # 5400 <_sk_callback_sse41+0xf93>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,182,17,0,0 ; mulps 0x11b6(%rip),%xmm9 # 52c0 <_sk_callback_sse41+0xfa5>
- DB 68,15,88,13,190,17,0,0 ; addps 0x11be(%rip),%xmm9 # 52d0 <_sk_callback_sse41+0xfb5>
+ DB 68,15,89,13,180,17,0,0 ; mulps 0x11b4(%rip),%xmm9 # 5410 <_sk_callback_sse41+0xfa3>
+ DB 68,15,88,13,188,17,0,0 ; addps 0x11bc(%rip),%xmm9 # 5420 <_sk_callback_sse41+0xfb3>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14889,16 +15090,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,173,17,0,0 ; addps 0x11ad(%rip),%xmm0 # 52e0 <_sk_callback_sse41+0xfc5>
- DB 68,15,40,13,181,17,0,0 ; movaps 0x11b5(%rip),%xmm9 # 52f0 <_sk_callback_sse41+0xfd5>
+ DB 15,88,5,171,17,0,0 ; addps 0x11ab(%rip),%xmm0 # 5430 <_sk_callback_sse41+0xfc3>
+ DB 68,15,40,13,179,17,0,0 ; movaps 0x11b3(%rip),%xmm9 # 5440 <_sk_callback_sse41+0xfd3>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,185,17,0,0 ; movaps 0x11b9(%rip),%xmm8 # 5300 <_sk_callback_sse41+0xfe5>
+ DB 68,15,40,5,183,17,0,0 ; movaps 0x11b7(%rip),%xmm8 # 5450 <_sk_callback_sse41+0xfe3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,189,17,0,0 ; addps 0x11bd(%rip),%xmm8 # 5310 <_sk_callback_sse41+0xff5>
+ DB 68,15,88,5,187,17,0,0 ; addps 0x11bb(%rip),%xmm8 # 5460 <_sk_callback_sse41+0xff3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,193,17,0,0 ; addps 0x11c1(%rip),%xmm8 # 5320 <_sk_callback_sse41+0x1005>
+ DB 68,15,88,5,191,17,0,0 ; addps 0x11bf(%rip),%xmm8 # 5470 <_sk_callback_sse41+0x1003>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,197,17,0,0 ; addps 0x11c5(%rip),%xmm8 # 5330 <_sk_callback_sse41+0x1015>
+ DB 68,15,88,5,195,17,0,0 ; addps 0x11c3(%rip),%xmm8 # 5480 <_sk_callback_sse41+0x1013>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -14906,17 +15107,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,191,17,0,0 ; movaps 0x11bf(%rip),%xmm8 # 5340 <_sk_callback_sse41+0x1025>
+ DB 68,15,40,5,189,17,0,0 ; movaps 0x11bd(%rip),%xmm8 # 5490 <_sk_callback_sse41+0x1023>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,187,17,0,0 ; movaps 0x11bb(%rip),%xmm10 # 5350 <_sk_callback_sse41+0x1035>
+ DB 68,15,40,21,185,17,0,0 ; movaps 0x11b9(%rip),%xmm10 # 54a0 <_sk_callback_sse41+0x1033>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,191,17,0,0 ; addps 0x11bf(%rip),%xmm10 # 5360 <_sk_callback_sse41+0x1045>
+ DB 68,15,88,21,189,17,0,0 ; addps 0x11bd(%rip),%xmm10 # 54b0 <_sk_callback_sse41+0x1043>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,187,17,0,0 ; addps 0x11bb(%rip),%xmm10 # 5370 <_sk_callback_sse41+0x1055>
+ DB 68,15,88,21,185,17,0,0 ; addps 0x11b9(%rip),%xmm10 # 54c0 <_sk_callback_sse41+0x1053>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -14926,11 +15127,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,174,17,0,0 ; addps 0x11ae(%rip),%xmm0 # 5380 <_sk_callback_sse41+0x1065>
+ DB 15,88,5,172,17,0,0 ; addps 0x11ac(%rip),%xmm0 # 54d0 <_sk_callback_sse41+0x1063>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,174,17,0,0 ; mulps 0x11ae(%rip),%xmm8 # 5390 <_sk_callback_sse41+0x1075>
- DB 68,15,88,5,182,17,0,0 ; addps 0x11b6(%rip),%xmm8 # 53a0 <_sk_callback_sse41+0x1085>
+ DB 68,15,89,5,172,17,0,0 ; mulps 0x11ac(%rip),%xmm8 # 54e0 <_sk_callback_sse41+0x1073>
+ DB 68,15,88,5,180,17,0,0 ; addps 0x11b4(%rip),%xmm8 # 54f0 <_sk_callback_sse41+0x1083>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14941,13 +15142,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,164,17,0,0 ; addps 0x11a4(%rip),%xmm1 # 53b0 <_sk_callback_sse41+0x1095>
- DB 68,15,40,13,172,17,0,0 ; movaps 0x11ac(%rip),%xmm9 # 53c0 <_sk_callback_sse41+0x10a5>
+ DB 15,88,13,162,17,0,0 ; addps 0x11a2(%rip),%xmm1 # 5500 <_sk_callback_sse41+0x1093>
+ DB 68,15,40,13,170,17,0,0 ; movaps 0x11aa(%rip),%xmm9 # 5510 <_sk_callback_sse41+0x10a3>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,168,17,0,0 ; mulps 0x11a8(%rip),%xmm9 # 53d0 <_sk_callback_sse41+0x10b5>
- DB 68,15,88,13,176,17,0,0 ; addps 0x11b0(%rip),%xmm9 # 53e0 <_sk_callback_sse41+0x10c5>
+ DB 68,15,89,13,166,17,0,0 ; mulps 0x11a6(%rip),%xmm9 # 5520 <_sk_callback_sse41+0x10b3>
+ DB 68,15,88,13,174,17,0,0 ; addps 0x11ae(%rip),%xmm9 # 5530 <_sk_callback_sse41+0x10c3>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14958,16 +15159,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,158,17,0,0 ; addps 0x119e(%rip),%xmm1 # 53f0 <_sk_callback_sse41+0x10d5>
- DB 68,15,40,13,166,17,0,0 ; movaps 0x11a6(%rip),%xmm9 # 5400 <_sk_callback_sse41+0x10e5>
+ DB 15,88,13,156,17,0,0 ; addps 0x119c(%rip),%xmm1 # 5540 <_sk_callback_sse41+0x10d3>
+ DB 68,15,40,13,164,17,0,0 ; movaps 0x11a4(%rip),%xmm9 # 5550 <_sk_callback_sse41+0x10e3>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,170,17,0,0 ; movaps 0x11aa(%rip),%xmm8 # 5410 <_sk_callback_sse41+0x10f5>
+ DB 68,15,40,5,168,17,0,0 ; movaps 0x11a8(%rip),%xmm8 # 5560 <_sk_callback_sse41+0x10f3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,174,17,0,0 ; addps 0x11ae(%rip),%xmm8 # 5420 <_sk_callback_sse41+0x1105>
+ DB 68,15,88,5,172,17,0,0 ; addps 0x11ac(%rip),%xmm8 # 5570 <_sk_callback_sse41+0x1103>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,178,17,0,0 ; addps 0x11b2(%rip),%xmm8 # 5430 <_sk_callback_sse41+0x1115>
+ DB 68,15,88,5,176,17,0,0 ; addps 0x11b0(%rip),%xmm8 # 5580 <_sk_callback_sse41+0x1113>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,182,17,0,0 ; addps 0x11b6(%rip),%xmm8 # 5440 <_sk_callback_sse41+0x1125>
+ DB 68,15,88,5,180,17,0,0 ; addps 0x11b4(%rip),%xmm8 # 5590 <_sk_callback_sse41+0x1123>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -14975,17 +15176,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,176,17,0,0 ; movaps 0x11b0(%rip),%xmm8 # 5450 <_sk_callback_sse41+0x1135>
+ DB 68,15,40,5,174,17,0,0 ; movaps 0x11ae(%rip),%xmm8 # 55a0 <_sk_callback_sse41+0x1133>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,171,17,0,0 ; movaps 0x11ab(%rip),%xmm10 # 5460 <_sk_callback_sse41+0x1145>
+ DB 68,15,40,21,169,17,0,0 ; movaps 0x11a9(%rip),%xmm10 # 55b0 <_sk_callback_sse41+0x1143>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,175,17,0,0 ; addps 0x11af(%rip),%xmm10 # 5470 <_sk_callback_sse41+0x1155>
+ DB 68,15,88,21,173,17,0,0 ; addps 0x11ad(%rip),%xmm10 # 55c0 <_sk_callback_sse41+0x1153>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,171,17,0,0 ; addps 0x11ab(%rip),%xmm10 # 5480 <_sk_callback_sse41+0x1165>
+ DB 68,15,88,21,169,17,0,0 ; addps 0x11a9(%rip),%xmm10 # 55d0 <_sk_callback_sse41+0x1163>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -14995,11 +15196,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,157,17,0,0 ; addps 0x119d(%rip),%xmm1 # 5490 <_sk_callback_sse41+0x1175>
+ DB 15,88,13,155,17,0,0 ; addps 0x119b(%rip),%xmm1 # 55e0 <_sk_callback_sse41+0x1173>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,157,17,0,0 ; mulps 0x119d(%rip),%xmm8 # 54a0 <_sk_callback_sse41+0x1185>
- DB 68,15,88,5,165,17,0,0 ; addps 0x11a5(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0x1195>
+ DB 68,15,89,5,155,17,0,0 ; mulps 0x119b(%rip),%xmm8 # 55f0 <_sk_callback_sse41+0x1183>
+ DB 68,15,88,5,163,17,0,0 ; addps 0x11a3(%rip),%xmm8 # 5600 <_sk_callback_sse41+0x1193>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -15204,17 +15405,12 @@ ALIGN 16
DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 45a8 <.literal16+0x1d8>
- DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 45ac <.literal16+0x1dc>
- DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 45b0 <.literal16+0x1e0>
+ DB 224,64 ; loopne 46f8 <.literal16+0x1d8>
DB 0,0 ; add %al,(%rax)
- DB 128,63,0 ; cmpb $0x0,(%rdi)
- DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
- DB 63 ; (bad)
+ DB 224,64 ; loopne 46fc <.literal16+0x1dc>
DB 0,0 ; add %al,(%rax)
- DB 128,63,154 ; cmpb $0x9a,(%rdi)
+ DB 224,64 ; loopne 4700 <.literal16+0x1e0>
+ DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,154 ; ds (bad)
@@ -15233,13 +15429,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 45e1 <.literal16+0x211>
+ DB 71,225,61 ; rex.RXB loope 4721 <.literal16+0x201>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 45e5 <.literal16+0x215>
+ DB 71,225,61 ; rex.RXB loope 4725 <.literal16+0x205>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 45e9 <.literal16+0x219>
+ DB 71,225,61 ; rex.RXB loope 4729 <.literal16+0x209>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 45ed <.literal16+0x21d>
+ DB 71,225,61 ; rex.RXB loope 472d <.literal16+0x20d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -15264,13 +15460,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4621 <.literal16+0x251>
+ DB 71,225,61 ; rex.RXB loope 4761 <.literal16+0x241>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4625 <.literal16+0x255>
+ DB 71,225,61 ; rex.RXB loope 4765 <.literal16+0x245>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4629 <.literal16+0x259>
+ DB 71,225,61 ; rex.RXB loope 4769 <.literal16+0x249>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 462d <.literal16+0x25d>
+ DB 71,225,61 ; rex.RXB loope 476d <.literal16+0x24d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -15295,13 +15491,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4661 <.literal16+0x291>
+ DB 71,225,61 ; rex.RXB loope 47a1 <.literal16+0x281>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4665 <.literal16+0x295>
+ DB 71,225,61 ; rex.RXB loope 47a5 <.literal16+0x285>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4669 <.literal16+0x299>
+ DB 71,225,61 ; rex.RXB loope 47a9 <.literal16+0x289>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 466d <.literal16+0x29d>
+ DB 71,225,61 ; rex.RXB loope 47ad <.literal16+0x28d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -15326,13 +15522,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 46a1 <.literal16+0x2d1>
+ DB 71,225,61 ; rex.RXB loope 47e1 <.literal16+0x2c1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 46a5 <.literal16+0x2d5>
+ DB 71,225,61 ; rex.RXB loope 47e5 <.literal16+0x2c5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 46a9 <.literal16+0x2d9>
+ DB 71,225,61 ; rex.RXB loope 47e9 <.literal16+0x2c9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 46ad <.literal16+0x2dd>
+ DB 71,225,61 ; rex.RXB loope 47ed <.literal16+0x2cd>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -15349,7 +15545,12 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
DB 63 ; (bad)
- DB 145 ; xchg %eax,%ecx
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,0 ; cmpb $0x0,(%rdi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
+ DB 63 ; (bad)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,145 ; cmpb $0x91,(%rdi)
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
DB 145 ; xchg %eax,%ecx
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
@@ -15551,13 +15752,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4869 <.literal16+0x499>
+ DB 224,7 ; loopne 49b9 <.literal16+0x499>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 486d <.literal16+0x49d>
+ DB 224,7 ; loopne 49bd <.literal16+0x49d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4871 <.literal16+0x4a1>
+ DB 224,7 ; loopne 49c1 <.literal16+0x4a1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4875 <.literal16+0x4a5>
+ DB 224,7 ; loopne 49c5 <.literal16+0x4a5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -15591,10 +15792,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0048b8 <_sk_callback_sse41+0xa00059d>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a004a08 <_sk_callback_sse41+0xa00059b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30048c0 <_sk_callback_sse41+0x30005a5>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3004a10 <_sk_callback_sse41+0x30005a3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -15649,11 +15850,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 498b <.literal16+0x5bb>
+ DB 127,67 ; jg 4adb <.literal16+0x5bb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 498f <.literal16+0x5bf>
+ DB 127,67 ; jg 4adf <.literal16+0x5bf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4993 <.literal16+0x5c3>
+ DB 127,67 ; jg 4ae3 <.literal16+0x5c3>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -15668,16 +15869,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4984 <.literal16+0x5b4>
+ DB 127,0 ; jg 4ad4 <.literal16+0x5b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4988 <.literal16+0x5b8>
+ DB 127,0 ; jg 4ad8 <.literal16+0x5b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 498c <.literal16+0x5bc>
+ DB 127,0 ; jg 4adc <.literal16+0x5bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4990 <.literal16+0x5c0>
+ DB 127,0 ; jg 4ae0 <.literal16+0x5c0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -15686,7 +15887,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4a15 <.literal16+0x645>
+ DB 119,115 ; ja 4b65 <.literal16+0x645>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -15697,7 +15898,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 4979 <.literal16+0x5a9>
+ DB 117,191 ; jne 4ac9 <.literal16+0x5a9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -15709,7 +15910,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a389ba <_sk_callback_sse41+0xffffffffe9a3469f>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a38b0a <_sk_callback_sse41+0xffffffffe9a3469d>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -15764,16 +15965,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4a54 <.literal16+0x684>
+ DB 127,0 ; jg 4ba4 <.literal16+0x684>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4a58 <.literal16+0x688>
+ DB 127,0 ; jg 4ba8 <.literal16+0x688>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4a5c <.literal16+0x68c>
+ DB 127,0 ; jg 4bac <.literal16+0x68c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4a60 <.literal16+0x690>
+ DB 127,0 ; jg 4bb0 <.literal16+0x690>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -15782,7 +15983,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4ae5 <.literal16+0x715>
+ DB 119,115 ; ja 4c35 <.literal16+0x715>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -15793,7 +15994,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 4a49 <.literal16+0x679>
+ DB 117,191 ; jne 4b99 <.literal16+0x679>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -15805,7 +16006,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a38a8a <_sk_callback_sse41+0xffffffffe9a3476f>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a38bda <_sk_callback_sse41+0xffffffffe9a3476d>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -15860,16 +16061,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4b24 <.literal16+0x754>
+ DB 127,0 ; jg 4c74 <.literal16+0x754>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4b28 <.literal16+0x758>
+ DB 127,0 ; jg 4c78 <.literal16+0x758>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4b2c <.literal16+0x75c>
+ DB 127,0 ; jg 4c7c <.literal16+0x75c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4b30 <.literal16+0x760>
+ DB 127,0 ; jg 4c80 <.literal16+0x760>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -15878,7 +16079,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4bb5 <.literal16+0x7e5>
+ DB 119,115 ; ja 4d05 <.literal16+0x7e5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -15889,7 +16090,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 4b19 <.literal16+0x749>
+ DB 117,191 ; jne 4c69 <.literal16+0x749>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -15901,7 +16102,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a38b5a <_sk_callback_sse41+0xffffffffe9a3483f>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a38caa <_sk_callback_sse41+0xffffffffe9a3483d>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -15956,16 +16157,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4bf4 <.literal16+0x824>
+ DB 127,0 ; jg 4d44 <.literal16+0x824>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4bf8 <.literal16+0x828>
+ DB 127,0 ; jg 4d48 <.literal16+0x828>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4bfc <.literal16+0x82c>
+ DB 127,0 ; jg 4d4c <.literal16+0x82c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4c00 <.literal16+0x830>
+ DB 127,0 ; jg 4d50 <.literal16+0x830>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -15974,7 +16175,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4c85 <.literal16+0x8b5>
+ DB 119,115 ; ja 4dd5 <.literal16+0x8b5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -15985,7 +16186,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 4be9 <.literal16+0x819>
+ DB 117,191 ; jne 4d39 <.literal16+0x819>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -15997,7 +16198,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a38c2a <_sk_callback_sse41+0xffffffffe9a3490f>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a38d7a <_sk_callback_sse41+0xffffffffe9a3490d>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -16048,13 +16249,13 @@ ALIGN 16
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 4d07 <.literal16+0x937>
+ DB 127,67 ; jg 4e57 <.literal16+0x937>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4d0b <.literal16+0x93b>
+ DB 127,67 ; jg 4e5b <.literal16+0x93b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4d0f <.literal16+0x93f>
+ DB 127,67 ; jg 4e5f <.literal16+0x93f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4d13 <.literal16+0x943>
+ DB 127,67 ; jg 4e63 <.literal16+0x943>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -16101,16 +16302,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 4d93 <.literal16+0x9c3>
+ DB 118,63 ; jbe 4ee3 <.literal16+0x9c3>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 4d97 <.literal16+0x9c7>
+ DB 118,63 ; jbe 4ee7 <.literal16+0x9c7>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 4d9b <.literal16+0x9cb>
+ DB 118,63 ; jbe 4eeb <.literal16+0x9cb>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 4d9f <.literal16+0x9cf>
+ DB 118,63 ; jbe 4eef <.literal16+0x9cf>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -16122,11 +16323,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4ddb <.literal16+0xa0b>
+ DB 127,67 ; jg 4f2b <.literal16+0xa0b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4ddf <.literal16+0xa0f>
+ DB 127,67 ; jg 4f2f <.literal16+0xa0f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4de3 <.literal16+0xa13>
+ DB 127,67 ; jg 4f33 <.literal16+0xa13>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,128,63 ; addb $0x3f,-0x7fffffc5(%rax)
@@ -16155,7 +16356,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3004e10 <_sk_callback_sse41+0x3000af5>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3004f60 <_sk_callback_sse41+0x3000af3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -16184,13 +16385,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4e49 <.literal16+0xa79>
+ DB 224,7 ; loopne 4f99 <.literal16+0xa79>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4e4d <.literal16+0xa7d>
+ DB 224,7 ; loopne 4f9d <.literal16+0xa7d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4e51 <.literal16+0xa81>
+ DB 224,7 ; loopne 4fa1 <.literal16+0xa81>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4e55 <.literal16+0xa85>
+ DB 224,7 ; loopne 4fa5 <.literal16+0xa85>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -16236,13 +16437,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4eb9 <.literal16+0xae9>
+ DB 224,7 ; loopne 5009 <.literal16+0xae9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4ebd <.literal16+0xaed>
+ DB 224,7 ; loopne 500d <.literal16+0xaed>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4ec1 <.literal16+0xaf1>
+ DB 224,7 ; loopne 5011 <.literal16+0xaf1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4ec5 <.literal16+0xaf5>
+ DB 224,7 ; loopne 5015 <.literal16+0xaf5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -16280,13 +16481,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 4f56 <.literal16+0xb86>
+ DB 124,66 ; jl 50a6 <.literal16+0xb86>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 4f5a <.literal16+0xb8a>
+ DB 124,66 ; jl 50aa <.literal16+0xb8a>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 4f5e <.literal16+0xb8e>
+ DB 124,66 ; jl 50ae <.literal16+0xb8e>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 4f62 <.literal16+0xb92>
+ DB 124,66 ; jl 50b2 <.literal16+0xb92>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -16376,13 +16577,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 5065 <.literal16+0xc95>
+ DB 112,65 ; jo 51b5 <.literal16+0xc95>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 5069 <.literal16+0xc99>
+ DB 112,65 ; jo 51b9 <.literal16+0xc99>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 506d <.literal16+0xc9d>
+ DB 112,65 ; jo 51bd <.literal16+0xc9d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 5071 <.literal16+0xca1>
+ DB 112,65 ; jo 51c1 <.literal16+0xca1>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -16397,7 +16598,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005060 <_sk_callback_sse41+0x3000d45>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30051b0 <_sk_callback_sse41+0x3000d43>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -16424,7 +16625,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30050a0 <_sk_callback_sse41+0x3000d85>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30051f0 <_sk_callback_sse41+0x3000d83>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -16439,11 +16640,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 50fb <.literal16+0xd2b>
+ DB 127,67 ; jg 524b <.literal16+0xd2b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 50ff <.literal16+0xd2f>
+ DB 127,67 ; jg 524f <.literal16+0xd2f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5103 <.literal16+0xd33>
+ DB 127,67 ; jg 5253 <.literal16+0xd33>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -16519,13 +16720,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 51cb <.literal16+0xdfb>
+ DB 127,71 ; jg 531b <.literal16+0xdfb>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 51cf <.literal16+0xdff>
+ DB 127,71 ; jg 531f <.literal16+0xdff>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 51d3 <.literal16+0xe03>
+ DB 127,71 ; jg 5323 <.literal16+0xe03>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 51d7 <.literal16+0xe07>
+ DB 127,71 ; jg 5327 <.literal16+0xe07>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,208 ; ds (bad)
@@ -16651,11 +16852,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 52e2 <.literal16+0xf12>
+ DB 62,114,28 ; jb,pt 5432 <.literal16+0xf12>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 52e6 <.literal16+0xf16>
+ DB 62,114,28 ; jb,pt 5436 <.literal16+0xf16>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 52ea <.literal16+0xf1a>
+ DB 62,114,28 ; jb,pt 543a <.literal16+0xf1a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -16699,7 +16900,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e175 <_sk_callback_sse41+0x3d639e5a>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e2c5 <_sk_callback_sse41+0x3d639e58>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -16725,7 +16926,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e1b5 <_sk_callback_sse41+0x3d639e9a>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e305 <_sk_callback_sse41+0x3d639e98>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -16734,13 +16935,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 53ae <.literal16+0xfde>
+ DB 114,28 ; jb 54fe <.literal16+0xfde>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 53b2 <.literal16+0xfe2>
+ DB 62,114,28 ; jb,pt 5502 <.literal16+0xfe2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 53b6 <.literal16+0xfe6>
+ DB 62,114,28 ; jb,pt 5506 <.literal16+0xfe6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 53ba <.literal16+0xfea>
+ DB 62,114,28 ; jb,pt 550a <.literal16+0xfea>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -16761,11 +16962,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 53f2 <.literal16+0x1022>
+ DB 62,114,28 ; jb,pt 5542 <.literal16+0x1022>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 53f6 <.literal16+0x1026>
+ DB 62,114,28 ; jb,pt 5546 <.literal16+0x1026>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 53fa <.literal16+0x102a>
+ DB 62,114,28 ; jb,pt 554a <.literal16+0x102a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -16809,7 +17010,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e285 <_sk_callback_sse41+0x3d639f6a>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e3d5 <_sk_callback_sse41+0x3d639f68>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -16835,7 +17036,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e2c5 <_sk_callback_sse41+0x3d639faa>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e415 <_sk_callback_sse41+0x3d639fa8>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -16844,13 +17045,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 54be <.literal16+0x10ee>
+ DB 114,28 ; jb 560e <.literal16+0x10ee>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 54c2 <_sk_callback_sse41+0x11a7>
+ DB 62,114,28 ; jb,pt 5612 <_sk_callback_sse41+0x11a5>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 54c6 <_sk_callback_sse41+0x11ab>
+ DB 62,114,28 ; jb,pt 5616 <_sk_callback_sse41+0x11a9>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 54ca <_sk_callback_sse41+0x11af>
+ DB 62,114,28 ; jb,pt 561a <_sk_callback_sse41+0x11ad>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -16941,7 +17142,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,199 ; movd %edi,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,145,71,0,0 ; movaps 0x4791(%rip),%xmm2 # 48a0 <_sk_callback_sse2+0xb6>
+ DB 15,40,21,193,72,0,0 ; movaps 0x48c1(%rip),%xmm2 # 49d0 <_sk_callback_sse2+0xac>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,2 ; movups (%rdx),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -16950,7 +17151,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,128,71,0,0 ; movaps 0x4780(%rip),%xmm2 # 48b0 <_sk_callback_sse2+0xc6>
+ DB 15,40,21,176,72,0,0 ; movaps 0x48b0(%rip),%xmm2 # 49e0 <_sk_callback_sse2+0xbc>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -16971,14 +17172,14 @@ _sk_dither_sse2 LABEL PROC
DB 102,68,15,110,1 ; movd (%rcx),%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,69,71,0,0 ; movdqa 0x4745(%rip),%xmm10 # 48c0 <_sk_callback_sse2+0xd6>
+ DB 102,68,15,111,21,117,72,0,0 ; movdqa 0x4875(%rip),%xmm10 # 49f0 <_sk_callback_sse2+0xcc>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,49,71,0,0 ; movdqa 0x4731(%rip),%xmm12 # 48d0 <_sk_callback_sse2+0xe6>
- DB 102,68,15,111,45,56,71,0,0 ; movdqa 0x4738(%rip),%xmm13 # 48e0 <_sk_callback_sse2+0xf6>
+ DB 102,68,15,111,37,97,72,0,0 ; movdqa 0x4861(%rip),%xmm12 # 4a00 <_sk_callback_sse2+0xdc>
+ DB 102,68,15,111,45,104,72,0,0 ; movdqa 0x4868(%rip),%xmm13 # 4a10 <_sk_callback_sse2+0xec>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -16994,8 +17195,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,243,70,0,0 ; mulps 0x46f3(%rip),%xmm8 # 48f0 <_sk_callback_sse2+0x106>
- DB 68,15,88,5,251,70,0,0 ; addps 0x46fb(%rip),%xmm8 # 4900 <_sk_callback_sse2+0x116>
+ DB 68,15,89,5,35,72,0,0 ; mulps 0x4823(%rip),%xmm8 # 4a20 <_sk_callback_sse2+0xfc>
+ DB 68,15,88,5,43,72,0,0 ; addps 0x482b(%rip),%xmm8 # 4a30 <_sk_callback_sse2+0x10c>
DB 243,68,15,16,72,8 ; movss 0x8(%rax),%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -17031,7 +17232,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,168,70,0,0 ; movaps 0x46a8(%rip),%xmm8 # 4910 <_sk_callback_sse2+0x126>
+ DB 68,15,40,5,216,71,0,0 ; movaps 0x47d8(%rip),%xmm8 # 4a40 <_sk_callback_sse2+0x11c>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -17054,7 +17255,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,107,70,0,0 ; movaps 0x466b(%rip),%xmm9 # 4920 <_sk_callback_sse2+0x136>
+ DB 68,15,40,13,155,71,0,0 ; movaps 0x479b(%rip),%xmm9 # 4a50 <_sk_callback_sse2+0x12c>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -17095,7 +17296,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,15,70,0,0 ; movaps 0x460f(%rip),%xmm8 # 4930 <_sk_callback_sse2+0x146>
+ DB 68,15,40,5,63,71,0,0 ; movaps 0x473f(%rip),%xmm8 # 4a60 <_sk_callback_sse2+0x13c>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -17106,7 +17307,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,255,69,0,0 ; movaps 0x45ff(%rip),%xmm8 # 4940 <_sk_callback_sse2+0x156>
+ DB 68,15,40,5,47,71,0,0 ; movaps 0x472f(%rip),%xmm8 # 4a70 <_sk_callback_sse2+0x14c>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -17121,7 +17322,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,226,69,0,0 ; movaps 0x45e2(%rip),%xmm8 # 4950 <_sk_callback_sse2+0x166>
+ DB 68,15,40,5,18,71,0,0 ; movaps 0x4712(%rip),%xmm8 # 4a80 <_sk_callback_sse2+0x15c>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -17139,7 +17340,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,182,69,0,0 ; movaps 0x45b6(%rip),%xmm8 # 4960 <_sk_callback_sse2+0x176>
+ DB 68,15,40,5,230,70,0,0 ; movaps 0x46e6(%rip),%xmm8 # 4a90 <_sk_callback_sse2+0x16c>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -17163,7 +17364,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,138,69,0,0 ; movaps 0x458a(%rip),%xmm8 # 4970 <_sk_callback_sse2+0x186>
+ DB 68,15,40,5,186,70,0,0 ; movaps 0x46ba(%rip),%xmm8 # 4aa0 <_sk_callback_sse2+0x17c>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -17233,7 +17434,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,187,68,0,0 ; movaps 0x44bb(%rip),%xmm3 # 4980 <_sk_callback_sse2+0x196>
+ DB 15,40,29,235,69,0,0 ; movaps 0x45eb(%rip),%xmm3 # 4ab0 <_sk_callback_sse2+0x18c>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -17279,7 +17480,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,38,68,0,0 ; movaps 0x4426(%rip),%xmm2 # 4990 <_sk_callback_sse2+0x1a6>
+ DB 15,40,21,86,69,0,0 ; movaps 0x4556(%rip),%xmm2 # 4ac0 <_sk_callback_sse2+0x19c>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17311,7 +17512,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,203,67,0,0 ; movaps 0x43cb(%rip),%xmm2 # 49a0 <_sk_callback_sse2+0x1b6>
+ DB 15,40,21,251,68,0,0 ; movaps 0x44fb(%rip),%xmm2 # 4ad0 <_sk_callback_sse2+0x1ac>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17346,7 +17547,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,101,67,0,0 ; movaps 0x4365(%rip),%xmm2 # 49b0 <_sk_callback_sse2+0x1c6>
+ DB 15,40,21,149,68,0,0 ; movaps 0x4495(%rip),%xmm2 # 4ae0 <_sk_callback_sse2+0x1bc>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17371,7 +17572,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,202 ; subps %xmm2,%xmm9
- DB 15,40,13,38,67,0,0 ; movaps 0x4326(%rip),%xmm1 # 49c0 <_sk_callback_sse2+0x1d6>
+ DB 15,40,13,86,68,0,0 ; movaps 0x4456(%rip),%xmm1 # 4af0 <_sk_callback_sse2+0x1cc>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -17383,7 +17584,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,21,67,0,0 ; movaps 0x4315(%rip),%xmm10 # 49d0 <_sk_callback_sse2+0x1e6>
+ DB 68,15,40,21,69,68,0,0 ; movaps 0x4445(%rip),%xmm10 # 4b00 <_sk_callback_sse2+0x1dc>
DB 69,15,40,202 ; movaps %xmm10,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,217 ; movaps %xmm9,%xmm11
@@ -17475,7 +17676,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,203,65,0,0 ; movaps 0x41cb(%rip),%xmm10 # 49e0 <_sk_callback_sse2+0x1f6>
+ DB 68,15,40,21,251,66,0,0 ; movaps 0x42fb(%rip),%xmm10 # 4b10 <_sk_callback_sse2+0x1ec>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -17568,7 +17769,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,125,64,0,0 ; movaps 0x407d(%rip),%xmm11 # 49f0 <_sk_callback_sse2+0x206>
+ DB 68,15,40,29,173,65,0,0 ; movaps 0x41ad(%rip),%xmm11 # 4b20 <_sk_callback_sse2+0x1fc>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -17655,7 +17856,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,72,63,0,0 ; movaps 0x3f48(%rip),%xmm9 # 4a00 <_sk_callback_sse2+0x216>
+ DB 68,15,40,13,120,64,0,0 ; movaps 0x4078(%rip),%xmm9 # 4b30 <_sk_callback_sse2+0x20c>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -17745,7 +17946,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,2,62,0,0 ; movaps 0x3e02(%rip),%xmm9 # 4a10 <_sk_callback_sse2+0x226>
+ DB 68,15,40,13,50,63,0,0 ; movaps 0x3f32(%rip),%xmm9 # 4b40 <_sk_callback_sse2+0x21c>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -17758,10 +17959,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,220,61,0,0 ; movaps 0x3ddc(%rip),%xmm14 # 4a20 <_sk_callback_sse2+0x236>
+ DB 68,15,40,53,12,63,0,0 ; movaps 0x3f0c(%rip),%xmm14 # 4b50 <_sk_callback_sse2+0x22c>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,220,61,0,0 ; movaps 0x3ddc(%rip),%xmm10 # 4a30 <_sk_callback_sse2+0x246>
+ DB 68,15,40,21,12,63,0,0 ; movaps 0x3f0c(%rip),%xmm10 # 4b60 <_sk_callback_sse2+0x23c>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -17900,590 +18101,680 @@ _sk_softlight_sse2 LABEL PROC
PUBLIC _sk_hue_sse2
_sk_hue_sse2 LABEL PROC
- DB 72,131,236,24 ; sub $0x18,%rsp
- DB 15,41,60,36 ; movaps %xmm7,(%rsp)
+ DB 72,131,236,72 ; sub $0x48,%rsp
+ DB 68,15,40,200 ; movaps %xmm0,%xmm9
+ DB 68,15,89,203 ; mulps %xmm3,%xmm9
+ DB 68,15,40,209 ; movaps %xmm1,%xmm10
+ DB 68,15,40,225 ; movaps %xmm1,%xmm12
+ DB 68,15,89,211 ; mulps %xmm3,%xmm10
+ DB 68,15,40,5,72,61,0,0 ; movaps 0x3d48(%rip),%xmm8 # 4ba0 <_sk_callback_sse2+0x27c>
+ DB 69,15,40,216 ; movaps %xmm8,%xmm11
+ DB 15,40,207 ; movaps %xmm7,%xmm1
+ DB 68,15,92,217 ; subps %xmm1,%xmm11
+ DB 65,15,89,195 ; mulps %xmm11,%xmm0
+ DB 15,41,68,36,48 ; movaps %xmm0,0x30(%rsp)
+ DB 69,15,89,227 ; mulps %xmm11,%xmm12
+ DB 68,15,41,100,36,32 ; movaps %xmm12,0x20(%rsp)
+ DB 68,15,89,218 ; mulps %xmm2,%xmm11
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 68,15,40,229 ; movaps %xmm5,%xmm12
+ DB 68,15,40,237 ; movaps %xmm5,%xmm13
DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 68,15,95,239 ; maxps %xmm7,%xmm13
+ DB 15,41,100,36,16 ; movaps %xmm4,0x10(%rsp)
+ DB 68,15,40,244 ; movaps %xmm4,%xmm14
+ DB 68,15,40,252 ; movaps %xmm4,%xmm15
+ DB 69,15,95,253 ; maxps %xmm13,%xmm15
+ DB 68,15,93,231 ; minps %xmm7,%xmm12
+ DB 69,15,93,244 ; minps %xmm12,%xmm14
+ DB 69,15,92,254 ; subps %xmm14,%xmm15
+ DB 69,15,40,226 ; movaps %xmm10,%xmm12
+ DB 68,15,93,226 ; minps %xmm2,%xmm12
+ DB 69,15,40,233 ; movaps %xmm9,%xmm13
+ DB 69,15,93,236 ; minps %xmm12,%xmm13
+ DB 69,15,40,226 ; movaps %xmm10,%xmm12
+ DB 68,15,95,226 ; maxps %xmm2,%xmm12
+ DB 69,15,40,241 ; movaps %xmm9,%xmm14
+ DB 69,15,95,244 ; maxps %xmm12,%xmm14
+ DB 69,15,92,245 ; subps %xmm13,%xmm14
+ DB 69,15,92,205 ; subps %xmm13,%xmm9
+ DB 69,15,92,213 ; subps %xmm13,%xmm10
+ DB 65,15,92,213 ; subps %xmm13,%xmm2
DB 15,40,245 ; movaps %xmm5,%xmm6
- DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,232,59,0,0 ; movaps 0x3be8(%rip),%xmm9 # 4a40 <_sk_callback_sse2+0x256>
- DB 69,15,40,209 ; movaps %xmm9,%xmm10
- DB 68,15,94,212 ; divps %xmm4,%xmm10
- DB 68,15,40,228 ; movaps %xmm4,%xmm12
- DB 69,15,194,224,4 ; cmpneqps %xmm8,%xmm12
- DB 69,15,84,226 ; andps %xmm10,%xmm12
- DB 65,15,89,196 ; mulps %xmm12,%xmm0
- DB 65,15,89,204 ; mulps %xmm12,%xmm1
- DB 68,15,89,226 ; mulps %xmm2,%xmm12
- DB 68,15,40,214 ; movaps %xmm6,%xmm10
- DB 68,15,40,238 ; movaps %xmm6,%xmm13
- DB 68,15,40,254 ; movaps %xmm6,%xmm15
- DB 68,15,95,255 ; maxps %xmm7,%xmm15
- DB 68,15,40,221 ; movaps %xmm5,%xmm11
- DB 68,15,40,245 ; movaps %xmm5,%xmm14
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 65,15,95,215 ; maxps %xmm15,%xmm2
- DB 68,15,93,215 ; minps %xmm7,%xmm10
- DB 69,15,93,218 ; minps %xmm10,%xmm11
- DB 65,15,92,211 ; subps %xmm11,%xmm2
- DB 68,15,40,209 ; movaps %xmm1,%xmm10
- DB 69,15,93,212 ; minps %xmm12,%xmm10
- DB 68,15,40,216 ; movaps %xmm0,%xmm11
- DB 69,15,93,218 ; minps %xmm10,%xmm11
- DB 68,15,40,209 ; movaps %xmm1,%xmm10
- DB 69,15,95,212 ; maxps %xmm12,%xmm10
- DB 68,15,40,248 ; movaps %xmm0,%xmm15
- DB 69,15,95,250 ; maxps %xmm10,%xmm15
- DB 69,15,92,251 ; subps %xmm11,%xmm15
- DB 65,15,92,195 ; subps %xmm11,%xmm0
- DB 15,89,194 ; mulps %xmm2,%xmm0
- DB 65,15,94,199 ; divps %xmm15,%xmm0
- DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 65,15,94,207 ; divps %xmm15,%xmm1
- DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,226 ; mulps %xmm2,%xmm12
- DB 69,15,94,231 ; divps %xmm15,%xmm12
- DB 69,15,194,248,4 ; cmpneqps %xmm8,%xmm15
- DB 65,15,84,199 ; andps %xmm15,%xmm0
- DB 65,15,84,207 ; andps %xmm15,%xmm1
- DB 69,15,84,231 ; andps %xmm15,%xmm12
- DB 68,15,40,61,77,59,0,0 ; movaps 0x3b4d(%rip),%xmm15 # 4a50 <_sk_callback_sse2+0x266>
- DB 69,15,89,247 ; mulps %xmm15,%xmm14
- DB 15,40,29,82,59,0,0 ; movaps 0x3b52(%rip),%xmm3 # 4a60 <_sk_callback_sse2+0x276>
+ DB 68,15,89,251 ; mulps %xmm3,%xmm15
+ DB 69,15,89,207 ; mulps %xmm15,%xmm9
+ DB 69,15,89,215 ; mulps %xmm15,%xmm10
+ DB 65,15,89,215 ; mulps %xmm15,%xmm2
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 69,15,94,206 ; divps %xmm14,%xmm9
+ DB 69,15,94,214 ; divps %xmm14,%xmm10
+ DB 65,15,94,214 ; divps %xmm14,%xmm2
+ DB 68,15,194,240,4 ; cmpneqps %xmm0,%xmm14
+ DB 69,15,84,206 ; andps %xmm14,%xmm9
+ DB 69,15,84,214 ; andps %xmm14,%xmm10
+ DB 65,15,84,214 ; andps %xmm14,%xmm2
+ DB 68,15,40,61,92,60,0,0 ; movaps 0x3c5c(%rip),%xmm15 # 4b70 <_sk_callback_sse2+0x24c>
+ DB 65,15,89,231 ; mulps %xmm15,%xmm4
+ DB 15,40,5,97,60,0,0 ; movaps 0x3c61(%rip),%xmm0 # 4b80 <_sk_callback_sse2+0x25c>
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 68,15,40,53,99,60,0,0 ; movaps 0x3c63(%rip),%xmm14 # 4b90 <_sk_callback_sse2+0x26c>
+ DB 68,15,40,239 ; movaps %xmm7,%xmm13
+ DB 69,15,89,238 ; mulps %xmm14,%xmm13
+ DB 68,15,88,238 ; addps %xmm6,%xmm13
+ DB 65,15,40,225 ; movaps %xmm9,%xmm4
+ DB 65,15,89,231 ; mulps %xmm15,%xmm4
+ DB 65,15,40,242 ; movaps %xmm10,%xmm6
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 65,15,89,230 ; mulps %xmm14,%xmm4
+ DB 15,88,230 ; addps %xmm6,%xmm4
DB 68,15,89,235 ; mulps %xmm3,%xmm13
- DB 69,15,88,238 ; addps %xmm14,%xmm13
- DB 68,15,40,21,82,59,0,0 ; movaps 0x3b52(%rip),%xmm10 # 4a70 <_sk_callback_sse2+0x286>
- DB 68,15,40,223 ; movaps %xmm7,%xmm11
- DB 69,15,89,218 ; mulps %xmm10,%xmm11
- DB 69,15,88,221 ; addps %xmm13,%xmm11
- DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,241 ; movaps %xmm1,%xmm14
- DB 68,15,89,243 ; mulps %xmm3,%xmm14
- DB 69,15,88,245 ; addps %xmm13,%xmm14
- DB 65,15,40,212 ; movaps %xmm12,%xmm2
- DB 65,15,89,210 ; mulps %xmm10,%xmm2
- DB 65,15,88,214 ; addps %xmm14,%xmm2
- DB 68,15,92,218 ; subps %xmm2,%xmm11
- DB 65,15,88,195 ; addps %xmm11,%xmm0
- DB 65,15,88,203 ; addps %xmm11,%xmm1
- DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 65,15,93,211 ; minps %xmm11,%xmm2
- DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,93,234 ; minps %xmm2,%xmm13
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 65,15,95,211 ; maxps %xmm11,%xmm2
- DB 68,15,40,224 ; movaps %xmm0,%xmm12
- DB 68,15,95,226 ; maxps %xmm2,%xmm12
- DB 68,15,89,248 ; mulps %xmm0,%xmm15
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 65,15,88,223 ; addps %xmm15,%xmm3
- DB 69,15,89,211 ; mulps %xmm11,%xmm10
- DB 68,15,88,211 ; addps %xmm3,%xmm10
+ DB 68,15,92,236 ; subps %xmm4,%xmm13
+ DB 69,15,88,205 ; addps %xmm13,%xmm9
+ DB 69,15,88,213 ; addps %xmm13,%xmm10
+ DB 68,15,88,234 ; addps %xmm2,%xmm13
+ DB 65,15,40,210 ; movaps %xmm10,%xmm2
+ DB 65,15,93,213 ; minps %xmm13,%xmm2
+ DB 65,15,40,241 ; movaps %xmm9,%xmm6
+ DB 15,93,242 ; minps %xmm2,%xmm6
+ DB 65,15,40,210 ; movaps %xmm10,%xmm2
+ DB 65,15,95,213 ; maxps %xmm13,%xmm2
+ DB 65,15,40,225 ; movaps %xmm9,%xmm4
+ DB 15,95,226 ; maxps %xmm2,%xmm4
+ DB 69,15,89,249 ; mulps %xmm9,%xmm15
+ DB 65,15,89,194 ; mulps %xmm10,%xmm0
+ DB 65,15,88,199 ; addps %xmm15,%xmm0
+ DB 69,15,89,245 ; mulps %xmm13,%xmm14
+ DB 68,15,88,240 ; addps %xmm0,%xmm14
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 65,15,194,213,2 ; cmpleps %xmm13,%xmm2
- DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 65,15,92,218 ; subps %xmm10,%xmm3
- DB 65,15,89,218 ; mulps %xmm10,%xmm3
- DB 69,15,40,242 ; movaps %xmm10,%xmm14
- DB 69,15,92,245 ; subps %xmm13,%xmm14
- DB 65,15,94,222 ; divps %xmm14,%xmm3
- DB 65,15,88,218 ; addps %xmm10,%xmm3
- DB 68,15,40,234 ; movaps %xmm2,%xmm13
- DB 68,15,85,235 ; andnps %xmm3,%xmm13
- DB 15,84,194 ; andps %xmm2,%xmm0
- DB 65,15,86,197 ; orps %xmm13,%xmm0
- DB 69,15,40,233 ; movaps %xmm9,%xmm13
- DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 65,15,40,221 ; movaps %xmm13,%xmm3
- DB 15,85,216 ; andnps %xmm0,%xmm3
- DB 65,15,92,194 ; subps %xmm10,%xmm0
- DB 69,15,92,202 ; subps %xmm10,%xmm9
- DB 65,15,89,193 ; mulps %xmm9,%xmm0
- DB 69,15,92,226 ; subps %xmm10,%xmm12
- DB 65,15,94,196 ; divps %xmm12,%xmm0
- DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 65,15,84,197 ; andps %xmm13,%xmm0
- DB 15,86,195 ; orps %xmm3,%xmm0
- DB 15,40,217 ; movaps %xmm1,%xmm3
- DB 65,15,92,218 ; subps %xmm10,%xmm3
- DB 65,15,89,218 ; mulps %xmm10,%xmm3
- DB 65,15,94,222 ; divps %xmm14,%xmm3
- DB 65,15,88,218 ; addps %xmm10,%xmm3
- DB 68,15,40,250 ; movaps %xmm2,%xmm15
- DB 68,15,85,251 ; andnps %xmm3,%xmm15
- DB 15,84,202 ; andps %xmm2,%xmm1
- DB 65,15,86,207 ; orps %xmm15,%xmm1
- DB 65,15,40,221 ; movaps %xmm13,%xmm3
+ DB 15,194,214,2 ; cmpleps %xmm6,%xmm2
+ DB 69,15,40,254 ; movaps %xmm14,%xmm15
+ DB 68,15,92,254 ; subps %xmm6,%xmm15
+ DB 65,15,40,241 ; movaps %xmm9,%xmm6
+ DB 65,15,92,246 ; subps %xmm14,%xmm6
+ DB 65,15,89,246 ; mulps %xmm14,%xmm6
+ DB 65,15,94,247 ; divps %xmm15,%xmm6
+ DB 65,15,88,246 ; addps %xmm14,%xmm6
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,85,198 ; andnps %xmm6,%xmm0
+ DB 68,15,84,202 ; andps %xmm2,%xmm9
+ DB 68,15,86,200 ; orps %xmm0,%xmm9
+ DB 68,15,40,227 ; movaps %xmm3,%xmm12
+ DB 65,15,40,196 ; movaps %xmm12,%xmm0
+ DB 15,41,12,36 ; movaps %xmm1,(%rsp)
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 69,15,92,196 ; subps %xmm12,%xmm8
+ DB 68,15,88,225 ; addps %xmm1,%xmm12
+ DB 68,15,92,224 ; subps %xmm0,%xmm12
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 65,15,85,201 ; andnps %xmm9,%xmm1
+ DB 69,15,92,206 ; subps %xmm14,%xmm9
+ DB 65,15,92,246 ; subps %xmm14,%xmm6
+ DB 68,15,89,206 ; mulps %xmm6,%xmm9
+ DB 65,15,92,230 ; subps %xmm14,%xmm4
+ DB 68,15,94,204 ; divps %xmm4,%xmm9
+ DB 69,15,88,206 ; addps %xmm14,%xmm9
+ DB 68,15,84,200 ; andps %xmm0,%xmm9
+ DB 68,15,86,201 ; orps %xmm1,%xmm9
+ DB 65,15,40,202 ; movaps %xmm10,%xmm1
+ DB 65,15,92,206 ; subps %xmm14,%xmm1
+ DB 65,15,89,206 ; mulps %xmm14,%xmm1
+ DB 65,15,94,207 ; divps %xmm15,%xmm1
+ DB 65,15,88,206 ; addps %xmm14,%xmm1
+ DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,85,217 ; andnps %xmm1,%xmm3
- DB 65,15,92,202 ; subps %xmm10,%xmm1
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 65,15,94,204 ; divps %xmm12,%xmm1
+ DB 68,15,84,210 ; andps %xmm2,%xmm10
+ DB 68,15,86,211 ; orps %xmm3,%xmm10
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 65,15,85,202 ; andnps %xmm10,%xmm1
+ DB 69,15,92,214 ; subps %xmm14,%xmm10
+ DB 68,15,89,214 ; mulps %xmm6,%xmm10
+ DB 68,15,94,212 ; divps %xmm4,%xmm10
+ DB 69,15,88,214 ; addps %xmm14,%xmm10
+ DB 68,15,84,208 ; andps %xmm0,%xmm10
+ DB 68,15,86,209 ; orps %xmm1,%xmm10
+ DB 65,15,40,205 ; movaps %xmm13,%xmm1
+ DB 65,15,92,206 ; subps %xmm14,%xmm1
+ DB 65,15,89,206 ; mulps %xmm14,%xmm1
+ DB 65,15,94,207 ; divps %xmm15,%xmm1
+ DB 65,15,88,206 ; addps %xmm14,%xmm1
+ DB 68,15,84,234 ; andps %xmm2,%xmm13
+ DB 15,85,209 ; andnps %xmm1,%xmm2
+ DB 65,15,86,213 ; orps %xmm13,%xmm2
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 15,85,202 ; andnps %xmm2,%xmm1
+ DB 65,15,92,214 ; subps %xmm14,%xmm2
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,94,212 ; divps %xmm4,%xmm2
+ DB 65,15,88,214 ; addps %xmm14,%xmm2
+ DB 15,84,208 ; andps %xmm0,%xmm2
+ DB 15,86,209 ; orps %xmm1,%xmm2
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 68,15,95,200 ; maxps %xmm0,%xmm9
+ DB 68,15,95,208 ; maxps %xmm0,%xmm10
+ DB 15,95,208 ; maxps %xmm0,%xmm2
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 15,40,100,36,16 ; movaps 0x10(%rsp),%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,40,76,36,48 ; movaps 0x30(%rsp),%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 65,15,88,201 ; addps %xmm9,%xmm1
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 65,15,40,216 ; movaps %xmm8,%xmm3
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,40,76,36,32 ; movaps 0x20(%rsp),%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 65,15,84,205 ; andps %xmm13,%xmm1
- DB 15,86,203 ; orps %xmm3,%xmm1
- DB 65,15,40,219 ; movaps %xmm11,%xmm3
- DB 65,15,92,218 ; subps %xmm10,%xmm3
- DB 65,15,89,218 ; mulps %xmm10,%xmm3
- DB 65,15,94,222 ; divps %xmm14,%xmm3
- DB 65,15,88,218 ; addps %xmm10,%xmm3
- DB 68,15,84,218 ; andps %xmm2,%xmm11
- DB 15,85,211 ; andnps %xmm3,%xmm2
- DB 65,15,86,211 ; orps %xmm11,%xmm2
- DB 65,15,40,221 ; movaps %xmm13,%xmm3
- DB 15,85,218 ; andnps %xmm2,%xmm3
- DB 65,15,92,210 ; subps %xmm10,%xmm2
- DB 65,15,89,209 ; mulps %xmm9,%xmm2
- DB 65,15,94,212 ; divps %xmm12,%xmm2
- DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 65,15,84,213 ; andps %xmm13,%xmm2
- DB 15,86,211 ; orps %xmm3,%xmm2
- DB 65,15,95,192 ; maxps %xmm8,%xmm0
- DB 65,15,95,200 ; maxps %xmm8,%xmm1
- DB 65,15,95,208 ; maxps %xmm8,%xmm2
- DB 68,15,40,196 ; movaps %xmm4,%xmm8
- DB 68,15,40,12,36 ; movaps (%rsp),%xmm9
- DB 69,15,88,193 ; addps %xmm9,%xmm8
- DB 65,15,89,225 ; mulps %xmm9,%xmm4
- DB 68,15,92,196 ; subps %xmm4,%xmm8
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 68,15,89,199 ; mulps %xmm7,%xmm8
+ DB 69,15,88,195 ; addps %xmm11,%xmm8
+ DB 68,15,88,194 ; addps %xmm2,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,40,238 ; movaps %xmm6,%xmm5
DB 15,40,247 ; movaps %xmm7,%xmm6
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
- DB 65,15,40,249 ; movaps %xmm9,%xmm7
- DB 72,131,196,24 ; add $0x18,%rsp
+ DB 65,15,40,208 ; movaps %xmm8,%xmm2
+ DB 65,15,40,220 ; movaps %xmm12,%xmm3
+ DB 15,40,60,36 ; movaps (%rsp),%xmm7
+ DB 72,131,196,72 ; add $0x48,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_saturation_sse2
_sk_saturation_sse2 LABEL PROC
- DB 68,15,40,214 ; movaps %xmm6,%xmm10
- DB 15,40,245 ; movaps %xmm5,%xmm6
- DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 68,15,40,193 ; movaps %xmm1,%xmm8
- DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 15,87,201 ; xorps %xmm1,%xmm1
- DB 68,15,40,29,177,57,0,0 ; movaps 0x39b1(%rip),%xmm11 # 4a80 <_sk_callback_sse2+0x296>
- DB 65,15,40,195 ; movaps %xmm11,%xmm0
- DB 15,94,199 ; divps %xmm7,%xmm0
+ DB 72,131,236,88 ; sub $0x58,%rsp
DB 68,15,40,231 ; movaps %xmm7,%xmm12
- DB 68,15,194,225,4 ; cmpneqps %xmm1,%xmm12
- DB 68,15,84,224 ; andps %xmm0,%xmm12
- DB 65,15,40,196 ; movaps %xmm12,%xmm0
- DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 69,15,40,252 ; movaps %xmm12,%xmm15
- DB 68,15,89,254 ; mulps %xmm6,%xmm15
- DB 69,15,89,226 ; mulps %xmm10,%xmm12
- DB 69,15,40,240 ; movaps %xmm8,%xmm14
- DB 68,15,95,242 ; maxps %xmm2,%xmm14
- DB 69,15,40,233 ; movaps %xmm9,%xmm13
- DB 69,15,95,238 ; maxps %xmm14,%xmm13
- DB 68,15,93,194 ; minps %xmm2,%xmm8
- DB 69,15,93,200 ; minps %xmm8,%xmm9
- DB 69,15,92,233 ; subps %xmm9,%xmm13
- DB 65,15,40,215 ; movaps %xmm15,%xmm2
- DB 65,15,93,212 ; minps %xmm12,%xmm2
- DB 68,15,40,192 ; movaps %xmm0,%xmm8
+ DB 68,15,40,198 ; movaps %xmm6,%xmm8
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 68,15,40,216 ; movaps %xmm0,%xmm11
+ DB 68,15,40,215 ; movaps %xmm7,%xmm10
+ DB 68,15,89,212 ; mulps %xmm4,%xmm10
+ DB 15,40,244 ; movaps %xmm4,%xmm6
+ DB 15,41,116,36,16 ; movaps %xmm6,0x10(%rsp)
+ DB 68,15,40,207 ; movaps %xmm7,%xmm9
+ DB 68,15,89,205 ; mulps %xmm5,%xmm9
+ DB 15,41,108,36,32 ; movaps %xmm5,0x20(%rsp)
+ DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 69,15,40,232 ; movaps %xmm8,%xmm13
+ DB 68,15,41,44,36 ; movaps %xmm13,(%rsp)
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,41,100,36,48 ; movaps %xmm4,0x30(%rsp)
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,41,84,36,64 ; movaps %xmm2,0x40(%rsp)
+ DB 15,95,218 ; maxps %xmm2,%xmm3
+ DB 65,15,40,203 ; movaps %xmm11,%xmm1
+ DB 15,95,203 ; maxps %xmm3,%xmm1
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,93,218 ; minps %xmm2,%xmm3
+ DB 65,15,40,211 ; movaps %xmm11,%xmm2
+ DB 15,93,211 ; minps %xmm3,%xmm2
+ DB 15,92,202 ; subps %xmm2,%xmm1
+ DB 65,15,89,204 ; mulps %xmm12,%xmm1
+ DB 65,15,40,228 ; movaps %xmm12,%xmm4
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 15,93,208 ; minps %xmm0,%xmm2
+ DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 68,15,93,194 ; minps %xmm2,%xmm8
- DB 69,15,40,207 ; movaps %xmm15,%xmm9
- DB 69,15,95,204 ; maxps %xmm12,%xmm9
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 65,15,95,209 ; maxps %xmm9,%xmm2
- DB 65,15,92,208 ; subps %xmm8,%xmm2
- DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 65,15,89,197 ; mulps %xmm13,%xmm0
- DB 15,94,194 ; divps %xmm2,%xmm0
- DB 69,15,92,248 ; subps %xmm8,%xmm15
- DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,94,250 ; divps %xmm2,%xmm15
- DB 69,15,92,224 ; subps %xmm8,%xmm12
- DB 69,15,89,229 ; mulps %xmm13,%xmm12
- DB 68,15,94,226 ; divps %xmm2,%xmm12
- DB 15,194,209,4 ; cmpneqps %xmm1,%xmm2
- DB 15,84,194 ; andps %xmm2,%xmm0
- DB 68,15,84,250 ; andps %xmm2,%xmm15
- DB 68,15,84,226 ; andps %xmm2,%xmm12
- DB 68,15,40,45,33,57,0,0 ; movaps 0x3921(%rip),%xmm13 # 4a90 <_sk_callback_sse2+0x2a6>
- DB 68,15,40,197 ; movaps %xmm5,%xmm8
- DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,33,57,0,0 ; movaps 0x3921(%rip),%xmm14 # 4aa0 <_sk_callback_sse2+0x2b6>
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 65,15,88,208 ; addps %xmm8,%xmm2
- DB 68,15,40,5,30,57,0,0 ; movaps 0x391e(%rip),%xmm8 # 4ab0 <_sk_callback_sse2+0x2c6>
- DB 69,15,40,202 ; movaps %xmm10,%xmm9
- DB 69,15,89,200 ; mulps %xmm8,%xmm9
- DB 68,15,88,202 ; addps %xmm2,%xmm9
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 65,15,40,207 ; movaps %xmm15,%xmm1
- DB 65,15,89,206 ; mulps %xmm14,%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 65,15,40,212 ; movaps %xmm12,%xmm2
- DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,88,209 ; addps %xmm1,%xmm2
- DB 68,15,92,202 ; subps %xmm2,%xmm9
- DB 65,15,88,193 ; addps %xmm9,%xmm0
- DB 69,15,88,249 ; addps %xmm9,%xmm15
- DB 69,15,88,204 ; addps %xmm12,%xmm9
- DB 65,15,40,207 ; movaps %xmm15,%xmm1
- DB 65,15,93,201 ; minps %xmm9,%xmm1
- DB 68,15,40,224 ; movaps %xmm0,%xmm12
- DB 68,15,93,225 ; minps %xmm1,%xmm12
- DB 65,15,40,215 ; movaps %xmm15,%xmm2
- DB 65,15,95,209 ; maxps %xmm9,%xmm2
- DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 65,15,40,209 ; movaps %xmm9,%xmm2
+ DB 15,95,208 ; maxps %xmm0,%xmm2
+ DB 65,15,40,218 ; movaps %xmm10,%xmm3
DB 15,95,218 ; maxps %xmm2,%xmm3
- DB 68,15,89,232 ; mulps %xmm0,%xmm13
- DB 69,15,89,247 ; mulps %xmm15,%xmm14
- DB 69,15,88,245 ; addps %xmm13,%xmm14
- DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 69,15,88,198 ; addps %xmm14,%xmm8
+ DB 65,15,92,216 ; subps %xmm8,%xmm3
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 65,15,194,212,2 ; cmpleps %xmm12,%xmm2
- DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 69,15,92,232 ; subps %xmm8,%xmm13
- DB 69,15,89,232 ; mulps %xmm8,%xmm13
- DB 69,15,40,240 ; movaps %xmm8,%xmm14
- DB 69,15,92,244 ; subps %xmm12,%xmm14
- DB 69,15,94,238 ; divps %xmm14,%xmm13
- DB 69,15,88,232 ; addps %xmm8,%xmm13
- DB 68,15,40,226 ; movaps %xmm2,%xmm12
- DB 69,15,85,229 ; andnps %xmm13,%xmm12
- DB 15,84,194 ; andps %xmm2,%xmm0
- DB 65,15,86,196 ; orps %xmm12,%xmm0
- DB 69,15,40,235 ; movaps %xmm11,%xmm13
- DB 68,15,194,235,1 ; cmpltps %xmm3,%xmm13
- DB 69,15,40,229 ; movaps %xmm13,%xmm12
- DB 68,15,85,224 ; andnps %xmm0,%xmm12
+ DB 69,15,92,208 ; subps %xmm8,%xmm10
+ DB 68,15,89,209 ; mulps %xmm1,%xmm10
+ DB 68,15,94,211 ; divps %xmm3,%xmm10
+ DB 69,15,92,200 ; subps %xmm8,%xmm9
+ DB 68,15,89,201 ; mulps %xmm1,%xmm9
+ DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 69,15,92,216 ; subps %xmm8,%xmm11
- DB 65,15,89,195 ; mulps %xmm11,%xmm0
- DB 65,15,92,216 ; subps %xmm8,%xmm3
+ DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,94,195 ; divps %xmm3,%xmm0
- DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 65,15,84,197 ; andps %xmm13,%xmm0
- DB 65,15,86,196 ; orps %xmm12,%xmm0
- DB 69,15,40,231 ; movaps %xmm15,%xmm12
- DB 69,15,92,224 ; subps %xmm8,%xmm12
- DB 69,15,89,224 ; mulps %xmm8,%xmm12
- DB 69,15,94,230 ; divps %xmm14,%xmm12
- DB 69,15,88,224 ; addps %xmm8,%xmm12
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 65,15,85,204 ; andnps %xmm12,%xmm1
- DB 68,15,84,250 ; andps %xmm2,%xmm15
- DB 68,15,86,249 ; orps %xmm1,%xmm15
- DB 65,15,40,205 ; movaps %xmm13,%xmm1
- DB 65,15,85,207 ; andnps %xmm15,%xmm1
- DB 69,15,92,248 ; subps %xmm8,%xmm15
- DB 69,15,89,251 ; mulps %xmm11,%xmm15
- DB 68,15,94,251 ; divps %xmm3,%xmm15
- DB 69,15,88,248 ; addps %xmm8,%xmm15
- DB 69,15,84,253 ; andps %xmm13,%xmm15
- DB 68,15,86,249 ; orps %xmm1,%xmm15
- DB 65,15,40,201 ; movaps %xmm9,%xmm1
- DB 65,15,92,200 ; subps %xmm8,%xmm1
- DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 65,15,94,206 ; divps %xmm14,%xmm1
+ DB 15,194,218,4 ; cmpneqps %xmm2,%xmm3
+ DB 68,15,84,211 ; andps %xmm3,%xmm10
+ DB 68,15,84,203 ; andps %xmm3,%xmm9
+ DB 15,84,195 ; andps %xmm3,%xmm0
+ DB 68,15,40,5,243,57,0,0 ; movaps 0x39f3(%rip),%xmm8 # 4bb0 <_sk_callback_sse2+0x28c>
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 15,40,13,245,57,0,0 ; movaps 0x39f5(%rip),%xmm1 # 4bc0 <_sk_callback_sse2+0x29c>
+ DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 68,15,40,37,244,57,0,0 ; movaps 0x39f4(%rip),%xmm12 # 4bd0 <_sk_callback_sse2+0x2ac>
+ DB 69,15,89,236 ; mulps %xmm12,%xmm13
+ DB 68,15,88,235 ; addps %xmm3,%xmm13
+ DB 65,15,40,210 ; movaps %xmm10,%xmm2
+ DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 65,15,40,217 ; movaps %xmm9,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 65,15,89,212 ; mulps %xmm12,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 68,15,89,239 ; mulps %xmm7,%xmm13
+ DB 68,15,92,234 ; subps %xmm2,%xmm13
+ DB 69,15,88,213 ; addps %xmm13,%xmm10
+ DB 69,15,88,205 ; addps %xmm13,%xmm9
+ DB 68,15,88,232 ; addps %xmm0,%xmm13
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,93,197 ; minps %xmm13,%xmm0
+ DB 65,15,40,218 ; movaps %xmm10,%xmm3
+ DB 15,93,216 ; minps %xmm0,%xmm3
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,95,197 ; maxps %xmm13,%xmm0
+ DB 69,15,40,242 ; movaps %xmm10,%xmm14
+ DB 68,15,95,240 ; maxps %xmm0,%xmm14
+ DB 69,15,89,194 ; mulps %xmm10,%xmm8
+ DB 65,15,89,201 ; mulps %xmm9,%xmm1
DB 65,15,88,200 ; addps %xmm8,%xmm1
+ DB 69,15,89,229 ; mulps %xmm13,%xmm12
+ DB 68,15,88,225 ; addps %xmm1,%xmm12
+ DB 15,87,210 ; xorps %xmm2,%xmm2
+ DB 15,194,211,2 ; cmpleps %xmm3,%xmm2
+ DB 65,15,40,244 ; movaps %xmm12,%xmm6
+ DB 15,92,243 ; subps %xmm3,%xmm6
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 65,15,92,196 ; subps %xmm12,%xmm0
+ DB 65,15,89,196 ; mulps %xmm12,%xmm0
+ DB 15,94,198 ; divps %xmm6,%xmm0
+ DB 65,15,88,196 ; addps %xmm12,%xmm0
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,85,200 ; andnps %xmm0,%xmm1
+ DB 68,15,84,210 ; andps %xmm2,%xmm10
+ DB 68,15,86,209 ; orps %xmm1,%xmm10
+ DB 15,40,223 ; movaps %xmm7,%xmm3
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 68,15,40,5,89,57,0,0 ; movaps 0x3959(%rip),%xmm8 # 4be0 <_sk_callback_sse2+0x2bc>
+ DB 65,15,40,224 ; movaps %xmm8,%xmm4
+ DB 68,15,92,199 ; subps %xmm7,%xmm8
+ DB 15,88,253 ; addps %xmm5,%xmm7
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 15,40,203 ; movaps %xmm3,%xmm1
+ DB 65,15,194,222,1 ; cmpltps %xmm14,%xmm3
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 65,15,85,194 ; andnps %xmm10,%xmm0
+ DB 69,15,92,212 ; subps %xmm12,%xmm10
+ DB 65,15,92,204 ; subps %xmm12,%xmm1
+ DB 68,15,89,209 ; mulps %xmm1,%xmm10
+ DB 69,15,92,244 ; subps %xmm12,%xmm14
+ DB 69,15,94,214 ; divps %xmm14,%xmm10
+ DB 69,15,88,212 ; addps %xmm12,%xmm10
+ DB 68,15,84,211 ; andps %xmm3,%xmm10
+ DB 68,15,86,208 ; orps %xmm0,%xmm10
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,92,196 ; subps %xmm12,%xmm0
+ DB 65,15,89,196 ; mulps %xmm12,%xmm0
+ DB 15,94,198 ; divps %xmm6,%xmm0
+ DB 65,15,88,196 ; addps %xmm12,%xmm0
+ DB 68,15,40,250 ; movaps %xmm2,%xmm15
+ DB 68,15,85,248 ; andnps %xmm0,%xmm15
DB 68,15,84,202 ; andps %xmm2,%xmm9
- DB 15,85,209 ; andnps %xmm1,%xmm2
- DB 65,15,86,209 ; orps %xmm9,%xmm2
- DB 65,15,40,205 ; movaps %xmm13,%xmm1
- DB 15,85,202 ; andnps %xmm2,%xmm1
- DB 65,15,92,208 ; subps %xmm8,%xmm2
- DB 65,15,89,211 ; mulps %xmm11,%xmm2
- DB 15,94,211 ; divps %xmm3,%xmm2
- DB 65,15,88,208 ; addps %xmm8,%xmm2
- DB 65,15,84,213 ; andps %xmm13,%xmm2
- DB 15,86,209 ; orps %xmm1,%xmm2
- DB 15,87,201 ; xorps %xmm1,%xmm1
- DB 15,95,193 ; maxps %xmm1,%xmm0
- DB 68,15,95,249 ; maxps %xmm1,%xmm15
- DB 15,95,209 ; maxps %xmm1,%xmm2
- DB 68,15,40,196 ; movaps %xmm4,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 68,15,92,196 ; subps %xmm4,%xmm8
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 69,15,86,207 ; orps %xmm15,%xmm9
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 65,15,85,193 ; andnps %xmm9,%xmm0
+ DB 69,15,92,204 ; subps %xmm12,%xmm9
+ DB 68,15,89,201 ; mulps %xmm1,%xmm9
+ DB 69,15,94,206 ; divps %xmm14,%xmm9
+ DB 69,15,88,204 ; addps %xmm12,%xmm9
+ DB 68,15,84,203 ; andps %xmm3,%xmm9
+ DB 68,15,86,200 ; orps %xmm0,%xmm9
+ DB 65,15,40,197 ; movaps %xmm13,%xmm0
+ DB 65,15,92,196 ; subps %xmm12,%xmm0
+ DB 65,15,89,196 ; mulps %xmm12,%xmm0
+ DB 15,94,198 ; divps %xmm6,%xmm0
+ DB 65,15,88,196 ; addps %xmm12,%xmm0
+ DB 68,15,84,234 ; andps %xmm2,%xmm13
+ DB 15,85,208 ; andnps %xmm0,%xmm2
+ DB 65,15,86,213 ; orps %xmm13,%xmm2
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,85,194 ; andnps %xmm2,%xmm0
+ DB 65,15,92,212 ; subps %xmm12,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 65,15,94,214 ; divps %xmm14,%xmm2
+ DB 65,15,88,212 ; addps %xmm12,%xmm2
+ DB 15,84,211 ; andps %xmm3,%xmm2
+ DB 15,86,208 ; orps %xmm0,%xmm2
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 68,15,95,208 ; maxps %xmm0,%xmm10
+ DB 68,15,95,200 ; maxps %xmm0,%xmm9
+ DB 15,95,208 ; maxps %xmm0,%xmm2
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 15,40,92,36,16 ; movaps 0x10(%rsp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 68,15,40,229 ; movaps %xmm5,%xmm12
+ DB 65,15,92,228 ; subps %xmm12,%xmm4
+ DB 68,15,89,220 ; mulps %xmm4,%xmm11
+ DB 68,15,88,216 ; addps %xmm0,%xmm11
+ DB 69,15,88,218 ; addps %xmm10,%xmm11
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 15,40,108,36,32 ; movaps 0x20(%rsp),%xmm5
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,40,76,36,48 ; movaps 0x30(%rsp),%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 65,15,88,201 ; addps %xmm9,%xmm1
+ DB 15,89,100,36,64 ; mulps 0x40(%rsp),%xmm4
+ DB 15,40,4,36 ; movaps (%rsp),%xmm0
+ DB 68,15,89,192 ; mulps %xmm0,%xmm8
+ DB 68,15,88,196 ; addps %xmm4,%xmm8
+ DB 68,15,88,194 ; addps %xmm2,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 65,15,40,242 ; movaps %xmm10,%xmm6
- DB 65,15,40,207 ; movaps %xmm15,%xmm1
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
+ DB 15,40,227 ; movaps %xmm3,%xmm4
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
+ DB 65,15,40,208 ; movaps %xmm8,%xmm2
+ DB 15,40,223 ; movaps %xmm7,%xmm3
+ DB 65,15,40,252 ; movaps %xmm12,%xmm7
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_color_sse2
_sk_color_sse2 LABEL PROC
- DB 72,131,236,24 ; sub $0x18,%rsp
+ DB 72,131,236,72 ; sub $0x48,%rsp
+ DB 68,15,40,199 ; movaps %xmm7,%xmm8
+ DB 68,15,40,230 ; movaps %xmm6,%xmm12
+ DB 68,15,41,100,36,32 ; movaps %xmm12,0x20(%rsp)
DB 68,15,40,221 ; movaps %xmm5,%xmm11
- DB 68,15,41,28,36 ; movaps %xmm11,(%rsp)
- DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 68,15,40,249 ; movaps %xmm1,%xmm15
- DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,128,55,0,0 ; movaps 0x3780(%rip),%xmm9 # 4ac0 <_sk_callback_sse2+0x2d6>
- DB 69,15,40,209 ; movaps %xmm9,%xmm10
- DB 68,15,94,212 ; divps %xmm4,%xmm10
- DB 68,15,40,228 ; movaps %xmm4,%xmm12
- DB 69,15,194,224,4 ; cmpneqps %xmm8,%xmm12
- DB 69,15,84,226 ; andps %xmm10,%xmm12
- DB 65,15,89,196 ; mulps %xmm12,%xmm0
- DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,89,226 ; mulps %xmm2,%xmm12
- DB 68,15,40,45,103,55,0,0 ; movaps 0x3767(%rip),%xmm13 # 4ad0 <_sk_callback_sse2+0x2e6>
+ DB 68,15,41,92,36,48 ; movaps %xmm11,0x30(%rsp)
+ DB 15,40,244 ; movaps %xmm4,%xmm6
+ DB 15,41,20,36 ; movaps %xmm2,(%rsp)
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 68,15,40,207 ; movaps %xmm7,%xmm9
+ DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,40,213 ; movaps %xmm5,%xmm10
- DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,40,53,103,55,0,0 ; movaps 0x3767(%rip),%xmm14 # 4ae0 <_sk_callback_sse2+0x2f6>
- DB 65,15,40,211 ; movaps %xmm11,%xmm2
- DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 68,15,40,21,99,55,0,0 ; movaps 0x3763(%rip),%xmm10 # 4af0 <_sk_callback_sse2+0x306>
- DB 68,15,40,222 ; movaps %xmm6,%xmm11
- DB 69,15,89,218 ; mulps %xmm10,%xmm11
- DB 68,15,88,218 ; addps %xmm2,%xmm11
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 65,15,40,207 ; movaps %xmm15,%xmm1
- DB 65,15,89,206 ; mulps %xmm14,%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 65,15,40,212 ; movaps %xmm12,%xmm2
- DB 65,15,89,210 ; mulps %xmm10,%xmm2
- DB 15,88,209 ; addps %xmm1,%xmm2
- DB 68,15,92,218 ; subps %xmm2,%xmm11
- DB 65,15,88,195 ; addps %xmm11,%xmm0
- DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 65,15,40,207 ; movaps %xmm15,%xmm1
- DB 65,15,93,203 ; minps %xmm11,%xmm1
- DB 68,15,40,224 ; movaps %xmm0,%xmm12
- DB 68,15,93,225 ; minps %xmm1,%xmm12
- DB 65,15,40,215 ; movaps %xmm15,%xmm2
- DB 65,15,95,211 ; maxps %xmm11,%xmm2
- DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 15,95,218 ; maxps %xmm2,%xmm3
- DB 68,15,89,232 ; mulps %xmm0,%xmm13
- DB 69,15,89,247 ; mulps %xmm15,%xmm14
+ DB 69,15,89,208 ; mulps %xmm8,%xmm10
+ DB 65,15,40,208 ; movaps %xmm8,%xmm2
+ DB 68,15,40,45,241,55,0,0 ; movaps 0x37f1(%rip),%xmm13 # 4bf0 <_sk_callback_sse2+0x2cc>
+ DB 68,15,40,198 ; movaps %xmm6,%xmm8
+ DB 69,15,89,197 ; mulps %xmm13,%xmm8
+ DB 68,15,40,53,241,55,0,0 ; movaps 0x37f1(%rip),%xmm14 # 4c00 <_sk_callback_sse2+0x2dc>
+ DB 65,15,40,195 ; movaps %xmm11,%xmm0
+ DB 65,15,89,198 ; mulps %xmm14,%xmm0
+ DB 65,15,88,192 ; addps %xmm8,%xmm0
+ DB 68,15,40,29,237,55,0,0 ; movaps 0x37ed(%rip),%xmm11 # 4c10 <_sk_callback_sse2+0x2ec>
+ DB 69,15,89,227 ; mulps %xmm11,%xmm12
+ DB 68,15,88,224 ; addps %xmm0,%xmm12
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,89,197 ; mulps %xmm13,%xmm0
+ DB 69,15,40,250 ; movaps %xmm10,%xmm15
+ DB 69,15,89,254 ; mulps %xmm14,%xmm15
+ DB 68,15,88,248 ; addps %xmm0,%xmm15
+ DB 68,15,40,5,217,55,0,0 ; movaps 0x37d9(%rip),%xmm8 # 4c20 <_sk_callback_sse2+0x2fc>
+ DB 65,15,40,224 ; movaps %xmm8,%xmm4
+ DB 15,92,226 ; subps %xmm2,%xmm4
+ DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,40,12,36 ; movaps (%rsp),%xmm1
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 65,15,89,195 ; mulps %xmm11,%xmm0
+ DB 65,15,88,199 ; addps %xmm15,%xmm0
+ DB 68,15,89,227 ; mulps %xmm3,%xmm12
+ DB 68,15,92,224 ; subps %xmm0,%xmm12
+ DB 69,15,88,204 ; addps %xmm12,%xmm9
+ DB 69,15,88,212 ; addps %xmm12,%xmm10
+ DB 68,15,88,225 ; addps %xmm1,%xmm12
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 65,15,93,196 ; minps %xmm12,%xmm0
+ DB 65,15,40,201 ; movaps %xmm9,%xmm1
+ DB 15,93,200 ; minps %xmm0,%xmm1
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 65,15,95,196 ; maxps %xmm12,%xmm0
+ DB 69,15,40,249 ; movaps %xmm9,%xmm15
+ DB 68,15,95,248 ; maxps %xmm0,%xmm15
+ DB 69,15,89,233 ; mulps %xmm9,%xmm13
+ DB 69,15,89,242 ; mulps %xmm10,%xmm14
DB 69,15,88,245 ; addps %xmm13,%xmm14
- DB 69,15,89,211 ; mulps %xmm11,%xmm10
- DB 69,15,88,214 ; addps %xmm14,%xmm10
- DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 65,15,194,212,2 ; cmpleps %xmm12,%xmm2
- DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 69,15,92,234 ; subps %xmm10,%xmm13
- DB 69,15,89,234 ; mulps %xmm10,%xmm13
- DB 69,15,40,242 ; movaps %xmm10,%xmm14
- DB 69,15,92,244 ; subps %xmm12,%xmm14
- DB 69,15,94,238 ; divps %xmm14,%xmm13
- DB 69,15,88,234 ; addps %xmm10,%xmm13
- DB 68,15,40,226 ; movaps %xmm2,%xmm12
- DB 69,15,85,229 ; andnps %xmm13,%xmm12
- DB 15,84,194 ; andps %xmm2,%xmm0
- DB 65,15,86,196 ; orps %xmm12,%xmm0
- DB 69,15,40,233 ; movaps %xmm9,%xmm13
- DB 68,15,194,235,1 ; cmpltps %xmm3,%xmm13
- DB 69,15,40,229 ; movaps %xmm13,%xmm12
- DB 68,15,85,224 ; andnps %xmm0,%xmm12
- DB 65,15,92,194 ; subps %xmm10,%xmm0
- DB 69,15,92,202 ; subps %xmm10,%xmm9
- DB 65,15,89,193 ; mulps %xmm9,%xmm0
- DB 65,15,92,218 ; subps %xmm10,%xmm3
- DB 15,94,195 ; divps %xmm3,%xmm0
- DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 65,15,84,197 ; andps %xmm13,%xmm0
- DB 65,15,86,196 ; orps %xmm12,%xmm0
- DB 69,15,40,231 ; movaps %xmm15,%xmm12
- DB 69,15,92,226 ; subps %xmm10,%xmm12
- DB 69,15,89,226 ; mulps %xmm10,%xmm12
- DB 69,15,94,230 ; divps %xmm14,%xmm12
- DB 69,15,88,226 ; addps %xmm10,%xmm12
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 65,15,85,204 ; andnps %xmm12,%xmm1
- DB 68,15,84,250 ; andps %xmm2,%xmm15
- DB 68,15,86,249 ; orps %xmm1,%xmm15
- DB 65,15,40,205 ; movaps %xmm13,%xmm1
- DB 65,15,85,207 ; andnps %xmm15,%xmm1
- DB 69,15,92,250 ; subps %xmm10,%xmm15
- DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,94,251 ; divps %xmm3,%xmm15
- DB 69,15,88,250 ; addps %xmm10,%xmm15
- DB 69,15,84,253 ; andps %xmm13,%xmm15
- DB 68,15,86,249 ; orps %xmm1,%xmm15
- DB 65,15,40,203 ; movaps %xmm11,%xmm1
- DB 65,15,92,202 ; subps %xmm10,%xmm1
- DB 65,15,89,202 ; mulps %xmm10,%xmm1
+ DB 69,15,89,220 ; mulps %xmm12,%xmm11
+ DB 69,15,88,222 ; addps %xmm14,%xmm11
+ DB 69,15,87,237 ; xorps %xmm13,%xmm13
+ DB 68,15,194,233,2 ; cmpleps %xmm1,%xmm13
+ DB 69,15,40,243 ; movaps %xmm11,%xmm14
+ DB 68,15,92,241 ; subps %xmm1,%xmm14
+ DB 65,15,40,201 ; movaps %xmm9,%xmm1
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 65,15,94,206 ; divps %xmm14,%xmm1
- DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,84,218 ; andps %xmm2,%xmm11
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 65,15,40,197 ; movaps %xmm13,%xmm0
+ DB 15,85,193 ; andnps %xmm1,%xmm0
+ DB 69,15,84,205 ; andps %xmm13,%xmm9
+ DB 68,15,86,200 ; orps %xmm0,%xmm9
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,41,84,36,16 ; movaps %xmm2,0x10(%rsp)
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 68,15,92,195 ; subps %xmm3,%xmm8
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 15,92,216 ; subps %xmm0,%xmm3
+ DB 15,41,28,36 ; movaps %xmm3,(%rsp)
+ DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 65,15,85,201 ; andnps %xmm9,%xmm1
+ DB 69,15,92,203 ; subps %xmm11,%xmm9
+ DB 65,15,92,219 ; subps %xmm11,%xmm3
+ DB 68,15,89,203 ; mulps %xmm3,%xmm9
+ DB 69,15,92,251 ; subps %xmm11,%xmm15
+ DB 69,15,94,207 ; divps %xmm15,%xmm9
+ DB 69,15,88,203 ; addps %xmm11,%xmm9
+ DB 68,15,84,200 ; andps %xmm0,%xmm9
+ DB 68,15,86,201 ; orps %xmm1,%xmm9
+ DB 65,15,40,202 ; movaps %xmm10,%xmm1
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 65,15,94,206 ; divps %xmm14,%xmm1
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 65,15,40,213 ; movaps %xmm13,%xmm2
DB 15,85,209 ; andnps %xmm1,%xmm2
- DB 65,15,86,211 ; orps %xmm11,%xmm2
- DB 65,15,40,205 ; movaps %xmm13,%xmm1
- DB 15,85,202 ; andnps %xmm2,%xmm1
- DB 65,15,92,210 ; subps %xmm10,%xmm2
- DB 65,15,89,209 ; mulps %xmm9,%xmm2
- DB 15,94,211 ; divps %xmm3,%xmm2
- DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 65,15,84,213 ; andps %xmm13,%xmm2
- DB 15,86,209 ; orps %xmm1,%xmm2
- DB 65,15,95,192 ; maxps %xmm8,%xmm0
- DB 69,15,95,248 ; maxps %xmm8,%xmm15
- DB 65,15,95,208 ; maxps %xmm8,%xmm2
- DB 68,15,40,196 ; movaps %xmm4,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 68,15,92,196 ; subps %xmm4,%xmm8
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 65,15,89,208 ; mulps %xmm8,%xmm2
+ DB 69,15,84,213 ; andps %xmm13,%xmm10
+ DB 68,15,86,210 ; orps %xmm2,%xmm10
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 65,15,85,202 ; andnps %xmm10,%xmm1
+ DB 69,15,92,211 ; subps %xmm11,%xmm10
+ DB 68,15,89,211 ; mulps %xmm3,%xmm10
+ DB 69,15,94,215 ; divps %xmm15,%xmm10
+ DB 69,15,88,211 ; addps %xmm11,%xmm10
+ DB 68,15,84,208 ; andps %xmm0,%xmm10
+ DB 68,15,86,209 ; orps %xmm1,%xmm10
+ DB 65,15,40,204 ; movaps %xmm12,%xmm1
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 65,15,94,206 ; divps %xmm14,%xmm1
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 69,15,84,229 ; andps %xmm13,%xmm12
+ DB 68,15,85,233 ; andnps %xmm1,%xmm13
+ DB 69,15,86,236 ; orps %xmm12,%xmm13
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 65,15,85,205 ; andnps %xmm13,%xmm1
+ DB 69,15,92,235 ; subps %xmm11,%xmm13
+ DB 68,15,89,235 ; mulps %xmm3,%xmm13
+ DB 69,15,94,239 ; divps %xmm15,%xmm13
+ DB 69,15,88,235 ; addps %xmm11,%xmm13
+ DB 68,15,84,232 ; andps %xmm0,%xmm13
+ DB 68,15,86,233 ; orps %xmm1,%xmm13
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 68,15,95,200 ; maxps %xmm0,%xmm9
+ DB 68,15,95,208 ; maxps %xmm0,%xmm10
+ DB 68,15,95,232 ; maxps %xmm0,%xmm13
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 65,15,88,249 ; addps %xmm9,%xmm7
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 15,40,84,36,48 ; movaps 0x30(%rsp),%xmm2
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 65,15,88,234 ; addps %xmm10,%xmm5
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,68,36,32 ; movaps 0x20(%rsp),%xmm0
+ DB 68,15,89,192 ; mulps %xmm0,%xmm8
+ DB 68,15,88,196 ; addps %xmm4,%xmm8
+ DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,40,44,36 ; movaps (%rsp),%xmm5
- DB 65,15,40,207 ; movaps %xmm15,%xmm1
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
- DB 72,131,196,24 ; add $0x18,%rsp
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 65,15,40,208 ; movaps %xmm8,%xmm2
+ DB 15,40,28,36 ; movaps (%rsp),%xmm3
+ DB 15,40,124,36,16 ; movaps 0x10(%rsp),%xmm7
+ DB 72,131,196,72 ; add $0x48,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_luminosity_sse2
_sk_luminosity_sse2 LABEL PROC
- DB 72,131,236,24 ; sub $0x18,%rsp
- DB 68,15,40,238 ; movaps %xmm6,%xmm13
- DB 68,15,41,44,36 ; movaps %xmm13,(%rsp)
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 68,15,40,215 ; movaps %xmm7,%xmm10
+ DB 15,41,116,36,32 ; movaps %xmm6,0x20(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
- DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 68,15,40,193 ; movaps %xmm1,%xmm8
- DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 69,15,87,210 ; xorps %xmm10,%xmm10
- DB 68,15,40,29,187,53,0,0 ; movaps 0x35bb(%rip),%xmm11 # 4b00 <_sk_callback_sse2+0x316>
- DB 65,15,40,195 ; movaps %xmm11,%xmm0
- DB 15,94,199 ; divps %xmm7,%xmm0
- DB 68,15,40,231 ; movaps %xmm7,%xmm12
- DB 69,15,194,226,4 ; cmpneqps %xmm10,%xmm12
- DB 68,15,84,224 ; andps %xmm0,%xmm12
- DB 65,15,40,196 ; movaps %xmm12,%xmm0
- DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,41,116,36,64 ; movaps %xmm6,0x40(%rsp)
+ DB 15,41,100,36,48 ; movaps %xmm4,0x30(%rsp)
+ DB 15,40,235 ; movaps %xmm3,%xmm5
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 68,15,40,205 ; movaps %xmm5,%xmm9
+ DB 68,15,89,204 ; mulps %xmm4,%xmm9
+ DB 15,89,222 ; mulps %xmm6,%xmm3
+ DB 68,15,40,37,235,53,0,0 ; movaps 0x35eb(%rip),%xmm12 # 4c30 <_sk_callback_sse2+0x30c>
+ DB 68,15,40,199 ; movaps %xmm7,%xmm8
+ DB 69,15,89,196 ; mulps %xmm12,%xmm8
+ DB 68,15,40,45,235,53,0,0 ; movaps 0x35eb(%rip),%xmm13 # 4c40 <_sk_callback_sse2+0x31c>
+ DB 68,15,40,241 ; movaps %xmm1,%xmm14
+ DB 69,15,89,245 ; mulps %xmm13,%xmm14
+ DB 69,15,88,240 ; addps %xmm8,%xmm14
+ DB 68,15,40,29,231,53,0,0 ; movaps 0x35e7(%rip),%xmm11 # 4c50 <_sk_callback_sse2+0x32c>
+ DB 68,15,40,5,239,53,0,0 ; movaps 0x35ef(%rip),%xmm8 # 4c60 <_sk_callback_sse2+0x33c>
+ DB 69,15,40,248 ; movaps %xmm8,%xmm15
+ DB 65,15,40,194 ; movaps %xmm10,%xmm0
+ DB 68,15,92,248 ; subps %xmm0,%xmm15
+ DB 65,15,89,255 ; mulps %xmm15,%xmm7
+ DB 65,15,89,207 ; mulps %xmm15,%xmm1
+ DB 15,41,76,36,16 ; movaps %xmm1,0x10(%rsp)
+ DB 68,15,89,250 ; mulps %xmm2,%xmm15
+ DB 65,15,89,211 ; mulps %xmm11,%xmm2
+ DB 65,15,88,214 ; addps %xmm14,%xmm2
+ DB 69,15,40,241 ; movaps %xmm9,%xmm14
+ DB 69,15,89,244 ; mulps %xmm12,%xmm14
+ DB 68,15,40,211 ; movaps %xmm3,%xmm10
+ DB 69,15,89,213 ; mulps %xmm13,%xmm10
+ DB 69,15,88,214 ; addps %xmm14,%xmm10
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,40,116,36,32 ; movaps 0x20(%rsp),%xmm6
+ DB 15,89,230 ; mulps %xmm6,%xmm4
+ DB 68,15,40,244 ; movaps %xmm4,%xmm14
+ DB 69,15,89,243 ; mulps %xmm11,%xmm14
+ DB 69,15,88,242 ; addps %xmm10,%xmm14
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 65,15,92,214 ; subps %xmm14,%xmm2
+ DB 68,15,88,202 ; addps %xmm2,%xmm9
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 68,15,40,211 ; movaps %xmm3,%xmm10
+ DB 68,15,93,210 ; minps %xmm2,%xmm10
+ DB 65,15,40,225 ; movaps %xmm9,%xmm4
+ DB 65,15,93,226 ; minps %xmm10,%xmm4
+ DB 68,15,40,211 ; movaps %xmm3,%xmm10
+ DB 68,15,95,210 ; maxps %xmm2,%xmm10
+ DB 69,15,40,241 ; movaps %xmm9,%xmm14
+ DB 69,15,95,242 ; maxps %xmm10,%xmm14
+ DB 69,15,89,225 ; mulps %xmm9,%xmm12
+ DB 68,15,89,235 ; mulps %xmm3,%xmm13
+ DB 69,15,88,236 ; addps %xmm12,%xmm13
+ DB 68,15,89,218 ; mulps %xmm2,%xmm11
+ DB 69,15,88,221 ; addps %xmm13,%xmm11
+ DB 69,15,87,228 ; xorps %xmm12,%xmm12
+ DB 68,15,194,228,2 ; cmpleps %xmm4,%xmm12
+ DB 69,15,40,211 ; movaps %xmm11,%xmm10
+ DB 68,15,92,212 ; subps %xmm4,%xmm10
+ DB 65,15,40,225 ; movaps %xmm9,%xmm4
+ DB 65,15,92,227 ; subps %xmm11,%xmm4
+ DB 65,15,89,227 ; mulps %xmm11,%xmm4
+ DB 65,15,94,226 ; divps %xmm10,%xmm4
+ DB 65,15,88,227 ; addps %xmm11,%xmm4
+ DB 69,15,40,236 ; movaps %xmm12,%xmm13
+ DB 68,15,85,236 ; andnps %xmm4,%xmm13
+ DB 69,15,84,204 ; andps %xmm12,%xmm9
+ DB 69,15,86,205 ; orps %xmm13,%xmm9
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,41,4,36 ; movaps %xmm0,(%rsp)
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 68,15,92,197 ; subps %xmm5,%xmm8
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 68,15,40,236 ; movaps %xmm4,%xmm13
+ DB 65,15,194,230,1 ; cmpltps %xmm14,%xmm4
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 65,15,85,193 ; andnps %xmm9,%xmm0
+ DB 69,15,92,203 ; subps %xmm11,%xmm9
+ DB 69,15,92,235 ; subps %xmm11,%xmm13
+ DB 69,15,89,205 ; mulps %xmm13,%xmm9
+ DB 69,15,92,243 ; subps %xmm11,%xmm14
+ DB 69,15,94,206 ; divps %xmm14,%xmm9
+ DB 69,15,88,203 ; addps %xmm11,%xmm9
+ DB 68,15,84,204 ; andps %xmm4,%xmm9
+ DB 68,15,86,200 ; orps %xmm0,%xmm9
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 65,15,92,195 ; subps %xmm11,%xmm0
+ DB 65,15,89,195 ; mulps %xmm11,%xmm0
+ DB 65,15,94,194 ; divps %xmm10,%xmm0
+ DB 65,15,88,195 ; addps %xmm11,%xmm0
DB 65,15,40,204 ; movaps %xmm12,%xmm1
- DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,85,200 ; andnps %xmm0,%xmm1
+ DB 65,15,84,220 ; andps %xmm12,%xmm3
+ DB 15,86,217 ; orps %xmm1,%xmm3
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 15,85,195 ; andnps %xmm3,%xmm0
+ DB 65,15,92,219 ; subps %xmm11,%xmm3
+ DB 65,15,89,221 ; mulps %xmm13,%xmm3
+ DB 65,15,94,222 ; divps %xmm14,%xmm3
+ DB 65,15,88,219 ; addps %xmm11,%xmm3
+ DB 15,84,220 ; andps %xmm4,%xmm3
+ DB 15,86,216 ; orps %xmm0,%xmm3
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 65,15,92,195 ; subps %xmm11,%xmm0
+ DB 65,15,89,195 ; mulps %xmm11,%xmm0
+ DB 65,15,94,194 ; divps %xmm10,%xmm0
+ DB 65,15,88,195 ; addps %xmm11,%xmm0
+ DB 65,15,84,212 ; andps %xmm12,%xmm2
+ DB 68,15,85,224 ; andnps %xmm0,%xmm12
+ DB 68,15,86,226 ; orps %xmm2,%xmm12
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 65,15,85,196 ; andnps %xmm12,%xmm0
+ DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,229 ; mulps %xmm13,%xmm12
- DB 68,15,40,53,157,53,0,0 ; movaps 0x359d(%rip),%xmm14 # 4b10 <_sk_callback_sse2+0x326>
- DB 69,15,89,206 ; mulps %xmm14,%xmm9
- DB 68,15,40,45,161,53,0,0 ; movaps 0x35a1(%rip),%xmm13 # 4b20 <_sk_callback_sse2+0x336>
- DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 69,15,88,193 ; addps %xmm9,%xmm8
- DB 68,15,40,13,161,53,0,0 ; movaps 0x35a1(%rip),%xmm9 # 4b30 <_sk_callback_sse2+0x346>
- DB 65,15,89,217 ; mulps %xmm9,%xmm3
- DB 65,15,88,216 ; addps %xmm8,%xmm3
- DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,40,249 ; movaps %xmm1,%xmm15
- DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 69,15,88,248 ; addps %xmm8,%xmm15
- DB 69,15,40,196 ; movaps %xmm12,%xmm8
- DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 69,15,88,199 ; addps %xmm15,%xmm8
- DB 65,15,92,216 ; subps %xmm8,%xmm3
- DB 15,88,195 ; addps %xmm3,%xmm0
+ DB 69,15,94,230 ; divps %xmm14,%xmm12
+ DB 69,15,88,227 ; addps %xmm11,%xmm12
+ DB 68,15,84,228 ; andps %xmm4,%xmm12
+ DB 68,15,86,224 ; orps %xmm0,%xmm12
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 68,15,95,200 ; maxps %xmm0,%xmm9
+ DB 15,95,216 ; maxps %xmm0,%xmm3
+ DB 68,15,95,224 ; maxps %xmm0,%xmm12
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 15,40,100,36,48 ; movaps 0x30(%rsp),%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 65,15,88,249 ; addps %xmm9,%xmm7
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 68,15,40,84,36,64 ; movaps 0x40(%rsp),%xmm10
+ DB 65,15,89,194 ; mulps %xmm10,%xmm0
+ DB 15,40,76,36,16 ; movaps 0x10(%rsp),%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,88,203 ; addps %xmm3,%xmm1
- DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 68,15,40,193 ; movaps %xmm1,%xmm8
- DB 68,15,93,195 ; minps %xmm3,%xmm8
- DB 68,15,40,248 ; movaps %xmm0,%xmm15
- DB 69,15,93,248 ; minps %xmm8,%xmm15
- DB 68,15,40,193 ; movaps %xmm1,%xmm8
- DB 68,15,95,195 ; maxps %xmm3,%xmm8
- DB 68,15,40,224 ; movaps %xmm0,%xmm12
- DB 69,15,95,224 ; maxps %xmm8,%xmm12
- DB 68,15,89,240 ; mulps %xmm0,%xmm14
- DB 68,15,89,233 ; mulps %xmm1,%xmm13
- DB 69,15,88,238 ; addps %xmm14,%xmm13
- DB 68,15,89,203 ; mulps %xmm3,%xmm9
- DB 69,15,88,205 ; addps %xmm13,%xmm9
- DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 69,15,194,199,2 ; cmpleps %xmm15,%xmm8
- DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 69,15,92,233 ; subps %xmm9,%xmm13
- DB 69,15,89,233 ; mulps %xmm9,%xmm13
- DB 69,15,40,241 ; movaps %xmm9,%xmm14
- DB 69,15,92,247 ; subps %xmm15,%xmm14
- DB 69,15,94,238 ; divps %xmm14,%xmm13
- DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 69,15,40,248 ; movaps %xmm8,%xmm15
- DB 69,15,85,253 ; andnps %xmm13,%xmm15
- DB 65,15,84,192 ; andps %xmm8,%xmm0
- DB 65,15,86,199 ; orps %xmm15,%xmm0
- DB 69,15,40,235 ; movaps %xmm11,%xmm13
- DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 69,15,40,253 ; movaps %xmm13,%xmm15
- DB 68,15,85,248 ; andnps %xmm0,%xmm15
- DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 69,15,92,217 ; subps %xmm9,%xmm11
- DB 65,15,89,195 ; mulps %xmm11,%xmm0
- DB 69,15,92,225 ; subps %xmm9,%xmm12
- DB 65,15,94,196 ; divps %xmm12,%xmm0
- DB 65,15,88,193 ; addps %xmm9,%xmm0
- DB 65,15,84,197 ; andps %xmm13,%xmm0
- DB 65,15,86,199 ; orps %xmm15,%xmm0
- DB 68,15,40,249 ; movaps %xmm1,%xmm15
- DB 69,15,92,249 ; subps %xmm9,%xmm15
- DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 69,15,94,254 ; divps %xmm14,%xmm15
- DB 69,15,88,249 ; addps %xmm9,%xmm15
- DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 65,15,85,215 ; andnps %xmm15,%xmm2
- DB 65,15,84,200 ; andps %xmm8,%xmm1
- DB 15,86,202 ; orps %xmm2,%xmm1
- DB 65,15,40,213 ; movaps %xmm13,%xmm2
- DB 15,85,209 ; andnps %xmm1,%xmm2
- DB 65,15,92,201 ; subps %xmm9,%xmm1
- DB 65,15,89,203 ; mulps %xmm11,%xmm1
- DB 65,15,94,204 ; divps %xmm12,%xmm1
- DB 65,15,88,201 ; addps %xmm9,%xmm1
- DB 65,15,84,205 ; andps %xmm13,%xmm1
- DB 15,86,202 ; orps %xmm2,%xmm1
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 65,15,92,209 ; subps %xmm9,%xmm2
- DB 65,15,89,209 ; mulps %xmm9,%xmm2
- DB 65,15,94,214 ; divps %xmm14,%xmm2
- DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 65,15,84,216 ; andps %xmm8,%xmm3
- DB 68,15,85,194 ; andnps %xmm2,%xmm8
- DB 68,15,86,195 ; orps %xmm3,%xmm8
- DB 65,15,40,213 ; movaps %xmm13,%xmm2
- DB 65,15,85,208 ; andnps %xmm8,%xmm2
- DB 69,15,92,193 ; subps %xmm9,%xmm8
- DB 69,15,89,195 ; mulps %xmm11,%xmm8
- DB 69,15,94,196 ; divps %xmm12,%xmm8
- DB 69,15,88,193 ; addps %xmm9,%xmm8
- DB 69,15,84,197 ; andps %xmm13,%xmm8
- DB 68,15,86,194 ; orps %xmm2,%xmm8
- DB 65,15,95,194 ; maxps %xmm10,%xmm0
- DB 65,15,95,202 ; maxps %xmm10,%xmm1
- DB 69,15,95,194 ; maxps %xmm10,%xmm8
- DB 68,15,40,204 ; movaps %xmm4,%xmm9
- DB 68,15,88,207 ; addps %xmm7,%xmm9
- DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 68,15,92,204 ; subps %xmm4,%xmm9
- DB 65,15,89,193 ; mulps %xmm9,%xmm0
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 69,15,89,193 ; mulps %xmm9,%xmm8
+ DB 68,15,89,198 ; mulps %xmm6,%xmm8
+ DB 69,15,88,199 ; addps %xmm15,%xmm8
+ DB 69,15,88,196 ; addps %xmm12,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,40,199 ; movaps %xmm7,%xmm0
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 65,15,40,217 ; movaps %xmm9,%xmm3
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 15,40,52,36 ; movaps (%rsp),%xmm6
- DB 72,131,196,24 ; add $0x18,%rsp
+ DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 65,15,40,234 ; movaps %xmm10,%xmm5
+ DB 15,40,60,36 ; movaps (%rsp),%xmm7
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
PUBLIC _sk_clamp_0_sse2
@@ -18498,7 +18789,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,0,52,0,0 ; movaps 0x3400(%rip),%xmm8 # 4b40 <_sk_callback_sse2+0x356>
+ DB 68,15,40,5,246,51,0,0 ; movaps 0x33f6(%rip),%xmm8 # 4c70 <_sk_callback_sse2+0x34c>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -18508,7 +18799,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,245,51,0,0 ; minps 0x33f5(%rip),%xmm3 # 4b50 <_sk_callback_sse2+0x366>
+ DB 15,93,29,235,51,0,0 ; minps 0x33eb(%rip),%xmm3 # 4c80 <_sk_callback_sse2+0x35c>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -18581,7 +18872,7 @@ _sk_premul_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,96,51,0,0 ; movaps 0x3360(%rip),%xmm9 # 4b60 <_sk_callback_sse2+0x376>
+ DB 68,15,40,13,86,51,0,0 ; movaps 0x3356(%rip),%xmm9 # 4c90 <_sk_callback_sse2+0x36c>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -18593,20 +18884,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,75,51,0,0 ; movaps 0x334b(%rip),%xmm8 # 4b70 <_sk_callback_sse2+0x386>
+ DB 68,15,40,5,65,51,0,0 ; movaps 0x3341(%rip),%xmm8 # 4ca0 <_sk_callback_sse2+0x37c>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,67,51,0,0 ; movaps 0x3343(%rip),%xmm9 # 4b80 <_sk_callback_sse2+0x396>
+ DB 68,15,40,13,57,51,0,0 ; movaps 0x3339(%rip),%xmm9 # 4cb0 <_sk_callback_sse2+0x38c>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,67,51,0,0 ; movaps 0x3343(%rip),%xmm10 # 4b90 <_sk_callback_sse2+0x3a6>
+ DB 68,15,40,21,57,51,0,0 ; movaps 0x3339(%rip),%xmm10 # 4cc0 <_sk_callback_sse2+0x39c>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,67,51,0,0 ; movaps 0x3343(%rip),%xmm11 # 4ba0 <_sk_callback_sse2+0x3b6>
+ DB 68,15,40,29,57,51,0,0 ; movaps 0x3339(%rip),%xmm11 # 4cd0 <_sk_callback_sse2+0x3ac>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,71,51,0,0 ; movaps 0x3347(%rip),%xmm12 # 4bb0 <_sk_callback_sse2+0x3c6>
+ DB 68,15,40,37,61,51,0,0 ; movaps 0x333d(%rip),%xmm12 # 4ce0 <_sk_callback_sse2+0x3bc>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -18643,20 +18934,20 @@ _sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
DB 69,15,83,200 ; rcpps %xmm8,%xmm9
DB 69,15,82,232 ; rsqrtps %xmm8,%xmm13
- DB 68,15,40,5,204,50,0,0 ; movaps 0x32cc(%rip),%xmm8 # 4bc0 <_sk_callback_sse2+0x3d6>
+ DB 68,15,40,5,194,50,0,0 ; movaps 0x32c2(%rip),%xmm8 # 4cf0 <_sk_callback_sse2+0x3cc>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,21,204,50,0,0 ; movaps 0x32cc(%rip),%xmm10 # 4bd0 <_sk_callback_sse2+0x3e6>
+ DB 68,15,40,21,194,50,0,0 ; movaps 0x32c2(%rip),%xmm10 # 4d00 <_sk_callback_sse2+0x3dc>
DB 69,15,89,202 ; mulps %xmm10,%xmm9
- DB 68,15,40,29,208,50,0,0 ; movaps 0x32d0(%rip),%xmm11 # 4be0 <_sk_callback_sse2+0x3f6>
+ DB 68,15,40,29,198,50,0,0 ; movaps 0x32c6(%rip),%xmm11 # 4d10 <_sk_callback_sse2+0x3ec>
DB 69,15,88,203 ; addps %xmm11,%xmm9
- DB 68,15,40,37,212,50,0,0 ; movaps 0x32d4(%rip),%xmm12 # 4bf0 <_sk_callback_sse2+0x406>
+ DB 68,15,40,37,202,50,0,0 ; movaps 0x32ca(%rip),%xmm12 # 4d20 <_sk_callback_sse2+0x3fc>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,40,13,212,50,0,0 ; movaps 0x32d4(%rip),%xmm9 # 4c00 <_sk_callback_sse2+0x416>
+ DB 68,15,40,13,202,50,0,0 ; movaps 0x32ca(%rip),%xmm9 # 4d30 <_sk_callback_sse2+0x40c>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,93,253 ; minps %xmm13,%xmm15
- DB 68,15,40,45,212,50,0,0 ; movaps 0x32d4(%rip),%xmm13 # 4c10 <_sk_callback_sse2+0x426>
+ DB 68,15,40,45,202,50,0,0 ; movaps 0x32ca(%rip),%xmm13 # 4d40 <_sk_callback_sse2+0x41c>
DB 65,15,194,197,1 ; cmpltps %xmm13,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
@@ -18704,7 +18995,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,93,218 ; minps %xmm2,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,45,50,0,0 ; movaps 0x322d(%rip),%xmm13 # 4c20 <_sk_callback_sse2+0x436>
+ DB 68,15,40,45,35,50,0,0 ; movaps 0x3223(%rip),%xmm13 # 4d50 <_sk_callback_sse2+0x42c>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -18713,30 +19004,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,19,50,0,0 ; andps 0x3213(%rip),%xmm14 # 4c30 <_sk_callback_sse2+0x446>
+ DB 68,15,84,53,9,50,0,0 ; andps 0x3209(%rip),%xmm14 # 4d60 <_sk_callback_sse2+0x43c>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,6,50,0,0 ; movaps 0x3206(%rip),%xmm12 # 4c40 <_sk_callback_sse2+0x456>
+ DB 68,15,40,37,252,49,0,0 ; movaps 0x31fc(%rip),%xmm12 # 4d70 <_sk_callback_sse2+0x44c>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,2,50,0,0 ; addps 0x3202(%rip),%xmm8 # 4c50 <_sk_callback_sse2+0x466>
+ DB 68,15,88,5,248,49,0,0 ; addps 0x31f8(%rip),%xmm8 # 4d80 <_sk_callback_sse2+0x45c>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,243,49,0,0 ; mulps 0x31f3(%rip),%xmm0 # 4c60 <_sk_callback_sse2+0x476>
+ DB 15,89,5,233,49,0,0 ; mulps 0x31e9(%rip),%xmm0 # 4d90 <_sk_callback_sse2+0x46c>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,230,49,0,0 ; movaps 0x31e6(%rip),%xmm9 # 4c70 <_sk_callback_sse2+0x486>
+ DB 68,15,40,13,220,49,0,0 ; movaps 0x31dc(%rip),%xmm9 # 4da0 <_sk_callback_sse2+0x47c>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -18759,7 +19050,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,161,49,0,0 ; movaps 0x31a1(%rip),%xmm9 # 4c80 <_sk_callback_sse2+0x496>
+ DB 68,15,40,13,151,49,0,0 ; movaps 0x3197(%rip),%xmm9 # 4db0 <_sk_callback_sse2+0x48c>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -18776,28 +19067,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,107,49,0,0 ; movaps 0x316b(%rip),%xmm0 # 4c90 <_sk_callback_sse2+0x4a6>
+ DB 15,40,5,97,49,0,0 ; movaps 0x3161(%rip),%xmm0 # 4dc0 <_sk_callback_sse2+0x49c>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,99,49,0,0 ; andps 0x3163(%rip),%xmm3 # 4ca0 <_sk_callback_sse2+0x4b6>
+ DB 15,84,29,89,49,0,0 ; andps 0x3159(%rip),%xmm3 # 4dd0 <_sk_callback_sse2+0x4ac>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,101,49,0,0 ; movaps 0x3165(%rip),%xmm13 # 4cb0 <_sk_callback_sse2+0x4c6>
+ DB 68,15,40,45,91,49,0,0 ; movaps 0x315b(%rip),%xmm13 # 4de0 <_sk_callback_sse2+0x4bc>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,117,49,0,0 ; movaps 0x3175(%rip),%xmm2 # 4ce0 <_sk_callback_sse2+0x4f6>
+ DB 15,40,21,107,49,0,0 ; movaps 0x316b(%rip),%xmm2 # 4e10 <_sk_callback_sse2+0x4ec>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,69,49,0,0 ; movaps 0x3145(%rip),%xmm1 # 4cc0 <_sk_callback_sse2+0x4d6>
+ DB 15,40,13,59,49,0,0 ; movaps 0x313b(%rip),%xmm1 # 4df0 <_sk_callback_sse2+0x4cc>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,75,49,0,0 ; movaps 0x314b(%rip),%xmm5 # 4cd0 <_sk_callback_sse2+0x4e6>
+ DB 15,40,45,65,49,0,0 ; movaps 0x3141(%rip),%xmm5 # 4e00 <_sk_callback_sse2+0x4dc>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -18820,7 +19111,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,192,48,0,0 ; andps 0x30c0(%rip),%xmm3 # 4ca0 <_sk_callback_sse2+0x4b6>
+ DB 15,84,29,182,48,0,0 ; andps 0x30b6(%rip),%xmm3 # 4dd0 <_sk_callback_sse2+0x4ac>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -18850,12 +19141,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,153,48,0,0 ; addps 0x3099(%rip),%xmm6 # 4cf0 <_sk_callback_sse2+0x506>
+ DB 15,88,53,143,48,0,0 ; addps 0x308f(%rip),%xmm6 # 4e20 <_sk_callback_sse2+0x4fc>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,52,48,0,0 ; andps 0x3034(%rip),%xmm3 # 4ca0 <_sk_callback_sse2+0x4b6>
+ DB 15,84,29,42,48,0,0 ; andps 0x302a(%rip),%xmm3 # 4dd0 <_sk_callback_sse2+0x4ac>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -18916,7 +19207,7 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,69,15,96,193 ; punpcklbw %xmm9,%xmm8
DB 102,69,15,97,193 ; punpcklwd %xmm9,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,190,47,0,0 ; mulps 0x2fbe(%rip),%xmm8 # 4d00 <_sk_callback_sse2+0x516>
+ DB 68,15,89,5,180,47,0,0 ; mulps 0x2fb4(%rip),%xmm8 # 4e30 <_sk_callback_sse2+0x50c>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -18953,7 +19244,7 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,69,15,96,193 ; punpcklbw %xmm9,%xmm8
DB 102,69,15,97,193 ; punpcklwd %xmm9,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,92,47,0,0 ; mulps 0x2f5c(%rip),%xmm8 # 4d10 <_sk_callback_sse2+0x526>
+ DB 68,15,89,5,82,47,0,0 ; mulps 0x2f52(%rip),%xmm8 # 4e40 <_sk_callback_sse2+0x51c>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -18976,17 +19267,17 @@ _sk_lerp_565_sse2 LABEL PROC
DB 243,68,15,126,20,120 ; movq (%rax,%rdi,2),%xmm10
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,69,15,97,208 ; punpcklwd %xmm8,%xmm10
- DB 102,68,15,111,5,34,47,0,0 ; movdqa 0x2f22(%rip),%xmm8 # 4d20 <_sk_callback_sse2+0x536>
+ DB 102,68,15,111,5,24,47,0,0 ; movdqa 0x2f18(%rip),%xmm8 # 4e50 <_sk_callback_sse2+0x52c>
DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,33,47,0,0 ; mulps 0x2f21(%rip),%xmm8 # 4d30 <_sk_callback_sse2+0x546>
- DB 102,68,15,111,13,40,47,0,0 ; movdqa 0x2f28(%rip),%xmm9 # 4d40 <_sk_callback_sse2+0x556>
+ DB 68,15,89,5,23,47,0,0 ; mulps 0x2f17(%rip),%xmm8 # 4e60 <_sk_callback_sse2+0x53c>
+ DB 102,68,15,111,13,30,47,0,0 ; movdqa 0x2f1e(%rip),%xmm9 # 4e70 <_sk_callback_sse2+0x54c>
DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,39,47,0,0 ; mulps 0x2f27(%rip),%xmm9 # 4d50 <_sk_callback_sse2+0x566>
- DB 102,68,15,219,21,46,47,0,0 ; pand 0x2f2e(%rip),%xmm10 # 4d60 <_sk_callback_sse2+0x576>
+ DB 68,15,89,13,29,47,0,0 ; mulps 0x2f1d(%rip),%xmm9 # 4e80 <_sk_callback_sse2+0x55c>
+ DB 102,68,15,219,21,36,47,0,0 ; pand 0x2f24(%rip),%xmm10 # 4e90 <_sk_callback_sse2+0x56c>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,50,47,0,0 ; mulps 0x2f32(%rip),%xmm10 # 4d70 <_sk_callback_sse2+0x586>
+ DB 68,15,89,21,40,47,0,0 ; mulps 0x2f28(%rip),%xmm10 # 4ea0 <_sk_callback_sse2+0x57c>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -19015,7 +19306,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 243,69,15,111,12,184 ; movdqu (%r8,%rdi,4),%xmm9
- DB 102,68,15,111,5,226,46,0,0 ; movdqa 0x2ee2(%rip),%xmm8 # 4d80 <_sk_callback_sse2+0x596>
+ DB 102,68,15,111,5,216,46,0,0 ; movdqa 0x2ed8(%rip),%xmm8 # 4eb0 <_sk_callback_sse2+0x58c>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -19070,7 +19361,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,239,45,0,0 ; mulps 0x2def(%rip),%xmm3 # 4d90 <_sk_callback_sse2+0x5a6>
+ DB 15,89,29,229,45,0,0 ; mulps 0x2de5(%rip),%xmm3 # 4ec0 <_sk_callback_sse2+0x59c>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -19087,7 +19378,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,194,45,0,0 ; movdqa 0x2dc2(%rip),%xmm10 # 4da0 <_sk_callback_sse2+0x5b6>
+ DB 102,68,15,111,21,184,45,0,0 ; movdqa 0x2db8(%rip),%xmm10 # 4ed0 <_sk_callback_sse2+0x5ac>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -19148,7 +19439,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,177,44,0,0 ; mulps 0x2cb1(%rip),%xmm3 # 4db0 <_sk_callback_sse2+0x5c6>
+ DB 15,89,29,167,44,0,0 ; mulps 0x2ca7(%rip),%xmm3 # 4ee0 <_sk_callback_sse2+0x5bc>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -19168,7 +19459,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,113,44,0,0 ; movdqa 0x2c71(%rip),%xmm8 # 4dc0 <_sk_callback_sse2+0x5d6>
+ DB 102,68,15,111,5,103,44,0,0 ; movdqa 0x2c67(%rip),%xmm8 # 4ef0 <_sk_callback_sse2+0x5cc>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -19223,7 +19514,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,128,43,0,0 ; movaps 0x2b80(%rip),%xmm3 # 4dd0 <_sk_callback_sse2+0x5e6>
+ DB 15,40,29,118,43,0,0 ; movaps 0x2b76(%rip),%xmm3 # 4f00 <_sk_callback_sse2+0x5dc>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_byte_tables_sse2
@@ -19231,7 +19522,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,129,43,0,0 ; movaps 0x2b81(%rip),%xmm8 # 4de0 <_sk_callback_sse2+0x5f6>
+ DB 68,15,40,5,119,43,0,0 ; movaps 0x2b77(%rip),%xmm8 # 4f10 <_sk_callback_sse2+0x5ec>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,72,15,126,193 ; movq %xmm0,%rcx
@@ -19258,7 +19549,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,30,43,0,0 ; movaps 0x2b1e(%rip),%xmm10 # 4df0 <_sk_callback_sse2+0x606>
+ DB 68,15,40,21,20,43,0,0 ; movaps 0x2b14(%rip),%xmm10 # 4f20 <_sk_callback_sse2+0x5fc>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19372,7 +19663,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,113,41,0,0 ; movaps 0x2971(%rip),%xmm10 # 4e00 <_sk_callback_sse2+0x616>
+ DB 68,15,40,21,103,41,0,0 ; movaps 0x2967(%rip),%xmm10 # 4f30 <_sk_callback_sse2+0x60c>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19559,15 +19850,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,176,38,0,0 ; mulps 0x26b0(%rip),%xmm9 # 4e10 <_sk_callback_sse2+0x626>
- DB 68,15,84,21,184,38,0,0 ; andps 0x26b8(%rip),%xmm10 # 4e20 <_sk_callback_sse2+0x636>
- DB 68,15,86,21,192,38,0,0 ; orps 0x26c0(%rip),%xmm10 # 4e30 <_sk_callback_sse2+0x646>
- DB 68,15,88,13,200,38,0,0 ; addps 0x26c8(%rip),%xmm9 # 4e40 <_sk_callback_sse2+0x656>
- DB 68,15,40,37,208,38,0,0 ; movaps 0x26d0(%rip),%xmm12 # 4e50 <_sk_callback_sse2+0x666>
+ DB 68,15,89,13,166,38,0,0 ; mulps 0x26a6(%rip),%xmm9 # 4f40 <_sk_callback_sse2+0x61c>
+ DB 68,15,84,21,174,38,0,0 ; andps 0x26ae(%rip),%xmm10 # 4f50 <_sk_callback_sse2+0x62c>
+ DB 68,15,86,21,182,38,0,0 ; orps 0x26b6(%rip),%xmm10 # 4f60 <_sk_callback_sse2+0x63c>
+ DB 68,15,88,13,190,38,0,0 ; addps 0x26be(%rip),%xmm9 # 4f70 <_sk_callback_sse2+0x64c>
+ DB 68,15,40,37,198,38,0,0 ; movaps 0x26c6(%rip),%xmm12 # 4f80 <_sk_callback_sse2+0x65c>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,208,38,0,0 ; addps 0x26d0(%rip),%xmm10 # 4e60 <_sk_callback_sse2+0x676>
- DB 68,15,40,37,216,38,0,0 ; movaps 0x26d8(%rip),%xmm12 # 4e70 <_sk_callback_sse2+0x686>
+ DB 68,15,88,21,198,38,0,0 ; addps 0x26c6(%rip),%xmm10 # 4f90 <_sk_callback_sse2+0x66c>
+ DB 68,15,40,37,206,38,0,0 ; movaps 0x26ce(%rip),%xmm12 # 4fa0 <_sk_callback_sse2+0x67c>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -19575,22 +19866,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,194,38,0,0 ; movaps 0x26c2(%rip),%xmm10 # 4e80 <_sk_callback_sse2+0x696>
+ DB 68,15,40,21,184,38,0,0 ; movaps 0x26b8(%rip),%xmm10 # 4fb0 <_sk_callback_sse2+0x68c>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,182,38,0,0 ; addps 0x26b6(%rip),%xmm9 # 4e90 <_sk_callback_sse2+0x6a6>
- DB 68,15,40,37,190,38,0,0 ; movaps 0x26be(%rip),%xmm12 # 4ea0 <_sk_callback_sse2+0x6b6>
+ DB 68,15,88,13,172,38,0,0 ; addps 0x26ac(%rip),%xmm9 # 4fc0 <_sk_callback_sse2+0x69c>
+ DB 68,15,40,37,180,38,0,0 ; movaps 0x26b4(%rip),%xmm12 # 4fd0 <_sk_callback_sse2+0x6ac>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,190,38,0,0 ; movaps 0x26be(%rip),%xmm12 # 4eb0 <_sk_callback_sse2+0x6c6>
+ DB 68,15,40,37,180,38,0,0 ; movaps 0x26b4(%rip),%xmm12 # 4fe0 <_sk_callback_sse2+0x6bc>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,194,38,0,0 ; movaps 0x26c2(%rip),%xmm13 # 4ec0 <_sk_callback_sse2+0x6d6>
+ DB 68,15,40,45,184,38,0,0 ; movaps 0x26b8(%rip),%xmm13 # 4ff0 <_sk_callback_sse2+0x6cc>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,194,38,0,0 ; mulps 0x26c2(%rip),%xmm13 # 4ed0 <_sk_callback_sse2+0x6e6>
+ DB 68,15,89,45,184,38,0,0 ; mulps 0x26b8(%rip),%xmm13 # 5000 <_sk_callback_sse2+0x6dc>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -19624,15 +19915,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,66,38,0,0 ; mulps 0x2642(%rip),%xmm9 # 4ee0 <_sk_callback_sse2+0x6f6>
- DB 68,15,84,21,74,38,0,0 ; andps 0x264a(%rip),%xmm10 # 4ef0 <_sk_callback_sse2+0x706>
- DB 68,15,86,21,82,38,0,0 ; orps 0x2652(%rip),%xmm10 # 4f00 <_sk_callback_sse2+0x716>
- DB 68,15,88,13,90,38,0,0 ; addps 0x265a(%rip),%xmm9 # 4f10 <_sk_callback_sse2+0x726>
- DB 68,15,40,37,98,38,0,0 ; movaps 0x2662(%rip),%xmm12 # 4f20 <_sk_callback_sse2+0x736>
+ DB 68,15,89,13,56,38,0,0 ; mulps 0x2638(%rip),%xmm9 # 5010 <_sk_callback_sse2+0x6ec>
+ DB 68,15,84,21,64,38,0,0 ; andps 0x2640(%rip),%xmm10 # 5020 <_sk_callback_sse2+0x6fc>
+ DB 68,15,86,21,72,38,0,0 ; orps 0x2648(%rip),%xmm10 # 5030 <_sk_callback_sse2+0x70c>
+ DB 68,15,88,13,80,38,0,0 ; addps 0x2650(%rip),%xmm9 # 5040 <_sk_callback_sse2+0x71c>
+ DB 68,15,40,37,88,38,0,0 ; movaps 0x2658(%rip),%xmm12 # 5050 <_sk_callback_sse2+0x72c>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,98,38,0,0 ; addps 0x2662(%rip),%xmm10 # 4f30 <_sk_callback_sse2+0x746>
- DB 68,15,40,37,106,38,0,0 ; movaps 0x266a(%rip),%xmm12 # 4f40 <_sk_callback_sse2+0x756>
+ DB 68,15,88,21,88,38,0,0 ; addps 0x2658(%rip),%xmm10 # 5060 <_sk_callback_sse2+0x73c>
+ DB 68,15,40,37,96,38,0,0 ; movaps 0x2660(%rip),%xmm12 # 5070 <_sk_callback_sse2+0x74c>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -19640,22 +19931,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,84,38,0,0 ; movaps 0x2654(%rip),%xmm10 # 4f50 <_sk_callback_sse2+0x766>
+ DB 68,15,40,21,74,38,0,0 ; movaps 0x264a(%rip),%xmm10 # 5080 <_sk_callback_sse2+0x75c>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,72,38,0,0 ; addps 0x2648(%rip),%xmm9 # 4f60 <_sk_callback_sse2+0x776>
- DB 68,15,40,37,80,38,0,0 ; movaps 0x2650(%rip),%xmm12 # 4f70 <_sk_callback_sse2+0x786>
+ DB 68,15,88,13,62,38,0,0 ; addps 0x263e(%rip),%xmm9 # 5090 <_sk_callback_sse2+0x76c>
+ DB 68,15,40,37,70,38,0,0 ; movaps 0x2646(%rip),%xmm12 # 50a0 <_sk_callback_sse2+0x77c>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,80,38,0,0 ; movaps 0x2650(%rip),%xmm12 # 4f80 <_sk_callback_sse2+0x796>
+ DB 68,15,40,37,70,38,0,0 ; movaps 0x2646(%rip),%xmm12 # 50b0 <_sk_callback_sse2+0x78c>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,84,38,0,0 ; movaps 0x2654(%rip),%xmm13 # 4f90 <_sk_callback_sse2+0x7a6>
+ DB 68,15,40,45,74,38,0,0 ; movaps 0x264a(%rip),%xmm13 # 50c0 <_sk_callback_sse2+0x79c>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,84,38,0,0 ; mulps 0x2654(%rip),%xmm13 # 4fa0 <_sk_callback_sse2+0x7b6>
+ DB 68,15,89,45,74,38,0,0 ; mulps 0x264a(%rip),%xmm13 # 50d0 <_sk_callback_sse2+0x7ac>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -19689,15 +19980,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,212,37,0,0 ; mulps 0x25d4(%rip),%xmm9 # 4fb0 <_sk_callback_sse2+0x7c6>
- DB 68,15,84,21,220,37,0,0 ; andps 0x25dc(%rip),%xmm10 # 4fc0 <_sk_callback_sse2+0x7d6>
- DB 68,15,86,21,228,37,0,0 ; orps 0x25e4(%rip),%xmm10 # 4fd0 <_sk_callback_sse2+0x7e6>
- DB 68,15,88,13,236,37,0,0 ; addps 0x25ec(%rip),%xmm9 # 4fe0 <_sk_callback_sse2+0x7f6>
- DB 68,15,40,37,244,37,0,0 ; movaps 0x25f4(%rip),%xmm12 # 4ff0 <_sk_callback_sse2+0x806>
+ DB 68,15,89,13,202,37,0,0 ; mulps 0x25ca(%rip),%xmm9 # 50e0 <_sk_callback_sse2+0x7bc>
+ DB 68,15,84,21,210,37,0,0 ; andps 0x25d2(%rip),%xmm10 # 50f0 <_sk_callback_sse2+0x7cc>
+ DB 68,15,86,21,218,37,0,0 ; orps 0x25da(%rip),%xmm10 # 5100 <_sk_callback_sse2+0x7dc>
+ DB 68,15,88,13,226,37,0,0 ; addps 0x25e2(%rip),%xmm9 # 5110 <_sk_callback_sse2+0x7ec>
+ DB 68,15,40,37,234,37,0,0 ; movaps 0x25ea(%rip),%xmm12 # 5120 <_sk_callback_sse2+0x7fc>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,244,37,0,0 ; addps 0x25f4(%rip),%xmm10 # 5000 <_sk_callback_sse2+0x816>
- DB 68,15,40,37,252,37,0,0 ; movaps 0x25fc(%rip),%xmm12 # 5010 <_sk_callback_sse2+0x826>
+ DB 68,15,88,21,234,37,0,0 ; addps 0x25ea(%rip),%xmm10 # 5130 <_sk_callback_sse2+0x80c>
+ DB 68,15,40,37,242,37,0,0 ; movaps 0x25f2(%rip),%xmm12 # 5140 <_sk_callback_sse2+0x81c>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -19705,22 +19996,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,230,37,0,0 ; movaps 0x25e6(%rip),%xmm10 # 5020 <_sk_callback_sse2+0x836>
+ DB 68,15,40,21,220,37,0,0 ; movaps 0x25dc(%rip),%xmm10 # 5150 <_sk_callback_sse2+0x82c>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,218,37,0,0 ; addps 0x25da(%rip),%xmm9 # 5030 <_sk_callback_sse2+0x846>
- DB 68,15,40,37,226,37,0,0 ; movaps 0x25e2(%rip),%xmm12 # 5040 <_sk_callback_sse2+0x856>
+ DB 68,15,88,13,208,37,0,0 ; addps 0x25d0(%rip),%xmm9 # 5160 <_sk_callback_sse2+0x83c>
+ DB 68,15,40,37,216,37,0,0 ; movaps 0x25d8(%rip),%xmm12 # 5170 <_sk_callback_sse2+0x84c>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,226,37,0,0 ; movaps 0x25e2(%rip),%xmm12 # 5050 <_sk_callback_sse2+0x866>
+ DB 68,15,40,37,216,37,0,0 ; movaps 0x25d8(%rip),%xmm12 # 5180 <_sk_callback_sse2+0x85c>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,230,37,0,0 ; movaps 0x25e6(%rip),%xmm13 # 5060 <_sk_callback_sse2+0x876>
+ DB 68,15,40,45,220,37,0,0 ; movaps 0x25dc(%rip),%xmm13 # 5190 <_sk_callback_sse2+0x86c>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,230,37,0,0 ; mulps 0x25e6(%rip),%xmm13 # 5070 <_sk_callback_sse2+0x886>
+ DB 68,15,89,45,220,37,0,0 ; mulps 0x25dc(%rip),%xmm13 # 51a0 <_sk_callback_sse2+0x87c>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -19754,15 +20045,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,102,37,0,0 ; mulps 0x2566(%rip),%xmm9 # 5080 <_sk_callback_sse2+0x896>
- DB 68,15,84,21,110,37,0,0 ; andps 0x256e(%rip),%xmm10 # 5090 <_sk_callback_sse2+0x8a6>
- DB 68,15,86,21,118,37,0,0 ; orps 0x2576(%rip),%xmm10 # 50a0 <_sk_callback_sse2+0x8b6>
- DB 68,15,88,13,126,37,0,0 ; addps 0x257e(%rip),%xmm9 # 50b0 <_sk_callback_sse2+0x8c6>
- DB 68,15,40,37,134,37,0,0 ; movaps 0x2586(%rip),%xmm12 # 50c0 <_sk_callback_sse2+0x8d6>
+ DB 68,15,89,13,92,37,0,0 ; mulps 0x255c(%rip),%xmm9 # 51b0 <_sk_callback_sse2+0x88c>
+ DB 68,15,84,21,100,37,0,0 ; andps 0x2564(%rip),%xmm10 # 51c0 <_sk_callback_sse2+0x89c>
+ DB 68,15,86,21,108,37,0,0 ; orps 0x256c(%rip),%xmm10 # 51d0 <_sk_callback_sse2+0x8ac>
+ DB 68,15,88,13,116,37,0,0 ; addps 0x2574(%rip),%xmm9 # 51e0 <_sk_callback_sse2+0x8bc>
+ DB 68,15,40,37,124,37,0,0 ; movaps 0x257c(%rip),%xmm12 # 51f0 <_sk_callback_sse2+0x8cc>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,134,37,0,0 ; addps 0x2586(%rip),%xmm10 # 50d0 <_sk_callback_sse2+0x8e6>
- DB 68,15,40,37,142,37,0,0 ; movaps 0x258e(%rip),%xmm12 # 50e0 <_sk_callback_sse2+0x8f6>
+ DB 68,15,88,21,124,37,0,0 ; addps 0x257c(%rip),%xmm10 # 5200 <_sk_callback_sse2+0x8dc>
+ DB 68,15,40,37,132,37,0,0 ; movaps 0x2584(%rip),%xmm12 # 5210 <_sk_callback_sse2+0x8ec>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -19770,22 +20061,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,120,37,0,0 ; movaps 0x2578(%rip),%xmm10 # 50f0 <_sk_callback_sse2+0x906>
+ DB 68,15,40,21,110,37,0,0 ; movaps 0x256e(%rip),%xmm10 # 5220 <_sk_callback_sse2+0x8fc>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,108,37,0,0 ; addps 0x256c(%rip),%xmm9 # 5100 <_sk_callback_sse2+0x916>
- DB 68,15,40,37,116,37,0,0 ; movaps 0x2574(%rip),%xmm12 # 5110 <_sk_callback_sse2+0x926>
+ DB 68,15,88,13,98,37,0,0 ; addps 0x2562(%rip),%xmm9 # 5230 <_sk_callback_sse2+0x90c>
+ DB 68,15,40,37,106,37,0,0 ; movaps 0x256a(%rip),%xmm12 # 5240 <_sk_callback_sse2+0x91c>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,116,37,0,0 ; movaps 0x2574(%rip),%xmm12 # 5120 <_sk_callback_sse2+0x936>
+ DB 68,15,40,37,106,37,0,0 ; movaps 0x256a(%rip),%xmm12 # 5250 <_sk_callback_sse2+0x92c>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,120,37,0,0 ; movaps 0x2578(%rip),%xmm13 # 5130 <_sk_callback_sse2+0x946>
+ DB 68,15,40,45,110,37,0,0 ; movaps 0x256e(%rip),%xmm13 # 5260 <_sk_callback_sse2+0x93c>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,120,37,0,0 ; mulps 0x2578(%rip),%xmm13 # 5140 <_sk_callback_sse2+0x956>
+ DB 68,15,89,45,110,37,0,0 ; mulps 0x256e(%rip),%xmm13 # 5270 <_sk_callback_sse2+0x94c>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -19800,29 +20091,29 @@ _sk_parametric_a_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,85,37,0,0 ; mulps 0x2555(%rip),%xmm0 # 5150 <_sk_callback_sse2+0x966>
- DB 68,15,40,5,93,37,0,0 ; movaps 0x255d(%rip),%xmm8 # 5160 <_sk_callback_sse2+0x976>
+ DB 15,89,5,75,37,0,0 ; mulps 0x254b(%rip),%xmm0 # 5280 <_sk_callback_sse2+0x95c>
+ DB 68,15,40,5,83,37,0,0 ; movaps 0x2553(%rip),%xmm8 # 5290 <_sk_callback_sse2+0x96c>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,97,37,0,0 ; movaps 0x2561(%rip),%xmm9 # 5170 <_sk_callback_sse2+0x986>
+ DB 68,15,40,13,87,37,0,0 ; movaps 0x2557(%rip),%xmm9 # 52a0 <_sk_callback_sse2+0x97c>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,94,37,0,0 ; addps 0x255e(%rip),%xmm0 # 5180 <_sk_callback_sse2+0x996>
- DB 15,89,5,103,37,0,0 ; mulps 0x2567(%rip),%xmm0 # 5190 <_sk_callback_sse2+0x9a6>
- DB 15,89,13,112,37,0,0 ; mulps 0x2570(%rip),%xmm1 # 51a0 <_sk_callback_sse2+0x9b6>
+ DB 15,88,5,84,37,0,0 ; addps 0x2554(%rip),%xmm0 # 52b0 <_sk_callback_sse2+0x98c>
+ DB 15,89,5,93,37,0,0 ; mulps 0x255d(%rip),%xmm0 # 52c0 <_sk_callback_sse2+0x99c>
+ DB 15,89,13,102,37,0,0 ; mulps 0x2566(%rip),%xmm1 # 52d0 <_sk_callback_sse2+0x9ac>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,118,37,0,0 ; mulps 0x2576(%rip),%xmm2 # 51b0 <_sk_callback_sse2+0x9c6>
+ DB 15,89,21,108,37,0,0 ; mulps 0x256c(%rip),%xmm2 # 52e0 <_sk_callback_sse2+0x9bc>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,107,37,0,0 ; movaps 0x256b(%rip),%xmm2 # 51c0 <_sk_callback_sse2+0x9d6>
+ DB 15,40,21,97,37,0,0 ; movaps 0x2561(%rip),%xmm2 # 52f0 <_sk_callback_sse2+0x9cc>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,106,37,0,0 ; movaps 0x256a(%rip),%xmm10 # 51d0 <_sk_callback_sse2+0x9e6>
+ DB 68,15,40,21,96,37,0,0 ; movaps 0x2560(%rip),%xmm10 # 5300 <_sk_callback_sse2+0x9dc>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,110,37,0,0 ; movaps 0x256e(%rip),%xmm11 # 51e0 <_sk_callback_sse2+0x9f6>
+ DB 68,15,40,29,100,37,0,0 ; movaps 0x2564(%rip),%xmm11 # 5310 <_sk_callback_sse2+0x9ec>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -19846,8 +20137,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,30,37,0,0 ; mulps 0x251e(%rip),%xmm8 # 51f0 <_sk_callback_sse2+0xa06>
- DB 15,89,21,39,37,0,0 ; mulps 0x2527(%rip),%xmm2 # 5200 <_sk_callback_sse2+0xa16>
+ DB 68,15,89,5,20,37,0,0 ; mulps 0x2514(%rip),%xmm8 # 5320 <_sk_callback_sse2+0x9fc>
+ DB 15,89,21,29,37,0,0 ; mulps 0x251d(%rip),%xmm2 # 5330 <_sk_callback_sse2+0xa0c>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19861,7 +20152,7 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,15,37,0,0 ; mulps 0x250f(%rip),%xmm3 # 5210 <_sk_callback_sse2+0xa26>
+ DB 15,89,29,5,37,0,0 ; mulps 0x2505(%rip),%xmm3 # 5340 <_sk_callback_sse2+0xa1c>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -19904,7 +20195,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,126,36,0,0 ; mulps 0x247e(%rip),%xmm3 # 5220 <_sk_callback_sse2+0xa36>
+ DB 15,89,29,116,36,0,0 ; mulps 0x2474(%rip),%xmm3 # 5350 <_sk_callback_sse2+0xa2c>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -19915,7 +20206,7 @@ PUBLIC _sk_store_a8_sse2
_sk_store_a8_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,114,36,0,0 ; movaps 0x2472(%rip),%xmm8 # 5230 <_sk_callback_sse2+0xa46>
+ DB 68,15,40,5,104,36,0,0 ; movaps 0x2468(%rip),%xmm8 # 5360 <_sk_callback_sse2+0xa3c>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -19935,9 +20226,9 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,57,36,0,0 ; mulps 0x2439(%rip),%xmm0 # 5240 <_sk_callback_sse2+0xa56>
+ DB 15,89,5,47,36,0,0 ; mulps 0x242f(%rip),%xmm0 # 5370 <_sk_callback_sse2+0xa4c>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,64,36,0,0 ; movaps 0x2440(%rip),%xmm3 # 5250 <_sk_callback_sse2+0xa66>
+ DB 15,40,29,54,36,0,0 ; movaps 0x2436(%rip),%xmm3 # 5380 <_sk_callback_sse2+0xa5c>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -19978,9 +20269,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,181,35,0,0 ; mulps 0x23b5(%rip),%xmm0 # 5260 <_sk_callback_sse2+0xa76>
+ DB 15,89,5,171,35,0,0 ; mulps 0x23ab(%rip),%xmm0 # 5390 <_sk_callback_sse2+0xa6c>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,188,35,0,0 ; movaps 0x23bc(%rip),%xmm3 # 5270 <_sk_callback_sse2+0xa86>
+ DB 15,40,29,178,35,0,0 ; movaps 0x23b2(%rip),%xmm3 # 53a0 <_sk_callback_sse2+0xa7c>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -19990,9 +20281,9 @@ _sk_gather_i8_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,192 ; mov %rax,%r8
DB 77,133,192 ; test %r8,%r8
- DB 116,5 ; je 2ecb <_sk_gather_i8_sse2+0xf>
+ DB 116,5 ; je 3005 <_sk_gather_i8_sse2+0xf>
DB 76,137,192 ; mov %r8,%rax
- DB 235,2 ; jmp 2ecd <_sk_gather_i8_sse2+0x11>
+ DB 235,2 ; jmp 3007 <_sk_gather_i8_sse2+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -20041,11 +20332,11 @@ _sk_gather_i8_sse2 LABEL PROC
DB 102,67,15,110,12,136 ; movd (%r8,%r9,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,219,34,0,0 ; movdqa 0x22db(%rip),%xmm2 # 5280 <_sk_callback_sse2+0xa96>
+ DB 102,15,111,21,209,34,0,0 ; movdqa 0x22d1(%rip),%xmm2 # 53b0 <_sk_callback_sse2+0xa8c>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,215,34,0,0 ; movaps 0x22d7(%rip),%xmm8 # 5290 <_sk_callback_sse2+0xaa6>
+ DB 68,15,40,5,205,34,0,0 ; movaps 0x22cd(%rip),%xmm8 # 53c0 <_sk_callback_sse2+0xa9c>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -20070,19 +20361,19 @@ _sk_load_565_sse2 LABEL PROC
DB 243,15,126,20,120 ; movq (%rax,%rdi,2),%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,141,34,0,0 ; movdqa 0x228d(%rip),%xmm0 # 52a0 <_sk_callback_sse2+0xab6>
+ DB 102,15,111,5,131,34,0,0 ; movdqa 0x2283(%rip),%xmm0 # 53d0 <_sk_callback_sse2+0xaac>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,143,34,0,0 ; mulps 0x228f(%rip),%xmm0 # 52b0 <_sk_callback_sse2+0xac6>
- DB 102,15,111,13,151,34,0,0 ; movdqa 0x2297(%rip),%xmm1 # 52c0 <_sk_callback_sse2+0xad6>
+ DB 15,89,5,133,34,0,0 ; mulps 0x2285(%rip),%xmm0 # 53e0 <_sk_callback_sse2+0xabc>
+ DB 102,15,111,13,141,34,0,0 ; movdqa 0x228d(%rip),%xmm1 # 53f0 <_sk_callback_sse2+0xacc>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,153,34,0,0 ; mulps 0x2299(%rip),%xmm1 # 52d0 <_sk_callback_sse2+0xae6>
- DB 102,15,219,21,161,34,0,0 ; pand 0x22a1(%rip),%xmm2 # 52e0 <_sk_callback_sse2+0xaf6>
+ DB 15,89,13,143,34,0,0 ; mulps 0x228f(%rip),%xmm1 # 5400 <_sk_callback_sse2+0xadc>
+ DB 102,15,219,21,151,34,0,0 ; pand 0x2297(%rip),%xmm2 # 5410 <_sk_callback_sse2+0xaec>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,167,34,0,0 ; mulps 0x22a7(%rip),%xmm2 # 52f0 <_sk_callback_sse2+0xb06>
+ DB 15,89,21,157,34,0,0 ; mulps 0x229d(%rip),%xmm2 # 5420 <_sk_callback_sse2+0xafc>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,174,34,0,0 ; movaps 0x22ae(%rip),%xmm3 # 5300 <_sk_callback_sse2+0xb16>
+ DB 15,40,29,164,34,0,0 ; movaps 0x22a4(%rip),%xmm3 # 5430 <_sk_callback_sse2+0xb0c>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_gather_565_sse2
@@ -20115,31 +20406,31 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,55,34,0,0 ; movdqa 0x2237(%rip),%xmm0 # 5310 <_sk_callback_sse2+0xb26>
+ DB 102,15,111,5,45,34,0,0 ; movdqa 0x222d(%rip),%xmm0 # 5440 <_sk_callback_sse2+0xb1c>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,57,34,0,0 ; mulps 0x2239(%rip),%xmm0 # 5320 <_sk_callback_sse2+0xb36>
- DB 102,15,111,13,65,34,0,0 ; movdqa 0x2241(%rip),%xmm1 # 5330 <_sk_callback_sse2+0xb46>
+ DB 15,89,5,47,34,0,0 ; mulps 0x222f(%rip),%xmm0 # 5450 <_sk_callback_sse2+0xb2c>
+ DB 102,15,111,13,55,34,0,0 ; movdqa 0x2237(%rip),%xmm1 # 5460 <_sk_callback_sse2+0xb3c>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,67,34,0,0 ; mulps 0x2243(%rip),%xmm1 # 5340 <_sk_callback_sse2+0xb56>
- DB 102,15,219,21,75,34,0,0 ; pand 0x224b(%rip),%xmm2 # 5350 <_sk_callback_sse2+0xb66>
+ DB 15,89,13,57,34,0,0 ; mulps 0x2239(%rip),%xmm1 # 5470 <_sk_callback_sse2+0xb4c>
+ DB 102,15,219,21,65,34,0,0 ; pand 0x2241(%rip),%xmm2 # 5480 <_sk_callback_sse2+0xb5c>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,81,34,0,0 ; mulps 0x2251(%rip),%xmm2 # 5360 <_sk_callback_sse2+0xb76>
+ DB 15,89,21,71,34,0,0 ; mulps 0x2247(%rip),%xmm2 # 5490 <_sk_callback_sse2+0xb6c>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,88,34,0,0 ; movaps 0x2258(%rip),%xmm3 # 5370 <_sk_callback_sse2+0xb86>
+ DB 15,40,29,78,34,0,0 ; movaps 0x224e(%rip),%xmm3 # 54a0 <_sk_callback_sse2+0xb7c>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_sse2
_sk_store_565_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,89,34,0,0 ; movaps 0x2259(%rip),%xmm8 # 5380 <_sk_callback_sse2+0xb96>
+ DB 68,15,40,5,79,34,0,0 ; movaps 0x224f(%rip),%xmm8 # 54b0 <_sk_callback_sse2+0xb8c>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,78,34,0,0 ; movaps 0x224e(%rip),%xmm10 # 5390 <_sk_callback_sse2+0xba6>
+ DB 68,15,40,21,68,34,0,0 ; movaps 0x2244(%rip),%xmm10 # 54c0 <_sk_callback_sse2+0xb9c>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -20161,21 +20452,21 @@ _sk_load_4444_sse2 LABEL PROC
DB 243,15,126,28,120 ; movq (%rax,%rdi,2),%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,7,34,0,0 ; movdqa 0x2207(%rip),%xmm0 # 53a0 <_sk_callback_sse2+0xbb6>
+ DB 102,15,111,5,253,33,0,0 ; movdqa 0x21fd(%rip),%xmm0 # 54d0 <_sk_callback_sse2+0xbac>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,9,34,0,0 ; mulps 0x2209(%rip),%xmm0 # 53b0 <_sk_callback_sse2+0xbc6>
- DB 102,15,111,13,17,34,0,0 ; movdqa 0x2211(%rip),%xmm1 # 53c0 <_sk_callback_sse2+0xbd6>
+ DB 15,89,5,255,33,0,0 ; mulps 0x21ff(%rip),%xmm0 # 54e0 <_sk_callback_sse2+0xbbc>
+ DB 102,15,111,13,7,34,0,0 ; movdqa 0x2207(%rip),%xmm1 # 54f0 <_sk_callback_sse2+0xbcc>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,19,34,0,0 ; mulps 0x2213(%rip),%xmm1 # 53d0 <_sk_callback_sse2+0xbe6>
- DB 102,15,111,21,27,34,0,0 ; movdqa 0x221b(%rip),%xmm2 # 53e0 <_sk_callback_sse2+0xbf6>
+ DB 15,89,13,9,34,0,0 ; mulps 0x2209(%rip),%xmm1 # 5500 <_sk_callback_sse2+0xbdc>
+ DB 102,15,111,21,17,34,0,0 ; movdqa 0x2211(%rip),%xmm2 # 5510 <_sk_callback_sse2+0xbec>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,29,34,0,0 ; mulps 0x221d(%rip),%xmm2 # 53f0 <_sk_callback_sse2+0xc06>
- DB 102,15,219,29,37,34,0,0 ; pand 0x2225(%rip),%xmm3 # 5400 <_sk_callback_sse2+0xc16>
+ DB 15,89,21,19,34,0,0 ; mulps 0x2213(%rip),%xmm2 # 5520 <_sk_callback_sse2+0xbfc>
+ DB 102,15,219,29,27,34,0,0 ; pand 0x221b(%rip),%xmm3 # 5530 <_sk_callback_sse2+0xc0c>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,43,34,0,0 ; mulps 0x222b(%rip),%xmm3 # 5410 <_sk_callback_sse2+0xc26>
+ DB 15,89,29,33,34,0,0 ; mulps 0x2221(%rip),%xmm3 # 5540 <_sk_callback_sse2+0xc1c>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20209,21 +20500,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,178,33,0,0 ; movdqa 0x21b2(%rip),%xmm0 # 5420 <_sk_callback_sse2+0xc36>
+ DB 102,15,111,5,168,33,0,0 ; movdqa 0x21a8(%rip),%xmm0 # 5550 <_sk_callback_sse2+0xc2c>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,180,33,0,0 ; mulps 0x21b4(%rip),%xmm0 # 5430 <_sk_callback_sse2+0xc46>
- DB 102,15,111,13,188,33,0,0 ; movdqa 0x21bc(%rip),%xmm1 # 5440 <_sk_callback_sse2+0xc56>
+ DB 15,89,5,170,33,0,0 ; mulps 0x21aa(%rip),%xmm0 # 5560 <_sk_callback_sse2+0xc3c>
+ DB 102,15,111,13,178,33,0,0 ; movdqa 0x21b2(%rip),%xmm1 # 5570 <_sk_callback_sse2+0xc4c>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,190,33,0,0 ; mulps 0x21be(%rip),%xmm1 # 5450 <_sk_callback_sse2+0xc66>
- DB 102,15,111,21,198,33,0,0 ; movdqa 0x21c6(%rip),%xmm2 # 5460 <_sk_callback_sse2+0xc76>
+ DB 15,89,13,180,33,0,0 ; mulps 0x21b4(%rip),%xmm1 # 5580 <_sk_callback_sse2+0xc5c>
+ DB 102,15,111,21,188,33,0,0 ; movdqa 0x21bc(%rip),%xmm2 # 5590 <_sk_callback_sse2+0xc6c>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,200,33,0,0 ; mulps 0x21c8(%rip),%xmm2 # 5470 <_sk_callback_sse2+0xc86>
- DB 102,15,219,29,208,33,0,0 ; pand 0x21d0(%rip),%xmm3 # 5480 <_sk_callback_sse2+0xc96>
+ DB 15,89,21,190,33,0,0 ; mulps 0x21be(%rip),%xmm2 # 55a0 <_sk_callback_sse2+0xc7c>
+ DB 102,15,219,29,198,33,0,0 ; pand 0x21c6(%rip),%xmm3 # 55b0 <_sk_callback_sse2+0xc8c>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,214,33,0,0 ; mulps 0x21d6(%rip),%xmm3 # 5490 <_sk_callback_sse2+0xca6>
+ DB 15,89,29,204,33,0,0 ; mulps 0x21cc(%rip),%xmm3 # 55c0 <_sk_callback_sse2+0xc9c>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20231,7 +20522,7 @@ PUBLIC _sk_store_4444_sse2
_sk_store_4444_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,213,33,0,0 ; movaps 0x21d5(%rip),%xmm8 # 54a0 <_sk_callback_sse2+0xcb6>
+ DB 68,15,40,5,203,33,0,0 ; movaps 0x21cb(%rip),%xmm8 # 55d0 <_sk_callback_sse2+0xcac>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20261,11 +20552,11 @@ _sk_load_8888_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 68,15,16,12,184 ; movups (%rax,%rdi,4),%xmm9
- DB 15,40,21,104,33,0,0 ; movaps 0x2168(%rip),%xmm2 # 54b0 <_sk_callback_sse2+0xcc6>
+ DB 15,40,21,94,33,0,0 ; movaps 0x215e(%rip),%xmm2 # 55e0 <_sk_callback_sse2+0xcbc>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,84,194 ; andps %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,102,33,0,0 ; movaps 0x2166(%rip),%xmm8 # 54c0 <_sk_callback_sse2+0xcd6>
+ DB 68,15,40,5,92,33,0,0 ; movaps 0x215c(%rip),%xmm8 # 55f0 <_sk_callback_sse2+0xccc>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,40,201 ; movaps %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -20312,11 +20603,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,129 ; movd (%r9,%r8,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,183,32,0,0 ; movdqa 0x20b7(%rip),%xmm2 # 54d0 <_sk_callback_sse2+0xce6>
+ DB 102,15,111,21,173,32,0,0 ; movdqa 0x20ad(%rip),%xmm2 # 5600 <_sk_callback_sse2+0xcdc>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,179,32,0,0 ; movaps 0x20b3(%rip),%xmm8 # 54e0 <_sk_callback_sse2+0xcf6>
+ DB 68,15,40,5,169,32,0,0 ; movaps 0x20a9(%rip),%xmm8 # 5610 <_sk_callback_sse2+0xcec>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -20338,7 +20629,7 @@ PUBLIC _sk_store_8888_sse2
_sk_store_8888_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,118,32,0,0 ; movaps 0x2076(%rip),%xmm8 # 54f0 <_sk_callback_sse2+0xd06>
+ DB 68,15,40,5,108,32,0,0 ; movaps 0x206c(%rip),%xmm8 # 5620 <_sk_callback_sse2+0xcfc>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20375,7 +20666,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,230,31,0,0 ; movdqa 0x1fe6(%rip),%xmm9 # 5500 <_sk_callback_sse2+0xd16>
+ DB 102,68,15,111,13,220,31,0,0 ; movdqa 0x1fdc(%rip),%xmm9 # 5630 <_sk_callback_sse2+0xd0c>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -20383,11 +20674,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,203,31,0,0 ; movdqa 0x1fcb(%rip),%xmm11 # 5510 <_sk_callback_sse2+0xd26>
+ DB 102,68,15,111,29,193,31,0,0 ; movdqa 0x1fc1(%rip),%xmm11 # 5640 <_sk_callback_sse2+0xd1c>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,205,31,0,0 ; movdqa 0x1fcd(%rip),%xmm12 # 5520 <_sk_callback_sse2+0xd36>
+ DB 102,68,15,111,37,195,31,0,0 ; movdqa 0x1fc3(%rip),%xmm12 # 5650 <_sk_callback_sse2+0xd2c>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,208,31,0,0 ; movdqa 0x1fd0(%rip),%xmm3 # 5530 <_sk_callback_sse2+0xd46>
+ DB 102,15,111,29,198,31,0,0 ; movdqa 0x1fc6(%rip),%xmm3 # 5660 <_sk_callback_sse2+0xd3c>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -20471,7 +20762,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,94,30,0,0 ; movdqa 0x1e5e(%rip),%xmm9 # 5540 <_sk_callback_sse2+0xd56>
+ DB 102,68,15,111,13,84,30,0,0 ; movdqa 0x1e54(%rip),%xmm9 # 5670 <_sk_callback_sse2+0xd4c>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -20479,11 +20770,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,67,30,0,0 ; movdqa 0x1e43(%rip),%xmm11 # 5550 <_sk_callback_sse2+0xd66>
+ DB 102,68,15,111,29,57,30,0,0 ; movdqa 0x1e39(%rip),%xmm11 # 5680 <_sk_callback_sse2+0xd5c>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,69,30,0,0 ; movdqa 0x1e45(%rip),%xmm12 # 5560 <_sk_callback_sse2+0xd76>
+ DB 102,68,15,111,37,59,30,0,0 ; movdqa 0x1e3b(%rip),%xmm12 # 5690 <_sk_callback_sse2+0xd6c>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,72,30,0,0 ; movdqa 0x1e48(%rip),%xmm3 # 5570 <_sk_callback_sse2+0xd86>
+ DB 102,15,111,29,62,30,0,0 ; movdqa 0x1e3e(%rip),%xmm3 # 56a0 <_sk_callback_sse2+0xd7c>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -20534,17 +20825,17 @@ PUBLIC _sk_store_f16_sse2
_sk_store_f16_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 102,68,15,111,21,112,29,0,0 ; movdqa 0x1d70(%rip),%xmm10 # 5580 <_sk_callback_sse2+0xd96>
+ DB 102,68,15,111,21,102,29,0,0 ; movdqa 0x1d66(%rip),%xmm10 # 56b0 <_sk_callback_sse2+0xd8c>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,219,234 ; pand %xmm10,%xmm13
DB 102,69,15,239,229 ; pxor %xmm13,%xmm12
- DB 102,68,15,111,13,99,29,0,0 ; movdqa 0x1d63(%rip),%xmm9 # 5590 <_sk_callback_sse2+0xda6>
+ DB 102,68,15,111,13,89,29,0,0 ; movdqa 0x1d59(%rip),%xmm9 # 56c0 <_sk_callback_sse2+0xd9c>
DB 102,65,15,114,213,16 ; psrld $0x10,%xmm13
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,196 ; pcmpgtd %xmm12,%xmm8
DB 102,65,15,114,212,13 ; psrld $0xd,%xmm12
- DB 102,68,15,111,29,84,29,0,0 ; movdqa 0x1d54(%rip),%xmm11 # 55a0 <_sk_callback_sse2+0xdb6>
+ DB 102,68,15,111,29,74,29,0,0 ; movdqa 0x1d4a(%rip),%xmm11 # 56d0 <_sk_callback_sse2+0xdac>
DB 102,69,15,235,235 ; por %xmm11,%xmm13
DB 102,69,15,254,236 ; paddd %xmm12,%xmm13
DB 102,65,15,114,245,16 ; pslld $0x10,%xmm13
@@ -20621,7 +20912,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,242,27,0,0 ; movaps 0x1bf2(%rip),%xmm8 # 55b0 <_sk_callback_sse2+0xdc6>
+ DB 68,15,40,5,232,27,0,0 ; movaps 0x1be8(%rip),%xmm8 # 56e0 <_sk_callback_sse2+0xdbc>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -20672,7 +20963,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,192 ; punpcklwd %xmm8,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,46,27,0,0 ; movaps 0x1b2e(%rip),%xmm9 # 55c0 <_sk_callback_sse2+0xdd6>
+ DB 68,15,40,13,36,27,0,0 ; movaps 0x1b24(%rip),%xmm9 # 56f0 <_sk_callback_sse2+0xdcc>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -20689,14 +20980,14 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,245,26,0,0 ; movaps 0x1af5(%rip),%xmm3 # 55d0 <_sk_callback_sse2+0xde6>
+ DB 15,40,29,235,26,0,0 ; movaps 0x1aeb(%rip),%xmm3 # 5700 <_sk_callback_sse2+0xddc>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,13,246,26,0,0 ; movaps 0x1af6(%rip),%xmm9 # 55e0 <_sk_callback_sse2+0xdf6>
+ DB 68,15,40,13,236,26,0,0 ; movaps 0x1aec(%rip),%xmm9 # 5710 <_sk_callback_sse2+0xdec>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -20832,7 +21123,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,246,24,0,0 ; andps 0x18f6(%rip),%xmm9 # 55f0 <_sk_callback_sse2+0xe06>
+ DB 68,15,84,13,236,24,0,0 ; andps 0x18ec(%rip),%xmm9 # 5720 <_sk_callback_sse2+0xdfc>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,92,194 ; subps %xmm10,%xmm0
@@ -20850,7 +21141,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,200,24,0,0 ; andps 0x18c8(%rip),%xmm9 # 5600 <_sk_callback_sse2+0xe16>
+ DB 68,15,84,13,190,24,0,0 ; andps 0x18be(%rip),%xmm9 # 5730 <_sk_callback_sse2+0xe0c>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,92,202 ; subps %xmm10,%xmm1
@@ -20872,7 +21163,7 @@ _sk_mirror_x_sse2 LABEL PROC
DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11
DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,136,24,0,0 ; andps 0x1888(%rip),%xmm10 # 5610 <_sk_callback_sse2+0xe26>
+ DB 68,15,84,21,126,24,0,0 ; andps 0x187e(%rip),%xmm10 # 5740 <_sk_callback_sse2+0xe1c>
DB 69,15,87,228 ; xorps %xmm12,%xmm12
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,89,216 ; mulps %xmm8,%xmm11
@@ -20898,7 +21189,7 @@ _sk_mirror_y_sse2 LABEL PROC
DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11
DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,56,24,0,0 ; andps 0x1838(%rip),%xmm10 # 5620 <_sk_callback_sse2+0xe36>
+ DB 68,15,84,21,46,24,0,0 ; andps 0x182e(%rip),%xmm10 # 5750 <_sk_callback_sse2+0xe2c>
DB 69,15,87,228 ; xorps %xmm12,%xmm12
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,89,216 ; mulps %xmm8,%xmm11
@@ -20913,10 +21204,10 @@ _sk_mirror_y_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,26,24,0,0 ; mulps 0x181a(%rip),%xmm0 # 5630 <_sk_callback_sse2+0xe46>
- DB 15,89,13,35,24,0,0 ; mulps 0x1823(%rip),%xmm1 # 5640 <_sk_callback_sse2+0xe56>
+ DB 15,89,5,16,24,0,0 ; mulps 0x1810(%rip),%xmm0 # 5760 <_sk_callback_sse2+0xe3c>
+ DB 15,89,13,25,24,0,0 ; mulps 0x1819(%rip),%xmm1 # 5770 <_sk_callback_sse2+0xe4c>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,41,24,0,0 ; mulps 0x1829(%rip),%xmm3 # 5650 <_sk_callback_sse2+0xe66>
+ DB 15,89,29,31,24,0,0 ; mulps 0x181f(%rip),%xmm3 # 5780 <_sk_callback_sse2+0xe5c>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -21139,7 +21430,7 @@ _sk_gradient_sse2 LABEL PROC
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
DB 72,139,8 ; mov (%rax),%rcx
DB 72,133,201 ; test %rcx,%rcx
- DB 15,132,15,1,0,0 ; je 42da <_sk_gradient_sse2+0x149>
+ DB 15,132,15,1,0,0 ; je 4414 <_sk_gradient_sse2+0x149>
DB 72,139,64,8 ; mov 0x8(%rax),%rax
DB 72,131,192,32 ; add $0x20,%rax
DB 69,15,87,192 ; xorps %xmm8,%xmm8
@@ -21200,8 +21491,8 @@ _sk_gradient_sse2 LABEL PROC
DB 69,15,86,231 ; orps %xmm15,%xmm12
DB 72,131,192,36 ; add $0x24,%rax
DB 72,255,201 ; dec %rcx
- DB 15,133,8,255,255,255 ; jne 41e0 <_sk_gradient_sse2+0x4f>
- DB 235,13 ; jmp 42e7 <_sk_gradient_sse2+0x156>
+ DB 15,133,8,255,255,255 ; jne 431a <_sk_gradient_sse2+0x4f>
+ DB 235,13 ; jmp 4421 <_sk_gradient_sse2+0x156>
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
@@ -21266,29 +21557,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,161,18,0,0 ; movaps 0x12a1(%rip),%xmm13 # 5660 <_sk_callback_sse2+0xe76>
+ DB 68,15,40,45,151,18,0,0 ; movaps 0x1297(%rip),%xmm13 # 5790 <_sk_callback_sse2+0xe6c>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,165,18,0,0 ; addps 0x12a5(%rip),%xmm13 # 5670 <_sk_callback_sse2+0xe86>
+ DB 68,15,88,45,155,18,0,0 ; addps 0x129b(%rip),%xmm13 # 57a0 <_sk_callback_sse2+0xe7c>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,169,18,0,0 ; addps 0x12a9(%rip),%xmm13 # 5680 <_sk_callback_sse2+0xe96>
+ DB 68,15,88,45,159,18,0,0 ; addps 0x129f(%rip),%xmm13 # 57b0 <_sk_callback_sse2+0xe8c>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,173,18,0,0 ; addps 0x12ad(%rip),%xmm13 # 5690 <_sk_callback_sse2+0xea6>
+ DB 68,15,88,45,163,18,0,0 ; addps 0x12a3(%rip),%xmm13 # 57c0 <_sk_callback_sse2+0xe9c>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,172,18,0,0 ; movaps 0x12ac(%rip),%xmm10 # 56a0 <_sk_callback_sse2+0xeb6>
+ DB 68,15,40,21,162,18,0,0 ; movaps 0x12a2(%rip),%xmm10 # 57d0 <_sk_callback_sse2+0xeac>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,159,18,0,0 ; movaps 0x129f(%rip),%xmm10 # 56b0 <_sk_callback_sse2+0xec6>
+ DB 68,15,40,21,149,18,0,0 ; movaps 0x1295(%rip),%xmm10 # 57e0 <_sk_callback_sse2+0xebc>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,142,18,0,0 ; movaps 0x128e(%rip),%xmm10 # 56c0 <_sk_callback_sse2+0xed6>
+ DB 68,15,40,21,132,18,0,0 ; movaps 0x1284(%rip),%xmm10 # 57f0 <_sk_callback_sse2+0xecc>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -21312,7 +21603,7 @@ _sk_xy_to_radius_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,93,18,0,0 ; movaps 0x125d(%rip),%xmm8 # 56d0 <_sk_callback_sse2+0xee6>
+ DB 68,15,40,5,83,18,0,0 ; movaps 0x1253(%rip),%xmm8 # 5800 <_sk_callback_sse2+0xedc>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -21320,7 +21611,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,72,18,0,0 ; movaps 0x1248(%rip),%xmm12 # 56e0 <_sk_callback_sse2+0xef6>
+ DB 68,15,40,37,62,18,0,0 ; movaps 0x123e(%rip),%xmm12 # 5810 <_sk_callback_sse2+0xeec>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -21363,8 +21654,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,193,17,0,0 ; addps 0x11c1(%rip),%xmm0 # 56f0 <_sk_callback_sse2+0xf06>
- DB 68,15,40,13,201,17,0,0 ; movaps 0x11c9(%rip),%xmm9 # 5700 <_sk_callback_sse2+0xf16>
+ DB 15,88,5,183,17,0,0 ; addps 0x11b7(%rip),%xmm0 # 5820 <_sk_callback_sse2+0xefc>
+ DB 68,15,40,13,191,17,0,0 ; movaps 0x11bf(%rip),%xmm9 # 5830 <_sk_callback_sse2+0xf0c>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -21375,7 +21666,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,184,17,0,0 ; addps 0x11b8(%rip),%xmm0 # 5710 <_sk_callback_sse2+0xf26>
+ DB 15,88,5,174,17,0,0 ; addps 0x11ae(%rip),%xmm0 # 5840 <_sk_callback_sse2+0xf1c>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -21385,8 +21676,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,170,17,0,0 ; addps 0x11aa(%rip),%xmm1 # 5720 <_sk_callback_sse2+0xf36>
- DB 68,15,40,13,178,17,0,0 ; movaps 0x11b2(%rip),%xmm9 # 5730 <_sk_callback_sse2+0xf46>
+ DB 15,88,13,160,17,0,0 ; addps 0x11a0(%rip),%xmm1 # 5850 <_sk_callback_sse2+0xf2c>
+ DB 68,15,40,13,168,17,0,0 ; movaps 0x11a8(%rip),%xmm9 # 5860 <_sk_callback_sse2+0xf3c>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -21397,7 +21688,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,160,17,0,0 ; addps 0x11a0(%rip),%xmm1 # 5740 <_sk_callback_sse2+0xf56>
+ DB 15,88,13,150,17,0,0 ; addps 0x1196(%rip),%xmm1 # 5870 <_sk_callback_sse2+0xf4c>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -21407,13 +21698,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,147,17,0,0 ; addps 0x1193(%rip),%xmm0 # 5750 <_sk_callback_sse2+0xf66>
- DB 68,15,40,13,155,17,0,0 ; movaps 0x119b(%rip),%xmm9 # 5760 <_sk_callback_sse2+0xf76>
+ DB 15,88,5,137,17,0,0 ; addps 0x1189(%rip),%xmm0 # 5880 <_sk_callback_sse2+0xf5c>
+ DB 68,15,40,13,145,17,0,0 ; movaps 0x1191(%rip),%xmm9 # 5890 <_sk_callback_sse2+0xf6c>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,151,17,0,0 ; mulps 0x1197(%rip),%xmm9 # 5770 <_sk_callback_sse2+0xf86>
- DB 68,15,88,13,159,17,0,0 ; addps 0x119f(%rip),%xmm9 # 5780 <_sk_callback_sse2+0xf96>
+ DB 68,15,89,13,141,17,0,0 ; mulps 0x118d(%rip),%xmm9 # 58a0 <_sk_callback_sse2+0xf7c>
+ DB 68,15,88,13,149,17,0,0 ; addps 0x1195(%rip),%xmm9 # 58b0 <_sk_callback_sse2+0xf8c>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -21424,16 +21715,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,142,17,0,0 ; addps 0x118e(%rip),%xmm0 # 5790 <_sk_callback_sse2+0xfa6>
- DB 68,15,40,13,150,17,0,0 ; movaps 0x1196(%rip),%xmm9 # 57a0 <_sk_callback_sse2+0xfb6>
+ DB 15,88,5,132,17,0,0 ; addps 0x1184(%rip),%xmm0 # 58c0 <_sk_callback_sse2+0xf9c>
+ DB 68,15,40,13,140,17,0,0 ; movaps 0x118c(%rip),%xmm9 # 58d0 <_sk_callback_sse2+0xfac>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,154,17,0,0 ; movaps 0x119a(%rip),%xmm8 # 57b0 <_sk_callback_sse2+0xfc6>
+ DB 68,15,40,5,144,17,0,0 ; movaps 0x1190(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0xfbc>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,158,17,0,0 ; addps 0x119e(%rip),%xmm8 # 57c0 <_sk_callback_sse2+0xfd6>
+ DB 68,15,88,5,148,17,0,0 ; addps 0x1194(%rip),%xmm8 # 58f0 <_sk_callback_sse2+0xfcc>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,162,17,0,0 ; addps 0x11a2(%rip),%xmm8 # 57d0 <_sk_callback_sse2+0xfe6>
+ DB 68,15,88,5,152,17,0,0 ; addps 0x1198(%rip),%xmm8 # 5900 <_sk_callback_sse2+0xfdc>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,166,17,0,0 ; addps 0x11a6(%rip),%xmm8 # 57e0 <_sk_callback_sse2+0xff6>
+ DB 68,15,88,5,156,17,0,0 ; addps 0x119c(%rip),%xmm8 # 5910 <_sk_callback_sse2+0xfec>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -21441,17 +21732,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,160,17,0,0 ; movaps 0x11a0(%rip),%xmm8 # 57f0 <_sk_callback_sse2+0x1006>
+ DB 68,15,40,5,150,17,0,0 ; movaps 0x1196(%rip),%xmm8 # 5920 <_sk_callback_sse2+0xffc>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,156,17,0,0 ; movaps 0x119c(%rip),%xmm10 # 5800 <_sk_callback_sse2+0x1016>
+ DB 68,15,40,21,146,17,0,0 ; movaps 0x1192(%rip),%xmm10 # 5930 <_sk_callback_sse2+0x100c>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,160,17,0,0 ; addps 0x11a0(%rip),%xmm10 # 5810 <_sk_callback_sse2+0x1026>
+ DB 68,15,88,21,150,17,0,0 ; addps 0x1196(%rip),%xmm10 # 5940 <_sk_callback_sse2+0x101c>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,156,17,0,0 ; addps 0x119c(%rip),%xmm10 # 5820 <_sk_callback_sse2+0x1036>
+ DB 68,15,88,21,146,17,0,0 ; addps 0x1192(%rip),%xmm10 # 5950 <_sk_callback_sse2+0x102c>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -21461,11 +21752,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,143,17,0,0 ; addps 0x118f(%rip),%xmm0 # 5830 <_sk_callback_sse2+0x1046>
+ DB 15,88,5,133,17,0,0 ; addps 0x1185(%rip),%xmm0 # 5960 <_sk_callback_sse2+0x103c>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,143,17,0,0 ; mulps 0x118f(%rip),%xmm8 # 5840 <_sk_callback_sse2+0x1056>
- DB 68,15,88,5,151,17,0,0 ; addps 0x1197(%rip),%xmm8 # 5850 <_sk_callback_sse2+0x1066>
+ DB 68,15,89,5,133,17,0,0 ; mulps 0x1185(%rip),%xmm8 # 5970 <_sk_callback_sse2+0x104c>
+ DB 68,15,88,5,141,17,0,0 ; addps 0x118d(%rip),%xmm8 # 5980 <_sk_callback_sse2+0x105c>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -21476,13 +21767,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,133,17,0,0 ; addps 0x1185(%rip),%xmm1 # 5860 <_sk_callback_sse2+0x1076>
- DB 68,15,40,13,141,17,0,0 ; movaps 0x118d(%rip),%xmm9 # 5870 <_sk_callback_sse2+0x1086>
+ DB 15,88,13,123,17,0,0 ; addps 0x117b(%rip),%xmm1 # 5990 <_sk_callback_sse2+0x106c>
+ DB 68,15,40,13,131,17,0,0 ; movaps 0x1183(%rip),%xmm9 # 59a0 <_sk_callback_sse2+0x107c>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,137,17,0,0 ; mulps 0x1189(%rip),%xmm9 # 5880 <_sk_callback_sse2+0x1096>
- DB 68,15,88,13,145,17,0,0 ; addps 0x1191(%rip),%xmm9 # 5890 <_sk_callback_sse2+0x10a6>
+ DB 68,15,89,13,127,17,0,0 ; mulps 0x117f(%rip),%xmm9 # 59b0 <_sk_callback_sse2+0x108c>
+ DB 68,15,88,13,135,17,0,0 ; addps 0x1187(%rip),%xmm9 # 59c0 <_sk_callback_sse2+0x109c>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -21493,16 +21784,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,127,17,0,0 ; addps 0x117f(%rip),%xmm1 # 58a0 <_sk_callback_sse2+0x10b6>
- DB 68,15,40,13,135,17,0,0 ; movaps 0x1187(%rip),%xmm9 # 58b0 <_sk_callback_sse2+0x10c6>
+ DB 15,88,13,117,17,0,0 ; addps 0x1175(%rip),%xmm1 # 59d0 <_sk_callback_sse2+0x10ac>
+ DB 68,15,40,13,125,17,0,0 ; movaps 0x117d(%rip),%xmm9 # 59e0 <_sk_callback_sse2+0x10bc>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,139,17,0,0 ; movaps 0x118b(%rip),%xmm8 # 58c0 <_sk_callback_sse2+0x10d6>
+ DB 68,15,40,5,129,17,0,0 ; movaps 0x1181(%rip),%xmm8 # 59f0 <_sk_callback_sse2+0x10cc>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,143,17,0,0 ; addps 0x118f(%rip),%xmm8 # 58d0 <_sk_callback_sse2+0x10e6>
+ DB 68,15,88,5,133,17,0,0 ; addps 0x1185(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0x10dc>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,147,17,0,0 ; addps 0x1193(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0x10f6>
+ DB 68,15,88,5,137,17,0,0 ; addps 0x1189(%rip),%xmm8 # 5a10 <_sk_callback_sse2+0x10ec>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,151,17,0,0 ; addps 0x1197(%rip),%xmm8 # 58f0 <_sk_callback_sse2+0x1106>
+ DB 68,15,88,5,141,17,0,0 ; addps 0x118d(%rip),%xmm8 # 5a20 <_sk_callback_sse2+0x10fc>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -21510,17 +21801,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,145,17,0,0 ; movaps 0x1191(%rip),%xmm8 # 5900 <_sk_callback_sse2+0x1116>
+ DB 68,15,40,5,135,17,0,0 ; movaps 0x1187(%rip),%xmm8 # 5a30 <_sk_callback_sse2+0x110c>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,140,17,0,0 ; movaps 0x118c(%rip),%xmm10 # 5910 <_sk_callback_sse2+0x1126>
+ DB 68,15,40,21,130,17,0,0 ; movaps 0x1182(%rip),%xmm10 # 5a40 <_sk_callback_sse2+0x111c>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,144,17,0,0 ; addps 0x1190(%rip),%xmm10 # 5920 <_sk_callback_sse2+0x1136>
+ DB 68,15,88,21,134,17,0,0 ; addps 0x1186(%rip),%xmm10 # 5a50 <_sk_callback_sse2+0x112c>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,140,17,0,0 ; addps 0x118c(%rip),%xmm10 # 5930 <_sk_callback_sse2+0x1146>
+ DB 68,15,88,21,130,17,0,0 ; addps 0x1182(%rip),%xmm10 # 5a60 <_sk_callback_sse2+0x113c>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -21530,11 +21821,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,126,17,0,0 ; addps 0x117e(%rip),%xmm1 # 5940 <_sk_callback_sse2+0x1156>
+ DB 15,88,13,116,17,0,0 ; addps 0x1174(%rip),%xmm1 # 5a70 <_sk_callback_sse2+0x114c>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,126,17,0,0 ; mulps 0x117e(%rip),%xmm8 # 5950 <_sk_callback_sse2+0x1166>
- DB 68,15,88,5,134,17,0,0 ; addps 0x1186(%rip),%xmm8 # 5960 <_sk_callback_sse2+0x1176>
+ DB 68,15,89,5,116,17,0,0 ; mulps 0x1174(%rip),%xmm8 # 5a80 <_sk_callback_sse2+0x115c>
+ DB 68,15,88,5,124,17,0,0 ; addps 0x117c(%rip),%xmm8 # 5a90 <_sk_callback_sse2+0x116c>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -21739,17 +22030,12 @@ ALIGN 16
DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 4a78 <.literal16+0x1d8>
- DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 4a7c <.literal16+0x1dc>
+ DB 224,64 ; loopne 4ba8 <.literal16+0x1d8>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 4a80 <.literal16+0x1e0>
+ DB 224,64 ; loopne 4bac <.literal16+0x1dc>
DB 0,0 ; add %al,(%rax)
- DB 128,63,0 ; cmpb $0x0,(%rdi)
- DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
- DB 63 ; (bad)
- DB 0,0 ; add %al,(%rax)
- DB 128,63,154 ; cmpb $0x9a,(%rdi)
+ DB 224,64 ; loopne 4bb0 <.literal16+0x1e0>
+ DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,154 ; ds (bad)
@@ -21768,13 +22054,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4ab1 <.literal16+0x211>
+ DB 71,225,61 ; rex.RXB loope 4bd1 <.literal16+0x201>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4ab5 <.literal16+0x215>
+ DB 71,225,61 ; rex.RXB loope 4bd5 <.literal16+0x205>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4ab9 <.literal16+0x219>
+ DB 71,225,61 ; rex.RXB loope 4bd9 <.literal16+0x209>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4abd <.literal16+0x21d>
+ DB 71,225,61 ; rex.RXB loope 4bdd <.literal16+0x20d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -21799,13 +22085,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4af1 <.literal16+0x251>
+ DB 71,225,61 ; rex.RXB loope 4c11 <.literal16+0x241>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4af5 <.literal16+0x255>
+ DB 71,225,61 ; rex.RXB loope 4c15 <.literal16+0x245>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4af9 <.literal16+0x259>
+ DB 71,225,61 ; rex.RXB loope 4c19 <.literal16+0x249>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4afd <.literal16+0x25d>
+ DB 71,225,61 ; rex.RXB loope 4c1d <.literal16+0x24d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -21830,13 +22116,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b31 <.literal16+0x291>
+ DB 71,225,61 ; rex.RXB loope 4c51 <.literal16+0x281>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b35 <.literal16+0x295>
+ DB 71,225,61 ; rex.RXB loope 4c55 <.literal16+0x285>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b39 <.literal16+0x299>
+ DB 71,225,61 ; rex.RXB loope 4c59 <.literal16+0x289>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b3d <.literal16+0x29d>
+ DB 71,225,61 ; rex.RXB loope 4c5d <.literal16+0x28d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -21861,13 +22147,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b71 <.literal16+0x2d1>
+ DB 71,225,61 ; rex.RXB loope 4c91 <.literal16+0x2c1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b75 <.literal16+0x2d5>
+ DB 71,225,61 ; rex.RXB loope 4c95 <.literal16+0x2c5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b79 <.literal16+0x2d9>
+ DB 71,225,61 ; rex.RXB loope 4c99 <.literal16+0x2c9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 4b7d <.literal16+0x2dd>
+ DB 71,225,61 ; rex.RXB loope 4c9d <.literal16+0x2cd>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -21884,7 +22170,12 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
DB 63 ; (bad)
- DB 145 ; xchg %eax,%ecx
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,0 ; cmpb $0x0,(%rdi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
+ DB 63 ; (bad)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,145 ; cmpb $0x91,(%rdi)
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
DB 145 ; xchg %eax,%ecx
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
@@ -22091,13 +22382,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4d49 <.literal16+0x4a9>
+ DB 224,7 ; loopne 4e79 <.literal16+0x4a9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4d4d <.literal16+0x4ad>
+ DB 224,7 ; loopne 4e7d <.literal16+0x4ad>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4d51 <.literal16+0x4b1>
+ DB 224,7 ; loopne 4e81 <.literal16+0x4b1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 4d55 <.literal16+0x4b5>
+ DB 224,7 ; loopne 4e85 <.literal16+0x4b5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -22162,11 +22453,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4e2b <.literal16+0x58b>
+ DB 127,67 ; jg 4f5b <.literal16+0x58b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4e2f <.literal16+0x58f>
+ DB 127,67 ; jg 4f5f <.literal16+0x58f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 4e33 <.literal16+0x593>
+ DB 127,67 ; jg 4f63 <.literal16+0x593>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -22181,16 +22472,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4e24 <.literal16+0x584>
+ DB 127,0 ; jg 4f54 <.literal16+0x584>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4e28 <.literal16+0x588>
+ DB 127,0 ; jg 4f58 <.literal16+0x588>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4e2c <.literal16+0x58c>
+ DB 127,0 ; jg 4f5c <.literal16+0x58c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4e30 <.literal16+0x590>
+ DB 127,0 ; jg 4f60 <.literal16+0x590>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -22199,7 +22490,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4eb5 <.literal16+0x615>
+ DB 119,115 ; ja 4fe5 <.literal16+0x615>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -22210,7 +22501,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 4e19 <.literal16+0x579>
+ DB 117,191 ; jne 4f49 <.literal16+0x579>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -22222,7 +22513,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a38e5a <_sk_callback_sse2+0xffffffffe9a34670>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a38f8a <_sk_callback_sse2+0xffffffffe9a34666>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -22276,16 +22567,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4ef4 <.literal16+0x654>
+ DB 127,0 ; jg 5024 <.literal16+0x654>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4ef8 <.literal16+0x658>
+ DB 127,0 ; jg 5028 <.literal16+0x658>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4efc <.literal16+0x65c>
+ DB 127,0 ; jg 502c <.literal16+0x65c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4f00 <.literal16+0x660>
+ DB 127,0 ; jg 5030 <.literal16+0x660>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -22294,7 +22585,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4f85 <.literal16+0x6e5>
+ DB 119,115 ; ja 50b5 <.literal16+0x6e5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -22305,7 +22596,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 4ee9 <.literal16+0x649>
+ DB 117,191 ; jne 5019 <.literal16+0x649>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -22317,7 +22608,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a38f2a <_sk_callback_sse2+0xffffffffe9a34740>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3905a <_sk_callback_sse2+0xffffffffe9a34736>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -22371,16 +22662,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4fc4 <.literal16+0x724>
+ DB 127,0 ; jg 50f4 <.literal16+0x724>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4fc8 <.literal16+0x728>
+ DB 127,0 ; jg 50f8 <.literal16+0x728>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4fcc <.literal16+0x72c>
+ DB 127,0 ; jg 50fc <.literal16+0x72c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 4fd0 <.literal16+0x730>
+ DB 127,0 ; jg 5100 <.literal16+0x730>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -22389,7 +22680,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5055 <.literal16+0x7b5>
+ DB 119,115 ; ja 5185 <.literal16+0x7b5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -22400,7 +22691,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 4fb9 <.literal16+0x719>
+ DB 117,191 ; jne 50e9 <.literal16+0x719>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -22412,7 +22703,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a38ffa <_sk_callback_sse2+0xffffffffe9a34810>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3912a <_sk_callback_sse2+0xffffffffe9a34806>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -22466,16 +22757,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5094 <.literal16+0x7f4>
+ DB 127,0 ; jg 51c4 <.literal16+0x7f4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5098 <.literal16+0x7f8>
+ DB 127,0 ; jg 51c8 <.literal16+0x7f8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 509c <.literal16+0x7fc>
+ DB 127,0 ; jg 51cc <.literal16+0x7fc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 50a0 <.literal16+0x800>
+ DB 127,0 ; jg 51d0 <.literal16+0x800>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -22484,7 +22775,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5125 <.literal16+0x885>
+ DB 119,115 ; ja 5255 <.literal16+0x885>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -22495,7 +22786,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 5089 <.literal16+0x7e9>
+ DB 117,191 ; jne 51b9 <.literal16+0x7e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -22507,7 +22798,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a390ca <_sk_callback_sse2+0xffffffffe9a348e0>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a391fa <_sk_callback_sse2+0xffffffffe9a348d6>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -22557,13 +22848,13 @@ ALIGN 16
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 51a7 <.literal16+0x907>
+ DB 127,67 ; jg 52d7 <.literal16+0x907>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 51ab <.literal16+0x90b>
+ DB 127,67 ; jg 52db <.literal16+0x90b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 51af <.literal16+0x90f>
+ DB 127,67 ; jg 52df <.literal16+0x90f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 51b3 <.literal16+0x913>
+ DB 127,67 ; jg 52e3 <.literal16+0x913>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -22610,16 +22901,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5233 <.literal16+0x993>
+ DB 118,63 ; jbe 5363 <.literal16+0x993>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5237 <.literal16+0x997>
+ DB 118,63 ; jbe 5367 <.literal16+0x997>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 523b <.literal16+0x99b>
+ DB 118,63 ; jbe 536b <.literal16+0x99b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 523f <.literal16+0x99f>
+ DB 118,63 ; jbe 536f <.literal16+0x99f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -22631,11 +22922,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 527b <.literal16+0x9db>
+ DB 127,67 ; jg 53ab <.literal16+0x9db>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 527f <.literal16+0x9df>
+ DB 127,67 ; jg 53af <.literal16+0x9df>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5283 <.literal16+0x9e3>
+ DB 127,67 ; jg 53b3 <.literal16+0x9e3>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,128,63 ; addb $0x3f,-0x7fffffc5(%rax)
@@ -22675,13 +22966,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 52c9 <.literal16+0xa29>
+ DB 224,7 ; loopne 53f9 <.literal16+0xa29>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 52cd <.literal16+0xa2d>
+ DB 224,7 ; loopne 53fd <.literal16+0xa2d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 52d1 <.literal16+0xa31>
+ DB 224,7 ; loopne 5401 <.literal16+0xa31>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 52d5 <.literal16+0xa35>
+ DB 224,7 ; loopne 5405 <.literal16+0xa35>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -22727,13 +23018,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5339 <.literal16+0xa99>
+ DB 224,7 ; loopne 5469 <.literal16+0xa99>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 533d <.literal16+0xa9d>
+ DB 224,7 ; loopne 546d <.literal16+0xa9d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5341 <.literal16+0xaa1>
+ DB 224,7 ; loopne 5471 <.literal16+0xaa1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5345 <.literal16+0xaa5>
+ DB 224,7 ; loopne 5475 <.literal16+0xaa5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -22771,13 +23062,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 53d6 <.literal16+0xb36>
+ DB 124,66 ; jl 5506 <.literal16+0xb36>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 53da <.literal16+0xb3a>
+ DB 124,66 ; jl 550a <.literal16+0xb3a>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 53de <.literal16+0xb3e>
+ DB 124,66 ; jl 550e <.literal16+0xb3e>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 53e2 <.literal16+0xb42>
+ DB 124,66 ; jl 5512 <.literal16+0xb42>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -22867,13 +23158,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 54e5 <.literal16+0xc45>
+ DB 112,65 ; jo 5615 <.literal16+0xc45>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 54e9 <.literal16+0xc49>
+ DB 112,65 ; jo 5619 <.literal16+0xc49>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 54ed <.literal16+0xc4d>
+ DB 112,65 ; jo 561d <.literal16+0xc4d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 54f1 <.literal16+0xc51>
+ DB 112,65 ; jo 5621 <.literal16+0xc51>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -22895,11 +23186,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 553b <.literal16+0xc9b>
+ DB 127,67 ; jg 566b <.literal16+0xc9b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 553f <.literal16+0xc9f>
+ DB 127,67 ; jg 566f <.literal16+0xc9f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5543 <.literal16+0xca3>
+ DB 127,67 ; jg 5673 <.literal16+0xca3>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -22975,13 +23266,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 562b <.literal16+0xd8b>
+ DB 127,71 ; jg 575b <.literal16+0xd8b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 562f <.literal16+0xd8f>
+ DB 127,71 ; jg 575f <.literal16+0xd8f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 5633 <.literal16+0xd93>
+ DB 127,71 ; jg 5763 <.literal16+0xd93>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 5637 <.literal16+0xd97>
+ DB 127,71 ; jg 5767 <.literal16+0xd97>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -23134,11 +23425,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 5792 <.literal16+0xef2>
+ DB 62,114,28 ; jb,pt 58c2 <.literal16+0xef2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 5796 <.literal16+0xef6>
+ DB 62,114,28 ; jb,pt 58c6 <.literal16+0xef6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 579a <.literal16+0xefa>
+ DB 62,114,28 ; jb,pt 58ca <.literal16+0xefa>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -23182,7 +23473,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e625 <_sk_callback_sse2+0x3d639e3b>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e755 <_sk_callback_sse2+0x3d639e31>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -23208,7 +23499,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e665 <_sk_callback_sse2+0x3d639e7b>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e795 <_sk_callback_sse2+0x3d639e71>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -23217,13 +23508,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 585e <.literal16+0xfbe>
+ DB 114,28 ; jb 598e <.literal16+0xfbe>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 5862 <.literal16+0xfc2>
+ DB 62,114,28 ; jb,pt 5992 <.literal16+0xfc2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 5866 <.literal16+0xfc6>
+ DB 62,114,28 ; jb,pt 5996 <.literal16+0xfc6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 586a <.literal16+0xfca>
+ DB 62,114,28 ; jb,pt 599a <.literal16+0xfca>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -23244,11 +23535,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 58a2 <.literal16+0x1002>
+ DB 62,114,28 ; jb,pt 59d2 <.literal16+0x1002>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 58a6 <.literal16+0x1006>
+ DB 62,114,28 ; jb,pt 59d6 <.literal16+0x1006>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 58aa <.literal16+0x100a>
+ DB 62,114,28 ; jb,pt 59da <.literal16+0x100a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -23292,7 +23583,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e735 <_sk_callback_sse2+0x3d639f4b>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e865 <_sk_callback_sse2+0x3d639f41>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -23318,7 +23609,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e775 <_sk_callback_sse2+0x3d639f8b>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63e8a5 <_sk_callback_sse2+0x3d639f81>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -23327,13 +23618,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 596e <.literal16+0x10ce>
+ DB 114,28 ; jb 5a9e <.literal16+0x10ce>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 5972 <_sk_callback_sse2+0x1188>
+ DB 62,114,28 ; jb,pt 5aa2 <_sk_callback_sse2+0x117e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 5976 <_sk_callback_sse2+0x118c>
+ DB 62,114,28 ; jb,pt 5aa6 <_sk_callback_sse2+0x1182>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 597a <_sk_callback_sse2+0x1190>
+ DB 62,114,28 ; jb,pt 5aaa <_sk_callback_sse2+0x1186>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 06644b717e..60b096bed8 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -418,6 +418,8 @@ BLEND_MODE(softlight) {
// and
// https://www.khronos.org/registry/OpenGL/specs/es/3.2/es_spec_3.2.pdf
// They're equivalent, but ES' math has been better simplified.
+//
+// Anything extra we add beyond that is to make the math work with premul inputs.
SI F max(F r, F g, F b) { return max(r, max(g, b)); }
SI F min(F r, F g, F b) { return min(r, min(g, b)); }
@@ -438,14 +440,20 @@ SI void set_sat(F* r, F* g, F* b, F s) {
*g = scale(*g);
*b = scale(*b);
}
-SI void clip_color(F* r, F* g, F* b) {
+SI void set_lum(F* r, F* g, F* b, F l) {
+ F diff = l - lum(*r, *g, *b);
+ *r += diff;
+ *g += diff;
+ *b += diff;
+}
+SI void clip_color(F* r, F* g, F* b, F a) {
F mn = min(*r, *g, *b),
mx = max(*r, *g, *b),
l = lum(*r, *g, *b);
auto clip = [=](F c) {
c = if_then_else(mn >= 0, c, l + (c - l) * ( l) / (l - mn) );
- c = if_then_else(mx > 1, l + (c - l) * (1 - l) / (mx - l), c);
+ c = if_then_else(mx > a, l + (c - l) * (a - l) / (mx - l), c);
c = max(c, 0); // Sometimes without this we may dip just a little negative.
return c;
};
@@ -453,67 +461,60 @@ SI void clip_color(F* r, F* g, F* b) {
*g = clip(*g);
*b = clip(*b);
}
-SI void set_lum(F* r, F* g, F* b, F l) {
- F diff = l - lum(*r, *g, *b);
- *r += diff;
- *g += diff;
- *b += diff;
- clip_color(r, g, b);
-}
-
-SI F unpremultiply(F c, F a) {
- return c * if_then_else(a == 0, 0, 1.0f / a);
-}
STAGE(hue) {
- F R = unpremultiply(r,a),
- G = unpremultiply(g,a),
- B = unpremultiply(b,a);
+ F R = r*a,
+ G = g*a,
+ B = b*a;
- set_sat(&R, &G, &B, sat(dr,dg,db));
- set_lum(&R, &G, &B, lum(dr,dg,db));
+ set_sat(&R, &G, &B, sat(dr,dg,db)*a);
+ set_lum(&R, &G, &B, lum(dr,dg,db)*a);
+ clip_color(&R,&G,&B, a*da);
+ r = r*inv(da) + dr*inv(a) + R;
+ g = g*inv(da) + dg*inv(a) + G;
+ b = b*inv(da) + db*inv(a) + B;
a = a + da - a*da;
- r = R * a;
- g = G * a;
- b = B * a;
}
STAGE(saturation) {
- F R = unpremultiply(dr,da),
- G = unpremultiply(dg,da),
- B = unpremultiply(db,da);
+ F R = dr*a,
+ G = dg*a,
+ B = db*a;
- set_sat(&R, &G, &B, sat( r, g, b));
- set_lum(&R, &G, &B, lum(dr,dg,db)); // (This is not redundant.)
+ set_sat(&R, &G, &B, sat( r, g, b)*da);
+ set_lum(&R, &G, &B, lum(dr,dg,db)* a); // (This is not redundant.)
+ clip_color(&R,&G,&B, a*da);
+ r = r*inv(da) + dr*inv(a) + R;
+ g = g*inv(da) + dg*inv(a) + G;
+ b = b*inv(da) + db*inv(a) + B;
a = a + da - a*da;
- r = R * a;
- g = G * a;
- b = B * a;
}
STAGE(color) {
- F R = unpremultiply(r,a),
- G = unpremultiply(g,a),
- B = unpremultiply(b,a);
+ F R = r*da,
+ G = g*da,
+ B = b*da;
- set_lum(&R, &G, &B, lum(dr,dg,db));
+ set_lum(&R, &G, &B, lum(dr,dg,db)*a);
+ clip_color(&R,&G,&B, a*da);
+ r = r*inv(da) + dr*inv(a) + R;
+ g = g*inv(da) + dg*inv(a) + G;
+ b = b*inv(da) + db*inv(a) + B;
a = a + da - a*da;
- r = R * a;
- g = G * a;
- b = B * a;
}
STAGE(luminosity) {
- F R = unpremultiply(dr,da),
- G = unpremultiply(dg,da),
- B = unpremultiply(db,da);
+ F R = dr*a,
+ G = dg*a,
+ B = db*a;
- set_lum(&R, &G, &B, lum(r,g,b));
+ set_lum(&R, &G, &B, lum(r,g,b)*da);
+ clip_color(&R,&G,&B, a*da);
+ r = r*inv(da) + dr*inv(a) + R;
+ g = g*inv(da) + dg*inv(a) + G;
+ b = b*inv(da) + db*inv(a) + B;
a = a + da - a*da;
- r = R * a;
- g = G * a;
- b = B * a;
}
STAGE(clamp_0) {
@@ -579,9 +580,10 @@ STAGE(premul) {
b = b * a;
}
STAGE(unpremul) {
- r = unpremultiply(r,a);
- g = unpremultiply(g,a);
- b = unpremultiply(b,a);
+ auto scale = if_then_else(a == 0, 0, 1.0f / a);
+ r *= scale;
+ g *= scale;
+ b *= scale;
}
STAGE(from_srgb) {