diff options
Diffstat (limited to 'src')
-rw-r--r-- | src/core/SkBlendMode.cpp | 18 | ||||
-rw-r--r-- | src/core/SkBlendModePriv.h | 10 | ||||
-rw-r--r-- | src/core/SkRasterPipeline.h | 4 | ||||
-rw-r--r-- | src/core/SkRasterPipelineBlitter.cpp | 33 | ||||
-rw-r--r-- | src/core/SkXfermode.cpp | 14 | ||||
-rw-r--r-- | src/jumper/SkJumper.cpp | 1 | ||||
-rw-r--r-- | src/jumper/SkJumper_generated.S | 9724 | ||||
-rw-r--r-- | src/jumper/SkJumper_generated_win.S | 8580 | ||||
-rw-r--r-- | src/jumper/SkJumper_stages.cpp | 29 | ||||
-rw-r--r-- | src/jumper/SkJumper_stages_8bit.cpp | 17 |
10 files changed, 9859 insertions, 8571 deletions
diff --git a/src/core/SkBlendMode.cpp b/src/core/SkBlendMode.cpp index 35d49d2499..ef96cc0376 100644 --- a/src/core/SkBlendMode.cpp +++ b/src/core/SkBlendMode.cpp @@ -62,7 +62,15 @@ bool SkBlendMode_AsCoeff(SkBlendMode mode, SkBlendModeCoeff* src, SkBlendModeCoe return true; } -void SkBlendMode_AppendStagesNoClamp(SkBlendMode mode, SkRasterPipeline* p) { +bool SkBlendMode_ShouldPreScaleCoverage(SkBlendMode mode, bool rgb_coverage) { + // The most important things we do here are: + // - always use pre-scaling for plus mode; + // - never use pre-scaling for srcover with 565 coverage. + return mode == SkBlendMode::kPlus || + (mode == SkBlendMode::kSrcOver && !rgb_coverage); +} + +void SkBlendMode_AppendStages(SkBlendMode mode, SkRasterPipeline* p) { auto stage = SkRasterPipeline::srcover; switch (mode) { case SkBlendMode::kClear: stage = SkRasterPipeline::clear; break; @@ -100,14 +108,6 @@ void SkBlendMode_AppendStagesNoClamp(SkBlendMode mode, SkRasterPipeline* p) { p->append(stage); } -void SkBlendMode_AppendClampIfNeeded(SkBlendMode mode, SkRasterPipeline* p) { - if (mode == SkBlendMode::kPlus) { - // Both clamp_a and clamp_1 would preserve premultiplication invariants here, - // so we pick clamp_1 for being a smidge faster. - p->append(SkRasterPipeline::clamp_1); - } -} - SkPM4f SkBlendMode_Apply(SkBlendMode mode, const SkPM4f& src, const SkPM4f& dst) { // special-case simple/common modes... switch (mode) { diff --git a/src/core/SkBlendModePriv.h b/src/core/SkBlendModePriv.h index c2822656cb..8d04e09fd7 100644 --- a/src/core/SkBlendModePriv.h +++ b/src/core/SkBlendModePriv.h @@ -19,14 +19,8 @@ static inline bool SkBlendMode_CaresAboutRBOrder(SkBlendMode mode) { return (mode > SkBlendMode::kLastSeparableMode); } -void SkBlendMode_AppendStagesNoClamp(SkBlendMode, SkRasterPipeline*); -void SkBlendMode_AppendClampIfNeeded(SkBlendMode, SkRasterPipeline*); - -static inline void SkBlendMode_AppendStages(SkBlendMode mode, SkRasterPipeline* p) { - // Only plus clamps, so maybe append a clamping plus here instead of a second stage? - SkBlendMode_AppendStagesNoClamp(mode, p); - SkBlendMode_AppendClampIfNeeded(mode, p); -} +bool SkBlendMode_ShouldPreScaleCoverage(SkBlendMode, bool rgb_coverage); +void SkBlendMode_AppendStages(SkBlendMode, SkRasterPipeline*); enum class SkBlendModeCoeff { kZero, /** 0 */ diff --git a/src/core/SkRasterPipeline.h b/src/core/SkRasterPipeline.h index adb0ed0187..ee24c266b0 100644 --- a/src/core/SkRasterPipeline.h +++ b/src/core/SkRasterPipeline.h @@ -57,8 +57,8 @@ struct SkJumper_Engine; M(load_u16_be) M(load_rgb_u16_be) M(store_u16_be) \ M(load_tables_u16_be) M(load_tables_rgb_u16_be) \ M(load_tables) M(load_rgba) M(store_rgba) \ - M(scale_u8) M(scale_1_float) \ - M(lerp_u8) M(lerp_565) M(lerp_1_float) \ + M(scale_u8) M(scale_565) M(scale_1_float) \ + M( lerp_u8) M( lerp_565) M( lerp_1_float) \ M(dstatop) M(dstin) M(dstout) M(dstover) \ M(srcatop) M(srcin) M(srcout) M(srcover) \ M(clear) M(modulate) M(multiply) M(plus_) M(screen) M(xor_) \ diff --git a/src/core/SkRasterPipelineBlitter.cpp b/src/core/SkRasterPipelineBlitter.cpp index fb15014a85..4c484a0439 100644 --- a/src/core/SkRasterPipelineBlitter.cpp +++ b/src/core/SkRasterPipelineBlitter.cpp @@ -52,7 +52,6 @@ public: private: void append_load_d(SkRasterPipeline*) const; void append_blend (SkRasterPipeline*) const; - void maybe_clamp (SkRasterPipeline*) const; void append_store (SkRasterPipeline*) const; // If we have an burst context, use it to fill our shader buffer. @@ -273,19 +272,15 @@ void SkRasterPipelineBlitter::append_store(SkRasterPipeline* p) const { } void SkRasterPipelineBlitter::append_blend(SkRasterPipeline* p) const { - if (fDst.info().alphaType() == kUnpremul_SkAlphaType) { + if (fDst.info().alphaType() == kUnpremul_SkAlphaType) { // TODO: move to append_load_d p->append(SkRasterPipeline::premul_dst); } - SkBlendMode_AppendStagesNoClamp(fBlend, p); - if (fDst.info().alphaType() == kUnpremul_SkAlphaType) { + SkBlendMode_AppendStages(fBlend, p); + if (fDst.info().alphaType() == kUnpremul_SkAlphaType) { // TODO: move to append_store p->append(SkRasterPipeline::unpremul); } } -void SkRasterPipelineBlitter::maybe_clamp(SkRasterPipeline* p) const { - SkBlendMode_AppendClampIfNeeded(fBlend, p); -} - void SkRasterPipelineBlitter::burst_shade(int x, int y, int w) { SkASSERT(fBurstCtx); if (w > SkToInt(fShaderBuffer.size())) { @@ -328,7 +323,6 @@ void SkRasterPipelineBlitter::blitRect(int x, int y, int w, int h) { if (fBlend != SkBlendMode::kSrc) { this->append_load_d(&p); this->append_blend(&p); - this->maybe_clamp(&p); } this->append_store(&p); } @@ -351,7 +345,7 @@ void SkRasterPipelineBlitter::blitAntiH(int x, int y, const SkAlpha aa[], const if (!fBlitAntiH) { SkRasterPipeline p(fAlloc); p.extend(fColorPipeline); - if (fBlend == SkBlendMode::kSrcOver) { + if (SkBlendMode_ShouldPreScaleCoverage(fBlend, /*rgb_coverage=*/false)) { p.append(SkRasterPipeline::scale_1_float, &fCurrentCoverage); this->append_load_d(&p); this->append_blend(&p); @@ -360,7 +354,7 @@ void SkRasterPipelineBlitter::blitAntiH(int x, int y, const SkAlpha aa[], const this->append_blend(&p); p.append(SkRasterPipeline::lerp_1_float, &fCurrentCoverage); } - this->maybe_clamp(&p); + this->append_store(&p); fBlitAntiH = p.compile(); } @@ -405,7 +399,7 @@ void SkRasterPipelineBlitter::blitMask(const SkMask& mask, const SkIRect& clip) if (mask.fFormat == SkMask::kA8_Format && !fBlitMaskA8) { SkRasterPipeline p(fAlloc); p.extend(fColorPipeline); - if (fBlend == SkBlendMode::kSrcOver) { + if (SkBlendMode_ShouldPreScaleCoverage(fBlend, /*rgb_coverage=*/false)) { p.append(SkRasterPipeline::scale_u8, &fMaskPtr); this->append_load_d(&p); this->append_blend(&p); @@ -414,17 +408,22 @@ void SkRasterPipelineBlitter::blitMask(const SkMask& mask, const SkIRect& clip) this->append_blend(&p); p.append(SkRasterPipeline::lerp_u8, &fMaskPtr); } - this->maybe_clamp(&p); this->append_store(&p); fBlitMaskA8 = p.compile(); } if (mask.fFormat == SkMask::kLCD16_Format && !fBlitMaskLCD16) { SkRasterPipeline p(fAlloc); p.extend(fColorPipeline); - this->append_load_d(&p); - this->append_blend(&p); - p.append(SkRasterPipeline::lerp_565, &fMaskPtr); - this->maybe_clamp(&p); + if (SkBlendMode_ShouldPreScaleCoverage(fBlend, /*rgb_coverage=*/true)) { + // Somewhat unusually, scale_565 needs dst loaded first. + this->append_load_d(&p); + p.append(SkRasterPipeline::scale_565, &fMaskPtr); + this->append_blend(&p); + } else { + this->append_load_d(&p); + this->append_blend(&p); + p.append(SkRasterPipeline::lerp_565, &fMaskPtr); + } this->append_store(&p); fBlitMaskLCD16 = p.compile(); } diff --git a/src/core/SkXfermode.cpp b/src/core/SkXfermode.cpp index 29296c3343..8a66363f74 100644 --- a/src/core/SkXfermode.cpp +++ b/src/core/SkXfermode.cpp @@ -49,11 +49,17 @@ public: p.append(SkRasterPipeline::load_8888, &src_ctx); } - SkBlendMode_AppendStagesNoClamp(fMode, &p); - if (aa) { - p.append(SkRasterPipeline::lerp_u8, &aa_ctx); + if (SkBlendMode_ShouldPreScaleCoverage(fMode, /*rgb_coverage=*/false)) { + if (aa) { + p.append(SkRasterPipeline::scale_u8, &aa_ctx); + } + SkBlendMode_AppendStages(fMode, &p); + } else { + SkBlendMode_AppendStages(fMode, &p); + if (aa) { + p.append(SkRasterPipeline::lerp_u8, &aa_ctx); + } } - SkBlendMode_AppendClampIfNeeded(fMode, &p); if (kN32_SkColorType == kBGRA_8888_SkColorType) { p.append(SkRasterPipeline::store_bgra, &dst_ctx); diff --git a/src/jumper/SkJumper.cpp b/src/jumper/SkJumper.cpp index b36084ccac..afd12e073c 100644 --- a/src/jumper/SkJumper.cpp +++ b/src/jumper/SkJumper.cpp @@ -99,6 +99,7 @@ using StartPipelineFn = void(size_t,size_t,size_t,size_t, void**,K*); M(multiply) \ M(screen) \ M(xor_) \ + M(plus_) \ M(darken) \ M(lighten) \ M(difference) \ diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S index e072a564c9..93848bac3e 100644 --- a/src/jumper/SkJumper_generated.S +++ b/src/jumper/SkJumper_generated.S @@ -385,9 +385,14 @@ FUNCTION(_sk_plus__aarch64) _sk_plus__aarch64: .long 0xf8408425 // ldr x5, [x1], #8 .long 0x4e24d400 // fadd v0.4s, v0.4s, v4.4s + .long 0x4f03f610 // fmov v16.4s, #1.000000000000000000e+00 .long 0x4e25d421 // fadd v1.4s, v1.4s, v5.4s .long 0x4e26d442 // fadd v2.4s, v2.4s, v6.4s .long 0x4e27d463 // fadd v3.4s, v3.4s, v7.4s + .long 0x4eb0f400 // fmin v0.4s, v0.4s, v16.4s + .long 0x4eb0f421 // fmin v1.4s, v1.4s, v16.4s + .long 0x4eb0f442 // fmin v2.4s, v2.4s, v16.4s + .long 0x4eb0f463 // fmin v3.4s, v3.4s, v16.4s .long 0xd61f00a0 // br x5 HIDDEN _sk_screen_aarch64 @@ -1307,7 +1312,7 @@ _sk_srcover_rgba_8888_aarch64: .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897908 // add x8, x8, x9, asr #30 - .long 0xb5000504 // cbnz x4, 11c4 <_sk_srcover_rgba_8888_aarch64+0xbc> + .long 0xb5000504 // cbnz x4, 11d8 <_sk_srcover_rgba_8888_aarch64+0xbc> .long 0x3dc00104 // ldr q4, [x8] .long 0x6f00e625 // movi v5.2d, #0xff000000ff .long 0x6f380486 // ushr v6.4s, v4.4s, #8 @@ -1342,42 +1347,42 @@ _sk_srcover_rgba_8888_aarch64: .long 0x6e21a871 // fcvtnu v17.4s, v3.4s .long 0x4f385631 // shl v17.4s, v17.4s, #24 .long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b - .long 0xb5000284 // cbnz x4, 1200 <_sk_srcover_rgba_8888_aarch64+0xf8> + .long 0xb5000284 // cbnz x4, 1214 <_sk_srcover_rgba_8888_aarch64+0xf8> .long 0x3d800110 // str q16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000300 // b.eq 122c <_sk_srcover_rgba_8888_aarch64+0x124> // b.none + .long 0x54000300 // b.eq 1240 <_sk_srcover_rgba_8888_aarch64+0x124> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x6f00e404 // movi v4.2d, #0x0 - .long 0x540000c0 // b.eq 11f0 <_sk_srcover_rgba_8888_aarch64+0xe8> // b.none + .long 0x540000c0 // b.eq 1204 <_sk_srcover_rgba_8888_aarch64+0xe8> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffa61 // b.ne 112c <_sk_srcover_rgba_8888_aarch64+0x24> // b.any + .long 0x54fffa61 // b.ne 1140 <_sk_srcover_rgba_8888_aarch64+0x24> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4e040fe4 // dup v4.4s, wzr .long 0x4d408124 // ld1 {v4.s}[2], [x9] .long 0xfd400105 // ldr d5, [x8] .long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8 .long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8 - .long 0x17ffffcc // b 112c <_sk_srcover_rgba_8888_aarch64+0x24> + .long 0x17ffffcc // b 1140 <_sk_srcover_rgba_8888_aarch64+0x24> .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000180 // b.eq 1238 <_sk_srcover_rgba_8888_aarch64+0x130> // b.none + .long 0x54000180 // b.eq 124c <_sk_srcover_rgba_8888_aarch64+0x130> // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 1224 <_sk_srcover_rgba_8888_aarch64+0x11c> // b.none + .long 0x540000a0 // b.eq 1238 <_sk_srcover_rgba_8888_aarch64+0x11c> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd01 // b.ne 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0> // b.any + .long 0x54fffd01 // b.ne 11cc <_sk_srcover_rgba_8888_aarch64+0xb0> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4d008130 // st1 {v16.s}[2], [x9] .long 0xfd000110 // str d16, [x8] - .long 0x17ffffe4 // b 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0> + .long 0x17ffffe4 // b 11cc <_sk_srcover_rgba_8888_aarch64+0xb0> .long 0x4e040fe4 // dup v4.4s, wzr .long 0x0d408104 // ld1 {v4.s}[0], [x8] - .long 0x17ffffbe // b 112c <_sk_srcover_rgba_8888_aarch64+0x24> + .long 0x17ffffbe // b 1140 <_sk_srcover_rgba_8888_aarch64+0x24> .long 0x0d008110 // st1 {v16.s}[0], [x8] - .long 0x17ffffdf // b 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0> + .long 0x17ffffdf // b 11cc <_sk_srcover_rgba_8888_aarch64+0xb0> HIDDEN _sk_clamp_0_aarch64 .globl _sk_clamp_0_aarch64 @@ -1680,44 +1685,44 @@ HIDDEN _sk_rgb_to_hsl_aarch64 .globl _sk_rgb_to_hsl_aarch64 FUNCTION(_sk_rgb_to_hsl_aarch64) _sk_rgb_to_hsl_aarch64: - .long 0x4e21f410 // fmax v16.4s, v0.4s, v1.4s - .long 0x4ea1f411 // fmin v17.4s, v0.4s, v1.4s + .long 0x4e22f430 // fmax v16.4s, v1.4s, v2.4s + .long 0x4ea2f431 // fmin v17.4s, v1.4s, v2.4s .long 0x6ea1e454 // fcmgt v20.4s, v2.4s, v1.4s .long 0x4f00f715 // fmov v21.4s, #6.000000000000000000e+00 - .long 0x4e22f610 // fmax v16.4s, v16.4s, v2.4s - .long 0x4ea2f631 // fmin v17.4s, v17.4s, v2.4s + .long 0x4e30f410 // fmax v16.4s, v0.4s, v16.4s + .long 0x4eb1f411 // fmin v17.4s, v0.4s, v17.4s .long 0x4f03f612 // fmov v18.4s, #1.000000000000000000e+00 .long 0x4e341eb4 // and v20.16b, v21.16b, v20.16b .long 0x4eb1d615 // fsub v21.4s, v16.4s, v17.4s .long 0x4ea2d433 // fsub v19.4s, v1.4s, v2.4s - .long 0x4ea0d456 // fsub v22.4s, v2.4s, v0.4s - .long 0x4f026417 // movi v23.4s, #0x40, lsl #24 - .long 0x6e35fe42 // fdiv v2.4s, v18.4s, v21.4s - .long 0x4ea1d418 // fsub v24.4s, v0.4s, v1.4s - .long 0x4f00f619 // fmov v25.4s, #4.000000000000000000e+00 - .long 0x4f0167fa // movi v26.4s, #0x3f, lsl #24 - .long 0x4eb0d6f2 // fsub v18.4s, v23.4s, v16.4s - .long 0x4e36cc57 // fmla v23.4s, v2.4s, v22.4s - .long 0x4e31e616 // fcmeq v22.4s, v16.4s, v17.4s + .long 0x4ea0d442 // fsub v2.4s, v2.4s, v0.4s + .long 0x4f026416 // movi v22.4s, #0x40, lsl #24 + .long 0x4ea1d417 // fsub v23.4s, v0.4s, v1.4s + .long 0x4f00f618 // fmov v24.4s, #4.000000000000000000e+00 + .long 0x6e35fe52 // fdiv v18.4s, v18.4s, v21.4s + .long 0x4f0167f9 // movi v25.4s, #0x3f, lsl #24 + .long 0x4e33ce54 // fmla v20.4s, v18.4s, v19.4s + .long 0x4eb0d6d3 // fsub v19.4s, v22.4s, v16.4s + .long 0x4e22ce56 // fmla v22.4s, v18.4s, v2.4s + .long 0x4e37ce58 // fmla v24.4s, v18.4s, v23.4s + .long 0x4e31e612 // fcmeq v18.4s, v16.4s, v17.4s .long 0x4e20e600 // fcmeq v0.4s, v16.4s, v0.4s .long 0x4e21e601 // fcmeq v1.4s, v16.4s, v1.4s .long 0x4e31d610 // fadd v16.4s, v16.4s, v17.4s .long 0x52a7c548 // mov w8, #0x3e2a0000 - .long 0x4e33cc54 // fmla v20.4s, v2.4s, v19.4s - .long 0x4e38cc59 // fmla v25.4s, v2.4s, v24.4s - .long 0x6e3ade02 // fmul v2.4s, v16.4s, v26.4s + .long 0x6e39de02 // fmul v2.4s, v16.4s, v25.4s .long 0x72955568 // movk w8, #0xaaab .long 0xf8408425 // ldr x5, [x1], #8 - .long 0x4eb1d651 // fsub v17.4s, v18.4s, v17.4s - .long 0x6ebae452 // fcmgt v18.4s, v2.4s, v26.4s - .long 0x6e791ee1 // bsl v1.16b, v23.16b, v25.16b - .long 0x4e040d13 // dup v19.4s, w8 - .long 0x6e701e32 // bsl v18.16b, v17.16b, v16.16b + .long 0x4eb1d671 // fsub v17.4s, v19.4s, v17.4s + .long 0x6eb9e453 // fcmgt v19.4s, v2.4s, v25.4s + .long 0x6e781ec1 // bsl v1.16b, v22.16b, v24.16b + .long 0x4e040d1a // dup v26.4s, w8 + .long 0x6e701e33 // bsl v19.16b, v17.16b, v16.16b .long 0x6e611e80 // bsl v0.16b, v20.16b, v1.16b - .long 0x6e32fea1 // fdiv v1.4s, v21.4s, v18.4s - .long 0x6e33dc00 // fmul v0.4s, v0.4s, v19.4s - .long 0x4e761c00 // bic v0.16b, v0.16b, v22.16b - .long 0x4e761c21 // bic v1.16b, v1.16b, v22.16b + .long 0x6e33fea1 // fdiv v1.4s, v21.4s, v19.4s + .long 0x6e3adc00 // fmul v0.4s, v0.4s, v26.4s + .long 0x4e721c00 // bic v0.16b, v0.16b, v18.16b + .long 0x4e721c21 // bic v1.16b, v1.16b, v18.16b .long 0xd61f00a0 // br x5 HIDDEN _sk_hsl_to_rgb_aarch64 @@ -1823,7 +1828,7 @@ _sk_scale_u8_aarch64: .long 0xb9800908 // ldrsw x8, [x8, #8] .long 0x9b0a2508 // madd x8, x8, x10, x9 .long 0x8b22c108 // add x8, x8, w2, sxtw - .long 0xb50002e4 // cbnz x4, 1814 <_sk_scale_u8_aarch64+0x74> + .long 0xb50002e4 // cbnz x4, 1828 <_sk_scale_u8_aarch64+0x74> .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -1848,12 +1853,12 @@ _sk_scale_u8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 1860 <_sk_scale_u8_aarch64+0xc0> // b.none + .long 0x54000220 // b.eq 1874 <_sk_scale_u8_aarch64+0xc0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e410 // movi d16, #0x0 - .long 0x540000c0 // b.eq 1840 <_sk_scale_u8_aarch64+0xa0> // b.none + .long 0x540000c0 // b.eq 1854 <_sk_scale_u8_aarch64+0xa0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 17dc <_sk_scale_u8_aarch64+0x3c> // b.any + .long 0x54fffd61 // b.ne 17f0 <_sk_scale_u8_aarch64+0x3c> // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e0a1d30 // mov v16.h[2], w9 @@ -1864,11 +1869,83 @@ _sk_scale_u8_aarch64: .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4 .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4 - .long 0x17ffffe0 // b 17dc <_sk_scale_u8_aarch64+0x3c> + .long 0x17ffffe0 // b 17f0 <_sk_scale_u8_aarch64+0x3c> .long 0x39400108 // ldrb w8, [x8] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e021d10 // mov v16.h[0], w8 - .long 0x17ffffdc // b 17dc <_sk_scale_u8_aarch64+0x3c> + .long 0x17ffffdc // b 17f0 <_sk_scale_u8_aarch64+0x3c> + +HIDDEN _sk_scale_565_aarch64 +.globl _sk_scale_565_aarch64 +FUNCTION(_sk_scale_565_aarch64) +_sk_scale_565_aarch64: + .long 0xf9400028 // ldr x8, [x1] + .long 0xb9400909 // ldr w9, [x8, #8] + .long 0xf9400108 // ldr x8, [x8] + .long 0x1b037d29 // mul w9, w9, w3 + .long 0x8b29c508 // add x8, x8, w9, sxtw #1 + .long 0xd3607c49 // lsl x9, x2, #32 + .long 0x8b897d08 // add x8, x8, x9, asr #31 + .long 0xb50004c4 // cbnz x4, 1938 <_sk_scale_565_aarch64+0xb4> + .long 0xfd400110 // ldr d16, [x8] + .long 0x52a6f088 // mov w8, #0x37840000 + .long 0x72842108 // movk w8, #0x2108 + .long 0x4e040d12 // dup v18.4s, w8 + .long 0x321b17e8 // orr w8, wzr, #0x7e0 + .long 0x4e040d13 // dup v19.4s, w8 + .long 0x52a74048 // mov w8, #0x3a020000 + .long 0x2f10a610 // uxtl v16.4s, v16.4h + .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8 + .long 0x72810428 // movk w8, #0x821 + .long 0x4f0007f4 // movi v20.4s, #0x1f + .long 0x4e040d15 // dup v21.4s, w8 + .long 0x52a7a088 // mov w8, #0x3d040000 + .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b + .long 0x72842108 // movk w8, #0x2108 + .long 0x4e341e14 // and v20.16b, v16.16b, v20.16b + .long 0x4e331e10 // and v16.16b, v16.16b, v19.16b + .long 0x4e21da31 // scvtf v17.4s, v17.4s + .long 0x6e32de31 // fmul v17.4s, v17.4s, v18.4s + .long 0x4e040d12 // dup v18.4s, w8 + .long 0x4e21da94 // scvtf v20.4s, v20.4s + .long 0x4e21da10 // scvtf v16.4s, v16.4s + .long 0x6e32de92 // fmul v18.4s, v20.4s, v18.4s + .long 0x6e35de10 // fmul v16.4s, v16.4s, v21.4s + .long 0xf9400425 // ldr x5, [x1, #8] + .long 0x6e22de42 // fmul v2.4s, v18.4s, v2.4s + .long 0x4eb2f614 // fmin v20.4s, v16.4s, v18.4s + .long 0x4e32f612 // fmax v18.4s, v16.4s, v18.4s + .long 0x6ea3e4f3 // fcmgt v19.4s, v7.4s, v3.4s + .long 0x6e20de20 // fmul v0.4s, v17.4s, v0.4s + .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s + .long 0x4eb4f630 // fmin v16.4s, v17.4s, v20.4s + .long 0x4e32f631 // fmax v17.4s, v17.4s, v18.4s + .long 0x6e711e13 // bsl v19.16b, v16.16b, v17.16b + .long 0x6e23de63 // fmul v3.4s, v19.4s, v3.4s + .long 0x91004021 // add x1, x1, #0x10 + .long 0xd61f00a0 // br x5 + .long 0x12000489 // and w9, w4, #0x3 + .long 0x7100053f // cmp w9, #0x1 + .long 0x54000220 // b.eq 1984 <_sk_scale_565_aarch64+0x100> // b.none + .long 0x7100093f // cmp w9, #0x2 + .long 0x2f00e410 // movi d16, #0x0 + .long 0x540000c0 // b.eq 1964 <_sk_scale_565_aarch64+0xe0> // b.none + .long 0x71000d3f // cmp w9, #0x3 + .long 0x54fffaa1 // b.ne 18a8 <_sk_scale_565_aarch64+0x24> // b.any + .long 0x91001109 // add x9, x8, #0x4 + .long 0x0e020ff0 // dup v16.4h, wzr + .long 0x0d405130 // ld1 {v16.h}[2], [x9] + .long 0x79400109 // ldrh w9, [x8] + .long 0x79400508 // ldrh w8, [x8, #2] + .long 0x4e041d31 // mov v17.s[0], w9 + .long 0x4e0c1d11 // mov v17.s[1], w8 + .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h + .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4 + .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4 + .long 0x17ffffca // b 18a8 <_sk_scale_565_aarch64+0x24> + .long 0x0e020ff0 // dup v16.4h, wzr + .long 0x0d404110 // ld1 {v16.h}[0], [x8] + .long 0x17ffffc7 // b 18a8 <_sk_scale_565_aarch64+0x24> HIDDEN _sk_lerp_1_float_aarch64 .globl _sk_lerp_1_float_aarch64 @@ -1900,7 +1977,7 @@ _sk_lerp_u8_aarch64: .long 0xb9800908 // ldrsw x8, [x8, #8] .long 0x9b0a2508 // madd x8, x8, x10, x9 .long 0x8b22c108 // add x8, x8, w2, sxtw - .long 0xb50003e4 // cbnz x4, 1940 <_sk_lerp_u8_aarch64+0x94> + .long 0xb50003e4 // cbnz x4, 1a60 <_sk_lerp_u8_aarch64+0x94> .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -1933,12 +2010,12 @@ _sk_lerp_u8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 198c <_sk_lerp_u8_aarch64+0xe0> // b.none + .long 0x54000220 // b.eq 1aac <_sk_lerp_u8_aarch64+0xe0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e410 // movi d16, #0x0 - .long 0x540000c0 // b.eq 196c <_sk_lerp_u8_aarch64+0xc0> // b.none + .long 0x540000c0 // b.eq 1a8c <_sk_lerp_u8_aarch64+0xc0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffc61 // b.ne 18e8 <_sk_lerp_u8_aarch64+0x3c> // b.any + .long 0x54fffc61 // b.ne 1a08 <_sk_lerp_u8_aarch64+0x3c> // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e0a1d30 // mov v16.h[2], w9 @@ -1949,11 +2026,11 @@ _sk_lerp_u8_aarch64: .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4 .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4 - .long 0x17ffffd8 // b 18e8 <_sk_lerp_u8_aarch64+0x3c> + .long 0x17ffffd8 // b 1a08 <_sk_lerp_u8_aarch64+0x3c> .long 0x39400108 // ldrb w8, [x8] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e021d10 // mov v16.h[0], w8 - .long 0x17ffffd4 // b 18e8 <_sk_lerp_u8_aarch64+0x3c> + .long 0x17ffffd4 // b 1a08 <_sk_lerp_u8_aarch64+0x3c> HIDDEN _sk_lerp_565_aarch64 .globl _sk_lerp_565_aarch64 @@ -1966,60 +2043,60 @@ _sk_lerp_565_aarch64: .long 0x8b29c508 // add x8, x8, w9, sxtw #1 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897d08 // add x8, x8, x9, asr #31 - .long 0xb50005c4 // cbnz x4, 1a70 <_sk_lerp_565_aarch64+0xd4> + .long 0xb50005c4 // cbnz x4, 1b90 <_sk_lerp_565_aarch64+0xd4> .long 0xfd400110 // ldr d16, [x8] - .long 0x321b17e8 // orr w8, wzr, #0x7e0 - .long 0x4e040d12 // dup v18.4s, w8 .long 0x52a6f088 // mov w8, #0x37840000 - .long 0x2f10a610 // uxtl v16.4s, v16.4h - .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8 .long 0x72842108 // movk w8, #0x2108 - .long 0x4f0007f3 // movi v19.4s, #0x1f - .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b - .long 0x4e331e13 // and v19.16b, v16.16b, v19.16b - .long 0x4e321e10 // and v16.16b, v16.16b, v18.16b .long 0x4e040d12 // dup v18.4s, w8 + .long 0x321b17e8 // orr w8, wzr, #0x7e0 + .long 0x2f10a610 // uxtl v16.4s, v16.4h + .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8 + .long 0x4e040d13 // dup v19.4s, w8 .long 0x52a7a088 // mov w8, #0x3d040000 .long 0x72842108 // movk w8, #0x2108 - .long 0x4e21da31 // scvtf v17.4s, v17.4s - .long 0x6e32de31 // fmul v17.4s, v17.4s, v18.4s - .long 0x4e040d12 // dup v18.4s, w8 + .long 0x4f0007f5 // movi v21.4s, #0x1f + .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b + .long 0x4e040d14 // dup v20.4s, w8 .long 0x52a74048 // mov w8, #0x3a020000 + .long 0x4e351e15 // and v21.16b, v16.16b, v21.16b + .long 0x4ea4d416 // fsub v22.4s, v0.4s, v4.4s + .long 0x4e21da20 // scvtf v0.4s, v17.4s .long 0x72810428 // movk w8, #0x821 - .long 0x4ea4d414 // fsub v20.4s, v0.4s, v4.4s - .long 0x4e21da60 // scvtf v0.4s, v19.4s - .long 0x6e32dc12 // fmul v18.4s, v0.4s, v18.4s - .long 0x4e040d00 // dup v0.4s, w8 + .long 0x4e331e10 // and v16.16b, v16.16b, v19.16b + .long 0x6e32dc11 // fmul v17.4s, v0.4s, v18.4s + .long 0x4ea5d432 // fsub v18.4s, v1.4s, v5.4s + .long 0x4e21daa1 // scvtf v1.4s, v21.4s + .long 0x6e34dc34 // fmul v20.4s, v1.4s, v20.4s + .long 0x4e040d01 // dup v1.4s, w8 .long 0x4e21da10 // scvtf v16.4s, v16.4s - .long 0x6e20de10 // fmul v16.4s, v16.4s, v0.4s + .long 0x6e21de10 // fmul v16.4s, v16.4s, v1.4s + .long 0x4ea51ca1 // mov v1.16b, v5.16b + .long 0xf9400425 // ldr x5, [x1, #8] + .long 0x4e32ce01 // fmla v1.4s, v16.4s, v18.4s + .long 0x4eb4f612 // fmin v18.4s, v16.4s, v20.4s + .long 0x4e34f610 // fmax v16.4s, v16.4s, v20.4s + .long 0x6ea3e4f3 // fcmgt v19.4s, v7.4s, v3.4s .long 0x4ea41c80 // mov v0.16b, v4.16b - .long 0x4e34ce20 // fmla v0.4s, v17.4s, v20.4s - .long 0x4ea7d463 // fsub v3.4s, v3.4s, v7.4s - .long 0x4ea71cf4 // mov v20.16b, v7.16b - .long 0x4ea5d433 // fsub v19.4s, v1.4s, v5.4s - .long 0x4ea6d441 // fsub v1.4s, v2.4s, v6.4s + .long 0x4eb2f632 // fmin v18.4s, v17.4s, v18.4s + .long 0x4e30f630 // fmax v16.4s, v17.4s, v16.4s + .long 0x4ea6d455 // fsub v21.4s, v2.4s, v6.4s + .long 0x4e36ce20 // fmla v0.4s, v17.4s, v22.4s .long 0x4ea61cc2 // mov v2.16b, v6.16b - .long 0x4e23ce34 // fmla v20.4s, v17.4s, v3.4s - .long 0x4ea71cf1 // mov v17.16b, v7.16b - .long 0x4e21ce42 // fmla v2.4s, v18.4s, v1.4s - .long 0x4e23ce51 // fmla v17.4s, v18.4s, v3.4s - .long 0x4ea71cf2 // mov v18.16b, v7.16b - .long 0xf9400425 // ldr x5, [x1, #8] - .long 0x4e23ce12 // fmla v18.4s, v16.4s, v3.4s - .long 0x4ea51ca1 // mov v1.16b, v5.16b - .long 0x4e31f643 // fmax v3.4s, v18.4s, v17.4s - .long 0x4e33ce01 // fmla v1.4s, v16.4s, v19.4s - .long 0x4e23f683 // fmax v3.4s, v20.4s, v3.4s + .long 0x4ea7d476 // fsub v22.4s, v3.4s, v7.4s + .long 0x4ea71ce3 // mov v3.16b, v7.16b + .long 0x6e701e53 // bsl v19.16b, v18.16b, v16.16b + .long 0x4e35ce82 // fmla v2.4s, v20.4s, v21.4s + .long 0x4e36ce63 // fmla v3.4s, v19.4s, v22.4s .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 1abc <_sk_lerp_565_aarch64+0x120> // b.none + .long 0x54000220 // b.eq 1bdc <_sk_lerp_565_aarch64+0x120> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e410 // movi d16, #0x0 - .long 0x540000c0 // b.eq 1a9c <_sk_lerp_565_aarch64+0x100> // b.none + .long 0x540000c0 // b.eq 1bbc <_sk_lerp_565_aarch64+0x100> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fff9a1 // b.ne 19c0 <_sk_lerp_565_aarch64+0x24> // b.any + .long 0x54fff9a1 // b.ne 1ae0 <_sk_lerp_565_aarch64+0x24> // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020ff0 // dup v16.4h, wzr .long 0x0d405130 // ld1 {v16.h}[2], [x9] @@ -2030,10 +2107,10 @@ _sk_lerp_565_aarch64: .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4 .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4 - .long 0x17ffffc2 // b 19c0 <_sk_lerp_565_aarch64+0x24> + .long 0x17ffffc2 // b 1ae0 <_sk_lerp_565_aarch64+0x24> .long 0x0e020ff0 // dup v16.4h, wzr .long 0x0d404110 // ld1 {v16.h}[0], [x8] - .long 0x17ffffbf // b 19c0 <_sk_lerp_565_aarch64+0x24> + .long 0x17ffffbf // b 1ae0 <_sk_lerp_565_aarch64+0x24> HIDDEN _sk_load_tables_aarch64 .globl _sk_load_tables_aarch64 @@ -2042,7 +2119,7 @@ _sk_load_tables_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400109 // ldr x9, [x8] .long 0x8b020929 // add x9, x9, x2, lsl #2 - .long 0xb50006e4 // cbnz x4, 1bb0 <_sk_load_tables_aarch64+0xe8> + .long 0xb50006e4 // cbnz x4, 1cd0 <_sk_load_tables_aarch64+0xe8> .long 0x3dc00122 // ldr q2, [x9] .long 0xa940a909 // ldp x9, x10, [x8, #8] .long 0x6f00e620 // movi v0.2d, #0xff000000ff @@ -2099,22 +2176,22 @@ _sk_load_tables_aarch64: .long 0xd61f00a0 // br x5 .long 0x1200048a // and w10, w4, #0x3 .long 0x7100055f // cmp w10, #0x1 - .long 0x540001a0 // b.eq 1bec <_sk_load_tables_aarch64+0x124> // b.none + .long 0x540001a0 // b.eq 1d0c <_sk_load_tables_aarch64+0x124> // b.none .long 0x7100095f // cmp w10, #0x2 .long 0x6f00e402 // movi v2.2d, #0x0 - .long 0x540000c0 // b.eq 1bdc <_sk_load_tables_aarch64+0x114> // b.none + .long 0x540000c0 // b.eq 1cfc <_sk_load_tables_aarch64+0x114> // b.none .long 0x71000d5f // cmp w10, #0x3 - .long 0x54fff881 // b.ne 1adc <_sk_load_tables_aarch64+0x14> // b.any + .long 0x54fff881 // b.ne 1bfc <_sk_load_tables_aarch64+0x14> // b.any .long 0x9100212a // add x10, x9, #0x8 .long 0x4e040fe2 // dup v2.4s, wzr .long 0x4d408142 // ld1 {v2.s}[2], [x10] .long 0xfd400120 // ldr d0, [x9] .long 0x6e004040 // ext v0.16b, v2.16b, v0.16b, #8 .long 0x6e004002 // ext v2.16b, v0.16b, v0.16b, #8 - .long 0x17ffffbd // b 1adc <_sk_load_tables_aarch64+0x14> + .long 0x17ffffbd // b 1bfc <_sk_load_tables_aarch64+0x14> .long 0x4e040fe2 // dup v2.4s, wzr .long 0x0d408122 // ld1 {v2.s}[0], [x9] - .long 0x17ffffba // b 1adc <_sk_load_tables_aarch64+0x14> + .long 0x17ffffba // b 1bfc <_sk_load_tables_aarch64+0x14> HIDDEN _sk_load_tables_u16_be_aarch64 .globl _sk_load_tables_u16_be_aarch64 @@ -2123,7 +2200,7 @@ _sk_load_tables_u16_be_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400109 // ldr x9, [x8] .long 0x8b020d29 // add x9, x9, x2, lsl #3 - .long 0xb5000744 // cbnz x4, 1cec <_sk_load_tables_u16_be_aarch64+0xf4> + .long 0xb5000744 // cbnz x4, 1e0c <_sk_load_tables_u16_be_aarch64+0xf4> .long 0x0c400520 // ld4 {v0.4h-v3.4h}, [x9] .long 0xa940a909 // ldp x9, x10, [x8, #8] .long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8 @@ -2183,14 +2260,14 @@ _sk_load_tables_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d606120 // ld4 {v0.h-v3.h}[0], [x9] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fff8c0 // b.eq 1c0c <_sk_load_tables_u16_be_aarch64+0x14> // b.none + .long 0x54fff8c0 // b.eq 1d2c <_sk_load_tables_u16_be_aarch64+0x14> // b.none .long 0x9100212a // add x10, x9, #0x8 .long 0x0d606940 // ld4 {v0.h-v3.h}[1], [x10] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fff843 // b.cc 1c0c <_sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last + .long 0x54fff843 // b.cc 1d2c <_sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last .long 0x91004129 // add x9, x9, #0x10 .long 0x0d607120 // ld4 {v0.h-v3.h}[2], [x9] - .long 0x17ffffbf // b 1c0c <_sk_load_tables_u16_be_aarch64+0x14> + .long 0x17ffffbf // b 1d2c <_sk_load_tables_u16_be_aarch64+0x14> HIDDEN _sk_load_tables_rgb_u16_be_aarch64 .globl _sk_load_tables_rgb_u16_be_aarch64 @@ -2200,7 +2277,7 @@ _sk_load_tables_rgb_u16_be_aarch64: .long 0x321f07ea // orr w10, wzr, #0x6 .long 0xf9400109 // ldr x9, [x8] .long 0x9b0a2449 // madd x9, x2, x10, x9 - .long 0xb5000664 // cbnz x4, 1df0 <_sk_load_tables_rgb_u16_be_aarch64+0xdc> + .long 0xb5000664 // cbnz x4, 1f10 <_sk_load_tables_rgb_u16_be_aarch64+0xdc> .long 0x0c404520 // ld3 {v0.4h-v2.4h}, [x9] .long 0xa940a909 // ldp x9, x10, [x8, #8] .long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8 @@ -2253,14 +2330,14 @@ _sk_load_tables_rgb_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d406120 // ld3 {v0.h-v2.h}[0], [x9] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fff9a0 // b.eq 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none + .long 0x54fff9a0 // b.eq 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none .long 0x9100192a // add x10, x9, #0x6 .long 0x0d406940 // ld3 {v0.h-v2.h}[1], [x10] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fff923 // b.cc 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last + .long 0x54fff923 // b.cc 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last .long 0x91003129 // add x9, x9, #0xc .long 0x0d407120 // ld3 {v0.h-v2.h}[2], [x9] - .long 0x17ffffc6 // b 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18> + .long 0x17ffffc6 // b 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18> HIDDEN _sk_byte_tables_aarch64 .globl _sk_byte_tables_aarch64 @@ -3003,7 +3080,7 @@ _sk_load_a8_aarch64: .long 0xb9800908 // ldrsw x8, [x8, #8] .long 0x9b0a2508 // madd x8, x8, x10, x9 .long 0x8b22c108 // add x8, x8, w2, sxtw - .long 0xb50002e4 // cbnz x4, 2908 <_sk_load_a8_aarch64+0x74> + .long 0xb50002e4 // cbnz x4, 2a28 <_sk_load_a8_aarch64+0x74> .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -3028,12 +3105,12 @@ _sk_load_a8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2954 <_sk_load_a8_aarch64+0xc0> // b.none + .long 0x54000220 // b.eq 2a74 <_sk_load_a8_aarch64+0xc0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e402 // movi d2, #0x0 - .long 0x540000c0 // b.eq 2934 <_sk_load_a8_aarch64+0xa0> // b.none + .long 0x540000c0 // b.eq 2a54 <_sk_load_a8_aarch64+0xa0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 28d0 <_sk_load_a8_aarch64+0x3c> // b.any + .long 0x54fffd61 // b.ne 29f0 <_sk_load_a8_aarch64+0x3c> // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020fe2 // dup v2.4h, wzr .long 0x4e0a1d22 // mov v2.h[2], w9 @@ -3044,11 +3121,11 @@ _sk_load_a8_aarch64: .long 0x0e401800 // uzp1 v0.4h, v0.4h, v0.4h .long 0x2e002040 // ext v0.8b, v2.8b, v0.8b, #4 .long 0x2e002002 // ext v2.8b, v0.8b, v0.8b, #4 - .long 0x17ffffe0 // b 28d0 <_sk_load_a8_aarch64+0x3c> + .long 0x17ffffe0 // b 29f0 <_sk_load_a8_aarch64+0x3c> .long 0x39400108 // ldrb w8, [x8] .long 0x0e020fe2 // dup v2.4h, wzr .long 0x4e021d02 // mov v2.h[0], w8 - .long 0x17ffffdc // b 28d0 <_sk_load_a8_aarch64+0x3c> + .long 0x17ffffdc // b 29f0 <_sk_load_a8_aarch64+0x3c> HIDDEN _sk_load_a8_dst_aarch64 .globl _sk_load_a8_dst_aarch64 @@ -3060,7 +3137,7 @@ _sk_load_a8_dst_aarch64: .long 0xb9800908 // ldrsw x8, [x8, #8] .long 0x9b0a2508 // madd x8, x8, x10, x9 .long 0x8b22c108 // add x8, x8, w2, sxtw - .long 0xb50002e4 // cbnz x4, 29d8 <_sk_load_a8_dst_aarch64+0x74> + .long 0xb50002e4 // cbnz x4, 2af8 <_sk_load_a8_dst_aarch64+0x74> .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -3085,12 +3162,12 @@ _sk_load_a8_dst_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2a24 <_sk_load_a8_dst_aarch64+0xc0> // b.none + .long 0x54000220 // b.eq 2b44 <_sk_load_a8_dst_aarch64+0xc0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e406 // movi d6, #0x0 - .long 0x540000c0 // b.eq 2a04 <_sk_load_a8_dst_aarch64+0xa0> // b.none + .long 0x540000c0 // b.eq 2b24 <_sk_load_a8_dst_aarch64+0xa0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 29a0 <_sk_load_a8_dst_aarch64+0x3c> // b.any + .long 0x54fffd61 // b.ne 2ac0 <_sk_load_a8_dst_aarch64+0x3c> // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020fe6 // dup v6.4h, wzr .long 0x4e0a1d26 // mov v6.h[2], w9 @@ -3101,11 +3178,11 @@ _sk_load_a8_dst_aarch64: .long 0x0e401884 // uzp1 v4.4h, v4.4h, v0.4h .long 0x2e0420c4 // ext v4.8b, v6.8b, v4.8b, #4 .long 0x2e042086 // ext v6.8b, v4.8b, v4.8b, #4 - .long 0x17ffffe0 // b 29a0 <_sk_load_a8_dst_aarch64+0x3c> + .long 0x17ffffe0 // b 2ac0 <_sk_load_a8_dst_aarch64+0x3c> .long 0x39400108 // ldrb w8, [x8] .long 0x0e020fe6 // dup v6.4h, wzr .long 0x4e021d06 // mov v6.h[0], w8 - .long 0x17ffffdc // b 29a0 <_sk_load_a8_dst_aarch64+0x3c> + .long 0x17ffffdc // b 2ac0 <_sk_load_a8_dst_aarch64+0x3c> HIDDEN _sk_gather_a8_aarch64 .globl _sk_gather_a8_aarch64 @@ -3157,7 +3234,7 @@ _sk_store_a8_aarch64: .long 0x0e612a10 // xtn v16.4h, v16.4s .long 0x9b0a2508 // madd x8, x8, x10, x9 .long 0x8b22c108 // add x8, x8, w2, sxtw - .long 0xb5000184 // cbnz x4, 2b08 <_sk_store_a8_aarch64+0x5c> + .long 0xb5000184 // cbnz x4, 2c28 <_sk_store_a8_aarch64+0x5c> .long 0x0e0e3e09 // umov w9, v16.h[3] .long 0x0e0a3e0a // umov w10, v16.h[2] .long 0x0e063e0b // umov w11, v16.h[1] @@ -3171,21 +3248,21 @@ _sk_store_a8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000180 // b.eq 2b40 <_sk_store_a8_aarch64+0x94> // b.none + .long 0x54000180 // b.eq 2c60 <_sk_store_a8_aarch64+0x94> // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 2b2c <_sk_store_a8_aarch64+0x80> // b.none + .long 0x540000a0 // b.eq 2c4c <_sk_store_a8_aarch64+0x80> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 2afc <_sk_store_a8_aarch64+0x50> // b.any + .long 0x54fffee1 // b.ne 2c1c <_sk_store_a8_aarch64+0x50> // b.any .long 0x0e0a3e09 // umov w9, v16.h[2] .long 0x39000909 // strb w9, [x8, #2] .long 0x0e023e09 // umov w9, v16.h[0] .long 0x0e063e0a // umov w10, v16.h[1] .long 0x3900050a // strb w10, [x8, #1] .long 0x39000109 // strb w9, [x8] - .long 0x17fffff0 // b 2afc <_sk_store_a8_aarch64+0x50> + .long 0x17fffff0 // b 2c1c <_sk_store_a8_aarch64+0x50> .long 0x0e023e09 // umov w9, v16.h[0] .long 0x39000109 // strb w9, [x8] - .long 0x17ffffed // b 2afc <_sk_store_a8_aarch64+0x50> + .long 0x17ffffed // b 2c1c <_sk_store_a8_aarch64+0x50> HIDDEN _sk_load_g8_aarch64 .globl _sk_load_g8_aarch64 @@ -3197,7 +3274,7 @@ _sk_load_g8_aarch64: .long 0xb9800908 // ldrsw x8, [x8, #8] .long 0x9b0a2508 // madd x8, x8, x10, x9 .long 0x8b22c108 // add x8, x8, w2, sxtw - .long 0xb50002e4 // cbnz x4, 2bc0 <_sk_load_g8_aarch64+0x74> + .long 0xb50002e4 // cbnz x4, 2ce0 <_sk_load_g8_aarch64+0x74> .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -3222,12 +3299,12 @@ _sk_load_g8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2c0c <_sk_load_g8_aarch64+0xc0> // b.none + .long 0x54000220 // b.eq 2d2c <_sk_load_g8_aarch64+0xc0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e400 // movi d0, #0x0 - .long 0x540000c0 // b.eq 2bec <_sk_load_g8_aarch64+0xa0> // b.none + .long 0x540000c0 // b.eq 2d0c <_sk_load_g8_aarch64+0xa0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 2b88 <_sk_load_g8_aarch64+0x3c> // b.any + .long 0x54fffd61 // b.ne 2ca8 <_sk_load_g8_aarch64+0x3c> // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020fe0 // dup v0.4h, wzr .long 0x4e0a1d20 // mov v0.h[2], w9 @@ -3238,11 +3315,11 @@ _sk_load_g8_aarch64: .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4 .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4 - .long 0x17ffffe0 // b 2b88 <_sk_load_g8_aarch64+0x3c> + .long 0x17ffffe0 // b 2ca8 <_sk_load_g8_aarch64+0x3c> .long 0x39400108 // ldrb w8, [x8] .long 0x0e020fe0 // dup v0.4h, wzr .long 0x4e021d00 // mov v0.h[0], w8 - .long 0x17ffffdc // b 2b88 <_sk_load_g8_aarch64+0x3c> + .long 0x17ffffdc // b 2ca8 <_sk_load_g8_aarch64+0x3c> HIDDEN _sk_load_g8_dst_aarch64 .globl _sk_load_g8_dst_aarch64 @@ -3254,7 +3331,7 @@ _sk_load_g8_dst_aarch64: .long 0xb9800908 // ldrsw x8, [x8, #8] .long 0x9b0a2508 // madd x8, x8, x10, x9 .long 0x8b22c108 // add x8, x8, w2, sxtw - .long 0xb50002e4 // cbnz x4, 2c90 <_sk_load_g8_dst_aarch64+0x74> + .long 0xb50002e4 // cbnz x4, 2db0 <_sk_load_g8_dst_aarch64+0x74> .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -3279,12 +3356,12 @@ _sk_load_g8_dst_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2cdc <_sk_load_g8_dst_aarch64+0xc0> // b.none + .long 0x54000220 // b.eq 2dfc <_sk_load_g8_dst_aarch64+0xc0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e404 // movi d4, #0x0 - .long 0x540000c0 // b.eq 2cbc <_sk_load_g8_dst_aarch64+0xa0> // b.none + .long 0x540000c0 // b.eq 2ddc <_sk_load_g8_dst_aarch64+0xa0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 2c58 <_sk_load_g8_dst_aarch64+0x3c> // b.any + .long 0x54fffd61 // b.ne 2d78 <_sk_load_g8_dst_aarch64+0x3c> // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020fe4 // dup v4.4h, wzr .long 0x4e0a1d24 // mov v4.h[2], w9 @@ -3295,11 +3372,11 @@ _sk_load_g8_dst_aarch64: .long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h .long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4 .long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4 - .long 0x17ffffe0 // b 2c58 <_sk_load_g8_dst_aarch64+0x3c> + .long 0x17ffffe0 // b 2d78 <_sk_load_g8_dst_aarch64+0x3c> .long 0x39400108 // ldrb w8, [x8] .long 0x0e020fe4 // dup v4.4h, wzr .long 0x4e021d04 // mov v4.h[0], w8 - .long 0x17ffffdc // b 2c58 <_sk_load_g8_dst_aarch64+0x3c> + .long 0x17ffffdc // b 2d78 <_sk_load_g8_dst_aarch64+0x3c> HIDDEN _sk_gather_g8_aarch64 .globl _sk_gather_g8_aarch64 @@ -3347,7 +3424,7 @@ _sk_load_565_aarch64: .long 0x8b29c508 // add x8, x8, w9, sxtw #1 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897d08 // add x8, x8, x9, asr #31 - .long 0xb50003c4 // cbnz x4, 2df8 <_sk_load_565_aarch64+0x94> + .long 0xb50003c4 // cbnz x4, 2f18 <_sk_load_565_aarch64+0x94> .long 0xfd400100 // ldr d0, [x8] .long 0x321b17e8 // orr w8, wzr, #0x7e0 .long 0x4e040d02 // dup v2.4s, w8 @@ -3379,12 +3456,12 @@ _sk_load_565_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2e44 <_sk_load_565_aarch64+0xe0> // b.none + .long 0x54000220 // b.eq 2f64 <_sk_load_565_aarch64+0xe0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e400 // movi d0, #0x0 - .long 0x540000c0 // b.eq 2e24 <_sk_load_565_aarch64+0xc0> // b.none + .long 0x540000c0 // b.eq 2f44 <_sk_load_565_aarch64+0xc0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffba1 // b.ne 2d88 <_sk_load_565_aarch64+0x24> // b.any + .long 0x54fffba1 // b.ne 2ea8 <_sk_load_565_aarch64+0x24> // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d405120 // ld1 {v0.h}[2], [x9] @@ -3395,10 +3472,10 @@ _sk_load_565_aarch64: .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4 .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4 - .long 0x17ffffd2 // b 2d88 <_sk_load_565_aarch64+0x24> + .long 0x17ffffd2 // b 2ea8 <_sk_load_565_aarch64+0x24> .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d404100 // ld1 {v0.h}[0], [x8] - .long 0x17ffffcf // b 2d88 <_sk_load_565_aarch64+0x24> + .long 0x17ffffcf // b 2ea8 <_sk_load_565_aarch64+0x24> HIDDEN _sk_load_565_dst_aarch64 .globl _sk_load_565_dst_aarch64 @@ -3411,7 +3488,7 @@ _sk_load_565_dst_aarch64: .long 0x8b29c508 // add x8, x8, w9, sxtw #1 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897d08 // add x8, x8, x9, asr #31 - .long 0xb50003c4 // cbnz x4, 2ee4 <_sk_load_565_dst_aarch64+0x94> + .long 0xb50003c4 // cbnz x4, 3004 <_sk_load_565_dst_aarch64+0x94> .long 0xfd400104 // ldr d4, [x8] .long 0x321b17e8 // orr w8, wzr, #0x7e0 .long 0x4e040d06 // dup v6.4s, w8 @@ -3443,12 +3520,12 @@ _sk_load_565_dst_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2f30 <_sk_load_565_dst_aarch64+0xe0> // b.none + .long 0x54000220 // b.eq 3050 <_sk_load_565_dst_aarch64+0xe0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e404 // movi d4, #0x0 - .long 0x540000c0 // b.eq 2f10 <_sk_load_565_dst_aarch64+0xc0> // b.none + .long 0x540000c0 // b.eq 3030 <_sk_load_565_dst_aarch64+0xc0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffba1 // b.ne 2e74 <_sk_load_565_dst_aarch64+0x24> // b.any + .long 0x54fffba1 // b.ne 2f94 <_sk_load_565_dst_aarch64+0x24> // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020fe4 // dup v4.4h, wzr .long 0x0d405124 // ld1 {v4.h}[2], [x9] @@ -3459,10 +3536,10 @@ _sk_load_565_dst_aarch64: .long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h .long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4 .long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4 - .long 0x17ffffd2 // b 2e74 <_sk_load_565_dst_aarch64+0x24> + .long 0x17ffffd2 // b 2f94 <_sk_load_565_dst_aarch64+0x24> .long 0x0e020fe4 // dup v4.4h, wzr .long 0x0d404104 // ld1 {v4.h}[0], [x8] - .long 0x17ffffcf // b 2e74 <_sk_load_565_dst_aarch64+0x24> + .long 0x17ffffcf // b 2f94 <_sk_load_565_dst_aarch64+0x24> HIDDEN _sk_gather_565_aarch64 .globl _sk_gather_565_aarch64 @@ -3538,24 +3615,24 @@ _sk_store_565_aarch64: .long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b .long 0x8b897d08 // add x8, x8, x9, asr #31 .long 0x0e612a10 // xtn v16.4h, v16.4s - .long 0xb50000a4 // cbnz x4, 3054 <_sk_store_565_aarch64+0x68> + .long 0xb50000a4 // cbnz x4, 3174 <_sk_store_565_aarch64+0x68> .long 0xfd000110 // str d16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000120 // b.eq 3080 <_sk_store_565_aarch64+0x94> // b.none + .long 0x54000120 // b.eq 31a0 <_sk_store_565_aarch64+0x94> // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 3078 <_sk_store_565_aarch64+0x8c> // b.none + .long 0x540000a0 // b.eq 3198 <_sk_store_565_aarch64+0x8c> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 3048 <_sk_store_565_aarch64+0x5c> // b.any + .long 0x54fffee1 // b.ne 3168 <_sk_store_565_aarch64+0x5c> // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0d005130 // st1 {v16.h}[2], [x9] .long 0x91000909 // add x9, x8, #0x2 .long 0x0d004930 // st1 {v16.h}[1], [x9] .long 0x0d004110 // st1 {v16.h}[0], [x8] - .long 0x17fffff1 // b 3048 <_sk_store_565_aarch64+0x5c> + .long 0x17fffff1 // b 3168 <_sk_store_565_aarch64+0x5c> HIDDEN _sk_load_4444_aarch64 .globl _sk_load_4444_aarch64 @@ -3568,7 +3645,7 @@ _sk_load_4444_aarch64: .long 0x8b29c508 // add x8, x8, w9, sxtw #1 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897d08 // add x8, x8, x9, asr #31 - .long 0xb5000444 // cbnz x4, 312c <_sk_load_4444_aarch64+0xa4> + .long 0xb5000444 // cbnz x4, 324c <_sk_load_4444_aarch64+0xa4> .long 0xfd400100 // ldr d0, [x8] .long 0x52a6f108 // mov w8, #0x37880000 .long 0x2f10a400 // uxtl v0.4s, v0.4h @@ -3604,12 +3681,12 @@ _sk_load_4444_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 3178 <_sk_load_4444_aarch64+0xf0> // b.none + .long 0x54000220 // b.eq 3298 <_sk_load_4444_aarch64+0xf0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e400 // movi d0, #0x0 - .long 0x540000c0 // b.eq 3158 <_sk_load_4444_aarch64+0xd0> // b.none + .long 0x540000c0 // b.eq 3278 <_sk_load_4444_aarch64+0xd0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffb21 // b.ne 30ac <_sk_load_4444_aarch64+0x24> // b.any + .long 0x54fffb21 // b.ne 31cc <_sk_load_4444_aarch64+0x24> // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d405120 // ld1 {v0.h}[2], [x9] @@ -3620,10 +3697,10 @@ _sk_load_4444_aarch64: .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4 .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4 - .long 0x17ffffce // b 30ac <_sk_load_4444_aarch64+0x24> + .long 0x17ffffce // b 31cc <_sk_load_4444_aarch64+0x24> .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d404100 // ld1 {v0.h}[0], [x8] - .long 0x17ffffcb // b 30ac <_sk_load_4444_aarch64+0x24> + .long 0x17ffffcb // b 31cc <_sk_load_4444_aarch64+0x24> HIDDEN _sk_load_4444_dst_aarch64 .globl _sk_load_4444_dst_aarch64 @@ -3636,7 +3713,7 @@ _sk_load_4444_dst_aarch64: .long 0x8b29c508 // add x8, x8, w9, sxtw #1 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897d08 // add x8, x8, x9, asr #31 - .long 0xb5000444 // cbnz x4, 3228 <_sk_load_4444_dst_aarch64+0xa4> + .long 0xb5000444 // cbnz x4, 3348 <_sk_load_4444_dst_aarch64+0xa4> .long 0xfd400104 // ldr d4, [x8] .long 0x52a6f108 // mov w8, #0x37880000 .long 0x2f10a484 // uxtl v4.4s, v4.4h @@ -3672,12 +3749,12 @@ _sk_load_4444_dst_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 3274 <_sk_load_4444_dst_aarch64+0xf0> // b.none + .long 0x54000220 // b.eq 3394 <_sk_load_4444_dst_aarch64+0xf0> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e404 // movi d4, #0x0 - .long 0x540000c0 // b.eq 3254 <_sk_load_4444_dst_aarch64+0xd0> // b.none + .long 0x540000c0 // b.eq 3374 <_sk_load_4444_dst_aarch64+0xd0> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffb21 // b.ne 31a8 <_sk_load_4444_dst_aarch64+0x24> // b.any + .long 0x54fffb21 // b.ne 32c8 <_sk_load_4444_dst_aarch64+0x24> // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020fe4 // dup v4.4h, wzr .long 0x0d405124 // ld1 {v4.h}[2], [x9] @@ -3688,10 +3765,10 @@ _sk_load_4444_dst_aarch64: .long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h .long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4 .long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4 - .long 0x17ffffce // b 31a8 <_sk_load_4444_dst_aarch64+0x24> + .long 0x17ffffce // b 32c8 <_sk_load_4444_dst_aarch64+0x24> .long 0x0e020fe4 // dup v4.4h, wzr .long 0x0d404104 // ld1 {v4.h}[0], [x8] - .long 0x17ffffcb // b 31a8 <_sk_load_4444_dst_aarch64+0x24> + .long 0x17ffffcb // b 32c8 <_sk_load_4444_dst_aarch64+0x24> HIDDEN _sk_gather_4444_aarch64 .globl _sk_gather_4444_aarch64 @@ -3774,24 +3851,24 @@ _sk_store_4444_aarch64: .long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b .long 0x8b897d08 // add x8, x8, x9, asr #31 .long 0x0e612a10 // xtn v16.4h, v16.4s - .long 0xb50000a4 // cbnz x4, 33b4 <_sk_store_4444_aarch64+0x70> + .long 0xb50000a4 // cbnz x4, 34d4 <_sk_store_4444_aarch64+0x70> .long 0xfd000110 // str d16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000120 // b.eq 33e0 <_sk_store_4444_aarch64+0x9c> // b.none + .long 0x54000120 // b.eq 3500 <_sk_store_4444_aarch64+0x9c> // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 33d8 <_sk_store_4444_aarch64+0x94> // b.none + .long 0x540000a0 // b.eq 34f8 <_sk_store_4444_aarch64+0x94> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 33a8 <_sk_store_4444_aarch64+0x64> // b.any + .long 0x54fffee1 // b.ne 34c8 <_sk_store_4444_aarch64+0x64> // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0d005130 // st1 {v16.h}[2], [x9] .long 0x91000909 // add x9, x8, #0x2 .long 0x0d004930 // st1 {v16.h}[1], [x9] .long 0x0d004110 // st1 {v16.h}[0], [x8] - .long 0x17fffff1 // b 33a8 <_sk_store_4444_aarch64+0x64> + .long 0x17fffff1 // b 34c8 <_sk_store_4444_aarch64+0x64> HIDDEN _sk_load_8888_aarch64 .globl _sk_load_8888_aarch64 @@ -3804,7 +3881,7 @@ _sk_load_8888_aarch64: .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897908 // add x8, x8, x9, asr #30 - .long 0xb50002e4 // cbnz x4, 3460 <_sk_load_8888_aarch64+0x78> + .long 0xb50002e4 // cbnz x4, 3580 <_sk_load_8888_aarch64+0x78> .long 0x3dc00100 // ldr q0, [x8] .long 0x6f00e621 // movi v1.2d, #0xff000000ff .long 0x52a77008 // mov w8, #0x3b800000 @@ -3829,22 +3906,22 @@ _sk_load_8888_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x540001a0 // b.eq 349c <_sk_load_8888_aarch64+0xb4> // b.none + .long 0x540001a0 // b.eq 35bc <_sk_load_8888_aarch64+0xb4> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x6f00e400 // movi v0.2d, #0x0 - .long 0x540000c0 // b.eq 348c <_sk_load_8888_aarch64+0xa4> // b.none + .long 0x540000c0 // b.eq 35ac <_sk_load_8888_aarch64+0xa4> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffc81 // b.ne 340c <_sk_load_8888_aarch64+0x24> // b.any + .long 0x54fffc81 // b.ne 352c <_sk_load_8888_aarch64+0x24> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4e040fe0 // dup v0.4s, wzr .long 0x4d408120 // ld1 {v0.s}[2], [x9] .long 0xfd400101 // ldr d1, [x8] .long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8 .long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8 - .long 0x17ffffdd // b 340c <_sk_load_8888_aarch64+0x24> + .long 0x17ffffdd // b 352c <_sk_load_8888_aarch64+0x24> .long 0x4e040fe0 // dup v0.4s, wzr .long 0x0d408100 // ld1 {v0.s}[0], [x8] - .long 0x17ffffda // b 340c <_sk_load_8888_aarch64+0x24> + .long 0x17ffffda // b 352c <_sk_load_8888_aarch64+0x24> HIDDEN _sk_load_8888_dst_aarch64 .globl _sk_load_8888_dst_aarch64 @@ -3857,7 +3934,7 @@ _sk_load_8888_dst_aarch64: .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897908 // add x8, x8, x9, asr #30 - .long 0xb50002e4 // cbnz x4, 3520 <_sk_load_8888_dst_aarch64+0x78> + .long 0xb50002e4 // cbnz x4, 3640 <_sk_load_8888_dst_aarch64+0x78> .long 0x3dc00104 // ldr q4, [x8] .long 0x6f00e625 // movi v5.2d, #0xff000000ff .long 0x52a77008 // mov w8, #0x3b800000 @@ -3882,22 +3959,22 @@ _sk_load_8888_dst_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x540001a0 // b.eq 355c <_sk_load_8888_dst_aarch64+0xb4> // b.none + .long 0x540001a0 // b.eq 367c <_sk_load_8888_dst_aarch64+0xb4> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x6f00e404 // movi v4.2d, #0x0 - .long 0x540000c0 // b.eq 354c <_sk_load_8888_dst_aarch64+0xa4> // b.none + .long 0x540000c0 // b.eq 366c <_sk_load_8888_dst_aarch64+0xa4> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffc81 // b.ne 34cc <_sk_load_8888_dst_aarch64+0x24> // b.any + .long 0x54fffc81 // b.ne 35ec <_sk_load_8888_dst_aarch64+0x24> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4e040fe4 // dup v4.4s, wzr .long 0x4d408124 // ld1 {v4.s}[2], [x9] .long 0xfd400105 // ldr d5, [x8] .long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8 .long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8 - .long 0x17ffffdd // b 34cc <_sk_load_8888_dst_aarch64+0x24> + .long 0x17ffffdd // b 35ec <_sk_load_8888_dst_aarch64+0x24> .long 0x4e040fe4 // dup v4.4s, wzr .long 0x0d408104 // ld1 {v4.s}[0], [x8] - .long 0x17ffffda // b 34cc <_sk_load_8888_dst_aarch64+0x24> + .long 0x17ffffda // b 35ec <_sk_load_8888_dst_aarch64+0x24> HIDDEN _sk_gather_8888_aarch64 .globl _sk_gather_8888_aarch64 @@ -3969,24 +4046,24 @@ _sk_store_8888_aarch64: .long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b .long 0x8b897908 // add x8, x8, x9, asr #30 .long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b - .long 0xb50000a4 // cbnz x4, 3670 <_sk_store_8888_aarch64+0x70> + .long 0xb50000a4 // cbnz x4, 3790 <_sk_store_8888_aarch64+0x70> .long 0x3d800110 // str q16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000120 // b.eq 369c <_sk_store_8888_aarch64+0x9c> // b.none + .long 0x54000120 // b.eq 37bc <_sk_store_8888_aarch64+0x9c> // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 3694 <_sk_store_8888_aarch64+0x94> // b.none + .long 0x540000a0 // b.eq 37b4 <_sk_store_8888_aarch64+0x94> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 3664 <_sk_store_8888_aarch64+0x64> // b.any + .long 0x54fffee1 // b.ne 3784 <_sk_store_8888_aarch64+0x64> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4d008130 // st1 {v16.s}[2], [x9] .long 0xfd000110 // str d16, [x8] - .long 0x17fffff3 // b 3664 <_sk_store_8888_aarch64+0x64> + .long 0x17fffff3 // b 3784 <_sk_store_8888_aarch64+0x64> .long 0x0d008110 // st1 {v16.s}[0], [x8] - .long 0x17fffff1 // b 3664 <_sk_store_8888_aarch64+0x64> + .long 0x17fffff1 // b 3784 <_sk_store_8888_aarch64+0x64> HIDDEN _sk_load_bgra_aarch64 .globl _sk_load_bgra_aarch64 @@ -3999,7 +4076,7 @@ _sk_load_bgra_aarch64: .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897908 // add x8, x8, x9, asr #30 - .long 0xb50002e4 // cbnz x4, 371c <_sk_load_bgra_aarch64+0x78> + .long 0xb50002e4 // cbnz x4, 383c <_sk_load_bgra_aarch64+0x78> .long 0x3dc00100 // ldr q0, [x8] .long 0x6f00e621 // movi v1.2d, #0xff000000ff .long 0x52a77008 // mov w8, #0x3b800000 @@ -4024,22 +4101,22 @@ _sk_load_bgra_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x540001a0 // b.eq 3758 <_sk_load_bgra_aarch64+0xb4> // b.none + .long 0x540001a0 // b.eq 3878 <_sk_load_bgra_aarch64+0xb4> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x6f00e400 // movi v0.2d, #0x0 - .long 0x540000c0 // b.eq 3748 <_sk_load_bgra_aarch64+0xa4> // b.none + .long 0x540000c0 // b.eq 3868 <_sk_load_bgra_aarch64+0xa4> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffc81 // b.ne 36c8 <_sk_load_bgra_aarch64+0x24> // b.any + .long 0x54fffc81 // b.ne 37e8 <_sk_load_bgra_aarch64+0x24> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4e040fe0 // dup v0.4s, wzr .long 0x4d408120 // ld1 {v0.s}[2], [x9] .long 0xfd400101 // ldr d1, [x8] .long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8 .long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8 - .long 0x17ffffdd // b 36c8 <_sk_load_bgra_aarch64+0x24> + .long 0x17ffffdd // b 37e8 <_sk_load_bgra_aarch64+0x24> .long 0x4e040fe0 // dup v0.4s, wzr .long 0x0d408100 // ld1 {v0.s}[0], [x8] - .long 0x17ffffda // b 36c8 <_sk_load_bgra_aarch64+0x24> + .long 0x17ffffda // b 37e8 <_sk_load_bgra_aarch64+0x24> HIDDEN _sk_load_bgra_dst_aarch64 .globl _sk_load_bgra_dst_aarch64 @@ -4052,7 +4129,7 @@ _sk_load_bgra_dst_aarch64: .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897908 // add x8, x8, x9, asr #30 - .long 0xb50002e4 // cbnz x4, 37dc <_sk_load_bgra_dst_aarch64+0x78> + .long 0xb50002e4 // cbnz x4, 38fc <_sk_load_bgra_dst_aarch64+0x78> .long 0x3dc00104 // ldr q4, [x8] .long 0x6f00e625 // movi v5.2d, #0xff000000ff .long 0x52a77008 // mov w8, #0x3b800000 @@ -4077,22 +4154,22 @@ _sk_load_bgra_dst_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x540001a0 // b.eq 3818 <_sk_load_bgra_dst_aarch64+0xb4> // b.none + .long 0x540001a0 // b.eq 3938 <_sk_load_bgra_dst_aarch64+0xb4> // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x6f00e404 // movi v4.2d, #0x0 - .long 0x540000c0 // b.eq 3808 <_sk_load_bgra_dst_aarch64+0xa4> // b.none + .long 0x540000c0 // b.eq 3928 <_sk_load_bgra_dst_aarch64+0xa4> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffc81 // b.ne 3788 <_sk_load_bgra_dst_aarch64+0x24> // b.any + .long 0x54fffc81 // b.ne 38a8 <_sk_load_bgra_dst_aarch64+0x24> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4e040fe4 // dup v4.4s, wzr .long 0x4d408124 // ld1 {v4.s}[2], [x9] .long 0xfd400105 // ldr d5, [x8] .long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8 .long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8 - .long 0x17ffffdd // b 3788 <_sk_load_bgra_dst_aarch64+0x24> + .long 0x17ffffdd // b 38a8 <_sk_load_bgra_dst_aarch64+0x24> .long 0x4e040fe4 // dup v4.4s, wzr .long 0x0d408104 // ld1 {v4.s}[0], [x8] - .long 0x17ffffda // b 3788 <_sk_load_bgra_dst_aarch64+0x24> + .long 0x17ffffda // b 38a8 <_sk_load_bgra_dst_aarch64+0x24> HIDDEN _sk_gather_bgra_aarch64 .globl _sk_gather_bgra_aarch64 @@ -4164,24 +4241,24 @@ _sk_store_bgra_aarch64: .long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b .long 0x8b897908 // add x8, x8, x9, asr #30 .long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b - .long 0xb50000a4 // cbnz x4, 392c <_sk_store_bgra_aarch64+0x70> + .long 0xb50000a4 // cbnz x4, 3a4c <_sk_store_bgra_aarch64+0x70> .long 0x3d800110 // str q16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000120 // b.eq 3958 <_sk_store_bgra_aarch64+0x9c> // b.none + .long 0x54000120 // b.eq 3a78 <_sk_store_bgra_aarch64+0x9c> // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 3950 <_sk_store_bgra_aarch64+0x94> // b.none + .long 0x540000a0 // b.eq 3a70 <_sk_store_bgra_aarch64+0x94> // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 3920 <_sk_store_bgra_aarch64+0x64> // b.any + .long 0x54fffee1 // b.ne 3a40 <_sk_store_bgra_aarch64+0x64> // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4d008130 // st1 {v16.s}[2], [x9] .long 0xfd000110 // str d16, [x8] - .long 0x17fffff3 // b 3920 <_sk_store_bgra_aarch64+0x64> + .long 0x17fffff3 // b 3a40 <_sk_store_bgra_aarch64+0x64> .long 0x0d008110 // st1 {v16.s}[0], [x8] - .long 0x17fffff1 // b 3920 <_sk_store_bgra_aarch64+0x64> + .long 0x17fffff1 // b 3a40 <_sk_store_bgra_aarch64+0x64> HIDDEN _sk_load_f16_aarch64 .globl _sk_load_f16_aarch64 @@ -4194,7 +4271,7 @@ _sk_load_f16_aarch64: .long 0x8b29cd08 // add x8, x8, w9, sxtw #3 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897508 // add x8, x8, x9, asr #29 - .long 0xb5000124 // cbnz x4, 39a0 <_sk_load_f16_aarch64+0x40> + .long 0xb5000124 // cbnz x4, 3ac0 <_sk_load_f16_aarch64+0x40> .long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x0e217a00 // fcvtl v0.4s, v16.4h @@ -4205,14 +4282,14 @@ _sk_load_f16_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fffee0 // b.eq 3984 <_sk_load_f16_aarch64+0x24> // b.none + .long 0x54fffee0 // b.eq 3aa4 <_sk_load_f16_aarch64+0x24> // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffe63 // b.cc 3984 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last + .long 0x54fffe63 // b.cc 3aa4 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8] - .long 0x17fffff0 // b 3984 <_sk_load_f16_aarch64+0x24> + .long 0x17fffff0 // b 3aa4 <_sk_load_f16_aarch64+0x24> HIDDEN _sk_load_f16_dst_aarch64 .globl _sk_load_f16_dst_aarch64 @@ -4225,7 +4302,7 @@ _sk_load_f16_dst_aarch64: .long 0x8b29cd08 // add x8, x8, w9, sxtw #3 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897508 // add x8, x8, x9, asr #29 - .long 0xb5000124 // cbnz x4, 3a08 <_sk_load_f16_dst_aarch64+0x40> + .long 0xb5000124 // cbnz x4, 3b28 <_sk_load_f16_dst_aarch64+0x40> .long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x0e217a04 // fcvtl v4.4s, v16.4h @@ -4236,14 +4313,14 @@ _sk_load_f16_dst_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fffee0 // b.eq 39ec <_sk_load_f16_dst_aarch64+0x24> // b.none + .long 0x54fffee0 // b.eq 3b0c <_sk_load_f16_dst_aarch64+0x24> // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffe63 // b.cc 39ec <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last + .long 0x54fffe63 // b.cc 3b0c <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8] - .long 0x17fffff0 // b 39ec <_sk_load_f16_dst_aarch64+0x24> + .long 0x17fffff0 // b 3b0c <_sk_load_f16_dst_aarch64+0x24> HIDDEN _sk_gather_f16_aarch64 .globl _sk_gather_f16_aarch64 @@ -4301,21 +4378,21 @@ _sk_store_f16_aarch64: .long 0x8b29cd08 // add x8, x8, w9, sxtw #3 .long 0xd3607c49 // lsl x9, x2, #32 .long 0x8b897508 // add x8, x8, x9, asr #29 - .long 0xb50000a4 // cbnz x4, 3b00 <_sk_store_f16_aarch64+0x40> + .long 0xb50000a4 // cbnz x4, 3c20 <_sk_store_f16_aarch64+0x40> .long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0xf100049f // cmp x4, #0x1 .long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8] - .long 0x54ffff60 // b.eq 3af4 <_sk_store_f16_aarch64+0x34> // b.none + .long 0x54ffff60 // b.eq 3c14 <_sk_store_f16_aarch64+0x34> // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0xf1000c9f // cmp x4, #0x3 .long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9] - .long 0x54fffee3 // b.cc 3af4 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 3c14 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8] - .long 0x17fffff4 // b 3af4 <_sk_store_f16_aarch64+0x34> + .long 0x17fffff4 // b 3c14 <_sk_store_f16_aarch64+0x34> HIDDEN _sk_load_u16_be_aarch64 .globl _sk_load_u16_be_aarch64 @@ -4328,7 +4405,7 @@ _sk_load_u16_be_aarch64: .long 0x1b037d29 // mul w9, w9, w3 .long 0x8b29c508 // add x8, x8, w9, sxtw #1 .long 0x8b2ac508 // add x8, x8, w10, sxtw #1 - .long 0xb5000404 // cbnz x4, 3bc4 <_sk_load_u16_be_aarch64+0x9c> + .long 0xb5000404 // cbnz x4, 3ce4 <_sk_load_u16_be_aarch64+0x9c> .long 0x0c400500 // ld4 {v0.4h-v3.4h}, [x8] .long 0x0f185410 // shl v16.4h, v0.4h, #8 .long 0x2f180411 // ushr v17.4h, v0.4h, #8 @@ -4362,14 +4439,14 @@ _sk_load_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d606100 // ld4 {v0.h-v3.h}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fffc00 // b.eq 3b4c <_sk_load_u16_be_aarch64+0x24> // b.none + .long 0x54fffc00 // b.eq 3c6c <_sk_load_u16_be_aarch64+0x24> // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0x0d606920 // ld4 {v0.h-v3.h}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffb83 // b.cc 3b4c <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last + .long 0x54fffb83 // b.cc 3c6c <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d607100 // ld4 {v0.h-v3.h}[2], [x8] - .long 0x17ffffd9 // b 3b4c <_sk_load_u16_be_aarch64+0x24> + .long 0x17ffffd9 // b 3c6c <_sk_load_u16_be_aarch64+0x24> HIDDEN _sk_load_rgb_u16_be_aarch64 .globl _sk_load_rgb_u16_be_aarch64 @@ -4383,7 +4460,7 @@ _sk_load_rgb_u16_be_aarch64: .long 0x0b020449 // add w9, w2, w2, lsl #1 .long 0xd3607d29 // lsl x9, x9, #32 .long 0x8b897d08 // add x8, x8, x9, asr #31 - .long 0xb5000384 // cbnz x4, 3c7c <_sk_load_rgb_u16_be_aarch64+0x90> + .long 0xb5000384 // cbnz x4, 3d9c <_sk_load_rgb_u16_be_aarch64+0x90> .long 0x0c404500 // ld3 {v0.4h-v2.4h}, [x8] .long 0x0f185403 // shl v3.4h, v0.4h, #8 .long 0x2f180410 // ushr v16.4h, v0.4h, #8 @@ -4413,14 +4490,14 @@ _sk_load_rgb_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d406100 // ld3 {v0.h-v2.h}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fffc80 // b.eq 3c14 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none + .long 0x54fffc80 // b.eq 3d34 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none .long 0x91001909 // add x9, x8, #0x6 .long 0x0d406920 // ld3 {v0.h-v2.h}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffc03 // b.cc 3c14 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last + .long 0x54fffc03 // b.cc 3d34 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last .long 0x91003108 // add x8, x8, #0xc .long 0x0d407100 // ld3 {v0.h-v2.h}[2], [x8] - .long 0x17ffffdd // b 3c14 <_sk_load_rgb_u16_be_aarch64+0x28> + .long 0x17ffffdd // b 3d34 <_sk_load_rgb_u16_be_aarch64+0x28> HIDDEN _sk_store_u16_be_aarch64 .globl _sk_store_u16_be_aarch64 @@ -4460,21 +4537,21 @@ _sk_store_u16_be_aarch64: .long 0x8b28c548 // add x8, x10, w8, sxtw #1 .long 0x8b29c508 // add x8, x8, w9, sxtw #1 .long 0x0eb41eb3 // orr v19.8b, v21.8b, v20.8b - .long 0xb50000a4 // cbnz x4, 3d40 <_sk_store_u16_be_aarch64+0x9c> + .long 0xb50000a4 // cbnz x4, 3e60 <_sk_store_u16_be_aarch64+0x9c> .long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0xf100049f // cmp x4, #0x1 .long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8] - .long 0x54ffff60 // b.eq 3d34 <_sk_store_u16_be_aarch64+0x90> // b.none + .long 0x54ffff60 // b.eq 3e54 <_sk_store_u16_be_aarch64+0x90> // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0xf1000c9f // cmp x4, #0x3 .long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9] - .long 0x54fffee3 // b.cc 3d34 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 3e54 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8] - .long 0x17fffff4 // b 3d34 <_sk_store_u16_be_aarch64+0x90> + .long 0x17fffff4 // b 3e54 <_sk_store_u16_be_aarch64+0x90> HIDDEN _sk_load_f32_aarch64 .globl _sk_load_f32_aarch64 @@ -4487,21 +4564,21 @@ _sk_load_f32_aarch64: .long 0x1b037d29 // mul w9, w9, w3 .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0x8b2ac908 // add x8, x8, w10, sxtw #2 - .long 0xb50000a4 // cbnz x4, 3d98 <_sk_load_f32_aarch64+0x30> + .long 0xb50000a4 // cbnz x4, 3eb8 <_sk_load_f32_aarch64+0x30> .long 0x4c400900 // ld4 {v0.4s-v3.4s}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x0d60a100 // ld4 {v0.s-v3.s}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54ffff60 // b.eq 3d8c <_sk_load_f32_aarch64+0x24> // b.none + .long 0x54ffff60 // b.eq 3eac <_sk_load_f32_aarch64+0x24> // b.none .long 0x91004109 // add x9, x8, #0x10 .long 0x0d60b120 // ld4 {v0.s-v3.s}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffee3 // b.cc 3d8c <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 3eac <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last .long 0x91008108 // add x8, x8, #0x20 .long 0x4d60a100 // ld4 {v0.s-v3.s}[2], [x8] - .long 0x17fffff4 // b 3d8c <_sk_load_f32_aarch64+0x24> + .long 0x17fffff4 // b 3eac <_sk_load_f32_aarch64+0x24> HIDDEN _sk_load_f32_dst_aarch64 .globl _sk_load_f32_dst_aarch64 @@ -4514,21 +4591,21 @@ _sk_load_f32_dst_aarch64: .long 0x1b037d29 // mul w9, w9, w3 .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0x8b2ac908 // add x8, x8, w10, sxtw #2 - .long 0xb50000a4 // cbnz x4, 3df0 <_sk_load_f32_dst_aarch64+0x30> + .long 0xb50000a4 // cbnz x4, 3f10 <_sk_load_f32_dst_aarch64+0x30> .long 0x4c400904 // ld4 {v4.4s-v7.4s}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x0d60a104 // ld4 {v4.s-v7.s}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54ffff60 // b.eq 3de4 <_sk_load_f32_dst_aarch64+0x24> // b.none + .long 0x54ffff60 // b.eq 3f04 <_sk_load_f32_dst_aarch64+0x24> // b.none .long 0x91004109 // add x9, x8, #0x10 .long 0x0d60b124 // ld4 {v4.s-v7.s}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffee3 // b.cc 3de4 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 3f04 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last .long 0x91008108 // add x8, x8, #0x20 .long 0x4d60a104 // ld4 {v4.s-v7.s}[2], [x8] - .long 0x17fffff4 // b 3de4 <_sk_load_f32_dst_aarch64+0x24> + .long 0x17fffff4 // b 3f04 <_sk_load_f32_dst_aarch64+0x24> HIDDEN _sk_store_f32_aarch64 .globl _sk_store_f32_aarch64 @@ -4541,21 +4618,21 @@ _sk_store_f32_aarch64: .long 0x1b037d29 // mul w9, w9, w3 .long 0x8b29c908 // add x8, x8, w9, sxtw #2 .long 0x8b2ac908 // add x8, x8, w10, sxtw #2 - .long 0xb50000a4 // cbnz x4, 3e48 <_sk_store_f32_aarch64+0x30> + .long 0xb50000a4 // cbnz x4, 3f68 <_sk_store_f32_aarch64+0x30> .long 0x4c000900 // st4 {v0.4s-v3.4s}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0xf100049f // cmp x4, #0x1 .long 0x0d20a100 // st4 {v0.s-v3.s}[0], [x8] - .long 0x54ffff60 // b.eq 3e3c <_sk_store_f32_aarch64+0x24> // b.none + .long 0x54ffff60 // b.eq 3f5c <_sk_store_f32_aarch64+0x24> // b.none .long 0x91004109 // add x9, x8, #0x10 .long 0xf1000c9f // cmp x4, #0x3 .long 0x0d20b120 // st4 {v0.s-v3.s}[1], [x9] - .long 0x54fffee3 // b.cc 3e3c <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 3f5c <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last .long 0x91008108 // add x8, x8, #0x20 .long 0x4d20a100 // st4 {v0.s-v3.s}[2], [x8] - .long 0x17fffff4 // b 3e3c <_sk_store_f32_aarch64+0x24> + .long 0x17fffff4 // b 3f5c <_sk_store_f32_aarch64+0x24> HIDDEN _sk_clamp_x_aarch64 .globl _sk_clamp_x_aarch64 @@ -5048,7 +5125,7 @@ _sk_gradient_aarch64: .long 0x6f00e411 // movi v17.2d, #0x0 .long 0xf9400109 // ldr x9, [x8] .long 0xf100093f // cmp x9, #0x2 - .long 0x540001c3 // b.cc 44c8 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last + .long 0x540001c3 // b.cc 45e8 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last .long 0xf940250a // ldr x10, [x8, #72] .long 0xd1000529 // sub x9, x9, #0x1 .long 0x6f00e401 // movi v1.2d, #0x0 @@ -5059,7 +5136,7 @@ _sk_gradient_aarch64: .long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s .long 0x4e221c63 // and v3.16b, v3.16b, v2.16b .long 0x4ea18461 // add v1.4s, v3.4s, v1.4s - .long 0xb5ffff69 // cbnz x9, 44a8 <_sk_gradient_aarch64+0x38> + .long 0xb5ffff69 // cbnz x9, 45c8 <_sk_gradient_aarch64+0x38> .long 0x6f20a431 // uxtl2 v17.2d, v1.4s .long 0x2f20a421 // uxtl v1.2d, v1.2s .long 0xa940b10a // ldp x10, x12, [x8, #8] @@ -7865,19 +7942,24 @@ HIDDEN _sk_plus__vfp4 .globl _sk_plus__vfp4 FUNCTION(_sk_plus__vfp4) _sk_plus__vfp4: - .long 0xe2802010 // add r2, r0, #16 - .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128] .long 0xe2802020 // add r2, r0, #32 - .long 0xf2000dc0 // vadd.f32 q0, q8, q0 + .long 0xf2c76f50 // vmov.f32 q11, #1 + .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128] + .long 0xe2802010 // add r2, r0, #16 + .long 0xf2400dc2 // vadd.f32 q8, q8, q1 .long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128] .long 0xe2802030 // add r2, r0, #48 - .long 0xf2022dc2 // vadd.f32 q1, q9, q1 - .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128] + .long 0xf2422dc0 // vadd.f32 q9, q9, q0 + .long 0xf4624aef // vld1.64 {d20-d21}, [r2 :128] .long 0xe2802040 // add r2, r0, #64 - .long 0xf2004dc4 // vadd.f32 q2, q8, q2 - .long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128] - .long 0xf2026dc6 // vadd.f32 q3, q9, q3 + .long 0xf2444dc4 // vadd.f32 q10, q10, q2 + .long 0xf4628aef // vld1.64 {d24-d25}, [r2 :128] + .long 0xf2488dc6 // vadd.f32 q12, q12, q3 .long 0xe4912004 // ldr r2, [r1], #4 + .long 0xf2220fe6 // vmin.f32 q0, q9, q11 + .long 0xf2202fe6 // vmin.f32 q1, q8, q11 + .long 0xf2244fe6 // vmin.f32 q2, q10, q11 + .long 0xf2286fe6 // vmin.f32 q3, q12, q11 .long 0xe12fff12 // bx r2 HIDDEN _sk_screen_vfp4 @@ -8506,7 +8588,6 @@ _sk_softlight_vfp4: .long 0xecbd8b10 // vpop {d8-d15} .long 0xe8bd0030 // pop {r4, r5} .long 0xe12fff12 // bx r2 - .long 0xe320f000 // nop {0} HIDDEN _sk_hue_vfp4 .globl _sk_hue_vfp4 @@ -9280,7 +9361,7 @@ _sk_srcover_rgba_8888_vfp4: .long 0xe0842102 // add r2, r4, r2, lsl #2 .long 0xe2804020 // add r4, r0, #32 .long 0xe0822106 // add r2, r2, r6, lsl #2 - .long 0x1a000032 // bne 1b88 <sk_srcover_rgba_8888_vfp4+0x110> + .long 0x1a000032 // bne 1b98 <sk_srcover_rgba_8888_vfp4+0x110> .long 0xf4620a8f // vld1.32 {d16-d17}, [r2] .long 0xf3c7405f // vmov.i32 q10, #255 .long 0xe28f6f51 // add r6, pc, #324 @@ -9325,7 +9406,7 @@ _sk_srcover_rgba_8888_vfp4: .long 0xf2f0c57c // vshl.s32 q14, q14, #16 .long 0xf26e01f4 // vorr q8, q15, q10 .long 0xf26001fc // vorr q8, q8, q14 - .long 0x1a000015 // bne 1bc8 <sk_srcover_rgba_8888_vfp4+0x150> + .long 0x1a000015 // bne 1bd8 <sk_srcover_rgba_8888_vfp4+0x150> .long 0xf4420a8f // vst1.32 {d16-d17}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -9334,12 +9415,12 @@ _sk_srcover_rgba_8888_vfp4: .long 0xe12fff12 // bx r2 .long 0xe2036003 // and r6, r3, #3 .long 0xe3560001 // cmp r6, #1 - .long 0x0a000017 // beq 1bf4 <sk_srcover_rgba_8888_vfp4+0x17c> + .long 0x0a000017 // beq 1c04 <sk_srcover_rgba_8888_vfp4+0x17c> .long 0xf2c00050 // vmov.i32 q8, #0 .long 0xe3560002 // cmp r6, #2 - .long 0x0a000005 // beq 1bb8 <sk_srcover_rgba_8888_vfp4+0x140> + .long 0x0a000005 // beq 1bc8 <sk_srcover_rgba_8888_vfp4+0x140> .long 0xe3560003 // cmp r6, #3 - .long 0x1affffc5 // bne 1ac0 <sk_srcover_rgba_8888_vfp4+0x48> + .long 0x1affffc5 // bne 1ad0 <sk_srcover_rgba_8888_vfp4+0x48> .long 0xe3a06000 // mov r6, #0 .long 0xeea06b90 // vdup.32 q8, r6 .long 0xe2826008 // add r6, r2, #8 @@ -9347,24 +9428,24 @@ _sk_srcover_rgba_8888_vfp4: .long 0xedd22b00 // vldr d18, [r2] .long 0xf2f008e2 // vext.8 q8, q8, q9, #8 .long 0xf2f008e0 // vext.8 q8, q8, q8, #8 - .long 0xeaffffbd // b 1ac0 <sk_srcover_rgba_8888_vfp4+0x48> + .long 0xeaffffbd // b 1ad0 <sk_srcover_rgba_8888_vfp4+0x48> .long 0xe2033003 // and r3, r3, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a00000b // beq 1c04 <sk_srcover_rgba_8888_vfp4+0x18c> + .long 0x0a00000b // beq 1c14 <sk_srcover_rgba_8888_vfp4+0x18c> .long 0xe3530002 // cmp r3, #2 - .long 0x0a000003 // beq 1bec <sk_srcover_rgba_8888_vfp4+0x174> + .long 0x0a000003 // beq 1bfc <sk_srcover_rgba_8888_vfp4+0x174> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffe3 // bne 1b74 <sk_srcover_rgba_8888_vfp4+0xfc> + .long 0x1affffe3 // bne 1b84 <sk_srcover_rgba_8888_vfp4+0xfc> .long 0xe2823008 // add r3, r2, #8 .long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32] .long 0xedc20b00 // vstr d16, [r2] - .long 0xeaffffdf // b 1b74 <sk_srcover_rgba_8888_vfp4+0xfc> + .long 0xeaffffdf // b 1b84 <sk_srcover_rgba_8888_vfp4+0xfc> .long 0xe3a06000 // mov r6, #0 .long 0xeea06b90 // vdup.32 q8, r6 .long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32] - .long 0xeaffffae // b 1ac0 <sk_srcover_rgba_8888_vfp4+0x48> + .long 0xeaffffae // b 1ad0 <sk_srcover_rgba_8888_vfp4+0x48> .long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32] - .long 0xeaffffd9 // b 1b74 <sk_srcover_rgba_8888_vfp4+0xfc> + .long 0xeaffffd9 // b 1b84 <sk_srcover_rgba_8888_vfp4+0xfc> .long 0xe320f000 // nop {0} .long 0x437f0000 // .word 0x437f0000 .long 0x437f0000 // .word 0x437f0000 @@ -9785,14 +9866,14 @@ HIDDEN _sk_rgb_to_hsl_vfp4 FUNCTION(_sk_rgb_to_hsl_vfp4) _sk_rgb_to_hsl_vfp4: .long 0xed2d8b0c // vpush {d8-d13} - .long 0xf2600f42 // vmin.f32 q8, q0, q1 + .long 0xf2620f44 // vmin.f32 q8, q1, q2 .long 0xe28f20c8 // add r2, pc, #200 .long 0xf462aacf // vld1.64 {d26-d27}, [r2] .long 0xe28f20d0 // add r2, pc, #208 - .long 0xf2402f42 // vmax.f32 q9, q0, q1 + .long 0xf2422f44 // vmax.f32 q9, q1, q2 .long 0xeeb7ca00 // vmov.f32 s24, #112 - .long 0xf2600fc4 // vmin.f32 q8, q8, q2 - .long 0xf2422fc4 // vmax.f32 q9, q9, q2 + .long 0xf2600f60 // vmin.f32 q8, q0, q8 + .long 0xf2402f62 // vmax.f32 q9, q0, q9 .long 0xf2624d44 // vsub.f32 q10, q1, q2 .long 0xf3648e42 // vcgt.f32 q12, q2, q1 .long 0xf2228de0 // vsub.f32 q4, q9, q8 @@ -10009,7 +10090,7 @@ _sk_scale_u8_vfp4: .long 0xe5922004 // ldr r2, [r2, #4] .long 0xe0224392 // mla r2, r2, r3, r4 .long 0xe082200e // add r2, r2, lr - .long 0x1a000013 // bne 24f4 <sk_scale_u8_vfp4+0x7c> + .long 0x1a000013 // bne 2504 <sk_scale_u8_vfp4+0x7c> .long 0xe5922000 // ldr r2, [r2] .long 0xe58d2000 // str r2, [sp] .long 0xe1a0200d // mov r2, sp @@ -10032,12 +10113,12 @@ _sk_scale_u8_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a000012 // beq 254c <sk_scale_u8_vfp4+0xd4> + .long 0x0a000012 // beq 255c <sk_scale_u8_vfp4+0xd4> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3530002 // cmp r3, #2 - .long 0x0a000005 // beq 2524 <sk_scale_u8_vfp4+0xac> + .long 0x0a000005 // beq 2534 <sk_scale_u8_vfp4+0xac> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffe8 // bne 24b8 <sk_scale_u8_vfp4+0x40> + .long 0x1affffe8 // bne 24c8 <sk_scale_u8_vfp4+0x40> .long 0xe3a04000 // mov r4, #0 .long 0xe5d23002 // ldrb r3, [r2, #2] .long 0xee804bb0 // vdup.16 d16, r4 @@ -10051,17 +10132,110 @@ _sk_scale_u8_vfp4: .long 0xf3f62124 // vuzp.16 d18, d20 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffda // b 24b8 <sk_scale_u8_vfp4+0x40> + .long 0xeaffffda // b 24c8 <sk_scale_u8_vfp4+0x40> .long 0xe3a03000 // mov r3, #0 .long 0xe5d22000 // ldrb r2, [r2] .long 0xee803bb0 // vdup.16 d16, r3 .long 0xee002bb0 // vmov.16 d16[0], r2 - .long 0xeaffffd5 // b 24b8 <sk_scale_u8_vfp4+0x40> + .long 0xeaffffd5 // b 24c8 <sk_scale_u8_vfp4+0x40> .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 +HIDDEN _sk_scale_565_vfp4 +.globl _sk_scale_565_vfp4 +FUNCTION(_sk_scale_565_vfp4) +_sk_scale_565_vfp4: + .long 0xe92d4010 // push {r4, lr} + .long 0xe24dd004 // sub sp, sp, #4 + .long 0xe5913000 // ldr r3, [r1] + .long 0xe590c000 // ldr ip, [r0] + .long 0xe9904004 // ldmib r0, {r2, lr} + .long 0xe5934000 // ldr r4, [r3] + .long 0xe35e0000 // cmp lr, #0 + .long 0xe5933004 // ldr r3, [r3, #4] + .long 0xe0020293 // mul r2, r3, r2 + .long 0xe0842082 // add r2, r4, r2, lsl #1 + .long 0xe082308c // add r3, r2, ip, lsl #1 + .long 0xe280c040 // add ip, r0, #64 + .long 0x1a000024 // bne 2648 <sk_scale_565_vfp4+0xc8> + .long 0xf463074f // vld1.16 {d16}, [r3] + .long 0xf3d00a30 // vmovl.u16 q8, d16 + .long 0xe3a02e7e // mov r2, #2016 + .long 0xf2c1205f // vmov.i32 q9, #31 + .long 0xeea42b90 // vdup.32 q10, r2 + .long 0xe28f20e0 // add r2, pc, #224 + .long 0xf3c76258 // vmov.i32 q11, #63488 + .long 0xf24021f2 // vand q9, q8, q9 + .long 0xf4628acf // vld1.64 {d24-d25}, [r2] + .long 0xf24041f4 // vand q10, q8, q10 + .long 0xe28f20dc // add r2, pc, #220 + .long 0xf3fb2662 // vcvt.f32.s32 q9, q9 + .long 0xf462aacf // vld1.64 {d26-d27}, [r2] + .long 0xe28f20e0 // add r2, pc, #224 + .long 0xf3fb4664 // vcvt.f32.s32 q10, q10 + .long 0xf24001f6 // vand q8, q8, q11 + .long 0xf4626acf // vld1.64 {d22-d23}, [r2] + .long 0xf3422df8 // vmul.f32 q9, q9, q12 + .long 0xf3fb0660 // vcvt.f32.s32 q8, q8 + .long 0xe5912004 // ldr r2, [r1, #4] + .long 0xe2811008 // add r1, r1, #8 + .long 0xf3444dfa // vmul.f32 q10, q10, q13 + .long 0xf3024dd4 // vmul.f32 q2, q9, q2 + .long 0xf3400df6 // vmul.f32 q8, q8, q11 + .long 0xf46c6aef // vld1.64 {d22-d23}, [ip :128] + .long 0xf3666ec6 // vcgt.f32 q11, q11, q3 + .long 0xf2648fe2 // vmin.f32 q12, q10, q9 + .long 0xf244afe2 // vmax.f32 q13, q10, q9 + .long 0xf3000dd0 // vmul.f32 q0, q8, q0 + .long 0xf2608fe8 // vmin.f32 q12, q8, q12 + .long 0xf240afea // vmax.f32 q13, q8, q13 + .long 0xf3042dd2 // vmul.f32 q1, q10, q1 + .long 0xf35861fa // vbsl q11, q12, q13 + .long 0xf3066dd6 // vmul.f32 q3, q11, q3 + .long 0xe28dd004 // add sp, sp, #4 + .long 0xe8bd4010 // pop {r4, lr} + .long 0xe12fff12 // bx r2 + .long 0xe20e2003 // and r2, lr, #3 + .long 0xe3520001 // cmp r2, #1 + .long 0x0a000011 // beq 269c <sk_scale_565_vfp4+0x11c> + .long 0xf2c00010 // vmov.i32 d16, #0 + .long 0xe3520002 // cmp r2, #2 + .long 0x0a000005 // beq 2678 <sk_scale_565_vfp4+0xf8> + .long 0xe3520003 // cmp r2, #3 + .long 0x1affffd3 // bne 25b8 <sk_scale_565_vfp4+0x38> + .long 0xe3a02000 // mov r2, #0 + .long 0xee802bb0 // vdup.16 d16, r2 + .long 0xe2832004 // add r2, r3, #4 + .long 0xf4e2049f // vld1.16 {d16[2]}, [r2 :16] + .long 0xe5932000 // ldr r2, [r3] + .long 0xe58d2000 // str r2, [sp] + .long 0xe1a0200d // mov r2, sp + .long 0xf4e2183f // vld1.32 {d17[0]}, [r2 :32] + .long 0xf3d02a31 // vmovl.u16 q9, d17 + .long 0xf3f62121 // vuzp.16 d18, d17 + .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 + .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 + .long 0xeaffffc6 // b 25b8 <sk_scale_565_vfp4+0x38> + .long 0xe3a02000 // mov r2, #0 + .long 0xee802bb0 // vdup.16 d16, r2 + .long 0xf4e3041f // vld1.16 {d16[0]}, [r3 :16] + .long 0xeaffffc2 // b 25b8 <sk_scale_565_vfp4+0x38> + .long 0xe320f000 // nop {0} + .long 0x3d042108 // .word 0x3d042108 + .long 0x3d042108 // .word 0x3d042108 + .long 0x3d042108 // .word 0x3d042108 + .long 0x3d042108 // .word 0x3d042108 + .long 0x3a020821 // .word 0x3a020821 + .long 0x3a020821 // .word 0x3a020821 + .long 0x3a020821 // .word 0x3a020821 + .long 0x3a020821 // .word 0x3a020821 + .long 0x37842108 // .word 0x37842108 + .long 0x37842108 // .word 0x37842108 + .long 0x37842108 // .word 0x37842108 + .long 0x37842108 // .word 0x37842108 + HIDDEN _sk_lerp_1_float_vfp4 .globl _sk_lerp_1_float_vfp4 FUNCTION(_sk_lerp_1_float_vfp4) @@ -10108,7 +10282,7 @@ _sk_lerp_u8_vfp4: .long 0xe0824003 // add r4, r2, r3 .long 0xe2803020 // add r3, r0, #32 .long 0xe2802010 // add r2, r0, #16 - .long 0x1a00001f // bne 2688 <sk_lerp_u8_vfp4+0xb8> + .long 0x1a00001f // bne 27f8 <sk_lerp_u8_vfp4+0xb8> .long 0xe5944000 // ldr r4, [r4] .long 0xe58d4000 // str r4, [sp] .long 0xe1a0400d // mov r4, sp @@ -10143,12 +10317,12 @@ _sk_lerp_u8_vfp4: .long 0xe12fff12 // bx r2 .long 0xe2065003 // and r5, r6, #3 .long 0xe3550001 // cmp r5, #1 - .long 0x0a000012 // beq 26e0 <sk_lerp_u8_vfp4+0x110> + .long 0x0a000012 // beq 2850 <sk_lerp_u8_vfp4+0x110> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3550002 // cmp r5, #2 - .long 0x0a000005 // beq 26b8 <sk_lerp_u8_vfp4+0xe8> + .long 0x0a000005 // beq 2828 <sk_lerp_u8_vfp4+0xe8> .long 0xe3550003 // cmp r5, #3 - .long 0x1affffdc // bne 261c <sk_lerp_u8_vfp4+0x4c> + .long 0x1affffdc // bne 278c <sk_lerp_u8_vfp4+0x4c> .long 0xe3a06000 // mov r6, #0 .long 0xe5d45002 // ldrb r5, [r4, #2] .long 0xee806bb0 // vdup.16 d16, r6 @@ -10162,12 +10336,12 @@ _sk_lerp_u8_vfp4: .long 0xf3f62124 // vuzp.16 d18, d20 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffce // b 261c <sk_lerp_u8_vfp4+0x4c> + .long 0xeaffffce // b 278c <sk_lerp_u8_vfp4+0x4c> .long 0xe3a05000 // mov r5, #0 .long 0xe5d44000 // ldrb r4, [r4] .long 0xee805bb0 // vdup.16 d16, r5 .long 0xee004bb0 // vmov.16 d16[0], r4 - .long 0xeaffffc9 // b 261c <sk_lerp_u8_vfp4+0x4c> + .long 0xeaffffc9 // b 278c <sk_lerp_u8_vfp4+0x4c> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -10181,73 +10355,74 @@ _sk_lerp_565_vfp4: .long 0xe92d4070 // push {r4, r5, r6, lr} .long 0xe24dd004 // sub sp, sp, #4 .long 0xe5912000 // ldr r2, [r1] - .long 0xe280e020 // add lr, r0, #32 + .long 0xe280e040 // add lr, r0, #64 .long 0xe8900058 // ldm r0, {r3, r4, r6} - .long 0xe280c010 // add ip, r0, #16 + .long 0xe280c020 // add ip, r0, #32 .long 0xe5925000 // ldr r5, [r2] .long 0xe3560000 // cmp r6, #0 .long 0xe5922004 // ldr r2, [r2, #4] .long 0xe0020492 // mul r2, r2, r4 .long 0xe0852082 // add r2, r5, r2, lsl #1 .long 0xe0824083 // add r4, r2, r3, lsl #1 - .long 0xe2803040 // add r3, r0, #64 .long 0xe2802030 // add r2, r0, #48 - .long 0x1a00002e // bne 2800 <sk_lerp_565_vfp4+0xf8> + .long 0xe2803010 // add r3, r0, #16 + .long 0x1a00002f // bne 2974 <sk_lerp_565_vfp4+0xfc> .long 0xf464074f // vld1.16 {d16}, [r4] .long 0xf3d00a30 // vmovl.u16 q8, d16 .long 0xe3a04e7e // mov r4, #2016 .long 0xf2c1205f // vmov.i32 q9, #31 - .long 0xeea64b90 // vdup.32 q11, r4 - .long 0xf3c74258 // vmov.i32 q10, #63488 + .long 0xeea44b90 // vdup.32 q10, r4 + .long 0xe28f4f42 // add r4, pc, #264 + .long 0xf3c76258 // vmov.i32 q11, #63488 .long 0xf24021f2 // vand q9, q8, q9 - .long 0xf24061f6 // vand q11, q8, q11 - .long 0xf24001f4 // vand q8, q8, q10 - .long 0xf3fb4666 // vcvt.f32.s32 q10, q11 - .long 0xf4636aef // vld1.64 {d22-d23}, [r3 :128] - .long 0xe28f30f0 // add r3, pc, #240 + .long 0xf4648acf // vld1.64 {d24-d25}, [r4] + .long 0xf24041f4 // vand q10, q8, q10 + .long 0xe28f4f41 // add r4, pc, #260 .long 0xf3fb2662 // vcvt.f32.s32 q9, q9 - .long 0xf4638acf // vld1.64 {d24-d25}, [r3] - .long 0xe28f30f4 // add r3, pc, #244 - .long 0xf463cacf // vld1.64 {d28-d29}, [r3] - .long 0xf266ad66 // vsub.f32 q13, q3, q11 - .long 0xe28f30f8 // add r3, pc, #248 - .long 0xf344cdfc // vmul.f32 q14, q10, q14 + .long 0xf464aacf // vld1.64 {d26-d27}, [r4] + .long 0xe28f4f42 // add r4, pc, #264 + .long 0xf3fb4664 // vcvt.f32.s32 q10, q10 + .long 0xf24001f6 // vand q8, q8, q11 .long 0xf3428df8 // vmul.f32 q12, q9, q12 - .long 0xf4632acf // vld1.64 {d18-d19}, [r3] - .long 0xf26641f6 // vorr q10, q11, q11 - .long 0xf22661f6 // vorr q3, q11, q11 + .long 0xf4642acf // vld1.64 {d18-d19}, [r4] .long 0xf3fb0660 // vcvt.f32.s32 q8, q8 - .long 0xf24a4cf8 // vfma.f32 q10, q13, q12 - .long 0xf20a6cfc // vfma.f32 q3, q13, q14 - .long 0xf340edf2 // vmul.f32 q15, q8, q9 - .long 0xf46e2aef // vld1.64 {d18-d19}, [lr :128] - .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128] - .long 0xf2244d60 // vsub.f32 q2, q2, q8 + .long 0xf344adfa // vmul.f32 q13, q10, q13 + .long 0xf3406df2 // vmul.f32 q11, q8, q9 + .long 0xf4630aef // vld1.64 {d16-d17}, [r3 :128] + .long 0xf260ed60 // vsub.f32 q15, q0, q8 + .long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128] + .long 0xf26a4fe8 // vmin.f32 q10, q13, q12 .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 - .long 0xf24a6cfe // vfma.f32 q11, q13, q15 - .long 0xf262ad62 // vsub.f32 q13, q1, q9 - .long 0xf2062f64 // vmax.f32 q1, q3, q10 - .long 0xf46c4aef // vld1.64 {d20-d21}, [ip :128] - .long 0xf2200d64 // vsub.f32 q0, q0, q10 - .long 0xf2440c78 // vfma.f32 q8, q2, q12 - .long 0xf24a2cfc // vfma.f32 q9, q13, q14 - .long 0xf2404c7e // vfma.f32 q10, q0, q15 - .long 0xf2066fc2 // vmax.f32 q3, q11, q1 - .long 0xf22041f0 // vorr q2, q8, q8 - .long 0xf22221f2 // vorr q1, q9, q9 - .long 0xf22401f4 // vorr q0, q10, q10 + .long 0xf24acfe8 // vmax.f32 q14, q13, q12 + .long 0xf24e0cf6 // vfma.f32 q8, q15, q11 + .long 0xf2260fe4 // vmin.f32 q0, q11, q10 + .long 0xf46e4aef // vld1.64 {d20-d21}, [lr :128] + .long 0xf266ed64 // vsub.f32 q15, q3, q10 + .long 0xf3246ec6 // vcgt.f32 q3, q10, q3 + .long 0xf246cfec // vmax.f32 q14, q11, q14 + .long 0xf46c6aef // vld1.64 {d22-d23}, [ip :128] + .long 0xf2244d62 // vsub.f32 q2, q2, q9 + .long 0xf310617c // vbsl q3, q0, q14 + .long 0xf262cd66 // vsub.f32 q14, q1, q11 + .long 0xf2442c78 // vfma.f32 q9, q2, q12 + .long 0xf24e4cd6 // vfma.f32 q10, q15, q3 + .long 0xf24c6cfa // vfma.f32 q11, q14, q13 + .long 0xf22001f0 // vorr q0, q8, q8 + .long 0xf22241f2 // vorr q2, q9, q9 + .long 0xf22461f4 // vorr q3, q10, q10 + .long 0xf22621f6 // vorr q1, q11, q11 .long 0xe28dd004 // add sp, sp, #4 .long 0xe8bd4070 // pop {r4, r5, r6, lr} .long 0xe12fff12 // bx r2 .long 0xe2065003 // and r5, r6, #3 .long 0xe3550001 // cmp r5, #1 - .long 0x0a000011 // beq 2854 <sk_lerp_565_vfp4+0x14c> + .long 0x0a000011 // beq 29c8 <sk_lerp_565_vfp4+0x150> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3550002 // cmp r5, #2 - .long 0x0a000005 // beq 2830 <sk_lerp_565_vfp4+0x128> + .long 0x0a000005 // beq 29a4 <sk_lerp_565_vfp4+0x12c> .long 0xe3550003 // cmp r5, #3 - .long 0x1affffc9 // bne 2748 <sk_lerp_565_vfp4+0x40> + .long 0x1affffc8 // bne 28b8 <sk_lerp_565_vfp4+0x40> .long 0xe3a05000 // mov r5, #0 .long 0xee805bb0 // vdup.16 d16, r5 .long 0xe2845004 // add r5, r4, #4 @@ -10260,12 +10435,11 @@ _sk_lerp_565_vfp4: .long 0xf3f62121 // vuzp.16 d18, d17 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffbc // b 2748 <sk_lerp_565_vfp4+0x40> + .long 0xeaffffbb // b 28b8 <sk_lerp_565_vfp4+0x40> .long 0xe3a05000 // mov r5, #0 .long 0xee805bb0 // vdup.16 d16, r5 .long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16] - .long 0xeaffffb8 // b 2748 <sk_lerp_565_vfp4+0x40> - .long 0xe320f000 // nop {0} + .long 0xeaffffb7 // b 28b8 <sk_lerp_565_vfp4+0x40> .long 0x3d042108 // .word 0x3d042108 .long 0x3d042108 // .word 0x3d042108 .long 0x3d042108 // .word 0x3d042108 @@ -10290,7 +10464,7 @@ _sk_load_tables_vfp4: .long 0xe5964000 // ldr r4, [r6] .long 0xe3530000 // cmp r3, #0 .long 0xe084e102 // add lr, r4, r2, lsl #2 - .long 0x1a000036 // bne 2994 <sk_load_tables_vfp4+0xfc> + .long 0x1a000036 // bne 2b04 <sk_load_tables_vfp4+0xfc> .long 0xf46e0a8f // vld1.32 {d16-d17}, [lr] .long 0xf3c7405f // vmov.i32 q10, #255 .long 0xe5967004 // ldr r7, [r6, #4] @@ -10348,12 +10522,12 @@ _sk_load_tables_vfp4: .long 0xe12fff12 // bx r2 .long 0xe203c003 // and ip, r3, #3 .long 0xe35c0001 // cmp ip, #1 - .long 0x0a00000c // beq 29d4 <sk_load_tables_vfp4+0x13c> + .long 0x0a00000c // beq 2b44 <sk_load_tables_vfp4+0x13c> .long 0xf2c00050 // vmov.i32 q8, #0 .long 0xe35c0002 // cmp ip, #2 - .long 0x0a000005 // beq 29c4 <sk_load_tables_vfp4+0x12c> + .long 0x0a000005 // beq 2b34 <sk_load_tables_vfp4+0x12c> .long 0xe35c0003 // cmp ip, #3 - .long 0x1affffc1 // bne 28bc <sk_load_tables_vfp4+0x24> + .long 0x1affffc1 // bne 2a2c <sk_load_tables_vfp4+0x24> .long 0xe3a02000 // mov r2, #0 .long 0xeea02b90 // vdup.32 q8, r2 .long 0xe28e2008 // add r2, lr, #8 @@ -10361,11 +10535,11 @@ _sk_load_tables_vfp4: .long 0xedde2b00 // vldr d18, [lr] .long 0xf2f008e2 // vext.8 q8, q8, q9, #8 .long 0xf2f008e0 // vext.8 q8, q8, q8, #8 - .long 0xeaffffb9 // b 28bc <sk_load_tables_vfp4+0x24> + .long 0xeaffffb9 // b 2a2c <sk_load_tables_vfp4+0x24> .long 0xe3a02000 // mov r2, #0 .long 0xeea02b90 // vdup.32 q8, r2 .long 0xf4ee083f // vld1.32 {d16[0]}, [lr :32] - .long 0xeaffffb5 // b 28bc <sk_load_tables_vfp4+0x24> + .long 0xeaffffb5 // b 2a2c <sk_load_tables_vfp4+0x24> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -10383,7 +10557,7 @@ _sk_load_tables_u16_be_vfp4: .long 0xe5982000 // ldr r2, [r8] .long 0xe35e0000 // cmp lr, #0 .long 0xe082c183 // add ip, r2, r3, lsl #3 - .long 0x1a000039 // bne 2b00 <sk_load_tables_u16_be_vfp4+0x108> + .long 0x1a000039 // bne 2c70 <sk_load_tables_u16_be_vfp4+0x108> .long 0xf46c004f // vld4.16 {d16-d19}, [ip] .long 0xf3c72b3f // vbic.i16 d18, #65280 .long 0xe5986004 // ldr r6, [r8, #4] @@ -10444,14 +10618,14 @@ _sk_load_tables_u16_be_vfp4: .long 0xe12fff12 // bx r2 .long 0xf4ec070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [ip] .long 0xe35e0001 // cmp lr, #1 - .long 0x0affffc3 // beq 2a1c <sk_load_tables_u16_be_vfp4+0x24> + .long 0x0affffc3 // beq 2b8c <sk_load_tables_u16_be_vfp4+0x24> .long 0xe28c2008 // add r2, ip, #8 .long 0xe35e0003 // cmp lr, #3 .long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2] - .long 0x3affffbf // bcc 2a1c <sk_load_tables_u16_be_vfp4+0x24> + .long 0x3affffbf // bcc 2b8c <sk_load_tables_u16_be_vfp4+0x24> .long 0xe28c2010 // add r2, ip, #16 .long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2] - .long 0xeaffffbc // b 2a1c <sk_load_tables_u16_be_vfp4+0x24> + .long 0xeaffffbc // b 2b8c <sk_load_tables_u16_be_vfp4+0x24> .long 0x37800080 // .word 0x37800080 .long 0x37800080 // .word 0x37800080 .long 0x37800080 // .word 0x37800080 @@ -10469,7 +10643,7 @@ _sk_load_tables_rgb_u16_be_vfp4: .long 0xe5982000 // ldr r2, [r8] .long 0xe35e0000 // cmp lr, #0 .long 0xe082c083 // add ip, r2, r3, lsl #1 - .long 0x1a000033 // bne 2c2c <sk_load_tables_rgb_u16_be_vfp4+0xf4> + .long 0x1a000033 // bne 2d9c <sk_load_tables_rgb_u16_be_vfp4+0xf4> .long 0xf46c044f // vld3.16 {d16-d18}, [ip] .long 0xf3c72b3f // vbic.i16 d18, #65280 .long 0xe5987004 // ldr r7, [r8, #4] @@ -10524,14 +10698,14 @@ _sk_load_tables_rgb_u16_be_vfp4: .long 0xe12fff12 // bx r2 .long 0xf4ec060f // vld3.16 {d16[0],d17[0],d18[0]}, [ip] .long 0xe35e0001 // cmp lr, #1 - .long 0x0affffc9 // beq 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28> + .long 0x0affffc9 // beq 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28> .long 0xe28c2006 // add r2, ip, #6 .long 0xe35e0003 // cmp lr, #3 .long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2] - .long 0x3affffc5 // bcc 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28> + .long 0x3affffc5 // bcc 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28> .long 0xe28c200c // add r2, ip, #12 .long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2] - .long 0xeaffffc2 // b 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28> + .long 0xeaffffc2 // b 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28> .long 0xe320f000 // nop {0} .long 0x3f800000 // .word 0x3f800000 .long 0x3f800000 // .word 0x3f800000 @@ -11584,7 +11758,7 @@ _sk_load_a8_vfp4: .long 0xe5922004 // ldr r2, [r2, #4] .long 0xe0224392 // mla r2, r2, r3, r4 .long 0xe082200e // add r2, r2, lr - .long 0x1a000012 // bne 3c10 <sk_load_a8_vfp4+0x78> + .long 0x1a000012 // bne 3d80 <sk_load_a8_vfp4+0x78> .long 0xe5922000 // ldr r2, [r2] .long 0xe58d2000 // str r2, [sp] .long 0xe1a0200d // mov r2, sp @@ -11606,12 +11780,12 @@ _sk_load_a8_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a000012 // beq 3c68 <sk_load_a8_vfp4+0xd0> + .long 0x0a000012 // beq 3dd8 <sk_load_a8_vfp4+0xd0> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3530002 // cmp r3, #2 - .long 0x0a000005 // beq 3c40 <sk_load_a8_vfp4+0xa8> + .long 0x0a000005 // beq 3db0 <sk_load_a8_vfp4+0xa8> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffe9 // bne 3bd8 <sk_load_a8_vfp4+0x40> + .long 0x1affffe9 // bne 3d48 <sk_load_a8_vfp4+0x40> .long 0xe3a04000 // mov r4, #0 .long 0xe5d23002 // ldrb r3, [r2, #2] .long 0xee804bb0 // vdup.16 d16, r4 @@ -11625,12 +11799,12 @@ _sk_load_a8_vfp4: .long 0xf3f62124 // vuzp.16 d18, d20 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffdb // b 3bd8 <sk_load_a8_vfp4+0x40> + .long 0xeaffffdb // b 3d48 <sk_load_a8_vfp4+0x40> .long 0xe3a03000 // mov r3, #0 .long 0xe5d22000 // ldrb r2, [r2] .long 0xee803bb0 // vdup.16 d16, r3 .long 0xee002bb0 // vmov.16 d16[0], r2 - .long 0xeaffffd6 // b 3bd8 <sk_load_a8_vfp4+0x40> + .long 0xeaffffd6 // b 3d48 <sk_load_a8_vfp4+0x40> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -11659,7 +11833,7 @@ _sk_load_a8_dst_vfp4: .long 0xf4430aef // vst1.64 {d16-d17}, [r3 :128] .long 0xe082300c // add r3, r2, ip .long 0xe280c040 // add ip, r0, #64 - .long 0x1a000011 // bne 3d24 <sk_load_a8_dst_vfp4+0x94> + .long 0x1a000011 // bne 3e94 <sk_load_a8_dst_vfp4+0x94> .long 0xe5932000 // ldr r2, [r3] .long 0xe58d2000 // str r2, [sp] .long 0xe1a0200d // mov r2, sp @@ -11680,12 +11854,12 @@ _sk_load_a8_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xe20e2003 // and r2, lr, #3 .long 0xe3520001 // cmp r2, #1 - .long 0x0a000012 // beq 3d7c <sk_load_a8_dst_vfp4+0xec> + .long 0x0a000012 // beq 3eec <sk_load_a8_dst_vfp4+0xec> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3520002 // cmp r2, #2 - .long 0x0a000005 // beq 3d54 <sk_load_a8_dst_vfp4+0xc4> + .long 0x0a000005 // beq 3ec4 <sk_load_a8_dst_vfp4+0xc4> .long 0xe3520003 // cmp r2, #3 - .long 0x1affffea // bne 3cf0 <sk_load_a8_dst_vfp4+0x60> + .long 0x1affffea // bne 3e60 <sk_load_a8_dst_vfp4+0x60> .long 0xe3a05000 // mov r5, #0 .long 0xe5d32002 // ldrb r2, [r3, #2] .long 0xee805bb0 // vdup.16 d16, r5 @@ -11699,12 +11873,12 @@ _sk_load_a8_dst_vfp4: .long 0xf3f62124 // vuzp.16 d18, d20 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffdc // b 3cf0 <sk_load_a8_dst_vfp4+0x60> + .long 0xeaffffdc // b 3e60 <sk_load_a8_dst_vfp4+0x60> .long 0xe5d32000 // ldrb r2, [r3] .long 0xe3a03000 // mov r3, #0 .long 0xee803bb0 // vdup.16 d16, r3 .long 0xee002bb0 // vmov.16 d16[0], r2 - .long 0xeaffffd7 // b 3cf0 <sk_load_a8_dst_vfp4+0x60> + .long 0xeaffffd7 // b 3e60 <sk_load_a8_dst_vfp4+0x60> .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -11770,7 +11944,7 @@ _sk_store_a8_vfp4: .long 0xe0224392 // mla r2, r2, r3, r4 .long 0xe082200e // add r2, r2, lr .long 0xf3f60220 // vmovn.i32 d16, q8 - .long 0x1a000005 // bne 3e88 <sk_store_a8_vfp4+0x58> + .long 0x1a000005 // bne 3ff8 <sk_store_a8_vfp4+0x58> .long 0xf3f20121 // vuzp.8 d16, d17 .long 0xf4c2080f // vst1.32 {d16[0]}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] @@ -11779,21 +11953,21 @@ _sk_store_a8_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a00000a // beq 3ec0 <sk_store_a8_vfp4+0x90> + .long 0x0a00000a // beq 4030 <sk_store_a8_vfp4+0x90> .long 0xe3530002 // cmp r3, #2 - .long 0x0a000003 // beq 3eac <sk_store_a8_vfp4+0x7c> + .long 0x0a000003 // beq 401c <sk_store_a8_vfp4+0x7c> .long 0xe3530003 // cmp r3, #3 - .long 0x1afffff4 // bne 3e78 <sk_store_a8_vfp4+0x48> + .long 0x1afffff4 // bne 3fe8 <sk_store_a8_vfp4+0x48> .long 0xeeb03bb0 // vmov.u16 r3, d16[2] .long 0xe5c23002 // strb r3, [r2, #2] .long 0xee903bf0 // vmov.u16 r3, d16[1] .long 0xee904bb0 // vmov.u16 r4, d16[0] .long 0xe5c23001 // strb r3, [r2, #1] .long 0xe5c24000 // strb r4, [r2] - .long 0xeaffffed // b 3e78 <sk_store_a8_vfp4+0x48> + .long 0xeaffffed // b 3fe8 <sk_store_a8_vfp4+0x48> .long 0xee903bb0 // vmov.u16 r3, d16[0] .long 0xe5c23000 // strb r3, [r2] - .long 0xeaffffea // b 3e78 <sk_store_a8_vfp4+0x48> + .long 0xeaffffea // b 3fe8 <sk_store_a8_vfp4+0x48> .long 0xe320f000 // nop {0} .long 0x437f0000 // .word 0x437f0000 .long 0x437f0000 // .word 0x437f0000 @@ -11814,7 +11988,7 @@ _sk_load_g8_vfp4: .long 0xe5922004 // ldr r2, [r2, #4] .long 0xe0224392 // mla r2, r2, r3, r4 .long 0xe082200e // add r2, r2, lr - .long 0x1a000013 // bne 3f5c <sk_load_g8_vfp4+0x7c> + .long 0x1a000013 // bne 40cc <sk_load_g8_vfp4+0x7c> .long 0xe5922000 // ldr r2, [r2] .long 0xe58d2000 // str r2, [sp] .long 0xe1a0200d // mov r2, sp @@ -11837,12 +12011,12 @@ _sk_load_g8_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a000012 // beq 3fb4 <sk_load_g8_vfp4+0xd4> + .long 0x0a000012 // beq 4124 <sk_load_g8_vfp4+0xd4> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3530002 // cmp r3, #2 - .long 0x0a000005 // beq 3f8c <sk_load_g8_vfp4+0xac> + .long 0x0a000005 // beq 40fc <sk_load_g8_vfp4+0xac> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffe8 // bne 3f20 <sk_load_g8_vfp4+0x40> + .long 0x1affffe8 // bne 4090 <sk_load_g8_vfp4+0x40> .long 0xe3a04000 // mov r4, #0 .long 0xe5d23002 // ldrb r3, [r2, #2] .long 0xee804bb0 // vdup.16 d16, r4 @@ -11856,12 +12030,12 @@ _sk_load_g8_vfp4: .long 0xf3f62124 // vuzp.16 d18, d20 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffda // b 3f20 <sk_load_g8_vfp4+0x40> + .long 0xeaffffda // b 4090 <sk_load_g8_vfp4+0x40> .long 0xe3a03000 // mov r3, #0 .long 0xe5d22000 // ldrb r2, [r2] .long 0xee803bb0 // vdup.16 d16, r3 .long 0xee002bb0 // vmov.16 d16[0], r2 - .long 0xeaffffd5 // b 3f20 <sk_load_g8_vfp4+0x40> + .long 0xeaffffd5 // b 4090 <sk_load_g8_vfp4+0x40> .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -11888,7 +12062,7 @@ _sk_load_g8_dst_vfp4: .long 0xe0824003 // add r4, r2, r3 .long 0xe2802020 // add r2, r0, #32 .long 0xe2803010 // add r3, r0, #16 - .long 0x1a000015 // bne 4078 <sk_load_g8_dst_vfp4+0x90> + .long 0x1a000015 // bne 41e8 <sk_load_g8_dst_vfp4+0x90> .long 0xe5944000 // ldr r4, [r4] .long 0xe58d4000 // str r4, [sp] .long 0xe1a0400d // mov r4, sp @@ -11913,12 +12087,12 @@ _sk_load_g8_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xe2065003 // and r5, r6, #3 .long 0xe3550001 // cmp r5, #1 - .long 0x0a000012 // beq 40d0 <sk_load_g8_dst_vfp4+0xe8> + .long 0x0a000012 // beq 4240 <sk_load_g8_dst_vfp4+0xe8> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3550002 // cmp r5, #2 - .long 0x0a000005 // beq 40a8 <sk_load_g8_dst_vfp4+0xc0> + .long 0x0a000005 // beq 4218 <sk_load_g8_dst_vfp4+0xc0> .long 0xe3550003 // cmp r5, #3 - .long 0x1affffe6 // bne 4034 <sk_load_g8_dst_vfp4+0x4c> + .long 0x1affffe6 // bne 41a4 <sk_load_g8_dst_vfp4+0x4c> .long 0xe3a06000 // mov r6, #0 .long 0xe5d45002 // ldrb r5, [r4, #2] .long 0xee806bb0 // vdup.16 d16, r6 @@ -11932,12 +12106,12 @@ _sk_load_g8_dst_vfp4: .long 0xf3f62124 // vuzp.16 d18, d20 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffd8 // b 4034 <sk_load_g8_dst_vfp4+0x4c> + .long 0xeaffffd8 // b 41a4 <sk_load_g8_dst_vfp4+0x4c> .long 0xe3a05000 // mov r5, #0 .long 0xe5d44000 // ldrb r4, [r4] .long 0xee805bb0 // vdup.16 d16, r5 .long 0xee004bb0 // vmov.16 d16[0], r4 - .long 0xeaffffd3 // b 4034 <sk_load_g8_dst_vfp4+0x4c> + .long 0xeaffffd3 // b 41a4 <sk_load_g8_dst_vfp4+0x4c> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -12004,7 +12178,7 @@ _sk_load_565_vfp4: .long 0xe0020392 // mul r2, r2, r3 .long 0xe0842082 // add r2, r4, r2, lsl #1 .long 0xe082208e // add r2, r2, lr, lsl #1 - .long 0x1a00001b // bne 4238 <sk_load_565_vfp4+0xa0> + .long 0x1a00001b // bne 43a8 <sk_load_565_vfp4+0xa0> .long 0xf462074f // vld1.16 {d16}, [r2] .long 0xf3d00a30 // vmovl.u16 q8, d16 .long 0xe3a02e7e // mov r2, #2016 @@ -12035,12 +12209,12 @@ _sk_load_565_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a000011 // beq 428c <sk_load_565_vfp4+0xf4> + .long 0x0a000011 // beq 43fc <sk_load_565_vfp4+0xf4> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3530002 // cmp r3, #2 - .long 0x0a000005 // beq 4268 <sk_load_565_vfp4+0xd0> + .long 0x0a000005 // beq 43d8 <sk_load_565_vfp4+0xd0> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffdc // bne 41cc <sk_load_565_vfp4+0x34> + .long 0x1affffdc // bne 433c <sk_load_565_vfp4+0x34> .long 0xe3a03000 // mov r3, #0 .long 0xee803bb0 // vdup.16 d16, r3 .long 0xe2823004 // add r3, r2, #4 @@ -12053,11 +12227,11 @@ _sk_load_565_vfp4: .long 0xf3f62121 // vuzp.16 d18, d17 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffcf // b 41cc <sk_load_565_vfp4+0x34> + .long 0xeaffffcf // b 433c <sk_load_565_vfp4+0x34> .long 0xe3a03000 // mov r3, #0 .long 0xee803bb0 // vdup.16 d16, r3 .long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16] - .long 0xeaffffcb // b 41cc <sk_load_565_vfp4+0x34> + .long 0xeaffffcb // b 433c <sk_load_565_vfp4+0x34> .long 0xe320f000 // nop {0} .long 0x37842108 // .word 0x37842108 .long 0x37842108 // .word 0x37842108 @@ -12094,7 +12268,7 @@ _sk_load_565_dst_vfp4: .long 0xe0824083 // add r4, r2, r3, lsl #1 .long 0xe2802020 // add r2, r0, #32 .long 0xe2803010 // add r3, r0, #16 - .long 0x1a00001f // bne 439c <sk_load_565_dst_vfp4+0xbc> + .long 0x1a00001f // bne 450c <sk_load_565_dst_vfp4+0xbc> .long 0xf464074f // vld1.16 {d16}, [r4] .long 0xf3d00a30 // vmovl.u16 q8, d16 .long 0xe3a04e7e // mov r4, #2016 @@ -12129,12 +12303,12 @@ _sk_load_565_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xe2065003 // and r5, r6, #3 .long 0xe3550001 // cmp r5, #1 - .long 0x0a000011 // beq 43f0 <sk_load_565_dst_vfp4+0x110> + .long 0x0a000011 // beq 4560 <sk_load_565_dst_vfp4+0x110> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3550002 // cmp r5, #2 - .long 0x0a000005 // beq 43cc <sk_load_565_dst_vfp4+0xec> + .long 0x0a000005 // beq 453c <sk_load_565_dst_vfp4+0xec> .long 0xe3550003 // cmp r5, #3 - .long 0x1affffd8 // bne 4320 <sk_load_565_dst_vfp4+0x40> + .long 0x1affffd8 // bne 4490 <sk_load_565_dst_vfp4+0x40> .long 0xe3a05000 // mov r5, #0 .long 0xee805bb0 // vdup.16 d16, r5 .long 0xe2845004 // add r5, r4, #4 @@ -12147,11 +12321,11 @@ _sk_load_565_dst_vfp4: .long 0xf3f62121 // vuzp.16 d18, d17 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffcb // b 4320 <sk_load_565_dst_vfp4+0x40> + .long 0xeaffffcb // b 4490 <sk_load_565_dst_vfp4+0x40> .long 0xe3a05000 // mov r5, #0 .long 0xee805bb0 // vdup.16 d16, r5 .long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16] - .long 0xeaffffc7 // b 4320 <sk_load_565_dst_vfp4+0x40> + .long 0xeaffffc7 // b 4490 <sk_load_565_dst_vfp4+0x40> .long 0x37842108 // .word 0x37842108 .long 0x37842108 // .word 0x37842108 .long 0x37842108 // .word 0x37842108 @@ -12263,7 +12437,7 @@ _sk_store_565_vfp4: .long 0xf26401f0 // vorr q8, q10, q8 .long 0xf26001f2 // vorr q8, q8, q9 .long 0xf3f60220 // vmovn.i32 d16, q8 - .long 0x1a000004 // bne 45ac <sk_store_565_vfp4+0x84> + .long 0x1a000004 // bne 471c <sk_store_565_vfp4+0x84> .long 0xf442074f // vst1.16 {d16}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -12271,11 +12445,11 @@ _sk_store_565_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a00000c // beq 45ec <sk_store_565_vfp4+0xc4> + .long 0x0a00000c // beq 475c <sk_store_565_vfp4+0xc4> .long 0xe3530002 // cmp r3, #2 - .long 0x0a000003 // beq 45d0 <sk_store_565_vfp4+0xa8> + .long 0x0a000003 // beq 4740 <sk_store_565_vfp4+0xa8> .long 0xe3530003 // cmp r3, #3 - .long 0x1afffff4 // bne 459c <sk_store_565_vfp4+0x74> + .long 0x1afffff4 // bne 470c <sk_store_565_vfp4+0x74> .long 0xe2823004 // add r3, r2, #4 .long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16] .long 0xee903bb0 // vmov.u16 r3, d16[0] @@ -12284,9 +12458,9 @@ _sk_store_565_vfp4: .long 0xee204b90 // vmov.32 d16[1], r4 .long 0xf3f60121 // vuzp.16 d16, d17 .long 0xf4c2080f // vst1.32 {d16[0]}, [r2] - .long 0xeaffffeb // b 459c <sk_store_565_vfp4+0x74> + .long 0xeaffffeb // b 470c <sk_store_565_vfp4+0x74> .long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16] - .long 0xeaffffe9 // b 459c <sk_store_565_vfp4+0x74> + .long 0xeaffffe9 // b 470c <sk_store_565_vfp4+0x74> .long 0xe320f000 // nop {0} .long 0x427c0000 // .word 0x427c0000 .long 0x427c0000 // .word 0x427c0000 @@ -12308,7 +12482,7 @@ _sk_load_4444_vfp4: .long 0xe0020392 // mul r2, r2, r3 .long 0xe0842082 // add r2, r4, r2, lsl #1 .long 0xe082208e // add r2, r2, lr, lsl #1 - .long 0x1a00001e // bne 46b4 <sk_load_4444_vfp4+0xac> + .long 0x1a00001e // bne 4824 <sk_load_4444_vfp4+0xac> .long 0xf462074f // vld1.16 {d16}, [r2] .long 0xf3d00a30 // vmovl.u16 q8, d16 .long 0xe28f20d0 // add r2, pc, #208 @@ -12342,12 +12516,12 @@ _sk_load_4444_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a000011 // beq 4708 <sk_load_4444_vfp4+0x100> + .long 0x0a000011 // beq 4878 <sk_load_4444_vfp4+0x100> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3530002 // cmp r3, #2 - .long 0x0a000005 // beq 46e4 <sk_load_4444_vfp4+0xdc> + .long 0x0a000005 // beq 4854 <sk_load_4444_vfp4+0xdc> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffd9 // bne 463c <sk_load_4444_vfp4+0x34> + .long 0x1affffd9 // bne 47ac <sk_load_4444_vfp4+0x34> .long 0xe3a03000 // mov r3, #0 .long 0xee803bb0 // vdup.16 d16, r3 .long 0xe2823004 // add r3, r2, #4 @@ -12360,11 +12534,11 @@ _sk_load_4444_vfp4: .long 0xf3f62121 // vuzp.16 d18, d17 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffcc // b 463c <sk_load_4444_vfp4+0x34> + .long 0xeaffffcc // b 47ac <sk_load_4444_vfp4+0x34> .long 0xe3a03000 // mov r3, #0 .long 0xee803bb0 // vdup.16 d16, r3 .long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16] - .long 0xeaffffc8 // b 463c <sk_load_4444_vfp4+0x34> + .long 0xeaffffc8 // b 47ac <sk_load_4444_vfp4+0x34> .long 0x3b888889 // .word 0x3b888889 .long 0x3b888889 // .word 0x3b888889 .long 0x3b888889 // .word 0x3b888889 @@ -12400,7 +12574,7 @@ _sk_load_4444_dst_vfp4: .long 0xe0824083 // add r4, r2, r3, lsl #1 .long 0xe2802020 // add r2, r0, #32 .long 0xe2803010 // add r3, r0, #16 - .long 0x1a000023 // bne 4824 <sk_load_4444_dst_vfp4+0xcc> + .long 0x1a000023 // bne 4994 <sk_load_4444_dst_vfp4+0xcc> .long 0xf464074f // vld1.16 {d16}, [r4] .long 0xf3d00a30 // vmovl.u16 q8, d16 .long 0xe28f40e4 // add r4, pc, #228 @@ -12439,12 +12613,12 @@ _sk_load_4444_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xe2065003 // and r5, r6, #3 .long 0xe3550001 // cmp r5, #1 - .long 0x0a000011 // beq 4878 <sk_load_4444_dst_vfp4+0x120> + .long 0x0a000011 // beq 49e8 <sk_load_4444_dst_vfp4+0x120> .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe3550002 // cmp r5, #2 - .long 0x0a000005 // beq 4854 <sk_load_4444_dst_vfp4+0xfc> + .long 0x0a000005 // beq 49c4 <sk_load_4444_dst_vfp4+0xfc> .long 0xe3550003 // cmp r5, #3 - .long 0x1affffd4 // bne 4798 <sk_load_4444_dst_vfp4+0x40> + .long 0x1affffd4 // bne 4908 <sk_load_4444_dst_vfp4+0x40> .long 0xe3a05000 // mov r5, #0 .long 0xee805bb0 // vdup.16 d16, r5 .long 0xe2845004 // add r5, r4, #4 @@ -12457,11 +12631,11 @@ _sk_load_4444_dst_vfp4: .long 0xf3f62121 // vuzp.16 d18, d17 .long 0xf2f004a2 // vext.8 d16, d16, d18, #4 .long 0xf2f004a0 // vext.8 d16, d16, d16, #4 - .long 0xeaffffc7 // b 4798 <sk_load_4444_dst_vfp4+0x40> + .long 0xeaffffc7 // b 4908 <sk_load_4444_dst_vfp4+0x40> .long 0xe3a05000 // mov r5, #0 .long 0xee805bb0 // vdup.16 d16, r5 .long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16] - .long 0xeaffffc3 // b 4798 <sk_load_4444_dst_vfp4+0x40> + .long 0xeaffffc3 // b 4908 <sk_load_4444_dst_vfp4+0x40> .long 0x37888889 // .word 0x37888889 .long 0x37888889 // .word 0x37888889 .long 0x37888889 // .word 0x37888889 @@ -12584,7 +12758,7 @@ _sk_store_4444_vfp4: .long 0xf26001f6 // vorr q8, q8, q11 .long 0xf26001f2 // vorr q8, q8, q9 .long 0xf3f60220 // vmovn.i32 d16, q8 - .long 0x1a000004 // bne 4a60 <sk_store_4444_vfp4+0x90> + .long 0x1a000004 // bne 4bd0 <sk_store_4444_vfp4+0x90> .long 0xf442074f // vst1.16 {d16}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -12592,11 +12766,11 @@ _sk_store_4444_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a00000c // beq 4aa0 <sk_store_4444_vfp4+0xd0> + .long 0x0a00000c // beq 4c10 <sk_store_4444_vfp4+0xd0> .long 0xe3530002 // cmp r3, #2 - .long 0x0a000003 // beq 4a84 <sk_store_4444_vfp4+0xb4> + .long 0x0a000003 // beq 4bf4 <sk_store_4444_vfp4+0xb4> .long 0xe3530003 // cmp r3, #3 - .long 0x1afffff4 // bne 4a50 <sk_store_4444_vfp4+0x80> + .long 0x1afffff4 // bne 4bc0 <sk_store_4444_vfp4+0x80> .long 0xe2823004 // add r3, r2, #4 .long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16] .long 0xee903bb0 // vmov.u16 r3, d16[0] @@ -12605,9 +12779,9 @@ _sk_store_4444_vfp4: .long 0xee204b90 // vmov.32 d16[1], r4 .long 0xf3f60121 // vuzp.16 d16, d17 .long 0xf4c2080f // vst1.32 {d16[0]}, [r2] - .long 0xeaffffeb // b 4a50 <sk_store_4444_vfp4+0x80> + .long 0xeaffffeb // b 4bc0 <sk_store_4444_vfp4+0x80> .long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16] - .long 0xeaffffe9 // b 4a50 <sk_store_4444_vfp4+0x80> + .long 0xeaffffe9 // b 4bc0 <sk_store_4444_vfp4+0x80> HIDDEN _sk_load_8888_vfp4 .globl _sk_load_8888_vfp4 @@ -12623,7 +12797,7 @@ _sk_load_8888_vfp4: .long 0xe0020392 // mul r2, r2, r3 .long 0xe0842102 // add r2, r4, r2, lsl #2 .long 0xe082210e // add r2, r2, lr, lsl #2 - .long 0x1a000015 // bne 4b2c <sk_load_8888_vfp4+0x84> + .long 0x1a000015 // bne 4c9c <sk_load_8888_vfp4+0x84> .long 0xf4620a8f // vld1.32 {d16-d17}, [r2] .long 0xf3c7205f // vmov.i32 q9, #255 .long 0xe28f209c // add r2, pc, #156 @@ -12648,12 +12822,12 @@ _sk_load_8888_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a00000c // beq 4b6c <sk_load_8888_vfp4+0xc4> + .long 0x0a00000c // beq 4cdc <sk_load_8888_vfp4+0xc4> .long 0xf2c00050 // vmov.i32 q8, #0 .long 0xe3530002 // cmp r3, #2 - .long 0x0a000005 // beq 4b5c <sk_load_8888_vfp4+0xb4> + .long 0x0a000005 // beq 4ccc <sk_load_8888_vfp4+0xb4> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffe2 // bne 4ad8 <sk_load_8888_vfp4+0x30> + .long 0x1affffe2 // bne 4c48 <sk_load_8888_vfp4+0x30> .long 0xe3a03000 // mov r3, #0 .long 0xeea03b90 // vdup.32 q8, r3 .long 0xe2823008 // add r3, r2, #8 @@ -12661,11 +12835,11 @@ _sk_load_8888_vfp4: .long 0xedd22b00 // vldr d18, [r2] .long 0xf2f008e2 // vext.8 q8, q8, q9, #8 .long 0xf2f008e0 // vext.8 q8, q8, q8, #8 - .long 0xeaffffda // b 4ad8 <sk_load_8888_vfp4+0x30> + .long 0xeaffffda // b 4c48 <sk_load_8888_vfp4+0x30> .long 0xe3a03000 // mov r3, #0 .long 0xeea03b90 // vdup.32 q8, r3 .long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32] - .long 0xeaffffd6 // b 4ad8 <sk_load_8888_vfp4+0x30> + .long 0xeaffffd6 // b 4c48 <sk_load_8888_vfp4+0x30> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -12689,7 +12863,7 @@ _sk_load_8888_dst_vfp4: .long 0xe0824103 // add r4, r2, r3, lsl #2 .long 0xe2802020 // add r2, r0, #32 .long 0xe2803010 // add r3, r0, #16 - .long 0x1a00001a // bne 4c34 <sk_load_8888_dst_vfp4+0xa4> + .long 0x1a00001a // bne 4da4 <sk_load_8888_dst_vfp4+0xa4> .long 0xf4640a8f // vld1.32 {d16-d17}, [r4] .long 0xf3c7205f // vmov.i32 q9, #255 .long 0xe28f40b0 // add r4, pc, #176 @@ -12719,12 +12893,12 @@ _sk_load_8888_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xe2065003 // and r5, r6, #3 .long 0xe3550001 // cmp r5, #1 - .long 0x0a00000c // beq 4c74 <sk_load_8888_dst_vfp4+0xe4> + .long 0x0a00000c // beq 4de4 <sk_load_8888_dst_vfp4+0xe4> .long 0xf2c00050 // vmov.i32 q8, #0 .long 0xe3550002 // cmp r5, #2 - .long 0x0a000005 // beq 4c64 <sk_load_8888_dst_vfp4+0xd4> + .long 0x0a000005 // beq 4dd4 <sk_load_8888_dst_vfp4+0xd4> .long 0xe3550003 // cmp r5, #3 - .long 0x1affffdd // bne 4bcc <sk_load_8888_dst_vfp4+0x3c> + .long 0x1affffdd // bne 4d3c <sk_load_8888_dst_vfp4+0x3c> .long 0xe3a05000 // mov r5, #0 .long 0xeea05b90 // vdup.32 q8, r5 .long 0xe2845008 // add r5, r4, #8 @@ -12732,11 +12906,11 @@ _sk_load_8888_dst_vfp4: .long 0xedd42b00 // vldr d18, [r4] .long 0xf2f008e2 // vext.8 q8, q8, q9, #8 .long 0xf2f008e0 // vext.8 q8, q8, q8, #8 - .long 0xeaffffd5 // b 4bcc <sk_load_8888_dst_vfp4+0x3c> + .long 0xeaffffd5 // b 4d3c <sk_load_8888_dst_vfp4+0x3c> .long 0xe3a05000 // mov r5, #0 .long 0xeea05b90 // vdup.32 q8, r5 .long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32] - .long 0xeaffffd1 // b 4bcc <sk_load_8888_dst_vfp4+0x3c> + .long 0xeaffffd1 // b 4d3c <sk_load_8888_dst_vfp4+0x3c> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -12826,7 +13000,7 @@ _sk_store_8888_vfp4: .long 0xf2f84576 // vshl.s32 q10, q11, #24 .long 0xf26001f2 // vorr q8, q8, q9 .long 0xf26001f4 // vorr q8, q8, q10 - .long 0x1a000004 // bne 4dd8 <sk_store_8888_vfp4+0x90> + .long 0x1a000004 // bne 4f48 <sk_store_8888_vfp4+0x90> .long 0xf4420a8f // vst1.32 {d16-d17}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -12834,17 +13008,17 @@ _sk_store_8888_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a000007 // beq 4e04 <sk_store_8888_vfp4+0xbc> + .long 0x0a000007 // beq 4f74 <sk_store_8888_vfp4+0xbc> .long 0xe3530002 // cmp r3, #2 - .long 0x0a000003 // beq 4dfc <sk_store_8888_vfp4+0xb4> + .long 0x0a000003 // beq 4f6c <sk_store_8888_vfp4+0xb4> .long 0xe3530003 // cmp r3, #3 - .long 0x1afffff4 // bne 4dc8 <sk_store_8888_vfp4+0x80> + .long 0x1afffff4 // bne 4f38 <sk_store_8888_vfp4+0x80> .long 0xe2823008 // add r3, r2, #8 .long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32] .long 0xedc20b00 // vstr d16, [r2] - .long 0xeafffff0 // b 4dc8 <sk_store_8888_vfp4+0x80> + .long 0xeafffff0 // b 4f38 <sk_store_8888_vfp4+0x80> .long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32] - .long 0xeaffffee // b 4dc8 <sk_store_8888_vfp4+0x80> + .long 0xeaffffee // b 4f38 <sk_store_8888_vfp4+0x80> .long 0xe320f000 // nop {0} .long 0x437f0000 // .word 0x437f0000 .long 0x437f0000 // .word 0x437f0000 @@ -12865,7 +13039,7 @@ _sk_load_bgra_vfp4: .long 0xe0020392 // mul r2, r2, r3 .long 0xe0842102 // add r2, r4, r2, lsl #2 .long 0xe082210e // add r2, r2, lr, lsl #2 - .long 0x1a000015 // bne 4ea4 <sk_load_bgra_vfp4+0x84> + .long 0x1a000015 // bne 5014 <sk_load_bgra_vfp4+0x84> .long 0xf4620a8f // vld1.32 {d16-d17}, [r2] .long 0xf3c7205f // vmov.i32 q9, #255 .long 0xe28f209c // add r2, pc, #156 @@ -12890,12 +13064,12 @@ _sk_load_bgra_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a00000c // beq 4ee4 <sk_load_bgra_vfp4+0xc4> + .long 0x0a00000c // beq 5054 <sk_load_bgra_vfp4+0xc4> .long 0xf2c00050 // vmov.i32 q8, #0 .long 0xe3530002 // cmp r3, #2 - .long 0x0a000005 // beq 4ed4 <sk_load_bgra_vfp4+0xb4> + .long 0x0a000005 // beq 5044 <sk_load_bgra_vfp4+0xb4> .long 0xe3530003 // cmp r3, #3 - .long 0x1affffe2 // bne 4e50 <sk_load_bgra_vfp4+0x30> + .long 0x1affffe2 // bne 4fc0 <sk_load_bgra_vfp4+0x30> .long 0xe3a03000 // mov r3, #0 .long 0xeea03b90 // vdup.32 q8, r3 .long 0xe2823008 // add r3, r2, #8 @@ -12903,11 +13077,11 @@ _sk_load_bgra_vfp4: .long 0xedd22b00 // vldr d18, [r2] .long 0xf2f008e2 // vext.8 q8, q8, q9, #8 .long 0xf2f008e0 // vext.8 q8, q8, q8, #8 - .long 0xeaffffda // b 4e50 <sk_load_bgra_vfp4+0x30> + .long 0xeaffffda // b 4fc0 <sk_load_bgra_vfp4+0x30> .long 0xe3a03000 // mov r3, #0 .long 0xeea03b90 // vdup.32 q8, r3 .long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32] - .long 0xeaffffd6 // b 4e50 <sk_load_bgra_vfp4+0x30> + .long 0xeaffffd6 // b 4fc0 <sk_load_bgra_vfp4+0x30> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -12931,7 +13105,7 @@ _sk_load_bgra_dst_vfp4: .long 0xe0824103 // add r4, r2, r3, lsl #2 .long 0xe2802020 // add r2, r0, #32 .long 0xe2803010 // add r3, r0, #16 - .long 0x1a00001a // bne 4fac <sk_load_bgra_dst_vfp4+0xa4> + .long 0x1a00001a // bne 511c <sk_load_bgra_dst_vfp4+0xa4> .long 0xf4640a8f // vld1.32 {d16-d17}, [r4] .long 0xf3c7205f // vmov.i32 q9, #255 .long 0xe28f40b0 // add r4, pc, #176 @@ -12961,12 +13135,12 @@ _sk_load_bgra_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xe2065003 // and r5, r6, #3 .long 0xe3550001 // cmp r5, #1 - .long 0x0a00000c // beq 4fec <sk_load_bgra_dst_vfp4+0xe4> + .long 0x0a00000c // beq 515c <sk_load_bgra_dst_vfp4+0xe4> .long 0xf2c00050 // vmov.i32 q8, #0 .long 0xe3550002 // cmp r5, #2 - .long 0x0a000005 // beq 4fdc <sk_load_bgra_dst_vfp4+0xd4> + .long 0x0a000005 // beq 514c <sk_load_bgra_dst_vfp4+0xd4> .long 0xe3550003 // cmp r5, #3 - .long 0x1affffdd // bne 4f44 <sk_load_bgra_dst_vfp4+0x3c> + .long 0x1affffdd // bne 50b4 <sk_load_bgra_dst_vfp4+0x3c> .long 0xe3a05000 // mov r5, #0 .long 0xeea05b90 // vdup.32 q8, r5 .long 0xe2845008 // add r5, r4, #8 @@ -12974,11 +13148,11 @@ _sk_load_bgra_dst_vfp4: .long 0xedd42b00 // vldr d18, [r4] .long 0xf2f008e2 // vext.8 q8, q8, q9, #8 .long 0xf2f008e0 // vext.8 q8, q8, q8, #8 - .long 0xeaffffd5 // b 4f44 <sk_load_bgra_dst_vfp4+0x3c> + .long 0xeaffffd5 // b 50b4 <sk_load_bgra_dst_vfp4+0x3c> .long 0xe3a05000 // mov r5, #0 .long 0xeea05b90 // vdup.32 q8, r5 .long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32] - .long 0xeaffffd1 // b 4f44 <sk_load_bgra_dst_vfp4+0x3c> + .long 0xeaffffd1 // b 50b4 <sk_load_bgra_dst_vfp4+0x3c> .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -13068,7 +13242,7 @@ _sk_store_bgra_vfp4: .long 0xf2f84576 // vshl.s32 q10, q11, #24 .long 0xf26001f2 // vorr q8, q8, q9 .long 0xf26001f4 // vorr q8, q8, q10 - .long 0x1a000004 // bne 5150 <sk_store_bgra_vfp4+0x90> + .long 0x1a000004 // bne 52c0 <sk_store_bgra_vfp4+0x90> .long 0xf4420a8f // vst1.32 {d16-d17}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -13076,17 +13250,17 @@ _sk_store_bgra_vfp4: .long 0xe12fff12 // bx r2 .long 0xe20c3003 // and r3, ip, #3 .long 0xe3530001 // cmp r3, #1 - .long 0x0a000007 // beq 517c <sk_store_bgra_vfp4+0xbc> + .long 0x0a000007 // beq 52ec <sk_store_bgra_vfp4+0xbc> .long 0xe3530002 // cmp r3, #2 - .long 0x0a000003 // beq 5174 <sk_store_bgra_vfp4+0xb4> + .long 0x0a000003 // beq 52e4 <sk_store_bgra_vfp4+0xb4> .long 0xe3530003 // cmp r3, #3 - .long 0x1afffff4 // bne 5140 <sk_store_bgra_vfp4+0x80> + .long 0x1afffff4 // bne 52b0 <sk_store_bgra_vfp4+0x80> .long 0xe2823008 // add r3, r2, #8 .long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32] .long 0xedc20b00 // vstr d16, [r2] - .long 0xeafffff0 // b 5140 <sk_store_bgra_vfp4+0x80> + .long 0xeafffff0 // b 52b0 <sk_store_bgra_vfp4+0x80> .long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32] - .long 0xeaffffee // b 5140 <sk_store_bgra_vfp4+0x80> + .long 0xeaffffee // b 52b0 <sk_store_bgra_vfp4+0x80> .long 0xe320f000 // nop {0} .long 0x437f0000 // .word 0x437f0000 .long 0x437f0000 // .word 0x437f0000 @@ -13107,7 +13281,7 @@ _sk_load_f16_vfp4: .long 0xe0020293 // mul r2, r3, r2 .long 0xe0842182 // add r2, r4, r2, lsl #3 .long 0xe082318e // add r3, r2, lr, lsl #3 - .long 0x1a000008 // bne 51e8 <sk_load_f16_vfp4+0x50> + .long 0x1a000008 // bne 5358 <sk_load_f16_vfp4+0x50> .long 0xf463004f // vld4.16 {d16-d19}, [r3] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xf3b60720 // vcvt.f32.f16 q0, d16 @@ -13119,14 +13293,14 @@ _sk_load_f16_vfp4: .long 0xe12fff12 // bx r2 .long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3] .long 0xe35c0001 // cmp ip, #1 - .long 0x0afffff4 // beq 51c8 <sk_load_f16_vfp4+0x30> + .long 0x0afffff4 // beq 5338 <sk_load_f16_vfp4+0x30> .long 0xe2832008 // add r2, r3, #8 .long 0xe35c0003 // cmp ip, #3 .long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2] - .long 0x3afffff0 // bcc 51c8 <sk_load_f16_vfp4+0x30> + .long 0x3afffff0 // bcc 5338 <sk_load_f16_vfp4+0x30> .long 0xe2832010 // add r2, r3, #16 .long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2] - .long 0xeaffffed // b 51c8 <sk_load_f16_vfp4+0x30> + .long 0xeaffffed // b 5338 <sk_load_f16_vfp4+0x30> HIDDEN _sk_load_f16_dst_vfp4 .globl _sk_load_f16_dst_vfp4 @@ -13145,7 +13319,7 @@ _sk_load_f16_dst_vfp4: .long 0xe0825183 // add r5, r2, r3, lsl #3 .long 0xe2802020 // add r2, r0, #32 .long 0xe2803010 // add r3, r0, #16 - .long 0x1a00000d // bne 5280 <sk_load_f16_dst_vfp4+0x70> + .long 0x1a00000d // bne 53f0 <sk_load_f16_dst_vfp4+0x70> .long 0xf465004f // vld4.16 {d16-d19}, [r5] .long 0xf3f64720 // vcvt.f32.f16 q10, d16 .long 0xf3f66721 // vcvt.f32.f16 q11, d17 @@ -13162,14 +13336,14 @@ _sk_load_f16_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xf4e5070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r5] .long 0xe3560001 // cmp r6, #1 - .long 0x0affffef // beq 524c <sk_load_f16_dst_vfp4+0x3c> + .long 0x0affffef // beq 53bc <sk_load_f16_dst_vfp4+0x3c> .long 0xe2854008 // add r4, r5, #8 .long 0xe3560003 // cmp r6, #3 .long 0xf4e4074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r4] - .long 0x3affffeb // bcc 524c <sk_load_f16_dst_vfp4+0x3c> + .long 0x3affffeb // bcc 53bc <sk_load_f16_dst_vfp4+0x3c> .long 0xe2854010 // add r4, r5, #16 .long 0xf4e4078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r4] - .long 0xeaffffe8 // b 524c <sk_load_f16_dst_vfp4+0x3c> + .long 0xeaffffe8 // b 53bc <sk_load_f16_dst_vfp4+0x3c> HIDDEN _sk_gather_f16_vfp4 .globl _sk_gather_f16_vfp4 @@ -13230,7 +13404,7 @@ _sk_store_f16_vfp4: .long 0xe0020392 // mul r2, r2, r3 .long 0xe0842182 // add r2, r4, r2, lsl #3 .long 0xe082218e // add r2, r2, lr, lsl #3 - .long 0x1a000004 // bne 5388 <sk_store_f16_vfp4+0x50> + .long 0x1a000004 // bne 54f8 <sk_store_f16_vfp4+0x50> .long 0xf442004f // vst4.16 {d16-d19}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -13238,14 +13412,14 @@ _sk_store_f16_vfp4: .long 0xe12fff12 // bx r2 .long 0xe35c0001 // cmp ip, #1 .long 0xf4c2070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r2] - .long 0x0afffff8 // beq 5378 <sk_store_f16_vfp4+0x40> + .long 0x0afffff8 // beq 54e8 <sk_store_f16_vfp4+0x40> .long 0xe2823008 // add r3, r2, #8 .long 0xe35c0003 // cmp ip, #3 .long 0xf4c3074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r3] - .long 0x3afffff4 // bcc 5378 <sk_store_f16_vfp4+0x40> + .long 0x3afffff4 // bcc 54e8 <sk_store_f16_vfp4+0x40> .long 0xe2822010 // add r2, r2, #16 .long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2] - .long 0xeafffff1 // b 5378 <sk_store_f16_vfp4+0x40> + .long 0xeafffff1 // b 54e8 <sk_store_f16_vfp4+0x40> HIDDEN _sk_load_u16_be_vfp4 .globl _sk_load_u16_be_vfp4 @@ -13261,7 +13435,7 @@ _sk_load_u16_be_vfp4: .long 0xe0020293 // mul r2, r3, r2 .long 0xe0842082 // add r2, r4, r2, lsl #1 .long 0xe082318e // add r3, r2, lr, lsl #3 - .long 0x1a00001e // bne 5458 <sk_load_u16_be_vfp4+0xa8> + .long 0x1a00001e // bne 55c8 <sk_load_u16_be_vfp4+0xa8> .long 0xf463004f // vld4.16 {d16-d19}, [r3] .long 0xf3d84030 // vshr.u16 d20, d16, #8 .long 0xe28f2094 // add r2, pc, #148 @@ -13295,14 +13469,14 @@ _sk_load_u16_be_vfp4: .long 0xe12fff12 // bx r2 .long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3] .long 0xe35c0001 // cmp ip, #1 - .long 0x0affffde // beq 53e0 <sk_load_u16_be_vfp4+0x30> + .long 0x0affffde // beq 5550 <sk_load_u16_be_vfp4+0x30> .long 0xe2832008 // add r2, r3, #8 .long 0xe35c0003 // cmp ip, #3 .long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2] - .long 0x3affffda // bcc 53e0 <sk_load_u16_be_vfp4+0x30> + .long 0x3affffda // bcc 5550 <sk_load_u16_be_vfp4+0x30> .long 0xe2832010 // add r2, r3, #16 .long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2] - .long 0xeaffffd7 // b 53e0 <sk_load_u16_be_vfp4+0x30> + .long 0xeaffffd7 // b 5550 <sk_load_u16_be_vfp4+0x30> .long 0x37800080 // .word 0x37800080 .long 0x37800080 // .word 0x37800080 .long 0x37800080 // .word 0x37800080 @@ -13323,7 +13497,7 @@ _sk_load_rgb_u16_be_vfp4: .long 0xe08e308e // add r3, lr, lr, lsl #1 .long 0xe0842082 // add r2, r4, r2, lsl #1 .long 0xe0823083 // add r3, r2, r3, lsl #1 - .long 0x1a00001a // bne 552c <sk_load_rgb_u16_be_vfp4+0x9c> + .long 0x1a00001a // bne 569c <sk_load_rgb_u16_be_vfp4+0x9c> .long 0xf463044f // vld3.16 {d16-d18}, [r3] .long 0xf3d84030 // vshr.u16 d20, d16, #8 .long 0xe28f2088 // add r2, pc, #136 @@ -13353,14 +13527,14 @@ _sk_load_rgb_u16_be_vfp4: .long 0xe12fff12 // bx r2 .long 0xf4e3060f // vld3.16 {d16[0],d17[0],d18[0]}, [r3] .long 0xe35c0001 // cmp ip, #1 - .long 0x0affffe2 // beq 54c4 <sk_load_rgb_u16_be_vfp4+0x34> + .long 0x0affffe2 // beq 5634 <sk_load_rgb_u16_be_vfp4+0x34> .long 0xe2832006 // add r2, r3, #6 .long 0xe35c0003 // cmp ip, #3 .long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2] - .long 0x3affffde // bcc 54c4 <sk_load_rgb_u16_be_vfp4+0x34> + .long 0x3affffde // bcc 5634 <sk_load_rgb_u16_be_vfp4+0x34> .long 0xe283200c // add r2, r3, #12 .long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2] - .long 0xeaffffdb // b 54c4 <sk_load_rgb_u16_be_vfp4+0x34> + .long 0xeaffffdb // b 5634 <sk_load_rgb_u16_be_vfp4+0x34> .long 0xe320f000 // nop {0} .long 0x37800080 // .word 0x37800080 .long 0x37800080 // .word 0x37800080 @@ -13415,7 +13589,7 @@ _sk_store_u16_be_vfp4: .long 0xf2d84534 // vshl.s16 d20, d20, #8 .long 0xf26811b7 // vorr d17, d24, d23 .long 0xf26401b9 // vorr d16, d20, d25 - .long 0x1a000004 // bne 5630 <sk_store_u16_be_vfp4+0xb8> + .long 0x1a000004 // bne 57a0 <sk_store_u16_be_vfp4+0xb8> .long 0xf443004f // vst4.16 {d16-d19}, [r3] .long 0xe5912004 // ldr r2, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -13423,14 +13597,14 @@ _sk_store_u16_be_vfp4: .long 0xe12fff12 // bx r2 .long 0xe35c0001 // cmp ip, #1 .long 0xf4c3070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3] - .long 0x0afffff8 // beq 5620 <sk_store_u16_be_vfp4+0xa8> + .long 0x0afffff8 // beq 5790 <sk_store_u16_be_vfp4+0xa8> .long 0xe2832008 // add r2, r3, #8 .long 0xe35c0003 // cmp ip, #3 .long 0xf4c2074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2] - .long 0x3afffff4 // bcc 5620 <sk_store_u16_be_vfp4+0xa8> + .long 0x3afffff4 // bcc 5790 <sk_store_u16_be_vfp4+0xa8> .long 0xe2832010 // add r2, r3, #16 .long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2] - .long 0xeafffff1 // b 5620 <sk_store_u16_be_vfp4+0xa8> + .long 0xeafffff1 // b 5790 <sk_store_u16_be_vfp4+0xa8> .long 0x477fff00 // .word 0x477fff00 .long 0x477fff00 // .word 0x477fff00 .long 0x477fff00 // .word 0x477fff00 @@ -13450,7 +13624,7 @@ _sk_load_f32_vfp4: .long 0xe0020392 // mul r2, r2, r3 .long 0xe0842102 // add r2, r4, r2, lsl #2 .long 0xe082220e // add r2, r2, lr, lsl #4 - .long 0x1a000009 // bne 56bc <sk_load_f32_vfp4+0x54> + .long 0x1a000009 // bne 582c <sk_load_f32_vfp4+0x54> .long 0xf462018d // vld4.32 {d16,d18,d20,d22}, [r2]! .long 0xf462118f // vld4.32 {d17,d19,d21,d23}, [r2] .long 0xf22001f0 // vorr q0, q8, q8 @@ -13463,14 +13637,14 @@ _sk_load_f32_vfp4: .long 0xe12fff12 // bx r2 .long 0xf4a20b4f // vld4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2] .long 0xe35c0001 // cmp ip, #1 - .long 0x0afffff8 // beq 56ac <sk_load_f32_vfp4+0x44> + .long 0x0afffff8 // beq 581c <sk_load_f32_vfp4+0x44> .long 0xe2823010 // add r3, r2, #16 .long 0xe35c0003 // cmp ip, #3 .long 0xf4a30bcf // vld4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3] - .long 0x3afffff4 // bcc 56ac <sk_load_f32_vfp4+0x44> + .long 0x3afffff4 // bcc 581c <sk_load_f32_vfp4+0x44> .long 0xe2822020 // add r2, r2, #32 .long 0xf4a21b4f // vld4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2] - .long 0xeafffff1 // b 56ac <sk_load_f32_vfp4+0x44> + .long 0xeafffff1 // b 581c <sk_load_f32_vfp4+0x44> HIDDEN _sk_load_f32_dst_vfp4 .globl _sk_load_f32_dst_vfp4 @@ -13489,7 +13663,7 @@ _sk_load_f32_dst_vfp4: .long 0xe0824203 // add r4, r2, r3, lsl #4 .long 0xe2802020 // add r2, r0, #32 .long 0xe2803010 // add r3, r0, #16 - .long 0x1a00000e // bne 5758 <sk_load_f32_dst_vfp4+0x74> + .long 0x1a00000e // bne 58c8 <sk_load_f32_dst_vfp4+0x74> .long 0xf464818d // vld4.32 {d24,d26,d28,d30}, [r4]! .long 0xf464918f // vld4.32 {d25,d27,d29,d31}, [r4] .long 0xf26801f8 // vorr q8, q12, q12 @@ -13507,14 +13681,14 @@ _sk_load_f32_dst_vfp4: .long 0xe12fff13 // bx r3 .long 0xf4e40b4f // vld4.32 {d16[0],d18[0],d20[0],d22[0]}, [r4] .long 0xe3560001 // cmp r6, #1 - .long 0x0afffff3 // beq 5734 <sk_load_f32_dst_vfp4+0x50> + .long 0x0afffff3 // beq 58a4 <sk_load_f32_dst_vfp4+0x50> .long 0xe2845010 // add r5, r4, #16 .long 0xe3560003 // cmp r6, #3 .long 0xf4e50bcf // vld4.32 {d16[1],d18[1],d20[1],d22[1]}, [r5] - .long 0x3affffef // bcc 5734 <sk_load_f32_dst_vfp4+0x50> + .long 0x3affffef // bcc 58a4 <sk_load_f32_dst_vfp4+0x50> .long 0xe2844020 // add r4, r4, #32 .long 0xf4e41b4f // vld4.32 {d17[0],d19[0],d21[0],d23[0]}, [r4] - .long 0xeaffffec // b 5734 <sk_load_f32_dst_vfp4+0x50> + .long 0xeaffffec // b 58a4 <sk_load_f32_dst_vfp4+0x50> HIDDEN _sk_store_f32_vfp4 .globl _sk_store_f32_vfp4 @@ -13530,7 +13704,7 @@ _sk_store_f32_vfp4: .long 0xe0020392 // mul r2, r2, r3 .long 0xe0842102 // add r2, r4, r2, lsl #2 .long 0xe082220e // add r2, r2, lr, lsl #4 - .long 0x1a000005 // bne 57c4 <sk_store_f32_vfp4+0x44> + .long 0x1a000005 // bne 5934 <sk_store_f32_vfp4+0x44> .long 0xf402018d // vst4.32 {d0,d2,d4,d6}, [r2]! .long 0xf402118f // vst4.32 {d1,d3,d5,d7}, [r2] .long 0xe5912004 // ldr r2, [r1, #4] @@ -13539,14 +13713,14 @@ _sk_store_f32_vfp4: .long 0xe12fff12 // bx r2 .long 0xe35c0001 // cmp ip, #1 .long 0xf4820b4f // vst4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2] - .long 0x0afffff8 // beq 57b4 <sk_store_f32_vfp4+0x34> + .long 0x0afffff8 // beq 5924 <sk_store_f32_vfp4+0x34> .long 0xe2823010 // add r3, r2, #16 .long 0xe35c0003 // cmp ip, #3 .long 0xf4830bcf // vst4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3] - .long 0x3afffff4 // bcc 57b4 <sk_store_f32_vfp4+0x34> + .long 0x3afffff4 // bcc 5924 <sk_store_f32_vfp4+0x34> .long 0xe2822020 // add r2, r2, #32 .long 0xf4821b4f // vst4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2] - .long 0xeafffff1 // b 57b4 <sk_store_f32_vfp4+0x34> + .long 0xeafffff1 // b 5924 <sk_store_f32_vfp4+0x34> HIDDEN _sk_clamp_x_vfp4 .globl _sk_clamp_x_vfp4 @@ -14227,7 +14401,7 @@ _sk_gradient_vfp4: .long 0xf2c00050 // vmov.i32 q8, #0 .long 0xe5931000 // ldr r1, [r3] .long 0xe3510002 // cmp r1, #2 - .long 0x3a00000a // bcc 612c <sk_gradient_vfp4+0x5c> + .long 0x3a00000a // bcc 629c <sk_gradient_vfp4+0x5c> .long 0xe5932024 // ldr r2, [r3, #36] .long 0xf2c04051 // vmov.i32 q10, #1 .long 0xf2c00050 // vmov.i32 q8, #0 @@ -14238,7 +14412,7 @@ _sk_gradient_vfp4: .long 0xf3468ee8 // vcge.f32 q12, q11, q12 .long 0xf35481f2 // vbsl q12, q10, q9 .long 0xf26808e0 // vadd.i32 q8, q12, q8 - .long 0x1afffff9 // bne 6114 <sk_gradient_vfp4+0x44> + .long 0x1afffff9 // bne 6284 <sk_gradient_vfp4+0x44> .long 0xee315b90 // vmov.32 r5, d17[1] .long 0xe5937010 // ldr r7, [r3, #16] .long 0xee112b90 // vmov.32 r2, d17[0] @@ -15379,7 +15553,7 @@ _sk_clut_3D_vfp4: .long 0xee1e2b10 // vmov.32 r2, d14[0] .long 0xf2660d40 // vsub.f32 q8, q3, q0 .long 0xf2000cf4 // vfma.f32 q0, q8, q10 - .long 0xea000003 // b 7130 <sk_clut_3D_vfp4+0x500> + .long 0xea000003 // b 72a0 <sk_clut_3D_vfp4+0x500> .long 0x3f7ff972 // .word 0x3f7ff972 .long 0x3f7ff972 // .word 0x3f7ff972 .long 0x3f7ff972 // .word 0x3f7ff972 @@ -15884,7 +16058,7 @@ _sk_clut_4D_vfp4: .long 0xf20c0cdc // vfma.f32 q0, q14, q6 .long 0xf260cd4e // vsub.f32 q14, q0, q7 .long 0xf20cecfe // vfma.f32 q7, q14, q15 - .long 0xea000003 // b 7900 <sk_clut_4D_vfp4+0x548> + .long 0xea000003 // b 7a70 <sk_clut_4D_vfp4+0x548> .long 0x3f7ff972 // .word 0x3f7ff972 .long 0x3f7ff972 // .word 0x3f7ff972 .long 0x3f7ff972 // .word 0x3f7ff972 @@ -16616,7 +16790,7 @@ _sk_seed_shader_hsw: .byte 197,249,110,194 // vmovd %edx,%xmm0 .byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,54,173,2,0 // vbroadcastss 0x2ad36(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,13,42,179,2,0 // vbroadcastss 0x2b32a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0 .byte 197,249,110,209 // vmovd %ecx,%xmm2 @@ -16624,7 +16798,7 @@ _sk_seed_shader_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,22,173,2,0 // vbroadcastss 0x2ad16(%rip),%ymm2 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,21,10,179,2,0 // vbroadcastss 0x2b30a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -16643,13 +16817,13 @@ _sk_dither_hsw: .byte 197,121,110,201 // vmovd %ecx,%xmm9 .byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9 .byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9 - .byte 196,98,125,88,21,221,172,2,0 // vpbroadcastd 0x2acdd(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,98,125,88,21,209,178,2,0 // vpbroadcastd 0x2b2d1(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11 .byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11 .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10 - .byte 196,98,125,88,37,194,172,2,0 // vpbroadcastd 0x2acc2(%rip),%ymm12 # 2ae0c <_sk_overlay_sse2_8bit+0x44b> - .byte 196,98,125,88,45,189,172,2,0 // vpbroadcastd 0x2acbd(%rip),%ymm13 # 2ae10 <_sk_overlay_sse2_8bit+0x44f> + .byte 196,98,125,88,37,182,178,2,0 // vpbroadcastd 0x2b2b6(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b> + .byte 196,98,125,88,45,177,178,2,0 // vpbroadcastd 0x2b2b1(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f> .byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14 .byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14 .byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13 @@ -16664,8 +16838,8 @@ _sk_dither_hsw: .byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8 .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,111,172,2,0 // vbroadcastss 0x2ac6f(%rip),%ymm9 # 2ae14 <_sk_overlay_sse2_8bit+0x453> - .byte 196,98,125,24,21,106,172,2,0 // vbroadcastss 0x2ac6a(%rip),%ymm10 # 2ae18 <_sk_overlay_sse2_8bit+0x457> + .byte 196,98,125,24,13,99,178,2,0 // vbroadcastss 0x2b263(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453> + .byte 196,98,125,24,21,94,178,2,0 // vbroadcastss 0x2b25e(%rip),%ymm10 # 2b40c <_sk_overlay_sse2_8bit+0x457> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8 .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 @@ -16699,7 +16873,7 @@ HIDDEN _sk_black_color_hsw FUNCTION(_sk_black_color_hsw) _sk_black_color_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,242,171,2,0 // vbroadcastss 0x2abf2(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,230,177,2,0 // vbroadcastss 0x2b1e6(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 @@ -16710,7 +16884,7 @@ HIDDEN _sk_white_color_hsw FUNCTION(_sk_white_color_hsw) _sk_white_color_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,217,171,2,0 // vbroadcastss 0x2abd9(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,205,177,2,0 // vbroadcastss 0x2b1cd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 197,252,40,216 // vmovaps %ymm0,%ymm3 @@ -16756,7 +16930,7 @@ HIDDEN _sk_srcatop_hsw FUNCTION(_sk_srcatop_hsw) _sk_srcatop_hsw: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,120,171,2,0 // vbroadcastss 0x2ab78(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,108,177,2,0 // vbroadcastss 0x2b16c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0 .byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1 @@ -16772,7 +16946,7 @@ HIDDEN _sk_dstatop_hsw .globl _sk_dstatop_hsw FUNCTION(_sk_dstatop_hsw) _sk_dstatop_hsw: - .byte 196,98,125,24,5,71,171,2,0 // vbroadcastss 0x2ab47(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,59,177,2,0 // vbroadcastss 0x2b13b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -16811,7 +16985,7 @@ HIDDEN _sk_srcout_hsw .globl _sk_srcout_hsw FUNCTION(_sk_srcout_hsw) _sk_srcout_hsw: - .byte 196,98,125,24,5,234,170,2,0 // vbroadcastss 0x2aaea(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,222,176,2,0 // vbroadcastss 0x2b0de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -16824,7 +16998,7 @@ HIDDEN _sk_dstout_hsw .globl _sk_dstout_hsw FUNCTION(_sk_dstout_hsw) _sk_dstout_hsw: - .byte 196,226,125,24,5,201,170,2,0 // vbroadcastss 0x2aac9(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,189,176,2,0 // vbroadcastss 0x2b0bd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -16837,7 +17011,7 @@ HIDDEN _sk_srcover_hsw .globl _sk_srcover_hsw FUNCTION(_sk_srcover_hsw) _sk_srcover_hsw: - .byte 196,98,125,24,5,168,170,2,0 // vbroadcastss 0x2aaa8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,156,176,2,0 // vbroadcastss 0x2b09c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -16850,7 +17024,7 @@ HIDDEN _sk_dstover_hsw .globl _sk_dstover_hsw FUNCTION(_sk_dstover_hsw) _sk_dstover_hsw: - .byte 196,98,125,24,5,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,119,176,2,0 // vbroadcastss 0x2b077(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 .byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -16874,7 +17048,7 @@ HIDDEN _sk_multiply_hsw .globl _sk_multiply_hsw FUNCTION(_sk_multiply_hsw) _sk_multiply_hsw: - .byte 196,98,125,24,5,74,170,2,0 // vbroadcastss 0x2aa4a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,62,176,2,0 // vbroadcastss 0x2b03e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -16897,9 +17071,14 @@ HIDDEN _sk_plus__hsw FUNCTION(_sk_plus__hsw) _sk_plus__hsw: .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 + .byte 196,98,125,24,5,237,175,2,0 // vbroadcastss 0x2afed(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> + .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1 + .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2 + .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3 + .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -16922,7 +17101,7 @@ HIDDEN _sk_xor__hsw .globl _sk_xor__hsw FUNCTION(_sk_xor__hsw) _sk_xor__hsw: - .byte 196,98,125,24,5,193,169,2,0 // vbroadcastss 0x2a9c1(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,152,175,2,0 // vbroadcastss 0x2af98(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -16956,7 +17135,7 @@ _sk_darken_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,69,169,2,0 // vbroadcastss 0x2a945(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,28,175,2,0 // vbroadcastss 0x2af1c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -16981,7 +17160,7 @@ _sk_lighten_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,240,168,2,0 // vbroadcastss 0x2a8f0(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,199,174,2,0 // vbroadcastss 0x2aec7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -17009,7 +17188,7 @@ _sk_difference_hsw: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,143,168,2,0 // vbroadcastss 0x2a88f(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,102,174,2,0 // vbroadcastss 0x2ae66(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -17031,7 +17210,7 @@ _sk_exclusion_hsw: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,73,168,2,0 // vbroadcastss 0x2a849(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,32,174,2,0 // vbroadcastss 0x2ae20(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -17041,7 +17220,7 @@ HIDDEN _sk_colorburn_hsw .globl _sk_colorburn_hsw FUNCTION(_sk_colorburn_hsw) _sk_colorburn_hsw: - .byte 196,98,125,24,5,51,168,2,0 // vbroadcastss 0x2a833(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,10,174,2,0 // vbroadcastss 0x2ae0a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -17099,7 +17278,7 @@ HIDDEN _sk_colordodge_hsw FUNCTION(_sk_colordodge_hsw) _sk_colordodge_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,67,167,2,0 // vbroadcastss 0x2a743(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,13,26,173,2,0 // vbroadcastss 0x2ad1a(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -17152,7 +17331,7 @@ HIDDEN _sk_hardlight_hsw .globl _sk_hardlight_hsw FUNCTION(_sk_hardlight_hsw) _sk_hardlight_hsw: - .byte 196,98,125,24,5,93,166,2,0 // vbroadcastss 0x2a65d(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,52,172,2,0 // vbroadcastss 0x2ac34(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -17203,7 +17382,7 @@ HIDDEN _sk_overlay_hsw .globl _sk_overlay_hsw FUNCTION(_sk_overlay_hsw) _sk_overlay_hsw: - .byte 196,98,125,24,5,145,165,2,0 // vbroadcastss 0x2a591(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,104,171,2,0 // vbroadcastss 0x2ab68(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -17264,10 +17443,10 @@ _sk_softlight_hsw: .byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8 .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,29,172,164,2,0 // vbroadcastss 0x2a4ac(%rip),%ymm11 # 2ae1c <_sk_overlay_sse2_8bit+0x45b> + .byte 196,98,125,24,29,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b> .byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12 .byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8 - .byte 196,98,125,24,37,157,164,2,0 // vbroadcastss 0x2a49d(%rip),%ymm12 # 2ae20 <_sk_overlay_sse2_8bit+0x45f> + .byte 196,98,125,24,37,116,170,2,0 // vbroadcastss 0x2aa74(%rip),%ymm12 # 2b414 <_sk_overlay_sse2_8bit+0x45f> .byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8 .byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14 .byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14 @@ -17277,7 +17456,7 @@ _sk_softlight_hsw: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,76,164,2,0 // vbroadcastss 0x2a44c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,35,170,2,0 // vbroadcastss 0x2aa23(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -17390,11 +17569,11 @@ _sk_hue_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,100,162,2,0 // vbroadcastss 0x2a264(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463> - .byte 196,98,125,24,61,95,162,2,0 // vbroadcastss 0x2a25f(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,53,59,168,2,0 // vbroadcastss 0x2a83b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,61,54,168,2,0 // vbroadcastss 0x2a836(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,80,162,2,0 // vbroadcastss 0x2a250(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,226,125,24,5,39,168,2,0 // vbroadcastss 0x2a827(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -17449,7 +17628,7 @@ _sk_hue_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,17,161,2,0 // vbroadcastss 0x2a111(%rip),%ymm1 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,13,232,166,2,0 // vbroadcastss 0x2a6e8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -17503,11 +17682,11 @@ _sk_saturation_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,68,160,2,0 // vbroadcastss 0x2a044(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463> - .byte 196,98,125,24,61,63,160,2,0 // vbroadcastss 0x2a03f(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,53,27,166,2,0 // vbroadcastss 0x2a61b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,61,22,166,2,0 // vbroadcastss 0x2a616(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,48,160,2,0 // vbroadcastss 0x2a030(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,226,125,24,5,7,166,2,0 // vbroadcastss 0x2a607(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -17562,7 +17741,7 @@ _sk_saturation_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,241,158,2,0 // vbroadcastss 0x29ef1(%rip),%ymm1 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,13,200,164,2,0 // vbroadcastss 0x2a4c8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -17590,11 +17769,11 @@ _sk_color_hsw: .byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8 .byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10 .byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11 - .byte 196,98,125,24,45,166,158,2,0 // vbroadcastss 0x29ea6(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463> - .byte 196,98,125,24,53,161,158,2,0 // vbroadcastss 0x29ea1(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,45,125,164,2,0 // vbroadcastss 0x2a47d(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,53,120,164,2,0 // vbroadcastss 0x2a478(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12 .byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12 - .byte 196,98,125,24,61,146,158,2,0 // vbroadcastss 0x29e92(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,98,125,24,61,105,164,2,0 // vbroadcastss 0x2a469(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -17650,7 +17829,7 @@ _sk_color_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,72,157,2,0 // vbroadcastss 0x29d48(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,31,163,2,0 // vbroadcastss 0x2a31f(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -17678,11 +17857,11 @@ _sk_luminosity_hsw: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10 .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11 - .byte 196,98,125,24,45,253,156,2,0 // vbroadcastss 0x29cfd(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463> - .byte 196,98,125,24,53,248,156,2,0 // vbroadcastss 0x29cf8(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,45,212,162,2,0 // vbroadcastss 0x2a2d4(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,53,207,162,2,0 // vbroadcastss 0x2a2cf(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12 .byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12 - .byte 196,98,125,24,61,233,156,2,0 // vbroadcastss 0x29ce9(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,98,125,24,61,192,162,2,0 // vbroadcastss 0x2a2c0(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -17738,7 +17917,7 @@ _sk_luminosity_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,159,155,2,0 // vbroadcastss 0x29b9f(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,118,161,2,0 // vbroadcastss 0x2a176(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -17768,19 +17947,19 @@ _sk_srcover_rgba_8888_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,180,0,0,0 // jne 137c <_sk_srcover_rgba_8888_hsw+0xd5> + .byte 15,133,180,0,0,0 // jne 1399 <_sk_srcover_rgba_8888_hsw+0xd5> .byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7 - .byte 197,197,219,37,202,156,2,0 // vpand 0x29cca(%rip),%ymm7,%ymm4 # 2afa0 <_sk_overlay_sse2_8bit+0x5df> + .byte 197,197,219,37,173,162,2,0 // vpand 0x2a2ad(%rip),%ymm7,%ymm4 # 2b5a0 <_sk_overlay_sse2_8bit+0x5eb> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,69,0,45,221,156,2,0 // vpshufb 0x29cdd(%rip),%ymm7,%ymm5 # 2afc0 <_sk_overlay_sse2_8bit+0x5ff> + .byte 196,226,69,0,45,192,162,2,0 // vpshufb 0x2a2c0(%rip),%ymm7,%ymm5 # 2b5c0 <_sk_overlay_sse2_8bit+0x60b> .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,69,0,53,240,156,2,0 // vpshufb 0x29cf0(%rip),%ymm7,%ymm6 # 2afe0 <_sk_overlay_sse2_8bit+0x61f> + .byte 196,226,69,0,53,211,162,2,0 // vpshufb 0x2a2d3(%rip),%ymm7,%ymm6 # 2b5e0 <_sk_overlay_sse2_8bit+0x62b> .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,254,154,2,0 // vbroadcastss 0x29afe(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,213,160,2,0 // vbroadcastss 0x2a0d5(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 - .byte 196,98,125,24,13,29,155,2,0 // vbroadcastss 0x29b1d(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,13,244,160,2,0 // vbroadcastss 0x2a0f4(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 @@ -17800,7 +17979,7 @@ _sk_srcover_rgba_8888_hsw: .byte 196,65,53,235,202 // vpor %ymm10,%ymm9,%ymm9 .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 13b3 <_sk_srcover_rgba_8888_hsw+0x10c> + .byte 117,66 // jne 13d0 <_sk_srcover_rgba_8888_hsw+0x10c> .byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -17810,33 +17989,33 @@ _sk_srcover_rgba_8888_hsw: .byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,58,255,255,255 // ja 12ce <_sk_srcover_rgba_8888_hsw+0x27> + .byte 15,135,58,255,255,255 // ja 12eb <_sk_srcover_rgba_8888_hsw+0x27> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,253,0,0,0 // lea 0xfd(%rip),%r11 # 149c <_sk_srcover_rgba_8888_hsw+0x1f5> + .byte 76,141,29,0,1,0,0 // lea 0x100(%rip),%r11 # 14bc <_sk_srcover_rgba_8888_hsw+0x1f8> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7 - .byte 233,27,255,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27> + .byte 233,27,255,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27> .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,180 // ja 1377 <_sk_srcover_rgba_8888_hsw+0xd0> + .byte 119,180 // ja 1394 <_sk_srcover_rgba_8888_hsw+0xd0> .byte 65,15,182,194 // movzbl %r10b,%eax - .byte 76,141,21,234,0,0,0 // lea 0xea(%rip),%r10 # 14b8 <_sk_srcover_rgba_8888_hsw+0x211> + .byte 76,141,21,237,0,0,0 // lea 0xed(%rip),%r10 # 14d8 <_sk_srcover_rgba_8888_hsw+0x214> .byte 73,99,4,130 // movslq (%r10,%rax,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4) - .byte 235,152 // jmp 1377 <_sk_srcover_rgba_8888_hsw+0xd0> + .byte 235,152 // jmp 1394 <_sk_srcover_rgba_8888_hsw+0xd0> .byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4 .byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 .byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7 .byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4 .byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7 - .byte 233,200,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27> + .byte 233,200,254,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27> .byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4 .byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 @@ -17849,10 +18028,10 @@ _sk_srcover_rgba_8888_hsw: .byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7 .byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4 .byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - .byte 233,121,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27> + .byte 233,121,254,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27> .byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) .byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4) - .byte 233,15,255,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xd0> + .byte 233,15,255,255,255 // jmpq 1394 <_sk_srcover_rgba_8888_hsw+0xd0> .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 @@ -17860,33 +18039,35 @@ _sk_srcover_rgba_8888_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4) .byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4) - .byte 233,219,254,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xd0> - .byte 12,255 // or $0xff,%al + .byte 233,219,254,255,255 // jmpq 1394 <_sk_srcover_rgba_8888_hsw+0xd0> + .byte 15,31,0 // nopl (%rax) + .byte 9,255 // or %edi,%edi .byte 255 // (bad) - .byte 255,89,255 // lcall *-0x1(%rcx) + .byte 255,86,255 // callq *-0x1(%rsi) .byte 255 // (bad) - .byte 255,67,255 // incl -0x1(%rbx) + .byte 255,64,255 // incl -0x1(%rax) .byte 255 // (bad) - .byte 255,168,255,255,255,148 // ljmp *-0x6b000001(%rax) + .byte 255,165,255,255,255,145 // jmpq *-0x6e000001(%rbp) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,128,255,255,255,106 // incl 0x6affffff(%rax) .byte 255 // (bad) + .byte 125,255 // jge 14d1 <_sk_srcover_rgba_8888_hsw+0x20d> .byte 255 // (bad) - .byte 255,31 // lcall *(%rdi) + .byte 255,103,255 // jmpq *-0x1(%rdi) .byte 255 // (bad) + .byte 255,28,255 // lcall *(%rdi,%rdi,8) .byte 255 // (bad) - .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp) + .byte 255,162,255,255,255,154 // jmpq *-0x65000001(%rdx) .byte 255 // (bad) .byte 255 // (bad) + .byte 255,214 // callq *%rsi .byte 255 // (bad) - .byte 217,255 // fcos .byte 255 // (bad) - .byte 255,204 // dec %esp + .byte 255,201 // dec %ecx .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 190,255,255,255,176 // mov $0xb0ffffff,%esi + .byte 187,255,255,255,173 // mov $0xadffffff,%ebx .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -17907,7 +18088,7 @@ HIDDEN _sk_clamp_1_hsw .globl _sk_clamp_1_hsw FUNCTION(_sk_clamp_1_hsw) _sk_clamp_1_hsw: - .byte 196,98,125,24,5,10,153,2,0 // vbroadcastss 0x2990a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,222,158,2,0 // vbroadcastss 0x29ede(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -17919,7 +18100,7 @@ HIDDEN _sk_clamp_a_hsw .globl _sk_clamp_a_hsw FUNCTION(_sk_clamp_a_hsw) _sk_clamp_a_hsw: - .byte 196,98,125,24,5,233,152,2,0 // vbroadcastss 0x298e9(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,189,158,2,0 // vbroadcastss 0x29ebd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -17931,7 +18112,7 @@ HIDDEN _sk_clamp_a_dst_hsw .globl _sk_clamp_a_dst_hsw FUNCTION(_sk_clamp_a_dst_hsw) _sk_clamp_a_dst_hsw: - .byte 196,98,125,24,5,203,152,2,0 // vbroadcastss 0x298cb(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,159,158,2,0 // vbroadcastss 0x29e9f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7 .byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4 .byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5 @@ -17964,7 +18145,7 @@ HIDDEN _sk_invert_hsw .globl _sk_invert_hsw FUNCTION(_sk_invert_hsw) _sk_invert_hsw: - .byte 196,98,125,24,5,134,152,2,0 // vbroadcastss 0x29886(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,90,158,2,0 // vbroadcastss 0x29e5a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0 .byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 @@ -18020,7 +18201,7 @@ FUNCTION(_sk_unpremul_hsw) _sk_unpremul_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,22,152,2,0 // vbroadcastss 0x29816(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,21,234,157,2,0 // vbroadcastss 0x29dea(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -18033,16 +18214,16 @@ HIDDEN _sk_from_srgb_hsw .globl _sk_from_srgb_hsw FUNCTION(_sk_from_srgb_hsw) _sk_from_srgb_hsw: - .byte 196,98,125,24,5,35,152,2,0 // vbroadcastss 0x29823(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473> + .byte 196,98,125,24,5,247,157,2,0 // vbroadcastss 0x29df7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,21,152,2,0 // vbroadcastss 0x29815(%rip),%ymm11 # 2ae38 <_sk_overlay_sse2_8bit+0x477> - .byte 196,98,125,24,37,248,151,2,0 // vbroadcastss 0x297f8(%rip),%ymm12 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,29,233,157,2,0 // vbroadcastss 0x29de9(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477> + .byte 196,98,125,24,37,204,157,2,0 // vbroadcastss 0x29dcc(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13 - .byte 196,98,125,24,53,253,151,2,0 // vbroadcastss 0x297fd(%rip),%ymm14 # 2ae3c <_sk_overlay_sse2_8bit+0x47b> + .byte 196,98,125,24,53,209,157,2,0 // vbroadcastss 0x29dd1(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b> .byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13 - .byte 196,98,125,24,21,243,151,2,0 // vbroadcastss 0x297f3(%rip),%ymm10 # 2ae40 <_sk_overlay_sse2_8bit+0x47f> + .byte 196,98,125,24,21,199,157,2,0 // vbroadcastss 0x29dc7(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f> .byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0 .byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -18065,16 +18246,16 @@ HIDDEN _sk_from_srgb_dst_hsw .globl _sk_from_srgb_dst_hsw FUNCTION(_sk_from_srgb_dst_hsw) _sk_from_srgb_dst_hsw: - .byte 196,98,125,24,5,139,151,2,0 // vbroadcastss 0x2978b(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473> + .byte 196,98,125,24,5,95,157,2,0 // vbroadcastss 0x29d5f(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473> .byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9 .byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10 - .byte 196,98,125,24,29,125,151,2,0 // vbroadcastss 0x2977d(%rip),%ymm11 # 2ae38 <_sk_overlay_sse2_8bit+0x477> - .byte 196,98,125,24,37,96,151,2,0 // vbroadcastss 0x29760(%rip),%ymm12 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,29,81,157,2,0 // vbroadcastss 0x29d51(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477> + .byte 196,98,125,24,37,52,157,2,0 // vbroadcastss 0x29d34(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13 - .byte 196,98,125,24,53,101,151,2,0 // vbroadcastss 0x29765(%rip),%ymm14 # 2ae3c <_sk_overlay_sse2_8bit+0x47b> + .byte 196,98,125,24,53,57,157,2,0 // vbroadcastss 0x29d39(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b> .byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13 - .byte 196,98,125,24,21,91,151,2,0 // vbroadcastss 0x2975b(%rip),%ymm10 # 2ae40 <_sk_overlay_sse2_8bit+0x47f> + .byte 196,98,125,24,21,47,157,2,0 // vbroadcastss 0x29d2f(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f> .byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4 .byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4 .byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9 @@ -18098,19 +18279,19 @@ HIDDEN _sk_to_srgb_hsw FUNCTION(_sk_to_srgb_hsw) _sk_to_srgb_hsw: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,255,150,2,0 // vbroadcastss 0x296ff(%rip),%ymm8 # 2ae44 <_sk_overlay_sse2_8bit+0x483> + .byte 196,98,125,24,5,211,156,2,0 // vbroadcastss 0x29cd3(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,245,150,2,0 // vbroadcastss 0x296f5(%rip),%ymm11 # 2ae48 <_sk_overlay_sse2_8bit+0x487> - .byte 196,98,125,24,37,240,150,2,0 // vbroadcastss 0x296f0(%rip),%ymm12 # 2ae4c <_sk_overlay_sse2_8bit+0x48b> + .byte 196,98,125,24,29,201,156,2,0 // vbroadcastss 0x29cc9(%rip),%ymm11 # 2b43c <_sk_overlay_sse2_8bit+0x487> + .byte 196,98,125,24,37,196,156,2,0 // vbroadcastss 0x29cc4(%rip),%ymm12 # 2b440 <_sk_overlay_sse2_8bit+0x48b> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13 - .byte 196,98,125,24,53,225,150,2,0 // vbroadcastss 0x296e1(%rip),%ymm14 # 2ae50 <_sk_overlay_sse2_8bit+0x48f> + .byte 196,98,125,24,53,181,156,2,0 // vbroadcastss 0x29cb5(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f> .byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13 - .byte 196,98,125,24,61,215,150,2,0 // vbroadcastss 0x296d7(%rip),%ymm15 # 2ae54 <_sk_overlay_sse2_8bit+0x493> + .byte 196,98,125,24,61,171,156,2,0 // vbroadcastss 0x29cab(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9 - .byte 196,98,125,24,45,195,150,2,0 // vbroadcastss 0x296c3(%rip),%ymm13 # 2ae58 <_sk_overlay_sse2_8bit+0x497> + .byte 196,98,125,24,45,151,156,2,0 // vbroadcastss 0x29c97(%rip),%ymm13 # 2b44c <_sk_overlay_sse2_8bit+0x497> .byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -18139,31 +18320,31 @@ HIDDEN _sk_rgb_to_hsl_hsw .globl _sk_rgb_to_hsl_hsw FUNCTION(_sk_rgb_to_hsl_hsw) _sk_rgb_to_hsl_hsw: - .byte 197,124,95,193 // vmaxps %ymm1,%ymm0,%ymm8 - .byte 197,60,95,194 // vmaxps %ymm2,%ymm8,%ymm8 - .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 - .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 + .byte 197,116,95,194 // vmaxps %ymm2,%ymm1,%ymm8 + .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8 + .byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9 + .byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,224,149,2,0 // vbroadcastss 0x295e0(%rip),%ymm11 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,29,178,155,2,0 // vbroadcastss 0x29bb2(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13 - .byte 196,98,125,24,53,33,150,2,0 // vbroadcastss 0x29621(%rip),%ymm14 # 2ae5c <_sk_overlay_sse2_8bit+0x49b> + .byte 196,98,125,24,53,243,155,2,0 // vbroadcastss 0x29bf3(%rip),%ymm14 # 2b450 <_sk_overlay_sse2_8bit+0x49b> .byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15 .byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13 .byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12 .byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2 .byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13 - .byte 196,98,125,24,53,8,150,2,0 // vbroadcastss 0x29608(%rip),%ymm14 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3> + .byte 196,98,125,24,53,218,155,2,0 // vbroadcastss 0x29bda(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3> .byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13 - .byte 196,98,125,24,53,246,149,2,0 // vbroadcastss 0x295f6(%rip),%ymm14 # 2ae60 <_sk_overlay_sse2_8bit+0x49f> + .byte 196,98,125,24,53,200,155,2,0 // vbroadcastss 0x29bc8(%rip),%ymm14 # 2b454 <_sk_overlay_sse2_8bit+0x49f> .byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2 .byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1 .byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,29,109,149,2,0 // vbroadcastss 0x2956d(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,29,63,155,2,0 // vbroadcastss 0x29b3f(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2 .byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11 .byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12 @@ -18173,7 +18354,7 @@ _sk_rgb_to_hsl_hsw: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0 .byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - .byte 196,98,125,24,5,156,149,2,0 // vbroadcastss 0x2959c(%rip),%ymm8 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7> + .byte 196,98,125,24,5,110,155,2,0 // vbroadcastss 0x29b6e(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18190,30 +18371,30 @@ _sk_hsl_to_rgb_hsw: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,233 // vmovaps %ymm1,%ymm5 .byte 197,252,40,224 // vmovaps %ymm0,%ymm4 - .byte 196,98,125,24,5,249,148,2,0 // vbroadcastss 0x294f9(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,203,154,2,0 // vbroadcastss 0x29acb(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10 .byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11 .byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9 .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 - .byte 196,98,125,24,13,56,149,2,0 // vbroadcastss 0x29538(%rip),%ymm9 # 2ae60 <_sk_overlay_sse2_8bit+0x49f> + .byte 196,98,125,24,13,10,155,2,0 // vbroadcastss 0x29b0a(%rip),%ymm9 # 2b454 <_sk_overlay_sse2_8bit+0x49f> .byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9 - .byte 196,98,125,24,29,54,149,2,0 // vbroadcastss 0x29536(%rip),%ymm11 # 2ae6c <_sk_overlay_sse2_8bit+0x4ab> + .byte 196,98,125,24,29,8,155,2,0 // vbroadcastss 0x29b08(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab> .byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,45,8,149,2,0 // vbroadcastss 0x29508(%rip),%ymm13 # 2ae5c <_sk_overlay_sse2_8bit+0x49b> + .byte 196,98,125,24,45,218,154,2,0 // vbroadcastss 0x29ada(%rip),%ymm13 # 2b450 <_sk_overlay_sse2_8bit+0x49b> .byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0 - .byte 196,98,125,24,53,2,149,2,0 // vbroadcastss 0x29502(%rip),%ymm14 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3> + .byte 196,98,125,24,53,212,154,2,0 // vbroadcastss 0x29ad4(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3> .byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12 .byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12 - .byte 196,226,125,24,29,252,148,2,0 // vbroadcastss 0x294fc(%rip),%ymm3 # 2ae70 <_sk_overlay_sse2_8bit+0x4af> + .byte 196,226,125,24,29,206,154,2,0 // vbroadcastss 0x29ace(%rip),%ymm3 # 2b464 <_sk_overlay_sse2_8bit+0x4af> .byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7 .byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7 .byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12 .byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,37,211,148,2,0 // vbroadcastss 0x294d3(%rip),%ymm12 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7> + .byte 196,98,125,24,37,165,154,2,0 // vbroadcastss 0x29aa5(%rip),%ymm12 # 2b45c <_sk_overlay_sse2_8bit+0x4a7> .byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15 .byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0 .byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -18229,7 +18410,7 @@ _sk_hsl_to_rgb_hsw: .byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0 .byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7 .byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - .byte 196,226,125,24,5,135,148,2,0 // vbroadcastss 0x29487(%rip),%ymm0 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,226,125,24,5,89,154,2,0 // vbroadcastss 0x29a59(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> .byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0 .byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 @@ -18282,12 +18463,12 @@ _sk_scale_u8_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,59 // jne 1ade <_sk_scale_u8_hsw+0x54> + .byte 117,59 // jne 1b00 <_sk_scale_u8_hsw+0x54> .byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8 - .byte 197,57,219,5,223,156,2,0 // vpand 0x29cdf(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,57,219,5,189,162,2,0 // vpand 0x2a2bd(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,180,147,2,0 // vbroadcastss 0x293b4(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,13,134,153,2,0 // vbroadcastss 0x29986(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -18301,15 +18482,15 @@ _sk_scale_u8_hsw: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,182 // ja 1aa9 <_sk_scale_u8_hsw+0x1f> + .byte 119,182 // ja 1acb <_sk_scale_u8_hsw+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 1b78 <_sk_scale_u8_hsw+0xee> + .byte 76,141,29,124,0,0,0 // lea 0x7c(%rip),%r11 # 1b9c <_sk_scale_u8_hsw+0xf0> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 235,151 // jmp 1aa9 <_sk_scale_u8_hsw+0x1f> + .byte 235,151 // jmp 1acb <_sk_scale_u8_hsw+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -18317,7 +18498,7 @@ _sk_scale_u8_hsw: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,110,255,255,255 // jmpq 1aa9 <_sk_scale_u8_hsw+0x1f> + .byte 233,110,255,255,255 // jmpq 1acb <_sk_scale_u8_hsw+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -18328,22 +18509,113 @@ _sk_scale_u8_hsw: .byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,50,255,255,255 // jmpq 1aa9 <_sk_scale_u8_hsw+0x1f> - .byte 144 // nop - .byte 143 // (bad) + .byte 233,50,255,255,255 // jmpq 1acb <_sk_scale_u8_hsw+0x1f> + .byte 15,31,0 // nopl (%rax) + .byte 141 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,170,255,255,255,154 // ljmp *-0x65000001(%rdx) + .byte 255,168,255,255,255,152 // ljmp *-0x67000001(%rax) .byte 255 // (bad) .byte 255 // (bad) + .byte 255,231 // jmpq *%rdi .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf001b88 <_sk_overlay_sse2_8bit+0xffffffffdefd71c7> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,211 // callq *%rbx + .byte 220,255 // fdivr %st,%st(7) .byte 255 // (bad) + .byte 255,209 // callq *%rcx .byte 255 // (bad) - .byte 255,195 // inc %ebx + .byte 255 // (bad) + .byte 255,193 // inc %ecx + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // .byte 0xff + +HIDDEN _sk_scale_565_hsw +.globl _sk_scale_565_hsw +FUNCTION(_sk_scale_565_hsw) +_sk_scale_565_hsw: + .byte 83 // push %rbx + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 76,99,80,8 // movslq 0x8(%rax),%r10 + .byte 76,99,201 // movslq %ecx,%r9 + .byte 77,15,175,202 // imul %r10,%r9 + .byte 77,1,201 // add %r9,%r9 + .byte 76,3,8 // add (%rax),%r9 + .byte 72,99,218 // movslq %edx,%rbx + .byte 77,133,192 // test %r8,%r8 + .byte 15,133,162,0,0,0 // jne 1c7a <_sk_scale_565_hsw+0xc2> + .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8 + .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 + .byte 196,98,125,88,13,132,152,2,0 // vpbroadcastd 0x29884(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9 + .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 + .byte 196,98,125,24,21,117,152,2,0 // vbroadcastss 0x29875(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 + .byte 196,98,125,88,21,107,152,2,0 // vpbroadcastd 0x2986b(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 + .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 + .byte 196,98,125,24,29,92,152,2,0 // vbroadcastss 0x2985c(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 + .byte 196,98,125,88,29,82,152,2,0 // vpbroadcastd 0x29852(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8 + .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 + .byte 196,98,125,24,29,67,152,2,0 // vbroadcastss 0x29843(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 + .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11 + .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12 + .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12 + .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13 + .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13 + .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11 + .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 + .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1 + .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2 + .byte 197,164,89,219 // vmulps %ymm3,%ymm11,%ymm3 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 91 // pop %rbx + .byte 255,224 // jmpq *%rax + .byte 69,137,194 // mov %r8d,%r10d + .byte 65,128,226,7 // and $0x7,%r10b + .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 + .byte 65,254,202 // dec %r10b + .byte 65,128,250,6 // cmp $0x6,%r10b + .byte 15,135,75,255,255,255 // ja 1bde <_sk_scale_565_hsw+0x26> + .byte 69,15,182,210 // movzbl %r10b,%r10d + .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1d04 <_sk_scale_565_hsw+0x14c> + .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax + .byte 76,1,216 // add %r11,%rax + .byte 255,224 // jmpq *%rax + .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax + .byte 197,121,110,192 // vmovd %eax,%xmm8 + .byte 233,41,255,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26> + .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 + .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9 + .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 + .byte 233,11,255,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26> + .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 + .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9 + .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 + .byte 233,221,254,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26> + .byte 15,31,0 // nopl (%rax) + .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 236 // in (%dx),%al + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,228 // jmpq *%rsp + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 220,255 // fdivr %st,%st(7) + .byte 255 // (bad) + .byte 255,207 // dec %edi .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -18377,12 +18649,12 @@ _sk_lerp_u8_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,79 // jne 1c2b <_sk_lerp_u8_hsw+0x68> + .byte 117,79 // jne 1db7 <_sk_lerp_u8_hsw+0x68> .byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8 - .byte 197,57,219,5,166,155,2,0 // vpand 0x29ba6(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,57,219,5,26,160,2,0 // vpand 0x2a01a(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,123,146,2,0 // vbroadcastss 0x2927b(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,13,227,150,2,0 // vbroadcastss 0x296e3(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -18400,15 +18672,15 @@ _sk_lerp_u8_hsw: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,162 // ja 1be2 <_sk_lerp_u8_hsw+0x1f> + .byte 119,162 // ja 1d6e <_sk_lerp_u8_hsw+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 1cc4 <_sk_lerp_u8_hsw+0x101> + .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 1e50 <_sk_lerp_u8_hsw+0x101> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 235,131 // jmp 1be2 <_sk_lerp_u8_hsw+0x1f> + .byte 235,131 // jmp 1d6e <_sk_lerp_u8_hsw+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -18416,7 +18688,7 @@ _sk_lerp_u8_hsw: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,90,255,255,255 // jmpq 1be2 <_sk_lerp_u8_hsw+0x1f> + .byte 233,90,255,255,255 // jmpq 1d6e <_sk_lerp_u8_hsw+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -18427,7 +18699,7 @@ _sk_lerp_u8_hsw: .byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,30,255,255,255 // jmpq 1be2 <_sk_lerp_u8_hsw+0x1f> + .byte 233,30,255,255,255 // jmpq 1d6e <_sk_lerp_u8_hsw+0x1f> .byte 144 // nop .byte 255 // (bad) .byte 255 // (bad) @@ -18462,24 +18734,30 @@ _sk_lerp_565_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,170,0,0,0 // jne 1daa <_sk_lerp_565_hsw+0xca> + .byte 15,133,182,0,0,0 // jne 1f42 <_sk_lerp_565_hsw+0xd6> .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8 .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 - .byte 196,98,125,88,13,104,145,2,0 // vpbroadcastd 0x29168(%rip),%ymm9 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,98,125,88,13,208,149,2,0 // vpbroadcastd 0x295d0(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,89,145,2,0 // vbroadcastss 0x29159(%rip),%ymm10 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,98,125,24,21,193,149,2,0 // vbroadcastss 0x295c1(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,88,21,79,145,2,0 // vpbroadcastd 0x2914f(%rip),%ymm10 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,98,125,88,21,183,149,2,0 // vpbroadcastd 0x295b7(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,64,145,2,0 // vbroadcastss 0x29140(%rip),%ymm11 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,98,125,24,29,168,149,2,0 // vbroadcastss 0x295a8(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,88,29,54,145,2,0 // vpbroadcastd 0x29136(%rip),%ymm11 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,98,125,88,29,158,149,2,0 // vpbroadcastd 0x2959e(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,39,145,2,0 // vbroadcastss 0x29127(%rip),%ymm11 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,98,125,24,29,143,149,2,0 // vbroadcastss 0x2958f(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 + .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11 + .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12 + .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12 + .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13 + .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13 + .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0 .byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1 @@ -18487,11 +18765,7 @@ _sk_lerp_565_hsw: .byte 197,236,92,214 // vsubps %ymm6,%ymm2,%ymm2 .byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2 .byte 197,228,92,223 // vsubps %ymm7,%ymm3,%ymm3 - .byte 196,98,101,168,207 // vfmadd213ps %ymm7,%ymm3,%ymm9 - .byte 196,98,101,168,215 // vfmadd213ps %ymm7,%ymm3,%ymm10 - .byte 196,98,101,168,199 // vfmadd213ps %ymm7,%ymm3,%ymm8 - .byte 196,193,44,95,216 // vmaxps %ymm8,%ymm10,%ymm3 - .byte 197,180,95,219 // vmaxps %ymm3,%ymm9,%ymm3 + .byte 196,226,37,168,223 // vfmadd213ps %ymm7,%ymm11,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -18500,27 +18774,27 @@ _sk_lerp_565_hsw: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,67,255,255,255 // ja 1d06 <_sk_lerp_565_hsw+0x26> + .byte 15,135,55,255,255,255 // ja 1e92 <_sk_lerp_565_hsw+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1e34 <_sk_lerp_565_hsw+0x154> + .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1fcc <_sk_lerp_565_hsw+0x160> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 233,33,255,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26> + .byte 233,21,255,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,3,255,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26> + .byte 233,247,254,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,213,254,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26> + .byte 233,201,254,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26> .byte 15,31,0 // nopl (%rax) .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff .byte 255 // (bad) @@ -18547,23 +18821,23 @@ _sk_load_tables_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 117,103 // jne 1ec1 <_sk_load_tables_hsw+0x71> + .byte 117,103 // jne 2059 <_sk_load_tables_hsw+0x71> .byte 196,193,126,111,28,145 // vmovdqu (%r9,%rdx,4),%ymm3 - .byte 197,229,219,13,152,145,2,0 // vpand 0x29198(%rip),%ymm3,%ymm1 # 2b000 <_sk_overlay_sse2_8bit+0x63f> + .byte 197,229,219,13,0,150,2,0 // vpand 0x29600(%rip),%ymm3,%ymm1 # 2b600 <_sk_overlay_sse2_8bit+0x64b> .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8 .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 76,139,80,16 // mov 0x10(%rax),%r10 .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2 .byte 196,194,109,146,4,137 // vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0 - .byte 196,226,101,0,21,152,145,2,0 // vpshufb 0x29198(%rip),%ymm3,%ymm2 # 2b020 <_sk_overlay_sse2_8bit+0x65f> + .byte 196,226,101,0,21,0,150,2,0 // vpshufb 0x29600(%rip),%ymm3,%ymm2 # 2b620 <_sk_overlay_sse2_8bit+0x66b> .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9 .byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1 .byte 72,139,64,24 // mov 0x18(%rax),%rax - .byte 196,98,101,0,13,160,145,2,0 // vpshufb 0x291a0(%rip),%ymm3,%ymm9 # 2b040 <_sk_overlay_sse2_8bit+0x67f> + .byte 196,98,101,0,13,8,150,2,0 // vpshufb 0x29608(%rip),%ymm3,%ymm9 # 2b640 <_sk_overlay_sse2_8bit+0x68b> .byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,192,143,2,0 // vbroadcastss 0x28fc0(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,28,148,2,0 // vbroadcastss 0x2941c(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18572,21 +18846,21 @@ _sk_load_tables_hsw: .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,139 // ja 1e60 <_sk_load_tables_hsw+0x10> + .byte 119,139 // ja 1ff8 <_sk_load_tables_hsw+0x10> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,140,0,0,0 // lea 0x8c(%rip),%r11 # 1f6c <_sk_load_tables_hsw+0x11c> + .byte 76,141,29,140,0,0,0 // lea 0x8c(%rip),%r11 # 2104 <_sk_load_tables_hsw+0x11c> .byte 79,99,20,147 // movslq (%r11,%r10,4),%r10 .byte 77,1,218 // add %r11,%r10 .byte 65,255,226 // jmpq *%r10 .byte 196,193,121,110,28,145 // vmovd (%r9,%rdx,4),%xmm3 - .byte 233,107,255,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10> + .byte 233,107,255,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10> .byte 196,193,121,110,68,145,8 // vmovd 0x8(%r9,%rdx,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 .byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3 .byte 196,193,122,126,4,145 // vmovq (%r9,%rdx,4),%xmm0 .byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3 - .byte 233,68,255,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10> + .byte 233,68,255,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10> .byte 196,193,121,110,68,145,24 // vmovd 0x18(%r9,%rdx,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -18599,9 +18873,9 @@ _sk_load_tables_hsw: .byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3 .byte 196,193,122,111,4,145 // vmovdqu (%r9,%rdx,4),%xmm0 .byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - .byte 233,245,254,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10> + .byte 233,245,254,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10> .byte 144 // nop - .byte 126,255 // jle 1f6d <_sk_load_tables_hsw+0x11d> + .byte 126,255 // jle 2105 <_sk_load_tables_hsw+0x11d> .byte 255 // (bad) .byte 255,159,255,255,255,137 // lcall *-0x76000001(%rdi) .byte 255 // (bad) @@ -18629,7 +18903,7 @@ _sk_load_tables_u16_be_hsw: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,201,0,0,0 // jne 2067 <_sk_load_tables_u16_be_hsw+0xdf> + .byte 15,133,201,0,0,0 // jne 21ff <_sk_load_tables_u16_be_hsw+0xdf> .byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8 .byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2 .byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -18645,7 +18919,7 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1 .byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2 .byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8 - .byte 197,121,111,21,161,151,2,0 // vmovdqa 0x297a1(%rip),%xmm10 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,121,111,21,9,156,2,0 // vmovdqa 0x29c09(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -18667,36 +18941,36 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3 .byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,54,142,2,0 // vbroadcastss 0x28e36(%rip),%ymm8 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3> + .byte 196,98,125,24,5,146,146,2,0 // vbroadcastss 0x29292(%rip),%ymm8 # 2b488 <_sk_overlay_sse2_8bit+0x4d3> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 20cd <_sk_load_tables_u16_be_hsw+0x145> + .byte 116,85 // je 2265 <_sk_load_tables_u16_be_hsw+0x145> .byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 20cd <_sk_load_tables_u16_be_hsw+0x145> + .byte 114,72 // jb 2265 <_sk_load_tables_u16_be_hsw+0x145> .byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 20da <_sk_load_tables_u16_be_hsw+0x152> + .byte 116,72 // je 2272 <_sk_load_tables_u16_be_hsw+0x152> .byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 20da <_sk_load_tables_u16_be_hsw+0x152> + .byte 114,59 // jb 2272 <_sk_load_tables_u16_be_hsw+0x152> .byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,9,255,255,255 // je 1fb9 <_sk_load_tables_u16_be_hsw+0x31> + .byte 15,132,9,255,255,255 // je 2151 <_sk_load_tables_u16_be_hsw+0x31> .byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,248,254,255,255 // jb 1fb9 <_sk_load_tables_u16_be_hsw+0x31> + .byte 15,130,248,254,255,255 // jb 2151 <_sk_load_tables_u16_be_hsw+0x31> .byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9 - .byte 233,236,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,236,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,223,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,223,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,214,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,214,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31> HIDDEN _sk_load_tables_rgb_u16_be_hsw .globl _sk_load_tables_rgb_u16_be_hsw @@ -18706,7 +18980,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,193,0,0,0 // jne 21b6 <_sk_load_tables_rgb_u16_be_hsw+0xd3> + .byte 15,133,193,0,0,0 // jne 234e <_sk_load_tables_rgb_u16_be_hsw+0xd3> .byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0 .byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2 .byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -18727,7 +19001,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,49,150,2,0 // vmovdqa 0x29631(%rip),%xmm9 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,121,111,13,153,154,2,0 // vmovdqa 0x29a99(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -18744,48 +19018,48 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8 .byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,80,140,2,0 // vbroadcastss 0x28c50(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,172,144,2,0 // vbroadcastss 0x290ac(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 255,224 // jmpq *%rax .byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0 .byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne 21cf <_sk_load_tables_rgb_u16_be_hsw+0xec> - .byte 233,90,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,5 // jne 2367 <_sk_load_tables_rgb_u16_be_hsw+0xec> + .byte 233,90,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1 .byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb 21fe <_sk_load_tables_rgb_u16_be_hsw+0x11b> + .byte 114,26 // jb 2396 <_sk_load_tables_rgb_u16_be_hsw+0x11b> .byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1 .byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne 2203 <_sk_load_tables_rgb_u16_be_hsw+0x120> - .byte 233,43,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,38,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 239b <_sk_load_tables_rgb_u16_be_hsw+0x120> + .byte 233,43,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,38,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1 .byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb 2232 <_sk_load_tables_rgb_u16_be_hsw+0x14f> + .byte 114,26 // jb 23ca <_sk_load_tables_rgb_u16_be_hsw+0x14f> .byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1 .byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne 2237 <_sk_load_tables_rgb_u16_be_hsw+0x154> - .byte 233,247,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,242,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 23cf <_sk_load_tables_rgb_u16_be_hsw+0x154> + .byte 233,247,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,242,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3 .byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb 2260 <_sk_load_tables_rgb_u16_be_hsw+0x17d> + .byte 114,20 // jb 23f8 <_sk_load_tables_rgb_u16_be_hsw+0x17d> .byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3 .byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - .byte 233,201,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,196,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,201,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,196,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46> HIDDEN _sk_byte_tables_hsw .globl _sk_byte_tables_hsw FUNCTION(_sk_byte_tables_hsw) _sk_byte_tables_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,192,139,2,0 // vbroadcastss 0x28bc0(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,28,144,2,0 // vbroadcastss 0x2901c(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9 .byte 196,65,249,126,201 // vmovq %xmm9,%r9 @@ -18907,7 +19181,7 @@ _sk_byte_tables_hsw: .byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax .byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,169,137,2,0 // vbroadcastss 0x289a9(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,5,142,2,0 // vbroadcastss 0x28e05(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 @@ -19023,7 +19297,7 @@ _sk_byte_tables_rgb_hsw: .byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax .byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,145,135,2,0 // vbroadcastss 0x28791(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,237,139,2,0 // vbroadcastss 0x28bed(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 @@ -19122,33 +19396,33 @@ _sk_parametric_r_hsw: .byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10 .byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,135,134,2,0 // vbroadcastss 0x28687(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> - .byte 196,98,125,24,45,130,134,2,0 // vbroadcastss 0x28682(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,227,138,2,0 // vbroadcastss 0x28ae3(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,45,222,138,2,0 // vbroadcastss 0x28ade(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,216,133,2,0 // vbroadcastss 0x285d8(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,45,52,138,2,0 // vbroadcastss 0x28a34(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,106,134,2,0 // vbroadcastss 0x2866a(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,45,198,138,2,0 // vbroadcastss 0x28ac6(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,96,134,2,0 // vbroadcastss 0x28660(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,29,188,138,2,0 // vbroadcastss 0x28abc(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,86,134,2,0 // vbroadcastss 0x28656(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,178,138,2,0 // vbroadcastss 0x28ab2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,76,134,2,0 // vbroadcastss 0x2864c(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,168,138,2,0 // vbroadcastss 0x28aa8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,45,134,2,0 // vbroadcastss 0x2862d(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,137,138,2,0 // vbroadcastss 0x28a89(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,35,134,2,0 // vbroadcastss 0x28623(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,127,138,2,0 // vbroadcastss 0x28a7f(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11 - .byte 196,226,125,24,5,25,134,2,0 // vbroadcastss 0x28619(%rip),%ymm0 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,226,125,24,5,117,138,2,0 // vbroadcastss 0x28a75(%rip),%ymm0 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,15,134,2,0 // vbroadcastss 0x2860f(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,21,107,138,2,0 // vbroadcastss 0x28a6b(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0 .byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,21,2,134,2,0 // vbroadcastss 0x28602(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,94,138,2,0 // vbroadcastss 0x28a5e(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -19156,7 +19430,7 @@ _sk_parametric_r_hsw: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,25,133,2,0 // vbroadcastss 0x28519(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,117,137,2,0 // vbroadcastss 0x28975(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19176,33 +19450,33 @@ _sk_parametric_g_hsw: .byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10 .byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,97,133,2,0 // vbroadcastss 0x28561(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> - .byte 196,98,125,24,45,92,133,2,0 // vbroadcastss 0x2855c(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,189,137,2,0 // vbroadcastss 0x289bd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,45,184,137,2,0 // vbroadcastss 0x289b8(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,178,132,2,0 // vbroadcastss 0x284b2(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,45,14,137,2,0 // vbroadcastss 0x2890e(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,68,133,2,0 // vbroadcastss 0x28544(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,45,160,137,2,0 // vbroadcastss 0x289a0(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,58,133,2,0 // vbroadcastss 0x2853a(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,29,150,137,2,0 // vbroadcastss 0x28996(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,48,133,2,0 // vbroadcastss 0x28530(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,140,137,2,0 // vbroadcastss 0x2898c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,38,133,2,0 // vbroadcastss 0x28526(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,130,137,2,0 // vbroadcastss 0x28982(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,7,133,2,0 // vbroadcastss 0x28507(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,99,137,2,0 // vbroadcastss 0x28963(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,253,132,2,0 // vbroadcastss 0x284fd(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,89,137,2,0 // vbroadcastss 0x28959(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11 - .byte 196,226,125,24,13,243,132,2,0 // vbroadcastss 0x284f3(%rip),%ymm1 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,226,125,24,13,79,137,2,0 // vbroadcastss 0x2894f(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,233,132,2,0 // vbroadcastss 0x284e9(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,21,69,137,2,0 // vbroadcastss 0x28945(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1 - .byte 196,98,125,24,21,220,132,2,0 // vbroadcastss 0x284dc(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,56,137,2,0 // vbroadcastss 0x28938(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -19210,7 +19484,7 @@ _sk_parametric_g_hsw: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,243,131,2,0 // vbroadcastss 0x283f3(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,79,136,2,0 // vbroadcastss 0x2884f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19230,33 +19504,33 @@ _sk_parametric_b_hsw: .byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,59,132,2,0 // vbroadcastss 0x2843b(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> - .byte 196,98,125,24,45,54,132,2,0 // vbroadcastss 0x28436(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,151,136,2,0 // vbroadcastss 0x28897(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,45,146,136,2,0 // vbroadcastss 0x28892(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,140,131,2,0 // vbroadcastss 0x2838c(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,45,232,135,2,0 // vbroadcastss 0x287e8(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,30,132,2,0 // vbroadcastss 0x2841e(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,45,122,136,2,0 // vbroadcastss 0x2887a(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,20,132,2,0 // vbroadcastss 0x28414(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,29,112,136,2,0 // vbroadcastss 0x28870(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,10,132,2,0 // vbroadcastss 0x2840a(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,102,136,2,0 // vbroadcastss 0x28866(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,0,132,2,0 // vbroadcastss 0x28400(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,92,136,2,0 // vbroadcastss 0x2885c(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,225,131,2,0 // vbroadcastss 0x283e1(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,61,136,2,0 // vbroadcastss 0x2883d(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,215,131,2,0 // vbroadcastss 0x283d7(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,51,136,2,0 // vbroadcastss 0x28833(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11 - .byte 196,226,125,24,21,205,131,2,0 // vbroadcastss 0x283cd(%rip),%ymm2 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,226,125,24,21,41,136,2,0 // vbroadcastss 0x28829(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,195,131,2,0 // vbroadcastss 0x283c3(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,21,31,136,2,0 // vbroadcastss 0x2881f(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2 .byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2 - .byte 196,98,125,24,21,182,131,2,0 // vbroadcastss 0x283b6(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,18,136,2,0 // vbroadcastss 0x28812(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -19264,7 +19538,7 @@ _sk_parametric_b_hsw: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,205,130,2,0 // vbroadcastss 0x282cd(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,41,135,2,0 // vbroadcastss 0x28729(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19284,33 +19558,33 @@ _sk_parametric_a_hsw: .byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10 .byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,21,131,2,0 // vbroadcastss 0x28315(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> - .byte 196,98,125,24,45,16,131,2,0 // vbroadcastss 0x28310(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,113,135,2,0 // vbroadcastss 0x28771(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,45,108,135,2,0 // vbroadcastss 0x2876c(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,102,130,2,0 // vbroadcastss 0x28266(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,45,194,134,2,0 // vbroadcastss 0x286c2(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,248,130,2,0 // vbroadcastss 0x282f8(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,45,84,135,2,0 // vbroadcastss 0x28754(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,238,130,2,0 // vbroadcastss 0x282ee(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,29,74,135,2,0 // vbroadcastss 0x2874a(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,228,130,2,0 // vbroadcastss 0x282e4(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,64,135,2,0 // vbroadcastss 0x28740(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,218,130,2,0 // vbroadcastss 0x282da(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,54,135,2,0 // vbroadcastss 0x28736(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,187,130,2,0 // vbroadcastss 0x282bb(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,23,135,2,0 // vbroadcastss 0x28717(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,177,130,2,0 // vbroadcastss 0x282b1(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,13,135,2,0 // vbroadcastss 0x2870d(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11 - .byte 196,226,125,24,29,167,130,2,0 // vbroadcastss 0x282a7(%rip),%ymm3 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,226,125,24,29,3,135,2,0 // vbroadcastss 0x28703(%rip),%ymm3 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,157,130,2,0 // vbroadcastss 0x2829d(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,21,249,134,2,0 // vbroadcastss 0x286f9(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3 .byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3 - .byte 196,98,125,24,21,144,130,2,0 // vbroadcastss 0x28290(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,236,134,2,0 // vbroadcastss 0x286ec(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -19318,7 +19592,7 @@ _sk_parametric_a_hsw: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,167,129,2,0 // vbroadcastss 0x281a7(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,3,134,2,0 // vbroadcastss 0x28603(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19337,35 +19611,35 @@ _sk_gamma_hsw: .byte 197,252,40,241 // vmovaps %ymm1,%ymm6 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10 - .byte 196,98,125,24,29,250,129,2,0 // vbroadcastss 0x281fa(%rip),%ymm11 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> - .byte 196,226,125,24,45,245,129,2,0 // vbroadcastss 0x281f5(%rip),%ymm5 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,29,86,134,2,0 // vbroadcastss 0x28656(%rip),%ymm11 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,226,125,24,45,81,134,2,0 // vbroadcastss 0x28651(%rip),%ymm5 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9 - .byte 196,226,125,24,37,76,129,2,0 // vbroadcastss 0x2814c(%rip),%ymm4 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,37,168,133,2,0 // vbroadcastss 0x285a8(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12 - .byte 196,98,125,24,45,223,129,2,0 // vbroadcastss 0x281df(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,45,59,134,2,0 // vbroadcastss 0x2863b(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10 - .byte 196,98,125,24,13,213,129,2,0 // vbroadcastss 0x281d5(%rip),%ymm9 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,13,49,134,2,0 // vbroadcastss 0x28631(%rip),%ymm9 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10 .byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14 .byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14 .byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15 .byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15 - .byte 196,98,125,24,29,185,129,2,0 // vbroadcastss 0x281b9(%rip),%ymm11 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,29,21,134,2,0 // vbroadcastss 0x28615(%rip),%ymm11 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12 - .byte 196,98,125,24,45,175,129,2,0 // vbroadcastss 0x281af(%rip),%ymm13 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,45,11,134,2,0 // vbroadcastss 0x2860b(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12 .byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10 .byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 .byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8 .byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8 - .byte 196,226,125,24,21,139,129,2,0 // vbroadcastss 0x2818b(%rip),%ymm2 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,226,125,24,21,231,133,2,0 // vbroadcastss 0x285e7(%rip),%ymm2 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10 - .byte 196,226,125,24,29,130,129,2,0 // vbroadcastss 0x28182(%rip),%ymm3 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,226,125,24,29,222,133,2,0 // vbroadcastss 0x285de(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10 - .byte 196,226,125,24,13,120,129,2,0 // vbroadcastss 0x28178(%rip),%ymm1 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,226,125,24,13,212,133,2,0 // vbroadcastss 0x285d4(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,5,110,129,2,0 // vbroadcastss 0x2816e(%rip),%ymm0 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,226,125,24,5,202,133,2,0 // vbroadcastss 0x285ca(%rip),%ymm0 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6 @@ -19396,7 +19670,7 @@ _sk_gamma_hsw: .byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1 .byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0 .byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0 - .byte 196,226,125,24,13,223,128,2,0 // vbroadcastss 0x280df(%rip),%ymm1 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,226,125,24,13,59,133,2,0 // vbroadcastss 0x2853b(%rip),%ymm1 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2 .byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3 .byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4 @@ -19416,26 +19690,26 @@ HIDDEN _sk_lab_to_xyz_hsw .globl _sk_lab_to_xyz_hsw FUNCTION(_sk_lab_to_xyz_hsw) _sk_lab_to_xyz_hsw: - .byte 196,98,125,24,5,157,128,2,0 // vbroadcastss 0x2809d(%rip),%ymm8 # 2aec4 <_sk_overlay_sse2_8bit+0x503> - .byte 196,98,125,24,13,0,128,2,0 // vbroadcastss 0x28000(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> - .byte 196,98,125,24,21,143,128,2,0 // vbroadcastss 0x2808f(%rip),%ymm10 # 2aec8 <_sk_overlay_sse2_8bit+0x507> + .byte 196,98,125,24,5,249,132,2,0 // vbroadcastss 0x284f9(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503> + .byte 196,98,125,24,13,92,132,2,0 // vbroadcastss 0x2845c(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,21,235,132,2,0 // vbroadcastss 0x284eb(%rip),%ymm10 # 2b4bc <_sk_overlay_sse2_8bit+0x507> .byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1 .byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2 - .byte 196,98,125,24,13,128,128,2,0 // vbroadcastss 0x28080(%rip),%ymm9 # 2aecc <_sk_overlay_sse2_8bit+0x50b> + .byte 196,98,125,24,13,220,132,2,0 // vbroadcastss 0x284dc(%rip),%ymm9 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b> .byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9 - .byte 196,226,125,24,5,118,128,2,0 // vbroadcastss 0x28076(%rip),%ymm0 # 2aed0 <_sk_overlay_sse2_8bit+0x50f> + .byte 196,226,125,24,5,210,132,2,0 // vbroadcastss 0x284d2(%rip),%ymm0 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f> .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 - .byte 196,98,125,24,5,109,128,2,0 // vbroadcastss 0x2806d(%rip),%ymm8 # 2aed4 <_sk_overlay_sse2_8bit+0x513> + .byte 196,98,125,24,5,201,132,2,0 // vbroadcastss 0x284c9(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513> .byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8 - .byte 196,98,125,24,13,99,128,2,0 // vbroadcastss 0x28063(%rip),%ymm9 # 2aed8 <_sk_overlay_sse2_8bit+0x517> + .byte 196,98,125,24,13,191,132,2,0 // vbroadcastss 0x284bf(%rip),%ymm9 # 2b4cc <_sk_overlay_sse2_8bit+0x517> .byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9 .byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 - .byte 196,226,125,24,21,80,128,2,0 // vbroadcastss 0x28050(%rip),%ymm2 # 2aedc <_sk_overlay_sse2_8bit+0x51b> + .byte 196,226,125,24,21,172,132,2,0 // vbroadcastss 0x284ac(%rip),%ymm2 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b> .byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10 - .byte 196,98,125,24,29,70,128,2,0 // vbroadcastss 0x28046(%rip),%ymm11 # 2aee0 <_sk_overlay_sse2_8bit+0x51f> + .byte 196,98,125,24,29,162,132,2,0 // vbroadcastss 0x284a2(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f> .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,37,60,128,2,0 // vbroadcastss 0x2803c(%rip),%ymm12 # 2aee4 <_sk_overlay_sse2_8bit+0x523> + .byte 196,98,125,24,37,152,132,2,0 // vbroadcastss 0x28498(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523> .byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8 .byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -19450,9 +19724,9 @@ _sk_lab_to_xyz_hsw: .byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 .byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - .byte 196,226,125,24,5,241,127,2,0 // vbroadcastss 0x27ff1(%rip),%ymm0 # 2aee8 <_sk_overlay_sse2_8bit+0x527> + .byte 196,226,125,24,5,77,132,2,0 // vbroadcastss 0x2844d(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,232,127,2,0 // vbroadcastss 0x27fe8(%rip),%ymm8 # 2aeec <_sk_overlay_sse2_8bit+0x52b> + .byte 196,98,125,24,5,68,132,2,0 // vbroadcastss 0x28444(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19469,12 +19743,12 @@ _sk_load_a8_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,53 // jne 2f5b <_sk_load_a8_hsw+0x4e> + .byte 117,53 // jne 30f3 <_sk_load_a8_hsw+0x4e> .byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0 - .byte 197,249,219,5,92,136,2,0 // vpand 0x2885c(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,249,219,5,196,140,2,0 // vpand 0x28cc4(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,50,127,2,0 // vbroadcastss 0x27f32(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,142,131,2,0 // vbroadcastss 0x2838e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -19487,15 +19761,15 @@ _sk_load_a8_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,189 // ja 2f2c <_sk_load_a8_hsw+0x1f> + .byte 119,189 // ja 30c4 <_sk_load_a8_hsw+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 2ff4 <_sk_load_a8_hsw+0xe7> + .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 318c <_sk_load_a8_hsw+0xe7> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,158 // jmp 2f2c <_sk_load_a8_hsw+0x1f> + .byte 235,158 // jmp 30c4 <_sk_load_a8_hsw+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -19503,7 +19777,7 @@ _sk_load_a8_hsw: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,118,255,255,255 // jmpq 2f2c <_sk_load_a8_hsw+0x1f> + .byte 233,118,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -19514,7 +19788,7 @@ _sk_load_a8_hsw: .byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,59,255,255,255 // jmpq 2f2c <_sk_load_a8_hsw+0x1f> + .byte 233,59,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f> .byte 15,31,0 // nopl (%rax) .byte 143 // (bad) .byte 255 // (bad) @@ -19548,12 +19822,12 @@ _sk_load_a8_dst_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,53 // jne 305e <_sk_load_a8_dst_hsw+0x4e> + .byte 117,53 // jne 31f6 <_sk_load_a8_dst_hsw+0x4e> .byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4 - .byte 197,217,219,37,89,135,2,0 // vpand 0x28759(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,217,219,37,193,139,2,0 // vpand 0x28bc1(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,47,126,2,0 // vbroadcastss 0x27e2f(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,45,139,130,2,0 // vbroadcastss 0x2828b(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 @@ -19566,15 +19840,15 @@ _sk_load_a8_dst_hsw: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,189 // ja 302f <_sk_load_a8_dst_hsw+0x1f> + .byte 119,189 // ja 31c7 <_sk_load_a8_dst_hsw+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 30f4 <_sk_load_a8_dst_hsw+0xe4> + .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 328c <_sk_load_a8_dst_hsw+0xe4> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 235,158 // jmp 302f <_sk_load_a8_dst_hsw+0x1f> + .byte 235,158 // jmp 31c7 <_sk_load_a8_dst_hsw+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -19582,7 +19856,7 @@ _sk_load_a8_dst_hsw: .byte 197,249,110,232 // vmovd %eax,%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,118,255,255,255 // jmpq 302f <_sk_load_a8_dst_hsw+0x1f> + .byte 233,118,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -19593,7 +19867,7 @@ _sk_load_a8_dst_hsw: .byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4 - .byte 233,59,255,255,255 // jmpq 302f <_sk_load_a8_dst_hsw+0x1f> + .byte 233,59,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f> .byte 146 // xchg %eax,%edx .byte 255 // (bad) .byte 255 // (bad) @@ -19654,7 +19928,7 @@ _sk_gather_a8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,178,124,2,0 // vbroadcastss 0x27cb2(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,14,129,2,0 // vbroadcastss 0x2810e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -19673,14 +19947,14 @@ _sk_store_a8_hsw: .byte 77,15,175,202 // imul %r10,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,57,124,2,0 // vbroadcastss 0x27c39(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,149,128,2,0 // vbroadcastss 0x28095(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne 3221 <_sk_store_a8_hsw+0x47> + .byte 117,11 // jne 33b9 <_sk_store_a8_hsw+0x47> .byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -19689,25 +19963,25 @@ _sk_store_a8_hsw: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja 321c <_sk_store_a8_hsw+0x42> + .byte 119,235 // ja 33b4 <_sk_store_a8_hsw+0x42> .byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8 .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3298 <_sk_store_a8_hsw+0xbe> + .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3430 <_sk_store_a8_hsw+0xbe> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1) - .byte 235,201 // jmp 321c <_sk_store_a8_hsw+0x42> + .byte 235,201 // jmp 33b4 <_sk_store_a8_hsw+0x42> .byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1) - .byte 196,98,57,0,5,60,133,2,0 // vpshufb 0x2853c(%rip),%xmm8,%xmm8 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf> + .byte 196,98,57,0,5,164,137,2,0 // vpshufb 0x289a4(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb> .byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1) - .byte 235,175 // jmp 321c <_sk_store_a8_hsw+0x42> + .byte 235,175 // jmp 33b4 <_sk_store_a8_hsw+0x42> .byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1) .byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1) .byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1) - .byte 196,98,57,0,5,34,133,2,0 // vpshufb 0x28522(%rip),%xmm8,%xmm8 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef> + .byte 196,98,57,0,5,138,137,2,0 // vpshufb 0x2898a(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb> .byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1) - .byte 235,134 // jmp 321c <_sk_store_a8_hsw+0x42> + .byte 235,134 // jmp 33b4 <_sk_store_a8_hsw+0x42> .byte 102,144 // xchg %ax,%ax .byte 178,255 // mov $0xff,%dl .byte 255 // (bad) @@ -19741,15 +20015,15 @@ _sk_load_g8_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,58 // jne 3307 <_sk_load_g8_hsw+0x53> + .byte 117,58 // jne 349f <_sk_load_g8_hsw+0x53> .byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0 - .byte 197,249,219,5,181,132,2,0 // vpand 0x284b5(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,249,219,5,29,137,2,0 // vpand 0x2891d(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,139,123,2,0 // vbroadcastss 0x27b8b(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,231,127,2,0 // vbroadcastss 0x27fe7(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,8,123,2,0 // vbroadcastss 0x27b08(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,100,127,2,0 // vbroadcastss 0x27f64(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 91 // pop %rbx @@ -19759,15 +20033,15 @@ _sk_load_g8_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,184 // ja 32d3 <_sk_load_g8_hsw+0x1f> + .byte 119,184 // ja 346b <_sk_load_g8_hsw+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 33a0 <_sk_load_g8_hsw+0xec> + .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3538 <_sk_load_g8_hsw+0xec> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,153 // jmp 32d3 <_sk_load_g8_hsw+0x1f> + .byte 235,153 // jmp 346b <_sk_load_g8_hsw+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -19775,7 +20049,7 @@ _sk_load_g8_hsw: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,113,255,255,255 // jmpq 32d3 <_sk_load_g8_hsw+0x1f> + .byte 233,113,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -19786,7 +20060,7 @@ _sk_load_g8_hsw: .byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,54,255,255,255 // jmpq 32d3 <_sk_load_g8_hsw+0x1f> + .byte 233,54,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f> .byte 15,31,0 // nopl (%rax) .byte 143 // (bad) .byte 255 // (bad) @@ -19820,15 +20094,15 @@ _sk_load_g8_dst_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,58 // jne 340f <_sk_load_g8_dst_hsw+0x53> + .byte 117,58 // jne 35a7 <_sk_load_g8_dst_hsw+0x53> .byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4 - .byte 197,217,219,37,173,131,2,0 // vpand 0x283ad(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,217,219,37,21,136,2,0 // vpand 0x28815(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,131,122,2,0 // vbroadcastss 0x27a83(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,45,223,126,2,0 // vbroadcastss 0x27edf(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,0,122,2,0 // vbroadcastss 0x27a00(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,61,92,126,2,0 // vbroadcastss 0x27e5c(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,236 // vmovaps %ymm4,%ymm5 .byte 197,252,40,244 // vmovaps %ymm4,%ymm6 .byte 91 // pop %rbx @@ -19838,15 +20112,15 @@ _sk_load_g8_dst_hsw: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,184 // ja 33db <_sk_load_g8_dst_hsw+0x1f> + .byte 119,184 // ja 3573 <_sk_load_g8_dst_hsw+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 34a8 <_sk_load_g8_dst_hsw+0xec> + .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3640 <_sk_load_g8_dst_hsw+0xec> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 235,153 // jmp 33db <_sk_load_g8_dst_hsw+0x1f> + .byte 235,153 // jmp 3573 <_sk_load_g8_dst_hsw+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -19854,7 +20128,7 @@ _sk_load_g8_dst_hsw: .byte 197,249,110,232 // vmovd %eax,%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,113,255,255,255 // jmpq 33db <_sk_load_g8_dst_hsw+0x1f> + .byte 233,113,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -19865,7 +20139,7 @@ _sk_load_g8_dst_hsw: .byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4 - .byte 233,54,255,255,255 // jmpq 33db <_sk_load_g8_dst_hsw+0x1f> + .byte 233,54,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f> .byte 15,31,0 // nopl (%rax) .byte 143 // (bad) .byte 255 // (bad) @@ -19927,10 +20201,10 @@ _sk_gather_g8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,254,120,2,0 // vbroadcastss 0x278fe(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,90,125,2,0 // vbroadcastss 0x27d5a(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,123,120,2,0 // vbroadcastss 0x2787b(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,215,124,2,0 // vbroadcastss 0x27cd7(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -19948,26 +20222,26 @@ _sk_load_565_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,115 // jne 3622 <_sk_load_565_hsw+0x8f> + .byte 117,115 // jne 37ba <_sk_load_565_hsw+0x8f> .byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,185,120,2,0 // vpbroadcastd 0x278b9(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,226,125,88,5,21,125,2,0 // vpbroadcastd 0x27d15(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,172,120,2,0 // vbroadcastss 0x278ac(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,226,125,24,13,8,125,2,0 // vbroadcastss 0x27d08(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,163,120,2,0 // vpbroadcastd 0x278a3(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,226,125,88,13,255,124,2,0 // vpbroadcastd 0x27cff(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,150,120,2,0 // vbroadcastss 0x27896(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,226,125,24,29,242,124,2,0 // vbroadcastss 0x27cf2(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,141,120,2,0 // vpbroadcastd 0x2788d(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,226,125,88,29,233,124,2,0 // vpbroadcastd 0x27ce9(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,128,120,2,0 // vbroadcastss 0x27880(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,226,125,24,29,220,124,2,0 // vbroadcastss 0x27cdc(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,229,119,2,0 // vbroadcastss 0x277e5(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,65,124,2,0 // vbroadcastss 0x27c41(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d @@ -19975,27 +20249,27 @@ _sk_load_565_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,123,255,255,255 // ja 35b5 <_sk_load_565_hsw+0x22> + .byte 15,135,123,255,255,255 // ja 374d <_sk_load_565_hsw+0x22> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 36a8 <_sk_load_565_hsw+0x115> + .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3840 <_sk_load_565_hsw+0x115> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,89,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22> + .byte 233,89,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,60,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22> + .byte 233,60,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,15,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22> + .byte 233,15,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22> .byte 102,144 // xchg %ax,%ax .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -20029,26 +20303,26 @@ _sk_load_565_dst_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,115 // jne 3753 <_sk_load_565_dst_hsw+0x8f> + .byte 117,115 // jne 38eb <_sk_load_565_dst_hsw+0x8f> .byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4 .byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6 - .byte 196,226,125,88,37,136,119,2,0 // vpbroadcastd 0x27788(%rip),%ymm4 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,226,125,88,37,228,123,2,0 // vpbroadcastd 0x27be4(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,123,119,2,0 // vbroadcastss 0x2777b(%rip),%ymm5 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,226,125,24,45,215,123,2,0 // vbroadcastss 0x27bd7(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,88,45,114,119,2,0 // vpbroadcastd 0x27772(%rip),%ymm5 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,226,125,88,45,206,123,2,0 // vpbroadcastd 0x27bce(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,61,101,119,2,0 // vbroadcastss 0x27765(%rip),%ymm7 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,226,125,24,61,193,123,2,0 // vbroadcastss 0x27bc1(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5 - .byte 196,226,125,88,61,92,119,2,0 // vpbroadcastd 0x2775c(%rip),%ymm7 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,226,125,88,61,184,123,2,0 // vpbroadcastd 0x27bb8(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,226,125,24,61,79,119,2,0 // vbroadcastss 0x2774f(%rip),%ymm7 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,226,125,24,61,171,123,2,0 // vbroadcastss 0x27bab(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,180,118,2,0 // vbroadcastss 0x276b4(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,61,16,123,2,0 // vbroadcastss 0x27b10(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d @@ -20056,27 +20330,27 @@ _sk_load_565_dst_hsw: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,123,255,255,255 // ja 36e6 <_sk_load_565_dst_hsw+0x22> + .byte 15,135,123,255,255,255 // ja 387e <_sk_load_565_dst_hsw+0x22> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 37d8 <_sk_load_565_dst_hsw+0x114> + .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3970 <_sk_load_565_dst_hsw+0x114> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 233,89,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22> + .byte 233,89,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5 .byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,60,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22> + .byte 233,60,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5 .byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4 - .byte 233,15,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22> + .byte 233,15,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22> .byte 144 // nop .byte 167 // cmpsl %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -20139,23 +20413,23 @@ _sk_gather_565_hsw: .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,215,117,2,0 // vpbroadcastd 0x275d7(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,226,125,88,5,51,122,2,0 // vpbroadcastd 0x27a33(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,202,117,2,0 // vbroadcastss 0x275ca(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,226,125,24,13,38,122,2,0 // vbroadcastss 0x27a26(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,193,117,2,0 // vpbroadcastd 0x275c1(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,226,125,88,13,29,122,2,0 // vpbroadcastd 0x27a1d(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,180,117,2,0 // vbroadcastss 0x275b4(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,226,125,24,29,16,122,2,0 // vbroadcastss 0x27a10(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,171,117,2,0 // vpbroadcastd 0x275ab(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,226,125,88,29,7,122,2,0 // vpbroadcastd 0x27a07(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,158,117,2,0 // vbroadcastss 0x2759e(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,226,125,24,29,250,121,2,0 // vbroadcastss 0x279fa(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,3,117,2,0 // vbroadcastss 0x27503(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,95,121,2,0 // vbroadcastss 0x2795f(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_hsw @@ -20170,11 +20444,11 @@ _sk_store_565_hsw: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,205,117,2,0 // vbroadcastss 0x275cd(%rip),%ymm8 # 2aef0 <_sk_overlay_sse2_8bit+0x52f> + .byte 196,98,125,24,5,41,122,2,0 // vbroadcastss 0x27a29(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9 - .byte 196,98,125,24,21,184,117,2,0 // vbroadcastss 0x275b8(%rip),%ymm10 # 2aef4 <_sk_overlay_sse2_8bit+0x533> + .byte 196,98,125,24,21,20,122,2,0 // vbroadcastss 0x27a14(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10 @@ -20185,7 +20459,7 @@ _sk_store_565_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne 397b <_sk_store_565_hsw+0x78> + .byte 117,11 // jne 3b13 <_sk_store_565_hsw+0x78> .byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -20194,22 +20468,22 @@ _sk_store_565_hsw: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja 3976 <_sk_store_565_hsw+0x73> + .byte 119,235 // ja 3b0e <_sk_store_565_hsw+0x73> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 39d8 <_sk_store_565_hsw+0xd5> + .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3b70 <_sk_store_565_hsw+0xd5> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2) - .byte 235,206 // jmp 3976 <_sk_store_565_hsw+0x73> + .byte 235,206 // jmp 3b0e <_sk_store_565_hsw+0x73> .byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) .byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2) - .byte 235,190 // jmp 3976 <_sk_store_565_hsw+0x73> + .byte 235,190 // jmp 3b0e <_sk_store_565_hsw+0x73> .byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) .byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) .byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) .byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2) - .byte 235,158 // jmp 3976 <_sk_store_565_hsw+0x73> + .byte 235,158 // jmp 3b0e <_sk_store_565_hsw+0x73> .byte 199 // (bad) .byte 255 // (bad) .byte 255 // (bad) @@ -20227,7 +20501,7 @@ _sk_store_565_hsw: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,224 // callq ffffffffe10039f0 <_sk_overlay_sse2_8bit+0xffffffffe0fd902f> + .byte 232,255,255,255,224 // callq ffffffffe1003b88 <_sk_overlay_sse2_8bit+0xffffffffe0fd8bd3> .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -20245,28 +20519,28 @@ _sk_load_4444_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,139,0,0,0 // jne 3a9f <_sk_load_4444_hsw+0xab> + .byte 15,133,139,0,0,0 // jne 3c37 <_sk_load_4444_hsw+0xab> .byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,208,116,2,0 // vpbroadcastd 0x274d0(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537> + .byte 196,226,125,88,5,44,121,2,0 // vpbroadcastd 0x2792c(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,195,116,2,0 // vbroadcastss 0x274c3(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b> + .byte 196,226,125,24,13,31,121,2,0 // vbroadcastss 0x2791f(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,186,116,2,0 // vpbroadcastd 0x274ba(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f> + .byte 196,226,125,88,13,22,121,2,0 // vpbroadcastd 0x27916(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,173,116,2,0 // vbroadcastss 0x274ad(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543> + .byte 196,226,125,24,21,9,121,2,0 // vbroadcastss 0x27909(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,164,116,2,0 // vpbroadcastd 0x274a4(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547> + .byte 196,226,125,88,21,0,121,2,0 // vpbroadcastd 0x27900(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,151,116,2,0 // vbroadcastss 0x27497(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b> + .byte 196,98,125,24,5,243,120,2,0 // vbroadcastss 0x278f3(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,141,116,2,0 // vpbroadcastd 0x2748d(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f> + .byte 196,98,125,88,5,233,120,2,0 // vpbroadcastd 0x278e9(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,127,116,2,0 // vbroadcastss 0x2747f(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553> + .byte 196,98,125,24,5,219,120,2,0 // vbroadcastss 0x278db(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -20276,27 +20550,27 @@ _sk_load_4444_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,99,255,255,255 // ja 3a1a <_sk_load_4444_hsw+0x26> + .byte 15,135,99,255,255,255 // ja 3bb2 <_sk_load_4444_hsw+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3b24 <_sk_load_4444_hsw+0x130> + .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3cbc <_sk_load_4444_hsw+0x130> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,65,255,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26> + .byte 233,65,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,36,255,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26> + .byte 233,36,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,247,254,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26> + .byte 233,247,254,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26> .byte 144 // nop .byte 167 // cmpsl %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -20331,28 +20605,28 @@ _sk_load_4444_dst_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,139,0,0,0 // jne 3beb <_sk_load_4444_dst_hsw+0xab> + .byte 15,133,139,0,0,0 // jne 3d83 <_sk_load_4444_dst_hsw+0xab> .byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4 .byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7 - .byte 196,226,125,88,37,132,115,2,0 // vpbroadcastd 0x27384(%rip),%ymm4 # 2aef8 <_sk_overlay_sse2_8bit+0x537> + .byte 196,226,125,88,37,224,119,2,0 // vpbroadcastd 0x277e0(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537> .byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,119,115,2,0 // vbroadcastss 0x27377(%rip),%ymm5 # 2aefc <_sk_overlay_sse2_8bit+0x53b> + .byte 196,226,125,24,45,211,119,2,0 // vbroadcastss 0x277d3(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,88,45,110,115,2,0 // vpbroadcastd 0x2736e(%rip),%ymm5 # 2af00 <_sk_overlay_sse2_8bit+0x53f> + .byte 196,226,125,88,45,202,119,2,0 // vpbroadcastd 0x277ca(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f> .byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,53,97,115,2,0 // vbroadcastss 0x27361(%rip),%ymm6 # 2af04 <_sk_overlay_sse2_8bit+0x543> + .byte 196,226,125,24,53,189,119,2,0 // vbroadcastss 0x277bd(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543> .byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5 - .byte 196,226,125,88,53,88,115,2,0 // vpbroadcastd 0x27358(%rip),%ymm6 # 2af08 <_sk_overlay_sse2_8bit+0x547> + .byte 196,226,125,88,53,180,119,2,0 // vpbroadcastd 0x277b4(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547> .byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,98,125,24,5,75,115,2,0 // vbroadcastss 0x2734b(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b> + .byte 196,98,125,24,5,167,119,2,0 // vbroadcastss 0x277a7(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b> .byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6 - .byte 196,98,125,88,5,65,115,2,0 // vpbroadcastd 0x27341(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f> + .byte 196,98,125,88,5,157,119,2,0 // vpbroadcastd 0x2779d(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f> .byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,51,115,2,0 // vbroadcastss 0x27333(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553> + .byte 196,98,125,24,5,143,119,2,0 // vbroadcastss 0x2778f(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553> .byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -20362,27 +20636,27 @@ _sk_load_4444_dst_hsw: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,99,255,255,255 // ja 3b66 <_sk_load_4444_dst_hsw+0x26> + .byte 15,135,99,255,255,255 // ja 3cfe <_sk_load_4444_dst_hsw+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3c70 <_sk_load_4444_dst_hsw+0x130> + .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3e08 <_sk_load_4444_dst_hsw+0x130> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 233,65,255,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26> + .byte 233,65,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5 .byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,36,255,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26> + .byte 233,36,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5 .byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4 - .byte 233,247,254,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26> + .byte 233,247,254,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26> .byte 144 // nop .byte 167 // cmpsl %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -20445,25 +20719,25 @@ _sk_gather_4444_hsw: .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,187,113,2,0 // vpbroadcastd 0x271bb(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537> + .byte 196,226,125,88,5,23,118,2,0 // vpbroadcastd 0x27617(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,174,113,2,0 // vbroadcastss 0x271ae(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b> + .byte 196,226,125,24,13,10,118,2,0 // vbroadcastss 0x2760a(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,165,113,2,0 // vpbroadcastd 0x271a5(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f> + .byte 196,226,125,88,13,1,118,2,0 // vpbroadcastd 0x27601(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,152,113,2,0 // vbroadcastss 0x27198(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543> + .byte 196,226,125,24,21,244,117,2,0 // vbroadcastss 0x275f4(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,143,113,2,0 // vpbroadcastd 0x2718f(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547> + .byte 196,226,125,88,21,235,117,2,0 // vpbroadcastd 0x275eb(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,130,113,2,0 // vbroadcastss 0x27182(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b> + .byte 196,98,125,24,5,222,117,2,0 // vbroadcastss 0x275de(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,120,113,2,0 // vpbroadcastd 0x27178(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f> + .byte 196,98,125,88,5,212,117,2,0 // vpbroadcastd 0x275d4(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,106,113,2,0 // vbroadcastss 0x2716a(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553> + .byte 196,98,125,24,5,198,117,2,0 // vbroadcastss 0x275c6(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -20480,7 +20754,7 @@ _sk_store_4444_hsw: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,69,113,2,0 // vbroadcastss 0x27145(%rip),%ymm8 # 2af18 <_sk_overlay_sse2_8bit+0x557> + .byte 196,98,125,24,5,161,117,2,0 // vbroadcastss 0x275a1(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9 @@ -20498,7 +20772,7 @@ _sk_store_4444_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne 3e37 <_sk_store_4444_hsw+0x84> + .byte 117,11 // jne 3fcf <_sk_store_4444_hsw+0x84> .byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -20507,22 +20781,22 @@ _sk_store_4444_hsw: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja 3e32 <_sk_store_4444_hsw+0x7f> + .byte 119,235 // ja 3fca <_sk_store_4444_hsw+0x7f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3e94 <_sk_store_4444_hsw+0xe1> + .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 402c <_sk_store_4444_hsw+0xe1> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2) - .byte 235,206 // jmp 3e32 <_sk_store_4444_hsw+0x7f> + .byte 235,206 // jmp 3fca <_sk_store_4444_hsw+0x7f> .byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) .byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2) - .byte 235,190 // jmp 3e32 <_sk_store_4444_hsw+0x7f> + .byte 235,190 // jmp 3fca <_sk_store_4444_hsw+0x7f> .byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) .byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) .byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) .byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2) - .byte 235,158 // jmp 3e32 <_sk_store_4444_hsw+0x7f> + .byte 235,158 // jmp 3fca <_sk_store_4444_hsw+0x7f> .byte 199 // (bad) .byte 255 // (bad) .byte 255 // (bad) @@ -20540,7 +20814,7 @@ _sk_store_4444_hsw: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,224 // callq ffffffffe1003eac <_sk_overlay_sse2_8bit+0xffffffffe0fd94eb> + .byte 232,255,255,255,224 // callq ffffffffe1004044 <_sk_overlay_sse2_8bit+0xffffffffe0fd908f> .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -20558,16 +20832,16 @@ _sk_load_8888_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,87 // jne 3f24 <_sk_load_8888_hsw+0x74> + .byte 117,87 // jne 40bc <_sk_load_8888_hsw+0x74> .byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3 - .byte 197,229,219,5,133,113,2,0 // vpand 0x27185(%rip),%ymm3,%ymm0 # 2b060 <_sk_overlay_sse2_8bit+0x69f> + .byte 197,229,219,5,237,117,2,0 // vpand 0x275ed(%rip),%ymm3,%ymm0 # 2b660 <_sk_overlay_sse2_8bit+0x6ab> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,144,111,2,0 // vbroadcastss 0x26f90(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,236,115,2,0 // vbroadcastss 0x273ec(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,138,113,2,0 // vpshufb 0x2718a(%rip),%ymm3,%ymm1 # 2b080 <_sk_overlay_sse2_8bit+0x6bf> + .byte 196,226,101,0,13,242,117,2,0 // vpshufb 0x275f2(%rip),%ymm3,%ymm1 # 2b680 <_sk_overlay_sse2_8bit+0x6cb> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,152,113,2,0 // vpshufb 0x27198(%rip),%ymm3,%ymm2 # 2b0a0 <_sk_overlay_sse2_8bit+0x6df> + .byte 196,226,101,0,21,0,118,2,0 // vpshufb 0x27600(%rip),%ymm3,%ymm2 # 2b6a0 <_sk_overlay_sse2_8bit+0x6eb> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -20581,21 +20855,21 @@ _sk_load_8888_hsw: .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,155 // ja 3ed3 <_sk_load_8888_hsw+0x23> + .byte 119,155 // ja 406b <_sk_load_8888_hsw+0x23> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 3fd0 <_sk_load_8888_hsw+0x120> + .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4168 <_sk_load_8888_hsw+0x120> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3 - .byte 233,124,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23> + .byte 233,124,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23> .byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 .byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3 .byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0 .byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3 - .byte 233,85,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23> + .byte 233,85,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23> .byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -20608,9 +20882,9 @@ _sk_load_8888_hsw: .byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3 .byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0 .byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - .byte 233,6,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23> + .byte 233,6,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23> .byte 15,31,0 // nopl (%rax) - .byte 124,255 // jl 3fd1 <_sk_load_8888_hsw+0x121> + .byte 124,255 // jl 4169 <_sk_load_8888_hsw+0x121> .byte 255 // (bad) .byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp) .byte 255 // (bad) @@ -20644,16 +20918,16 @@ _sk_load_8888_dst_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,87 // jne 4060 <_sk_load_8888_dst_hsw+0x74> + .byte 117,87 // jne 41f8 <_sk_load_8888_dst_hsw+0x74> .byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7 - .byte 197,197,219,37,169,112,2,0 // vpand 0x270a9(%rip),%ymm7,%ymm4 # 2b0c0 <_sk_overlay_sse2_8bit+0x6ff> + .byte 197,197,219,37,17,117,2,0 // vpand 0x27511(%rip),%ymm7,%ymm4 # 2b6c0 <_sk_overlay_sse2_8bit+0x70b> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,98,125,24,5,84,110,2,0 // vbroadcastss 0x26e54(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,176,114,2,0 // vbroadcastss 0x272b0(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4 - .byte 196,226,69,0,45,174,112,2,0 // vpshufb 0x270ae(%rip),%ymm7,%ymm5 # 2b0e0 <_sk_overlay_sse2_8bit+0x71f> + .byte 196,226,69,0,45,22,117,2,0 // vpshufb 0x27516(%rip),%ymm7,%ymm5 # 2b6e0 <_sk_overlay_sse2_8bit+0x72b> .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 .byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5 - .byte 196,226,69,0,53,188,112,2,0 // vpshufb 0x270bc(%rip),%ymm7,%ymm6 # 2b100 <_sk_overlay_sse2_8bit+0x73f> + .byte 196,226,69,0,53,36,117,2,0 // vpshufb 0x27524(%rip),%ymm7,%ymm6 # 2b700 <_sk_overlay_sse2_8bit+0x74b> .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 .byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6 .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 @@ -20667,21 +20941,21 @@ _sk_load_8888_dst_hsw: .byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,155 // ja 400f <_sk_load_8888_dst_hsw+0x23> + .byte 119,155 // ja 41a7 <_sk_load_8888_dst_hsw+0x23> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 410c <_sk_load_8888_dst_hsw+0x120> + .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 42a4 <_sk_load_8888_dst_hsw+0x120> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7 - .byte 233,124,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23> + .byte 233,124,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23> .byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4 .byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 .byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7 .byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4 .byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7 - .byte 233,85,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23> + .byte 233,85,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23> .byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4 .byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 @@ -20694,9 +20968,9 @@ _sk_load_8888_dst_hsw: .byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7 .byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4 .byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - .byte 233,6,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23> + .byte 233,6,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23> .byte 15,31,0 // nopl (%rax) - .byte 124,255 // jl 410d <_sk_load_8888_dst_hsw+0x121> + .byte 124,255 // jl 42a5 <_sk_load_8888_dst_hsw+0x121> .byte 255 // (bad) .byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp) .byte 255 // (bad) @@ -20730,14 +21004,14 @@ _sk_gather_8888_hsw: .byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - .byte 197,229,219,5,202,111,2,0 // vpand 0x26fca(%rip),%ymm3,%ymm0 # 2b120 <_sk_overlay_sse2_8bit+0x75f> + .byte 197,229,219,5,50,116,2,0 // vpand 0x27432(%rip),%ymm3,%ymm0 # 2b720 <_sk_overlay_sse2_8bit+0x76b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,21,109,2,0 // vbroadcastss 0x26d15(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,113,113,2,0 // vbroadcastss 0x27171(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,207,111,2,0 // vpshufb 0x26fcf(%rip),%ymm3,%ymm1 # 2b140 <_sk_overlay_sse2_8bit+0x77f> + .byte 196,226,101,0,13,55,116,2,0 // vpshufb 0x27437(%rip),%ymm3,%ymm1 # 2b740 <_sk_overlay_sse2_8bit+0x78b> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,221,111,2,0 // vpshufb 0x26fdd(%rip),%ymm3,%ymm2 # 2b160 <_sk_overlay_sse2_8bit+0x79f> + .byte 196,226,101,0,21,69,116,2,0 // vpshufb 0x27445(%rip),%ymm3,%ymm2 # 2b760 <_sk_overlay_sse2_8bit+0x7ab> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -20758,7 +21032,7 @@ _sk_store_8888_hsw: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,113,108,2,0 // vbroadcastss 0x26c71(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,205,112,2,0 // vbroadcastss 0x270cd(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -20774,7 +21048,7 @@ _sk_store_8888_hsw: .byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8 .byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne 4218 <_sk_store_8888_hsw+0x7a> + .byte 117,11 // jne 43b0 <_sk_store_8888_hsw+0x7a> .byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -20783,17 +21057,17 @@ _sk_store_8888_hsw: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja 4213 <_sk_store_8888_hsw+0x75> + .byte 119,235 // ja 43ab <_sk_store_8888_hsw+0x75> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4288 <_sk_store_8888_hsw+0xea> + .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4420 <_sk_store_8888_hsw+0xea> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4) - .byte 235,207 // jmp 4213 <_sk_store_8888_hsw+0x75> + .byte 235,207 // jmp 43ab <_sk_store_8888_hsw+0x75> .byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) .byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4) - .byte 235,191 // jmp 4213 <_sk_store_8888_hsw+0x75> + .byte 235,191 // jmp 43ab <_sk_store_8888_hsw+0x75> .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 @@ -20801,7 +21075,7 @@ _sk_store_8888_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4) .byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4) - .byte 235,142 // jmp 4213 <_sk_store_8888_hsw+0x75> + .byte 235,142 // jmp 43ab <_sk_store_8888_hsw+0x75> .byte 15,31,0 // nopl (%rax) .byte 180,255 // mov $0xff,%ah .byte 255 // (bad) @@ -20813,7 +21087,7 @@ _sk_store_8888_hsw: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,218 // callq ffffffffdb00429c <_sk_overlay_sse2_8bit+0xffffffffdafd98db> + .byte 232,255,255,255,218 // callq ffffffffdb004434 <_sk_overlay_sse2_8bit+0xffffffffdafd947f> .byte 255 // (bad) .byte 255 // (bad) .byte 255,204 // dec %esp @@ -20834,16 +21108,16 @@ _sk_load_bgra_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,87 // jne 4318 <_sk_load_bgra_hsw+0x74> + .byte 117,87 // jne 44b0 <_sk_load_bgra_hsw+0x74> .byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3 - .byte 197,229,219,5,177,110,2,0 // vpand 0x26eb1(%rip),%ymm3,%ymm0 # 2b180 <_sk_overlay_sse2_8bit+0x7bf> + .byte 197,229,219,5,25,115,2,0 // vpand 0x27319(%rip),%ymm3,%ymm0 # 2b780 <_sk_overlay_sse2_8bit+0x7cb> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,156,107,2,0 // vbroadcastss 0x26b9c(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,248,111,2,0 // vbroadcastss 0x26ff8(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2 - .byte 196,226,101,0,5,182,110,2,0 // vpshufb 0x26eb6(%rip),%ymm3,%ymm0 # 2b1a0 <_sk_overlay_sse2_8bit+0x7df> + .byte 196,226,101,0,5,30,115,2,0 // vpshufb 0x2731e(%rip),%ymm3,%ymm0 # 2b7a0 <_sk_overlay_sse2_8bit+0x7eb> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1 - .byte 196,226,101,0,5,196,110,2,0 // vpshufb 0x26ec4(%rip),%ymm3,%ymm0 # 2b1c0 <_sk_overlay_sse2_8bit+0x7ff> + .byte 196,226,101,0,5,44,115,2,0 // vpshufb 0x2732c(%rip),%ymm3,%ymm0 # 2b7c0 <_sk_overlay_sse2_8bit+0x80b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -20857,21 +21131,21 @@ _sk_load_bgra_hsw: .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,155 // ja 42c7 <_sk_load_bgra_hsw+0x23> + .byte 119,155 // ja 445f <_sk_load_bgra_hsw+0x23> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 43c4 <_sk_load_bgra_hsw+0x120> + .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 455c <_sk_load_bgra_hsw+0x120> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3 - .byte 233,124,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23> + .byte 233,124,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23> .byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 .byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3 .byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0 .byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3 - .byte 233,85,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23> + .byte 233,85,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23> .byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -20884,9 +21158,9 @@ _sk_load_bgra_hsw: .byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3 .byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0 .byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - .byte 233,6,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23> + .byte 233,6,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23> .byte 15,31,0 // nopl (%rax) - .byte 124,255 // jl 43c5 <_sk_load_bgra_hsw+0x121> + .byte 124,255 // jl 455d <_sk_load_bgra_hsw+0x121> .byte 255 // (bad) .byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp) .byte 255 // (bad) @@ -20920,16 +21194,16 @@ _sk_load_bgra_dst_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,87 // jne 4454 <_sk_load_bgra_dst_hsw+0x74> + .byte 117,87 // jne 45ec <_sk_load_bgra_dst_hsw+0x74> .byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7 - .byte 197,197,219,37,213,109,2,0 // vpand 0x26dd5(%rip),%ymm7,%ymm4 # 2b1e0 <_sk_overlay_sse2_8bit+0x81f> + .byte 197,197,219,37,61,114,2,0 // vpand 0x2723d(%rip),%ymm7,%ymm4 # 2b7e0 <_sk_overlay_sse2_8bit+0x82b> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,98,125,24,5,96,106,2,0 // vbroadcastss 0x26a60(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,188,110,2,0 // vbroadcastss 0x26ebc(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6 - .byte 196,226,69,0,37,218,109,2,0 // vpshufb 0x26dda(%rip),%ymm7,%ymm4 # 2b200 <_sk_overlay_sse2_8bit+0x83f> + .byte 196,226,69,0,37,66,114,2,0 // vpshufb 0x27242(%rip),%ymm7,%ymm4 # 2b800 <_sk_overlay_sse2_8bit+0x84b> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 .byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5 - .byte 196,226,69,0,37,232,109,2,0 // vpshufb 0x26de8(%rip),%ymm7,%ymm4 # 2b220 <_sk_overlay_sse2_8bit+0x85f> + .byte 196,226,69,0,37,80,114,2,0 // vpshufb 0x27250(%rip),%ymm7,%ymm4 # 2b820 <_sk_overlay_sse2_8bit+0x86b> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 .byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4 .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 @@ -20943,21 +21217,21 @@ _sk_load_bgra_dst_hsw: .byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,155 // ja 4403 <_sk_load_bgra_dst_hsw+0x23> + .byte 119,155 // ja 459b <_sk_load_bgra_dst_hsw+0x23> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4500 <_sk_load_bgra_dst_hsw+0x120> + .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4698 <_sk_load_bgra_dst_hsw+0x120> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7 - .byte 233,124,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23> + .byte 233,124,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23> .byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4 .byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 .byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7 .byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4 .byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7 - .byte 233,85,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23> + .byte 233,85,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23> .byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4 .byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 @@ -20970,9 +21244,9 @@ _sk_load_bgra_dst_hsw: .byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7 .byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4 .byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - .byte 233,6,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23> + .byte 233,6,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23> .byte 15,31,0 // nopl (%rax) - .byte 124,255 // jl 4501 <_sk_load_bgra_dst_hsw+0x121> + .byte 124,255 // jl 4699 <_sk_load_bgra_dst_hsw+0x121> .byte 255 // (bad) .byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp) .byte 255 // (bad) @@ -21006,14 +21280,14 @@ _sk_gather_bgra_hsw: .byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - .byte 197,229,219,5,246,108,2,0 // vpand 0x26cf6(%rip),%ymm3,%ymm0 # 2b240 <_sk_overlay_sse2_8bit+0x87f> + .byte 197,229,219,5,94,113,2,0 // vpand 0x2715e(%rip),%ymm3,%ymm0 # 2b840 <_sk_overlay_sse2_8bit+0x88b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,33,105,2,0 // vbroadcastss 0x26921(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,125,109,2,0 // vbroadcastss 0x26d7d(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2 - .byte 196,226,101,0,5,251,108,2,0 // vpshufb 0x26cfb(%rip),%ymm3,%ymm0 # 2b260 <_sk_overlay_sse2_8bit+0x89f> + .byte 196,226,101,0,5,99,113,2,0 // vpshufb 0x27163(%rip),%ymm3,%ymm0 # 2b860 <_sk_overlay_sse2_8bit+0x8ab> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1 - .byte 196,226,101,0,5,9,109,2,0 // vpshufb 0x26d09(%rip),%ymm3,%ymm0 # 2b280 <_sk_overlay_sse2_8bit+0x8bf> + .byte 196,226,101,0,5,113,113,2,0 // vpshufb 0x27171(%rip),%ymm3,%ymm0 # 2b880 <_sk_overlay_sse2_8bit+0x8cb> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -21034,7 +21308,7 @@ _sk_store_bgra_hsw: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,125,104,2,0 // vbroadcastss 0x2687d(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,217,108,2,0 // vbroadcastss 0x26cd9(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -21050,7 +21324,7 @@ _sk_store_bgra_hsw: .byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8 .byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne 460c <_sk_store_bgra_hsw+0x7a> + .byte 117,11 // jne 47a4 <_sk_store_bgra_hsw+0x7a> .byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -21059,17 +21333,17 @@ _sk_store_bgra_hsw: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja 4607 <_sk_store_bgra_hsw+0x75> + .byte 119,235 // ja 479f <_sk_store_bgra_hsw+0x75> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 467c <_sk_store_bgra_hsw+0xea> + .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4814 <_sk_store_bgra_hsw+0xea> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4) - .byte 235,207 // jmp 4607 <_sk_store_bgra_hsw+0x75> + .byte 235,207 // jmp 479f <_sk_store_bgra_hsw+0x75> .byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) .byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4) - .byte 235,191 // jmp 4607 <_sk_store_bgra_hsw+0x75> + .byte 235,191 // jmp 479f <_sk_store_bgra_hsw+0x75> .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 @@ -21077,7 +21351,7 @@ _sk_store_bgra_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4) .byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4) - .byte 235,142 // jmp 4607 <_sk_store_bgra_hsw+0x75> + .byte 235,142 // jmp 479f <_sk_store_bgra_hsw+0x75> .byte 15,31,0 // nopl (%rax) .byte 180,255 // mov $0xff,%ah .byte 255 // (bad) @@ -21089,7 +21363,7 @@ _sk_store_bgra_hsw: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,218 // callq ffffffffdb004690 <_sk_overlay_sse2_8bit+0xffffffffdafd9ccf> + .byte 232,255,255,255,218 // callq ffffffffdb004828 <_sk_overlay_sse2_8bit+0xffffffffdafd9873> .byte 255 // (bad) .byte 255 // (bad) .byte 255,204 // dec %esp @@ -21109,7 +21383,7 @@ _sk_load_f16_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,101 // jne 4719 <_sk_load_f16_hsw+0x81> + .byte 117,101 // jne 48b1 <_sk_load_f16_hsw+0x81> .byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8 .byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2 .byte 196,193,121,16,92,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm3 @@ -21135,29 +21409,29 @@ _sk_load_f16_hsw: .byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 477f <_sk_load_f16_hsw+0xe7> + .byte 116,85 // je 4917 <_sk_load_f16_hsw+0xe7> .byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 477f <_sk_load_f16_hsw+0xe7> + .byte 114,72 // jb 4917 <_sk_load_f16_hsw+0xe7> .byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 478c <_sk_load_f16_hsw+0xf4> + .byte 116,72 // je 4924 <_sk_load_f16_hsw+0xf4> .byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 478c <_sk_load_f16_hsw+0xf4> + .byte 114,59 // jb 4924 <_sk_load_f16_hsw+0xf4> .byte 196,193,123,16,92,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,109,255,255,255 // je 46cf <_sk_load_f16_hsw+0x37> + .byte 15,132,109,255,255,255 // je 4867 <_sk_load_f16_hsw+0x37> .byte 196,193,97,22,92,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,92,255,255,255 // jb 46cf <_sk_load_f16_hsw+0x37> + .byte 15,130,92,255,255,255 // jb 4867 <_sk_load_f16_hsw+0x37> .byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9 - .byte 233,80,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37> + .byte 233,80,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,67,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37> + .byte 233,67,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,58,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37> + .byte 233,58,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37> HIDDEN _sk_load_f16_dst_hsw .globl _sk_load_f16_dst_hsw @@ -21171,7 +21445,7 @@ _sk_load_f16_dst_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,101 // jne 4816 <_sk_load_f16_dst_hsw+0x81> + .byte 117,101 // jne 49ae <_sk_load_f16_dst_hsw+0x81> .byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8 .byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6 .byte 196,193,121,16,124,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm7 @@ -21197,29 +21471,29 @@ _sk_load_f16_dst_hsw: .byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 487c <_sk_load_f16_dst_hsw+0xe7> + .byte 116,85 // je 4a14 <_sk_load_f16_dst_hsw+0xe7> .byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 487c <_sk_load_f16_dst_hsw+0xe7> + .byte 114,72 // jb 4a14 <_sk_load_f16_dst_hsw+0xe7> .byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 4889 <_sk_load_f16_dst_hsw+0xf4> + .byte 116,72 // je 4a21 <_sk_load_f16_dst_hsw+0xf4> .byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 4889 <_sk_load_f16_dst_hsw+0xf4> + .byte 114,59 // jb 4a21 <_sk_load_f16_dst_hsw+0xf4> .byte 196,193,123,16,124,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm7 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,109,255,255,255 // je 47cc <_sk_load_f16_dst_hsw+0x37> + .byte 15,132,109,255,255,255 // je 4964 <_sk_load_f16_dst_hsw+0x37> .byte 196,193,65,22,124,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,92,255,255,255 // jb 47cc <_sk_load_f16_dst_hsw+0x37> + .byte 15,130,92,255,255,255 // jb 4964 <_sk_load_f16_dst_hsw+0x37> .byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9 - .byte 233,80,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37> + .byte 233,80,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37> .byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7 .byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6 - .byte 233,67,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37> + .byte 233,67,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37> .byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7 - .byte 233,58,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37> + .byte 233,58,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37> HIDDEN _sk_gather_f16_hsw .globl _sk_gather_f16_hsw @@ -21282,7 +21556,7 @@ _sk_store_f16_hsw: .byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9 .byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,31 // jne 4997 <_sk_store_f16_hsw+0x7b> + .byte 117,31 // jne 4b2f <_sk_store_f16_hsw+0x7b> .byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8) .byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8) .byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8) @@ -21291,22 +21565,22 @@ _sk_store_f16_hsw: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 4993 <_sk_store_f16_hsw+0x77> + .byte 116,240 // je 4b2b <_sk_store_f16_hsw+0x77> .byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 4993 <_sk_store_f16_hsw+0x77> + .byte 114,227 // jb 4b2b <_sk_store_f16_hsw+0x77> .byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8) - .byte 116,218 // je 4993 <_sk_store_f16_hsw+0x77> + .byte 116,218 // je 4b2b <_sk_store_f16_hsw+0x77> .byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb 4993 <_sk_store_f16_hsw+0x77> + .byte 114,205 // jb 4b2b <_sk_store_f16_hsw+0x77> .byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8) - .byte 116,196 // je 4993 <_sk_store_f16_hsw+0x77> + .byte 116,196 // je 4b2b <_sk_store_f16_hsw+0x77> .byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,183 // jb 4993 <_sk_store_f16_hsw+0x77> + .byte 114,183 // jb 4b2b <_sk_store_f16_hsw+0x77> .byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8) - .byte 235,174 // jmp 4993 <_sk_store_f16_hsw+0x77> + .byte 235,174 // jmp 4b2b <_sk_store_f16_hsw+0x77> HIDDEN _sk_load_u16_be_hsw .globl _sk_load_u16_be_hsw @@ -21321,7 +21595,7 @@ _sk_load_u16_be_hsw: .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,204,0,0,0 // jne 4ad8 <_sk_load_u16_be_hsw+0xf3> + .byte 15,133,204,0,0,0 // jne 4c70 <_sk_load_u16_be_hsw+0xf3> .byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8 .byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2 .byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -21340,7 +21614,7 @@ _sk_load_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,39,100,2,0 // vbroadcastss 0x26427(%rip),%ymm10 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3> + .byte 196,98,125,24,21,131,104,2,0 // vbroadcastss 0x26883(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -21368,29 +21642,29 @@ _sk_load_u16_be_hsw: .byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 4b3e <_sk_load_u16_be_hsw+0x159> + .byte 116,85 // je 4cd6 <_sk_load_u16_be_hsw+0x159> .byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 4b3e <_sk_load_u16_be_hsw+0x159> + .byte 114,72 // jb 4cd6 <_sk_load_u16_be_hsw+0x159> .byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 4b4b <_sk_load_u16_be_hsw+0x166> + .byte 116,72 // je 4ce3 <_sk_load_u16_be_hsw+0x166> .byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 4b4b <_sk_load_u16_be_hsw+0x166> + .byte 114,59 // jb 4ce3 <_sk_load_u16_be_hsw+0x166> .byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,6,255,255,255 // je 4a27 <_sk_load_u16_be_hsw+0x42> + .byte 15,132,6,255,255,255 // je 4bbf <_sk_load_u16_be_hsw+0x42> .byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,245,254,255,255 // jb 4a27 <_sk_load_u16_be_hsw+0x42> + .byte 15,130,245,254,255,255 // jb 4bbf <_sk_load_u16_be_hsw+0x42> .byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9 - .byte 233,233,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42> + .byte 233,233,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,220,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42> + .byte 233,220,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,211,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42> + .byte 233,211,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42> HIDDEN _sk_load_rgb_u16_be_hsw .globl _sk_load_rgb_u16_be_hsw @@ -21407,7 +21681,7 @@ _sk_load_rgb_u16_be_hsw: .byte 72,141,4,64 // lea (%rax,%rax,2),%rax .byte 72,193,248,32 // sar $0x20,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,204,0,0,0 // jne 4c4b <_sk_load_rgb_u16_be_hsw+0xf7> + .byte 15,133,204,0,0,0 // jne 4de3 <_sk_load_rgb_u16_be_hsw+0xf7> .byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0 .byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2 .byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -21431,7 +21705,7 @@ _sk_load_rgb_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,155,98,2,0 // vbroadcastss 0x2629b(%rip),%ymm10 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3> + .byte 196,98,125,24,21,247,102,2,0 // vbroadcastss 0x266f7(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -21448,41 +21722,41 @@ _sk_load_rgb_u16_be_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,187,97,2,0 // vbroadcastss 0x261bb(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,23,102,2,0 // vbroadcastss 0x26617(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0 .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne 4c64 <_sk_load_rgb_u16_be_hsw+0x110> - .byte 233,79,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f> + .byte 117,5 // jne 4dfc <_sk_load_rgb_u16_be_hsw+0x110> + .byte 233,79,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f> .byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1 .byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb 4c93 <_sk_load_rgb_u16_be_hsw+0x13f> + .byte 114,26 // jb 4e2b <_sk_load_rgb_u16_be_hsw+0x13f> .byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1 .byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne 4c98 <_sk_load_rgb_u16_be_hsw+0x144> - .byte 233,32,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f> - .byte 233,27,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f> + .byte 117,10 // jne 4e30 <_sk_load_rgb_u16_be_hsw+0x144> + .byte 233,32,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f> + .byte 233,27,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f> .byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1 .byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb 4cc7 <_sk_load_rgb_u16_be_hsw+0x173> + .byte 114,26 // jb 4e5f <_sk_load_rgb_u16_be_hsw+0x173> .byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1 .byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne 4ccc <_sk_load_rgb_u16_be_hsw+0x178> - .byte 233,236,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f> - .byte 233,231,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f> + .byte 117,10 // jne 4e64 <_sk_load_rgb_u16_be_hsw+0x178> + .byte 233,236,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f> + .byte 233,231,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f> .byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3 .byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb 4cf5 <_sk_load_rgb_u16_be_hsw+0x1a1> + .byte 114,20 // jb 4e8d <_sk_load_rgb_u16_be_hsw+0x1a1> .byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3 .byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - .byte 233,190,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f> - .byte 233,185,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f> + .byte 233,190,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f> + .byte 233,185,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f> HIDDEN _sk_store_u16_be_hsw .globl _sk_store_u16_be_hsw @@ -21496,7 +21770,7 @@ _sk_store_u16_be_hsw: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax - .byte 196,98,125,24,5,251,97,2,0 // vbroadcastss 0x261fb(%rip),%ymm8 # 2af1c <_sk_overlay_sse2_8bit+0x55b> + .byte 196,98,125,24,5,87,102,2,0 // vbroadcastss 0x26657(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -21534,7 +21808,7 @@ _sk_store_u16_be_hsw: .byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9 .byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,31 // jne 4e05 <_sk_store_u16_be_hsw+0x10b> + .byte 117,31 // jne 4f9d <_sk_store_u16_be_hsw+0x10b> .byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2) .byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2) .byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2) @@ -21543,22 +21817,22 @@ _sk_store_u16_be_hsw: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 4e01 <_sk_store_u16_be_hsw+0x107> + .byte 116,240 // je 4f99 <_sk_store_u16_be_hsw+0x107> .byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 4e01 <_sk_store_u16_be_hsw+0x107> + .byte 114,227 // jb 4f99 <_sk_store_u16_be_hsw+0x107> .byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2) - .byte 116,218 // je 4e01 <_sk_store_u16_be_hsw+0x107> + .byte 116,218 // je 4f99 <_sk_store_u16_be_hsw+0x107> .byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb 4e01 <_sk_store_u16_be_hsw+0x107> + .byte 114,205 // jb 4f99 <_sk_store_u16_be_hsw+0x107> .byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2) - .byte 116,196 // je 4e01 <_sk_store_u16_be_hsw+0x107> + .byte 116,196 // je 4f99 <_sk_store_u16_be_hsw+0x107> .byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,183 // jb 4e01 <_sk_store_u16_be_hsw+0x107> + .byte 114,183 // jb 4f99 <_sk_store_u16_be_hsw+0x107> .byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2) - .byte 235,174 // jmp 4e01 <_sk_store_u16_be_hsw+0x107> + .byte 235,174 // jmp 4f99 <_sk_store_u16_be_hsw+0x107> HIDDEN _sk_load_f32_hsw .globl _sk_load_f32_hsw @@ -21566,7 +21840,7 @@ FUNCTION(_sk_load_f32_hsw) _sk_load_f32_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,135,128,0,0,0 // ja 4edf <_sk_load_f32_hsw+0x8c> + .byte 15,135,128,0,0,0 // ja 5077 <_sk_load_f32_hsw+0x8c> .byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d .byte 76,99,88,8 // movslq 0x8(%rax),%r11 .byte 76,99,201 // movslq %ecx,%r9 @@ -21574,7 +21848,7 @@ _sk_load_f32_hsw: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 77,99,210 // movslq %r10d,%r10 - .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 4f08 <_sk_load_f32_hsw+0xb5> + .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 50a0 <_sk_load_f32_hsw+0xb5> .byte 75,99,4,131 // movslq (%r11,%r8,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax @@ -21622,7 +21896,7 @@ FUNCTION(_sk_load_f32_dst_hsw) _sk_load_f32_dst_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,135,128,0,0,0 // ja 4fb4 <_sk_load_f32_dst_hsw+0x8c> + .byte 15,135,128,0,0,0 // ja 514c <_sk_load_f32_dst_hsw+0x8c> .byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d .byte 76,99,88,8 // movslq 0x8(%rax),%r11 .byte 76,99,201 // movslq %ecx,%r9 @@ -21630,7 +21904,7 @@ _sk_load_f32_dst_hsw: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 77,99,210 // movslq %r10d,%r10 - .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 4fdc <_sk_load_f32_dst_hsw+0xb4> + .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 5174 <_sk_load_f32_dst_hsw+0xb4> .byte 75,99,4,131 // movslq (%r11,%r8,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax @@ -21694,7 +21968,7 @@ _sk_store_f32_hsw: .byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8 .byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11 .byte 77,133,192 // test %r8,%r8 - .byte 117,55 // jne 507b <_sk_store_f32_hsw+0x7f> + .byte 117,55 // jne 5213 <_sk_store_f32_hsw+0x7f> .byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 .byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 .byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -21707,22 +21981,22 @@ _sk_store_f32_hsw: .byte 255,224 // jmpq *%rax .byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 5077 <_sk_store_f32_hsw+0x7b> + .byte 116,240 // je 520f <_sk_store_f32_hsw+0x7b> .byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 5077 <_sk_store_f32_hsw+0x7b> + .byte 114,227 // jb 520f <_sk_store_f32_hsw+0x7b> .byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4) - .byte 116,218 // je 5077 <_sk_store_f32_hsw+0x7b> + .byte 116,218 // je 520f <_sk_store_f32_hsw+0x7b> .byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb 5077 <_sk_store_f32_hsw+0x7b> + .byte 114,205 // jb 520f <_sk_store_f32_hsw+0x7b> .byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - .byte 116,195 // je 5077 <_sk_store_f32_hsw+0x7b> + .byte 116,195 // je 520f <_sk_store_f32_hsw+0x7b> .byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,181 // jb 5077 <_sk_store_f32_hsw+0x7b> + .byte 114,181 // jb 520f <_sk_store_f32_hsw+0x7b> .byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - .byte 235,171 // jmp 5077 <_sk_store_f32_hsw+0x7b> + .byte 235,171 // jmp 520f <_sk_store_f32_hsw+0x7b> HIDDEN _sk_clamp_x_hsw .globl _sk_clamp_x_hsw @@ -21799,7 +22073,7 @@ _sk_mirror_x_hsw: .byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11 .byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0 .byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8 - .byte 197,178,89,5,87,92,2,0 // vmulss 0x25c57(%rip),%xmm9,%xmm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 197,178,89,5,179,96,2,0 // vmulss 0x260b3(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 .byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0 .byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0 @@ -21826,7 +22100,7 @@ _sk_mirror_y_hsw: .byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11 .byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1 .byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8 - .byte 197,178,89,13,243,91,2,0 // vmulss 0x25bf3(%rip),%xmm9,%xmm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 197,178,89,13,79,96,2,0 // vmulss 0x2604f(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1 .byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1 .byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1 @@ -21848,7 +22122,7 @@ FUNCTION(_sk_clamp_x_1_hsw) _sk_clamp_x_1_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,168,91,2,0 // vbroadcastss 0x25ba8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,4,96,2,0 // vbroadcastss 0x26004(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -21866,9 +22140,9 @@ HIDDEN _sk_mirror_x_1_hsw .globl _sk_mirror_x_1_hsw FUNCTION(_sk_mirror_x_1_hsw) _sk_mirror_x_1_hsw: - .byte 196,98,125,24,5,159,91,2,0 // vbroadcastss 0x25b9f(%rip),%ymm8 # 2ae1c <_sk_overlay_sse2_8bit+0x45b> + .byte 196,98,125,24,5,251,95,2,0 // vbroadcastss 0x25ffb(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,117,91,2,0 // vbroadcastss 0x25b75(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,13,209,95,2,0 // vbroadcastss 0x25fd1(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -21884,11 +22158,11 @@ HIDDEN _sk_luminance_to_alpha_hsw .globl _sk_luminance_to_alpha_hsw FUNCTION(_sk_luminance_to_alpha_hsw) _sk_luminance_to_alpha_hsw: - .byte 196,226,125,24,29,97,92,2,0 // vbroadcastss 0x25c61(%rip),%ymm3 # 2af20 <_sk_overlay_sse2_8bit+0x55f> - .byte 196,98,125,24,5,92,92,2,0 // vbroadcastss 0x25c5c(%rip),%ymm8 # 2af24 <_sk_overlay_sse2_8bit+0x563> + .byte 196,226,125,24,29,189,96,2,0 // vbroadcastss 0x260bd(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f> + .byte 196,98,125,24,5,184,96,2,0 // vbroadcastss 0x260b8(%rip),%ymm8 # 2b518 <_sk_overlay_sse2_8bit+0x563> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1 - .byte 196,226,125,24,29,77,92,2,0 // vbroadcastss 0x25c4d(%rip),%ymm3 # 2af28 <_sk_overlay_sse2_8bit+0x567> + .byte 196,226,125,24,29,169,96,2,0 // vbroadcastss 0x260a9(%rip),%ymm3 # 2b51c <_sk_overlay_sse2_8bit+0x567> .byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -22088,9 +22362,9 @@ _sk_evenly_spaced_gradient_hsw: .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 77,137,211 // mov %r10,%r11 .byte 73,255,203 // dec %r11 - .byte 120,7 // js 55d4 <_sk_evenly_spaced_gradient_hsw+0x19> + .byte 120,7 // js 576c <_sk_evenly_spaced_gradient_hsw+0x19> .byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1 - .byte 235,22 // jmp 55ea <_sk_evenly_spaced_gradient_hsw+0x2f> + .byte 235,22 // jmp 5782 <_sk_evenly_spaced_gradient_hsw+0x2f> .byte 76,137,219 // mov %r11,%rbx .byte 72,209,235 // shr %rbx .byte 65,131,227,1 // and $0x1,%r11d @@ -22101,7 +22375,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1 .byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11 .byte 73,131,250,8 // cmp $0x8,%r10 - .byte 119,70 // ja 5643 <_sk_evenly_spaced_gradient_hsw+0x88> + .byte 119,70 // ja 57db <_sk_evenly_spaced_gradient_hsw+0x88> .byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8 .byte 72,139,88,40 // mov 0x28(%rax),%rbx .byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9 @@ -22117,7 +22391,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13 - .byte 235,110 // jmp 56b1 <_sk_evenly_spaced_gradient_hsw+0xf6> + .byte 235,110 // jmp 5849 <_sk_evenly_spaced_gradient_hsw+0xf6> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8 @@ -22154,14 +22428,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw .globl _sk_gauss_a_to_rgba_hsw FUNCTION(_sk_gauss_a_to_rgba_hsw) _sk_gauss_a_to_rgba_hsw: - .byte 196,226,125,24,5,85,88,2,0 // vbroadcastss 0x25855(%rip),%ymm0 # 2af2c <_sk_overlay_sse2_8bit+0x56b> - .byte 196,226,125,24,13,80,88,2,0 // vbroadcastss 0x25850(%rip),%ymm1 # 2af30 <_sk_overlay_sse2_8bit+0x56f> + .byte 196,226,125,24,5,177,92,2,0 // vbroadcastss 0x25cb1(%rip),%ymm0 # 2b520 <_sk_overlay_sse2_8bit+0x56b> + .byte 196,226,125,24,13,172,92,2,0 // vbroadcastss 0x25cac(%rip),%ymm1 # 2b524 <_sk_overlay_sse2_8bit+0x56f> .byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,70,88,2,0 // vbroadcastss 0x25846(%rip),%ymm0 # 2af34 <_sk_overlay_sse2_8bit+0x573> + .byte 196,226,125,24,5,162,92,2,0 // vbroadcastss 0x25ca2(%rip),%ymm0 # 2b528 <_sk_overlay_sse2_8bit+0x573> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 - .byte 196,226,125,24,13,60,88,2,0 // vbroadcastss 0x2583c(%rip),%ymm1 # 2af38 <_sk_overlay_sse2_8bit+0x577> + .byte 196,226,125,24,13,152,92,2,0 // vbroadcastss 0x25c98(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577> .byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,50,88,2,0 // vbroadcastss 0x25832(%rip),%ymm0 # 2af3c <_sk_overlay_sse2_8bit+0x57b> + .byte 196,226,125,24,5,142,92,2,0 // vbroadcastss 0x25c8e(%rip),%ymm0 # 2b530 <_sk_overlay_sse2_8bit+0x57b> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -22176,11 +22450,11 @@ _sk_gradient_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 73,131,249,1 // cmp $0x1,%r9 - .byte 15,134,180,0,0,0 // jbe 57e2 <_sk_gradient_hsw+0xc3> + .byte 15,134,180,0,0,0 // jbe 597a <_sk_gradient_hsw+0xc3> .byte 76,139,80,72 // mov 0x48(%rax),%r10 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 65,187,1,0,0,0 // mov $0x1,%r11d - .byte 196,226,125,24,21,195,86,2,0 // vbroadcastss 0x256c3(%rip),%ymm2 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,226,125,24,21,31,91,2,0 // vbroadcastss 0x25b1f(%rip),%ymm2 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9 .byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3 .byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3 @@ -22188,10 +22462,10 @@ _sk_gradient_hsw: .byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9 .byte 73,255,195 // inc %r11 .byte 77,57,217 // cmp %r11,%r9 - .byte 117,226 // jne 574a <_sk_gradient_hsw+0x2b> + .byte 117,226 // jne 58e2 <_sk_gradient_hsw+0x2b> .byte 76,139,80,8 // mov 0x8(%rax),%r10 .byte 73,131,249,8 // cmp $0x8,%r9 - .byte 118,121 // jbe 57eb <_sk_gradient_hsw+0xcc> + .byte 118,121 // jbe 5983 <_sk_gradient_hsw+0xcc> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8 @@ -22215,7 +22489,7 @@ _sk_gradient_hsw: .byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13 - .byte 235,77 // jmp 582f <_sk_gradient_hsw+0x110> + .byte 235,77 // jmp 59c7 <_sk_gradient_hsw+0x110> .byte 76,139,80,8 // mov 0x8(%rax),%r10 .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8 @@ -22275,24 +22549,24 @@ _sk_xy_to_unit_angle_hsw: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,118,86,2,0 // vbroadcastss 0x25676(%rip),%ymm13 # 2af40 <_sk_overlay_sse2_8bit+0x57f> - .byte 196,98,125,24,53,113,86,2,0 // vbroadcastss 0x25671(%rip),%ymm14 # 2af44 <_sk_overlay_sse2_8bit+0x583> + .byte 196,98,125,24,45,210,90,2,0 // vbroadcastss 0x25ad2(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f> + .byte 196,98,125,24,53,205,90,2,0 // vbroadcastss 0x25acd(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 - .byte 196,98,125,24,45,103,86,2,0 // vbroadcastss 0x25667(%rip),%ymm13 # 2af48 <_sk_overlay_sse2_8bit+0x587> + .byte 196,98,125,24,45,195,90,2,0 // vbroadcastss 0x25ac3(%rip),%ymm13 # 2b53c <_sk_overlay_sse2_8bit+0x587> .byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13 - .byte 196,98,125,24,53,93,86,2,0 // vbroadcastss 0x2565d(%rip),%ymm14 # 2af4c <_sk_overlay_sse2_8bit+0x58b> + .byte 196,98,125,24,53,185,90,2,0 // vbroadcastss 0x25ab9(%rip),%ymm14 # 2b540 <_sk_overlay_sse2_8bit+0x58b> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 .byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,72,86,2,0 // vbroadcastss 0x25648(%rip),%ymm10 # 2af50 <_sk_overlay_sse2_8bit+0x58f> + .byte 196,98,125,24,21,164,90,2,0 // vbroadcastss 0x25aa4(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,222,84,2,0 // vbroadcastss 0x254de(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,21,58,89,2,0 // vbroadcastss 0x2593a(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,200,84,2,0 // vbroadcastss 0x254c8(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,21,36,89,2,0 // vbroadcastss 0x25924(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -22320,23 +22594,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw: .byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10 .byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10 .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 - .byte 196,98,125,24,29,200,85,2,0 // vbroadcastss 0x255c8(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593> + .byte 196,98,125,24,29,36,90,2,0 // vbroadcastss 0x25a24(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11 .byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11 .byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0 .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,13,167,85,2,0 // vbroadcastss 0x255a7(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597> + .byte 196,98,125,24,13,3,90,2,0 // vbroadcastss 0x25a03(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0 .byte 197,252,81,192 // vsqrtps %ymm0,%ymm0 .byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8 - .byte 196,98,125,24,13,138,85,2,0 // vbroadcastss 0x2558a(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,125,24,13,230,89,2,0 // vbroadcastss 0x259e6(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,27,84,2,0 // vbroadcastss 0x2541b(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,29,119,88,2,0 // vbroadcastss 0x25877(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10 .byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0 @@ -22355,23 +22629,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw: .byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10 .byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10 .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 - .byte 196,98,125,24,29,48,85,2,0 // vbroadcastss 0x25530(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593> + .byte 196,98,125,24,29,140,89,2,0 // vbroadcastss 0x2598c(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11 .byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11 .byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0 .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,13,15,85,2,0 // vbroadcastss 0x2550f(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597> + .byte 196,98,125,24,13,107,89,2,0 // vbroadcastss 0x2596b(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0 .byte 197,252,81,192 // vsqrtps %ymm0,%ymm0 .byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8 - .byte 196,98,125,24,13,242,84,2,0 // vbroadcastss 0x254f2(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,125,24,13,78,89,2,0 // vbroadcastss 0x2594e(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,131,83,2,0 // vbroadcastss 0x25383(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,29,223,87,2,0 // vbroadcastss 0x257df(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10 .byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0 @@ -22389,14 +22663,14 @@ _sk_xy_to_2pt_conical_linear_hsw: .byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9 .byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9 .byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9 - .byte 196,98,125,24,21,158,84,2,0 // vbroadcastss 0x2549e(%rip),%ymm10 # 2af54 <_sk_overlay_sse2_8bit+0x593> + .byte 196,98,125,24,21,250,88,2,0 // vbroadcastss 0x258fa(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 .byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10 .byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10 .byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0 .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 .byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0 - .byte 196,98,125,24,5,129,84,2,0 // vbroadcastss 0x25481(%rip),%ymm8 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,125,24,5,221,88,2,0 // vbroadcastss 0x258dd(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0 .byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -22436,7 +22710,7 @@ HIDDEN _sk_save_xy_hsw FUNCTION(_sk_save_xy_hsw) _sk_save_xy_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,193,82,2,0 // vbroadcastss 0x252c1(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,29,87,2,0 // vbroadcastss 0x2571d(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -22470,9 +22744,9 @@ HIDDEN _sk_bilinear_nx_hsw FUNCTION(_sk_bilinear_nx_hsw) _sk_bilinear_nx_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,177,83,2,0 // vbroadcastss 0x253b1(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,5,13,88,2,0 // vbroadcastss 0x2580d(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,72,82,2,0 // vbroadcastss 0x25248(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,164,86,2,0 // vbroadcastss 0x256a4(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -22483,7 +22757,7 @@ HIDDEN _sk_bilinear_px_hsw FUNCTION(_sk_bilinear_px_hsw) _sk_bilinear_px_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,40,82,2,0 // vbroadcastss 0x25228(%rip),%ymm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,5,132,86,2,0 // vbroadcastss 0x25684(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -22495,9 +22769,9 @@ HIDDEN _sk_bilinear_ny_hsw FUNCTION(_sk_bilinear_ny_hsw) _sk_bilinear_ny_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,104,83,2,0 // vbroadcastss 0x25368(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,13,196,87,2,0 // vbroadcastss 0x257c4(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,254,81,2,0 // vbroadcastss 0x251fe(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,90,86,2,0 // vbroadcastss 0x2565a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -22508,7 +22782,7 @@ HIDDEN _sk_bilinear_py_hsw FUNCTION(_sk_bilinear_py_hsw) _sk_bilinear_py_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,222,81,2,0 // vbroadcastss 0x251de(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,13,58,86,2,0 // vbroadcastss 0x2563a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -22520,13 +22794,13 @@ HIDDEN _sk_bicubic_n3x_hsw FUNCTION(_sk_bicubic_n3x_hsw) _sk_bicubic_n3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,33,83,2,0 // vbroadcastss 0x25321(%rip),%ymm0 # 2af64 <_sk_overlay_sse2_8bit+0x5a3> + .byte 196,226,125,24,5,125,87,2,0 // vbroadcastss 0x2577d(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,180,81,2,0 // vbroadcastss 0x251b4(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,16,86,2,0 // vbroadcastss 0x25610(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,17,82,2,0 // vbroadcastss 0x25211(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> - .byte 196,98,125,24,29,252,82,2,0 // vbroadcastss 0x252fc(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,109,86,2,0 // vbroadcastss 0x2566d(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,29,88,87,2,0 // vbroadcastss 0x25758(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -22538,16 +22812,16 @@ HIDDEN _sk_bicubic_n1x_hsw FUNCTION(_sk_bicubic_n1x_hsw) _sk_bicubic_n1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,211,82,2,0 // vbroadcastss 0x252d3(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,5,47,87,2,0 // vbroadcastss 0x2572f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,106,81,2,0 // vbroadcastss 0x2516a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,198,85,2,0 // vbroadcastss 0x255c6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,196,82,2,0 // vbroadcastss 0x252c4(%rip),%ymm9 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> - .byte 196,98,125,24,21,191,82,2,0 // vbroadcastss 0x252bf(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,13,32,87,2,0 // vbroadcastss 0x25720(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,21,27,87,2,0 // vbroadcastss 0x2571b(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,65,81,2,0 // vbroadcastss 0x25141(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,13,157,85,2,0 // vbroadcastss 0x2559d(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,167,82,2,0 // vbroadcastss 0x252a7(%rip),%ymm10 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,21,3,87,2,0 // vbroadcastss 0x25703(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -22558,14 +22832,14 @@ HIDDEN _sk_bicubic_p1x_hsw FUNCTION(_sk_bicubic_p1x_hsw) _sk_bicubic_p1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,23,81,2,0 // vbroadcastss 0x25117(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,115,85,2,0 // vbroadcastss 0x25573(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,113,82,2,0 // vbroadcastss 0x25271(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> - .byte 196,98,125,24,29,108,82,2,0 // vbroadcastss 0x2526c(%rip),%ymm11 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,21,205,86,2,0 // vbroadcastss 0x256cd(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,29,200,86,2,0 // vbroadcastss 0x256c8(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,93,82,2,0 // vbroadcastss 0x2525d(%rip),%ymm8 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,5,185,86,2,0 // vbroadcastss 0x256b9(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -22576,12 +22850,12 @@ HIDDEN _sk_bicubic_p3x_hsw FUNCTION(_sk_bicubic_p3x_hsw) _sk_bicubic_p3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,57,82,2,0 // vbroadcastss 0x25239(%rip),%ymm0 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,226,125,24,5,149,86,2,0 // vbroadcastss 0x25695(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,42,81,2,0 // vbroadcastss 0x2512a(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> - .byte 196,98,125,24,29,21,82,2,0 // vbroadcastss 0x25215(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,134,85,2,0 // vbroadcastss 0x25586(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,29,113,86,2,0 // vbroadcastss 0x25671(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -22593,13 +22867,13 @@ HIDDEN _sk_bicubic_n3y_hsw FUNCTION(_sk_bicubic_n3y_hsw) _sk_bicubic_n3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,240,81,2,0 // vbroadcastss 0x251f0(%rip),%ymm1 # 2af64 <_sk_overlay_sse2_8bit+0x5a3> + .byte 196,226,125,24,13,76,86,2,0 // vbroadcastss 0x2564c(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,130,80,2,0 // vbroadcastss 0x25082(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,222,84,2,0 // vbroadcastss 0x254de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,223,80,2,0 // vbroadcastss 0x250df(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> - .byte 196,98,125,24,29,202,81,2,0 // vbroadcastss 0x251ca(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,59,85,2,0 // vbroadcastss 0x2553b(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,29,38,86,2,0 // vbroadcastss 0x25626(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -22611,16 +22885,16 @@ HIDDEN _sk_bicubic_n1y_hsw FUNCTION(_sk_bicubic_n1y_hsw) _sk_bicubic_n1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,161,81,2,0 // vbroadcastss 0x251a1(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,13,253,85,2,0 // vbroadcastss 0x255fd(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,55,80,2,0 // vbroadcastss 0x25037(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,147,84,2,0 // vbroadcastss 0x25493(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,145,81,2,0 // vbroadcastss 0x25191(%rip),%ymm9 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> - .byte 196,98,125,24,21,140,81,2,0 // vbroadcastss 0x2518c(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,13,237,85,2,0 // vbroadcastss 0x255ed(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,21,232,85,2,0 // vbroadcastss 0x255e8(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,14,80,2,0 // vbroadcastss 0x2500e(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,13,106,84,2,0 // vbroadcastss 0x2546a(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,116,81,2,0 // vbroadcastss 0x25174(%rip),%ymm10 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,21,208,85,2,0 // vbroadcastss 0x255d0(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -22631,14 +22905,14 @@ HIDDEN _sk_bicubic_p1y_hsw FUNCTION(_sk_bicubic_p1y_hsw) _sk_bicubic_p1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,228,79,2,0 // vbroadcastss 0x24fe4(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,64,84,2,0 // vbroadcastss 0x25440(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,61,81,2,0 // vbroadcastss 0x2513d(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> - .byte 196,98,125,24,29,56,81,2,0 // vbroadcastss 0x25138(%rip),%ymm11 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,21,153,85,2,0 // vbroadcastss 0x25599(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,29,148,85,2,0 // vbroadcastss 0x25594(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,41,81,2,0 // vbroadcastss 0x25129(%rip),%ymm8 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,5,133,85,2,0 // vbroadcastss 0x25585(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -22649,12 +22923,12 @@ HIDDEN _sk_bicubic_p3y_hsw FUNCTION(_sk_bicubic_p3y_hsw) _sk_bicubic_p3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,5,81,2,0 // vbroadcastss 0x25105(%rip),%ymm1 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,226,125,24,13,97,85,2,0 // vbroadcastss 0x25561(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,245,79,2,0 // vbroadcastss 0x24ff5(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> - .byte 196,98,125,24,29,224,80,2,0 // vbroadcastss 0x250e0(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,81,84,2,0 // vbroadcastss 0x25451(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,29,60,85,2,0 // vbroadcastss 0x2553c(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -22794,19 +23068,19 @@ _sk_clut_3D_hsw: .byte 197,254,127,76,36,160 // vmovdqu %ymm1,-0x60(%rsp) .byte 72,139,0 // mov (%rax),%rax .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1 - .byte 196,226,125,88,61,157,78,2,0 // vpbroadcastd 0x24e9d(%rip),%ymm7 # 2af7c <_sk_overlay_sse2_8bit+0x5bb> + .byte 196,226,125,88,61,249,82,2,0 // vpbroadcastd 0x252f9(%rip),%ymm7 # 2b570 <_sk_overlay_sse2_8bit+0x5bb> .byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1 .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6 .byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8 - .byte 196,98,125,88,21,17,77,2,0 // vpbroadcastd 0x24d11(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,98,125,88,21,109,81,2,0 // vpbroadcastd 0x2516d(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 196,193,117,254,242 // vpaddd %ymm10,%ymm1,%ymm6 .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11 .byte 196,226,37,146,28,176 // vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3 - .byte 196,98,125,88,29,0,77,2,0 // vpbroadcastd 0x24d00(%rip),%ymm11 # 2ae10 <_sk_overlay_sse2_8bit+0x44f> + .byte 196,98,125,88,29,92,81,2,0 // vpbroadcastd 0x2515c(%rip),%ymm11 # 2b404 <_sk_overlay_sse2_8bit+0x44f> .byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1 .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6 .byte 196,226,77,146,36,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4 - .byte 196,98,125,24,45,80,78,2,0 // vbroadcastss 0x24e50(%rip),%ymm13 # 2af78 <_sk_overlay_sse2_8bit+0x5b7> + .byte 196,98,125,24,45,172,82,2,0 // vbroadcastss 0x252ac(%rip),%ymm13 # 2b56c <_sk_overlay_sse2_8bit+0x5b7> .byte 196,193,124,88,245 // vaddps %ymm13,%ymm0,%ymm6 .byte 197,254,91,246 // vcvttps2dq %ymm6,%ymm6 .byte 196,226,77,64,205 // vpmulld %ymm5,%ymm6,%ymm1 @@ -23026,19 +23300,19 @@ _sk_clut_4D_hsw: .byte 197,126,91,245 // vcvttps2dq %ymm5,%ymm14 .byte 196,98,13,64,233 // vpmulld %ymm1,%ymm14,%ymm13 .byte 197,149,254,198 // vpaddd %ymm6,%ymm13,%ymm0 - .byte 196,98,125,88,21,230,73,2,0 // vpbroadcastd 0x249e6(%rip),%ymm10 # 2af7c <_sk_overlay_sse2_8bit+0x5bb> + .byte 196,98,125,88,21,66,78,2,0 // vpbroadcastd 0x24e42(%rip),%ymm10 # 2b570 <_sk_overlay_sse2_8bit+0x5bb> .byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0 .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8 .byte 196,98,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15 - .byte 196,98,125,88,29,89,72,2,0 // vpbroadcastd 0x24859(%rip),%ymm11 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,98,125,88,29,181,76,2,0 // vpbroadcastd 0x24cb5(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 196,65,125,254,195 // vpaddd %ymm11,%ymm0,%ymm8 .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9 .byte 196,162,53,146,20,128 // vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2 - .byte 196,98,125,88,37,72,72,2,0 // vpbroadcastd 0x24848(%rip),%ymm12 # 2ae10 <_sk_overlay_sse2_8bit+0x44f> + .byte 196,98,125,88,37,164,76,2,0 // vpbroadcastd 0x24ca4(%rip),%ymm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f> .byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0 .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8 .byte 196,226,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7 - .byte 196,98,125,24,13,151,73,2,0 // vbroadcastss 0x24997(%rip),%ymm9 # 2af78 <_sk_overlay_sse2_8bit+0x5b7> + .byte 196,98,125,24,13,243,77,2,0 // vbroadcastss 0x24df3(%rip),%ymm9 # 2b56c <_sk_overlay_sse2_8bit+0x5b7> .byte 196,65,84,88,193 // vaddps %ymm9,%ymm5,%ymm8 .byte 196,65,126,91,192 // vcvttps2dq %ymm8,%ymm8 .byte 196,226,61,64,193 // vpmulld %ymm1,%ymm8,%ymm0 @@ -23363,7 +23637,7 @@ _sk_clut_4D_hsw: .byte 197,196,92,214 // vsubps %ymm6,%ymm7,%ymm2 .byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,69,65,2,0 // vbroadcastss 0x24145(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,161,69,2,0 // vbroadcastss 0x245a1(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,16,164,36,32,3,0,0 // vmovups 0x320(%rsp),%ymm4 .byte 197,252,16,172,36,64,3,0,0 // vmovups 0x340(%rsp),%ymm5 .byte 197,252,16,180,36,96,3,0,0 // vmovups 0x360(%rsp),%ymm6 @@ -23391,7 +23665,7 @@ _sk_start_pipeline_avx: .byte 72,137,194 // mov %rax,%rdx .byte 72,137,77,176 // mov %rcx,-0x50(%rbp) .byte 73,57,206 // cmp %rcx,%r14 - .byte 115,117 // jae 6d8d <_sk_start_pipeline_avx+0xa1> + .byte 115,117 // jae 6f25 <_sk_start_pipeline_avx+0xa1> .byte 72,139,69,208 // mov -0x30(%rbp),%rax .byte 72,141,64,8 // lea 0x8(%rax),%rax .byte 72,137,69,184 // mov %rax,-0x48(%rbp) @@ -23401,7 +23675,7 @@ _sk_start_pipeline_avx: .byte 73,137,244 // mov %rsi,%r12 .byte 72,139,85,208 // mov -0x30(%rbp),%rdx .byte 72,57,93,184 // cmp %rbx,-0x48(%rbp) - .byte 119,45 // ja 6d69 <_sk_start_pipeline_avx+0x7d> + .byte 119,45 // ja 6f01 <_sk_start_pipeline_avx+0x7d> .byte 76,139,125,208 // mov -0x30(%rbp),%r15 .byte 69,49,192 // xor %r8d,%r8d .byte 76,137,207 // mov %r9,%rdi @@ -23415,10 +23689,10 @@ _sk_start_pipeline_avx: .byte 73,131,199,16 // add $0x10,%r15 .byte 73,57,223 // cmp %rbx,%r15 .byte 73,137,215 // mov %rdx,%r15 - .byte 118,215 // jbe 6d40 <_sk_start_pipeline_avx+0x54> + .byte 118,215 // jbe 6ed8 <_sk_start_pipeline_avx+0x54> .byte 73,137,216 // mov %rbx,%r8 .byte 73,41,208 // sub %rdx,%r8 - .byte 116,19 // je 6d84 <_sk_start_pipeline_avx+0x98> + .byte 116,19 // je 6f1c <_sk_start_pipeline_avx+0x98> .byte 76,137,207 // mov %r9,%rdi .byte 76,137,230 // mov %r12,%rsi .byte 76,137,241 // mov %r14,%rcx @@ -23427,7 +23701,7 @@ _sk_start_pipeline_avx: .byte 76,139,77,192 // mov -0x40(%rbp),%r9 .byte 73,255,198 // inc %r14 .byte 76,59,117,176 // cmp -0x50(%rbp),%r14 - .byte 117,165 // jne 6d32 <_sk_start_pipeline_avx+0x46> + .byte 117,165 // jne 6eca <_sk_start_pipeline_avx+0x46> .byte 72,131,196,40 // add $0x28,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -23452,7 +23726,7 @@ _sk_seed_shader_avx: .byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,68,64,2,0 // vbroadcastss 0x24044(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,13,160,68,2,0 // vbroadcastss 0x244a0(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0 .byte 197,249,110,209 // vmovd %ecx,%xmm2 @@ -23461,7 +23735,7 @@ _sk_seed_shader_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,30,64,2,0 // vbroadcastss 0x2401e(%rip),%ymm2 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,21,122,68,2,0 // vbroadcastss 0x2447a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -23485,7 +23759,7 @@ _sk_dither_avx: .byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9 .byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 .byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,199,63,2,0 // vbroadcastss 0x23fc7(%rip),%ymm11 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,98,125,24,29,35,68,2,0 // vbroadcastss 0x24423(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9 .byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 @@ -23496,8 +23770,8 @@ _sk_dither_avx: .byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11 .byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11 .byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - .byte 196,98,125,24,37,136,63,2,0 // vbroadcastss 0x23f88(%rip),%ymm12 # 2ae0c <_sk_overlay_sse2_8bit+0x44b> - .byte 196,98,125,24,45,131,63,2,0 // vbroadcastss 0x23f83(%rip),%ymm13 # 2ae10 <_sk_overlay_sse2_8bit+0x44f> + .byte 196,98,125,24,37,228,67,2,0 // vbroadcastss 0x243e4(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b> + .byte 196,98,125,24,45,223,67,2,0 // vbroadcastss 0x243df(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f> .byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14 .byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15 .byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14 @@ -23524,9 +23798,9 @@ _sk_dither_avx: .byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8 .byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,238,62,2,0 // vbroadcastss 0x23eee(%rip),%ymm9 # 2ae14 <_sk_overlay_sse2_8bit+0x453> + .byte 196,98,125,24,13,74,67,2,0 // vbroadcastss 0x2434a(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,228,62,2,0 // vbroadcastss 0x23ee4(%rip),%ymm9 # 2ae18 <_sk_overlay_sse2_8bit+0x457> + .byte 196,98,125,24,13,64,67,2,0 // vbroadcastss 0x24340(%rip),%ymm9 # 2b40c <_sk_overlay_sse2_8bit+0x457> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 @@ -23560,7 +23834,7 @@ HIDDEN _sk_black_color_avx FUNCTION(_sk_black_color_avx) _sk_black_color_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,108,62,2,0 // vbroadcastss 0x23e6c(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,200,66,2,0 // vbroadcastss 0x242c8(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 @@ -23571,7 +23845,7 @@ HIDDEN _sk_white_color_avx FUNCTION(_sk_white_color_avx) _sk_white_color_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,83,62,2,0 // vbroadcastss 0x23e53(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,175,66,2,0 // vbroadcastss 0x242af(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 197,252,40,216 // vmovaps %ymm0,%ymm3 @@ -23617,7 +23891,7 @@ HIDDEN _sk_srcatop_avx FUNCTION(_sk_srcatop_avx) _sk_srcatop_avx: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,242,61,2,0 // vbroadcastss 0x23df2(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,78,66,2,0 // vbroadcastss 0x2424e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -23638,7 +23912,7 @@ HIDDEN _sk_dstatop_avx FUNCTION(_sk_dstatop_avx) _sk_dstatop_avx: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 - .byte 196,98,125,24,13,176,61,2,0 // vbroadcastss 0x23db0(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,13,12,66,2,0 // vbroadcastss 0x2420c(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0 @@ -23680,7 +23954,7 @@ HIDDEN _sk_srcout_avx .globl _sk_srcout_avx FUNCTION(_sk_srcout_avx) _sk_srcout_avx: - .byte 196,98,125,24,5,75,61,2,0 // vbroadcastss 0x23d4b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,167,65,2,0 // vbroadcastss 0x241a7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -23693,7 +23967,7 @@ HIDDEN _sk_dstout_avx .globl _sk_dstout_avx FUNCTION(_sk_dstout_avx) _sk_dstout_avx: - .byte 196,226,125,24,5,42,61,2,0 // vbroadcastss 0x23d2a(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,134,65,2,0 // vbroadcastss 0x24186(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -23706,7 +23980,7 @@ HIDDEN _sk_srcover_avx .globl _sk_srcover_avx FUNCTION(_sk_srcover_avx) _sk_srcover_avx: - .byte 196,98,125,24,5,9,61,2,0 // vbroadcastss 0x23d09(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,101,65,2,0 // vbroadcastss 0x24165(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -23723,7 +23997,7 @@ HIDDEN _sk_dstover_avx .globl _sk_dstover_avx FUNCTION(_sk_dstover_avx) _sk_dstover_avx: - .byte 196,98,125,24,5,216,60,2,0 // vbroadcastss 0x23cd8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,52,65,2,0 // vbroadcastss 0x24134(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 @@ -23751,7 +24025,7 @@ HIDDEN _sk_multiply_avx .globl _sk_multiply_avx FUNCTION(_sk_multiply_avx) _sk_multiply_avx: - .byte 196,98,125,24,5,147,60,2,0 // vbroadcastss 0x23c93(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,239,64,2,0 // vbroadcastss 0x240ef(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -23782,9 +24056,14 @@ HIDDEN _sk_plus__avx FUNCTION(_sk_plus__avx) _sk_plus__avx: .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 + .byte 196,98,125,24,5,126,64,2,0 // vbroadcastss 0x2407e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> + .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1 + .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2 + .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3 + .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -23811,7 +24090,7 @@ HIDDEN _sk_xor__avx .globl _sk_xor__avx FUNCTION(_sk_xor__avx) _sk_xor__avx: - .byte 196,98,125,24,5,222,59,2,0 // vbroadcastss 0x23bde(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,29,64,2,0 // vbroadcastss 0x2401d(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -23848,7 +24127,7 @@ _sk_darken_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,90,59,2,0 // vbroadcastss 0x23b5a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,153,63,2,0 // vbroadcastss 0x23f99(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -23874,7 +24153,7 @@ _sk_lighten_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,2,59,2,0 // vbroadcastss 0x23b02(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,65,63,2,0 // vbroadcastss 0x23f41(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -23903,7 +24182,7 @@ _sk_difference_avx: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,158,58,2,0 // vbroadcastss 0x23a9e(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,221,62,2,0 // vbroadcastss 0x23edd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -23926,7 +24205,7 @@ _sk_exclusion_avx: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,85,58,2,0 // vbroadcastss 0x23a55(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,148,62,2,0 // vbroadcastss 0x23e94(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -23937,7 +24216,7 @@ HIDDEN _sk_colorburn_avx .globl _sk_colorburn_avx FUNCTION(_sk_colorburn_avx) _sk_colorburn_avx: - .byte 196,98,125,24,5,60,58,2,0 // vbroadcastss 0x23a3c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,123,62,2,0 // vbroadcastss 0x23e7b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -23999,7 +24278,7 @@ HIDDEN _sk_colordodge_avx FUNCTION(_sk_colordodge_avx) _sk_colordodge_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,64,57,2,0 // vbroadcastss 0x23940(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,13,127,61,2,0 // vbroadcastss 0x23d7f(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -24056,7 +24335,7 @@ HIDDEN _sk_hardlight_avx .globl _sk_hardlight_avx FUNCTION(_sk_hardlight_avx) _sk_hardlight_avx: - .byte 196,98,125,24,5,75,56,2,0 // vbroadcastss 0x2384b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,138,60,2,0 // vbroadcastss 0x23c8a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -24111,7 +24390,7 @@ HIDDEN _sk_overlay_avx .globl _sk_overlay_avx FUNCTION(_sk_overlay_avx) _sk_overlay_avx: - .byte 196,98,125,24,5,112,55,2,0 // vbroadcastss 0x23770(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,175,59,2,0 // vbroadcastss 0x23baf(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -24177,10 +24456,10 @@ _sk_softlight_avx: .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11 .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,29,119,54,2,0 // vbroadcastss 0x23677(%rip),%ymm11 # 2ae1c <_sk_overlay_sse2_8bit+0x45b> + .byte 196,98,125,24,29,182,58,2,0 // vbroadcastss 0x23ab6(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b> .byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13 .byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8 - .byte 196,98,125,24,45,104,54,2,0 // vbroadcastss 0x23668(%rip),%ymm13 # 2ae20 <_sk_overlay_sse2_8bit+0x45f> + .byte 196,98,125,24,45,167,58,2,0 // vbroadcastss 0x23aa7(%rip),%ymm13 # 2b414 <_sk_overlay_sse2_8bit+0x45f> .byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14 .byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8 .byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14 @@ -24191,7 +24470,7 @@ _sk_softlight_avx: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,18,54,2,0 // vbroadcastss 0x23612(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,81,58,2,0 // vbroadcastss 0x23a51(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 @@ -24318,12 +24597,12 @@ _sk_hue_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,245,51,2,0 // vbroadcastss 0x233f5(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,53,52,56,2,0 // vbroadcastss 0x23834(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,235,51,2,0 // vbroadcastss 0x233eb(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,61,42,56,2,0 // vbroadcastss 0x2382a(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,220,51,2,0 // vbroadcastss 0x233dc(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,226,125,24,5,27,56,2,0 // vbroadcastss 0x2381b(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -24384,7 +24663,7 @@ _sk_hue_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,137,50,2,0 // vbroadcastss 0x23289(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,200,54,2,0 // vbroadcastss 0x236c8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -24441,12 +24720,12 @@ _sk_saturation_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,179,49,2,0 // vbroadcastss 0x231b3(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,53,242,53,2,0 // vbroadcastss 0x235f2(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,169,49,2,0 // vbroadcastss 0x231a9(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,61,232,53,2,0 // vbroadcastss 0x235e8(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,154,49,2,0 // vbroadcastss 0x2319a(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,226,125,24,5,217,53,2,0 // vbroadcastss 0x235d9(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -24507,7 +24786,7 @@ _sk_saturation_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,71,48,2,0 // vbroadcastss 0x23047(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,134,52,2,0 // vbroadcastss 0x23486(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -24536,12 +24815,12 @@ _sk_color_avx: .byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp) .byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8 .byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9 - .byte 196,98,125,24,45,249,47,2,0 // vbroadcastss 0x22ff9(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,45,56,52,2,0 // vbroadcastss 0x23438(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10 - .byte 196,98,125,24,53,239,47,2,0 // vbroadcastss 0x22fef(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,53,46,52,2,0 // vbroadcastss 0x2342e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,224,47,2,0 // vbroadcastss 0x22fe0(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,98,125,24,61,31,52,2,0 // vbroadcastss 0x2341f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -24604,7 +24883,7 @@ _sk_color_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,123,46,2,0 // vbroadcastss 0x22e7b(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,186,50,2,0 // vbroadcastss 0x232ba(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -24634,12 +24913,12 @@ _sk_luminosity_avx: .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9 - .byte 196,98,125,24,45,41,46,2,0 // vbroadcastss 0x22e29(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,45,104,50,2,0 // vbroadcastss 0x23268(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10 - .byte 196,98,125,24,53,31,46,2,0 // vbroadcastss 0x22e1f(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467> + .byte 196,98,125,24,53,94,50,2,0 // vbroadcastss 0x2325e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467> .byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,16,46,2,0 // vbroadcastss 0x22e10(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b> + .byte 196,98,125,24,61,79,50,2,0 // vbroadcastss 0x2324f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b> .byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -24702,7 +24981,7 @@ _sk_luminosity_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,171,44,2,0 // vbroadcastss 0x22cab(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,5,234,48,2,0 // vbroadcastss 0x230ea(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -24735,9 +25014,9 @@ _sk_srcover_rgba_8888_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,43,1,0,0 // jne 82f0 <_sk_srcover_rgba_8888_avx+0x14c> + .byte 15,133,43,1,0,0 // jne 84a5 <_sk_srcover_rgba_8888_avx+0x14c> .byte 196,65,125,16,4,153 // vmovupd (%r9,%rbx,4),%ymm8 - .byte 197,125,40,13,205,48,2,0 // vmovapd 0x230cd(%rip),%ymm9 # 2b2a0 <_sk_overlay_sse2_8bit+0x8df> + .byte 197,125,40,13,24,53,2,0 // vmovapd 0x23518(%rip),%ymm9 # 2b8a0 <_sk_overlay_sse2_8bit+0x8eb> .byte 196,193,61,84,225 // vandpd %ymm9,%ymm8,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 .byte 196,193,81,114,208,8 // vpsrld $0x8,%xmm8,%xmm5 @@ -24755,9 +25034,9 @@ _sk_srcover_rgba_8888_avx: .byte 197,193,114,215,24 // vpsrld $0x18,%xmm7,%xmm7 .byte 196,227,61,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm8,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,208,43,2,0 // vbroadcastss 0x22bd0(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,15,48,2,0 // vbroadcastss 0x2300f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 - .byte 196,98,125,24,13,239,43,2,0 // vbroadcastss 0x22bef(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,13,46,48,2,0 // vbroadcastss 0x2302e(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 @@ -24790,7 +25069,7 @@ _sk_srcover_rgba_8888_avx: .byte 196,65,53,86,202 // vorpd %ymm10,%ymm9,%ymm9 .byte 196,65,61,86,193 // vorpd %ymm9,%ymm8,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,67 // jne 8328 <_sk_srcover_rgba_8888_avx+0x184> + .byte 117,67 // jne 84dd <_sk_srcover_rgba_8888_avx+0x184> .byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -24800,33 +25079,33 @@ _sk_srcover_rgba_8888_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,194,254,255,255 // ja 81cb <_sk_srcover_rgba_8888_avx+0x27> + .byte 15,135,194,254,255,255 // ja 8380 <_sk_srcover_rgba_8888_avx+0x27> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,4,1,0,0 // lea 0x104(%rip),%r11 # 8418 <_sk_srcover_rgba_8888_avx+0x274> + .byte 76,141,29,3,1,0,0 // lea 0x103(%rip),%r11 # 85cc <_sk_srcover_rgba_8888_avx+0x273> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,122,16,4,153 // vmovss (%r9,%rbx,4),%xmm8 - .byte 233,163,254,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27> + .byte 233,163,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27> .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,179 // ja 82eb <_sk_srcover_rgba_8888_avx+0x147> + .byte 119,179 // ja 84a0 <_sk_srcover_rgba_8888_avx+0x147> .byte 65,15,182,194 // movzbl %r10b,%eax - .byte 76,141,21,241,0,0,0 // lea 0xf1(%rip),%r10 # 8434 <_sk_srcover_rgba_8888_avx+0x290> + .byte 76,141,21,240,0,0,0 // lea 0xf0(%rip),%r10 # 85e8 <_sk_srcover_rgba_8888_avx+0x28f> .byte 73,99,4,130 // movslq (%r10,%rax,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4) - .byte 235,151 // jmp 82eb <_sk_srcover_rgba_8888_avx+0x147> + .byte 235,151 // jmp 84a0 <_sk_srcover_rgba_8888_avx+0x147> .byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4 .byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 .byte 196,99,85,12,196,4 // vblendps $0x4,%ymm4,%ymm5,%ymm8 .byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4 .byte 196,99,61,13,196,1 // vblendpd $0x1,%ymm4,%ymm8,%ymm8 - .byte 233,80,254,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27> + .byte 233,80,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27> .byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4 .byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4 .byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4 @@ -24840,10 +25119,10 @@ _sk_srcover_rgba_8888_avx: .byte 196,99,61,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm8,%ymm8 .byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4 .byte 196,67,93,13,192,12 // vblendpd $0xc,%ymm8,%ymm4,%ymm8 - .byte 233,251,253,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27> + .byte 233,251,253,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27> .byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) .byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4) - .byte 233,8,255,255,255 // jmpq 82eb <_sk_srcover_rgba_8888_avx+0x147> + .byte 233,8,255,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147> .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 @@ -24851,35 +25130,33 @@ _sk_srcover_rgba_8888_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4) .byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4) - .byte 233,212,254,255,255 // jmpq 82eb <_sk_srcover_rgba_8888_avx+0x147> - .byte 144 // nop - .byte 5,255,255,255,82 // add $0x52ffffff,%eax + .byte 233,212,254,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147> + .byte 6 // (bad) .byte 255 // (bad) .byte 255 // (bad) + .byte 255,83,255 // callq *-0x1(%rbx) .byte 255 // (bad) - .byte 60,255 // cmp $0xff,%al .byte 255 // (bad) - .byte 255,167,255,255,255,147 // jmpq *-0x6c000001(%rdi) + .byte 61,255,255,255,168 // cmp $0xa8ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) + .byte 255,148,255,255,255,128,255 // callq *-0x7f0001(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,255 // jg 842d <_sk_srcover_rgba_8888_avx+0x289> + .byte 255,100,255,255 // jmpq *-0x1(%rdi,%rdi,8) + .byte 255,25 // lcall *(%rcx) .byte 255 // (bad) - .byte 255,99,255 // jmpq *-0x1(%rbx) .byte 255 // (bad) - .byte 255,24 // lcall *(%rax) + .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,164,255,255,255,156,255 // jmpq *-0x630001(%rdi,%rdi,8) .byte 255 // (bad) + .byte 217,255 // fcos .byte 255 // (bad) - .byte 216,255 // fdivr %st(7),%st - .byte 255 // (bad) - .byte 255,203 // dec %ebx + .byte 255,204 // dec %esp .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 189,255,255,255,175 // mov $0xafffffff,%ebp + .byte 190,255,255,255,176 // mov $0xb0ffffff,%esi .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -24900,7 +25177,7 @@ HIDDEN _sk_clamp_1_avx .globl _sk_clamp_1_avx FUNCTION(_sk_clamp_1_avx) _sk_clamp_1_avx: - .byte 196,98,125,24,5,142,41,2,0 // vbroadcastss 0x2298e(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,206,45,2,0 // vbroadcastss 0x22dce(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -24912,7 +25189,7 @@ HIDDEN _sk_clamp_a_avx .globl _sk_clamp_a_avx FUNCTION(_sk_clamp_a_avx) _sk_clamp_a_avx: - .byte 196,98,125,24,5,109,41,2,0 // vbroadcastss 0x2296d(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,173,45,2,0 // vbroadcastss 0x22dad(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -24924,7 +25201,7 @@ HIDDEN _sk_clamp_a_dst_avx .globl _sk_clamp_a_dst_avx FUNCTION(_sk_clamp_a_dst_avx) _sk_clamp_a_dst_avx: - .byte 196,98,125,24,5,79,41,2,0 // vbroadcastss 0x2294f(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,143,45,2,0 // vbroadcastss 0x22d8f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7 .byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4 .byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5 @@ -24957,7 +25234,7 @@ HIDDEN _sk_invert_avx .globl _sk_invert_avx FUNCTION(_sk_invert_avx) _sk_invert_avx: - .byte 196,98,125,24,5,10,41,2,0 // vbroadcastss 0x2290a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,74,45,2,0 // vbroadcastss 0x22d4a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0 .byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 @@ -25013,7 +25290,7 @@ FUNCTION(_sk_unpremul_avx) _sk_unpremul_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,154,40,2,0 // vbroadcastss 0x2289a(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,21,218,44,2,0 // vbroadcastss 0x22cda(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -25026,17 +25303,17 @@ HIDDEN _sk_from_srgb_avx .globl _sk_from_srgb_avx FUNCTION(_sk_from_srgb_avx) _sk_from_srgb_avx: - .byte 196,98,125,24,5,167,40,2,0 // vbroadcastss 0x228a7(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473> + .byte 196,98,125,24,5,231,44,2,0 // vbroadcastss 0x22ce7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,133,40,2,0 // vbroadcastss 0x22885(%rip),%ymm11 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,29,197,44,2,0 // vbroadcastss 0x22cc5(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12 - .byte 196,98,125,24,45,139,40,2,0 // vbroadcastss 0x2288b(%rip),%ymm13 # 2ae38 <_sk_overlay_sse2_8bit+0x477> + .byte 196,98,125,24,45,203,44,2,0 // vbroadcastss 0x22ccb(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,124,40,2,0 // vbroadcastss 0x2287c(%rip),%ymm12 # 2ae3c <_sk_overlay_sse2_8bit+0x47b> + .byte 196,98,125,24,37,188,44,2,0 // vbroadcastss 0x22cbc(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,53,114,40,2,0 // vbroadcastss 0x22872(%rip),%ymm14 # 2ae40 <_sk_overlay_sse2_8bit+0x47f> + .byte 196,98,125,24,53,178,44,2,0 // vbroadcastss 0x22cb2(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f> .byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0 .byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -25062,17 +25339,17 @@ HIDDEN _sk_from_srgb_dst_avx .globl _sk_from_srgb_dst_avx FUNCTION(_sk_from_srgb_dst_avx) _sk_from_srgb_dst_avx: - .byte 196,98,125,24,5,251,39,2,0 // vbroadcastss 0x227fb(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473> + .byte 196,98,125,24,5,59,44,2,0 // vbroadcastss 0x22c3b(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473> .byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9 .byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10 - .byte 196,98,125,24,29,217,39,2,0 // vbroadcastss 0x227d9(%rip),%ymm11 # 2ae24 <_sk_overlay_sse2_8bit+0x463> + .byte 196,98,125,24,29,25,44,2,0 // vbroadcastss 0x22c19(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463> .byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12 - .byte 196,98,125,24,45,223,39,2,0 // vbroadcastss 0x227df(%rip),%ymm13 # 2ae38 <_sk_overlay_sse2_8bit+0x477> + .byte 196,98,125,24,45,31,44,2,0 // vbroadcastss 0x22c1f(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,208,39,2,0 // vbroadcastss 0x227d0(%rip),%ymm12 # 2ae3c <_sk_overlay_sse2_8bit+0x47b> + .byte 196,98,125,24,37,16,44,2,0 // vbroadcastss 0x22c10(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,53,198,39,2,0 // vbroadcastss 0x227c6(%rip),%ymm14 # 2ae40 <_sk_overlay_sse2_8bit+0x47f> + .byte 196,98,125,24,53,6,44,2,0 // vbroadcastss 0x22c06(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f> .byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4 .byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4 .byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9 @@ -25099,20 +25376,20 @@ HIDDEN _sk_to_srgb_avx FUNCTION(_sk_to_srgb_avx) _sk_to_srgb_avx: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,91,39,2,0 // vbroadcastss 0x2275b(%rip),%ymm8 # 2ae44 <_sk_overlay_sse2_8bit+0x483> + .byte 196,98,125,24,5,155,43,2,0 // vbroadcastss 0x22b9b(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,85,39,2,0 // vbroadcastss 0x22755(%rip),%ymm11 # 2ae4c <_sk_overlay_sse2_8bit+0x48b> + .byte 196,98,125,24,29,149,43,2,0 // vbroadcastss 0x22b95(%rip),%ymm11 # 2b440 <_sk_overlay_sse2_8bit+0x48b> .byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12 - .byte 196,98,125,24,45,67,39,2,0 // vbroadcastss 0x22743(%rip),%ymm13 # 2ae48 <_sk_overlay_sse2_8bit+0x487> + .byte 196,98,125,24,45,131,43,2,0 // vbroadcastss 0x22b83(%rip),%ymm13 # 2b43c <_sk_overlay_sse2_8bit+0x487> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12 - .byte 196,98,125,24,53,56,39,2,0 // vbroadcastss 0x22738(%rip),%ymm14 # 2ae50 <_sk_overlay_sse2_8bit+0x48f> + .byte 196,98,125,24,53,120,43,2,0 // vbroadcastss 0x22b78(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f> .byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12 - .byte 196,98,125,24,61,46,39,2,0 // vbroadcastss 0x2272e(%rip),%ymm15 # 2ae54 <_sk_overlay_sse2_8bit+0x493> + .byte 196,98,125,24,61,110,43,2,0 // vbroadcastss 0x22b6e(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 - .byte 196,98,125,24,37,26,39,2,0 // vbroadcastss 0x2271a(%rip),%ymm12 # 2ae58 <_sk_overlay_sse2_8bit+0x497> + .byte 196,98,125,24,37,90,43,2,0 // vbroadcastss 0x22b5a(%rip),%ymm12 # 2b44c <_sk_overlay_sse2_8bit+0x497> .byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -25144,12 +25421,12 @@ HIDDEN _sk_rgb_to_hsl_avx .globl _sk_rgb_to_hsl_avx FUNCTION(_sk_rgb_to_hsl_avx) _sk_rgb_to_hsl_avx: - .byte 197,124,95,193 // vmaxps %ymm1,%ymm0,%ymm8 - .byte 197,60,95,194 // vmaxps %ymm2,%ymm8,%ymm8 - .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 - .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 + .byte 197,116,95,194 // vmaxps %ymm2,%ymm1,%ymm8 + .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8 + .byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9 + .byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,40,38,2,0 // vbroadcastss 0x22628(%rip),%ymm11 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,29,102,42,2,0 // vbroadcastss 0x22a66(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12 @@ -25159,19 +25436,19 @@ _sk_rgb_to_hsl_avx: .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1 .byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,85,38,2,0 // vbroadcastss 0x22655(%rip),%ymm11 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3> + .byte 196,98,125,24,29,147,42,2,0 // vbroadcastss 0x22a93(%rip),%ymm11 # 2b458 <_sk_overlay_sse2_8bit+0x4a3> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,67,38,2,0 // vbroadcastss 0x22643(%rip),%ymm11 # 2ae60 <_sk_overlay_sse2_8bit+0x49f> + .byte 196,98,125,24,29,129,42,2,0 // vbroadcastss 0x22a81(%rip),%ymm11 # 2b454 <_sk_overlay_sse2_8bit+0x49f> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,43,38,2,0 // vbroadcastss 0x2262b(%rip),%ymm2 # 2ae5c <_sk_overlay_sse2_8bit+0x49b> + .byte 196,226,125,24,21,105,42,2,0 // vbroadcastss 0x22a69(%rip),%ymm2 # 2b450 <_sk_overlay_sse2_8bit+0x49b> .byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14 .byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 .byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,37,166,37,2,0 // vbroadcastss 0x225a6(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,37,228,41,2,0 // vbroadcastss 0x229e4(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2 .byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12 .byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11 @@ -25181,7 +25458,7 @@ _sk_rgb_to_hsl_avx: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0 .byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - .byte 196,98,125,24,5,213,37,2,0 // vbroadcastss 0x225d5(%rip),%ymm8 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7> + .byte 196,98,125,24,5,19,42,2,0 // vbroadcastss 0x22a13(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25198,7 +25475,7 @@ _sk_hsl_to_rgb_avx: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,225 // vmovaps %ymm1,%ymm4 .byte 197,252,40,216 // vmovaps %ymm0,%ymm3 - .byte 196,98,125,24,5,50,37,2,0 // vbroadcastss 0x22532(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,112,41,2,0 // vbroadcastss 0x22970(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10 .byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11 @@ -25206,23 +25483,23 @@ _sk_hsl_to_rgb_avx: .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 .byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,29,116,37,2,0 // vbroadcastss 0x22574(%rip),%ymm11 # 2ae6c <_sk_overlay_sse2_8bit+0x4ab> + .byte 196,98,125,24,29,178,41,2,0 // vbroadcastss 0x229b2(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab> .byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,37,70,37,2,0 // vbroadcastss 0x22546(%rip),%ymm12 # 2ae5c <_sk_overlay_sse2_8bit+0x49b> + .byte 196,98,125,24,37,132,41,2,0 // vbroadcastss 0x22984(%rip),%ymm12 # 2b450 <_sk_overlay_sse2_8bit+0x49b> .byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0 - .byte 196,98,125,24,45,64,37,2,0 // vbroadcastss 0x22540(%rip),%ymm13 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3> + .byte 196,98,125,24,45,126,41,2,0 // vbroadcastss 0x2297e(%rip),%ymm13 # 2b458 <_sk_overlay_sse2_8bit+0x4a3> .byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14 .byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14 .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14 - .byte 196,226,125,24,13,53,37,2,0 // vbroadcastss 0x22535(%rip),%ymm1 # 2ae70 <_sk_overlay_sse2_8bit+0x4af> + .byte 196,226,125,24,13,115,41,2,0 // vbroadcastss 0x22973(%rip),%ymm1 # 2b464 <_sk_overlay_sse2_8bit+0x4af> .byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7 .byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7 .byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14 .byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,53,12,37,2,0 // vbroadcastss 0x2250c(%rip),%ymm14 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7> + .byte 196,98,125,24,53,74,41,2,0 // vbroadcastss 0x2294a(%rip),%ymm14 # 2b45c <_sk_overlay_sse2_8bit+0x4a7> .byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15 .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -25241,7 +25518,7 @@ _sk_hsl_to_rgb_avx: .byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6 .byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6 .byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - .byte 196,226,125,24,5,182,36,2,0 // vbroadcastss 0x224b6(%rip),%ymm0 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,226,125,24,5,244,40,2,0 // vbroadcastss 0x228f4(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> .byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0 .byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3 .byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0 @@ -25296,15 +25573,15 @@ _sk_scale_u8_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,75 // jne 8ac5 <_sk_scale_u8_avx+0x64> + .byte 117,75 // jne 8c7b <_sk_scale_u8_avx+0x64> .byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8 - .byte 197,57,219,5,8,45,2,0 // vpand 0x22d08(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,57,219,5,82,49,2,0 // vpand 0x23152(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,205,35,2,0 // vbroadcastss 0x223cd(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,13,11,40,2,0 // vbroadcastss 0x2280b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -25318,15 +25595,15 @@ _sk_scale_u8_avx: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,166 // ja 8a80 <_sk_scale_u8_avx+0x1f> + .byte 119,166 // ja 8c36 <_sk_scale_u8_avx+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,123,0,0,0 // lea 0x7b(%rip),%r11 # 8b60 <_sk_scale_u8_avx+0xff> + .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 8d14 <_sk_scale_u8_avx+0xfd> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 235,135 // jmp 8a80 <_sk_scale_u8_avx+0x1f> + .byte 235,135 // jmp 8c36 <_sk_scale_u8_avx+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -25334,7 +25611,7 @@ _sk_scale_u8_avx: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8 - .byte 233,94,255,255,255 // jmpq 8a80 <_sk_scale_u8_avx+0x1f> + .byte 233,94,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -25345,21 +25622,116 @@ _sk_scale_u8_avx: .byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - .byte 233,34,255,255,255 // jmpq 8a80 <_sk_scale_u8_avx+0x1f> - .byte 102,144 // xchg %ax,%ax - .byte 142,255 // mov %edi,%? + .byte 233,34,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f> + .byte 144 // nop .byte 255 // (bad) - .byte 255,169,255,255,255,153 // ljmp *-0x66000001(%rcx) .byte 255 // (bad) + .byte 255,171,255,255,255,155 // ljmp *-0x64000001(%rbx) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,221 // callq ffffffffde008b70 <_sk_overlay_sse2_8bit+0xffffffffddfde1af> .byte 255 // (bad) + .byte 234 // (bad) .byte 255 // (bad) - .byte 255,210 // callq *%rdx .byte 255 // (bad) .byte 255 // (bad) - .byte 255,194 // inc %edx + .byte 223,255 // (bad) + .byte 255 // (bad) + .byte 255,212 // callq *%rsp + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,196 // inc %esp + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // .byte 0xff + +HIDDEN _sk_scale_565_avx +.globl _sk_scale_565_avx +FUNCTION(_sk_scale_565_avx) +_sk_scale_565_avx: + .byte 83 // push %rbx + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 76,99,80,8 // movslq 0x8(%rax),%r10 + .byte 76,99,201 // movslq %ecx,%r9 + .byte 77,15,175,202 // imul %r10,%r9 + .byte 77,1,201 // add %r9,%r9 + .byte 76,3,8 // add (%rax),%r9 + .byte 72,99,218 // movslq %edx,%rbx + .byte 77,133,192 // test %r8,%r8 + .byte 15,133,178,0,0,0 // jne 8e02 <_sk_scale_565_avx+0xd2> + .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8 + .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 + .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 + .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 + .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 + .byte 196,98,125,24,13,252,38,2,0 // vbroadcastss 0x226fc(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9 + .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 + .byte 196,98,125,24,21,237,38,2,0 // vbroadcastss 0x226ed(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 + .byte 196,98,125,24,21,227,38,2,0 // vbroadcastss 0x226e3(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10 + .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 + .byte 196,98,125,24,29,212,38,2,0 // vbroadcastss 0x226d4(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 + .byte 196,98,125,24,29,202,38,2,0 // vbroadcastss 0x226ca(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8 + .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 + .byte 196,98,125,24,29,187,38,2,0 // vbroadcastss 0x226bb(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 + .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11 + .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12 + .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12 + .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13 + .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13 + .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11 + .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 + .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1 + .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2 + .byte 197,164,89,219 // vmulps %ymm3,%ymm11,%ymm3 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 91 // pop %rbx + .byte 255,224 // jmpq *%rax + .byte 69,137,194 // mov %r8d,%r10d + .byte 65,128,226,7 // and $0x7,%r10b + .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 + .byte 65,254,202 // dec %r10b + .byte 65,128,250,6 // cmp $0x6,%r10b + .byte 15,135,59,255,255,255 // ja 8d56 <_sk_scale_565_avx+0x26> + .byte 69,15,182,210 // movzbl %r10b,%r10d + .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 8e8c <_sk_scale_565_avx+0x15c> + .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax + .byte 76,1,216 // add %r11,%rax + .byte 255,224 // jmpq *%rax + .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax + .byte 197,121,110,192 // vmovd %eax,%xmm8 + .byte 233,25,255,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26> + .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 + .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9 + .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8 + .byte 233,251,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26> + .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 + .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 + .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9 + .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8 + .byte 233,205,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26> + .byte 15,31,0 // nopl (%rax) + .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 236 // in (%dx),%al + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,228 // jmpq *%rsp + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 220,255 // fdivr %st,%st(7) + .byte 255 // (bad) + .byte 255,207 // dec %edi .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -25397,15 +25769,15 @@ _sk_lerp_u8_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,111 // jne 8c43 <_sk_lerp_u8_avx+0x88> + .byte 117,111 // jne 8f6f <_sk_lerp_u8_avx+0x88> .byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8 - .byte 197,57,219,5,174,43,2,0 // vpand 0x22bae(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,57,219,5,130,46,2,0 // vpand 0x22e82(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,115,34,2,0 // vbroadcastss 0x22273(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,13,59,37,2,0 // vbroadcastss 0x2253b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 @@ -25427,15 +25799,15 @@ _sk_lerp_u8_avx: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,130 // ja 8bda <_sk_lerp_u8_avx+0x1f> + .byte 119,130 // ja 8f06 <_sk_lerp_u8_avx+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 8ce0 <_sk_lerp_u8_avx+0x125> + .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 900c <_sk_lerp_u8_avx+0x125> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 233,96,255,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f> + .byte 233,96,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -25443,7 +25815,7 @@ _sk_lerp_u8_avx: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8 - .byte 233,55,255,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f> + .byte 233,55,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -25454,7 +25826,7 @@ _sk_lerp_u8_avx: .byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - .byte 233,251,254,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f> + .byte 233,251,254,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f> .byte 144 // nop .byte 140,255 // mov %?,%edi .byte 255 // (bad) @@ -25462,7 +25834,7 @@ _sk_lerp_u8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf008cf0 <_sk_overlay_sse2_8bit+0xffffffffdefde32f> + .byte 233,255,255,255,222 // jmpq ffffffffdf00901c <_sk_overlay_sse2_8bit+0xffffffffdefde067> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -25486,27 +25858,33 @@ _sk_lerp_565_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,209,0,0,0 // jne 8ded <_sk_lerp_565_avx+0xf1> + .byte 15,133,214,0,0,0 // jne 911e <_sk_lerp_565_avx+0xf6> .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,60,33,2,0 // vbroadcastss 0x2213c(%rip),%ymm9 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,98,125,24,13,4,36,2,0 // vbroadcastss 0x22404(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,45,33,2,0 // vbroadcastss 0x2212d(%rip),%ymm10 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,98,125,24,21,245,35,2,0 // vbroadcastss 0x223f5(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,35,33,2,0 // vbroadcastss 0x22123(%rip),%ymm10 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,98,125,24,21,235,35,2,0 // vbroadcastss 0x223eb(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,20,33,2,0 // vbroadcastss 0x22114(%rip),%ymm11 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,98,125,24,29,220,35,2,0 // vbroadcastss 0x223dc(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,29,10,33,2,0 // vbroadcastss 0x2210a(%rip),%ymm11 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,98,125,24,29,210,35,2,0 // vbroadcastss 0x223d2(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,251,32,2,0 // vbroadcastss 0x220fb(%rip),%ymm11 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,98,125,24,29,195,35,2,0 // vbroadcastss 0x223c3(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 + .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11 + .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12 + .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12 + .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13 + .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13 + .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 @@ -25517,14 +25895,8 @@ _sk_lerp_565_avx: .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2 .byte 197,228,92,223 // vsubps %ymm7,%ymm3,%ymm3 - .byte 196,65,100,89,201 // vmulps %ymm9,%ymm3,%ymm9 - .byte 197,52,88,207 // vaddps %ymm7,%ymm9,%ymm9 - .byte 196,65,100,89,210 // vmulps %ymm10,%ymm3,%ymm10 - .byte 197,44,88,215 // vaddps %ymm7,%ymm10,%ymm10 - .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 + .byte 196,193,100,89,219 // vmulps %ymm11,%ymm3,%ymm3 .byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3 - .byte 197,172,95,219 // vmaxps %ymm3,%ymm10,%ymm3 - .byte 197,180,95,219 // vmaxps %ymm3,%ymm9,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -25533,42 +25905,42 @@ _sk_lerp_565_avx: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,28,255,255,255 // ja 8d22 <_sk_lerp_565_avx+0x26> + .byte 15,135,23,255,255,255 // ja 904e <_sk_lerp_565_avx+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 8e74 <_sk_lerp_565_avx+0x178> + .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 91a8 <_sk_lerp_565_avx+0x180> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 233,250,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26> + .byte 233,245,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9 .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8 - .byte 233,220,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26> + .byte 233,215,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9 .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - .byte 233,174,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26> - .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi) + .byte 233,169,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26> + .byte 15,31,0 // nopl (%rax) + .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff .byte 255 // (bad) .byte 255 // (bad) - .byte 255,193 // inc %ecx .byte 255 // (bad) + .byte 236 // in (%dx),%al .byte 255 // (bad) - .byte 255,180,255,255,255,239,255 // pushq -0x100001(%rdi,%rdi,8) .byte 255 // (bad) - .byte 255,231 // jmpq *%rdi + .byte 255,228 // jmpq *%rsp .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 223,255 // (bad) + .byte 220,255 // fdivr %st,%st(7) .byte 255 // (bad) - .byte 255,210 // callq *%rdx + .byte 255,207 // dec %edi .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -25581,9 +25953,9 @@ _sk_load_tables_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,4,2,0,0 // jne 90a8 <_sk_load_tables_avx+0x218> + .byte 15,133,4,2,0,0 // jne 93dc <_sk_load_tables_avx+0x218> .byte 196,65,125,16,20,145 // vmovupd (%r9,%rdx,4),%ymm10 - .byte 197,125,40,13,14,36,2,0 // vmovapd 0x2240e(%rip),%ymm9 # 2b2c0 <_sk_overlay_sse2_8bit+0x8ff> + .byte 197,125,40,13,218,38,2,0 // vmovapd 0x226da(%rip),%ymm9 # 2b8c0 <_sk_overlay_sse2_8bit+0x90b> .byte 196,193,45,84,201 // vandpd %ymm9,%ymm10,%ymm1 .byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0 .byte 196,193,249,126,193 // vmovq %xmm0,%r9 @@ -25675,7 +26047,7 @@ _sk_load_tables_avx: .byte 196,193,65,114,213,24 // vpsrld $0x18,%xmm13,%xmm7 .byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,226,125,24,61,222,29,2,0 // vbroadcastss 0x21dde(%rip),%ymm7 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,61,158,32,2,0 // vbroadcastss 0x2209e(%rip),%ymm7 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7 @@ -25685,21 +26057,21 @@ _sk_load_tables_avx: .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,233,253,255,255 // ja 8eaa <_sk_load_tables_avx+0x1a> + .byte 15,135,233,253,255,255 // ja 91de <_sk_load_tables_avx+0x1a> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 9160 <_sk_load_tables_avx+0x2d0> + .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 9494 <_sk_load_tables_avx+0x2d0> .byte 79,99,20,147 // movslq (%r11,%r10,4),%r10 .byte 77,1,218 // add %r11,%r10 .byte 65,255,226 // jmpq *%r10 .byte 196,65,122,16,20,145 // vmovss (%r9,%rdx,4),%xmm10 - .byte 233,201,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a> + .byte 233,201,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a> .byte 196,193,121,110,68,145,8 // vmovd 0x8(%r9,%rdx,4),%xmm0 .byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,99,117,12,208,4 // vblendps $0x4,%ymm0,%ymm1,%ymm10 .byte 196,193,123,16,4,145 // vmovsd (%r9,%rdx,4),%xmm0 .byte 196,99,45,13,208,1 // vblendpd $0x1,%ymm0,%ymm10,%ymm10 - .byte 233,162,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a> + .byte 233,162,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a> .byte 196,193,121,110,68,145,24 // vmovd 0x18(%r9,%rdx,4),%xmm0 .byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 @@ -25713,9 +26085,9 @@ _sk_load_tables_avx: .byte 196,99,45,24,208,1 // vinsertf128 $0x1,%xmm0,%ymm10,%ymm10 .byte 196,193,121,16,4,145 // vmovupd (%r9,%rdx,4),%xmm0 .byte 196,67,125,13,210,12 // vblendpd $0xc,%ymm10,%ymm0,%ymm10 - .byte 233,77,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a> + .byte 233,77,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a> .byte 15,31,0 // nopl (%rax) - .byte 118,255 // jbe 9161 <_sk_load_tables_avx+0x2d1> + .byte 118,255 // jbe 9495 <_sk_load_tables_avx+0x2d1> .byte 255 // (bad) .byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi) .byte 255 // (bad) @@ -25744,7 +26116,7 @@ _sk_load_tables_u16_be_avx: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 .byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp) - .byte 15,133,84,2,0,0 // jne 93ec <_sk_load_tables_u16_be_avx+0x270> + .byte 15,133,84,2,0,0 // jne 9720 <_sk_load_tables_u16_be_avx+0x270> .byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8 .byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2 .byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -25759,7 +26131,7 @@ _sk_load_tables_u16_be_avx: .byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11 .byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1 .byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12 - .byte 197,121,111,21,171,37,2,0 // vmovdqa 0x225ab(%rip),%xmm10 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,121,111,21,119,40,2,0 // vmovdqa 0x22877(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2 @@ -25857,7 +26229,7 @@ _sk_load_tables_u16_be_avx: .byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3 .byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,226,125,24,61,182,26,2,0 // vbroadcastss 0x21ab6(%rip),%ymm7 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3> + .byte 196,226,125,24,61,118,29,2,0 // vbroadcastss 0x21d76(%rip),%ymm7 # 2b488 <_sk_overlay_sse2_8bit+0x4d3> .byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7 @@ -25865,29 +26237,29 @@ _sk_load_tables_u16_be_avx: .byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 9452 <_sk_load_tables_u16_be_avx+0x2d6> + .byte 116,85 // je 9786 <_sk_load_tables_u16_be_avx+0x2d6> .byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 9452 <_sk_load_tables_u16_be_avx+0x2d6> + .byte 114,72 // jb 9786 <_sk_load_tables_u16_be_avx+0x2d6> .byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 945f <_sk_load_tables_u16_be_avx+0x2e3> + .byte 116,72 // je 9793 <_sk_load_tables_u16_be_avx+0x2e3> .byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 945f <_sk_load_tables_u16_be_avx+0x2e3> + .byte 114,59 // jb 9793 <_sk_load_tables_u16_be_avx+0x2e3> .byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,126,253,255,255 // je 91b3 <_sk_load_tables_u16_be_avx+0x37> + .byte 15,132,126,253,255,255 // je 94e7 <_sk_load_tables_u16_be_avx+0x37> .byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,109,253,255,255 // jb 91b3 <_sk_load_tables_u16_be_avx+0x37> + .byte 15,130,109,253,255,255 // jb 94e7 <_sk_load_tables_u16_be_avx+0x37> .byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9 - .byte 233,97,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37> + .byte 233,97,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,84,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37> + .byte 233,84,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,75,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37> + .byte 233,75,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37> HIDDEN _sk_load_tables_rgb_u16_be_avx .globl _sk_load_tables_rgb_u16_be_avx @@ -25899,7 +26271,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 77,133,192 // test %r8,%r8 .byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp) .byte 197,252,17,116,36,168 // vmovups %ymm6,-0x58(%rsp) - .byte 15,133,71,2,0,0 // jne 96cd <_sk_load_tables_rgb_u16_be_avx+0x265> + .byte 15,133,71,2,0,0 // jne 9a01 <_sk_load_tables_rgb_u16_be_avx+0x265> .byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0 .byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2 .byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -25920,7 +26292,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,160,34,2,0 // vmovdqa 0x222a0(%rip),%xmm9 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,121,111,13,108,37,2,0 // vmovdqa 0x2256c(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10 .byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -26010,50 +26382,50 @@ _sk_load_tables_rgb_u16_be_avx: .byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2 .byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,69,23,2,0 // vbroadcastss 0x21745(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,5,26,2,0 // vbroadcastss 0x21a05(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6 .byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7 .byte 255,224 // jmpq *%rax .byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0 .byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne 96e6 <_sk_load_tables_rgb_u16_be_avx+0x27e> - .byte 233,212,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 117,5 // jne 9a1a <_sk_load_tables_rgb_u16_be_avx+0x27e> + .byte 233,212,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52> .byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1 .byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb 9715 <_sk_load_tables_rgb_u16_be_avx+0x2ad> + .byte 114,26 // jb 9a49 <_sk_load_tables_rgb_u16_be_avx+0x2ad> .byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1 .byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne 971a <_sk_load_tables_rgb_u16_be_avx+0x2b2> - .byte 233,165,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52> - .byte 233,160,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 117,10 // jne 9a4e <_sk_load_tables_rgb_u16_be_avx+0x2b2> + .byte 233,165,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,160,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52> .byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1 .byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb 9749 <_sk_load_tables_rgb_u16_be_avx+0x2e1> + .byte 114,26 // jb 9a7d <_sk_load_tables_rgb_u16_be_avx+0x2e1> .byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1 .byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne 974e <_sk_load_tables_rgb_u16_be_avx+0x2e6> - .byte 233,113,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52> - .byte 233,108,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 117,10 // jne 9a82 <_sk_load_tables_rgb_u16_be_avx+0x2e6> + .byte 233,113,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,108,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52> .byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3 .byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb 9777 <_sk_load_tables_rgb_u16_be_avx+0x30f> + .byte 114,20 // jb 9aab <_sk_load_tables_rgb_u16_be_avx+0x30f> .byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3 .byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - .byte 233,67,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52> - .byte 233,62,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,67,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,62,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52> HIDDEN _sk_byte_tables_avx .globl _sk_byte_tables_avx FUNCTION(_sk_byte_tables_avx) _sk_byte_tables_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,169,22,2,0 // vbroadcastss 0x216a9(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,105,25,2,0 // vbroadcastss 0x21969(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9 .byte 196,65,249,126,201 // vmovq %xmm9,%r9 @@ -26172,7 +26544,7 @@ _sk_byte_tables_avx: .byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1 .byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2 .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 - .byte 196,98,125,24,13,151,20,2,0 // vbroadcastss 0x21497(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,13,87,23,2,0 // vbroadcastss 0x21757(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 @@ -26288,7 +26660,7 @@ _sk_byte_tables_rgb_avx: .byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,116,18,2,0 // vbroadcastss 0x21274(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,13,52,21,2,0 // vbroadcastss 0x21534(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1 .byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2 @@ -26493,36 +26865,36 @@ _sk_parametric_r_avx: .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11 - .byte 196,98,125,24,37,61,15,2,0 // vbroadcastss 0x20f3d(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,37,253,17,2,0 // vbroadcastss 0x211fd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,51,15,2,0 // vbroadcastss 0x20f33(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,243,17,2,0 // vbroadcastss 0x211f3(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,137,14,2,0 // vbroadcastss 0x20e89(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,37,73,17,2,0 // vbroadcastss 0x21149(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,27,15,2,0 // vbroadcastss 0x20f1b(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,37,219,17,2,0 // vbroadcastss 0x211db(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,17,15,2,0 // vbroadcastss 0x20f11(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,37,209,17,2,0 // vbroadcastss 0x211d1(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,2,15,2,0 // vbroadcastss 0x20f02(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,194,17,2,0 // vbroadcastss 0x211c2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,248,14,2,0 // vbroadcastss 0x20ef8(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,184,17,2,0 // vbroadcastss 0x211b8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,220,14,2,0 // vbroadcastss 0x20edc(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,156,17,2,0 // vbroadcastss 0x2119c(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,210,14,2,0 // vbroadcastss 0x20ed2(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,146,17,2,0 // vbroadcastss 0x21192(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,195,14,2,0 // vbroadcastss 0x20ec3(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,98,125,24,29,131,17,2,0 // vbroadcastss 0x21183(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,185,14,2,0 // vbroadcastss 0x20eb9(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,29,121,17,2,0 // vbroadcastss 0x21179(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,170,14,2,0 // vbroadcastss 0x20eaa(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,106,17,2,0 // vbroadcastss 0x2116a(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -26530,7 +26902,7 @@ _sk_parametric_r_avx: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,193,13,2,0 // vbroadcastss 0x20dc1(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,129,16,2,0 // vbroadcastss 0x21081(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -26552,36 +26924,36 @@ _sk_parametric_g_avx: .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11 - .byte 196,98,125,24,37,2,14,2,0 // vbroadcastss 0x20e02(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,37,194,16,2,0 // vbroadcastss 0x210c2(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,248,13,2,0 // vbroadcastss 0x20df8(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,184,16,2,0 // vbroadcastss 0x210b8(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,78,13,2,0 // vbroadcastss 0x20d4e(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,37,14,16,2,0 // vbroadcastss 0x2100e(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,224,13,2,0 // vbroadcastss 0x20de0(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,37,160,16,2,0 // vbroadcastss 0x210a0(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,214,13,2,0 // vbroadcastss 0x20dd6(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,37,150,16,2,0 // vbroadcastss 0x21096(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,199,13,2,0 // vbroadcastss 0x20dc7(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,135,16,2,0 // vbroadcastss 0x21087(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,189,13,2,0 // vbroadcastss 0x20dbd(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,125,16,2,0 // vbroadcastss 0x2107d(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1 .byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1 .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,161,13,2,0 // vbroadcastss 0x20da1(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,97,16,2,0 // vbroadcastss 0x21061(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,151,13,2,0 // vbroadcastss 0x20d97(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,87,16,2,0 // vbroadcastss 0x21057(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,136,13,2,0 // vbroadcastss 0x20d88(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,98,125,24,29,72,16,2,0 // vbroadcastss 0x21048(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,126,13,2,0 // vbroadcastss 0x20d7e(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,29,62,16,2,0 // vbroadcastss 0x2103e(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,111,13,2,0 // vbroadcastss 0x20d6f(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,47,16,2,0 // vbroadcastss 0x2102f(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -26589,7 +26961,7 @@ _sk_parametric_g_avx: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,134,12,2,0 // vbroadcastss 0x20c86(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,70,15,2,0 // vbroadcastss 0x20f46(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -26611,36 +26983,36 @@ _sk_parametric_b_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11 - .byte 196,98,125,24,37,199,12,2,0 // vbroadcastss 0x20cc7(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,37,135,15,2,0 // vbroadcastss 0x20f87(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,189,12,2,0 // vbroadcastss 0x20cbd(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,125,15,2,0 // vbroadcastss 0x20f7d(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,19,12,2,0 // vbroadcastss 0x20c13(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,37,211,14,2,0 // vbroadcastss 0x20ed3(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,165,12,2,0 // vbroadcastss 0x20ca5(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,37,101,15,2,0 // vbroadcastss 0x20f65(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,155,12,2,0 // vbroadcastss 0x20c9b(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,37,91,15,2,0 // vbroadcastss 0x20f5b(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,140,12,2,0 // vbroadcastss 0x20c8c(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,76,15,2,0 // vbroadcastss 0x20f4c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,130,12,2,0 // vbroadcastss 0x20c82(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,66,15,2,0 // vbroadcastss 0x20f42(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2 .byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,102,12,2,0 // vbroadcastss 0x20c66(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,38,15,2,0 // vbroadcastss 0x20f26(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,92,12,2,0 // vbroadcastss 0x20c5c(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,28,15,2,0 // vbroadcastss 0x20f1c(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,77,12,2,0 // vbroadcastss 0x20c4d(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,98,125,24,29,13,15,2,0 // vbroadcastss 0x20f0d(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,67,12,2,0 // vbroadcastss 0x20c43(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,29,3,15,2,0 // vbroadcastss 0x20f03(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,52,12,2,0 // vbroadcastss 0x20c34(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,244,14,2,0 // vbroadcastss 0x20ef4(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -26648,7 +27020,7 @@ _sk_parametric_b_avx: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,75,11,2,0 // vbroadcastss 0x20b4b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,11,14,2,0 // vbroadcastss 0x20e0b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -26670,36 +27042,36 @@ _sk_parametric_a_avx: .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11 - .byte 196,98,125,24,37,140,11,2,0 // vbroadcastss 0x20b8c(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,37,76,14,2,0 // vbroadcastss 0x20e4c(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,130,11,2,0 // vbroadcastss 0x20b82(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,37,66,14,2,0 // vbroadcastss 0x20e42(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,216,10,2,0 // vbroadcastss 0x20ad8(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,37,152,13,2,0 // vbroadcastss 0x20d98(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,106,11,2,0 // vbroadcastss 0x20b6a(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,37,42,14,2,0 // vbroadcastss 0x20e2a(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,96,11,2,0 // vbroadcastss 0x20b60(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,37,32,14,2,0 // vbroadcastss 0x20e20(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,81,11,2,0 // vbroadcastss 0x20b51(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,17,14,2,0 // vbroadcastss 0x20e11(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,71,11,2,0 // vbroadcastss 0x20b47(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,37,7,14,2,0 // vbroadcastss 0x20e07(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3 .byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3 .byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,43,11,2,0 // vbroadcastss 0x20b2b(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,29,235,13,2,0 // vbroadcastss 0x20deb(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,33,11,2,0 // vbroadcastss 0x20b21(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,98,125,24,29,225,13,2,0 // vbroadcastss 0x20de1(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,18,11,2,0 // vbroadcastss 0x20b12(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,98,125,24,29,210,13,2,0 // vbroadcastss 0x20dd2(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,8,11,2,0 // vbroadcastss 0x20b08(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,98,125,24,29,200,13,2,0 // vbroadcastss 0x20dc8(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,249,10,2,0 // vbroadcastss 0x20af9(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,98,125,24,21,185,13,2,0 // vbroadcastss 0x20db9(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -26707,7 +27079,7 @@ _sk_parametric_a_avx: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,16,10,2,0 // vbroadcastss 0x20a10(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,208,12,2,0 // vbroadcastss 0x20cd0(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -26726,34 +27098,34 @@ _sk_gamma_avx: .byte 197,252,40,233 // vmovaps %ymm1,%ymm5 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1 - .byte 196,98,125,24,5,99,10,2,0 // vbroadcastss 0x20a63(%rip),%ymm8 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7> + .byte 196,98,125,24,5,35,13,2,0 // vbroadcastss 0x20d23(%rip),%ymm8 # 2b48c <_sk_overlay_sse2_8bit+0x4d7> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,13,89,10,2,0 // vbroadcastss 0x20a59(%rip),%ymm9 # 2ae9c <_sk_overlay_sse2_8bit+0x4db> + .byte 196,98,125,24,13,25,13,2,0 // vbroadcastss 0x20d19(%rip),%ymm9 # 2b490 <_sk_overlay_sse2_8bit+0x4db> .byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0 - .byte 196,226,125,24,37,175,9,2,0 // vbroadcastss 0x209af(%rip),%ymm4 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,37,111,12,2,0 // vbroadcastss 0x20c6f(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0 - .byte 196,98,125,24,21,66,10,2,0 // vbroadcastss 0x20a42(%rip),%ymm10 # 2aea0 <_sk_overlay_sse2_8bit+0x4df> + .byte 196,98,125,24,21,2,13,2,0 // vbroadcastss 0x20d02(%rip),%ymm10 # 2b494 <_sk_overlay_sse2_8bit+0x4df> .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,29,56,10,2,0 // vbroadcastss 0x20a38(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3> + .byte 196,98,125,24,29,248,12,2,0 // vbroadcastss 0x20cf8(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3> .byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2 .byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1 - .byte 196,98,125,24,37,42,10,2,0 // vbroadcastss 0x20a2a(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7> + .byte 196,98,125,24,37,234,12,2,0 // vbroadcastss 0x20cea(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7> .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,45,32,10,2,0 // vbroadcastss 0x20a20(%rip),%ymm13 # 2aeac <_sk_overlay_sse2_8bit+0x4eb> + .byte 196,98,125,24,45,224,12,2,0 // vbroadcastss 0x20ce0(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb> .byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0 .byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0 .byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14 .byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0 .byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1 .byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6 - .byte 196,98,125,24,61,255,9,2,0 // vbroadcastss 0x209ff(%rip),%ymm15 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef> + .byte 196,98,125,24,61,191,12,2,0 // vbroadcastss 0x20cbf(%rip),%ymm15 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef> .byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0 - .byte 196,226,125,24,29,245,9,2,0 // vbroadcastss 0x209f5(%rip),%ymm3 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3> + .byte 196,226,125,24,29,181,12,2,0 // vbroadcastss 0x20cb5(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3> .byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1 .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1 - .byte 196,226,125,24,21,232,9,2,0 // vbroadcastss 0x209e8(%rip),%ymm2 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7> + .byte 196,226,125,24,21,168,12,2,0 // vbroadcastss 0x20ca8(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7> .byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0 - .byte 196,226,125,24,53,223,9,2,0 // vbroadcastss 0x209df(%rip),%ymm6 # 2aebc <_sk_overlay_sse2_8bit+0x4fb> + .byte 196,226,125,24,53,159,12,2,0 // vbroadcastss 0x20c9f(%rip),%ymm6 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb> .byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0 .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0 .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp) @@ -26795,7 +27167,7 @@ _sk_gamma_avx: .byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2 .byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2 .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,34,9,2,0 // vbroadcastss 0x20922(%rip),%ymm2 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff> + .byte 196,226,125,24,21,226,11,2,0 // vbroadcastss 0x20be2(%rip),%ymm2 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff> .byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3 .byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4 .byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2 @@ -26815,31 +27187,31 @@ HIDDEN _sk_lab_to_xyz_avx .globl _sk_lab_to_xyz_avx FUNCTION(_sk_lab_to_xyz_avx) _sk_lab_to_xyz_avx: - .byte 196,98,125,24,5,222,8,2,0 // vbroadcastss 0x208de(%rip),%ymm8 # 2aec4 <_sk_overlay_sse2_8bit+0x503> + .byte 196,98,125,24,5,158,11,2,0 // vbroadcastss 0x20b9e(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,60,8,2,0 // vbroadcastss 0x2083c(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,252,10,2,0 // vbroadcastss 0x20afc(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,13,198,8,2,0 // vbroadcastss 0x208c6(%rip),%ymm9 # 2aec8 <_sk_overlay_sse2_8bit+0x507> + .byte 196,98,125,24,13,134,11,2,0 // vbroadcastss 0x20b86(%rip),%ymm9 # 2b4bc <_sk_overlay_sse2_8bit+0x507> .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2 - .byte 196,98,125,24,5,178,8,2,0 // vbroadcastss 0x208b2(%rip),%ymm8 # 2aecc <_sk_overlay_sse2_8bit+0x50b> + .byte 196,98,125,24,5,114,11,2,0 // vbroadcastss 0x20b72(%rip),%ymm8 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,168,8,2,0 // vbroadcastss 0x208a8(%rip),%ymm8 # 2aed0 <_sk_overlay_sse2_8bit+0x50f> + .byte 196,98,125,24,5,104,11,2,0 // vbroadcastss 0x20b68(%rip),%ymm8 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,158,8,2,0 // vbroadcastss 0x2089e(%rip),%ymm8 # 2aed4 <_sk_overlay_sse2_8bit+0x513> + .byte 196,98,125,24,5,94,11,2,0 // vbroadcastss 0x20b5e(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1 - .byte 196,98,125,24,5,144,8,2,0 // vbroadcastss 0x20890(%rip),%ymm8 # 2aed8 <_sk_overlay_sse2_8bit+0x517> + .byte 196,98,125,24,5,80,11,2,0 // vbroadcastss 0x20b50(%rip),%ymm8 # 2b4cc <_sk_overlay_sse2_8bit+0x517> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2 .byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8 .byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8 - .byte 196,98,125,24,13,121,8,2,0 // vbroadcastss 0x20879(%rip),%ymm9 # 2aedc <_sk_overlay_sse2_8bit+0x51b> + .byte 196,98,125,24,13,57,11,2,0 // vbroadcastss 0x20b39(%rip),%ymm9 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b> .byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,110,8,2,0 // vbroadcastss 0x2086e(%rip),%ymm11 # 2aee0 <_sk_overlay_sse2_8bit+0x51f> + .byte 196,98,125,24,29,46,11,2,0 // vbroadcastss 0x20b2e(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,37,100,8,2,0 // vbroadcastss 0x20864(%rip),%ymm12 # 2aee4 <_sk_overlay_sse2_8bit+0x523> + .byte 196,98,125,24,37,36,11,2,0 // vbroadcastss 0x20b24(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523> .byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1 .byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -26854,9 +27226,9 @@ _sk_lab_to_xyz_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2 .byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - .byte 196,226,125,24,5,26,8,2,0 // vbroadcastss 0x2081a(%rip),%ymm0 # 2aee8 <_sk_overlay_sse2_8bit+0x527> + .byte 196,226,125,24,5,218,10,2,0 // vbroadcastss 0x20ada(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,17,8,2,0 // vbroadcastss 0x20811(%rip),%ymm8 # 2aeec <_sk_overlay_sse2_8bit+0x52b> + .byte 196,98,125,24,5,209,10,2,0 // vbroadcastss 0x20ad1(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -26873,15 +27245,15 @@ _sk_load_a8_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,67 // jne a740 <_sk_load_a8_avx+0x5c> + .byte 117,67 // jne aa74 <_sk_load_a8_avx+0x5c> .byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0 - .byte 197,249,219,5,133,16,2,0 // vpand 0x21085(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,249,219,5,81,19,2,0 // vpand 0x21351(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,77,7,2,0 // vbroadcastss 0x2074d(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,13,10,2,0 // vbroadcastss 0x20a0d(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -26894,15 +27266,15 @@ _sk_load_a8_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,175 // ja a703 <_sk_load_a8_avx+0x1f> + .byte 119,175 // ja aa37 <_sk_load_a8_avx+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # a7d8 <_sk_load_a8_avx+0xf4> + .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ab0c <_sk_load_a8_avx+0xf4> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,144 // jmp a703 <_sk_load_a8_avx+0x1f> + .byte 235,144 // jmp aa37 <_sk_load_a8_avx+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -26910,7 +27282,7 @@ _sk_load_a8_avx: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,104,255,255,255 // jmpq a703 <_sk_load_a8_avx+0x1f> + .byte 233,104,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -26921,7 +27293,7 @@ _sk_load_a8_avx: .byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,45,255,255,255 // jmpq a703 <_sk_load_a8_avx+0x1f> + .byte 233,45,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f> .byte 102,144 // xchg %ax,%ax .byte 144 // nop .byte 255 // (bad) @@ -26930,7 +27302,7 @@ _sk_load_a8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,221 // callq ffffffffde00a7e8 <_sk_overlay_sse2_8bit+0xffffffffddfdfe27> + .byte 232,255,255,255,221 // callq ffffffffde00ab1c <_sk_overlay_sse2_8bit+0xffffffffddfdfb67> .byte 255 // (bad) .byte 255 // (bad) .byte 255,210 // callq *%rdx @@ -26953,15 +27325,15 @@ _sk_load_a8_dst_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,67 // jne a850 <_sk_load_a8_dst_avx+0x5c> + .byte 117,67 // jne ab84 <_sk_load_a8_dst_avx+0x5c> .byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4 - .byte 197,217,219,37,117,15,2,0 // vpand 0x20f75(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,217,219,37,65,18,2,0 // vpand 0x21241(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5 .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,61,6,2,0 // vbroadcastss 0x2063d(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,45,253,8,2,0 // vbroadcastss 0x208fd(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 @@ -26974,15 +27346,15 @@ _sk_load_a8_dst_avx: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,175 // ja a813 <_sk_load_a8_dst_avx+0x1f> + .byte 119,175 // ja ab47 <_sk_load_a8_dst_avx+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # a8e8 <_sk_load_a8_dst_avx+0xf4> + .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ac1c <_sk_load_a8_dst_avx+0xf4> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 235,144 // jmp a813 <_sk_load_a8_dst_avx+0x1f> + .byte 235,144 // jmp ab47 <_sk_load_a8_dst_avx+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -26990,7 +27362,7 @@ _sk_load_a8_dst_avx: .byte 197,249,110,232 // vmovd %eax,%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4 - .byte 233,104,255,255,255 // jmpq a813 <_sk_load_a8_dst_avx+0x1f> + .byte 233,104,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -27001,7 +27373,7 @@ _sk_load_a8_dst_avx: .byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - .byte 233,45,255,255,255 // jmpq a813 <_sk_load_a8_dst_avx+0x1f> + .byte 233,45,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f> .byte 102,144 // xchg %ax,%ax .byte 144 // nop .byte 255 // (bad) @@ -27010,7 +27382,7 @@ _sk_load_a8_dst_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,221 // callq ffffffffde00a8f8 <_sk_overlay_sse2_8bit+0xffffffffddfdff37> + .byte 232,255,255,255,221 // callq ffffffffde00ac2c <_sk_overlay_sse2_8bit+0xffffffffddfdfc77> .byte 255 // (bad) .byte 255 // (bad) .byte 255,210 // callq *%rdx @@ -27065,7 +27437,7 @@ _sk_gather_a8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,168,4,2,0 // vbroadcastss 0x204a8(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,104,7,2,0 // vbroadcastss 0x20768(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -27084,14 +27456,14 @@ _sk_store_a8_avx: .byte 77,15,175,202 // imul %r10,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,47,4,2,0 // vbroadcastss 0x2042f(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,239,6,2,0 // vbroadcastss 0x206ef(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne aa2b <_sk_store_a8_avx+0x47> + .byte 117,11 // jne ad5f <_sk_store_a8_avx+0x47> .byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -27100,25 +27472,25 @@ _sk_store_a8_avx: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja aa26 <_sk_store_a8_avx+0x42> + .byte 119,235 // ja ad5a <_sk_store_a8_avx+0x42> .byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8 .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # aaa0 <_sk_store_a8_avx+0xbc> + .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # add4 <_sk_store_a8_avx+0xbc> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1) - .byte 235,201 // jmp aa26 <_sk_store_a8_avx+0x42> + .byte 235,201 // jmp ad5a <_sk_store_a8_avx+0x42> .byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1) - .byte 196,98,57,0,5,50,13,2,0 // vpshufb 0x20d32(%rip),%xmm8,%xmm8 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf> + .byte 196,98,57,0,5,254,15,2,0 // vpshufb 0x20ffe(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb> .byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1) - .byte 235,175 // jmp aa26 <_sk_store_a8_avx+0x42> + .byte 235,175 // jmp ad5a <_sk_store_a8_avx+0x42> .byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1) .byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1) .byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1) - .byte 196,98,57,0,5,24,13,2,0 // vpshufb 0x20d18(%rip),%xmm8,%xmm8 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef> + .byte 196,98,57,0,5,228,15,2,0 // vpshufb 0x20fe4(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb> .byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1) - .byte 235,134 // jmp aa26 <_sk_store_a8_avx+0x42> + .byte 235,134 // jmp ad5a <_sk_store_a8_avx+0x42> .byte 180,255 // mov $0xff,%ah .byte 255 // (bad) .byte 255,197 // inc %ebp @@ -27151,18 +27523,18 @@ _sk_load_g8_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,72 // jne ab1d <_sk_load_g8_avx+0x61> + .byte 117,72 // jne ae51 <_sk_load_g8_avx+0x61> .byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0 - .byte 197,249,219,5,173,12,2,0 // vpand 0x20cad(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,249,219,5,121,15,2,0 // vpand 0x20f79(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,117,3,2,0 // vbroadcastss 0x20375(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,53,6,2,0 // vbroadcastss 0x20635(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,242,2,2,0 // vbroadcastss 0x202f2(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,178,5,2,0 // vbroadcastss 0x205b2(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 91 // pop %rbx @@ -27172,15 +27544,15 @@ _sk_load_g8_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,170 // ja aadb <_sk_load_g8_avx+0x1f> + .byte 119,170 // ja ae0f <_sk_load_g8_avx+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # abb4 <_sk_load_g8_avx+0xf8> + .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # aee8 <_sk_load_g8_avx+0xf8> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,139 // jmp aadb <_sk_load_g8_avx+0x1f> + .byte 235,139 // jmp ae0f <_sk_load_g8_avx+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -27188,7 +27560,7 @@ _sk_load_g8_avx: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,99,255,255,255 // jmpq aadb <_sk_load_g8_avx+0x1f> + .byte 233,99,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -27199,7 +27571,7 @@ _sk_load_g8_avx: .byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,40,255,255,255 // jmpq aadb <_sk_load_g8_avx+0x1f> + .byte 233,40,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f> .byte 144 // nop .byte 145 // xchg %eax,%ecx .byte 255 // (bad) @@ -27208,7 +27580,7 @@ _sk_load_g8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf00abc4 <_sk_overlay_sse2_8bit+0xffffffffdefe0203> + .byte 233,255,255,255,222 // jmpq ffffffffdf00aef8 <_sk_overlay_sse2_8bit+0xffffffffdefdff43> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -27231,18 +27603,18 @@ _sk_load_g8_dst_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 117,72 // jne ac31 <_sk_load_g8_dst_avx+0x61> + .byte 117,72 // jne af65 <_sk_load_g8_dst_avx+0x61> .byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4 - .byte 197,217,219,37,153,11,2,0 // vpand 0x20b99(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 197,217,219,37,101,14,2,0 // vpand 0x20e65(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5 .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,97,2,2,0 // vbroadcastss 0x20261(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,45,33,5,2,0 // vbroadcastss 0x20521(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,222,1,2,0 // vbroadcastss 0x201de(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,61,158,4,2,0 // vbroadcastss 0x2049e(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,236 // vmovaps %ymm4,%ymm5 .byte 197,252,40,244 // vmovaps %ymm4,%ymm6 .byte 91 // pop %rbx @@ -27252,15 +27624,15 @@ _sk_load_g8_dst_avx: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,170 // ja abef <_sk_load_g8_dst_avx+0x1f> + .byte 119,170 // ja af23 <_sk_load_g8_dst_avx+0x1f> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # acc8 <_sk_load_g8_dst_avx+0xf8> + .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # affc <_sk_load_g8_dst_avx+0xf8> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 235,139 // jmp abef <_sk_load_g8_dst_avx+0x1f> + .byte 235,139 // jmp af23 <_sk_load_g8_dst_avx+0x1f> .byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -27268,7 +27640,7 @@ _sk_load_g8_dst_avx: .byte 197,249,110,232 // vmovd %eax,%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4 - .byte 233,99,255,255,255 // jmpq abef <_sk_load_g8_dst_avx+0x1f> + .byte 233,99,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f> .byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -27279,7 +27651,7 @@ _sk_load_g8_dst_avx: .byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5 .byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5 .byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - .byte 233,40,255,255,255 // jmpq abef <_sk_load_g8_dst_avx+0x1f> + .byte 233,40,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f> .byte 144 // nop .byte 145 // xchg %eax,%ecx .byte 255 // (bad) @@ -27288,7 +27660,7 @@ _sk_load_g8_dst_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf00acd8 <_sk_overlay_sse2_8bit+0xffffffffdefe0317> + .byte 233,255,255,255,222 // jmpq ffffffffdf00b00c <_sk_overlay_sse2_8bit+0xffffffffdefe0057> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -27343,10 +27715,10 @@ _sk_gather_g8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,200,0,2,0 // vbroadcastss 0x200c8(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,226,125,24,13,136,3,2,0 // vbroadcastss 0x20388(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,69,0,2,0 // vbroadcastss 0x20045(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -27364,29 +27736,29 @@ _sk_load_565_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,129,0,0,0 // jne ae6a <_sk_load_565_avx+0xa1> + .byte 15,133,129,0,0,0 // jne b19e <_sk_load_565_avx+0xa1> .byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0 .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,113,0,2,0 // vbroadcastss 0x20071(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,226,125,24,5,49,3,2,0 // vbroadcastss 0x20331(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,100,0,2,0 // vbroadcastss 0x20064(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,226,125,24,13,36,3,2,0 // vbroadcastss 0x20324(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,91,0,2,0 // vbroadcastss 0x2005b(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,226,125,24,13,27,3,2,0 // vbroadcastss 0x2031b(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,78,0,2,0 // vbroadcastss 0x2004e(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,226,125,24,29,14,3,2,0 // vbroadcastss 0x2030e(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,69,0,2,0 // vbroadcastss 0x20045(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,56,0,2,0 // vbroadcastss 0x20038(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,226,125,24,29,248,2,2,0 // vbroadcastss 0x202f8(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,157,255,1,0 // vbroadcastss 0x1ff9d(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,93,2,2,0 // vbroadcastss 0x2025d(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d @@ -27394,27 +27766,27 @@ _sk_load_565_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,109,255,255,255 // ja adef <_sk_load_565_avx+0x26> + .byte 15,135,109,255,255,255 // ja b123 <_sk_load_565_avx+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # aef0 <_sk_load_565_avx+0x127> + .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # b224 <_sk_load_565_avx+0x127> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,75,255,255,255 // jmpq adef <_sk_load_565_avx+0x26> + .byte 233,75,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,46,255,255,255 // jmpq adef <_sk_load_565_avx+0x26> + .byte 233,46,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,1,255,255,255 // jmpq adef <_sk_load_565_avx+0x26> + .byte 233,1,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26> .byte 102,144 // xchg %ax,%ax .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -27448,29 +27820,29 @@ _sk_load_565_dst_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,129,0,0,0 // jne afad <_sk_load_565_dst_avx+0xa1> + .byte 15,133,129,0,0,0 // jne b2e1 <_sk_load_565_dst_avx+0xa1> .byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4 .byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5 .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6 - .byte 196,226,125,24,37,46,255,1,0 // vbroadcastss 0x1ff2e(%rip),%ymm4 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,226,125,24,37,238,1,2,0 // vbroadcastss 0x201ee(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,33,255,1,0 // vbroadcastss 0x1ff21(%rip),%ymm5 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,226,125,24,45,225,1,2,0 // vbroadcastss 0x201e1(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,24,45,24,255,1,0 // vbroadcastss 0x1ff18(%rip),%ymm5 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,226,125,24,45,216,1,2,0 // vbroadcastss 0x201d8(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,61,11,255,1,0 // vbroadcastss 0x1ff0b(%rip),%ymm7 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,226,125,24,61,203,1,2,0 // vbroadcastss 0x201cb(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5 - .byte 196,226,125,24,61,2,255,1,0 // vbroadcastss 0x1ff02(%rip),%ymm7 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,226,125,24,61,194,1,2,0 // vbroadcastss 0x201c2(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,226,125,24,61,245,254,1,0 // vbroadcastss 0x1fef5(%rip),%ymm7 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,226,125,24,61,181,1,2,0 // vbroadcastss 0x201b5(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,90,254,1,0 // vbroadcastss 0x1fe5a(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,61,26,1,2,0 // vbroadcastss 0x2011a(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d @@ -27478,27 +27850,27 @@ _sk_load_565_dst_avx: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,109,255,255,255 // ja af32 <_sk_load_565_dst_avx+0x26> + .byte 15,135,109,255,255,255 // ja b266 <_sk_load_565_dst_avx+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b034 <_sk_load_565_dst_avx+0x128> + .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b368 <_sk_load_565_dst_avx+0x128> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 233,75,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26> + .byte 233,75,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5 .byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4 - .byte 233,46,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26> + .byte 233,46,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5 .byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - .byte 233,1,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26> + .byte 233,1,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26> .byte 15,31,0 // nopl (%rax) .byte 165 // movsl %ds:(%rsi),%es:(%rdi) .byte 255 // (bad) @@ -27570,23 +27942,23 @@ _sk_gather_565_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,90,253,1,0 // vbroadcastss 0x1fd5a(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb> + .byte 196,226,125,24,5,26,0,2,0 // vbroadcastss 0x2001a(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,77,253,1,0 // vbroadcastss 0x1fd4d(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf> + .byte 196,226,125,24,13,13,0,2,0 // vbroadcastss 0x2000d(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,68,253,1,0 // vbroadcastss 0x1fd44(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3> + .byte 196,226,125,24,13,4,0,2,0 // vbroadcastss 0x20004(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,55,253,1,0 // vbroadcastss 0x1fd37(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7> + .byte 196,226,125,24,29,247,255,1,0 // vbroadcastss 0x1fff7(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,46,253,1,0 // vbroadcastss 0x1fd2e(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb> + .byte 196,226,125,24,29,238,255,1,0 // vbroadcastss 0x1ffee(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,33,253,1,0 // vbroadcastss 0x1fd21(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf> + .byte 196,226,125,24,29,225,255,1,0 // vbroadcastss 0x1ffe1(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,134,252,1,0 // vbroadcastss 0x1fc86(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,70,255,1,0 // vbroadcastss 0x1ff46(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_avx @@ -27601,14 +27973,14 @@ _sk_store_565_avx: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,80,253,1,0 // vbroadcastss 0x1fd50(%rip),%ymm8 # 2aef0 <_sk_overlay_sse2_8bit+0x52f> + .byte 196,98,125,24,5,16,0,2,0 // vbroadcastss 0x20010(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 .byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - .byte 196,98,125,24,21,41,253,1,0 // vbroadcastss 0x1fd29(%rip),%ymm10 # 2aef4 <_sk_overlay_sse2_8bit+0x533> + .byte 196,98,125,24,21,233,255,1,0 // vbroadcastss 0x1ffe9(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11 @@ -27622,7 +27994,7 @@ _sk_store_565_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne b21c <_sk_store_565_avx+0x9c> + .byte 117,11 // jne b550 <_sk_store_565_avx+0x9c> .byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -27631,22 +28003,22 @@ _sk_store_565_avx: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja b217 <_sk_store_565_avx+0x97> + .byte 119,235 // ja b54b <_sk_store_565_avx+0x97> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b27c <_sk_store_565_avx+0xfc> + .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b5b0 <_sk_store_565_avx+0xfc> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2) - .byte 235,206 // jmp b217 <_sk_store_565_avx+0x97> + .byte 235,206 // jmp b54b <_sk_store_565_avx+0x97> .byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) .byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2) - .byte 235,190 // jmp b217 <_sk_store_565_avx+0x97> + .byte 235,190 // jmp b54b <_sk_store_565_avx+0x97> .byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) .byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) .byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) .byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2) - .byte 235,158 // jmp b217 <_sk_store_565_avx+0x97> + .byte 235,158 // jmp b54b <_sk_store_565_avx+0x97> .byte 15,31,0 // nopl (%rax) .byte 196 // (bad) .byte 255 // (bad) @@ -27685,31 +28057,31 @@ _sk_load_4444_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,153,0,0,0 // jne b351 <_sk_load_4444_avx+0xb9> + .byte 15,133,153,0,0,0 // jne b685 <_sk_load_4444_avx+0xb9> .byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0 .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,30,252,1,0 // vbroadcastss 0x1fc1e(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537> + .byte 196,226,125,24,5,222,254,1,0 // vbroadcastss 0x1fede(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,17,252,1,0 // vbroadcastss 0x1fc11(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b> + .byte 196,226,125,24,13,209,254,1,0 // vbroadcastss 0x1fed1(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,8,252,1,0 // vbroadcastss 0x1fc08(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f> + .byte 196,226,125,24,13,200,254,1,0 // vbroadcastss 0x1fec8(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,251,251,1,0 // vbroadcastss 0x1fbfb(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543> + .byte 196,226,125,24,21,187,254,1,0 // vbroadcastss 0x1febb(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,242,251,1,0 // vbroadcastss 0x1fbf2(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547> + .byte 196,226,125,24,21,178,254,1,0 // vbroadcastss 0x1feb2(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,229,251,1,0 // vbroadcastss 0x1fbe5(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b> + .byte 196,98,125,24,5,165,254,1,0 // vbroadcastss 0x1fea5(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,219,251,1,0 // vbroadcastss 0x1fbdb(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f> + .byte 196,98,125,24,5,155,254,1,0 // vbroadcastss 0x1fe9b(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,205,251,1,0 // vbroadcastss 0x1fbcd(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553> + .byte 196,98,125,24,5,141,254,1,0 // vbroadcastss 0x1fe8d(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -27719,27 +28091,27 @@ _sk_load_4444_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,85,255,255,255 // ja b2be <_sk_load_4444_avx+0x26> + .byte 15,135,85,255,255,255 // ja b5f2 <_sk_load_4444_avx+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b3d8 <_sk_load_4444_avx+0x140> + .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b70c <_sk_load_4444_avx+0x140> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,51,255,255,255 // jmpq b2be <_sk_load_4444_avx+0x26> + .byte 233,51,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,22,255,255,255 // jmpq b2be <_sk_load_4444_avx+0x26> + .byte 233,22,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,233,254,255,255 // jmpq b2be <_sk_load_4444_avx+0x26> + .byte 233,233,254,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26> .byte 15,31,0 // nopl (%rax) .byte 165 // movsl %ds:(%rsi),%es:(%rdi) .byte 255 // (bad) @@ -27776,31 +28148,31 @@ _sk_load_4444_dst_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,153,0,0,0 // jne b4ad <_sk_load_4444_dst_avx+0xb9> + .byte 15,133,153,0,0,0 // jne b7e1 <_sk_load_4444_dst_avx+0xb9> .byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4 .byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5 .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7 - .byte 196,226,125,24,37,194,250,1,0 // vbroadcastss 0x1fac2(%rip),%ymm4 # 2aef8 <_sk_overlay_sse2_8bit+0x537> + .byte 196,226,125,24,37,130,253,1,0 // vbroadcastss 0x1fd82(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537> .byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,181,250,1,0 // vbroadcastss 0x1fab5(%rip),%ymm5 # 2aefc <_sk_overlay_sse2_8bit+0x53b> + .byte 196,226,125,24,45,117,253,1,0 // vbroadcastss 0x1fd75(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,24,45,172,250,1,0 // vbroadcastss 0x1faac(%rip),%ymm5 # 2af00 <_sk_overlay_sse2_8bit+0x53f> + .byte 196,226,125,24,45,108,253,1,0 // vbroadcastss 0x1fd6c(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f> .byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,53,159,250,1,0 // vbroadcastss 0x1fa9f(%rip),%ymm6 # 2af04 <_sk_overlay_sse2_8bit+0x543> + .byte 196,226,125,24,53,95,253,1,0 // vbroadcastss 0x1fd5f(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543> .byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5 - .byte 196,226,125,24,53,150,250,1,0 // vbroadcastss 0x1fa96(%rip),%ymm6 # 2af08 <_sk_overlay_sse2_8bit+0x547> + .byte 196,226,125,24,53,86,253,1,0 // vbroadcastss 0x1fd56(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547> .byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,98,125,24,5,137,250,1,0 // vbroadcastss 0x1fa89(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b> + .byte 196,98,125,24,5,73,253,1,0 // vbroadcastss 0x1fd49(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b> .byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6 - .byte 196,98,125,24,5,127,250,1,0 // vbroadcastss 0x1fa7f(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f> + .byte 196,98,125,24,5,63,253,1,0 // vbroadcastss 0x1fd3f(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f> .byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,113,250,1,0 // vbroadcastss 0x1fa71(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553> + .byte 196,98,125,24,5,49,253,1,0 // vbroadcastss 0x1fd31(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553> .byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -27810,27 +28182,27 @@ _sk_load_4444_dst_avx: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,85,255,255,255 // ja b41a <_sk_load_4444_dst_avx+0x26> + .byte 15,135,85,255,255,255 // ja b74e <_sk_load_4444_dst_avx+0x26> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b534 <_sk_load_4444_dst_avx+0x140> + .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b868 <_sk_load_4444_dst_avx+0x140> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 233,51,255,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26> + .byte 233,51,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5 .byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4 - .byte 233,22,255,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26> + .byte 233,22,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 .byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5 .byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - .byte 233,233,254,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26> + .byte 233,233,254,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26> .byte 15,31,0 // nopl (%rax) .byte 165 // movsl %ds:(%rsi),%es:(%rdi) .byte 255 // (bad) @@ -27902,25 +28274,25 @@ _sk_gather_4444_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,214,248,1,0 // vbroadcastss 0x1f8d6(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537> + .byte 196,226,125,24,5,150,251,1,0 // vbroadcastss 0x1fb96(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,201,248,1,0 // vbroadcastss 0x1f8c9(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b> + .byte 196,226,125,24,13,137,251,1,0 // vbroadcastss 0x1fb89(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,192,248,1,0 // vbroadcastss 0x1f8c0(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f> + .byte 196,226,125,24,13,128,251,1,0 // vbroadcastss 0x1fb80(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,179,248,1,0 // vbroadcastss 0x1f8b3(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543> + .byte 196,226,125,24,21,115,251,1,0 // vbroadcastss 0x1fb73(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,170,248,1,0 // vbroadcastss 0x1f8aa(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547> + .byte 196,226,125,24,21,106,251,1,0 // vbroadcastss 0x1fb6a(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,157,248,1,0 // vbroadcastss 0x1f89d(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b> + .byte 196,98,125,24,5,93,251,1,0 // vbroadcastss 0x1fb5d(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,147,248,1,0 // vbroadcastss 0x1f893(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f> + .byte 196,98,125,24,5,83,251,1,0 // vbroadcastss 0x1fb53(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,133,248,1,0 // vbroadcastss 0x1f885(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553> + .byte 196,98,125,24,5,69,251,1,0 // vbroadcastss 0x1fb45(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -27937,7 +28309,7 @@ _sk_store_4444_avx: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,96,248,1,0 // vbroadcastss 0x1f860(%rip),%ymm8 # 2af18 <_sk_overlay_sse2_8bit+0x557> + .byte 196,98,125,24,5,32,251,1,0 // vbroadcastss 0x1fb20(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10 @@ -27964,7 +28336,7 @@ _sk_store_4444_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne b752 <_sk_store_4444_avx+0xba> + .byte 117,11 // jne ba86 <_sk_store_4444_avx+0xba> .byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -27973,22 +28345,22 @@ _sk_store_4444_avx: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja b74d <_sk_store_4444_avx+0xb5> + .byte 119,235 // ja ba81 <_sk_store_4444_avx+0xb5> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # b7b0 <_sk_store_4444_avx+0x118> + .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # bae4 <_sk_store_4444_avx+0x118> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2) - .byte 235,206 // jmp b74d <_sk_store_4444_avx+0xb5> + .byte 235,206 // jmp ba81 <_sk_store_4444_avx+0xb5> .byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) .byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2) - .byte 235,190 // jmp b74d <_sk_store_4444_avx+0xb5> + .byte 235,190 // jmp ba81 <_sk_store_4444_avx+0xb5> .byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) .byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) .byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) .byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2) - .byte 235,158 // jmp b74d <_sk_store_4444_avx+0xb5> + .byte 235,158 // jmp ba81 <_sk_store_4444_avx+0xb5> .byte 144 // nop .byte 198 // (bad) .byte 255 // (bad) @@ -28027,12 +28399,12 @@ _sk_load_8888_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,136,0,0,0 // jne b875 <_sk_load_8888_avx+0xa9> + .byte 15,133,136,0,0,0 // jne bba9 <_sk_load_8888_avx+0xa9> .byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9 - .byte 197,125,40,21,229,250,1,0 // vmovapd 0x1fae5(%rip),%ymm10 # 2b2e0 <_sk_overlay_sse2_8bit+0x91f> + .byte 197,125,40,21,177,253,1,0 // vmovapd 0x1fdb1(%rip),%ymm10 # 2b8e0 <_sk_overlay_sse2_8bit+0x92b> .byte 196,193,53,84,194 // vandpd %ymm10,%ymm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,107,246,1,0 // vbroadcastss 0x1f66b(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,43,249,1,0 // vbroadcastss 0x1f92b(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1 .byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3 @@ -28060,21 +28432,21 @@ _sk_load_8888_avx: .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,101,255,255,255 // ja b7f3 <_sk_load_8888_avx+0x27> + .byte 15,135,101,255,255,255 // ja bb27 <_sk_load_8888_avx+0x27> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # b92c <_sk_load_8888_avx+0x160> + .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bc60 <_sk_load_8888_avx+0x160> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9 - .byte 233,70,255,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27> + .byte 233,70,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27> .byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0 .byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9 .byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0 .byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9 - .byte 233,31,255,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27> + .byte 233,31,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27> .byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0 .byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 @@ -28088,9 +28460,9 @@ _sk_load_8888_avx: .byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9 .byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0 .byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9 - .byte 233,202,254,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27> + .byte 233,202,254,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27> .byte 15,31,0 // nopl (%rax) - .byte 118,255 // jbe b92d <_sk_load_8888_avx+0x161> + .byte 118,255 // jbe bc61 <_sk_load_8888_avx+0x161> .byte 255 // (bad) .byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi) .byte 255 // (bad) @@ -28123,12 +28495,12 @@ _sk_load_8888_dst_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,136,0,0,0 // jne b9f1 <_sk_load_8888_dst_avx+0xa9> + .byte 15,133,136,0,0,0 // jne bd25 <_sk_load_8888_dst_avx+0xa9> .byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9 - .byte 197,125,40,21,137,249,1,0 // vmovapd 0x1f989(%rip),%ymm10 # 2b300 <_sk_overlay_sse2_8bit+0x93f> + .byte 197,125,40,21,85,252,1,0 // vmovapd 0x1fc55(%rip),%ymm10 # 2b900 <_sk_overlay_sse2_8bit+0x94b> .byte 196,193,53,84,226 // vandpd %ymm10,%ymm9,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,98,125,24,5,239,244,1,0 // vbroadcastss 0x1f4ef(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,175,247,1,0 // vbroadcastss 0x1f7af(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4 .byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5 .byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7 @@ -28156,21 +28528,21 @@ _sk_load_8888_dst_avx: .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,101,255,255,255 // ja b96f <_sk_load_8888_dst_avx+0x27> + .byte 15,135,101,255,255,255 // ja bca3 <_sk_load_8888_dst_avx+0x27> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # baa8 <_sk_load_8888_dst_avx+0x160> + .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bddc <_sk_load_8888_dst_avx+0x160> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9 - .byte 233,70,255,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27> + .byte 233,70,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27> .byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4 .byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 .byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9 .byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4 .byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9 - .byte 233,31,255,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27> + .byte 233,31,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27> .byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4 .byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4 .byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4 @@ -28184,9 +28556,9 @@ _sk_load_8888_dst_avx: .byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9 .byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4 .byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9 - .byte 233,202,254,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27> + .byte 233,202,254,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27> .byte 15,31,0 // nopl (%rax) - .byte 118,255 // jbe baa9 <_sk_load_8888_dst_avx+0x161> + .byte 118,255 // jbe bddd <_sk_load_8888_dst_avx+0x161> .byte 255 // (bad) .byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi) .byte 255 // (bad) @@ -28243,10 +28615,10 @@ _sk_gather_8888_avx: .byte 73,193,234,32 // shr $0x20,%r10 .byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,177,247,1,0 // vmovaps 0x1f7b1(%rip),%ymm10 # 2b320 <_sk_overlay_sse2_8bit+0x95f> + .byte 197,124,40,21,125,250,1,0 // vmovaps 0x1fa7d(%rip),%ymm10 # 2b920 <_sk_overlay_sse2_8bit+0x96b> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,247,242,1,0 // vbroadcastss 0x1f2f7(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,13,183,245,1,0 // vbroadcastss 0x1f5b7(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -28280,7 +28652,7 @@ _sk_store_8888_avx: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,45,242,1,0 // vbroadcastss 0x1f22d(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,237,244,1,0 // vbroadcastss 0x1f4ed(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -28305,7 +28677,7 @@ _sk_store_8888_avx: .byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8 .byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne bc92 <_sk_store_8888_avx+0xb0> + .byte 117,11 // jne bfc6 <_sk_store_8888_avx+0xb0> .byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -28314,17 +28686,17 @@ _sk_store_8888_avx: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja bc8d <_sk_store_8888_avx+0xab> + .byte 119,235 // ja bfc1 <_sk_store_8888_avx+0xab> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # bd00 <_sk_store_8888_avx+0x11e> + .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c034 <_sk_store_8888_avx+0x11e> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4) - .byte 235,207 // jmp bc8d <_sk_store_8888_avx+0xab> + .byte 235,207 // jmp bfc1 <_sk_store_8888_avx+0xab> .byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) .byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4) - .byte 235,191 // jmp bc8d <_sk_store_8888_avx+0xab> + .byte 235,191 // jmp bfc1 <_sk_store_8888_avx+0xab> .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 @@ -28332,7 +28704,7 @@ _sk_store_8888_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4) .byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4) - .byte 235,142 // jmp bc8d <_sk_store_8888_avx+0xab> + .byte 235,142 // jmp bfc1 <_sk_store_8888_avx+0xab> .byte 144 // nop .byte 182,255 // mov $0xff,%dh .byte 255 // (bad) @@ -28368,12 +28740,12 @@ _sk_load_bgra_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,136,0,0,0 // jne bdc5 <_sk_load_bgra_avx+0xa9> + .byte 15,133,136,0,0,0 // jne c0f9 <_sk_load_bgra_avx+0xa9> .byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9 - .byte 197,125,40,21,245,245,1,0 // vmovapd 0x1f5f5(%rip),%ymm10 # 2b340 <_sk_overlay_sse2_8bit+0x97f> + .byte 197,125,40,21,193,248,1,0 // vmovapd 0x1f8c1(%rip),%ymm10 # 2b940 <_sk_overlay_sse2_8bit+0x98b> .byte 196,193,53,84,202 // vandpd %ymm10,%ymm9,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,98,125,24,5,27,241,1,0 // vbroadcastss 0x1f11b(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,219,243,1,0 // vbroadcastss 0x1f3db(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2 .byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1 .byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3 @@ -28401,21 +28773,21 @@ _sk_load_bgra_avx: .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,101,255,255,255 // ja bd43 <_sk_load_bgra_avx+0x27> + .byte 15,135,101,255,255,255 // ja c077 <_sk_load_bgra_avx+0x27> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # be7c <_sk_load_bgra_avx+0x160> + .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c1b0 <_sk_load_bgra_avx+0x160> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9 - .byte 233,70,255,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27> + .byte 233,70,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27> .byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0 .byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9 .byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0 .byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9 - .byte 233,31,255,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27> + .byte 233,31,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27> .byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0 .byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 @@ -28429,9 +28801,9 @@ _sk_load_bgra_avx: .byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9 .byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0 .byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9 - .byte 233,202,254,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27> + .byte 233,202,254,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27> .byte 15,31,0 // nopl (%rax) - .byte 118,255 // jbe be7d <_sk_load_bgra_avx+0x161> + .byte 118,255 // jbe c1b1 <_sk_load_bgra_avx+0x161> .byte 255 // (bad) .byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi) .byte 255 // (bad) @@ -28464,12 +28836,12 @@ _sk_load_bgra_dst_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,136,0,0,0 // jne bf41 <_sk_load_bgra_dst_avx+0xa9> + .byte 15,133,136,0,0,0 // jne c275 <_sk_load_bgra_dst_avx+0xa9> .byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9 - .byte 197,125,40,21,153,244,1,0 // vmovapd 0x1f499(%rip),%ymm10 # 2b360 <_sk_overlay_sse2_8bit+0x99f> + .byte 197,125,40,21,101,247,1,0 // vmovapd 0x1f765(%rip),%ymm10 # 2b960 <_sk_overlay_sse2_8bit+0x9ab> .byte 196,193,53,84,234 // vandpd %ymm10,%ymm9,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,98,125,24,5,159,239,1,0 // vbroadcastss 0x1ef9f(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,5,95,242,1,0 // vbroadcastss 0x1f25f(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6 .byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5 .byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7 @@ -28497,21 +28869,21 @@ _sk_load_bgra_dst_avx: .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 15,135,101,255,255,255 // ja bebf <_sk_load_bgra_dst_avx+0x27> + .byte 15,135,101,255,255,255 // ja c1f3 <_sk_load_bgra_dst_avx+0x27> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bff8 <_sk_load_bgra_dst_avx+0x160> + .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c32c <_sk_load_bgra_dst_avx+0x160> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9 - .byte 233,70,255,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27> + .byte 233,70,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27> .byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4 .byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 .byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9 .byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4 .byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9 - .byte 233,31,255,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27> + .byte 233,31,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27> .byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4 .byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4 .byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4 @@ -28525,9 +28897,9 @@ _sk_load_bgra_dst_avx: .byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9 .byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4 .byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9 - .byte 233,202,254,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27> + .byte 233,202,254,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27> .byte 15,31,0 // nopl (%rax) - .byte 118,255 // jbe bff9 <_sk_load_bgra_dst_avx+0x161> + .byte 118,255 // jbe c32d <_sk_load_bgra_dst_avx+0x161> .byte 255 // (bad) .byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi) .byte 255 // (bad) @@ -28584,10 +28956,10 @@ _sk_gather_bgra_avx: .byte 73,193,234,32 // shr $0x20,%r10 .byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,13,193,242,1,0 // vmovaps 0x1f2c1(%rip),%ymm9 # 2b380 <_sk_overlay_sse2_8bit+0x9bf> + .byte 197,124,40,13,141,245,1,0 // vmovaps 0x1f58d(%rip),%ymm9 # 2b980 <_sk_overlay_sse2_8bit+0x9cb> .byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,167,237,1,0 // vbroadcastss 0x1eda7(%rip),%ymm10 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7> + .byte 196,98,125,24,21,103,240,1,0 // vbroadcastss 0x1f067(%rip),%ymm10 # 2b46c <_sk_overlay_sse2_8bit+0x4b7> .byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2 .byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0 .byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1 @@ -28621,7 +28993,7 @@ _sk_store_bgra_avx: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,218 // movslq %edx,%rbx - .byte 196,98,125,24,5,221,236,1,0 // vbroadcastss 0x1ecdd(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 196,98,125,24,5,157,239,1,0 // vbroadcastss 0x1ef9d(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -28646,7 +29018,7 @@ _sk_store_bgra_avx: .byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8 .byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,11 // jne c1e2 <_sk_store_bgra_avx+0xb0> + .byte 117,11 // jne c516 <_sk_store_bgra_avx+0xb0> .byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -28655,17 +29027,17 @@ _sk_store_bgra_avx: .byte 65,128,226,7 // and $0x7,%r10b .byte 65,254,202 // dec %r10b .byte 65,128,250,6 // cmp $0x6,%r10b - .byte 119,235 // ja c1dd <_sk_store_bgra_avx+0xab> + .byte 119,235 // ja c511 <_sk_store_bgra_avx+0xab> .byte 69,15,182,210 // movzbl %r10b,%r10d - .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c250 <_sk_store_bgra_avx+0x11e> + .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c584 <_sk_store_bgra_avx+0x11e> .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4) - .byte 235,207 // jmp c1dd <_sk_store_bgra_avx+0xab> + .byte 235,207 // jmp c511 <_sk_store_bgra_avx+0xab> .byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) .byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4) - .byte 235,191 // jmp c1dd <_sk_store_bgra_avx+0xab> + .byte 235,191 // jmp c511 <_sk_store_bgra_avx+0xab> .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 @@ -28673,7 +29045,7 @@ _sk_store_bgra_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4) .byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4) - .byte 235,142 // jmp c1dd <_sk_store_bgra_avx+0xab> + .byte 235,142 // jmp c511 <_sk_store_bgra_avx+0xab> .byte 144 // nop .byte 182,255 // mov $0xff,%dh .byte 255 // (bad) @@ -28713,7 +29085,7 @@ _sk_load_f16_avx: .byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp) .byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp) .byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp) - .byte 15,133,145,2,0,0 // jne c539 <_sk_load_f16_avx+0x2cd> + .byte 15,133,145,2,0,0 // jne c86d <_sk_load_f16_avx+0x2cd> .byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8 .byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2 .byte 196,193,121,16,76,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm1 @@ -28731,13 +29103,13 @@ _sk_load_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,123,236,1,0 // vbroadcastss 0x1ec7b(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf> + .byte 196,98,125,24,37,59,239,1,0 // vbroadcastss 0x1ef3b(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,63,236,1,0 // vbroadcastss 0x1ec3f(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,121,24,29,255,238,1,0 // vbroadcastss 0x1eeff(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,89,236,1,0 // vbroadcastss 0x1ec59(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3> + .byte 196,98,121,24,45,25,239,1,0 // vbroadcastss 0x1ef19(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -28751,7 +29123,7 @@ _sk_load_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,15,236,1,0 // vbroadcastss 0x1ec0f(%rip),%xmm3 # 2af88 <_sk_overlay_sse2_8bit+0x5c7> + .byte 196,226,121,24,29,207,238,1,0 // vbroadcastss 0x1eecf(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -28844,29 +29216,29 @@ _sk_load_f16_avx: .byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je c59f <_sk_load_f16_avx+0x333> + .byte 116,85 // je c8d3 <_sk_load_f16_avx+0x333> .byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb c59f <_sk_load_f16_avx+0x333> + .byte 114,72 // jb c8d3 <_sk_load_f16_avx+0x333> .byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je c5ac <_sk_load_f16_avx+0x340> + .byte 116,72 // je c8e0 <_sk_load_f16_avx+0x340> .byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb c5ac <_sk_load_f16_avx+0x340> + .byte 114,59 // jb c8e0 <_sk_load_f16_avx+0x340> .byte 196,193,123,16,76,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,65,253,255,255 // je c2c3 <_sk_load_f16_avx+0x57> + .byte 15,132,65,253,255,255 // je c5f7 <_sk_load_f16_avx+0x57> .byte 196,193,113,22,76,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,48,253,255,255 // jb c2c3 <_sk_load_f16_avx+0x57> + .byte 15,130,48,253,255,255 // jb c5f7 <_sk_load_f16_avx+0x57> .byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9 - .byte 233,36,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57> + .byte 233,36,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57> .byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,23,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57> + .byte 233,23,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57> .byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1 - .byte 233,14,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57> + .byte 233,14,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57> HIDDEN _sk_load_f16_dst_avx .globl _sk_load_f16_dst_avx @@ -28885,7 +29257,7 @@ _sk_load_f16_dst_avx: .byte 197,252,17,84,36,192 // vmovups %ymm2,-0x40(%rsp) .byte 197,252,17,76,36,160 // vmovups %ymm1,-0x60(%rsp) .byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp) - .byte 15,133,145,2,0,0 // jne c882 <_sk_load_f16_dst_avx+0x2cd> + .byte 15,133,145,2,0,0 // jne cbb6 <_sk_load_f16_dst_avx+0x2cd> .byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8 .byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6 .byte 196,193,121,16,108,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm5 @@ -28903,13 +29275,13 @@ _sk_load_f16_dst_avx: .byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 - .byte 196,98,125,24,37,50,233,1,0 // vbroadcastss 0x1e932(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf> + .byte 196,98,125,24,37,242,235,1,0 // vbroadcastss 0x1ebf2(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf> .byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5 .byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4 .byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14 - .byte 196,98,121,24,29,246,232,1,0 // vbroadcastss 0x1e8f6(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,121,24,29,182,235,1,0 // vbroadcastss 0x1ebb6(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7 - .byte 196,98,121,24,45,16,233,1,0 // vbroadcastss 0x1e910(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3> + .byte 196,98,121,24,45,208,235,1,0 // vbroadcastss 0x1ebd0(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3> .byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7 .byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -28923,7 +29295,7 @@ _sk_load_f16_dst_avx: .byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4 .byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4 .byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5 - .byte 196,226,121,24,61,198,232,1,0 // vbroadcastss 0x1e8c6(%rip),%xmm7 # 2af88 <_sk_overlay_sse2_8bit+0x5c7> + .byte 196,226,121,24,61,134,235,1,0 // vbroadcastss 0x1eb86(%rip),%xmm7 # 2b57c <_sk_overlay_sse2_8bit+0x5c7> .byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5 .byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 @@ -29016,29 +29388,29 @@ _sk_load_f16_dst_avx: .byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je c8e8 <_sk_load_f16_dst_avx+0x333> + .byte 116,85 // je cc1c <_sk_load_f16_dst_avx+0x333> .byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb c8e8 <_sk_load_f16_dst_avx+0x333> + .byte 114,72 // jb cc1c <_sk_load_f16_dst_avx+0x333> .byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je c8f5 <_sk_load_f16_dst_avx+0x340> + .byte 116,72 // je cc29 <_sk_load_f16_dst_avx+0x340> .byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb c8f5 <_sk_load_f16_dst_avx+0x340> + .byte 114,59 // jb cc29 <_sk_load_f16_dst_avx+0x340> .byte 196,193,123,16,108,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm5 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,65,253,255,255 // je c60c <_sk_load_f16_dst_avx+0x57> + .byte 15,132,65,253,255,255 // je c940 <_sk_load_f16_dst_avx+0x57> .byte 196,193,81,22,108,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,48,253,255,255 // jb c60c <_sk_load_f16_dst_avx+0x57> + .byte 15,130,48,253,255,255 // jb c940 <_sk_load_f16_dst_avx+0x57> .byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9 - .byte 233,36,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57> + .byte 233,36,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57> .byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5 .byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6 - .byte 233,23,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57> + .byte 233,23,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57> .byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5 - .byte 233,14,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57> + .byte 233,14,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57> HIDDEN _sk_gather_f16_avx .globl _sk_gather_f16_avx @@ -29099,13 +29471,13 @@ _sk_gather_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,120,229,1,0 // vbroadcastss 0x1e578(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf> + .byte 196,98,125,24,37,56,232,1,0 // vbroadcastss 0x1e838(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,60,229,1,0 // vbroadcastss 0x1e53c(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,121,24,29,252,231,1,0 // vbroadcastss 0x1e7fc(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,86,229,1,0 // vbroadcastss 0x1e556(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3> + .byte 196,98,121,24,45,22,232,1,0 // vbroadcastss 0x1e816(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -29119,7 +29491,7 @@ _sk_gather_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,12,229,1,0 // vbroadcastss 0x1e50c(%rip),%xmm3 # 2af88 <_sk_overlay_sse2_8bit+0x5c7> + .byte 196,226,121,24,29,204,231,1,0 // vbroadcastss 0x1e7cc(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -29219,12 +29591,12 @@ _sk_store_f16_avx: .byte 197,252,17,52,36 // vmovups %ymm6,(%rsp) .byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp) .byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp) - .byte 196,98,125,24,13,252,226,1,0 // vbroadcastss 0x1e2fc(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,125,24,13,188,229,1,0 // vbroadcastss 0x1e5bc(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10 .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp) .byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11 .byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12 - .byte 196,98,121,24,5,13,227,1,0 // vbroadcastss 0x1e30d(%rip),%xmm8 # 2af8c <_sk_overlay_sse2_8bit+0x5cb> + .byte 196,98,121,24,5,205,229,1,0 // vbroadcastss 0x1e5cd(%rip),%xmm8 # 2b580 <_sk_overlay_sse2_8bit+0x5cb> .byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13 .byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14 .byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -29234,7 +29606,7 @@ _sk_store_f16_avx: .byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 .byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11 .byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12 - .byte 196,98,125,24,21,212,226,1,0 // vbroadcastss 0x1e2d4(%rip),%ymm10 # 2af90 <_sk_overlay_sse2_8bit+0x5cf> + .byte 196,98,125,24,21,148,229,1,0 // vbroadcastss 0x1e594(%rip),%ymm10 # 2b584 <_sk_overlay_sse2_8bit+0x5cf> .byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14 .byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15 .byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12 @@ -29321,7 +29693,7 @@ _sk_store_f16_avx: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,70 // jne ceb0 <_sk_store_f16_avx+0x274> + .byte 117,70 // jne d1e4 <_sk_store_f16_avx+0x274> .byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8) .byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8) .byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8) @@ -29337,22 +29709,22 @@ _sk_store_f16_avx: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,201 // je ce85 <_sk_store_f16_avx+0x249> + .byte 116,201 // je d1b9 <_sk_store_f16_avx+0x249> .byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,188 // jb ce85 <_sk_store_f16_avx+0x249> + .byte 114,188 // jb d1b9 <_sk_store_f16_avx+0x249> .byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8) - .byte 116,179 // je ce85 <_sk_store_f16_avx+0x249> + .byte 116,179 // je d1b9 <_sk_store_f16_avx+0x249> .byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,166 // jb ce85 <_sk_store_f16_avx+0x249> + .byte 114,166 // jb d1b9 <_sk_store_f16_avx+0x249> .byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8) - .byte 116,157 // je ce85 <_sk_store_f16_avx+0x249> + .byte 116,157 // je d1b9 <_sk_store_f16_avx+0x249> .byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,144 // jb ce85 <_sk_store_f16_avx+0x249> + .byte 114,144 // jb d1b9 <_sk_store_f16_avx+0x249> .byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8) - .byte 235,135 // jmp ce85 <_sk_store_f16_avx+0x249> + .byte 235,135 // jmp d1b9 <_sk_store_f16_avx+0x249> HIDDEN _sk_load_u16_be_avx .globl _sk_load_u16_be_avx @@ -29367,7 +29739,7 @@ _sk_load_u16_be_avx: .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,253,0,0,0 // jne d022 <_sk_load_u16_be_avx+0x124> + .byte 15,133,253,0,0,0 // jne d356 <_sk_load_u16_be_avx+0x124> .byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8 .byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2 .byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -29389,7 +29761,7 @@ _sk_load_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,254,222,1,0 // vbroadcastss 0x1defe(%rip),%ymm11 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3> + .byte 196,98,125,24,29,190,225,1,0 // vbroadcastss 0x1e1be(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -29423,29 +29795,29 @@ _sk_load_u16_be_avx: .byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je d088 <_sk_load_u16_be_avx+0x18a> + .byte 116,85 // je d3bc <_sk_load_u16_be_avx+0x18a> .byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb d088 <_sk_load_u16_be_avx+0x18a> + .byte 114,72 // jb d3bc <_sk_load_u16_be_avx+0x18a> .byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je d095 <_sk_load_u16_be_avx+0x197> + .byte 116,72 // je d3c9 <_sk_load_u16_be_avx+0x197> .byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb d095 <_sk_load_u16_be_avx+0x197> + .byte 114,59 // jb d3c9 <_sk_load_u16_be_avx+0x197> .byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,213,254,255,255 // je cf40 <_sk_load_u16_be_avx+0x42> + .byte 15,132,213,254,255,255 // je d274 <_sk_load_u16_be_avx+0x42> .byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,196,254,255,255 // jb cf40 <_sk_load_u16_be_avx+0x42> + .byte 15,130,196,254,255,255 // jb d274 <_sk_load_u16_be_avx+0x42> .byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9 - .byte 233,184,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42> + .byte 233,184,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,171,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42> + .byte 233,171,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,162,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42> + .byte 233,162,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42> HIDDEN _sk_load_rgb_u16_be_avx .globl _sk_load_rgb_u16_be_avx @@ -29462,7 +29834,7 @@ _sk_load_rgb_u16_be_avx: .byte 72,141,4,64 // lea (%rax,%rax,2),%rax .byte 72,193,248,32 // sar $0x20,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,243,0,0,0 // jne d1bc <_sk_load_rgb_u16_be_avx+0x11e> + .byte 15,133,243,0,0,0 // jne d4f0 <_sk_load_rgb_u16_be_avx+0x11e> .byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0 .byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2 .byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -29489,7 +29861,7 @@ _sk_load_rgb_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,65,221,1,0 // vbroadcastss 0x1dd41(%rip),%ymm11 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3> + .byte 196,98,125,24,29,1,224,1,0 // vbroadcastss 0x1e001(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -29510,41 +29882,41 @@ _sk_load_rgb_u16_be_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,74,220,1,0 // vbroadcastss 0x1dc4a(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,10,223,1,0 // vbroadcastss 0x1df0a(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0 .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne d1d5 <_sk_load_rgb_u16_be_avx+0x137> - .byte 233,40,255,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f> + .byte 117,5 // jne d509 <_sk_load_rgb_u16_be_avx+0x137> + .byte 233,40,255,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f> .byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1 .byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb d204 <_sk_load_rgb_u16_be_avx+0x166> + .byte 114,26 // jb d538 <_sk_load_rgb_u16_be_avx+0x166> .byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1 .byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne d209 <_sk_load_rgb_u16_be_avx+0x16b> - .byte 233,249,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f> - .byte 233,244,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f> + .byte 117,10 // jne d53d <_sk_load_rgb_u16_be_avx+0x16b> + .byte 233,249,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f> + .byte 233,244,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f> .byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1 .byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb d238 <_sk_load_rgb_u16_be_avx+0x19a> + .byte 114,26 // jb d56c <_sk_load_rgb_u16_be_avx+0x19a> .byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1 .byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne d23d <_sk_load_rgb_u16_be_avx+0x19f> - .byte 233,197,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f> - .byte 233,192,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f> + .byte 117,10 // jne d571 <_sk_load_rgb_u16_be_avx+0x19f> + .byte 233,197,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f> + .byte 233,192,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f> .byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3 .byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb d266 <_sk_load_rgb_u16_be_avx+0x1c8> + .byte 114,20 // jb d59a <_sk_load_rgb_u16_be_avx+0x1c8> .byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3 .byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - .byte 233,151,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f> - .byte 233,146,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f> + .byte 233,151,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f> + .byte 233,146,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f> HIDDEN _sk_store_u16_be_avx .globl _sk_store_u16_be_avx @@ -29558,7 +29930,7 @@ _sk_store_u16_be_avx: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax - .byte 196,98,125,24,5,138,220,1,0 // vbroadcastss 0x1dc8a(%rip),%ymm8 # 2af1c <_sk_overlay_sse2_8bit+0x55b> + .byte 196,98,125,24,5,74,223,1,0 // vbroadcastss 0x1df4a(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -29596,7 +29968,7 @@ _sk_store_u16_be_avx: .byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9 .byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,31 // jne d376 <_sk_store_u16_be_avx+0x10b> + .byte 117,31 // jne d6aa <_sk_store_u16_be_avx+0x10b> .byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2) .byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2) .byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2) @@ -29605,22 +29977,22 @@ _sk_store_u16_be_avx: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je d372 <_sk_store_u16_be_avx+0x107> + .byte 116,240 // je d6a6 <_sk_store_u16_be_avx+0x107> .byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb d372 <_sk_store_u16_be_avx+0x107> + .byte 114,227 // jb d6a6 <_sk_store_u16_be_avx+0x107> .byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2) - .byte 116,218 // je d372 <_sk_store_u16_be_avx+0x107> + .byte 116,218 // je d6a6 <_sk_store_u16_be_avx+0x107> .byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb d372 <_sk_store_u16_be_avx+0x107> + .byte 114,205 // jb d6a6 <_sk_store_u16_be_avx+0x107> .byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2) - .byte 116,196 // je d372 <_sk_store_u16_be_avx+0x107> + .byte 116,196 // je d6a6 <_sk_store_u16_be_avx+0x107> .byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,183 // jb d372 <_sk_store_u16_be_avx+0x107> + .byte 114,183 // jb d6a6 <_sk_store_u16_be_avx+0x107> .byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2) - .byte 235,174 // jmp d372 <_sk_store_u16_be_avx+0x107> + .byte 235,174 // jmp d6a6 <_sk_store_u16_be_avx+0x107> HIDDEN _sk_load_f32_avx .globl _sk_load_f32_avx @@ -29628,7 +30000,7 @@ FUNCTION(_sk_load_f32_avx) _sk_load_f32_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,135,128,0,0,0 // ja d450 <_sk_load_f32_avx+0x8c> + .byte 15,135,128,0,0,0 // ja d784 <_sk_load_f32_avx+0x8c> .byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d .byte 76,99,88,8 // movslq 0x8(%rax),%r11 .byte 76,99,201 // movslq %ecx,%r9 @@ -29636,7 +30008,7 @@ _sk_load_f32_avx: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 77,99,210 // movslq %r10d,%r10 - .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d478 <_sk_load_f32_avx+0xb4> + .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d7ac <_sk_load_f32_avx+0xb4> .byte 75,99,4,131 // movslq (%r11,%r8,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax @@ -29685,7 +30057,7 @@ FUNCTION(_sk_load_f32_dst_avx) _sk_load_f32_dst_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,135,128,0,0,0 // ja d524 <_sk_load_f32_dst_avx+0x8c> + .byte 15,135,128,0,0,0 // ja d858 <_sk_load_f32_dst_avx+0x8c> .byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d .byte 76,99,88,8 // movslq 0x8(%rax),%r11 .byte 76,99,201 // movslq %ecx,%r9 @@ -29693,7 +30065,7 @@ _sk_load_f32_dst_avx: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 77,99,210 // movslq %r10d,%r10 - .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d54c <_sk_load_f32_dst_avx+0xb4> + .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d880 <_sk_load_f32_dst_avx+0xb4> .byte 75,99,4,131 // movslq (%r11,%r8,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax @@ -29757,7 +30129,7 @@ _sk_store_f32_avx: .byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8 .byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11 .byte 77,133,192 // test %r8,%r8 - .byte 117,55 // jne d5eb <_sk_store_f32_avx+0x7f> + .byte 117,55 // jne d91f <_sk_store_f32_avx+0x7f> .byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 .byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 .byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -29770,22 +30142,22 @@ _sk_store_f32_avx: .byte 255,224 // jmpq *%rax .byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je d5e7 <_sk_store_f32_avx+0x7b> + .byte 116,240 // je d91b <_sk_store_f32_avx+0x7b> .byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb d5e7 <_sk_store_f32_avx+0x7b> + .byte 114,227 // jb d91b <_sk_store_f32_avx+0x7b> .byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4) - .byte 116,218 // je d5e7 <_sk_store_f32_avx+0x7b> + .byte 116,218 // je d91b <_sk_store_f32_avx+0x7b> .byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb d5e7 <_sk_store_f32_avx+0x7b> + .byte 114,205 // jb d91b <_sk_store_f32_avx+0x7b> .byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - .byte 116,195 // je d5e7 <_sk_store_f32_avx+0x7b> + .byte 116,195 // je d91b <_sk_store_f32_avx+0x7b> .byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,181 // jb d5e7 <_sk_store_f32_avx+0x7b> + .byte 114,181 // jb d91b <_sk_store_f32_avx+0x7b> .byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - .byte 235,171 // jmp d5e7 <_sk_store_f32_avx+0x7b> + .byte 235,171 // jmp d91b <_sk_store_f32_avx+0x7b> HIDDEN _sk_clamp_x_avx .globl _sk_clamp_x_avx @@ -29878,7 +30250,7 @@ _sk_mirror_x_avx: .byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0 .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8 - .byte 197,178,89,5,143,214,1,0 // vmulss 0x1d68f(%rip),%xmm9,%xmm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 197,178,89,5,79,217,1,0 // vmulss 0x1d94f(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0 @@ -29912,7 +30284,7 @@ _sk_mirror_y_avx: .byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1 .byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1 .byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8 - .byte 197,178,89,13,2,214,1,0 // vmulss 0x1d602(%rip),%xmm9,%xmm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 197,178,89,13,194,216,1,0 // vmulss 0x1d8c2(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1 .byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 .byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1 @@ -29939,7 +30311,7 @@ FUNCTION(_sk_clamp_x_1_avx) _sk_clamp_x_1_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,156,213,1,0 // vbroadcastss 0x1d59c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,92,216,1,0 // vbroadcastss 0x1d85c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -29957,9 +30329,9 @@ HIDDEN _sk_mirror_x_1_avx .globl _sk_mirror_x_1_avx FUNCTION(_sk_mirror_x_1_avx) _sk_mirror_x_1_avx: - .byte 196,98,125,24,5,147,213,1,0 // vbroadcastss 0x1d593(%rip),%ymm8 # 2ae1c <_sk_overlay_sse2_8bit+0x45b> + .byte 196,98,125,24,5,83,216,1,0 // vbroadcastss 0x1d853(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,105,213,1,0 // vbroadcastss 0x1d569(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,13,41,216,1,0 // vbroadcastss 0x1d829(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -29975,12 +30347,12 @@ HIDDEN _sk_luminance_to_alpha_avx .globl _sk_luminance_to_alpha_avx FUNCTION(_sk_luminance_to_alpha_avx) _sk_luminance_to_alpha_avx: - .byte 196,226,125,24,29,85,214,1,0 // vbroadcastss 0x1d655(%rip),%ymm3 # 2af20 <_sk_overlay_sse2_8bit+0x55f> + .byte 196,226,125,24,29,21,217,1,0 // vbroadcastss 0x1d915(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f> .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,29,76,214,1,0 // vbroadcastss 0x1d64c(%rip),%ymm3 # 2af24 <_sk_overlay_sse2_8bit+0x563> + .byte 196,226,125,24,29,12,217,1,0 // vbroadcastss 0x1d90c(%rip),%ymm3 # 2b518 <_sk_overlay_sse2_8bit+0x563> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,63,214,1,0 // vbroadcastss 0x1d63f(%rip),%ymm1 # 2af28 <_sk_overlay_sse2_8bit+0x567> + .byte 196,226,125,24,13,255,216,1,0 // vbroadcastss 0x1d8ff(%rip),%ymm1 # 2b51c <_sk_overlay_sse2_8bit+0x567> .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1 .byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -30228,9 +30600,9 @@ _sk_evenly_spaced_gradient_avx: .byte 72,139,24 // mov (%rax),%rbx .byte 72,139,104,8 // mov 0x8(%rax),%rbp .byte 72,255,203 // dec %rbx - .byte 120,7 // js dc8d <_sk_evenly_spaced_gradient_avx+0x25> + .byte 120,7 // js dfc1 <_sk_evenly_spaced_gradient_avx+0x25> .byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1 - .byte 235,21 // jmp dca2 <_sk_evenly_spaced_gradient_avx+0x3a> + .byte 235,21 // jmp dfd6 <_sk_evenly_spaced_gradient_avx+0x3a> .byte 73,137,217 // mov %rbx,%r9 .byte 73,209,233 // shr %r9 .byte 131,227,1 // and $0x1,%ebx @@ -30388,18 +30760,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx .globl _sk_gauss_a_to_rgba_avx FUNCTION(_sk_gauss_a_to_rgba_avx) _sk_gauss_a_to_rgba_avx: - .byte 196,226,125,24,5,42,207,1,0 // vbroadcastss 0x1cf2a(%rip),%ymm0 # 2af30 <_sk_overlay_sse2_8bit+0x56f> + .byte 196,226,125,24,5,234,209,1,0 // vbroadcastss 0x1d1ea(%rip),%ymm0 # 2b524 <_sk_overlay_sse2_8bit+0x56f> .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0 - .byte 196,226,125,24,13,25,207,1,0 // vbroadcastss 0x1cf19(%rip),%ymm1 # 2af2c <_sk_overlay_sse2_8bit+0x56b> + .byte 196,226,125,24,13,217,209,1,0 // vbroadcastss 0x1d1d9(%rip),%ymm1 # 2b520 <_sk_overlay_sse2_8bit+0x56b> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,16,207,1,0 // vbroadcastss 0x1cf10(%rip),%ymm1 # 2af34 <_sk_overlay_sse2_8bit+0x573> + .byte 196,226,125,24,13,208,209,1,0 // vbroadcastss 0x1d1d0(%rip),%ymm1 # 2b528 <_sk_overlay_sse2_8bit+0x573> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,3,207,1,0 // vbroadcastss 0x1cf03(%rip),%ymm1 # 2af38 <_sk_overlay_sse2_8bit+0x577> + .byte 196,226,125,24,13,195,209,1,0 // vbroadcastss 0x1d1c3(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,246,206,1,0 // vbroadcastss 0x1cef6(%rip),%ymm1 # 2af3c <_sk_overlay_sse2_8bit+0x57b> + .byte 196,226,125,24,13,182,209,1,0 // vbroadcastss 0x1d1b6(%rip),%ymm1 # 2b530 <_sk_overlay_sse2_8bit+0x57b> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -30422,12 +30794,12 @@ _sk_gradient_avx: .byte 76,139,8 // mov (%rax),%r9 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 73,131,249,2 // cmp $0x2,%r9 - .byte 114,80 // jb e0c9 <_sk_gradient_avx+0x6f> + .byte 114,80 // jb e3fd <_sk_gradient_avx+0x6f> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 - .byte 196,98,125,24,21,118,205,1,0 // vbroadcastss 0x1cd76(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,98,125,24,21,54,208,1,0 // vbroadcastss 0x1d036(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8 .byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8 @@ -30439,7 +30811,7 @@ _sk_gradient_avx: .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,201 // dec %r9 - .byte 117,205 // jne e096 <_sk_gradient_avx+0x3c> + .byte 117,205 // jne e3ca <_sk_gradient_avx+0x3c> .byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9 .byte 69,137,202 // mov %r9d,%r10d .byte 73,193,233,32 // shr $0x20,%r9 @@ -30622,27 +30994,27 @@ _sk_xy_to_unit_angle_avx: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,160,202,1,0 // vbroadcastss 0x1caa0(%rip),%ymm13 # 2af40 <_sk_overlay_sse2_8bit+0x57f> + .byte 196,98,125,24,45,96,205,1,0 // vbroadcastss 0x1cd60(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f> .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,150,202,1,0 // vbroadcastss 0x1ca96(%rip),%ymm14 # 2af44 <_sk_overlay_sse2_8bit+0x583> + .byte 196,98,125,24,53,86,205,1,0 // vbroadcastss 0x1cd56(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,135,202,1,0 // vbroadcastss 0x1ca87(%rip),%ymm14 # 2af48 <_sk_overlay_sse2_8bit+0x587> + .byte 196,98,125,24,53,71,205,1,0 // vbroadcastss 0x1cd47(%rip),%ymm14 # 2b53c <_sk_overlay_sse2_8bit+0x587> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12 - .byte 196,98,125,24,45,120,202,1,0 // vbroadcastss 0x1ca78(%rip),%ymm13 # 2af4c <_sk_overlay_sse2_8bit+0x58b> + .byte 196,98,125,24,45,56,205,1,0 // vbroadcastss 0x1cd38(%rip),%ymm13 # 2b540 <_sk_overlay_sse2_8bit+0x58b> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,99,202,1,0 // vbroadcastss 0x1ca63(%rip),%ymm10 # 2af50 <_sk_overlay_sse2_8bit+0x58f> + .byte 196,98,125,24,21,35,205,1,0 // vbroadcastss 0x1cd23(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,249,200,1,0 // vbroadcastss 0x1c8f9(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,21,185,203,1,0 // vbroadcastss 0x1cbb9(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,227,200,1,0 // vbroadcastss 0x1c8e3(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,21,163,203,1,0 // vbroadcastss 0x1cba3(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -30672,7 +31044,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx: .byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10 .byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 - .byte 196,98,125,24,29,217,201,1,0 // vbroadcastss 0x1c9d9(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593> + .byte 196,98,125,24,29,153,204,1,0 // vbroadcastss 0x1cc99(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0 .byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11 @@ -30681,17 +31053,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx: .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,13,173,201,1,0 // vbroadcastss 0x1c9ad(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597> + .byte 196,98,125,24,13,109,204,1,0 // vbroadcastss 0x1cc6d(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8 .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 .byte 197,252,81,192 // vsqrtps %ymm0,%ymm0 .byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8 - .byte 196,98,125,24,13,139,201,1,0 // vbroadcastss 0x1c98b(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,125,24,13,75,204,1,0 // vbroadcastss 0x1cc4b(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,28,200,1,0 // vbroadcastss 0x1c81c(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,29,220,202,1,0 // vbroadcastss 0x1cadc(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10 .byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0 @@ -30711,7 +31083,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx: .byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10 .byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 - .byte 196,98,125,24,29,43,201,1,0 // vbroadcastss 0x1c92b(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593> + .byte 196,98,125,24,29,235,203,1,0 // vbroadcastss 0x1cbeb(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0 .byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11 @@ -30720,17 +31092,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx: .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,13,255,200,1,0 // vbroadcastss 0x1c8ff(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597> + .byte 196,98,125,24,13,191,203,1,0 // vbroadcastss 0x1cbbf(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8 .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 .byte 197,252,81,192 // vsqrtps %ymm0,%ymm0 .byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8 - .byte 196,98,125,24,13,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,125,24,13,157,203,1,0 // vbroadcastss 0x1cb9d(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,110,199,1,0 // vbroadcastss 0x1c76e(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,29,46,202,1,0 // vbroadcastss 0x1ca2e(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10 .byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0 @@ -30749,7 +31121,7 @@ _sk_xy_to_2pt_conical_linear_avx: .byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9 .byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 .byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9 - .byte 196,98,125,24,21,131,200,1,0 // vbroadcastss 0x1c883(%rip),%ymm10 # 2af54 <_sk_overlay_sse2_8bit+0x593> + .byte 196,98,125,24,21,67,203,1,0 // vbroadcastss 0x1cb43(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 .byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0 .byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10 @@ -30758,7 +31130,7 @@ _sk_xy_to_2pt_conical_linear_avx: .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0 - .byte 196,98,125,24,5,91,200,1,0 // vbroadcastss 0x1c85b(%rip),%ymm8 # 2af5c <_sk_overlay_sse2_8bit+0x59b> + .byte 196,98,125,24,5,27,203,1,0 // vbroadcastss 0x1cb1b(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b> .byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0 .byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -30799,7 +31171,7 @@ HIDDEN _sk_save_xy_avx FUNCTION(_sk_save_xy_avx) _sk_save_xy_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,151,198,1,0 // vbroadcastss 0x1c697(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,87,201,1,0 // vbroadcastss 0x1c957(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -30836,9 +31208,9 @@ HIDDEN _sk_bilinear_nx_avx FUNCTION(_sk_bilinear_nx_avx) _sk_bilinear_nx_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,127,199,1,0 // vbroadcastss 0x1c77f(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,5,63,202,1,0 // vbroadcastss 0x1ca3f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,22,198,1,0 // vbroadcastss 0x1c616(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,214,200,1,0 // vbroadcastss 0x1c8d6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -30849,7 +31221,7 @@ HIDDEN _sk_bilinear_px_avx FUNCTION(_sk_bilinear_px_avx) _sk_bilinear_px_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,246,197,1,0 // vbroadcastss 0x1c5f6(%rip),%ymm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,5,182,200,1,0 // vbroadcastss 0x1c8b6(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -30861,9 +31233,9 @@ HIDDEN _sk_bilinear_ny_avx FUNCTION(_sk_bilinear_ny_avx) _sk_bilinear_ny_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,54,199,1,0 // vbroadcastss 0x1c736(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,13,246,201,1,0 // vbroadcastss 0x1c9f6(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,204,197,1,0 // vbroadcastss 0x1c5cc(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,140,200,1,0 // vbroadcastss 0x1c88c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -30874,7 +31246,7 @@ HIDDEN _sk_bilinear_py_avx FUNCTION(_sk_bilinear_py_avx) _sk_bilinear_py_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,172,197,1,0 // vbroadcastss 0x1c5ac(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,226,125,24,13,108,200,1,0 // vbroadcastss 0x1c86c(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -30886,14 +31258,14 @@ HIDDEN _sk_bicubic_n3x_avx FUNCTION(_sk_bicubic_n3x_avx) _sk_bicubic_n3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,239,198,1,0 // vbroadcastss 0x1c6ef(%rip),%ymm0 # 2af64 <_sk_overlay_sse2_8bit+0x5a3> + .byte 196,226,125,24,5,175,201,1,0 // vbroadcastss 0x1c9af(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,130,197,1,0 // vbroadcastss 0x1c582(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,66,200,1,0 // vbroadcastss 0x1c842(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,211,198,1,0 // vbroadcastss 0x1c6d3(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,147,201,1,0 // vbroadcastss 0x1c993(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,209,197,1,0 // vbroadcastss 0x1c5d1(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,21,145,200,1,0 // vbroadcastss 0x1c891(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -30905,19 +31277,19 @@ HIDDEN _sk_bicubic_n1x_avx FUNCTION(_sk_bicubic_n1x_avx) _sk_bicubic_n1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,156,198,1,0 // vbroadcastss 0x1c69c(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,5,92,201,1,0 // vbroadcastss 0x1c95c(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,51,197,1,0 // vbroadcastss 0x1c533(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,243,199,1,0 // vbroadcastss 0x1c7f3(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,145,198,1,0 // vbroadcastss 0x1c691(%rip),%ymm9 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,13,81,201,1,0 // vbroadcastss 0x1c951(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,127,198,1,0 // vbroadcastss 0x1c67f(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,21,63,201,1,0 // vbroadcastss 0x1c93f(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,0,197,1,0 // vbroadcastss 0x1c500(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,21,192,199,1,0 // vbroadcastss 0x1c7c0(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,97,198,1,0 // vbroadcastss 0x1c661(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,13,33,201,1,0 // vbroadcastss 0x1c921(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -30928,17 +31300,17 @@ HIDDEN _sk_bicubic_p1x_avx FUNCTION(_sk_bicubic_p1x_avx) _sk_bicubic_p1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,209,196,1,0 // vbroadcastss 0x1c4d1(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,145,199,1,0 // vbroadcastss 0x1c791(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,47,198,1,0 // vbroadcastss 0x1c62f(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,21,239,200,1,0 // vbroadcastss 0x1c8ef(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,29,198,1,0 // vbroadcastss 0x1c61d(%rip),%ymm11 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,29,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,8,198,1,0 // vbroadcastss 0x1c608(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,13,200,200,1,0 // vbroadcastss 0x1c8c8(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -30949,13 +31321,13 @@ HIDDEN _sk_bicubic_p3x_avx FUNCTION(_sk_bicubic_p3x_avx) _sk_bicubic_p3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,228,197,1,0 // vbroadcastss 0x1c5e4(%rip),%ymm0 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,226,125,24,5,164,200,1,0 // vbroadcastss 0x1c8a4(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,201,197,1,0 // vbroadcastss 0x1c5c9(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,137,200,1,0 // vbroadcastss 0x1c889(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,199,196,1,0 // vbroadcastss 0x1c4c7(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,21,135,199,1,0 // vbroadcastss 0x1c787(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -30967,14 +31339,14 @@ HIDDEN _sk_bicubic_n3y_avx FUNCTION(_sk_bicubic_n3y_avx) _sk_bicubic_n3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,150,197,1,0 // vbroadcastss 0x1c596(%rip),%ymm1 # 2af64 <_sk_overlay_sse2_8bit+0x5a3> + .byte 196,226,125,24,13,86,200,1,0 // vbroadcastss 0x1c856(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,40,196,1,0 // vbroadcastss 0x1c428(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,232,198,1,0 // vbroadcastss 0x1c6e8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,121,197,1,0 // vbroadcastss 0x1c579(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,57,200,1,0 // vbroadcastss 0x1c839(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,119,196,1,0 // vbroadcastss 0x1c477(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,21,55,199,1,0 // vbroadcastss 0x1c737(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -30986,19 +31358,19 @@ HIDDEN _sk_bicubic_n1y_avx FUNCTION(_sk_bicubic_n1y_avx) _sk_bicubic_n1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,66,197,1,0 // vbroadcastss 0x1c542(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f> + .byte 196,226,125,24,13,2,200,1,0 // vbroadcastss 0x1c802(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,216,195,1,0 // vbroadcastss 0x1c3d8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,98,125,24,5,152,198,1,0 // vbroadcastss 0x1c698(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,54,197,1,0 // vbroadcastss 0x1c536(%rip),%ymm9 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,13,246,199,1,0 // vbroadcastss 0x1c7f6(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,36,197,1,0 // vbroadcastss 0x1c524(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,21,228,199,1,0 // vbroadcastss 0x1c7e4(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,165,195,1,0 // vbroadcastss 0x1c3a5(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,21,101,198,1,0 // vbroadcastss 0x1c665(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,6,197,1,0 // vbroadcastss 0x1c506(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,13,198,199,1,0 // vbroadcastss 0x1c7c6(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -31009,17 +31381,17 @@ HIDDEN _sk_bicubic_p1y_avx FUNCTION(_sk_bicubic_p1y_avx) _sk_bicubic_p1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,118,195,1,0 // vbroadcastss 0x1c376(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 196,98,125,24,5,54,198,1,0 // vbroadcastss 0x1c636(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,211,196,1,0 // vbroadcastss 0x1c4d3(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af> + .byte 196,98,125,24,21,147,199,1,0 // vbroadcastss 0x1c793(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,193,196,1,0 // vbroadcastss 0x1c4c1(%rip),%ymm11 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,98,125,24,29,129,199,1,0 // vbroadcastss 0x1c781(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,172,196,1,0 // vbroadcastss 0x1c4ac(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3> + .byte 196,98,125,24,13,108,199,1,0 // vbroadcastss 0x1c76c(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -31030,13 +31402,13 @@ HIDDEN _sk_bicubic_p3y_avx FUNCTION(_sk_bicubic_p3y_avx) _sk_bicubic_p3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,136,196,1,0 // vbroadcastss 0x1c488(%rip),%ymm1 # 2af6c <_sk_overlay_sse2_8bit+0x5ab> + .byte 196,226,125,24,13,72,199,1,0 // vbroadcastss 0x1c748(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,108,196,1,0 // vbroadcastss 0x1c46c(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7> + .byte 196,98,125,24,21,44,199,1,0 // vbroadcastss 0x1c72c(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,106,195,1,0 // vbroadcastss 0x1c36a(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3> + .byte 196,98,125,24,21,42,198,1,0 // vbroadcastss 0x1c62a(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -31182,7 +31554,7 @@ _sk_clut_3D_avx: .byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp) .byte 72,139,0 // mov (%rax),%rax .byte 196,193,121,254,194 // vpaddd %xmm10,%xmm0,%xmm0 - .byte 196,98,121,24,29,2,194,1,0 // vbroadcastss 0x1c202(%rip),%xmm11 # 2af7c <_sk_overlay_sse2_8bit+0x5bb> + .byte 196,98,121,24,29,194,196,1,0 // vbroadcastss 0x1c4c2(%rip),%xmm11 # 2b570 <_sk_overlay_sse2_8bit+0x5bb> .byte 196,194,121,64,203 // vpmulld %xmm11,%xmm0,%xmm1 .byte 196,193,249,126,201 // vmovq %xmm1,%r9 .byte 69,137,202 // mov %r9d,%r10d @@ -31216,7 +31588,7 @@ _sk_clut_3D_avx: .byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7 .byte 196,227,93,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm3 .byte 197,252,17,92,36,64 // vmovups %ymm3,0x40(%rsp) - .byte 196,98,121,24,13,205,191,1,0 // vbroadcastss 0x1bfcd(%rip),%xmm9 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,98,121,24,13,141,194,1,0 // vbroadcastss 0x1c28d(%rip),%xmm9 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 196,193,105,254,249 // vpaddd %xmm9,%xmm2,%xmm7 .byte 196,195,249,22,249,1 // vpextrq $0x1,%xmm7,%r9 .byte 196,193,249,126,250 // vmovq %xmm7,%r10 @@ -31244,7 +31616,7 @@ _sk_clut_3D_avx: .byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7 .byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5 .byte 196,99,85,24,254,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm15 - .byte 196,98,121,24,37,64,191,1,0 // vbroadcastss 0x1bf40(%rip),%xmm12 # 2ae10 <_sk_overlay_sse2_8bit+0x44f> + .byte 196,98,121,24,37,0,194,1,0 // vbroadcastss 0x1c200(%rip),%xmm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f> .byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2 .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9 .byte 196,193,249,126,210 // vmovq %xmm2,%r10 @@ -31272,7 +31644,7 @@ _sk_clut_3D_avx: .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5 .byte 196,227,105,33,213,48 // vinsertps $0x30,%xmm5,%xmm2,%xmm2 .byte 196,227,109,24,225,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm4 - .byte 196,226,125,24,13,20,192,1,0 // vbroadcastss 0x1c014(%rip),%ymm1 # 2af78 <_sk_overlay_sse2_8bit+0x5b7> + .byte 196,226,125,24,13,212,194,1,0 // vbroadcastss 0x1c2d4(%rip),%ymm1 # 2b56c <_sk_overlay_sse2_8bit+0x5b7> .byte 197,188,88,209 // vaddps %ymm1,%ymm8,%ymm2 .byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp) .byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2 @@ -32027,7 +32399,7 @@ _sk_clut_4D_avx: .byte 196,226,25,64,200 // vpmulld %xmm0,%xmm12,%xmm1 .byte 197,249,127,76,36,128 // vmovdqa %xmm1,-0x80(%rsp) .byte 197,241,254,202 // vpaddd %xmm2,%xmm1,%xmm1 - .byte 196,98,121,24,61,194,176,1,0 // vbroadcastss 0x1b0c2(%rip),%xmm15 # 2af7c <_sk_overlay_sse2_8bit+0x5bb> + .byte 196,98,121,24,61,130,179,1,0 // vbroadcastss 0x1b382(%rip),%xmm15 # 2b570 <_sk_overlay_sse2_8bit+0x5bb> .byte 196,194,113,64,247 // vpmulld %xmm15,%xmm1,%xmm6 .byte 196,193,249,126,241 // vmovq %xmm6,%r9 .byte 69,137,202 // mov %r9d,%r10d @@ -32065,7 +32437,7 @@ _sk_clut_4D_avx: .byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7 .byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7 .byte 196,99,53,24,247,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm14 - .byte 196,98,121,24,21,117,174,1,0 // vbroadcastss 0x1ae75(%rip),%xmm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447> + .byte 196,98,121,24,21,53,177,1,0 // vbroadcastss 0x1b135(%rip),%xmm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447> .byte 196,65,97,254,202 // vpaddd %xmm10,%xmm3,%xmm9 .byte 196,67,249,22,201,1 // vpextrq $0x1,%xmm9,%r9 .byte 196,65,249,126,202 // vmovq %xmm9,%r10 @@ -32093,7 +32465,7 @@ _sk_clut_4D_avx: .byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7 .byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5 .byte 196,99,85,24,220,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm11 - .byte 196,98,121,24,13,232,173,1,0 // vbroadcastss 0x1ade8(%rip),%xmm9 # 2ae10 <_sk_overlay_sse2_8bit+0x44f> + .byte 196,98,121,24,13,168,176,1,0 // vbroadcastss 0x1b0a8(%rip),%xmm9 # 2b404 <_sk_overlay_sse2_8bit+0x44f> .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3 .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9 .byte 196,193,249,126,218 // vmovq %xmm3,%r10 @@ -32121,7 +32493,7 @@ _sk_clut_4D_avx: .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5 .byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4 .byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6 - .byte 196,226,125,24,37,188,174,1,0 // vbroadcastss 0x1aebc(%rip),%ymm4 # 2af78 <_sk_overlay_sse2_8bit+0x5b7> + .byte 196,226,125,24,37,124,177,1,0 // vbroadcastss 0x1b17c(%rip),%ymm4 # 2b56c <_sk_overlay_sse2_8bit+0x5b7> .byte 197,148,88,220 // vaddps %ymm4,%ymm13,%ymm3 .byte 197,252,40,252 // vmovaps %ymm4,%ymm7 .byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp) @@ -33551,7 +33923,7 @@ _sk_clut_4D_avx: .byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2 .byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,204,143,1,0 // vbroadcastss 0x18fcc(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443> + .byte 196,226,125,24,29,140,146,1,0 // vbroadcastss 0x1928c(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443> .byte 197,252,16,164,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm4 .byte 197,252,16,172,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm5 .byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6 @@ -33582,7 +33954,7 @@ _sk_start_pipeline_sse41: .byte 72,137,194 // mov %rax,%rdx .byte 72,137,77,176 // mov %rcx,-0x50(%rbp) .byte 73,57,206 // cmp %rcx,%r14 - .byte 115,117 // jae 11f0b <_sk_start_pipeline_sse41+0xa1> + .byte 115,117 // jae 1223f <_sk_start_pipeline_sse41+0xa1> .byte 72,139,69,208 // mov -0x30(%rbp),%rax .byte 72,141,64,4 // lea 0x4(%rax),%rax .byte 72,137,69,184 // mov %rax,-0x48(%rbp) @@ -33592,7 +33964,7 @@ _sk_start_pipeline_sse41: .byte 73,137,244 // mov %rsi,%r12 .byte 72,57,93,184 // cmp %rbx,-0x48(%rbp) .byte 72,139,85,208 // mov -0x30(%rbp),%rdx - .byte 119,45 // ja 11ee7 <_sk_start_pipeline_sse41+0x7d> + .byte 119,45 // ja 1221b <_sk_start_pipeline_sse41+0x7d> .byte 76,139,125,208 // mov -0x30(%rbp),%r15 .byte 69,49,192 // xor %r8d,%r8d .byte 76,137,207 // mov %r9,%rdi @@ -33606,10 +33978,10 @@ _sk_start_pipeline_sse41: .byte 73,131,199,8 // add $0x8,%r15 .byte 73,57,223 // cmp %rbx,%r15 .byte 73,137,215 // mov %rdx,%r15 - .byte 118,215 // jbe 11ebe <_sk_start_pipeline_sse41+0x54> + .byte 118,215 // jbe 121f2 <_sk_start_pipeline_sse41+0x54> .byte 73,137,216 // mov %rbx,%r8 .byte 73,41,208 // sub %rdx,%r8 - .byte 116,19 // je 11f02 <_sk_start_pipeline_sse41+0x98> + .byte 116,19 // je 12236 <_sk_start_pipeline_sse41+0x98> .byte 76,137,207 // mov %r9,%rdi .byte 76,137,230 // mov %r12,%rsi .byte 76,137,241 // mov %r14,%rcx @@ -33618,7 +33990,7 @@ _sk_start_pipeline_sse41: .byte 76,139,77,192 // mov -0x40(%rbp),%r9 .byte 73,255,198 // inc %r14 .byte 76,59,117,176 // cmp -0x50(%rbp),%r14 - .byte 117,165 // jne 11eb0 <_sk_start_pipeline_sse41+0x46> + .byte 117,165 // jne 121e4 <_sk_start_pipeline_sse41+0x46> .byte 72,131,196,40 // add $0x28,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -33641,7 +34013,7 @@ _sk_seed_shader_sse41: .byte 102,15,110,194 // movd %edx,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,146,152,1,0 // movaps 0x19892(%rip),%xmm2 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,40,21,94,155,1,0 // movaps 0x19b5e(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,7 // movups (%rdi),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -33650,7 +34022,7 @@ _sk_seed_shader_sse41: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,129,152,1,0 // movaps 0x19881(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,77,155,1,0 // movaps 0x19b4d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -33670,14 +34042,14 @@ _sk_dither_sse41: .byte 102,68,15,110,193 // movd %ecx,%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,79,152,1,0 // movdqa 0x1984f(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,21,27,155,1,0 // movdqa 0x19b1b(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,59,152,1,0 // movdqa 0x1983b(%rip),%xmm12 # 2b7f0 <_sk_overlay_sse2_8bit+0xe2f> - .byte 102,68,15,111,45,66,152,1,0 // movdqa 0x19842(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,37,7,155,1,0 // movdqa 0x19b07(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b> + .byte 102,68,15,111,45,14,155,1,0 // movdqa 0x19b0e(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -33693,8 +34065,8 @@ _sk_dither_sse41: .byte 102,69,15,235,245 // por %xmm13,%xmm14 .byte 102,69,15,235,240 // por %xmm8,%xmm14 .byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8 - .byte 68,15,89,5,253,151,1,0 // mulps 0x197fd(%rip),%xmm8 # 2b810 <_sk_overlay_sse2_8bit+0xe4f> - .byte 68,15,88,5,5,152,1,0 // addps 0x19805(%rip),%xmm8 # 2b820 <_sk_overlay_sse2_8bit+0xe5f> + .byte 68,15,89,5,201,154,1,0 // mulps 0x19ac9(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b> + .byte 68,15,88,5,209,154,1,0 // addps 0x19ad1(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b> .byte 243,68,15,16,16 // movss (%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -33736,7 +34108,7 @@ HIDDEN _sk_black_color_sse41 FUNCTION(_sk_black_color_sse41) _sk_black_color_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,59,151,1,0 // movaps 0x1973b(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,7,154,1,0 // movaps 0x19a07(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,87,201 // xorps %xmm1,%xmm1 .byte 15,87,210 // xorps %xmm2,%xmm2 @@ -33747,7 +34119,7 @@ HIDDEN _sk_white_color_sse41 FUNCTION(_sk_white_color_sse41) _sk_white_color_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,5,39,151,1,0 // movaps 0x19727(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,5,243,153,1,0 // movaps 0x199f3(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,40,216 // movaps %xmm0,%xmm3 @@ -33793,7 +34165,7 @@ HIDDEN _sk_srcatop_sse41 FUNCTION(_sk_srcatop_sse41) _sk_srcatop_sse41: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,215,150,1,0 // movaps 0x196d7(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,163,153,1,0 // movaps 0x199a3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -33818,7 +34190,7 @@ FUNCTION(_sk_dstatop_sse41) _sk_dstatop_sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,138,150,1,0 // movaps 0x1968a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,86,153,1,0 // movaps 0x19956(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -33865,7 +34237,7 @@ HIDDEN _sk_srcout_sse41 .globl _sk_srcout_sse41 FUNCTION(_sk_srcout_sse41) _sk_srcout_sse41: - .byte 68,15,40,5,30,150,1,0 // movaps 0x1961e(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,234,152,1,0 // movaps 0x198ea(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -33878,7 +34250,7 @@ HIDDEN _sk_dstout_sse41 .globl _sk_dstout_sse41 FUNCTION(_sk_dstout_sse41) _sk_dstout_sse41: - .byte 68,15,40,5,254,149,1,0 // movaps 0x195fe(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,202,152,1,0 // movaps 0x198ca(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -33895,7 +34267,7 @@ HIDDEN _sk_srcover_sse41 .globl _sk_srcover_sse41 FUNCTION(_sk_srcover_sse41) _sk_srcover_sse41: - .byte 68,15,40,5,209,149,1,0 // movaps 0x195d1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,157,152,1,0 // movaps 0x1989d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -33915,7 +34287,7 @@ HIDDEN _sk_dstover_sse41 .globl _sk_dstover_sse41 FUNCTION(_sk_dstover_sse41) _sk_dstover_sse41: - .byte 68,15,40,5,149,149,1,0 // movaps 0x19595(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,97,152,1,0 // movaps 0x19861(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -33943,7 +34315,7 @@ HIDDEN _sk_multiply_sse41 .globl _sk_multiply_sse41 FUNCTION(_sk_multiply_sse41) _sk_multiply_sse41: - .byte 68,15,40,5,89,149,1,0 // movaps 0x19559(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,37,152,1,0 // movaps 0x19825(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -33981,9 +34353,14 @@ HIDDEN _sk_plus__sse41 FUNCTION(_sk_plus__sse41) _sk_plus__sse41: .byte 15,88,196 // addps %xmm4,%xmm0 + .byte 68,15,40,5,166,151,1,0 // movaps 0x197a6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> + .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 15,88,205 // addps %xmm5,%xmm1 + .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 15,88,214 // addps %xmm6,%xmm2 + .byte 65,15,93,208 // minps %xmm8,%xmm2 .byte 15,88,223 // addps %xmm7,%xmm3 + .byte 65,15,93,216 // minps %xmm8,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -34018,7 +34395,7 @@ HIDDEN _sk_xor__sse41 FUNCTION(_sk_xor__sse41) _sk_xor__sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,126,148,1,0 // movaps 0x1947e(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,50,151,1,0 // movaps 0x19732(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -34066,7 +34443,7 @@ _sk_darken_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,217,147,1,0 // movaps 0x193d9(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,141,150,1,0 // movaps 0x1968d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34100,7 +34477,7 @@ _sk_lighten_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,110,147,1,0 // movaps 0x1936e(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,34,150,1,0 // movaps 0x19622(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34137,7 +34514,7 @@ _sk_difference_sse41: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,248,146,1,0 // movaps 0x192f8(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,172,149,1,0 // movaps 0x195ac(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34165,7 +34542,7 @@ _sk_exclusion_sse41: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,168,146,1,0 // movaps 0x192a8(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,92,149,1,0 // movaps 0x1955c(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34177,7 +34554,7 @@ HIDDEN _sk_colorburn_sse41 .globl _sk_colorburn_sse41 FUNCTION(_sk_colorburn_sse41) _sk_colorburn_sse41: - .byte 68,15,40,29,143,146,1,0 // movaps 0x1928f(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,29,67,149,1,0 // movaps 0x19543(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,227 // movaps %xmm11,%xmm12 .byte 68,15,92,231 // subps %xmm7,%xmm12 .byte 69,15,40,204 // movaps %xmm12,%xmm9 @@ -34261,7 +34638,7 @@ HIDDEN _sk_colordodge_sse41 FUNCTION(_sk_colordodge_sse41) _sk_colordodge_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,89,145,1,0 // movaps 0x19159(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,13,148,1,0 // movaps 0x1940d(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -34343,7 +34720,7 @@ _sk_hardlight_sse41: .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,36,144,1,0 // movaps 0x19024(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,216,146,1,0 // movaps 0x192d8(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,40,234 // movaps %xmm10,%xmm5 .byte 15,92,239 // subps %xmm7,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 @@ -34426,7 +34803,7 @@ FUNCTION(_sk_overlay_sse41) _sk_overlay_sse41: .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,40,240 // movaps %xmm0,%xmm14 - .byte 68,15,40,21,249,142,1,0 // movaps 0x18ef9(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,173,145,1,0 // movaps 0x191ad(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 65,15,40,195 // movaps %xmm11,%xmm0 @@ -34511,7 +34888,7 @@ _sk_softlight_sse41: .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 65,15,84,193 // andps %xmm9,%xmm0 - .byte 15,40,13,192,141,1,0 // movaps 0x18dc0(%rip),%xmm1 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,13,116,144,1,0 // movaps 0x19074(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 68,15,40,240 // movaps %xmm0,%xmm14 @@ -34524,10 +34901,10 @@ _sk_softlight_sse41: .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,89,210 // mulps %xmm2,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,40,45,238,141,1,0 // movaps 0x18dee(%rip),%xmm13 # 2b830 <_sk_overlay_sse2_8bit+0xe6f> + .byte 68,15,40,45,162,144,1,0 // movaps 0x190a2(%rip),%xmm13 # 2be30 <_sk_overlay_sse2_8bit+0xe7b> .byte 69,15,88,245 // addps %xmm13,%xmm14 .byte 68,15,89,242 // mulps %xmm2,%xmm14 - .byte 68,15,40,37,238,141,1,0 // movaps 0x18dee(%rip),%xmm12 # 2b840 <_sk_overlay_sse2_8bit+0xe7f> + .byte 68,15,40,37,162,144,1,0 // movaps 0x190a2(%rip),%xmm12 # 2be40 <_sk_overlay_sse2_8bit+0xe8b> .byte 69,15,89,252 // mulps %xmm12,%xmm15 .byte 69,15,88,254 // addps %xmm14,%xmm15 .byte 15,40,198 // movaps %xmm6,%xmm0 @@ -34713,12 +35090,12 @@ _sk_hue_sse41: .byte 68,15,84,208 // andps %xmm0,%xmm10 .byte 15,84,200 // andps %xmm0,%xmm1 .byte 68,15,84,232 // andps %xmm0,%xmm13 - .byte 15,40,5,89,139,1,0 // movaps 0x18b59(%rip),%xmm0 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 15,40,5,13,142,1,0 // movaps 0x18e0d(%rip),%xmm0 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 68,15,89,224 // mulps %xmm0,%xmm12 - .byte 15,40,21,94,139,1,0 // movaps 0x18b5e(%rip),%xmm2 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 15,40,21,18,142,1,0 // movaps 0x18e12(%rip),%xmm2 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 15,89,250 // mulps %xmm2,%xmm7 .byte 65,15,88,252 // addps %xmm12,%xmm7 - .byte 68,15,40,53,95,139,1,0 // movaps 0x18b5f(%rip),%xmm14 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> + .byte 68,15,40,53,19,142,1,0 // movaps 0x18e13(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb> .byte 68,15,40,252 // movaps %xmm4,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,255 // addps %xmm7,%xmm15 @@ -34801,7 +35178,7 @@ _sk_hue_sse41: .byte 65,15,88,214 // addps %xmm14,%xmm2 .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,40,13,115,137,1,0 // movaps 0x18973(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,39,140,1,0 // movaps 0x18c27(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,40,225 // movaps %xmm9,%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0 @@ -34895,14 +35272,14 @@ _sk_saturation_sse41: .byte 68,15,84,215 // andps %xmm7,%xmm10 .byte 68,15,84,223 // andps %xmm7,%xmm11 .byte 68,15,84,199 // andps %xmm7,%xmm8 - .byte 15,40,21,157,136,1,0 // movaps 0x1889d(%rip),%xmm2 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 15,40,21,81,139,1,0 // movaps 0x18b51(%rip),%xmm2 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,218 // mulps %xmm2,%xmm3 - .byte 15,40,13,160,136,1,0 // movaps 0x188a0(%rip),%xmm1 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 15,40,13,84,139,1,0 // movaps 0x18b54(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,249 // mulps %xmm1,%xmm7 .byte 15,88,251 // addps %xmm3,%xmm7 - .byte 68,15,40,45,159,136,1,0 // movaps 0x1889f(%rip),%xmm13 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> + .byte 68,15,40,45,83,139,1,0 // movaps 0x18b53(%rip),%xmm13 # 2be70 <_sk_overlay_sse2_8bit+0xebb> .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 68,15,88,247 // addps %xmm7,%xmm14 .byte 65,15,40,218 // movaps %xmm10,%xmm3 @@ -34983,7 +35360,7 @@ _sk_saturation_sse41: .byte 65,15,88,253 // addps %xmm13,%xmm7 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11 - .byte 68,15,40,13,181,134,1,0 // movaps 0x186b5(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,105,137,1,0 // movaps 0x18969(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 68,15,92,204 // subps %xmm4,%xmm9 .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7 @@ -35038,14 +35415,14 @@ _sk_color_sse41: .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 68,15,89,244 // mulps %xmm4,%xmm14 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 68,15,40,13,112,134,1,0 // movaps 0x18670(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,13,36,137,1,0 // movaps 0x18924(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 65,15,40,250 // movaps %xmm10,%xmm7 .byte 65,15,89,249 // mulps %xmm9,%xmm7 - .byte 68,15,40,21,112,134,1,0 // movaps 0x18670(%rip),%xmm10 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 68,15,40,21,36,137,1,0 // movaps 0x18924(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 65,15,40,219 // movaps %xmm11,%xmm3 .byte 65,15,89,218 // mulps %xmm10,%xmm3 .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 68,15,40,29,109,134,1,0 // movaps 0x1866d(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> + .byte 68,15,40,29,33,137,1,0 // movaps 0x18921(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb> .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 @@ -35130,7 +35507,7 @@ _sk_color_sse41: .byte 65,15,88,251 // addps %xmm11,%xmm7 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1 - .byte 68,15,40,13,121,132,1,0 // movaps 0x18479(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,45,135,1,0 // movaps 0x1872d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 .byte 68,15,89,192 // mulps %xmm0,%xmm8 @@ -35182,13 +35559,13 @@ _sk_luminosity_sse41: .byte 69,15,89,216 // mulps %xmm8,%xmm11 .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,89,205 // mulps %xmm5,%xmm9 - .byte 68,15,40,5,65,132,1,0 // movaps 0x18441(%rip),%xmm8 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,5,245,134,1,0 // movaps 0x186f5(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 - .byte 68,15,40,21,69,132,1,0 // movaps 0x18445(%rip),%xmm10 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 68,15,40,21,249,134,1,0 // movaps 0x186f9(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 65,15,89,234 // mulps %xmm10,%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 68,15,40,37,67,132,1,0 // movaps 0x18443(%rip),%xmm12 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> + .byte 68,15,40,37,247,134,1,0 // movaps 0x186f7(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb> .byte 68,15,40,242 // movaps %xmm2,%xmm14 .byte 69,15,89,244 // mulps %xmm12,%xmm14 .byte 68,15,88,245 // addps %xmm5,%xmm14 @@ -35273,7 +35650,7 @@ _sk_luminosity_sse41: .byte 65,15,88,244 // addps %xmm12,%xmm6 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9 - .byte 15,40,5,73,130,1,0 // movaps 0x18249(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,5,253,132,1,0 // movaps 0x184fd(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,92,215 // subps %xmm7,%xmm2 .byte 15,89,226 // mulps %xmm2,%xmm4 @@ -35318,23 +35695,23 @@ _sk_srcover_rgba_8888_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,219,0,0,0 // jne 136ef <_sk_srcover_rgba_8888_sse41+0xfb> + .byte 15,133,219,0,0,0 // jne 13a3b <_sk_srcover_rgba_8888_sse41+0xfb> .byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7 .byte 77,133,192 // test %r8,%r8 - .byte 102,15,111,37,91,130,1,0 // movdqa 0x1825b(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,37,15,133,1,0 // movdqa 0x1850f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 .byte 102,15,111,239 // movdqa %xmm7,%xmm5 - .byte 102,15,56,0,45,87,130,1,0 // pshufb 0x18257(%rip),%xmm5 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,45,11,133,1,0 // pshufb 0x1850b(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 .byte 102,15,111,247 // movdqa %xmm7,%xmm6 - .byte 102,15,56,0,53,87,130,1,0 // pshufb 0x18257(%rip),%xmm6 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,53,11,133,1,0 // pshufb 0x1850b(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 102,15,114,215,24 // psrld $0x18,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 68,15,40,5,116,129,1,0 // movaps 0x18174(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,40,132,1,0 // movaps 0x18428(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 - .byte 68,15,40,37,72,130,1,0 // movaps 0x18248(%rip),%xmm12 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,37,252,132,1,0 // movaps 0x184fc(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 65,15,89,196 // mulps %xmm12,%xmm0 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -35360,7 +35737,7 @@ _sk_srcover_rgba_8888_sse41: .byte 102,15,114,240,24 // pslld $0x18,%xmm0 .byte 102,15,235,194 // por %xmm2,%xmm0 .byte 102,15,235,193 // por %xmm1,%xmm0 - .byte 117,88 // jne 1372d <_sk_srcover_rgba_8888_sse41+0x139> + .byte 117,88 // jne 13a79 <_sk_srcover_rgba_8888_sse41+0x139> .byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -35371,32 +35748,32 @@ _sk_srcover_rgba_8888_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,91 // je 13757 <_sk_srcover_rgba_8888_sse41+0x163> + .byte 116,91 // je 13aa3 <_sk_srcover_rgba_8888_sse41+0x163> .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,22 // je 1371c <_sk_srcover_rgba_8888_sse41+0x128> + .byte 116,22 // je 13a68 <_sk_srcover_rgba_8888_sse41+0x128> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,10,255,255,255 // jne 1361a <_sk_srcover_rgba_8888_sse41+0x26> + .byte 15,133,10,255,255,255 // jne 13966 <_sk_srcover_rgba_8888_sse41+0x26> .byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4 .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7 .byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4 .byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7 - .byte 233,237,254,255,255 // jmpq 1361a <_sk_srcover_rgba_8888_sse41+0x26> + .byte 233,237,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26> .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,40 // je 13762 <_sk_srcover_rgba_8888_sse41+0x16e> + .byte 116,40 // je 13aae <_sk_srcover_rgba_8888_sse41+0x16e> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,15 // je 1374f <_sk_srcover_rgba_8888_sse41+0x15b> + .byte 116,15 // je 13a9b <_sk_srcover_rgba_8888_sse41+0x15b> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,149 // jne 136db <_sk_srcover_rgba_8888_sse41+0xe7> + .byte 117,149 // jne 13a27 <_sk_srcover_rgba_8888_sse41+0xe7> .byte 102,65,15,58,22,68,129,8,2 // pextrd $0x2,%xmm0,0x8(%r9,%rax,4) .byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4) - .byte 235,132 // jmp 136db <_sk_srcover_rgba_8888_sse41+0xe7> + .byte 235,132 // jmp 13a27 <_sk_srcover_rgba_8888_sse41+0xe7> .byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7 - .byte 233,184,254,255,255 // jmpq 1361a <_sk_srcover_rgba_8888_sse41+0x26> + .byte 233,184,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26> .byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4) - .byte 233,110,255,255,255 // jmpq 136db <_sk_srcover_rgba_8888_sse41+0xe7> + .byte 233,110,255,255,255 // jmpq 13a27 <_sk_srcover_rgba_8888_sse41+0xe7> HIDDEN _sk_clamp_0_sse41 .globl _sk_clamp_0_sse41 @@ -35414,7 +35791,7 @@ HIDDEN _sk_clamp_1_sse41 .globl _sk_clamp_1_sse41 FUNCTION(_sk_clamp_1_sse41) _sk_clamp_1_sse41: - .byte 68,15,40,5,67,128,1,0 // movaps 0x18043(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,247,130,1,0 // movaps 0x182f7(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -35426,7 +35803,7 @@ HIDDEN _sk_clamp_a_sse41 .globl _sk_clamp_a_sse41 FUNCTION(_sk_clamp_a_sse41) _sk_clamp_a_sse41: - .byte 15,93,29,40,128,1,0 // minps 0x18028(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,93,29,220,130,1,0 // minps 0x182dc(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -35437,7 +35814,7 @@ HIDDEN _sk_clamp_a_dst_sse41 .globl _sk_clamp_a_dst_sse41 FUNCTION(_sk_clamp_a_dst_sse41) _sk_clamp_a_dst_sse41: - .byte 15,93,61,20,128,1,0 // minps 0x18014(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,93,61,200,130,1,0 // minps 0x182c8(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,93,231 // minps %xmm7,%xmm4 .byte 15,93,239 // minps %xmm7,%xmm5 .byte 15,93,247 // minps %xmm7,%xmm6 @@ -35472,7 +35849,7 @@ HIDDEN _sk_invert_sse41 .globl _sk_invert_sse41 FUNCTION(_sk_invert_sse41) _sk_invert_sse41: - .byte 68,15,40,5,208,127,1,0 // movaps 0x17fd0(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,132,130,1,0 // movaps 0x18284(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,200 // subps %xmm0,%xmm9 .byte 69,15,40,208 // movaps %xmm8,%xmm10 @@ -35534,7 +35911,7 @@ HIDDEN _sk_unpremul_sse41 FUNCTION(_sk_unpremul_sse41) _sk_unpremul_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,90,127,1,0 // movaps 0x17f5a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,14,130,1,0 // movaps 0x1820e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -35548,20 +35925,20 @@ HIDDEN _sk_from_srgb_sse41 .globl _sk_from_srgb_sse41 FUNCTION(_sk_from_srgb_sse41) _sk_from_srgb_sse41: - .byte 68,15,40,29,37,128,1,0 // movaps 0x18025(%rip),%xmm11 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff> + .byte 68,15,40,29,217,130,1,0 // movaps 0x182d9(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 .byte 68,15,40,208 // movaps %xmm0,%xmm10 .byte 69,15,89,210 // mulps %xmm10,%xmm10 - .byte 68,15,40,37,157,127,1,0 // movaps 0x17f9d(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,37,81,130,1,0 // movaps 0x18251(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,13,128,1,0 // movaps 0x1800d(%rip),%xmm13 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f> + .byte 68,15,40,45,193,130,1,0 // movaps 0x182c1(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b> .byte 69,15,88,197 // addps %xmm13,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 - .byte 68,15,40,53,13,128,1,0 // movaps 0x1800d(%rip),%xmm14 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f> + .byte 68,15,40,53,193,130,1,0 // movaps 0x182c1(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b> .byte 69,15,88,198 // addps %xmm14,%xmm8 - .byte 68,15,40,61,17,128,1,0 // movaps 0x18011(%rip),%xmm15 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f> + .byte 68,15,40,61,197,130,1,0 // movaps 0x182c5(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,40,209 // movaps %xmm1,%xmm10 @@ -35598,19 +35975,19 @@ FUNCTION(_sk_from_srgb_dst_sse41) _sk_from_srgb_dst_sse41: .byte 68,15,40,204 // movaps %xmm4,%xmm9 .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,29,92,127,1,0 // movaps 0x17f5c(%rip),%xmm11 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff> + .byte 68,15,40,29,16,130,1,0 // movaps 0x18210(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 69,15,89,211 // mulps %xmm11,%xmm10 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 - .byte 68,15,40,37,213,126,1,0 // movaps 0x17ed5(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,37,137,129,1,0 // movaps 0x18189(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 65,15,89,228 // mulps %xmm12,%xmm4 - .byte 68,15,40,45,73,127,1,0 // movaps 0x17f49(%rip),%xmm13 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f> + .byte 68,15,40,45,253,129,1,0 // movaps 0x181fd(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b> .byte 65,15,88,229 // addps %xmm13,%xmm4 .byte 15,89,224 // mulps %xmm0,%xmm4 - .byte 68,15,40,53,74,127,1,0 // movaps 0x17f4a(%rip),%xmm14 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f> + .byte 68,15,40,53,254,129,1,0 // movaps 0x181fe(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b> .byte 65,15,88,230 // addps %xmm14,%xmm4 - .byte 68,15,40,61,78,127,1,0 // movaps 0x17f4e(%rip),%xmm15 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f> + .byte 68,15,40,61,2,130,1,0 // movaps 0x18202(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b> .byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4 @@ -35654,22 +36031,22 @@ _sk_to_srgb_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 68,15,82,192 // rsqrtps %xmm0,%xmm8 - .byte 68,15,40,29,194,126,1,0 // movaps 0x17ec2(%rip),%xmm11 # 2b900 <_sk_overlay_sse2_8bit+0xf3f> + .byte 68,15,40,29,118,129,1,0 // movaps 0x18176(%rip),%xmm11 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 - .byte 68,15,40,37,194,126,1,0 // movaps 0x17ec2(%rip),%xmm12 # 2b910 <_sk_overlay_sse2_8bit+0xf4f> + .byte 68,15,40,37,118,129,1,0 // movaps 0x18176(%rip),%xmm12 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 69,15,89,252 // mulps %xmm12,%xmm15 - .byte 68,15,40,21,194,126,1,0 // movaps 0x17ec2(%rip),%xmm10 # 2b920 <_sk_overlay_sse2_8bit+0xf5f> + .byte 68,15,40,21,118,129,1,0 // movaps 0x18176(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,248 // mulps %xmm8,%xmm15 - .byte 68,15,40,45,194,126,1,0 // movaps 0x17ec2(%rip),%xmm13 # 2b930 <_sk_overlay_sse2_8bit+0xf6f> + .byte 68,15,40,45,118,129,1,0 // movaps 0x18176(%rip),%xmm13 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b> .byte 69,15,88,253 // addps %xmm13,%xmm15 - .byte 68,15,40,53,198,126,1,0 // movaps 0x17ec6(%rip),%xmm14 # 2b940 <_sk_overlay_sse2_8bit+0xf7f> + .byte 68,15,40,53,122,129,1,0 // movaps 0x1817a(%rip),%xmm14 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b> .byte 69,15,88,198 // addps %xmm14,%xmm8 .byte 69,15,83,192 // rcpps %xmm8,%xmm8 .byte 69,15,89,199 // mulps %xmm15,%xmm8 - .byte 68,15,40,61,194,126,1,0 // movaps 0x17ec2(%rip),%xmm15 # 2b950 <_sk_overlay_sse2_8bit+0xf8f> + .byte 68,15,40,61,118,129,1,0 // movaps 0x18176(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,82,202 // rsqrtps %xmm2,%xmm9 @@ -35714,15 +36091,17 @@ FUNCTION(_sk_rgb_to_hsl_sse41) _sk_rgb_to_hsl_sse41: .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,40,192 // movaps %xmm0,%xmm8 + .byte 65,15,40,193 // movaps %xmm9,%xmm0 + .byte 15,95,194 // maxps %xmm2,%xmm0 .byte 69,15,40,216 // movaps %xmm8,%xmm11 - .byte 69,15,95,217 // maxps %xmm9,%xmm11 - .byte 68,15,95,218 // maxps %xmm2,%xmm11 + .byte 68,15,95,216 // maxps %xmm0,%xmm11 + .byte 65,15,40,193 // movaps %xmm9,%xmm0 + .byte 15,93,194 // minps %xmm2,%xmm0 .byte 69,15,40,224 // movaps %xmm8,%xmm12 - .byte 69,15,93,225 // minps %xmm9,%xmm12 - .byte 68,15,93,226 // minps %xmm2,%xmm12 + .byte 68,15,93,224 // minps %xmm0,%xmm12 .byte 65,15,40,203 // movaps %xmm11,%xmm1 .byte 65,15,92,204 // subps %xmm12,%xmm1 - .byte 68,15,40,53,127,124,1,0 // movaps 0x17c7f(%rip),%xmm14 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,53,45,127,1,0 // movaps 0x17f2d(%rip),%xmm14 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,94,241 // divps %xmm1,%xmm14 .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10 @@ -35731,27 +36110,27 @@ _sk_rgb_to_hsl_sse41: .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15 - .byte 68,15,84,61,230,125,1,0 // andps 0x17de6(%rip),%xmm15 # 2b960 <_sk_overlay_sse2_8bit+0xf9f> + .byte 68,15,84,61,148,128,1,0 // andps 0x18094(%rip),%xmm15 # 2bf60 <_sk_overlay_sse2_8bit+0xfab> .byte 68,15,88,248 // addps %xmm0,%xmm15 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,214 // mulps %xmm14,%xmm2 - .byte 68,15,40,45,217,125,1,0 // movaps 0x17dd9(%rip),%xmm13 # 2b970 <_sk_overlay_sse2_8bit+0xfaf> + .byte 68,15,40,45,135,128,1,0 // movaps 0x18087(%rip),%xmm13 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb> .byte 65,15,88,213 // addps %xmm13,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,198 // mulps %xmm14,%xmm8 - .byte 68,15,88,5,213,125,1,0 // addps 0x17dd5(%rip),%xmm8 # 2b980 <_sk_overlay_sse2_8bit+0xfbf> + .byte 68,15,88,5,131,128,1,0 // addps 0x18083(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb> .byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8 - .byte 68,15,89,5,205,125,1,0 // mulps 0x17dcd(%rip),%xmm8 # 2b990 <_sk_overlay_sse2_8bit+0xfcf> + .byte 68,15,89,5,123,128,1,0 // mulps 0x1807b(%rip),%xmm8 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb> .byte 69,15,40,203 // movaps %xmm11,%xmm9 .byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9 .byte 69,15,84,193 // andps %xmm9,%xmm8 .byte 69,15,92,235 // subps %xmm11,%xmm13 .byte 69,15,88,220 // addps %xmm12,%xmm11 - .byte 15,40,5,225,123,1,0 // movaps 0x17be1(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,40,5,143,126,1,0 // movaps 0x17e8f(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,40,211 // movaps %xmm11,%xmm2 .byte 15,89,208 // mulps %xmm0,%xmm2 .byte 15,194,194,1 // cmpltps %xmm2,%xmm0 @@ -35773,7 +36152,7 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp) .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,208 // movaps %xmm0,%xmm10 - .byte 68,15,40,13,151,123,1,0 // movaps 0x17b97(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,13,69,126,1,0 // movaps 0x17e45(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,194,194,2 // cmpleps %xmm2,%xmm0 .byte 15,40,217 // movaps %xmm1,%xmm3 @@ -35786,19 +36165,19 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp) .byte 69,15,88,192 // addps %xmm8,%xmm8 .byte 68,15,92,197 // subps %xmm5,%xmm8 - .byte 68,15,40,53,66,125,1,0 // movaps 0x17d42(%rip),%xmm14 # 2b9a0 <_sk_overlay_sse2_8bit+0xfdf> + .byte 68,15,40,53,240,127,1,0 // movaps 0x17ff0(%rip),%xmm14 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0 .byte 68,15,92,240 // subps %xmm0,%xmm14 - .byte 68,15,40,29,59,125,1,0 // movaps 0x17d3b(%rip),%xmm11 # 2b9b0 <_sk_overlay_sse2_8bit+0xfef> + .byte 68,15,40,29,233,127,1,0 // movaps 0x17fe9(%rip),%xmm11 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 65,15,92,240 // subps %xmm8,%xmm6 - .byte 15,40,61,212,124,1,0 // movaps 0x17cd4(%rip),%xmm7 # 2b960 <_sk_overlay_sse2_8bit+0xf9f> + .byte 15,40,61,130,127,1,0 // movaps 0x17f82(%rip),%xmm7 # 2bf60 <_sk_overlay_sse2_8bit+0xfab> .byte 69,15,40,238 // movaps %xmm14,%xmm13 .byte 68,15,89,239 // mulps %xmm7,%xmm13 - .byte 15,40,29,229,124,1,0 // movaps 0x17ce5(%rip),%xmm3 # 2b980 <_sk_overlay_sse2_8bit+0xfbf> + .byte 15,40,29,147,127,1,0 // movaps 0x17f93(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb> .byte 68,15,40,227 // movaps %xmm3,%xmm12 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 68,15,89,230 // mulps %xmm6,%xmm12 @@ -35808,7 +36187,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,40,253 // movaps %xmm5,%xmm15 .byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15 - .byte 68,15,40,37,196,124,1,0 // movaps 0x17cc4(%rip),%xmm12 # 2b990 <_sk_overlay_sse2_8bit+0xfcf> + .byte 68,15,40,37,114,127,1,0 // movaps 0x17f72(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb> .byte 65,15,40,196 // movaps %xmm12,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,89,238 // mulps %xmm6,%xmm13 @@ -35842,7 +36221,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,40,198 // movaps %xmm14,%xmm0 .byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,88,21,92,124,1,0 // addps 0x17c5c(%rip),%xmm10 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,88,21,10,127,1,0 // addps 0x17f0a(%rip),%xmm10 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11 @@ -35897,11 +36276,11 @@ _sk_scale_u8_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,52 // jne 13e4b <_sk_scale_u8_sse41+0x4c> + .byte 117,52 // jne 1419d <_sk_scale_u8_sse41+0x4c> .byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8 - .byte 102,68,15,219,5,89,122,1,0 // pand 0x17a59(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,68,15,219,5,7,125,1,0 // pand 0x17d07(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,157,123,1,0 // mulps 0x17b9d(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,89,5,75,126,1,0 // mulps 0x17e4b(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -35912,12 +36291,12 @@ _sk_scale_u8_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,59 // je 13e93 <_sk_scale_u8_sse41+0x94> + .byte 116,59 // je 141e5 <_sk_scale_u8_sse41+0x94> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 13e7a <_sk_scale_u8_sse41+0x7b> + .byte 116,23 // je 141cc <_sk_scale_u8_sse41+0x7b> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,181 // jne 13e1e <_sk_scale_u8_sse41+0x1f> + .byte 117,181 // jne 14170 <_sk_scale_u8_sse41+0x1f> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -35925,10 +36304,77 @@ _sk_scale_u8_sse41: .byte 102,68,15,110,200 // movd %eax,%xmm9 .byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9 .byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8 - .byte 235,139 // jmp 13e1e <_sk_scale_u8_sse41+0x1f> + .byte 235,139 // jmp 14170 <_sk_scale_u8_sse41+0x1f> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,124,255,255,255 // jmpq 13e1e <_sk_scale_u8_sse41+0x1f> + .byte 233,124,255,255,255 // jmpq 14170 <_sk_scale_u8_sse41+0x1f> + +HIDDEN _sk_scale_565_sse41 +.globl _sk_scale_565_sse41 +FUNCTION(_sk_scale_565_sse41) +_sk_scale_565_sse41: + .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 76,99,80,8 // movslq 0x8(%rax),%r10 + .byte 76,99,201 // movslq %ecx,%r9 + .byte 77,15,175,202 // imul %r10,%r9 + .byte 77,1,201 // add %r9,%r9 + .byte 76,3,8 // add (%rax),%r9 + .byte 76,99,218 // movslq %edx,%r11 + .byte 77,133,192 // test %r8,%r8 + .byte 15,133,159,0,0,0 // jne 142b7 <_sk_scale_565_sse41+0xc3> + .byte 102,71,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm11 + .byte 102,15,111,5,185,125,1,0 // movdqa 0x17db9(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> + .byte 102,65,15,219,195 // pand %xmm11,%xmm0 + .byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9 + .byte 68,15,89,13,184,125,1,0 // mulps 0x17db8(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,5,192,125,1,0 // movdqa 0x17dc0(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b> + .byte 102,65,15,219,195 // pand %xmm11,%xmm0 + .byte 68,15,91,208 // cvtdq2ps %xmm0,%xmm10 + .byte 68,15,89,21,191,125,1,0 // mulps 0x17dbf(%rip),%xmm10 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,68,15,219,29,198,125,1,0 // pand 0x17dc6(%rip),%xmm11 # 2c020 <_sk_overlay_sse2_8bit+0x106b> + .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 + .byte 68,15,89,29,202,125,1,0 // mulps 0x17dca(%rip),%xmm11 # 2c030 <_sk_overlay_sse2_8bit+0x107b> + .byte 15,40,195 // movaps %xmm3,%xmm0 + .byte 15,194,199,1 // cmpltps %xmm7,%xmm0 + .byte 69,15,40,226 // movaps %xmm10,%xmm12 + .byte 69,15,93,227 // minps %xmm11,%xmm12 + .byte 69,15,40,233 // movaps %xmm9,%xmm13 + .byte 69,15,93,236 // minps %xmm12,%xmm13 + .byte 69,15,40,242 // movaps %xmm10,%xmm14 + .byte 69,15,95,243 // maxps %xmm11,%xmm14 + .byte 69,15,40,225 // movaps %xmm9,%xmm12 + .byte 69,15,95,230 // maxps %xmm14,%xmm12 + .byte 102,69,15,56,20,229 // blendvps %xmm0,%xmm13,%xmm12 + .byte 69,15,89,200 // mulps %xmm8,%xmm9 + .byte 68,15,89,209 // mulps %xmm1,%xmm10 + .byte 68,15,89,218 // mulps %xmm2,%xmm11 + .byte 68,15,89,227 // mulps %xmm3,%xmm12 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 65,15,40,193 // movaps %xmm9,%xmm0 + .byte 65,15,40,202 // movaps %xmm10,%xmm1 + .byte 65,15,40,211 // movaps %xmm11,%xmm2 + .byte 65,15,40,220 // movaps %xmm12,%xmm3 + .byte 255,224 // jmpq *%rax + .byte 69,137,194 // mov %r8d,%r10d + .byte 65,128,226,3 // and $0x3,%r10b + .byte 65,128,250,1 // cmp $0x1,%r10b + .byte 116,60 // je 14300 <_sk_scale_565_sse41+0x10c> + .byte 102,69,15,239,219 // pxor %xmm11,%xmm11 + .byte 65,128,250,2 // cmp $0x2,%r10b + .byte 116,26 // je 142e9 <_sk_scale_565_sse41+0xf5> + .byte 65,128,250,3 // cmp $0x3,%r10b + .byte 15,133,70,255,255,255 // jne 1421f <_sk_scale_565_sse41+0x2b> + .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax + .byte 102,15,110,192 // movd %eax,%xmm0 + .byte 102,68,15,112,216,69 // pshufd $0x45,%xmm0,%xmm11 + .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0 + .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 + .byte 102,68,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm11 + .byte 233,31,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b> + .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax + .byte 102,68,15,110,216 // movd %eax,%xmm11 + .byte 233,16,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b> HIDDEN _sk_lerp_1_float_sse41 .globl _sk_lerp_1_float_sse41 @@ -35963,11 +36409,11 @@ _sk_lerp_u8_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,72 // jne 13f3a <_sk_lerp_u8_sse41+0x60> + .byte 117,72 // jne 143a7 <_sk_lerp_u8_sse41+0x60> .byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8 - .byte 102,68,15,219,5,126,121,1,0 // pand 0x1797e(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,68,15,219,5,17,123,1,0 // pand 0x17b11(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,194,122,1,0 // mulps 0x17ac2(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,89,5,85,124,1,0 // mulps 0x17c55(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -35985,12 +36431,12 @@ _sk_lerp_u8_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,62 // je 13f85 <_sk_lerp_u8_sse41+0xab> + .byte 116,62 // je 143f2 <_sk_lerp_u8_sse41+0xab> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 13f69 <_sk_lerp_u8_sse41+0x8f> + .byte 116,23 // je 143d6 <_sk_lerp_u8_sse41+0x8f> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,161 // jne 13ef9 <_sk_lerp_u8_sse41+0x1f> + .byte 117,161 // jne 14366 <_sk_lerp_u8_sse41+0x1f> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -35998,15 +36444,16 @@ _sk_lerp_u8_sse41: .byte 102,68,15,110,200 // movd %eax,%xmm9 .byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9 .byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8 - .byte 233,116,255,255,255 // jmpq 13ef9 <_sk_lerp_u8_sse41+0x1f> + .byte 233,116,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,101,255,255,255 // jmpq 13ef9 <_sk_lerp_u8_sse41+0x1f> + .byte 233,101,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f> HIDDEN _sk_lerp_565_sse41 .globl _sk_lerp_565_sse41 FUNCTION(_sk_lerp_565_sse41) _sk_lerp_565_sse41: + .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,99,80,8 // movslq 0x8(%rax),%r10 .byte 76,99,201 // movslq %ecx,%r9 @@ -36015,59 +36462,62 @@ _sk_lerp_565_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,152,0,0,0 // jne 1404b <_sk_lerp_565_sse41+0xb7> + .byte 15,133,165,0,0,0 // jne 144ca <_sk_lerp_565_sse41+0xc9> .byte 102,71,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm10 - .byte 102,68,15,111,5,29,122,1,0 // movdqa 0x17a1d(%rip),%xmm8 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> - .byte 102,69,15,219,194 // pand %xmm10,%xmm8 - .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,28,122,1,0 // mulps 0x17a1c(%rip),%xmm8 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,68,15,111,13,35,122,1,0 // movdqa 0x17a23(%rip),%xmm9 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> - .byte 102,69,15,219,202 // pand %xmm10,%xmm9 - .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,34,122,1,0 // mulps 0x17a22(%rip),%xmm9 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,68,15,219,21,41,122,1,0 // pand 0x17a29(%rip),%xmm10 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 102,15,111,5,172,123,1,0 // movdqa 0x17bac(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> + .byte 102,65,15,219,194 // pand %xmm10,%xmm0 + .byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9 + .byte 68,15,89,13,171,123,1,0 // mulps 0x17bab(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,5,179,123,1,0 // movdqa 0x17bb3(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b> + .byte 102,65,15,219,194 // pand %xmm10,%xmm0 + .byte 68,15,91,216 // cvtdq2ps %xmm0,%xmm11 + .byte 68,15,89,29,178,123,1,0 // mulps 0x17bb2(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,68,15,219,21,185,123,1,0 // pand 0x17bb9(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b> .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,45,122,1,0 // mulps 0x17a2d(%rip),%xmm10 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> - .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 65,15,89,192 // mulps %xmm8,%xmm0 - .byte 15,88,196 // addps %xmm4,%xmm0 + .byte 68,15,89,21,189,123,1,0 // mulps 0x17bbd(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b> + .byte 15,40,195 // movaps %xmm3,%xmm0 + .byte 15,194,199,1 // cmpltps %xmm7,%xmm0 + .byte 69,15,40,227 // movaps %xmm11,%xmm12 .byte 15,92,205 // subps %xmm5,%xmm1 - .byte 65,15,89,201 // mulps %xmm9,%xmm1 + .byte 65,15,89,203 // mulps %xmm11,%xmm1 + .byte 69,15,93,218 // minps %xmm10,%xmm11 + .byte 69,15,40,233 // movaps %xmm9,%xmm13 + .byte 68,15,92,196 // subps %xmm4,%xmm8 + .byte 69,15,89,193 // mulps %xmm9,%xmm8 + .byte 69,15,93,203 // minps %xmm11,%xmm9 + .byte 69,15,95,226 // maxps %xmm10,%xmm12 + .byte 69,15,95,236 // maxps %xmm12,%xmm13 + .byte 102,69,15,56,20,233 // blendvps %xmm0,%xmm9,%xmm13 + .byte 68,15,88,196 // addps %xmm4,%xmm8 .byte 15,88,205 // addps %xmm5,%xmm1 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 65,15,89,210 // mulps %xmm10,%xmm2 .byte 15,88,214 // addps %xmm6,%xmm2 .byte 15,92,223 // subps %xmm7,%xmm3 - .byte 68,15,89,195 // mulps %xmm3,%xmm8 - .byte 68,15,88,199 // addps %xmm7,%xmm8 - .byte 68,15,89,203 // mulps %xmm3,%xmm9 - .byte 68,15,88,207 // addps %xmm7,%xmm9 - .byte 65,15,89,218 // mulps %xmm10,%xmm3 + .byte 65,15,89,221 // mulps %xmm13,%xmm3 .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 68,15,95,203 // maxps %xmm3,%xmm9 - .byte 69,15,95,193 // maxps %xmm9,%xmm8 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 65,15,40,216 // movaps %xmm8,%xmm3 + .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,62 // je 14096 <_sk_lerp_565_sse41+0x102> + .byte 116,60 // je 14513 <_sk_lerp_565_sse41+0x112> .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,27 // je 1407e <_sk_lerp_565_sse41+0xea> + .byte 116,26 // je 144fc <_sk_lerp_565_sse41+0xfb> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,77,255,255,255 // jne 13fba <_sk_lerp_565_sse41+0x26> + .byte 15,133,64,255,255,255 // jne 1442c <_sk_lerp_565_sse41+0x2b> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax - .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10 - .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8 - .byte 102,69,15,56,51,192 // pmovzxwd %xmm8,%xmm8 - .byte 102,69,15,58,14,208,15 // pblendw $0xf,%xmm8,%xmm10 - .byte 233,36,255,255,255 // jmpq 13fba <_sk_lerp_565_sse41+0x26> + .byte 102,15,110,192 // movd %eax,%xmm0 + .byte 102,68,15,112,208,69 // pshufd $0x45,%xmm0,%xmm10 + .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0 + .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 + .byte 102,68,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm10 + .byte 233,25,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,68,15,110,208 // movd %eax,%xmm10 - .byte 233,21,255,255,255 // jmpq 13fba <_sk_lerp_565_sse41+0x26> + .byte 233,10,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b> HIDDEN _sk_load_tables_sse41 .globl _sk_load_tables_sse41 @@ -36076,12 +36526,12 @@ _sk_load_tables_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,24,1,0,0 // jne 141cb <_sk_load_tables_sse41+0x126> + .byte 15,133,24,1,0,0 // jne 14648 <_sk_load_tables_sse41+0x126> .byte 243,69,15,111,4,145 // movdqu (%r9,%rdx,4),%xmm8 .byte 65,87 // push %r15 .byte 65,86 // push %r14 .byte 83 // push %rbx - .byte 102,15,111,5,186,119,1,0 // movdqa 0x177ba(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,5,61,121,1,0 // movdqa 0x1793d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9 .byte 102,73,15,126,194 // movq %xmm0,%r10 @@ -36096,7 +36546,7 @@ _sk_load_tables_sse41: .byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0 .byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0 .byte 102,65,15,111,200 // movdqa %xmm8,%xmm1 - .byte 102,15,56,0,13,117,119,1,0 // pshufb 0x17775(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,13,248,120,1,0 // pshufb 0x178f8(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx .byte 68,15,182,211 // movzbl %bl,%r10d @@ -36111,7 +36561,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1 .byte 76,139,72,24 // mov 0x18(%rax),%r9 .byte 102,65,15,111,208 // movdqa %xmm8,%xmm2 - .byte 102,15,56,0,21,49,119,1,0 // pshufb 0x17731(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,21,180,120,1,0 // pshufb 0x178b4(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx .byte 102,72,15,126,208 // movq %xmm2,%rax .byte 68,15,182,208 // movzbl %al,%r10d @@ -36126,7 +36576,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3 - .byte 15,89,29,14,120,1,0 // mulps 0x1780e(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,29,145,121,1,0 // mulps 0x17991(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -36135,19 +36585,19 @@ _sk_load_tables_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,52 // je 1420c <_sk_load_tables_sse41+0x167> + .byte 116,52 // je 14689 <_sk_load_tables_sse41+0x167> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 141fa <_sk_load_tables_sse41+0x155> + .byte 116,23 // je 14677 <_sk_load_tables_sse41+0x155> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,204,254,255,255 // jne 140b9 <_sk_load_tables_sse41+0x14> + .byte 15,133,204,254,255,255 // jne 14536 <_sk_load_tables_sse41+0x14> .byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0 .byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8 .byte 243,65,15,126,4,145 // movq (%r9,%rdx,4),%xmm0 .byte 102,68,15,58,14,192,15 // pblendw $0xf,%xmm0,%xmm8 - .byte 233,173,254,255,255 // jmpq 140b9 <_sk_load_tables_sse41+0x14> + .byte 233,173,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14> .byte 102,69,15,110,4,145 // movd (%r9,%rdx,4),%xmm8 - .byte 233,162,254,255,255 // jmpq 140b9 <_sk_load_tables_sse41+0x14> + .byte 233,162,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14> HIDDEN _sk_load_tables_u16_be_sse41 .globl _sk_load_tables_u16_be_sse41 @@ -36157,7 +36607,7 @@ _sk_load_tables_u16_be_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,99,1,0,0 // jne 14390 <_sk_load_tables_u16_be_sse41+0x179> + .byte 15,133,99,1,0,0 // jne 1480d <_sk_load_tables_u16_be_sse41+0x179> .byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0 .byte 243,67,15,111,76,81,16 // movdqu 0x10(%r9,%r10,2),%xmm1 .byte 65,87 // push %r15 @@ -36169,7 +36619,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,5,220,119,1,0 // movdqa 0x177dc(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f> + .byte 102,68,15,111,5,95,121,1,0 // movdqa 0x1795f(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -36187,7 +36637,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0 .byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2 .byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0 - .byte 102,15,56,0,13,139,119,1,0 // pshufb 0x1778b(%rip),%xmm1 # 2ba50 <_sk_overlay_sse2_8bit+0x108f> + .byte 102,15,56,0,13,14,121,1,0 // pshufb 0x1790e(%rip),%xmm1 # 2c050 <_sk_overlay_sse2_8bit+0x109b> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx @@ -36223,7 +36673,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,235,216 // por %xmm8,%xmm3 .byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,217,118,1,0 // mulps 0x176d9(%rip),%xmm3 # 2ba60 <_sk_overlay_sse2_8bit+0x109f> + .byte 15,89,29,92,120,1,0 // mulps 0x1785c(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -36231,16 +36681,16 @@ _sk_load_tables_u16_be_sse41: .byte 255,224 // jmpq *%rax .byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 143a9 <_sk_load_tables_u16_be_sse41+0x192> + .byte 117,13 // jne 14826 <_sk_load_tables_u16_be_sse41+0x192> .byte 243,15,126,192 // movq %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,145,254,255,255 // jmpq 1423a <_sk_load_tables_u16_be_sse41+0x23> + .byte 233,145,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23> .byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,124,254,255,255 // jb 1423a <_sk_load_tables_u16_be_sse41+0x23> + .byte 15,130,124,254,255,255 // jb 146b7 <_sk_load_tables_u16_be_sse41+0x23> .byte 243,67,15,126,76,81,16 // movq 0x10(%r9,%r10,2),%xmm1 - .byte 233,112,254,255,255 // jmpq 1423a <_sk_load_tables_u16_be_sse41+0x23> + .byte 233,112,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23> HIDDEN _sk_load_tables_rgb_u16_be_sse41 .globl _sk_load_tables_rgb_u16_be_sse41 @@ -36250,7 +36700,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,83,1,0,0 // jne 1452f <_sk_load_tables_rgb_u16_be_sse41+0x165> + .byte 15,133,83,1,0,0 // jne 149ac <_sk_load_tables_rgb_u16_be_sse41+0x165> .byte 243,67,15,111,20,81 // movdqu (%r9,%r10,2),%xmm2 .byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1 .byte 102,15,115,217,4 // psrldq $0x4,%xmm1 @@ -36265,7 +36715,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 - .byte 102,68,15,111,5,30,118,1,0 // movdqa 0x1761e(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f> + .byte 102,68,15,111,5,161,119,1,0 // movdqa 0x177a1(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -36283,7 +36733,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0 .byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3 .byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0 - .byte 102,15,56,0,13,237,117,1,0 // pshufb 0x175ed(%rip),%xmm1 # 2ba70 <_sk_overlay_sse2_8bit+0x10af> + .byte 102,15,56,0,13,112,119,1,0 // pshufb 0x17770(%rip),%xmm1 # 2c070 <_sk_overlay_sse2_8bit+0x10bb> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx @@ -36314,7 +36764,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3 .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,168,114,1,0 // movaps 0x172a8(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,43,116,1,0 // movaps 0x1742b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 91 // pop %rbx .byte 65,94 // pop %r14 .byte 65,95 // pop %r15 @@ -36323,21 +36773,21 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,67,15,196,84,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,14 // jne 14555 <_sk_load_tables_rgb_u16_be_sse41+0x18b> + .byte 117,14 // jne 149d2 <_sk_load_tables_rgb_u16_be_sse41+0x18b> .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 - .byte 233,173,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38> + .byte 233,173,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38> .byte 102,71,15,110,76,81,6 // movd 0x6(%r9,%r10,2),%xmm9 .byte 102,71,15,196,76,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm9 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 14586 <_sk_load_tables_rgb_u16_be_sse41+0x1bc> + .byte 114,24 // jb 14a03 <_sk_load_tables_rgb_u16_be_sse41+0x1bc> .byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1 .byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,124,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38> + .byte 233,124,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38> .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,115,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38> + .byte 233,115,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38> HIDDEN _sk_byte_tables_sse41 .globl _sk_byte_tables_sse41 @@ -36348,7 +36798,7 @@ _sk_byte_tables_sse41: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,16,115,1,0 // movaps 0x17310(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,147,116,1,0 // movaps 0x17493(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9 @@ -36367,7 +36817,7 @@ _sk_byte_tables_sse41: .byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,209,115,1,0 // movaps 0x173d1(%rip),%xmm9 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,13,84,117,1,0 // movaps 0x17554(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -36463,7 +36913,7 @@ _sk_byte_tables_rgb_sse41: .byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,57,114,1,0 // movaps 0x17239(%rip),%xmm9 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,13,188,115,1,0 // movaps 0x173bc(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -36650,31 +37100,31 @@ _sk_parametric_r_sse41: .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8 - .byte 68,15,89,5,33,112,1,0 // mulps 0x17021(%rip),%xmm8 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,21,41,112,1,0 // andps 0x17029(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,21,81,109,1,0 // orps 0x16d51(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,5,41,112,1,0 // addps 0x17029(%rip),%xmm8 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 68,15,40,37,49,112,1,0 // movaps 0x17031(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,5,164,113,1,0 // mulps 0x171a4(%rip),%xmm8 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,21,172,113,1,0 // andps 0x171ac(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,21,212,110,1,0 // orps 0x16ed4(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,5,172,113,1,0 // addps 0x171ac(%rip),%xmm8 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 68,15,40,37,180,113,1,0 // movaps 0x171b4(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 - .byte 68,15,88,21,49,112,1,0 // addps 0x17031(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 68,15,40,37,57,112,1,0 // movaps 0x17039(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,21,180,113,1,0 // addps 0x171b4(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 68,15,40,37,188,113,1,0 // movaps 0x171bc(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 .byte 69,15,89,195 // mulps %xmm11,%xmm8 .byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10 .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,5,38,112,1,0 // addps 0x17026(%rip),%xmm8 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 68,15,40,21,46,112,1,0 // movaps 0x1702e(%rip),%xmm10 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,5,169,113,1,0 // addps 0x171a9(%rip),%xmm8 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 69,15,89,211 // mulps %xmm11,%xmm10 .byte 69,15,92,194 // subps %xmm10,%xmm8 - .byte 68,15,40,21,46,112,1,0 // movaps 0x1702e(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 68,15,40,29,50,112,1,0 // movaps 0x17032(%rip),%xmm11 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 68,15,40,29,181,113,1,0 // movaps 0x171b5(%rip),%xmm11 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 69,15,94,218 // divps %xmm10,%xmm11 .byte 69,15,88,216 // addps %xmm8,%xmm11 - .byte 68,15,89,29,50,112,1,0 // mulps 0x17032(%rip),%xmm11 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 68,15,89,29,181,113,1,0 // mulps 0x171b5(%rip),%xmm11 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10 .byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 @@ -36682,7 +37132,7 @@ _sk_parametric_r_sse41: .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,185,108,1,0 // minps 0x16cb9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,93,5,60,110,1,0 // minps 0x16e3c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -36712,31 +37162,31 @@ _sk_parametric_g_sse41: .byte 68,15,88,217 // addps %xmm1,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,250,110,1,0 // mulps 0x16efa(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,29,2,111,1,0 // andps 0x16f02(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,29,42,108,1,0 // orps 0x16c2a(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,37,2,111,1,0 // addps 0x16f02(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 15,40,13,11,111,1,0 // movaps 0x16f0b(%rip),%xmm1 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,37,125,112,1,0 // mulps 0x1707d(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,29,133,112,1,0 // andps 0x17085(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,29,173,109,1,0 // orps 0x16dad(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,37,133,112,1,0 // addps 0x17085(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 15,40,13,142,112,1,0 // movaps 0x1708e(%rip),%xmm1 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,88,29,11,111,1,0 // addps 0x16f0b(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 15,40,13,20,111,1,0 // movaps 0x16f14(%rip),%xmm1 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,29,142,112,1,0 // addps 0x1708e(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 15,40,13,151,112,1,0 // movaps 0x17097(%rip),%xmm1 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 65,15,94,203 // divps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,1,111,1,0 // addps 0x16f01(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 15,40,13,10,111,1,0 // movaps 0x16f0a(%rip),%xmm1 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,37,132,112,1,0 // addps 0x17084(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 15,40,13,141,112,1,0 // movaps 0x1708d(%rip),%xmm1 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,40,21,10,111,1,0 // movaps 0x16f0a(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,21,141,112,1,0 // movaps 0x1708d(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,13,15,111,1,0 // movaps 0x16f0f(%rip),%xmm1 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 15,40,13,146,112,1,0 // movaps 0x17092(%rip),%xmm1 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 65,15,94,202 // divps %xmm10,%xmm1 .byte 65,15,88,204 // addps %xmm12,%xmm1 - .byte 15,89,13,16,111,1,0 // mulps 0x16f10(%rip),%xmm1 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 15,89,13,147,112,1,0 // mulps 0x17093(%rip),%xmm1 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10 .byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1 .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1 @@ -36744,7 +37194,7 @@ _sk_parametric_g_sse41: .byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,200 // maxps %xmm0,%xmm1 - .byte 15,93,13,155,107,1,0 // minps 0x16b9b(%rip),%xmm1 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,93,13,30,109,1,0 // minps 0x16d1e(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -36774,31 +37224,31 @@ _sk_parametric_b_sse41: .byte 68,15,88,218 // addps %xmm2,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,220,109,1,0 // mulps 0x16ddc(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,29,228,109,1,0 // andps 0x16de4(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,29,12,107,1,0 // orps 0x16b0c(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,37,228,109,1,0 // addps 0x16de4(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 15,40,21,237,109,1,0 // movaps 0x16ded(%rip),%xmm2 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,37,95,111,1,0 // mulps 0x16f5f(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,29,103,111,1,0 // andps 0x16f67(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,29,143,108,1,0 // orps 0x16c8f(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,37,103,111,1,0 // addps 0x16f67(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 15,40,21,112,111,1,0 // movaps 0x16f70(%rip),%xmm2 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,88,29,237,109,1,0 // addps 0x16ded(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 15,40,21,246,109,1,0 // movaps 0x16df6(%rip),%xmm2 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,29,112,111,1,0 // addps 0x16f70(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 15,40,21,121,111,1,0 // movaps 0x16f79(%rip),%xmm2 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 65,15,94,211 // divps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,227,109,1,0 // addps 0x16de3(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 15,40,21,236,109,1,0 // movaps 0x16dec(%rip),%xmm2 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,37,102,111,1,0 // addps 0x16f66(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm2 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,40,21,236,109,1,0 // movaps 0x16dec(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,21,241,109,1,0 // movaps 0x16df1(%rip),%xmm2 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 15,40,21,116,111,1,0 // movaps 0x16f74(%rip),%xmm2 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 65,15,94,210 // divps %xmm10,%xmm2 .byte 65,15,88,212 // addps %xmm12,%xmm2 - .byte 15,89,21,242,109,1,0 // mulps 0x16df2(%rip),%xmm2 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 15,89,21,117,111,1,0 // mulps 0x16f75(%rip),%xmm2 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10 .byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2 .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2 @@ -36806,7 +37256,7 @@ _sk_parametric_b_sse41: .byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,208 // maxps %xmm0,%xmm2 - .byte 15,93,21,125,106,1,0 // minps 0x16a7d(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,93,21,0,108,1,0 // minps 0x16c00(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -36836,31 +37286,31 @@ _sk_parametric_a_sse41: .byte 68,15,88,219 // addps %xmm3,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,190,108,1,0 // mulps 0x16cbe(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,29,198,108,1,0 // andps 0x16cc6(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,29,238,105,1,0 // orps 0x169ee(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,37,198,108,1,0 // addps 0x16cc6(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 15,40,29,207,108,1,0 // movaps 0x16ccf(%rip),%xmm3 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,37,65,110,1,0 // mulps 0x16e41(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,29,73,110,1,0 // andps 0x16e49(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,29,113,107,1,0 // orps 0x16b71(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,37,73,110,1,0 // addps 0x16e49(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 15,40,29,82,110,1,0 // movaps 0x16e52(%rip),%xmm3 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,88,29,207,108,1,0 // addps 0x16ccf(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 15,40,29,216,108,1,0 // movaps 0x16cd8(%rip),%xmm3 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,29,82,110,1,0 // addps 0x16e52(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 15,40,29,91,110,1,0 // movaps 0x16e5b(%rip),%xmm3 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 65,15,94,219 // divps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,197,108,1,0 // addps 0x16cc5(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 15,40,29,206,108,1,0 // movaps 0x16cce(%rip),%xmm3 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,37,72,110,1,0 // addps 0x16e48(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 15,40,29,81,110,1,0 // movaps 0x16e51(%rip),%xmm3 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,40,21,206,108,1,0 // movaps 0x16cce(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,21,81,110,1,0 // movaps 0x16e51(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,29,211,108,1,0 // movaps 0x16cd3(%rip),%xmm3 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 15,40,29,86,110,1,0 // movaps 0x16e56(%rip),%xmm3 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 65,15,94,218 // divps %xmm10,%xmm3 .byte 65,15,88,220 // addps %xmm12,%xmm3 - .byte 15,89,29,212,108,1,0 // mulps 0x16cd4(%rip),%xmm3 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 15,89,29,87,110,1,0 // mulps 0x16e57(%rip),%xmm3 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10 .byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 @@ -36868,7 +37318,7 @@ _sk_parametric_a_sse41: .byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,216 // maxps %xmm0,%xmm3 - .byte 15,93,29,95,105,1,0 // minps 0x1695f(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,93,29,226,106,1,0 // minps 0x16ae2(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -36885,20 +37335,20 @@ _sk_gamma_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0 - .byte 15,89,5,222,107,1,0 // mulps 0x16bde(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,40,53,230,107,1,0 // movaps 0x16be6(%rip),%xmm14 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> + .byte 15,89,5,97,109,1,0 // mulps 0x16d61(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,40,53,105,109,1,0 // movaps 0x16d69(%rip),%xmm14 # 2c090 <_sk_overlay_sse2_8bit+0x10db> .byte 65,15,84,214 // andps %xmm14,%xmm2 - .byte 68,15,40,37,10,105,1,0 // movaps 0x1690a(%rip),%xmm12 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,37,141,106,1,0 // movaps 0x16a8d(%rip),%xmm12 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,86,212 // orps %xmm12,%xmm2 - .byte 68,15,40,21,222,107,1,0 // movaps 0x16bde(%rip),%xmm10 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> + .byte 68,15,40,21,97,109,1,0 // movaps 0x16d61(%rip),%xmm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> .byte 65,15,88,194 // addps %xmm10,%xmm0 - .byte 68,15,40,29,226,107,1,0 // movaps 0x16be2(%rip),%xmm11 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,40,29,101,109,1,0 // movaps 0x16d65(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 15,40,226 // movaps %xmm2,%xmm4 .byte 65,15,89,227 // mulps %xmm11,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 68,15,40,13,224,107,1,0 // movaps 0x16be0(%rip),%xmm9 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> + .byte 68,15,40,13,99,109,1,0 // movaps 0x16d63(%rip),%xmm9 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> .byte 65,15,88,209 // addps %xmm9,%xmm2 - .byte 68,15,40,45,228,107,1,0 // movaps 0x16be4(%rip),%xmm13 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,40,45,103,109,1,0 // movaps 0x16d67(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 65,15,40,229 // movaps %xmm13,%xmm4 .byte 15,94,226 // divps %xmm2,%xmm4 .byte 72,173 // lods %ds:(%rsi),%rax @@ -36909,21 +37359,21 @@ _sk_gamma_sse41: .byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 15,40,53,199,107,1,0 // movaps 0x16bc7(%rip),%xmm6 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> + .byte 15,40,53,74,109,1,0 // movaps 0x16d4a(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> .byte 15,88,198 // addps %xmm6,%xmm0 - .byte 15,40,61,221,107,1,0 // movaps 0x16bdd(%rip),%xmm7 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 15,40,61,96,109,1,0 // movaps 0x16d60(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 15,40,239 // movaps %xmm7,%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,212 // movaps %xmm4,%xmm2 - .byte 15,40,37,189,107,1,0 // movaps 0x16bbd(%rip),%xmm4 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 15,40,37,64,109,1,0 // movaps 0x16d40(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 15,92,194 // subps %xmm2,%xmm0 - .byte 68,15,40,61,207,107,1,0 // movaps 0x16bcf(%rip),%xmm15 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 68,15,40,61,82,109,1,0 // movaps 0x16d52(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 65,15,40,215 // movaps %xmm15,%xmm2 .byte 15,94,213 // divps %xmm5,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 15,89,5,43,107,1,0 // mulps 0x16b2b(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> + .byte 15,89,5,174,108,1,0 // mulps 0x16cae(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> .byte 65,15,84,206 // andps %xmm14,%xmm1 .byte 65,15,86,204 // orps %xmm12,%xmm1 .byte 65,15,88,194 // addps %xmm10,%xmm0 @@ -36949,8 +37399,8 @@ _sk_gamma_sse41: .byte 15,94,206 // divps %xmm6,%xmm1 .byte 15,88,200 // addps %xmm0,%xmm1 .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0 - .byte 15,89,5,204,106,1,0 // mulps 0x16acc(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 15,84,29,213,106,1,0 // andps 0x16ad5(%rip),%xmm3 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> + .byte 15,89,5,79,108,1,0 // mulps 0x16c4f(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 15,84,29,88,108,1,0 // andps 0x16c58(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db> .byte 65,15,86,220 // orps %xmm12,%xmm3 .byte 65,15,88,194 // addps %xmm10,%xmm0 .byte 68,15,89,219 // mulps %xmm3,%xmm11 @@ -36968,7 +37418,7 @@ _sk_gamma_sse41: .byte 15,92,253 // subps %xmm5,%xmm7 .byte 68,15,94,255 // divps %xmm7,%xmm15 .byte 68,15,88,248 // addps %xmm0,%xmm15 - .byte 15,40,5,29,107,1,0 // movaps 0x16b1d(%rip),%xmm0 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 15,40,5,160,108,1,0 // movaps 0x16ca0(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 15,89,208 // mulps %xmm0,%xmm2 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 68,15,89,248 // mulps %xmm0,%xmm15 @@ -36988,29 +37438,29 @@ HIDDEN _sk_lab_to_xyz_sse41 FUNCTION(_sk_lab_to_xyz_sse41) _sk_lab_to_xyz_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,89,5,237,106,1,0 // mulps 0x16aed(%rip),%xmm8 # 2bb30 <_sk_overlay_sse2_8bit+0x116f> - .byte 68,15,40,13,101,104,1,0 // movaps 0x16865(%rip),%xmm9 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,89,5,112,108,1,0 // mulps 0x16c70(%rip),%xmm8 # 2c130 <_sk_overlay_sse2_8bit+0x117b> + .byte 68,15,40,13,232,105,1,0 // movaps 0x169e8(%rip),%xmm9 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 65,15,89,201 // mulps %xmm9,%xmm1 - .byte 15,40,5,234,106,1,0 // movaps 0x16aea(%rip),%xmm0 # 2bb40 <_sk_overlay_sse2_8bit+0x117f> + .byte 15,40,5,109,108,1,0 // movaps 0x16c6d(%rip),%xmm0 # 2c140 <_sk_overlay_sse2_8bit+0x118b> .byte 15,88,200 // addps %xmm0,%xmm1 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,88,5,232,106,1,0 // addps 0x16ae8(%rip),%xmm8 # 2bb50 <_sk_overlay_sse2_8bit+0x118f> - .byte 68,15,89,5,240,106,1,0 // mulps 0x16af0(%rip),%xmm8 # 2bb60 <_sk_overlay_sse2_8bit+0x119f> - .byte 15,89,13,249,106,1,0 // mulps 0x16af9(%rip),%xmm1 # 2bb70 <_sk_overlay_sse2_8bit+0x11af> + .byte 68,15,88,5,107,108,1,0 // addps 0x16c6b(%rip),%xmm8 # 2c150 <_sk_overlay_sse2_8bit+0x119b> + .byte 68,15,89,5,115,108,1,0 // mulps 0x16c73(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x11ab> + .byte 15,89,13,124,108,1,0 // mulps 0x16c7c(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb> .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 15,89,21,254,106,1,0 // mulps 0x16afe(%rip),%xmm2 # 2bb80 <_sk_overlay_sse2_8bit+0x11bf> + .byte 15,89,21,129,108,1,0 // mulps 0x16c81(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb> .byte 69,15,40,208 // movaps %xmm8,%xmm10 .byte 68,15,92,210 // subps %xmm2,%xmm10 .byte 68,15,40,217 // movaps %xmm1,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 .byte 68,15,89,217 // mulps %xmm1,%xmm11 - .byte 68,15,40,13,242,106,1,0 // movaps 0x16af2(%rip),%xmm9 # 2bb90 <_sk_overlay_sse2_8bit+0x11cf> + .byte 68,15,40,13,117,108,1,0 // movaps 0x16c75(%rip),%xmm9 # 2c190 <_sk_overlay_sse2_8bit+0x11db> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 15,40,21,242,106,1,0 // movaps 0x16af2(%rip),%xmm2 # 2bba0 <_sk_overlay_sse2_8bit+0x11df> + .byte 15,40,21,117,108,1,0 // movaps 0x16c75(%rip),%xmm2 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb> .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 68,15,40,37,247,106,1,0 // movaps 0x16af7(%rip),%xmm12 # 2bbb0 <_sk_overlay_sse2_8bit+0x11ef> + .byte 68,15,40,37,122,108,1,0 // movaps 0x16c7a(%rip),%xmm12 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb> .byte 65,15,89,204 // mulps %xmm12,%xmm1 .byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1 .byte 69,15,40,216 // movaps %xmm8,%xmm11 @@ -37029,8 +37479,8 @@ _sk_lab_to_xyz_sse41: .byte 65,15,89,212 // mulps %xmm12,%xmm2 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2 - .byte 15,89,13,176,106,1,0 // mulps 0x16ab0(%rip),%xmm1 # 2bbc0 <_sk_overlay_sse2_8bit+0x11ff> - .byte 15,89,21,185,106,1,0 // mulps 0x16ab9(%rip),%xmm2 # 2bbd0 <_sk_overlay_sse2_8bit+0x120f> + .byte 15,89,13,51,108,1,0 // mulps 0x16c33(%rip),%xmm1 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b> + .byte 15,89,21,60,108,1,0 // mulps 0x16c3c(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,40,200 // movaps %xmm8,%xmm1 @@ -37047,11 +37497,11 @@ _sk_load_a8_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,39 // jne 15161 <_sk_load_a8_sse41+0x3f> + .byte 117,39 // jne 155de <_sk_load_a8_sse41+0x3f> .byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0 - .byte 102,15,219,5,55,103,1,0 // pand 0x16737(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,5,186,104,1,0 // pand 0x168ba(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,125,104,1,0 // mulps 0x1687d(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,29,0,106,1,0 // mulps 0x16a00(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -37060,12 +37510,12 @@ _sk_load_a8_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 151a3 <_sk_load_a8_sse41+0x81> + .byte 116,53 // je 15620 <_sk_load_a8_sse41+0x81> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1518d <_sk_load_a8_sse41+0x6b> + .byte 116,21 // je 1560a <_sk_load_a8_sse41+0x6b> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,195 // jne 15141 <_sk_load_a8_sse41+0x1f> + .byte 117,195 // jne 155be <_sk_load_a8_sse41+0x1f> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -37073,10 +37523,10 @@ _sk_load_a8_sse41: .byte 102,15,110,200 // movd %eax,%xmm1 .byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1 .byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0 - .byte 235,158 // jmp 15141 <_sk_load_a8_sse41+0x1f> + .byte 235,158 // jmp 155be <_sk_load_a8_sse41+0x1f> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,147 // jmp 15141 <_sk_load_a8_sse41+0x1f> + .byte 235,147 // jmp 155be <_sk_load_a8_sse41+0x1f> HIDDEN _sk_load_a8_dst_sse41 .globl _sk_load_a8_dst_sse41 @@ -37089,11 +37539,11 @@ _sk_load_a8_dst_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,39 // jne 151ed <_sk_load_a8_dst_sse41+0x3f> + .byte 117,39 // jne 1566a <_sk_load_a8_dst_sse41+0x3f> .byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4 - .byte 102,15,219,37,171,102,1,0 // pand 0x166ab(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,37,46,104,1,0 // pand 0x1682e(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,252 // cvtdq2ps %xmm4,%xmm7 - .byte 15,89,61,241,103,1,0 // mulps 0x167f1(%rip),%xmm7 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,61,116,105,1,0 // mulps 0x16974(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 102,15,239,237 // pxor %xmm5,%xmm5 @@ -37102,12 +37552,12 @@ _sk_load_a8_dst_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 1522f <_sk_load_a8_dst_sse41+0x81> + .byte 116,53 // je 156ac <_sk_load_a8_dst_sse41+0x81> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 15219 <_sk_load_a8_dst_sse41+0x6b> + .byte 116,21 // je 15696 <_sk_load_a8_dst_sse41+0x6b> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,195 // jne 151cd <_sk_load_a8_dst_sse41+0x1f> + .byte 117,195 // jne 1564a <_sk_load_a8_dst_sse41+0x1f> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -37115,10 +37565,10 @@ _sk_load_a8_dst_sse41: .byte 102,15,110,232 // movd %eax,%xmm5 .byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5 .byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4 - .byte 235,158 // jmp 151cd <_sk_load_a8_dst_sse41+0x1f> + .byte 235,158 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 - .byte 235,147 // jmp 151cd <_sk_load_a8_dst_sse41+0x1f> + .byte 235,147 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f> HIDDEN _sk_gather_a8_sse41 .globl _sk_gather_a8_sse41 @@ -37147,7 +37597,7 @@ _sk_gather_a8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,38,103,1,0 // mulps 0x16726(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,29,169,104,1,0 // mulps 0x168a9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -37165,13 +37615,13 @@ _sk_store_a8_sse41: .byte 77,15,175,202 // imul %r10,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 - .byte 68,15,40,5,219,101,1,0 // movaps 0x165db(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,94,103,1,0 // movaps 0x1675e(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,13 // jne 152fb <_sk_store_a8_sse41+0x41> + .byte 117,13 // jne 15778 <_sk_store_a8_sse41+0x41> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 67,137,4,25 // mov %eax,(%r9,%r11,1) .byte 72,173 // lods %ds:(%rsi),%rax @@ -37180,17 +37630,17 @@ _sk_store_a8_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,41 // je 15337 <_sk_store_a8_sse41+0x7d> + .byte 116,41 // je 157b4 <_sk_store_a8_sse41+0x7d> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,15 // je 15323 <_sk_store_a8_sse41+0x69> + .byte 116,15 // je 157a0 <_sk_store_a8_sse41+0x69> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,221 // jne 152f7 <_sk_store_a8_sse41+0x3d> + .byte 117,221 // jne 15774 <_sk_store_a8_sse41+0x3d> .byte 102,71,15,58,20,68,25,2,8 // pextrb $0x8,%xmm8,0x2(%r9,%r11,1) - .byte 102,68,15,56,0,5,179,104,1,0 // pshufb 0x168b3(%rip),%xmm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x121f> + .byte 102,68,15,56,0,5,54,106,1,0 // pshufb 0x16a36(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x122b> .byte 102,71,15,58,21,4,25,0 // pextrw $0x0,%xmm8,(%r9,%r11,1) - .byte 235,192 // jmp 152f7 <_sk_store_a8_sse41+0x3d> + .byte 235,192 // jmp 15774 <_sk_store_a8_sse41+0x3d> .byte 102,71,15,58,20,4,25,0 // pextrb $0x0,%xmm8,(%r9,%r11,1) - .byte 235,182 // jmp 152f7 <_sk_store_a8_sse41+0x3d> + .byte 235,182 // jmp 15774 <_sk_store_a8_sse41+0x3d> HIDDEN _sk_load_g8_sse41 .globl _sk_load_g8_sse41 @@ -37203,25 +37653,25 @@ _sk_load_g8_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,42 // jne 15383 <_sk_load_g8_sse41+0x42> + .byte 117,42 // jne 15800 <_sk_load_g8_sse41+0x42> .byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0 - .byte 102,15,219,5,24,101,1,0 // pand 0x16518(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,5,155,102,1,0 // pand 0x1669b(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,94,102,1,0 // mulps 0x1665e(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,5,225,103,1,0 // mulps 0x167e1(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,85,100,1,0 // movaps 0x16455(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,216,101,1,0 // movaps 0x165d8(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 153c5 <_sk_load_g8_sse41+0x84> + .byte 116,53 // je 15842 <_sk_load_g8_sse41+0x84> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 153af <_sk_load_g8_sse41+0x6e> + .byte 116,21 // je 1582c <_sk_load_g8_sse41+0x6e> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,192 // jne 15360 <_sk_load_g8_sse41+0x1f> + .byte 117,192 // jne 157dd <_sk_load_g8_sse41+0x1f> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -37229,10 +37679,10 @@ _sk_load_g8_sse41: .byte 102,15,110,200 // movd %eax,%xmm1 .byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1 .byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0 - .byte 235,155 // jmp 15360 <_sk_load_g8_sse41+0x1f> + .byte 235,155 // jmp 157dd <_sk_load_g8_sse41+0x1f> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,144 // jmp 15360 <_sk_load_g8_sse41+0x1f> + .byte 235,144 // jmp 157dd <_sk_load_g8_sse41+0x1f> HIDDEN _sk_load_g8_dst_sse41 .globl _sk_load_g8_dst_sse41 @@ -37245,25 +37695,25 @@ _sk_load_g8_dst_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,42 // jne 15412 <_sk_load_g8_dst_sse41+0x42> + .byte 117,42 // jne 1588f <_sk_load_g8_dst_sse41+0x42> .byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4 - .byte 102,15,219,37,137,100,1,0 // pand 0x16489(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,37,12,102,1,0 // pand 0x1660c(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,207,101,1,0 // mulps 0x165cf(%rip),%xmm4 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,37,82,103,1,0 // mulps 0x16752(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,198,99,1,0 // movaps 0x163c6(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,61,73,101,1,0 // movaps 0x16549(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 15454 <_sk_load_g8_dst_sse41+0x84> + .byte 116,53 // je 158d1 <_sk_load_g8_dst_sse41+0x84> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1543e <_sk_load_g8_dst_sse41+0x6e> + .byte 116,21 // je 158bb <_sk_load_g8_dst_sse41+0x6e> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,192 // jne 153ef <_sk_load_g8_dst_sse41+0x1f> + .byte 117,192 // jne 1586c <_sk_load_g8_dst_sse41+0x1f> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -37271,10 +37721,10 @@ _sk_load_g8_dst_sse41: .byte 102,15,110,232 // movd %eax,%xmm5 .byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5 .byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4 - .byte 235,155 // jmp 153ef <_sk_load_g8_dst_sse41+0x1f> + .byte 235,155 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 - .byte 235,144 // jmp 153ef <_sk_load_g8_dst_sse41+0x1f> + .byte 235,144 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f> HIDDEN _sk_gather_g8_sse41 .globl _sk_gather_g8_sse41 @@ -37303,9 +37753,9 @@ _sk_gather_g8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,1,101,1,0 // mulps 0x16501(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,5,132,102,1,0 // mulps 0x16684(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,248,98,1,0 // movaps 0x162f8(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,123,100,1,0 // movaps 0x1647b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 91 // pop %rbx @@ -37323,41 +37773,41 @@ _sk_load_565_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,80 // jne 1554c <_sk_load_565_sse41+0x6b> + .byte 117,80 // jne 159c9 <_sk_load_565_sse41+0x6b> .byte 102,67,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm2 - .byte 102,15,111,5,213,100,1,0 // movdqa 0x164d5(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> + .byte 102,15,111,5,88,102,1,0 // movdqa 0x16658(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,215,100,1,0 // mulps 0x164d7(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,15,111,13,223,100,1,0 // movdqa 0x164df(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> + .byte 15,89,5,90,102,1,0 // mulps 0x1665a(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,13,98,102,1,0 // movdqa 0x16662(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,225,100,1,0 // mulps 0x164e1(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,15,219,21,233,100,1,0 // pand 0x164e9(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 15,89,13,100,102,1,0 // mulps 0x16664(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,15,219,21,108,102,1,0 // pand 0x1666c(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,239,100,1,0 // mulps 0x164ef(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> + .byte 15,89,21,114,102,1,0 // mulps 0x16672(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,134,98,1,0 // movaps 0x16286(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,9,100,1,0 // movaps 0x16409(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 1558e <_sk_load_565_sse41+0xad> + .byte 116,53 // je 15a0b <_sk_load_565_sse41+0xad> .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 15578 <_sk_load_565_sse41+0x97> + .byte 116,21 // je 159f5 <_sk_load_565_sse41+0x97> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,154 // jne 15503 <_sk_load_565_sse41+0x22> + .byte 117,154 // jne 15980 <_sk_load_565_sse41+0x22> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2 .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 .byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2 - .byte 233,117,255,255,255 // jmpq 15503 <_sk_load_565_sse41+0x22> + .byte 233,117,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,208 // movd %eax,%xmm2 - .byte 233,103,255,255,255 // jmpq 15503 <_sk_load_565_sse41+0x22> + .byte 233,103,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22> HIDDEN _sk_load_565_dst_sse41 .globl _sk_load_565_dst_sse41 @@ -37371,41 +37821,41 @@ _sk_load_565_dst_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,80 // jne 15607 <_sk_load_565_dst_sse41+0x6b> + .byte 117,80 // jne 15a84 <_sk_load_565_dst_sse41+0x6b> .byte 102,67,15,56,51,52,89 // pmovzxwd (%r9,%r11,2),%xmm6 - .byte 102,15,111,37,26,100,1,0 // movdqa 0x1641a(%rip),%xmm4 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> + .byte 102,15,111,37,157,101,1,0 // movdqa 0x1659d(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,28,100,1,0 // mulps 0x1641c(%rip),%xmm4 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,15,111,45,36,100,1,0 // movdqa 0x16424(%rip),%xmm5 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> + .byte 15,89,37,159,101,1,0 // mulps 0x1659f(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,45,167,101,1,0 // movdqa 0x165a7(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b> .byte 102,15,219,238 // pand %xmm6,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,38,100,1,0 // mulps 0x16426(%rip),%xmm5 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,15,219,53,46,100,1,0 // pand 0x1642e(%rip),%xmm6 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 15,89,45,169,101,1,0 // mulps 0x165a9(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,15,219,53,177,101,1,0 // pand 0x165b1(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,52,100,1,0 // mulps 0x16434(%rip),%xmm6 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> + .byte 15,89,53,183,101,1,0 // mulps 0x165b7(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,203,97,1,0 // movaps 0x161cb(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,61,78,99,1,0 // movaps 0x1634e(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 15649 <_sk_load_565_dst_sse41+0xad> + .byte 116,53 // je 15ac6 <_sk_load_565_dst_sse41+0xad> .byte 102,15,239,246 // pxor %xmm6,%xmm6 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 15633 <_sk_load_565_dst_sse41+0x97> + .byte 116,21 // je 15ab0 <_sk_load_565_dst_sse41+0x97> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,154 // jne 155be <_sk_load_565_dst_sse41+0x22> + .byte 117,154 // jne 15a3b <_sk_load_565_dst_sse41+0x22> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6 .byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4 .byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4 .byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6 - .byte 233,117,255,255,255 // jmpq 155be <_sk_load_565_dst_sse41+0x22> + .byte 233,117,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,240 // movd %eax,%xmm6 - .byte 233,103,255,255,255 // jmpq 155be <_sk_load_565_dst_sse41+0x22> + .byte 233,103,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22> HIDDEN _sk_gather_565_sse41 .globl _sk_gather_565_sse41 @@ -37433,19 +37883,19 @@ _sk_gather_565_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2 - .byte 102,15,111,5,31,99,1,0 // movdqa 0x1631f(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> + .byte 102,15,111,5,162,100,1,0 // movdqa 0x164a2(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,33,99,1,0 // mulps 0x16321(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,15,111,13,41,99,1,0 // movdqa 0x16329(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> + .byte 15,89,5,164,100,1,0 // mulps 0x164a4(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,13,172,100,1,0 // movdqa 0x164ac(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,43,99,1,0 // mulps 0x1632b(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,15,219,21,51,99,1,0 // pand 0x16333(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 15,89,13,174,100,1,0 // mulps 0x164ae(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,15,219,21,182,100,1,0 // pand 0x164b6(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,57,99,1,0 // mulps 0x16339(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> + .byte 15,89,21,188,100,1,0 // mulps 0x164bc(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,208,96,1,0 // movaps 0x160d0(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,83,98,1,0 // movaps 0x16253(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -37460,12 +37910,12 @@ _sk_store_565_sse41: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 68,15,40,5,207,100,1,0 // movaps 0x164cf(%rip),%xmm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x122f> + .byte 68,15,40,5,82,102,1,0 // movaps 0x16652(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,196,100,1,0 // movaps 0x164c4(%rip),%xmm10 # 2bc00 <_sk_overlay_sse2_8bit+0x123f> + .byte 68,15,40,21,71,102,1,0 // movaps 0x16647(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -37475,7 +37925,7 @@ _sk_store_565_sse41: .byte 102,69,15,86,194 // orpd %xmm10,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 15773 <_sk_store_565_sse41+0x70> + .byte 117,10 // jne 15bf0 <_sk_store_565_sse41+0x70> .byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -37483,17 +37933,17 @@ _sk_store_565_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,35 // je 157a9 <_sk_store_565_sse41+0xa6> + .byte 116,35 // je 15c26 <_sk_store_565_sse41+0xa6> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,15 // je 1579b <_sk_store_565_sse41+0x98> + .byte 116,15 // je 15c18 <_sk_store_565_sse41+0x98> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,221 // jne 1576f <_sk_store_565_sse41+0x6c> + .byte 117,221 // jne 15bec <_sk_store_565_sse41+0x6c> .byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2) - .byte 235,198 // jmp 1576f <_sk_store_565_sse41+0x6c> + .byte 235,198 // jmp 15bec <_sk_store_565_sse41+0x6c> .byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2) - .byte 235,188 // jmp 1576f <_sk_store_565_sse41+0x6c> + .byte 235,188 // jmp 15bec <_sk_store_565_sse41+0x6c> HIDDEN _sk_load_4444_sse41 .globl _sk_load_4444_sse41 @@ -37507,44 +37957,44 @@ _sk_load_4444_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,95 // jne 1582d <_sk_load_4444_sse41+0x7a> + .byte 117,95 // jne 15caa <_sk_load_4444_sse41+0x7a> .byte 102,67,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm3 - .byte 102,15,111,5,51,100,1,0 // movdqa 0x16433(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f> + .byte 102,15,111,5,182,101,1,0 // movdqa 0x165b6(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,53,100,1,0 // mulps 0x16435(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f> - .byte 102,15,111,13,61,100,1,0 // movdqa 0x1643d(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f> + .byte 15,89,5,184,101,1,0 // mulps 0x165b8(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b> + .byte 102,15,111,13,192,101,1,0 // movdqa 0x165c0(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,63,100,1,0 // mulps 0x1643f(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f> - .byte 102,15,111,21,71,100,1,0 // movdqa 0x16447(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f> + .byte 15,89,13,194,101,1,0 // mulps 0x165c2(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b> + .byte 102,15,111,21,202,101,1,0 // movdqa 0x165ca(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,73,100,1,0 // mulps 0x16449(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f> - .byte 102,15,219,29,81,100,1,0 // pand 0x16451(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af> + .byte 15,89,21,204,101,1,0 // mulps 0x165cc(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab> + .byte 102,15,219,29,212,101,1,0 // pand 0x165d4(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,87,100,1,0 // mulps 0x16457(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf> + .byte 15,89,29,218,101,1,0 // mulps 0x165da(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 1586f <_sk_load_4444_sse41+0xbc> + .byte 116,53 // je 15cec <_sk_load_4444_sse41+0xbc> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 15859 <_sk_load_4444_sse41+0xa6> + .byte 116,21 // je 15cd6 <_sk_load_4444_sse41+0xa6> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,139 // jne 157d5 <_sk_load_4444_sse41+0x22> + .byte 117,139 // jne 15c52 <_sk_load_4444_sse41+0x22> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 .byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3 - .byte 233,102,255,255,255 // jmpq 157d5 <_sk_load_4444_sse41+0x22> + .byte 233,102,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,216 // movd %eax,%xmm3 - .byte 233,88,255,255,255 // jmpq 157d5 <_sk_load_4444_sse41+0x22> + .byte 233,88,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22> HIDDEN _sk_load_4444_dst_sse41 .globl _sk_load_4444_dst_sse41 @@ -37558,44 +38008,44 @@ _sk_load_4444_dst_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,95 // jne 158f7 <_sk_load_4444_dst_sse41+0x7a> + .byte 117,95 // jne 15d74 <_sk_load_4444_dst_sse41+0x7a> .byte 102,67,15,56,51,60,89 // pmovzxwd (%r9,%r11,2),%xmm7 - .byte 102,15,111,37,105,99,1,0 // movdqa 0x16369(%rip),%xmm4 # 2bc10 <_sk_overlay_sse2_8bit+0x124f> + .byte 102,15,111,37,236,100,1,0 // movdqa 0x164ec(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,107,99,1,0 // mulps 0x1636b(%rip),%xmm4 # 2bc20 <_sk_overlay_sse2_8bit+0x125f> - .byte 102,15,111,45,115,99,1,0 // movdqa 0x16373(%rip),%xmm5 # 2bc30 <_sk_overlay_sse2_8bit+0x126f> + .byte 15,89,37,238,100,1,0 // mulps 0x164ee(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b> + .byte 102,15,111,45,246,100,1,0 // movdqa 0x164f6(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b> .byte 102,15,219,239 // pand %xmm7,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,117,99,1,0 // mulps 0x16375(%rip),%xmm5 # 2bc40 <_sk_overlay_sse2_8bit+0x127f> - .byte 102,15,111,53,125,99,1,0 // movdqa 0x1637d(%rip),%xmm6 # 2bc50 <_sk_overlay_sse2_8bit+0x128f> + .byte 15,89,45,248,100,1,0 // mulps 0x164f8(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b> + .byte 102,15,111,53,0,101,1,0 // movdqa 0x16500(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b> .byte 102,15,219,247 // pand %xmm7,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,127,99,1,0 // mulps 0x1637f(%rip),%xmm6 # 2bc60 <_sk_overlay_sse2_8bit+0x129f> - .byte 102,15,219,61,135,99,1,0 // pand 0x16387(%rip),%xmm7 # 2bc70 <_sk_overlay_sse2_8bit+0x12af> + .byte 15,89,53,2,101,1,0 // mulps 0x16502(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab> + .byte 102,15,219,61,10,101,1,0 // pand 0x1650a(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb> .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 15,89,61,141,99,1,0 // mulps 0x1638d(%rip),%xmm7 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf> + .byte 15,89,61,16,101,1,0 // mulps 0x16510(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,53 // je 15939 <_sk_load_4444_dst_sse41+0xbc> + .byte 116,53 // je 15db6 <_sk_load_4444_dst_sse41+0xbc> .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 15923 <_sk_load_4444_dst_sse41+0xa6> + .byte 116,21 // je 15da0 <_sk_load_4444_dst_sse41+0xa6> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,139 // jne 1589f <_sk_load_4444_dst_sse41+0x22> + .byte 117,139 // jne 15d1c <_sk_load_4444_dst_sse41+0x22> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7 .byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4 .byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4 .byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7 - .byte 233,102,255,255,255 // jmpq 1589f <_sk_load_4444_dst_sse41+0x22> + .byte 233,102,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,248 // movd %eax,%xmm7 - .byte 233,88,255,255,255 // jmpq 1589f <_sk_load_4444_dst_sse41+0x22> + .byte 233,88,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22> HIDDEN _sk_gather_4444_sse41 .globl _sk_gather_4444_sse41 @@ -37623,21 +38073,21 @@ _sk_gather_4444_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3 - .byte 102,15,111,5,95,98,1,0 // movdqa 0x1625f(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f> + .byte 102,15,111,5,226,99,1,0 // movdqa 0x163e2(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,97,98,1,0 // mulps 0x16261(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f> - .byte 102,15,111,13,105,98,1,0 // movdqa 0x16269(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f> + .byte 15,89,5,228,99,1,0 // mulps 0x163e4(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b> + .byte 102,15,111,13,236,99,1,0 // movdqa 0x163ec(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,107,98,1,0 // mulps 0x1626b(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f> - .byte 102,15,111,21,115,98,1,0 // movdqa 0x16273(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f> + .byte 15,89,13,238,99,1,0 // mulps 0x163ee(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b> + .byte 102,15,111,21,246,99,1,0 // movdqa 0x163f6(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,117,98,1,0 // mulps 0x16275(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f> - .byte 102,15,219,29,125,98,1,0 // pand 0x1627d(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af> + .byte 15,89,21,248,99,1,0 // mulps 0x163f8(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab> + .byte 102,15,219,29,0,100,1,0 // pand 0x16400(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,131,98,1,0 // mulps 0x16283(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf> + .byte 15,89,29,6,100,1,0 // mulps 0x16406(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -37653,7 +38103,7 @@ _sk_store_4444_sse41: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 68,15,40,5,112,98,1,0 // movaps 0x16270(%rip),%xmm8 # 2bc90 <_sk_overlay_sse2_8bit+0x12cf> + .byte 68,15,40,5,243,99,1,0 // movaps 0x163f3(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -37673,7 +38123,7 @@ _sk_store_4444_sse41: .byte 102,69,15,86,194 // orpd %xmm10,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 15a86 <_sk_store_4444_sse41+0x84> + .byte 117,10 // jne 15f03 <_sk_store_4444_sse41+0x84> .byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -37681,17 +38131,17 @@ _sk_store_4444_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,35 // je 15abc <_sk_store_4444_sse41+0xba> + .byte 116,35 // je 15f39 <_sk_store_4444_sse41+0xba> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,15 // je 15aae <_sk_store_4444_sse41+0xac> + .byte 116,15 // je 15f2b <_sk_store_4444_sse41+0xac> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,221 // jne 15a82 <_sk_store_4444_sse41+0x80> + .byte 117,221 // jne 15eff <_sk_store_4444_sse41+0x80> .byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2) - .byte 235,198 // jmp 15a82 <_sk_store_4444_sse41+0x80> + .byte 235,198 // jmp 15eff <_sk_store_4444_sse41+0x80> .byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2) - .byte 235,188 // jmp 15a82 <_sk_store_4444_sse41+0x80> + .byte 235,188 // jmp 15eff <_sk_store_4444_sse41+0x80> HIDDEN _sk_load_8888_sse41 .globl _sk_load_8888_sse41 @@ -37705,19 +38155,19 @@ _sk_load_8888_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,89 // jne 15b3b <_sk_load_8888_sse41+0x75> + .byte 117,89 // jne 15fb8 <_sk_load_8888_sse41+0x75> .byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3 - .byte 102,15,111,5,144,93,1,0 // movdqa 0x15d90(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,5,19,95,1,0 // movdqa 0x15f13(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,209,94,1,0 // movaps 0x15ed1(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,84,96,1,0 // movaps 0x16054(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,128,93,1,0 // pshufb 0x15d80(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,13,3,95,1,0 // pshufb 0x15f03(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,124,93,1,0 // pshufb 0x15d7c(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,21,255,94,1,0 // pshufb 0x15eff(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -37728,19 +38178,19 @@ _sk_load_8888_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,45 // je 15b75 <_sk_load_8888_sse41+0xaf> + .byte 116,45 // je 15ff2 <_sk_load_8888_sse41+0xaf> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,18 // je 15b64 <_sk_load_8888_sse41+0x9e> + .byte 116,18 // je 15fe1 <_sk_load_8888_sse41+0x9e> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,144 // jne 15ae8 <_sk_load_8888_sse41+0x22> + .byte 117,144 // jne 15f65 <_sk_load_8888_sse41+0x22> .byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0 .byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3 - .byte 233,115,255,255,255 // jmpq 15ae8 <_sk_load_8888_sse41+0x22> + .byte 233,115,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22> .byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3 - .byte 233,104,255,255,255 // jmpq 15ae8 <_sk_load_8888_sse41+0x22> + .byte 233,104,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22> HIDDEN _sk_load_8888_dst_sse41 .globl _sk_load_8888_dst_sse41 @@ -37754,19 +38204,19 @@ _sk_load_8888_dst_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,89 // jne 15bf5 <_sk_load_8888_dst_sse41+0x75> + .byte 117,89 // jne 16072 <_sk_load_8888_dst_sse41+0x75> .byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7 - .byte 102,15,111,37,214,92,1,0 // movdqa 0x15cd6(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,37,89,94,1,0 // movdqa 0x15e59(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 68,15,40,5,23,94,1,0 // movaps 0x15e17(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,154,95,1,0 // movaps 0x15f9a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,224 // mulps %xmm8,%xmm4 .byte 102,15,111,239 // movdqa %xmm7,%xmm5 - .byte 102,15,56,0,45,198,92,1,0 // pshufb 0x15cc6(%rip),%xmm5 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,45,73,94,1,0 // pshufb 0x15e49(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 .byte 65,15,89,232 // mulps %xmm8,%xmm5 .byte 102,15,111,247 // movdqa %xmm7,%xmm6 - .byte 102,15,56,0,53,194,92,1,0 // pshufb 0x15cc2(%rip),%xmm6 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,53,69,94,1,0 // pshufb 0x15e45(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 65,15,89,240 // mulps %xmm8,%xmm6 .byte 102,15,114,215,24 // psrld $0x18,%xmm7 @@ -37777,19 +38227,19 @@ _sk_load_8888_dst_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,45 // je 15c2f <_sk_load_8888_dst_sse41+0xaf> + .byte 116,45 // je 160ac <_sk_load_8888_dst_sse41+0xaf> .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,18 // je 15c1e <_sk_load_8888_dst_sse41+0x9e> + .byte 116,18 // je 1609b <_sk_load_8888_dst_sse41+0x9e> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,144 // jne 15ba2 <_sk_load_8888_dst_sse41+0x22> + .byte 117,144 // jne 1601f <_sk_load_8888_dst_sse41+0x22> .byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4 .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7 .byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4 .byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7 - .byte 233,115,255,255,255 // jmpq 15ba2 <_sk_load_8888_dst_sse41+0x22> + .byte 233,115,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22> .byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7 - .byte 233,104,255,255,255 // jmpq 15ba2 <_sk_load_8888_dst_sse41+0x22> + .byte 233,104,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22> HIDDEN _sk_gather_8888_sse41 .globl _sk_gather_8888_sse41 @@ -37814,17 +38264,17 @@ _sk_gather_8888_sse41: .byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3 .byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3 .byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3 - .byte 102,15,111,5,229,91,1,0 // movdqa 0x15be5(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,5,104,93,1,0 // movdqa 0x15d68(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,38,93,1,0 // movaps 0x15d26(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,169,94,1,0 // movaps 0x15ea9(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,213,91,1,0 // pshufb 0x15bd5(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,13,88,93,1,0 // pshufb 0x15d58(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,209,91,1,0 // pshufb 0x15bd1(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,21,84,93,1,0 // pshufb 0x15d54(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -37845,7 +38295,7 @@ _sk_store_8888_sse41: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 68,15,40,5,170,91,1,0 // movaps 0x15baa(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,45,93,1,0 // movaps 0x15d2d(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -37864,23 +38314,23 @@ _sk_store_8888_sse41: .byte 102,69,15,235,193 // por %xmm9,%xmm8 .byte 102,69,15,235,194 // por %xmm10,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 15d66 <_sk_store_8888_sse41+0x7f> + .byte 117,10 // jne 161e3 <_sk_store_8888_sse41+0x7f> .byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,29 // je 15d90 <_sk_store_8888_sse41+0xa9> + .byte 116,29 // je 1620d <_sk_store_8888_sse41+0xa9> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,15 // je 15d88 <_sk_store_8888_sse41+0xa1> + .byte 116,15 // je 16205 <_sk_store_8888_sse41+0xa1> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,227 // jne 15d62 <_sk_store_8888_sse41+0x7b> + .byte 117,227 // jne 161df <_sk_store_8888_sse41+0x7b> .byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4) .byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4) - .byte 235,210 // jmp 15d62 <_sk_store_8888_sse41+0x7b> + .byte 235,210 // jmp 161df <_sk_store_8888_sse41+0x7b> .byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4) - .byte 235,202 // jmp 15d62 <_sk_store_8888_sse41+0x7b> + .byte 235,202 // jmp 161df <_sk_store_8888_sse41+0x7b> HIDDEN _sk_load_bgra_sse41 .globl _sk_load_bgra_sse41 @@ -37894,19 +38344,19 @@ _sk_load_bgra_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,89 // jne 15e0d <_sk_load_bgra_sse41+0x75> + .byte 117,89 // jne 1628a <_sk_load_bgra_sse41+0x75> .byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3 - .byte 102,15,111,5,190,90,1,0 // movdqa 0x15abe(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,5,65,92,1,0 // movdqa 0x15c41(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,208 // cvtdq2ps %xmm0,%xmm2 - .byte 68,15,40,5,255,91,1,0 // movaps 0x15bff(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,130,93,1,0 // movaps 0x15d82(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,174,90,1,0 // pshufb 0x15aae(%rip),%xmm0 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,5,49,92,1,0 // pshufb 0x15c31(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,170,90,1,0 // pshufb 0x15aaa(%rip),%xmm0 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,5,45,92,1,0 // pshufb 0x15c2d(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -37917,19 +38367,19 @@ _sk_load_bgra_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,45 // je 15e47 <_sk_load_bgra_sse41+0xaf> + .byte 116,45 // je 162c4 <_sk_load_bgra_sse41+0xaf> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,18 // je 15e36 <_sk_load_bgra_sse41+0x9e> + .byte 116,18 // je 162b3 <_sk_load_bgra_sse41+0x9e> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,144 // jne 15dba <_sk_load_bgra_sse41+0x22> + .byte 117,144 // jne 16237 <_sk_load_bgra_sse41+0x22> .byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0 .byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3 - .byte 233,115,255,255,255 // jmpq 15dba <_sk_load_bgra_sse41+0x22> + .byte 233,115,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22> .byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3 - .byte 233,104,255,255,255 // jmpq 15dba <_sk_load_bgra_sse41+0x22> + .byte 233,104,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22> HIDDEN _sk_load_bgra_dst_sse41 .globl _sk_load_bgra_dst_sse41 @@ -37943,19 +38393,19 @@ _sk_load_bgra_dst_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,89 // jne 15ec7 <_sk_load_bgra_dst_sse41+0x75> + .byte 117,89 // jne 16344 <_sk_load_bgra_dst_sse41+0x75> .byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7 - .byte 102,15,111,37,4,90,1,0 // movdqa 0x15a04(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,37,135,91,1,0 // movdqa 0x15b87(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,244 // cvtdq2ps %xmm4,%xmm6 - .byte 68,15,40,5,69,91,1,0 // movaps 0x15b45(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,200,92,1,0 // movaps 0x15cc8(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,240 // mulps %xmm8,%xmm6 .byte 102,15,111,231 // movdqa %xmm7,%xmm4 - .byte 102,15,56,0,37,244,89,1,0 // pshufb 0x159f4(%rip),%xmm4 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,37,119,91,1,0 // pshufb 0x15b77(%rip),%xmm4 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 15,91,236 // cvtdq2ps %xmm4,%xmm5 .byte 65,15,89,232 // mulps %xmm8,%xmm5 .byte 102,15,111,231 // movdqa %xmm7,%xmm4 - .byte 102,15,56,0,37,240,89,1,0 // pshufb 0x159f0(%rip),%xmm4 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,37,115,91,1,0 // pshufb 0x15b73(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 .byte 65,15,89,224 // mulps %xmm8,%xmm4 .byte 102,15,114,215,24 // psrld $0x18,%xmm7 @@ -37966,19 +38416,19 @@ _sk_load_bgra_dst_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,45 // je 15f01 <_sk_load_bgra_dst_sse41+0xaf> + .byte 116,45 // je 1637e <_sk_load_bgra_dst_sse41+0xaf> .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,18 // je 15ef0 <_sk_load_bgra_dst_sse41+0x9e> + .byte 116,18 // je 1636d <_sk_load_bgra_dst_sse41+0x9e> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,144 // jne 15e74 <_sk_load_bgra_dst_sse41+0x22> + .byte 117,144 // jne 162f1 <_sk_load_bgra_dst_sse41+0x22> .byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4 .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7 .byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4 .byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7 - .byte 233,115,255,255,255 // jmpq 15e74 <_sk_load_bgra_dst_sse41+0x22> + .byte 233,115,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22> .byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7 - .byte 233,104,255,255,255 // jmpq 15e74 <_sk_load_bgra_dst_sse41+0x22> + .byte 233,104,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22> HIDDEN _sk_gather_bgra_sse41 .globl _sk_gather_bgra_sse41 @@ -38003,17 +38453,17 @@ _sk_gather_bgra_sse41: .byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3 .byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3 .byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3 - .byte 102,15,111,5,19,89,1,0 // movdqa 0x15913(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,5,150,90,1,0 // movdqa 0x15a96(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,208 // cvtdq2ps %xmm0,%xmm2 - .byte 68,15,40,5,84,90,1,0 // movaps 0x15a54(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,215,91,1,0 // movaps 0x15bd7(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,3,89,1,0 // pshufb 0x15903(%rip),%xmm0 # 2b890 <_sk_overlay_sse2_8bit+0xecf> + .byte 102,15,56,0,5,134,90,1,0 // pshufb 0x15a86(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb> .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,255,88,1,0 // pshufb 0x158ff(%rip),%xmm0 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf> + .byte 102,15,56,0,5,130,90,1,0 // pshufb 0x15a82(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -38034,7 +38484,7 @@ _sk_store_bgra_sse41: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 68,15,40,5,216,88,1,0 // movaps 0x158d8(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,91,90,1,0 // movaps 0x15a5b(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 68,15,40,202 // movaps %xmm2,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -38053,23 +38503,23 @@ _sk_store_bgra_sse41: .byte 102,69,15,235,193 // por %xmm9,%xmm8 .byte 102,69,15,235,194 // por %xmm10,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 16038 <_sk_store_bgra_sse41+0x7f> + .byte 117,10 // jne 164b5 <_sk_store_bgra_sse41+0x7f> .byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,29 // je 16062 <_sk_store_bgra_sse41+0xa9> + .byte 116,29 // je 164df <_sk_store_bgra_sse41+0xa9> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,15 // je 1605a <_sk_store_bgra_sse41+0xa1> + .byte 116,15 // je 164d7 <_sk_store_bgra_sse41+0xa1> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,227 // jne 16034 <_sk_store_bgra_sse41+0x7b> + .byte 117,227 // jne 164b1 <_sk_store_bgra_sse41+0x7b> .byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4) .byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4) - .byte 235,210 // jmp 16034 <_sk_store_bgra_sse41+0x7b> + .byte 235,210 // jmp 164b1 <_sk_store_bgra_sse41+0x7b> .byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4) - .byte 235,202 // jmp 16034 <_sk_store_bgra_sse41+0x7b> + .byte 235,202 // jmp 164b1 <_sk_store_bgra_sse41+0x7b> HIDDEN _sk_load_f16_sse41 .globl _sk_load_f16_sse41 @@ -38083,7 +38533,7 @@ _sk_load_f16_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,62,1,0,0 // jne 161c8 <_sk_load_f16_sse41+0x15e> + .byte 15,133,62,1,0,0 // jne 16645 <_sk_load_f16_sse41+0x15e> .byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0 .byte 243,65,15,111,76,193,16 // movdqu 0x10(%r9,%rax,8),%xmm1 .byte 102,68,15,40,200 // movapd %xmm0,%xmm9 @@ -38093,18 +38543,18 @@ _sk_load_f16_sse41: .byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,221,91,1,0 // movdqa 0x15bdd(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df> + .byte 102,68,15,111,5,96,93,1,0 // movdqa 0x15d60(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,216,91,1,0 // movdqa 0x15bd8(%rip),%xmm3 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef> + .byte 102,15,111,29,91,93,1,0 // movdqa 0x15d5b(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,196,91,1,0 // movdqa 0x15bc4(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff> + .byte 102,68,15,111,21,71,93,1,0 // movdqa 0x15d47(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -38147,16 +38597,16 @@ _sk_load_f16_sse41: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 161e1 <_sk_load_f16_sse41+0x177> + .byte 117,13 // jne 1665e <_sk_load_f16_sse41+0x177> .byte 243,15,126,192 // movq %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,182,254,255,255 // jmpq 16097 <_sk_load_f16_sse41+0x2d> + .byte 233,182,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d> .byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,161,254,255,255 // jb 16097 <_sk_load_f16_sse41+0x2d> + .byte 15,130,161,254,255,255 // jb 16514 <_sk_load_f16_sse41+0x2d> .byte 243,65,15,126,76,193,16 // movq 0x10(%r9,%rax,8),%xmm1 - .byte 233,149,254,255,255 // jmpq 16097 <_sk_load_f16_sse41+0x2d> + .byte 233,149,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d> HIDDEN _sk_load_f16_dst_sse41 .globl _sk_load_f16_dst_sse41 @@ -38170,7 +38620,7 @@ _sk_load_f16_dst_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,62,1,0,0 // jne 16360 <_sk_load_f16_dst_sse41+0x15e> + .byte 15,133,62,1,0,0 // jne 167dd <_sk_load_f16_dst_sse41+0x15e> .byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4 .byte 243,65,15,111,108,193,16 // movdqu 0x10(%r9,%rax,8),%xmm5 .byte 102,68,15,40,204 // movapd %xmm4,%xmm9 @@ -38180,18 +38630,18 @@ _sk_load_f16_dst_sse41: .byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11 .byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9 .byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5 - .byte 102,68,15,111,5,69,90,1,0 // movdqa 0x15a45(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df> + .byte 102,68,15,111,5,200,91,1,0 // movdqa 0x15bc8(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb> .byte 102,15,111,245 // movdqa %xmm5,%xmm6 .byte 102,65,15,219,240 // pand %xmm8,%xmm6 .byte 102,15,239,238 // pxor %xmm6,%xmm5 - .byte 102,15,111,61,64,90,1,0 // movdqa 0x15a40(%rip),%xmm7 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef> + .byte 102,15,111,61,195,91,1,0 // movdqa 0x15bc3(%rip),%xmm7 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb> .byte 102,15,114,246,16 // pslld $0x10,%xmm6 .byte 102,15,111,229 // movdqa %xmm5,%xmm4 .byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4 .byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4 .byte 102,15,114,245,13 // pslld $0xd,%xmm5 .byte 102,15,235,238 // por %xmm6,%xmm5 - .byte 102,68,15,111,21,44,90,1,0 // movdqa 0x15a2c(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff> + .byte 102,68,15,111,21,175,91,1,0 // movdqa 0x15baf(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b> .byte 102,65,15,254,234 // paddd %xmm10,%xmm5 .byte 102,15,219,229 // pand %xmm5,%xmm4 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -38234,16 +38684,16 @@ _sk_load_f16_dst_sse41: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 16379 <_sk_load_f16_dst_sse41+0x177> + .byte 117,13 // jne 167f6 <_sk_load_f16_dst_sse41+0x177> .byte 243,15,126,228 // movq %xmm4,%xmm4 .byte 102,15,239,237 // pxor %xmm5,%xmm5 - .byte 233,182,254,255,255 // jmpq 1622f <_sk_load_f16_dst_sse41+0x2d> + .byte 233,182,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d> .byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4 .byte 102,15,239,237 // pxor %xmm5,%xmm5 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,161,254,255,255 // jb 1622f <_sk_load_f16_dst_sse41+0x2d> + .byte 15,130,161,254,255,255 // jb 166ac <_sk_load_f16_dst_sse41+0x2d> .byte 243,65,15,126,108,193,16 // movq 0x10(%r9,%rax,8),%xmm5 - .byte 233,149,254,255,255 // jmpq 1622f <_sk_load_f16_dst_sse41+0x2d> + .byte 233,149,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d> HIDDEN _sk_gather_f16_sse41 .globl _sk_gather_f16_sse41 @@ -38277,18 +38727,18 @@ _sk_gather_f16_sse41: .byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11 .byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,127,88,1,0 // movdqa 0x1587f(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df> + .byte 102,68,15,111,5,2,90,1,0 // movdqa 0x15a02(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,122,88,1,0 // movdqa 0x1587a(%rip),%xmm3 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef> + .byte 102,15,111,29,253,89,1,0 // movdqa 0x159fd(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,102,88,1,0 // movdqa 0x15866(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff> + .byte 102,68,15,111,21,233,89,1,0 // movdqa 0x159e9(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -38342,17 +38792,17 @@ _sk_store_f16_sse41: .byte 73,193,225,3 // shl $0x3,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 102,68,15,111,21,137,87,1,0 // movdqa 0x15789(%rip),%xmm10 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> + .byte 102,68,15,111,21,12,89,1,0 // movdqa 0x1590c(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> .byte 102,68,15,111,216 // movdqa %xmm0,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,239,235 // pxor %xmm11,%xmm13 - .byte 102,68,15,111,13,124,87,1,0 // movdqa 0x1577c(%rip),%xmm9 # 2bce0 <_sk_overlay_sse2_8bit+0x131f> + .byte 102,68,15,111,13,255,88,1,0 // movdqa 0x158ff(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b> .byte 102,65,15,114,211,16 // psrld $0x10,%xmm11 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8 .byte 102,65,15,114,213,13 // psrld $0xd,%xmm13 - .byte 102,68,15,111,37,109,87,1,0 // movdqa 0x1576d(%rip),%xmm12 # 2bcf0 <_sk_overlay_sse2_8bit+0x132f> + .byte 102,68,15,111,37,240,88,1,0 // movdqa 0x158f0(%rip),%xmm12 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b> .byte 102,69,15,235,220 // por %xmm12,%xmm11 .byte 102,69,15,254,221 // paddd %xmm13,%xmm11 .byte 102,69,15,223,195 // pandn %xmm11,%xmm8 @@ -38396,7 +38846,7 @@ _sk_store_f16_sse41: .byte 102,69,15,111,200 // movdqa %xmm8,%xmm9 .byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 16679 <_sk_store_f16_sse41+0x152> + .byte 117,21 // jne 16af6 <_sk_store_f16_sse41+0x152> .byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8) .byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8 .byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8) @@ -38404,13 +38854,13 @@ _sk_store_f16_sse41: .byte 255,224 // jmpq *%rax .byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 16675 <_sk_store_f16_sse41+0x14e> + .byte 116,240 // je 16af2 <_sk_store_f16_sse41+0x14e> .byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 16675 <_sk_store_f16_sse41+0x14e> + .byte 114,227 // jb 16af2 <_sk_store_f16_sse41+0x14e> .byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8 .byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8) - .byte 235,213 // jmp 16675 <_sk_store_f16_sse41+0x14e> + .byte 235,213 // jmp 16af2 <_sk_store_f16_sse41+0x14e> HIDDEN _sk_load_u16_be_sse41 .globl _sk_load_u16_be_sse41 @@ -38425,7 +38875,7 @@ _sk_load_u16_be_sse41: .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,185,0,0,0 // jne 16780 <_sk_load_u16_be_sse41+0xe0> + .byte 15,133,185,0,0,0 // jne 16bfd <_sk_load_u16_be_sse41+0xe0> .byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0 .byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -38441,7 +38891,7 @@ _sk_load_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,77,83,1,0 // movaps 0x1534d(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f> + .byte 68,15,40,5,208,84,1,0 // movaps 0x154d0(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -38469,16 +38919,16 @@ _sk_load_u16_be_sse41: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 16799 <_sk_load_u16_be_sse41+0xf9> + .byte 117,13 // jne 16c16 <_sk_load_u16_be_sse41+0xf9> .byte 243,15,126,192 // movq %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,59,255,255,255 // jmpq 166d4 <_sk_load_u16_be_sse41+0x34> + .byte 233,59,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34> .byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,38,255,255,255 // jb 166d4 <_sk_load_u16_be_sse41+0x34> + .byte 15,130,38,255,255,255 // jb 16b51 <_sk_load_u16_be_sse41+0x34> .byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1 - .byte 233,26,255,255,255 // jmpq 166d4 <_sk_load_u16_be_sse41+0x34> + .byte 233,26,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34> HIDDEN _sk_load_rgb_u16_be_sse41 .globl _sk_load_rgb_u16_be_sse41 @@ -38495,7 +38945,7 @@ _sk_load_rgb_u16_be_sse41: .byte 72,141,4,64 // lea (%rax,%rax,2),%rax .byte 72,193,248,32 // sar $0x20,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,170,0,0,0 // jne 1688f <_sk_load_rgb_u16_be_sse41+0xd5> + .byte 15,133,170,0,0,0 // jne 16d0c <_sk_load_rgb_u16_be_sse41+0xd5> .byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2 .byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3 .byte 102,15,115,219,4 // psrldq $0x4,%xmm3 @@ -38515,7 +38965,7 @@ _sk_load_rgb_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,28,82,1,0 // movaps 0x1521c(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f> + .byte 68,15,40,5,159,83,1,0 // movaps 0x1539f(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -38532,27 +38982,27 @@ _sk_load_rgb_u16_be_sse41: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,67,79,1,0 // movaps 0x14f43(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,198,80,1,0 // movaps 0x150c6(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 255,224 // jmpq *%rax .byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2 .byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 168b4 <_sk_load_rgb_u16_be_sse41+0xfa> + .byte 117,13 // jne 16d31 <_sk_load_rgb_u16_be_sse41+0xfa> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,85,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f> + .byte 233,85,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f> .byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0 .byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 168e5 <_sk_load_rgb_u16_be_sse41+0x12b> + .byte 114,24 // jb 16d62 <_sk_load_rgb_u16_be_sse41+0x12b> .byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3 .byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,36,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f> + .byte 233,36,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f> .byte 102,15,239,219 // pxor %xmm3,%xmm3 - .byte 233,27,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f> + .byte 233,27,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f> HIDDEN _sk_store_u16_be_sse41 .globl _sk_store_u16_be_sse41 @@ -38566,7 +39016,7 @@ _sk_store_u16_be_sse41: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax - .byte 68,15,40,21,236,83,1,0 // movaps 0x153ec(%rip),%xmm10 # 2bd00 <_sk_overlay_sse2_8bit+0x133f> + .byte 68,15,40,21,111,85,1,0 // movaps 0x1556f(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -38603,7 +39053,7 @@ _sk_store_u16_be_sse41: .byte 102,69,15,111,208 // movdqa %xmm8,%xmm10 .byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 169e2 <_sk_store_u16_be_sse41+0xf4> + .byte 117,21 // jne 16e5f <_sk_store_u16_be_sse41+0xf4> .byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2) .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2) @@ -38611,13 +39061,13 @@ _sk_store_u16_be_sse41: .byte 255,224 // jmpq *%rax .byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 169de <_sk_store_u16_be_sse41+0xf0> + .byte 116,240 // je 16e5b <_sk_store_u16_be_sse41+0xf0> .byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 169de <_sk_store_u16_be_sse41+0xf0> + .byte 114,227 // jb 16e5b <_sk_store_u16_be_sse41+0xf0> .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2) - .byte 235,213 // jmp 169de <_sk_store_u16_be_sse41+0xf0> + .byte 235,213 // jmp 16e5b <_sk_store_u16_be_sse41+0xf0> HIDDEN _sk_load_f32_sse41 .globl _sk_load_f32_sse41 @@ -38633,7 +39083,7 @@ _sk_load_f32_sse41: .byte 73,99,194 // movslq %r10d,%rax .byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 16a74 <_sk_load_f32_sse41+0x6b> + .byte 117,66 // jne 16ef1 <_sk_load_f32_sse41+0x6b> .byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0 .byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3 .byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9 @@ -38653,17 +39103,17 @@ _sk_load_f32_sse41: .byte 255,224 // jmpq *%rax .byte 69,15,87,201 // xorps %xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,8 // jne 16a86 <_sk_load_f32_sse41+0x7d> + .byte 117,8 // jne 16f03 <_sk_load_f32_sse41+0x7d> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 235,190 // jmp 16a44 <_sk_load_f32_sse41+0x3b> + .byte 235,190 // jmp 16ec1 <_sk_load_f32_sse41+0x3b> .byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,8 // jb 16a9a <_sk_load_f32_sse41+0x91> + .byte 114,8 // jb 16f17 <_sk_load_f32_sse41+0x91> .byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3 - .byte 235,170 // jmp 16a44 <_sk_load_f32_sse41+0x3b> + .byte 235,170 // jmp 16ec1 <_sk_load_f32_sse41+0x3b> .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 235,165 // jmp 16a44 <_sk_load_f32_sse41+0x3b> + .byte 235,165 // jmp 16ec1 <_sk_load_f32_sse41+0x3b> HIDDEN _sk_load_f32_dst_sse41 .globl _sk_load_f32_dst_sse41 @@ -38679,7 +39129,7 @@ _sk_load_f32_dst_sse41: .byte 73,99,194 // movslq %r10d,%rax .byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 16b0a <_sk_load_f32_dst_sse41+0x6b> + .byte 117,66 // jne 16f87 <_sk_load_f32_dst_sse41+0x6b> .byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4 .byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7 .byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9 @@ -38699,17 +39149,17 @@ _sk_load_f32_dst_sse41: .byte 255,224 // jmpq *%rax .byte 69,15,87,201 // xorps %xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,8 // jne 16b1c <_sk_load_f32_dst_sse41+0x7d> + .byte 117,8 // jne 16f99 <_sk_load_f32_dst_sse41+0x7d> .byte 15,87,255 // xorps %xmm7,%xmm7 .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 235,190 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b> + .byte 235,190 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b> .byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,8 // jb 16b30 <_sk_load_f32_dst_sse41+0x91> + .byte 114,8 // jb 16fad <_sk_load_f32_dst_sse41+0x91> .byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7 - .byte 235,170 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b> + .byte 235,170 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b> .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 235,165 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b> + .byte 235,165 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b> HIDDEN _sk_store_f32_sse41 .globl _sk_store_f32_sse41 @@ -38738,7 +39188,7 @@ _sk_store_f32_sse41: .byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9 .byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4) .byte 77,133,192 // test %r8,%r8 - .byte 117,29 // jne 16bb2 <_sk_store_f32_sse41+0x7d> + .byte 117,29 // jne 1702f <_sk_store_f32_sse41+0x7d> .byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10 .byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4) .byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4) @@ -38746,12 +39196,12 @@ _sk_store_f32_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,246 // je 16bae <_sk_store_f32_sse41+0x79> + .byte 116,246 // je 1702b <_sk_store_f32_sse41+0x79> .byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,234 // jb 16bae <_sk_store_f32_sse41+0x79> + .byte 114,234 // jb 1702b <_sk_store_f32_sse41+0x79> .byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4) - .byte 235,225 // jmp 16bae <_sk_store_f32_sse41+0x79> + .byte 235,225 // jmp 1702b <_sk_store_f32_sse41+0x79> HIDDEN _sk_clamp_x_sse41 .globl _sk_clamp_x_sse41 @@ -38841,7 +39291,7 @@ _sk_mirror_x_sse41: .byte 65,15,92,194 // subps %xmm10,%xmm0 .byte 243,69,15,88,192 // addss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 - .byte 243,68,15,89,13,38,65,1,0 // mulss 0x14126(%rip),%xmm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 243,68,15,89,13,157,66,1,0 // mulss 0x1429d(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 @@ -38872,7 +39322,7 @@ _sk_mirror_y_sse41: .byte 65,15,92,202 // subps %xmm10,%xmm1 .byte 243,69,15,88,192 // addss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 - .byte 243,68,15,89,13,180,64,1,0 // mulss 0x140b4(%rip),%xmm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 243,68,15,89,13,43,66,1,0 // mulss 0x1422b(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,89,201 // mulps %xmm1,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 @@ -38897,7 +39347,7 @@ FUNCTION(_sk_clamp_x_1_sse41) _sk_clamp_x_1_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,47,74,1,0 // minps 0x14a2f(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,93,5,178,75,1,0 // minps 0x14bb2(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -38915,9 +39365,9 @@ HIDDEN _sk_mirror_x_1_sse41 .globl _sk_mirror_x_1_sse41 FUNCTION(_sk_mirror_x_1_sse41) _sk_mirror_x_1_sse41: - .byte 68,15,40,5,112,74,1,0 // movaps 0x14a70(%rip),%xmm8 # 2b830 <_sk_overlay_sse2_8bit+0xe6f> + .byte 68,15,40,5,243,75,1,0 // movaps 0x14bf3(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,244,73,1,0 // movaps 0x149f4(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,13,119,75,1,0 // movaps 0x14b77(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 .byte 69,15,88,201 // addps %xmm9,%xmm9 @@ -38934,10 +39384,10 @@ HIDDEN _sk_luminance_to_alpha_sse41 FUNCTION(_sk_luminance_to_alpha_sse41) _sk_luminance_to_alpha_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,19,79,1,0 // mulps 0x14f13(%rip),%xmm0 # 2bd10 <_sk_overlay_sse2_8bit+0x134f> - .byte 15,89,13,28,79,1,0 // mulps 0x14f1c(%rip),%xmm1 # 2bd20 <_sk_overlay_sse2_8bit+0x135f> + .byte 15,89,5,150,80,1,0 // mulps 0x15096(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b> + .byte 15,89,13,159,80,1,0 // mulps 0x1509f(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,34,79,1,0 // mulps 0x14f22(%rip),%xmm3 # 2bd30 <_sk_overlay_sse2_8bit+0x136f> + .byte 15,89,29,165,80,1,0 // mulps 0x150a5(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -39250,9 +39700,9 @@ _sk_evenly_spaced_gradient_sse41: .byte 72,139,24 // mov (%rax),%rbx .byte 76,139,112,8 // mov 0x8(%rax),%r14 .byte 72,255,203 // dec %rbx - .byte 120,7 // js 172b0 <_sk_evenly_spaced_gradient_sse41+0x1a> + .byte 120,7 // js 1772d <_sk_evenly_spaced_gradient_sse41+0x1a> .byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1 - .byte 235,21 // jmp 172c5 <_sk_evenly_spaced_gradient_sse41+0x2f> + .byte 235,21 // jmp 17742 <_sk_evenly_spaced_gradient_sse41+0x2f> .byte 73,137,217 // mov %rbx,%r9 .byte 73,209,233 // shr %r9 .byte 131,227,1 // and $0x1,%ebx @@ -39342,15 +39792,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41 .globl _sk_gauss_a_to_rgba_sse41 FUNCTION(_sk_gauss_a_to_rgba_sse41) _sk_gauss_a_to_rgba_sse41: - .byte 15,40,5,205,72,1,0 // movaps 0x148cd(%rip),%xmm0 # 2bd40 <_sk_overlay_sse2_8bit+0x137f> + .byte 15,40,5,80,74,1,0 // movaps 0x14a50(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,211,72,1,0 // addps 0x148d3(%rip),%xmm0 # 2bd50 <_sk_overlay_sse2_8bit+0x138f> + .byte 15,88,5,86,74,1,0 // addps 0x14a56(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,217,72,1,0 // addps 0x148d9(%rip),%xmm0 # 2bd60 <_sk_overlay_sse2_8bit+0x139f> + .byte 15,88,5,92,74,1,0 // addps 0x14a5c(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,223,72,1,0 // addps 0x148df(%rip),%xmm0 # 2bd70 <_sk_overlay_sse2_8bit+0x13af> + .byte 15,88,5,98,74,1,0 // addps 0x14a62(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,229,72,1,0 // addps 0x148e5(%rip),%xmm0 # 2bd80 <_sk_overlay_sse2_8bit+0x13bf> + .byte 15,88,5,104,74,1,0 // addps 0x14a68(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -39368,12 +39818,12 @@ _sk_gradient_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,249,2 // cmp $0x2,%r9 - .byte 114,50 // jb 174ee <_sk_gradient_sse41+0x46> + .byte 114,50 // jb 1796b <_sk_gradient_sse41+0x46> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,14,67,1,0 // movaps 0x1430e(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 15,40,21,145,68,1,0 // movaps 0x14491(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 243,15,16,27 // movss (%rbx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -39381,7 +39831,7 @@ _sk_gradient_sse41: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,201 // dec %r9 - .byte 117,228 // jne 174d2 <_sk_gradient_sse41+0x2a> + .byte 117,228 // jne 1794f <_sk_gradient_sse41+0x2a> .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 69,137,202 // mov %r9d,%r10d .byte 73,193,233,32 // shr $0x20,%r9 @@ -39511,26 +39961,26 @@ _sk_xy_to_unit_angle_sse41: .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,237 // mulps %xmm13,%xmm13 - .byte 68,15,40,21,79,70,1,0 // movaps 0x1464f(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0x13cf> + .byte 68,15,40,21,210,71,1,0 // movaps 0x147d2(%rip),%xmm10 # 2c390 <_sk_overlay_sse2_8bit+0x13db> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,83,70,1,0 // addps 0x14653(%rip),%xmm10 # 2bda0 <_sk_overlay_sse2_8bit+0x13df> + .byte 68,15,88,21,214,71,1,0 // addps 0x147d6(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,87,70,1,0 // addps 0x14657(%rip),%xmm10 # 2bdb0 <_sk_overlay_sse2_8bit+0x13ef> + .byte 68,15,88,21,218,71,1,0 // addps 0x147da(%rip),%xmm10 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,91,70,1,0 // addps 0x1465b(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0x13ff> + .byte 68,15,88,21,222,71,1,0 // addps 0x147de(%rip),%xmm10 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 68,15,40,29,90,70,1,0 // movaps 0x1465a(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0x140f> + .byte 68,15,40,29,221,71,1,0 // movaps 0x147dd(%rip),%xmm11 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,40,29,51,64,1,0 // movaps 0x14033(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,29,182,65,1,0 // movaps 0x141b6(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0 - .byte 68,15,40,13,37,64,1,0 // movaps 0x14025(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,168,65,1,0 // movaps 0x141a8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10 .byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8 @@ -39564,7 +40014,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41: .byte 243,69,15,89,203 // mulss %xmm11,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,88,200 // addps %xmm0,%xmm9 - .byte 68,15,89,13,206,69,1,0 // mulps 0x145ce(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f> + .byte 68,15,89,13,81,71,1,0 // mulps 0x14751(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 @@ -39572,7 +40022,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41: .byte 243,69,15,89,219 // mulss %xmm11,%xmm11 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,92,227 // subps %xmm11,%xmm12 - .byte 68,15,89,21,185,69,1,0 // mulps 0x145b9(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f> + .byte 68,15,89,21,60,71,1,0 // mulps 0x1473c(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 @@ -39581,8 +40031,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41: .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,92,193 // subps %xmm9,%xmm0 - .byte 68,15,87,13,113,68,1,0 // xorps 0x14471(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> - .byte 68,15,89,5,89,63,1,0 // mulps 0x13f59(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,87,13,244,69,1,0 // xorps 0x145f4(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> + .byte 68,15,89,5,220,64,1,0 // mulps 0x140dc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 @@ -39603,7 +40053,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41: .byte 243,69,15,89,203 // mulss %xmm11,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,88,200 // addps %xmm0,%xmm9 - .byte 68,15,89,13,48,69,1,0 // mulps 0x14530(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f> + .byte 68,15,89,13,179,70,1,0 // mulps 0x146b3(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 @@ -39611,7 +40061,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41: .byte 243,69,15,89,219 // mulss %xmm11,%xmm11 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,92,227 // subps %xmm11,%xmm12 - .byte 68,15,89,21,27,69,1,0 // mulps 0x1451b(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f> + .byte 68,15,89,21,158,70,1,0 // mulps 0x1469e(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 @@ -39620,8 +40070,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41: .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,92,193 // subps %xmm9,%xmm0 - .byte 68,15,87,13,211,67,1,0 // xorps 0x143d3(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> - .byte 68,15,89,5,187,62,1,0 // mulps 0x13ebb(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,87,13,86,69,1,0 // xorps 0x14556(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> + .byte 68,15,89,5,62,64,1,0 // mulps 0x1403e(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 @@ -39639,7 +40089,7 @@ _sk_xy_to_2pt_conical_linear_sse41: .byte 243,69,15,89,200 // mulss %xmm8,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,88,200 // addps %xmm0,%xmm9 - .byte 68,15,89,13,163,68,1,0 // mulps 0x144a3(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f> + .byte 68,15,89,13,38,70,1,0 // mulps 0x14626(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 69,15,89,210 // mulps %xmm10,%xmm10 @@ -39647,7 +40097,7 @@ _sk_xy_to_2pt_conical_linear_sse41: .byte 243,69,15,89,192 // mulss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 65,15,92,192 // subps %xmm8,%xmm0 - .byte 15,87,5,111,67,1,0 // xorps 0x1436f(%rip),%xmm0 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> + .byte 15,87,5,242,68,1,0 // xorps 0x144f2(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> .byte 65,15,94,193 // divps %xmm9,%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39690,7 +40140,7 @@ HIDDEN _sk_save_xy_sse41 FUNCTION(_sk_save_xy_sse41) _sk_save_xy_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,245,61,1,0 // movaps 0x13df5(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,5,120,63,1,0 // movaps 0x13f78(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -39734,8 +40184,8 @@ _sk_bilinear_nx_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,167,67,1,0 // addps 0x143a7(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,111,61,1,0 // movaps 0x13d6f(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,5,42,69,1,0 // addps 0x1452a(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,242,62,1,0 // movaps 0x13ef2(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39748,7 +40198,7 @@ _sk_bilinear_px_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,62,61,1,0 // addps 0x13d3e(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,88,5,193,62,1,0 // addps 0x13ec1(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39760,8 +40210,8 @@ _sk_bilinear_ny_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,96,67,1,0 // addps 0x14360(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,40,61,1,0 // movaps 0x13d28(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,13,227,68,1,0 // addps 0x144e3(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,171,62,1,0 // movaps 0x13eab(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39774,7 +40224,7 @@ _sk_bilinear_py_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,246,60,1,0 // addps 0x13cf6(%rip),%xmm1 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,88,13,121,62,1,0 // addps 0x13e79(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39786,13 +40236,13 @@ _sk_bicubic_n3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,41,67,1,0 // addps 0x14329(%rip),%xmm0 # 2be10 <_sk_overlay_sse2_8bit+0x144f> - .byte 68,15,40,13,225,60,1,0 // movaps 0x13ce1(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,5,172,68,1,0 // addps 0x144ac(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b> + .byte 68,15,40,13,100,62,1,0 // movaps 0x13e64(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,29,67,1,0 // mulps 0x1431d(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,13,181,62,1,0 // addps 0x13eb5(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,13,160,68,1,0 // mulps 0x144a0(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,13,56,64,1,0 // addps 0x14038(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39805,16 +40255,16 @@ _sk_bicubic_n1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,212,66,1,0 // addps 0x142d4(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,156,60,1,0 // movaps 0x13c9c(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,5,87,68,1,0 // addps 0x14457(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,31,62,1,0 // movaps 0x13e1f(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,240,66,1,0 // movaps 0x142f0(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,5,115,68,1,0 // movaps 0x14473(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,244,66,1,0 // addps 0x142f4(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,5,119,68,1,0 // addps 0x14477(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,104,60,1,0 // addps 0x13c68(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,88,5,235,61,1,0 // addps 0x13deb(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,236,66,1,0 // addps 0x142ec(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,5,111,68,1,0 // addps 0x1446f(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39824,17 +40274,17 @@ HIDDEN _sk_bicubic_p1x_sse41 FUNCTION(_sk_bicubic_p1x_sse41) _sk_bicubic_p1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,70,60,1,0 // movaps 0x13c46(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,5,201,61,1,0 // movaps 0x13dc9(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,162,66,1,0 // movaps 0x142a2(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,21,37,68,1,0 // movaps 0x14425(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,166,66,1,0 // addps 0x142a6(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,21,41,68,1,0 // addps 0x14429(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,162,66,1,0 // addps 0x142a2(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,21,37,68,1,0 // addps 0x14425(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39846,11 +40296,11 @@ _sk_bicubic_p3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,117,66,1,0 // addps 0x14275(%rip),%xmm0 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 15,88,5,248,67,1,0 // addps 0x143f8(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,69,66,1,0 // mulps 0x14245(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,5,221,61,1,0 // addps 0x13ddd(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,5,200,67,1,0 // mulps 0x143c8(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,5,96,63,1,0 // addps 0x13f60(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39863,13 +40313,13 @@ _sk_bicubic_n3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,11,66,1,0 // addps 0x1420b(%rip),%xmm1 # 2be10 <_sk_overlay_sse2_8bit+0x144f> - .byte 68,15,40,13,195,59,1,0 // movaps 0x13bc3(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,13,142,67,1,0 // addps 0x1438e(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b> + .byte 68,15,40,13,70,61,1,0 // movaps 0x13d46(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,255,65,1,0 // mulps 0x141ff(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,13,151,61,1,0 // addps 0x13d97(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,13,130,67,1,0 // mulps 0x14382(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,13,26,63,1,0 // addps 0x13f1a(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39882,16 +40332,16 @@ _sk_bicubic_n1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,181,65,1,0 // addps 0x141b5(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,125,59,1,0 // movaps 0x13b7d(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,13,56,67,1,0 // addps 0x14338(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,0,61,1,0 // movaps 0x13d00(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,209,65,1,0 // movaps 0x141d1(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,5,84,67,1,0 // movaps 0x14354(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,213,65,1,0 // addps 0x141d5(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,5,88,67,1,0 // addps 0x14358(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,73,59,1,0 // addps 0x13b49(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,88,5,204,60,1,0 // addps 0x13ccc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,205,65,1,0 // addps 0x141cd(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,5,80,67,1,0 // addps 0x14350(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39901,17 +40351,17 @@ HIDDEN _sk_bicubic_p1y_sse41 FUNCTION(_sk_bicubic_p1y_sse41) _sk_bicubic_p1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,39,59,1,0 // movaps 0x13b27(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,5,170,60,1,0 // movaps 0x13caa(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,130,65,1,0 // movaps 0x14182(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,21,5,67,1,0 // movaps 0x14305(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,134,65,1,0 // addps 0x14186(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,21,9,67,1,0 // addps 0x14309(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,130,65,1,0 // addps 0x14182(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,21,5,67,1,0 // addps 0x14305(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39923,11 +40373,11 @@ _sk_bicubic_p3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,84,65,1,0 // addps 0x14154(%rip),%xmm1 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 15,88,13,215,66,1,0 // addps 0x142d7(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,36,65,1,0 // mulps 0x14124(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,5,188,60,1,0 // addps 0x13cbc(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,5,167,66,1,0 // mulps 0x142a7(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,5,63,62,1,0 // addps 0x13e3f(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -40074,10 +40524,10 @@ _sk_clut_3D_sse41: .byte 102,68,15,56,64,227 // pmulld %xmm3,%xmm12 .byte 102,65,15,111,212 // movdqa %xmm12,%xmm2 .byte 102,15,254,209 // paddd %xmm1,%xmm2 - .byte 102,15,111,37,117,63,1,0 // movdqa 0x13f75(%rip),%xmm4 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,37,248,64,1,0 // movdqa 0x140f8(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,56,64,212 // pmulld %xmm4,%xmm2 .byte 102,68,15,111,220 // movdqa %xmm4,%xmm11 - .byte 102,68,15,111,61,210,56,1,0 // movdqa 0x138d2(%rip),%xmm15 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,61,85,58,1,0 // movdqa 0x13a55(%rip),%xmm15 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,111,226 // movdqa %xmm2,%xmm4 .byte 102,65,15,254,231 // paddd %xmm15,%xmm4 .byte 102,73,15,58,22,225,1 // pextrq $0x1,%xmm4,%r9 @@ -40097,7 +40547,7 @@ _sk_clut_3D_sse41: .byte 102,65,15,58,22,210,1 // pextrd $0x1,%xmm2,%r10d .byte 102,65,15,58,22,211,2 // pextrd $0x2,%xmm2,%r11d .byte 102,65,15,58,22,214,3 // pextrd $0x3,%xmm2,%r14d - .byte 102,68,15,111,13,132,56,1,0 // movdqa 0x13884(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,13,7,58,1,0 // movdqa 0x13a07(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,65,15,254,209 // paddd %xmm9,%xmm2 .byte 102,73,15,58,22,215,1 // pextrq $0x1,%xmm2,%r15 .byte 102,72,15,126,211 // movq %xmm2,%rbx @@ -40111,7 +40561,7 @@ _sk_clut_3D_sse41: .byte 73,193,239,32 // shr $0x20,%r15 .byte 243,66,15,16,20,184 // movss (%rax,%r15,4),%xmm2 .byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6 - .byte 15,40,45,153,62,1,0 // movaps 0x13e99(%rip),%xmm5 # 2be60 <_sk_overlay_sse2_8bit+0x149f> + .byte 15,40,45,28,64,1,0 // movaps 0x1401c(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab> .byte 68,15,88,197 // addps %xmm5,%xmm8 .byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp) .byte 15,40,215 // movaps %xmm7,%xmm2 @@ -40280,7 +40730,7 @@ _sk_clut_3D_sse41: .byte 102,68,15,254,232 // paddd %xmm0,%xmm13 .byte 102,65,15,111,212 // movdqa %xmm12,%xmm2 .byte 102,65,15,254,213 // paddd %xmm13,%xmm2 - .byte 102,15,111,45,88,59,1,0 // movdqa 0x13b58(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,45,219,60,1,0 // movdqa 0x13cdb(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,56,64,213 // pmulld %xmm5,%xmm2 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 .byte 102,65,15,254,207 // paddd %xmm15,%xmm1 @@ -40386,7 +40836,7 @@ _sk_clut_3D_sse41: .byte 102,69,15,58,22,225,1 // pextrd $0x1,%xmm12,%r9d .byte 102,69,15,58,22,226,2 // pextrd $0x2,%xmm12,%r10d .byte 102,69,15,58,22,227,3 // pextrd $0x3,%xmm12,%r11d - .byte 102,15,111,21,188,50,1,0 // movdqa 0x132bc(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,111,21,63,52,1,0 // movdqa 0x1343f(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,68,15,254,226 // paddd %xmm2,%xmm12 .byte 102,76,15,58,22,225,1 // pextrq $0x1,%xmm12,%rcx .byte 102,76,15,126,226 // movq %xmm12,%rdx @@ -40565,8 +41015,8 @@ _sk_clut_4D_sse41: .byte 102,65,15,111,197 // movdqa %xmm13,%xmm0 .byte 102,68,15,127,108,36,176 // movdqa %xmm13,-0x50(%rsp) .byte 102,15,254,193 // paddd %xmm1,%xmm0 - .byte 102,15,56,64,5,37,54,1,0 // pmulld 0x13625(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af> - .byte 102,68,15,111,29,140,47,1,0 // movdqa 0x12f8c(%rip),%xmm11 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,56,64,5,168,55,1,0 // pmulld 0x137a8(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> + .byte 102,68,15,111,29,15,49,1,0 // movdqa 0x1310f(%rip),%xmm11 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,111,208 // movdqa %xmm0,%xmm2 .byte 102,65,15,254,211 // paddd %xmm11,%xmm2 .byte 102,73,15,58,22,209,1 // pextrq $0x1,%xmm2,%r9 @@ -40586,7 +41036,7 @@ _sk_clut_4D_sse41: .byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d .byte 102,65,15,58,22,195,2 // pextrd $0x2,%xmm0,%r11d .byte 102,65,15,58,22,198,3 // pextrd $0x3,%xmm0,%r14d - .byte 102,68,15,111,5,62,47,1,0 // movdqa 0x12f3e(%rip),%xmm8 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,5,193,48,1,0 // movdqa 0x130c1(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,65,15,254,192 // paddd %xmm8,%xmm0 .byte 102,73,15,58,22,199,1 // pextrq $0x1,%xmm0,%r15 .byte 102,72,15,126,195 // movq %xmm0,%rbx @@ -40600,7 +41050,7 @@ _sk_clut_4D_sse41: .byte 73,193,239,32 // shr $0x20,%r15 .byte 243,66,15,16,4,184 // movss (%rax,%r15,4),%xmm0 .byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5 - .byte 15,40,53,83,53,1,0 // movaps 0x13553(%rip),%xmm6 # 2be60 <_sk_overlay_sse2_8bit+0x149f> + .byte 15,40,53,214,54,1,0 // movaps 0x136d6(%rip),%xmm6 # 2c460 <_sk_overlay_sse2_8bit+0x14ab> .byte 68,15,88,214 // addps %xmm6,%xmm10 .byte 68,15,41,84,36,48 // movaps %xmm10,0x30(%rsp) .byte 15,88,254 // addps %xmm6,%xmm7 @@ -40613,7 +41063,7 @@ _sk_clut_4D_sse41: .byte 102,15,254,206 // paddd %xmm6,%xmm1 .byte 102,68,15,111,214 // movdqa %xmm6,%xmm10 .byte 102,68,15,127,84,36,160 // movdqa %xmm10,-0x60(%rsp) - .byte 102,15,56,64,13,36,53,1,0 // pmulld 0x13524(%rip),%xmm1 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,56,64,13,167,54,1,0 // pmulld 0x136a7(%rip),%xmm1 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,65,15,254,227 // paddd %xmm11,%xmm4 .byte 102,73,15,58,22,231,1 // pextrq $0x1,%xmm4,%r15 @@ -40671,11 +41121,11 @@ _sk_clut_4D_sse41: .byte 102,15,254,216 // paddd %xmm0,%xmm3 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,65,15,254,205 // paddd %xmm13,%xmm1 - .byte 102,15,111,5,248,51,1,0 // movdqa 0x133f8(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,5,123,53,1,0 // movdqa 0x1357b(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,56,64,200 // pmulld %xmm0,%xmm1 .byte 102,68,15,111,200 // movdqa %xmm0,%xmm9 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 - .byte 102,68,15,111,5,81,45,1,0 // movdqa 0x12d51(%rip),%xmm8 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,5,212,46,1,0 // movdqa 0x12ed4(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,65,15,254,192 // paddd %xmm8,%xmm0 .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx .byte 102,72,15,126,194 // movq %xmm0,%rdx @@ -40777,7 +41227,7 @@ _sk_clut_4D_sse41: .byte 102,15,111,200 // movdqa %xmm0,%xmm1 .byte 102,68,15,111,108,36,176 // movdqa -0x50(%rsp),%xmm13 .byte 102,65,15,254,205 // paddd %xmm13,%xmm1 - .byte 102,15,111,45,205,49,1,0 // movdqa 0x131cd(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,45,80,51,1,0 // movdqa 0x13350(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,56,64,205 // pmulld %xmm5,%xmm1 .byte 102,15,126,201 // movd %xmm1,%ecx .byte 102,15,58,22,202,1 // pextrd $0x1,%xmm1,%edx @@ -40789,7 +41239,7 @@ _sk_clut_4D_sse41: .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2 .byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6 .byte 102,15,111,209 // movdqa %xmm1,%xmm2 - .byte 102,15,111,29,248,42,1,0 // movdqa 0x12af8(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,29,123,44,1,0 // movdqa 0x12c7b(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx .byte 102,72,15,126,210 // movq %xmm2,%rdx @@ -40837,7 +41287,7 @@ _sk_clut_4D_sse41: .byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d .byte 102,65,15,58,22,198,2 // pextrd $0x2,%xmm0,%r14d .byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d - .byte 102,15,254,5,38,42,1,0 // paddd 0x12a26(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,5,169,43,1,0 // paddd 0x12ba9(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx .byte 102,72,15,126,194 // movq %xmm0,%rdx .byte 137,211 // mov %edx,%ebx @@ -40866,10 +41316,10 @@ _sk_clut_4D_sse41: .byte 102,15,254,100,36,144 // paddd -0x70(%rsp),%xmm4 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,65,15,254,197 // paddd %xmm13,%xmm0 - .byte 102,68,15,111,45,8,48,1,0 // movdqa 0x13008(%rip),%xmm13 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,68,15,111,45,139,49,1,0 // movdqa 0x1318b(%rip),%xmm13 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,65,15,56,64,197 // pmulld %xmm13,%xmm0 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,15,111,53,102,41,1,0 // movdqa 0x12966(%rip),%xmm6 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,53,233,42,1,0 // movdqa 0x12ae9(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,206 // paddd %xmm6,%xmm1 .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx .byte 102,72,15,126,202 // movq %xmm1,%rdx @@ -40887,7 +41337,7 @@ _sk_clut_4D_sse41: .byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d .byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d .byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d - .byte 102,15,111,61,38,41,1,0 // movdqa 0x12926(%rip),%xmm7 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,111,61,169,42,1,0 // movdqa 0x12aa9(%rip),%xmm7 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,254,199 // paddd %xmm7,%xmm0 .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx .byte 102,72,15,126,194 // movq %xmm0,%rdx @@ -40904,7 +41354,7 @@ _sk_clut_4D_sse41: .byte 102,65,15,254,227 // paddd %xmm11,%xmm4 .byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4 .byte 102,15,111,244 // movdqa %xmm4,%xmm6 - .byte 102,68,15,111,45,176,40,1,0 // movdqa 0x128b0(%rip),%xmm13 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,45,51,42,1,0 // movdqa 0x12a33(%rip),%xmm13 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,65,15,254,245 // paddd %xmm13,%xmm6 .byte 102,72,15,58,22,241,1 // pextrq $0x1,%xmm6,%rcx .byte 102,72,15,126,242 // movq %xmm6,%rdx @@ -40983,7 +41433,7 @@ _sk_clut_4D_sse41: .byte 102,68,15,111,76,36,176 // movdqa -0x50(%rsp),%xmm9 .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,254,194 // paddd %xmm2,%xmm0 - .byte 102,15,111,29,192,45,1,0 // movdqa 0x12dc0(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,29,67,47,1,0 // movdqa 0x12f43(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,56,64,195 // pmulld %xmm3,%xmm0 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 .byte 102,69,15,111,213 // movdqa %xmm13,%xmm10 @@ -41004,7 +41454,7 @@ _sk_clut_4D_sse41: .byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d .byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d .byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d - .byte 102,15,111,45,225,38,1,0 // movdqa 0x126e1(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,111,45,100,40,1,0 // movdqa 0x12864(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,254,197 // paddd %xmm5,%xmm0 .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx .byte 102,72,15,126,194 // movq %xmm0,%rdx @@ -41092,7 +41542,7 @@ _sk_clut_4D_sse41: .byte 102,65,15,58,22,225,1 // pextrd $0x1,%xmm4,%r9d .byte 102,65,15,58,22,226,2 // pextrd $0x2,%xmm4,%r10d .byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d - .byte 102,68,15,111,13,29,37,1,0 // movdqa 0x1251d(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,13,160,38,1,0 // movdqa 0x126a0(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,65,15,254,225 // paddd %xmm9,%xmm4 .byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx .byte 102,72,15,126,226 // movq %xmm4,%rdx @@ -41174,7 +41624,7 @@ _sk_clut_4D_sse41: .byte 102,15,254,76,36,176 // paddd -0x50(%rsp),%xmm1 .byte 102,65,15,56,64,205 // pmulld %xmm13,%xmm1 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 - .byte 102,68,15,111,37,86,35,1,0 // movdqa 0x12356(%rip),%xmm12 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,37,217,36,1,0 // movdqa 0x124d9(%rip),%xmm12 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,65,15,254,196 // paddd %xmm12,%xmm0 .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx .byte 102,72,15,126,194 // movq %xmm0,%rdx @@ -41192,7 +41642,7 @@ _sk_clut_4D_sse41: .byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d .byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d .byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d - .byte 102,15,111,29,21,35,1,0 // movdqa 0x12315(%rip),%xmm3 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,111,29,152,36,1,0 // movdqa 0x12498(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx .byte 102,72,15,126,202 // movq %xmm1,%rdx @@ -41261,9 +41711,9 @@ _sk_clut_4D_sse41: .byte 102,68,15,254,116,36,144 // paddd -0x70(%rsp),%xmm14 .byte 102,15,111,68,36,176 // movdqa -0x50(%rsp),%xmm0 .byte 102,65,15,254,198 // paddd %xmm14,%xmm0 - .byte 102,15,56,64,5,22,40,1,0 // pmulld 0x12816(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,56,64,5,153,41,1,0 // pmulld 0x12999(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,15,254,5,122,33,1,0 // paddd 0x1217a(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,254,5,253,34,1,0 // paddd 0x122fd(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx .byte 102,72,15,126,194 // movq %xmm0,%rdx .byte 137,213 // mov %edx,%ebp @@ -41296,8 +41746,8 @@ _sk_clut_4D_sse41: .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0 .byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5 .byte 102,68,15,254,116,36,160 // paddd -0x60(%rsp),%xmm14 - .byte 102,68,15,56,64,53,95,39,1,0 // pmulld 0x1275f(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0x14af> - .byte 102,15,111,5,199,32,1,0 // movdqa 0x120c7(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,56,64,53,226,40,1,0 // pmulld 0x128e2(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> + .byte 102,15,111,5,74,34,1,0 // movdqa 0x1224a(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,65,15,254,198 // paddd %xmm14,%xmm0 .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx .byte 102,72,15,126,194 // movq %xmm0,%rdx @@ -41378,7 +41828,7 @@ _sk_clut_4D_sse41: .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 15,88,215 // addps %xmm7,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,72,31,1,0 // movaps 0x11f48(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,203,32,1,0 // movaps 0x120cb(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 76,137,194 // mov %r8,%rdx .byte 72,139,76,36,240 // mov -0x10(%rsp),%rcx .byte 76,139,68,36,248 // mov -0x8(%rsp),%r8 @@ -41415,7 +41865,7 @@ _sk_start_pipeline_sse2: .byte 72,137,194 // mov %rax,%rdx .byte 72,137,77,176 // mov %rcx,-0x50(%rbp) .byte 73,57,206 // cmp %rcx,%r14 - .byte 115,117 // jae 19960 <_sk_start_pipeline_sse2+0xa1> + .byte 115,117 // jae 19ddd <_sk_start_pipeline_sse2+0xa1> .byte 72,139,69,208 // mov -0x30(%rbp),%rax .byte 72,141,64,4 // lea 0x4(%rax),%rax .byte 72,137,69,184 // mov %rax,-0x48(%rbp) @@ -41425,7 +41875,7 @@ _sk_start_pipeline_sse2: .byte 73,137,244 // mov %rsi,%r12 .byte 72,57,93,184 // cmp %rbx,-0x48(%rbp) .byte 72,139,85,208 // mov -0x30(%rbp),%rdx - .byte 119,45 // ja 1993c <_sk_start_pipeline_sse2+0x7d> + .byte 119,45 // ja 19db9 <_sk_start_pipeline_sse2+0x7d> .byte 76,139,125,208 // mov -0x30(%rbp),%r15 .byte 69,49,192 // xor %r8d,%r8d .byte 76,137,207 // mov %r9,%rdi @@ -41439,10 +41889,10 @@ _sk_start_pipeline_sse2: .byte 73,131,199,8 // add $0x8,%r15 .byte 73,57,223 // cmp %rbx,%r15 .byte 73,137,215 // mov %rdx,%r15 - .byte 118,215 // jbe 19913 <_sk_start_pipeline_sse2+0x54> + .byte 118,215 // jbe 19d90 <_sk_start_pipeline_sse2+0x54> .byte 73,137,216 // mov %rbx,%r8 .byte 73,41,208 // sub %rdx,%r8 - .byte 116,19 // je 19957 <_sk_start_pipeline_sse2+0x98> + .byte 116,19 // je 19dd4 <_sk_start_pipeline_sse2+0x98> .byte 76,137,207 // mov %r9,%rdi .byte 76,137,230 // mov %r12,%rsi .byte 76,137,241 // mov %r14,%rcx @@ -41451,7 +41901,7 @@ _sk_start_pipeline_sse2: .byte 76,139,77,192 // mov -0x40(%rbp),%r9 .byte 73,255,198 // inc %r14 .byte 76,59,117,176 // cmp -0x50(%rbp),%r14 - .byte 117,165 // jne 19905 <_sk_start_pipeline_sse2+0x46> + .byte 117,165 // jne 19d82 <_sk_start_pipeline_sse2+0x46> .byte 72,131,196,40 // add $0x28,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -41474,7 +41924,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,194 // movd %edx,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,61,30,1,0 // movaps 0x11e3d(%rip),%xmm2 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,40,21,192,31,1,0 // movaps 0x11fc0(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,7 // movups (%rdi),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -41483,7 +41933,7 @@ _sk_seed_shader_sse2: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,44,30,1,0 // movaps 0x11e2c(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,175,31,1,0 // movaps 0x11faf(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -41503,14 +41953,14 @@ _sk_dither_sse2: .byte 102,68,15,110,193 // movd %ecx,%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,250,29,1,0 // movdqa 0x11dfa(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,21,125,31,1,0 // movdqa 0x11f7d(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,230,29,1,0 // movdqa 0x11de6(%rip),%xmm12 # 2b7f0 <_sk_overlay_sse2_8bit+0xe2f> - .byte 102,68,15,111,45,237,29,1,0 // movdqa 0x11ded(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,37,105,31,1,0 // movdqa 0x11f69(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b> + .byte 102,68,15,111,45,112,31,1,0 // movdqa 0x11f70(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -41526,8 +41976,8 @@ _sk_dither_sse2: .byte 102,69,15,235,245 // por %xmm13,%xmm14 .byte 102,69,15,235,240 // por %xmm8,%xmm14 .byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8 - .byte 68,15,89,5,168,29,1,0 // mulps 0x11da8(%rip),%xmm8 # 2b810 <_sk_overlay_sse2_8bit+0xe4f> - .byte 68,15,88,5,176,29,1,0 // addps 0x11db0(%rip),%xmm8 # 2b820 <_sk_overlay_sse2_8bit+0xe5f> + .byte 68,15,89,5,43,31,1,0 // mulps 0x11f2b(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b> + .byte 68,15,88,5,51,31,1,0 // addps 0x11f33(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b> .byte 243,68,15,16,16 // movss (%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -41569,7 +42019,7 @@ HIDDEN _sk_black_color_sse2 FUNCTION(_sk_black_color_sse2) _sk_black_color_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,230,28,1,0 // movaps 0x11ce6(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,105,30,1,0 // movaps 0x11e69(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,87,201 // xorps %xmm1,%xmm1 .byte 15,87,210 // xorps %xmm2,%xmm2 @@ -41580,7 +42030,7 @@ HIDDEN _sk_white_color_sse2 FUNCTION(_sk_white_color_sse2) _sk_white_color_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,5,210,28,1,0 // movaps 0x11cd2(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,5,85,30,1,0 // movaps 0x11e55(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,40,216 // movaps %xmm0,%xmm3 @@ -41626,7 +42076,7 @@ HIDDEN _sk_srcatop_sse2 FUNCTION(_sk_srcatop_sse2) _sk_srcatop_sse2: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,130,28,1,0 // movaps 0x11c82(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,5,30,1,0 // movaps 0x11e05(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -41651,7 +42101,7 @@ FUNCTION(_sk_dstatop_sse2) _sk_dstatop_sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,53,28,1,0 // movaps 0x11c35(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,184,29,1,0 // movaps 0x11db8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -41698,7 +42148,7 @@ HIDDEN _sk_srcout_sse2 .globl _sk_srcout_sse2 FUNCTION(_sk_srcout_sse2) _sk_srcout_sse2: - .byte 68,15,40,5,201,27,1,0 // movaps 0x11bc9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,76,29,1,0 // movaps 0x11d4c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -41711,7 +42161,7 @@ HIDDEN _sk_dstout_sse2 .globl _sk_dstout_sse2 FUNCTION(_sk_dstout_sse2) _sk_dstout_sse2: - .byte 68,15,40,5,169,27,1,0 // movaps 0x11ba9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,44,29,1,0 // movaps 0x11d2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -41728,7 +42178,7 @@ HIDDEN _sk_srcover_sse2 .globl _sk_srcover_sse2 FUNCTION(_sk_srcover_sse2) _sk_srcover_sse2: - .byte 68,15,40,5,124,27,1,0 // movaps 0x11b7c(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,255,28,1,0 // movaps 0x11cff(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -41748,7 +42198,7 @@ HIDDEN _sk_dstover_sse2 .globl _sk_dstover_sse2 FUNCTION(_sk_dstover_sse2) _sk_dstover_sse2: - .byte 68,15,40,5,64,27,1,0 // movaps 0x11b40(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,195,28,1,0 // movaps 0x11cc3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -41776,7 +42226,7 @@ HIDDEN _sk_multiply_sse2 .globl _sk_multiply_sse2 FUNCTION(_sk_multiply_sse2) _sk_multiply_sse2: - .byte 68,15,40,5,4,27,1,0 // movaps 0x11b04(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,135,28,1,0 // movaps 0x11c87(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -41814,9 +42264,14 @@ HIDDEN _sk_plus__sse2 FUNCTION(_sk_plus__sse2) _sk_plus__sse2: .byte 15,88,196 // addps %xmm4,%xmm0 + .byte 68,15,40,5,8,28,1,0 // movaps 0x11c08(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> + .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 15,88,205 // addps %xmm5,%xmm1 + .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 15,88,214 // addps %xmm6,%xmm2 + .byte 65,15,93,208 // minps %xmm8,%xmm2 .byte 15,88,223 // addps %xmm7,%xmm3 + .byte 65,15,93,216 // minps %xmm8,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -41851,7 +42306,7 @@ HIDDEN _sk_xor__sse2 FUNCTION(_sk_xor__sse2) _sk_xor__sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,41,26,1,0 // movaps 0x11a29(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,148,27,1,0 // movaps 0x11b94(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -41899,7 +42354,7 @@ _sk_darken_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,132,25,1,0 // movaps 0x11984(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,239,26,1,0 // movaps 0x11aef(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -41933,7 +42388,7 @@ _sk_lighten_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,25,25,1,0 // movaps 0x11919(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,132,26,1,0 // movaps 0x11a84(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -41970,7 +42425,7 @@ _sk_difference_sse2: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,163,24,1,0 // movaps 0x118a3(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,14,26,1,0 // movaps 0x11a0e(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -41998,7 +42453,7 @@ _sk_exclusion_sse2: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,83,24,1,0 // movaps 0x11853(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,21,190,25,1,0 // movaps 0x119be(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -42011,7 +42466,7 @@ HIDDEN _sk_colorburn_sse2 FUNCTION(_sk_colorburn_sse2) _sk_colorburn_sse2: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,13,54,24,1,0 // movaps 0x11836(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,161,25,1,0 // movaps 0x119a1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -42106,7 +42561,7 @@ HIDDEN _sk_colordodge_sse2 FUNCTION(_sk_colordodge_sse2) _sk_colordodge_sse2: .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,222,22,1,0 // movaps 0x116de(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,73,24,1,0 // movaps 0x11849(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 65,15,40,195 // movaps %xmm11,%xmm0 @@ -42198,7 +42653,7 @@ _sk_hardlight_sse2: .byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp) .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 68,15,40,29,135,21,1,0 // movaps 0x11587(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,29,242,22,1,0 // movaps 0x116f2(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,194 // movaps %xmm10,%xmm8 @@ -42286,7 +42741,7 @@ FUNCTION(_sk_overlay_sse2) _sk_overlay_sse2: .byte 68,15,40,193 // movaps %xmm1,%xmm8 .byte 68,15,40,232 // movaps %xmm0,%xmm13 - .byte 68,15,40,13,69,20,1,0 // movaps 0x11445(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,176,21,1,0 // movaps 0x115b0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -42377,7 +42832,7 @@ _sk_softlight_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 68,15,94,215 // divps %xmm7,%xmm10 .byte 69,15,84,212 // andps %xmm12,%xmm10 - .byte 68,15,40,13,242,18,1,0 // movaps 0x112f2(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,93,20,1,0 // movaps 0x1145d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 69,15,92,250 // subps %xmm10,%xmm15 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -42390,10 +42845,10 @@ _sk_softlight_sse2: .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 65,15,88,194 // addps %xmm10,%xmm0 - .byte 68,15,40,53,28,19,1,0 // movaps 0x1131c(%rip),%xmm14 # 2b830 <_sk_overlay_sse2_8bit+0xe6f> + .byte 68,15,40,53,135,20,1,0 // movaps 0x11487(%rip),%xmm14 # 2be30 <_sk_overlay_sse2_8bit+0xe7b> .byte 69,15,88,222 // addps %xmm14,%xmm11 .byte 68,15,89,216 // mulps %xmm0,%xmm11 - .byte 68,15,40,21,28,19,1,0 // movaps 0x1131c(%rip),%xmm10 # 2b840 <_sk_overlay_sse2_8bit+0xe7f> + .byte 68,15,40,21,135,20,1,0 // movaps 0x11487(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0xe8b> .byte 69,15,89,234 // mulps %xmm10,%xmm13 .byte 69,15,88,235 // addps %xmm11,%xmm13 .byte 15,88,228 // addps %xmm4,%xmm4 @@ -42538,7 +42993,7 @@ _sk_hue_sse2: .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 68,15,89,211 // mulps %xmm3,%xmm10 - .byte 68,15,40,5,175,16,1,0 // movaps 0x110af(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,26,18,1,0 // movaps 0x1121a(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 15,40,207 // movaps %xmm7,%xmm1 .byte 68,15,92,217 // subps %xmm1,%xmm11 @@ -42586,12 +43041,12 @@ _sk_hue_sse2: .byte 69,15,84,206 // andps %xmm14,%xmm9 .byte 69,15,84,214 // andps %xmm14,%xmm10 .byte 65,15,84,214 // andps %xmm14,%xmm2 - .byte 68,15,40,61,108,16,1,0 // movaps 0x1106c(%rip),%xmm15 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,61,215,17,1,0 // movaps 0x111d7(%rip),%xmm15 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 65,15,89,231 // mulps %xmm15,%xmm4 - .byte 15,40,5,113,16,1,0 // movaps 0x11071(%rip),%xmm0 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 15,40,5,220,17,1,0 // movaps 0x111dc(%rip),%xmm0 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 15,88,244 // addps %xmm4,%xmm6 - .byte 68,15,40,53,115,16,1,0 // movaps 0x11073(%rip),%xmm14 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> + .byte 68,15,40,53,222,17,1,0 // movaps 0x111de(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb> .byte 68,15,40,239 // movaps %xmm7,%xmm13 .byte 69,15,89,238 // mulps %xmm14,%xmm13 .byte 68,15,88,238 // addps %xmm6,%xmm13 @@ -42769,14 +43224,14 @@ _sk_saturation_sse2: .byte 68,15,84,211 // andps %xmm3,%xmm10 .byte 68,15,84,203 // andps %xmm3,%xmm9 .byte 15,84,195 // andps %xmm3,%xmm0 - .byte 68,15,40,5,197,13,1,0 // movaps 0x10dc5(%rip),%xmm8 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,5,48,15,1,0 // movaps 0x10f30(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 15,40,214 // movaps %xmm6,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 - .byte 15,40,13,199,13,1,0 // movaps 0x10dc7(%rip),%xmm1 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 15,40,13,50,15,1,0 // movaps 0x10f32(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,217 // mulps %xmm1,%xmm3 .byte 15,88,218 // addps %xmm2,%xmm3 - .byte 68,15,40,37,198,13,1,0 // movaps 0x10dc6(%rip),%xmm12 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> + .byte 68,15,40,37,49,15,1,0 // movaps 0x10f31(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb> .byte 69,15,89,236 // mulps %xmm12,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 .byte 65,15,40,210 // movaps %xmm10,%xmm2 @@ -42821,7 +43276,7 @@ _sk_saturation_sse2: .byte 15,40,223 // movaps %xmm7,%xmm3 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,221 // mulps %xmm5,%xmm3 - .byte 68,15,40,5,123,12,1,0 // movaps 0x10c7b(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,230,13,1,0 // movaps 0x10de6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 15,88,253 // addps %xmm5,%xmm7 @@ -42922,14 +43377,14 @@ _sk_color_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,40,208 // movaps %xmm8,%xmm2 - .byte 68,15,40,45,137,11,1,0 // movaps 0x10b89(%rip),%xmm13 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,45,244,12,1,0 // movaps 0x10cf4(%rip),%xmm13 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 68,15,40,198 // movaps %xmm6,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,40,53,137,11,1,0 // movaps 0x10b89(%rip),%xmm14 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 68,15,40,53,244,12,1,0 // movaps 0x10cf4(%rip),%xmm14 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,29,133,11,1,0 // movaps 0x10b85(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> + .byte 68,15,40,29,240,12,1,0 // movaps 0x10cf0(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb> .byte 69,15,89,227 // mulps %xmm11,%xmm12 .byte 68,15,88,224 // addps %xmm0,%xmm12 .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -42937,7 +43392,7 @@ _sk_color_sse2: .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,248 // addps %xmm0,%xmm15 - .byte 68,15,40,5,193,10,1,0 // movaps 0x10ac1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,44,12,1,0 // movaps 0x10c2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 .byte 15,89,252 // mulps %xmm4,%xmm7 @@ -43073,15 +43528,15 @@ _sk_luminosity_sse2: .byte 68,15,40,205 // movaps %xmm5,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 .byte 15,89,222 // mulps %xmm6,%xmm3 - .byte 68,15,40,37,72,9,1,0 // movaps 0x10948(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,37,179,10,1,0 // movaps 0x10ab3(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 68,15,40,199 // movaps %xmm7,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,72,9,1,0 // movaps 0x10948(%rip),%xmm13 # 2b860 <_sk_overlay_sse2_8bit+0xe9f> + .byte 68,15,40,45,179,10,1,0 // movaps 0x10ab3(%rip),%xmm13 # 2be60 <_sk_overlay_sse2_8bit+0xeab> .byte 68,15,40,241 // movaps %xmm1,%xmm14 .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 69,15,88,240 // addps %xmm8,%xmm14 - .byte 68,15,40,29,68,9,1,0 // movaps 0x10944(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf> - .byte 68,15,40,5,156,8,1,0 // movaps 0x1089c(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,29,175,10,1,0 // movaps 0x10aaf(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb> + .byte 68,15,40,5,7,10,1,0 // movaps 0x10a07(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 68,15,92,248 // subps %xmm0,%xmm15 @@ -43222,10 +43677,10 @@ _sk_srcover_rgba_8888_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,228,0,0,0 // jne 1b21f <_sk_srcover_rgba_8888_sse2+0x104> + .byte 15,133,228,0,0,0 // jne 1b6b4 <_sk_srcover_rgba_8888_sse2+0x104> .byte 243,69,15,111,4,129 // movdqu (%r9,%rax,4),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 102,15,111,53,52,7,1,0 // movdqa 0x10734(%rip),%xmm6 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,53,159,8,1,0 // movdqa 0x1089f(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,224 // movdqa %xmm8,%xmm4 .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 @@ -43239,9 +43694,9 @@ _sk_srcover_rgba_8888_sse2: .byte 15,91,247 // cvtdq2ps %xmm7,%xmm6 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7 - .byte 68,15,40,5,68,6,1,0 // movaps 0x10644(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,175,7,1,0 // movaps 0x107af(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,92,195 // subps %xmm3,%xmm8 - .byte 68,15,40,37,24,7,1,0 // movaps 0x10718(%rip),%xmm12 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,37,131,8,1,0 // movaps 0x10883(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 65,15,89,196 // mulps %xmm12,%xmm0 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -43267,7 +43722,7 @@ _sk_srcover_rgba_8888_sse2: .byte 102,15,114,240,24 // pslld $0x18,%xmm0 .byte 102,15,235,194 // por %xmm2,%xmm0 .byte 102,15,235,193 // por %xmm1,%xmm0 - .byte 117,84 // jne 1b259 <_sk_srcover_rgba_8888_sse2+0x13e> + .byte 117,84 // jne 1b6ee <_sk_srcover_rgba_8888_sse2+0x13e> .byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -43278,32 +43733,32 @@ _sk_srcover_rgba_8888_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,90 // je 1b286 <_sk_srcover_rgba_8888_sse2+0x16b> + .byte 116,90 // je 1b71b <_sk_srcover_rgba_8888_sse2+0x16b> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 1b24e <_sk_srcover_rgba_8888_sse2+0x133> + .byte 116,23 // je 1b6e3 <_sk_srcover_rgba_8888_sse2+0x133> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,0,255,255,255 // jne 1b141 <_sk_srcover_rgba_8888_sse2+0x26> + .byte 15,133,0,255,255,255 // jne 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26> .byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4 .byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8 .byte 102,69,15,18,4,129 // movlpd (%r9,%rax,4),%xmm8 - .byte 233,232,254,255,255 // jmpq 1b141 <_sk_srcover_rgba_8888_sse2+0x26> + .byte 233,232,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26> .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,43 // je 1b291 <_sk_srcover_rgba_8888_sse2+0x176> + .byte 116,43 // je 1b726 <_sk_srcover_rgba_8888_sse2+0x176> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,18 // je 1b27e <_sk_srcover_rgba_8888_sse2+0x163> + .byte 116,18 // je 1b713 <_sk_srcover_rgba_8888_sse2+0x163> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,153 // jne 1b20b <_sk_srcover_rgba_8888_sse2+0xf0> + .byte 117,153 // jne 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,65,15,126,76,129,8 // movd %xmm1,0x8(%r9,%rax,4) .byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4) - .byte 235,133 // jmp 1b20b <_sk_srcover_rgba_8888_sse2+0xf0> + .byte 235,133 // jmp 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0> .byte 102,69,15,110,4,129 // movd (%r9,%rax,4),%xmm8 - .byte 233,176,254,255,255 // jmpq 1b141 <_sk_srcover_rgba_8888_sse2+0x26> + .byte 233,176,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26> .byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4) - .byte 233,111,255,255,255 // jmpq 1b20b <_sk_srcover_rgba_8888_sse2+0xf0> + .byte 233,111,255,255,255 // jmpq 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0> HIDDEN _sk_clamp_0_sse2 .globl _sk_clamp_0_sse2 @@ -43321,7 +43776,7 @@ HIDDEN _sk_clamp_1_sse2 .globl _sk_clamp_1_sse2 FUNCTION(_sk_clamp_1_sse2) _sk_clamp_1_sse2: - .byte 68,15,40,5,20,5,1,0 // movaps 0x10514(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,127,6,1,0 // movaps 0x1067f(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -43333,7 +43788,7 @@ HIDDEN _sk_clamp_a_sse2 .globl _sk_clamp_a_sse2 FUNCTION(_sk_clamp_a_sse2) _sk_clamp_a_sse2: - .byte 15,93,29,249,4,1,0 // minps 0x104f9(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,93,29,100,6,1,0 // minps 0x10664(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -43344,7 +43799,7 @@ HIDDEN _sk_clamp_a_dst_sse2 .globl _sk_clamp_a_dst_sse2 FUNCTION(_sk_clamp_a_dst_sse2) _sk_clamp_a_dst_sse2: - .byte 15,93,61,229,4,1,0 // minps 0x104e5(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,93,61,80,6,1,0 // minps 0x10650(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,93,231 // minps %xmm7,%xmm4 .byte 15,93,239 // minps %xmm7,%xmm5 .byte 15,93,247 // minps %xmm7,%xmm6 @@ -43379,7 +43834,7 @@ HIDDEN _sk_invert_sse2 .globl _sk_invert_sse2 FUNCTION(_sk_invert_sse2) _sk_invert_sse2: - .byte 68,15,40,5,161,4,1,0 // movaps 0x104a1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,5,12,6,1,0 // movaps 0x1060c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,200 // subps %xmm0,%xmm9 .byte 69,15,40,208 // movaps %xmm8,%xmm10 @@ -43441,7 +43896,7 @@ HIDDEN _sk_unpremul_sse2 FUNCTION(_sk_unpremul_sse2) _sk_unpremul_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,43,4,1,0 // movaps 0x1042b(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,150,5,1,0 // movaps 0x10596(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -43455,20 +43910,20 @@ HIDDEN _sk_from_srgb_sse2 .globl _sk_from_srgb_sse2 FUNCTION(_sk_from_srgb_sse2) _sk_from_srgb_sse2: - .byte 68,15,40,5,246,4,1,0 // movaps 0x104f6(%rip),%xmm8 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff> + .byte 68,15,40,5,97,6,1,0 // movaps 0x10661(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b> .byte 68,15,40,232 // movaps %xmm0,%xmm13 .byte 69,15,89,232 // mulps %xmm8,%xmm13 .byte 68,15,40,216 // movaps %xmm0,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 - .byte 68,15,40,13,110,4,1,0 // movaps 0x1046e(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,13,217,5,1,0 // movaps 0x105d9(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,241 // mulps %xmm9,%xmm14 - .byte 68,15,40,21,222,4,1,0 // movaps 0x104de(%rip),%xmm10 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f> + .byte 68,15,40,21,73,6,1,0 // movaps 0x10649(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 69,15,89,243 // mulps %xmm11,%xmm14 - .byte 68,15,40,29,222,4,1,0 // movaps 0x104de(%rip),%xmm11 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f> + .byte 68,15,40,29,73,6,1,0 // movaps 0x10649(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b> .byte 69,15,88,243 // addps %xmm11,%xmm14 - .byte 68,15,40,37,226,4,1,0 // movaps 0x104e2(%rip),%xmm12 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f> + .byte 68,15,40,37,77,6,1,0 // movaps 0x1064d(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b> .byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0 .byte 68,15,84,232 // andps %xmm0,%xmm13 .byte 65,15,85,198 // andnps %xmm14,%xmm0 @@ -43504,20 +43959,20 @@ HIDDEN _sk_from_srgb_dst_sse2 .globl _sk_from_srgb_dst_sse2 FUNCTION(_sk_from_srgb_dst_sse2) _sk_from_srgb_dst_sse2: - .byte 68,15,40,5,51,4,1,0 // movaps 0x10433(%rip),%xmm8 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff> + .byte 68,15,40,5,158,5,1,0 // movaps 0x1059e(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b> .byte 68,15,40,236 // movaps %xmm4,%xmm13 .byte 69,15,89,232 // mulps %xmm8,%xmm13 .byte 68,15,40,220 // movaps %xmm4,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 - .byte 68,15,40,13,171,3,1,0 // movaps 0x103ab(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f> + .byte 68,15,40,13,22,5,1,0 // movaps 0x10516(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b> .byte 68,15,40,244 // movaps %xmm4,%xmm14 .byte 69,15,89,241 // mulps %xmm9,%xmm14 - .byte 68,15,40,21,27,4,1,0 // movaps 0x1041b(%rip),%xmm10 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f> + .byte 68,15,40,21,134,5,1,0 // movaps 0x10586(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 69,15,89,243 // mulps %xmm11,%xmm14 - .byte 68,15,40,29,27,4,1,0 // movaps 0x1041b(%rip),%xmm11 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f> + .byte 68,15,40,29,134,5,1,0 // movaps 0x10586(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b> .byte 69,15,88,243 // addps %xmm11,%xmm14 - .byte 68,15,40,37,31,4,1,0 // movaps 0x1041f(%rip),%xmm12 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f> + .byte 68,15,40,37,138,5,1,0 // movaps 0x1058a(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b> .byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4 .byte 68,15,84,236 // andps %xmm4,%xmm13 .byte 65,15,85,230 // andnps %xmm14,%xmm4 @@ -43554,22 +44009,22 @@ HIDDEN _sk_to_srgb_sse2 FUNCTION(_sk_to_srgb_sse2) _sk_to_srgb_sse2: .byte 68,15,82,232 // rsqrtps %xmm0,%xmm13 - .byte 68,15,40,5,172,3,1,0 // movaps 0x103ac(%rip),%xmm8 # 2b900 <_sk_overlay_sse2_8bit+0xf3f> + .byte 68,15,40,5,23,5,1,0 // movaps 0x10517(%rip),%xmm8 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,240 // mulps %xmm8,%xmm14 - .byte 68,15,40,13,172,3,1,0 // movaps 0x103ac(%rip),%xmm9 # 2b910 <_sk_overlay_sse2_8bit+0xf4f> + .byte 68,15,40,13,23,5,1,0 // movaps 0x10517(%rip),%xmm9 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b> .byte 69,15,40,253 // movaps %xmm13,%xmm15 .byte 69,15,89,249 // mulps %xmm9,%xmm15 - .byte 68,15,40,21,172,3,1,0 // movaps 0x103ac(%rip),%xmm10 # 2b920 <_sk_overlay_sse2_8bit+0xf5f> + .byte 68,15,40,21,23,5,1,0 // movaps 0x10517(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,253 // mulps %xmm13,%xmm15 - .byte 68,15,40,29,172,3,1,0 // movaps 0x103ac(%rip),%xmm11 # 2b930 <_sk_overlay_sse2_8bit+0xf6f> + .byte 68,15,40,29,23,5,1,0 // movaps 0x10517(%rip),%xmm11 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b> .byte 69,15,88,251 // addps %xmm11,%xmm15 - .byte 68,15,40,37,176,3,1,0 // movaps 0x103b0(%rip),%xmm12 # 2b940 <_sk_overlay_sse2_8bit+0xf7f> + .byte 68,15,40,37,27,5,1,0 // movaps 0x1051b(%rip),%xmm12 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b> .byte 69,15,88,236 // addps %xmm12,%xmm13 .byte 69,15,83,237 // rcpps %xmm13,%xmm13 .byte 69,15,89,239 // mulps %xmm15,%xmm13 - .byte 68,15,40,61,172,3,1,0 // movaps 0x103ac(%rip),%xmm15 # 2b950 <_sk_overlay_sse2_8bit+0xf8f> + .byte 68,15,40,61,23,5,1,0 // movaps 0x10517(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,197 // andnps %xmm13,%xmm0 @@ -43611,15 +44066,17 @@ FUNCTION(_sk_rgb_to_hsl_sse2) _sk_rgb_to_hsl_sse2: .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,40,192 // movaps %xmm0,%xmm8 + .byte 65,15,40,193 // movaps %xmm9,%xmm0 + .byte 15,95,194 // maxps %xmm2,%xmm0 .byte 69,15,40,208 // movaps %xmm8,%xmm10 - .byte 69,15,95,209 // maxps %xmm9,%xmm10 - .byte 68,15,95,210 // maxps %xmm2,%xmm10 + .byte 68,15,95,208 // maxps %xmm0,%xmm10 + .byte 65,15,40,193 // movaps %xmm9,%xmm0 + .byte 15,93,194 // minps %xmm2,%xmm0 .byte 69,15,40,216 // movaps %xmm8,%xmm11 - .byte 69,15,93,217 // minps %xmm9,%xmm11 - .byte 68,15,93,218 // minps %xmm2,%xmm11 + .byte 68,15,93,216 // minps %xmm0,%xmm11 .byte 65,15,40,202 // movaps %xmm10,%xmm1 .byte 65,15,92,203 // subps %xmm11,%xmm1 - .byte 68,15,40,45,117,1,1,0 // movaps 0x10175(%rip),%xmm13 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,45,218,2,1,0 // movaps 0x102da(%rip),%xmm13 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 68,15,94,233 // divps %xmm1,%xmm13 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0 @@ -43628,30 +44085,30 @@ _sk_rgb_to_hsl_sse2: .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,40,241 // movaps %xmm9,%xmm14 .byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14 - .byte 68,15,84,53,219,2,1,0 // andps 0x102db(%rip),%xmm14 # 2b960 <_sk_overlay_sse2_8bit+0xf9f> + .byte 68,15,84,53,64,4,1,0 // andps 0x10440(%rip),%xmm14 # 2bf60 <_sk_overlay_sse2_8bit+0xfab> .byte 69,15,88,244 // addps %xmm12,%xmm14 .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,213 // mulps %xmm13,%xmm2 - .byte 68,15,40,37,206,2,1,0 // movaps 0x102ce(%rip),%xmm12 # 2b970 <_sk_overlay_sse2_8bit+0xfaf> + .byte 68,15,40,37,51,4,1,0 // movaps 0x10433(%rip),%xmm12 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb> .byte 65,15,88,212 // addps %xmm12,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,88,5,202,2,1,0 // addps 0x102ca(%rip),%xmm8 # 2b980 <_sk_overlay_sse2_8bit+0xfbf> + .byte 68,15,88,5,47,4,1,0 // addps 0x1042f(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb> .byte 65,15,84,215 // andps %xmm15,%xmm2 .byte 69,15,85,248 // andnps %xmm8,%xmm15 .byte 68,15,86,250 // orps %xmm2,%xmm15 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,199 // andnps %xmm15,%xmm0 .byte 65,15,86,198 // orps %xmm14,%xmm0 - .byte 15,89,5,187,2,1,0 // mulps 0x102bb(%rip),%xmm0 # 2b990 <_sk_overlay_sse2_8bit+0xfcf> + .byte 15,89,5,32,4,1,0 // mulps 0x10420(%rip),%xmm0 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb> .byte 69,15,40,194 // movaps %xmm10,%xmm8 .byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8 .byte 65,15,84,192 // andps %xmm8,%xmm0 .byte 69,15,92,226 // subps %xmm10,%xmm12 .byte 69,15,88,211 // addps %xmm11,%xmm10 - .byte 68,15,40,13,206,0,1,0 // movaps 0x100ce(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,13,51,2,1,0 // movaps 0x10233(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,40,210 // movaps %xmm10,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9 @@ -43675,7 +44132,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,218 // movaps %xmm2,%xmm11 .byte 15,40,240 // movaps %xmm0,%xmm6 - .byte 68,15,40,13,125,0,1,0 // movaps 0x1007d(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,13,226,1,1,0 // movaps 0x101e2(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 @@ -43692,28 +44149,28 @@ _sk_hsl_to_rgb_sse2: .byte 69,15,88,211 // addps %xmm11,%xmm10 .byte 69,15,88,219 // addps %xmm11,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 15,40,5,22,2,1,0 // movaps 0x10216(%rip),%xmm0 # 2b9a0 <_sk_overlay_sse2_8bit+0xfdf> + .byte 15,40,5,123,3,1,0 // movaps 0x1037b(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb> .byte 15,88,198 // addps %xmm6,%xmm0 .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,40,216 // movaps %xmm0,%xmm3 .byte 15,194,217,1 // cmpltps %xmm1,%xmm3 - .byte 15,84,29,46,0,1,0 // andps 0x1002e(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,84,29,147,1,1,0 // andps 0x10193(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 - .byte 68,15,40,45,0,2,1,0 // movaps 0x10200(%rip),%xmm13 # 2b9b0 <_sk_overlay_sse2_8bit+0xfef> + .byte 68,15,40,45,101,3,1,0 // movaps 0x10365(%rip),%xmm13 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb> .byte 69,15,40,197 // movaps %xmm13,%xmm8 .byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8 .byte 69,15,40,242 // movaps %xmm10,%xmm14 .byte 69,15,92,243 // subps %xmm11,%xmm14 .byte 65,15,40,217 // movaps %xmm9,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 - .byte 15,40,21,192,1,1,0 // movaps 0x101c0(%rip),%xmm2 # 2b990 <_sk_overlay_sse2_8bit+0xfcf> + .byte 15,40,21,37,3,1,0 // movaps 0x10325(%rip),%xmm2 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb> .byte 68,15,40,250 // movaps %xmm2,%xmm15 .byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15 - .byte 15,40,13,128,1,1,0 // movaps 0x10180(%rip),%xmm1 # 2b960 <_sk_overlay_sse2_8bit+0xf9f> + .byte 15,40,13,229,2,1,0 // movaps 0x102e5(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xfab> .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,45,150,1,1,0 // movaps 0x10196(%rip),%xmm5 # 2b980 <_sk_overlay_sse2_8bit+0xfbf> + .byte 15,40,45,251,2,1,0 // movaps 0x102fb(%rip),%xmm5 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb> .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,92,224 // subps %xmm0,%xmm4 .byte 65,15,89,230 // mulps %xmm14,%xmm4 @@ -43736,7 +44193,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,139,255,0,0 // andps 0xff8b(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,84,29,240,0,1,0 // andps 0x100f0(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 68,15,40,230 // movaps %xmm6,%xmm12 .byte 68,15,92,224 // subps %xmm0,%xmm12 @@ -43766,12 +44223,12 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7 .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 15,85,227 // andnps %xmm3,%xmm4 - .byte 15,88,53,3,1,1,0 // addps 0x10103(%rip),%xmm6 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 15,88,53,104,2,1,0 // addps 0x10268(%rip),%xmm6 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,254,254,0,0 // andps 0xfefe(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,84,29,99,0,1,0 // andps 0x10063(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 15,92,240 // subps %xmm0,%xmm6 .byte 15,89,206 // mulps %xmm6,%xmm1 @@ -43835,13 +44292,13 @@ _sk_scale_u8_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,61 // jne 1b9d3 <_sk_scale_u8_sse2+0x55> + .byte 117,61 // jne 1be6e <_sk_scale_u8_sse2+0x55> .byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 - .byte 102,68,15,219,5,209,254,0,0 // pand 0xfed1(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,68,15,219,5,54,0,1,0 // pand 0x10036(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,21,0,1,0 // mulps 0x10015(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,89,5,122,1,1,0 // mulps 0x1017a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -43852,12 +44309,12 @@ _sk_scale_u8_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,61 // je 1ba1d <_sk_scale_u8_sse2+0x9f> + .byte 116,61 // je 1beb8 <_sk_scale_u8_sse2+0x9f> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 1ba02 <_sk_scale_u8_sse2+0x84> + .byte 116,23 // je 1be9d <_sk_scale_u8_sse2+0x84> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,181 // jne 1b9a6 <_sk_scale_u8_sse2+0x28> + .byte 117,181 // jne 1be41 <_sk_scale_u8_sse2+0x28> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -43866,10 +44323,79 @@ _sk_scale_u8_sse2: .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 242,69,15,16,193 // movsd %xmm9,%xmm8 - .byte 235,137 // jmp 1b9a6 <_sk_scale_u8_sse2+0x28> + .byte 235,137 // jmp 1be41 <_sk_scale_u8_sse2+0x28> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,122,255,255,255 // jmpq 1b9a6 <_sk_scale_u8_sse2+0x28> + .byte 233,122,255,255,255 // jmpq 1be41 <_sk_scale_u8_sse2+0x28> + +HIDDEN _sk_scale_565_sse2 +.globl _sk_scale_565_sse2 +FUNCTION(_sk_scale_565_sse2) +_sk_scale_565_sse2: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 76,99,80,8 // movslq 0x8(%rax),%r10 + .byte 76,99,201 // movslq %ecx,%r9 + .byte 77,15,175,202 // imul %r10,%r9 + .byte 77,1,201 // add %r9,%r9 + .byte 76,3,8 // add (%rax),%r9 + .byte 76,99,218 // movslq %edx,%r11 + .byte 77,133,192 // test %r8,%r8 + .byte 15,133,173,0,0,0 // jne 1bf93 <_sk_scale_565_sse2+0xcc> + .byte 243,71,15,126,20,89 // movq (%r9,%r11,2),%xmm10 + .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10 + .byte 102,68,15,111,5,230,0,1,0 // movdqa 0x100e6(%rip),%xmm8 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> + .byte 102,69,15,219,194 // pand %xmm10,%xmm8 + .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 + .byte 68,15,89,5,229,0,1,0 // mulps 0x100e5(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,68,15,111,13,236,0,1,0 // movdqa 0x100ec(%rip),%xmm9 # 2c000 <_sk_overlay_sse2_8bit+0x104b> + .byte 102,69,15,219,202 // pand %xmm10,%xmm9 + .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 + .byte 68,15,89,13,235,0,1,0 // mulps 0x100eb(%rip),%xmm9 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,68,15,219,21,242,0,1,0 // pand 0x100f2(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b> + .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 + .byte 68,15,89,21,246,0,1,0 // mulps 0x100f6(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b> + .byte 68,15,40,219 // movaps %xmm3,%xmm11 + .byte 68,15,194,223,1 // cmpltps %xmm7,%xmm11 + .byte 69,15,40,225 // movaps %xmm9,%xmm12 + .byte 69,15,93,226 // minps %xmm10,%xmm12 + .byte 69,15,40,232 // movaps %xmm8,%xmm13 + .byte 69,15,93,236 // minps %xmm12,%xmm13 + .byte 69,15,40,225 // movaps %xmm9,%xmm12 + .byte 69,15,95,226 // maxps %xmm10,%xmm12 + .byte 69,15,40,240 // movaps %xmm8,%xmm14 + .byte 69,15,95,244 // maxps %xmm12,%xmm14 + .byte 69,15,84,235 // andps %xmm11,%xmm13 + .byte 69,15,85,222 // andnps %xmm14,%xmm11 + .byte 69,15,86,221 // orps %xmm13,%xmm11 + .byte 68,15,89,192 // mulps %xmm0,%xmm8 + .byte 68,15,89,201 // mulps %xmm1,%xmm9 + .byte 68,15,89,210 // mulps %xmm2,%xmm10 + .byte 68,15,89,219 // mulps %xmm3,%xmm11 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 65,15,40,192 // movaps %xmm8,%xmm0 + .byte 65,15,40,201 // movaps %xmm9,%xmm1 + .byte 65,15,40,210 // movaps %xmm10,%xmm2 + .byte 65,15,40,219 // movaps %xmm11,%xmm3 + .byte 255,224 // jmpq *%rax + .byte 69,137,194 // mov %r8d,%r10d + .byte 65,128,226,3 // and $0x3,%r10b + .byte 65,128,250,1 // cmp $0x1,%r10b + .byte 116,59 // je 1bfdb <_sk_scale_565_sse2+0x114> + .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 + .byte 65,128,250,2 // cmp $0x2,%r10b + .byte 116,27 // je 1bfc6 <_sk_scale_565_sse2+0xff> + .byte 65,128,250,3 // cmp $0x3,%r10b + .byte 15,133,60,255,255,255 // jne 1bef1 <_sk_scale_565_sse2+0x2a> + .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax + .byte 102,68,15,110,192 // movd %eax,%xmm8 + .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10 + .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8 + .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 + .byte 242,69,15,16,208 // movsd %xmm8,%xmm10 + .byte 233,22,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a> + .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax + .byte 102,68,15,110,208 // movd %eax,%xmm10 + .byte 233,7,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a> HIDDEN _sk_lerp_1_float_sse2 .globl _sk_lerp_1_float_sse2 @@ -43904,13 +44430,13 @@ _sk_lerp_u8_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,81 // jne 1bacd <_sk_lerp_u8_sse2+0x69> + .byte 117,81 // jne 1c08b <_sk_lerp_u8_sse2+0x69> .byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 - .byte 102,68,15,219,5,235,253,0,0 // pand 0xfdeb(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,68,15,219,5,45,254,0,0 // pand 0xfe2d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,47,255,0,0 // mulps 0xff2f(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,89,5,113,255,0,0 // mulps 0xff71(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -43928,12 +44454,12 @@ _sk_lerp_u8_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,64 // je 1bb1a <_sk_lerp_u8_sse2+0xb6> + .byte 116,64 // je 1c0d8 <_sk_lerp_u8_sse2+0xb6> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 1bafc <_sk_lerp_u8_sse2+0x98> + .byte 116,23 // je 1c0ba <_sk_lerp_u8_sse2+0x98> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,161 // jne 1ba8c <_sk_lerp_u8_sse2+0x28> + .byte 117,161 // jne 1c04a <_sk_lerp_u8_sse2+0x28> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -43942,10 +44468,10 @@ _sk_lerp_u8_sse2: .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 242,69,15,16,193 // movsd %xmm9,%xmm8 - .byte 233,114,255,255,255 // jmpq 1ba8c <_sk_lerp_u8_sse2+0x28> + .byte 233,114,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,99,255,255,255 // jmpq 1ba8c <_sk_lerp_u8_sse2+0x28> + .byte 233,99,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28> HIDDEN _sk_lerp_565_sse2 .globl _sk_lerp_565_sse2 @@ -43959,60 +44485,64 @@ _sk_lerp_565_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,156,0,0,0 // jne 1bbe4 <_sk_lerp_565_sse2+0xbb> - .byte 243,71,15,126,12,89 // movq (%r9,%r11,2),%xmm9 - .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 - .byte 102,68,15,111,5,132,254,0,0 // movdqa 0xfe84(%rip),%xmm8 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> - .byte 102,69,15,219,193 // pand %xmm9,%xmm8 - .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,131,254,0,0 // mulps 0xfe83(%rip),%xmm8 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,68,15,111,21,138,254,0,0 // movdqa 0xfe8a(%rip),%xmm10 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> - .byte 102,69,15,219,209 // pand %xmm9,%xmm10 - .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,137,254,0,0 // mulps 0xfe89(%rip),%xmm10 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,68,15,219,13,144,254,0,0 // pand 0xfe90(%rip),%xmm9 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 15,133,173,0,0,0 // jne 1c1b3 <_sk_lerp_565_sse2+0xcc> + .byte 243,71,15,126,4,89 // movq (%r9,%r11,2),%xmm8 + .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 + .byte 102,68,15,111,13,198,254,0,0 // movdqa 0xfec6(%rip),%xmm9 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> + .byte 102,69,15,219,200 // pand %xmm8,%xmm9 .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,148,254,0,0 // mulps 0xfe94(%rip),%xmm9 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> + .byte 68,15,89,13,197,254,0,0 // mulps 0xfec5(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,68,15,111,21,204,254,0,0 // movdqa 0xfecc(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0x104b> + .byte 102,69,15,219,208 // pand %xmm8,%xmm10 + .byte 69,15,91,218 // cvtdq2ps %xmm10,%xmm11 + .byte 68,15,89,29,203,254,0,0 // mulps 0xfecb(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,68,15,219,5,210,254,0,0 // pand 0xfed2(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0x106b> + .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 + .byte 68,15,89,5,214,254,0,0 // mulps 0xfed6(%rip),%xmm8 # 2c030 <_sk_overlay_sse2_8bit+0x107b> + .byte 68,15,40,211 // movaps %xmm3,%xmm10 + .byte 68,15,194,215,1 // cmpltps %xmm7,%xmm10 + .byte 69,15,40,227 // movaps %xmm11,%xmm12 + .byte 15,92,205 // subps %xmm5,%xmm1 + .byte 65,15,89,203 // mulps %xmm11,%xmm1 + .byte 69,15,93,216 // minps %xmm8,%xmm11 + .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 65,15,89,192 // mulps %xmm8,%xmm0 + .byte 65,15,89,193 // mulps %xmm9,%xmm0 + .byte 69,15,93,203 // minps %xmm11,%xmm9 + .byte 69,15,95,224 // maxps %xmm8,%xmm12 + .byte 69,15,95,236 // maxps %xmm12,%xmm13 + .byte 69,15,84,202 // andps %xmm10,%xmm9 + .byte 69,15,85,213 // andnps %xmm13,%xmm10 + .byte 69,15,86,209 // orps %xmm9,%xmm10 .byte 15,88,196 // addps %xmm4,%xmm0 - .byte 15,92,205 // subps %xmm5,%xmm1 - .byte 65,15,89,202 // mulps %xmm10,%xmm1 .byte 15,88,205 // addps %xmm5,%xmm1 .byte 15,92,214 // subps %xmm6,%xmm2 - .byte 65,15,89,209 // mulps %xmm9,%xmm2 + .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 15,88,214 // addps %xmm6,%xmm2 .byte 15,92,223 // subps %xmm7,%xmm3 - .byte 68,15,89,195 // mulps %xmm3,%xmm8 - .byte 68,15,88,199 // addps %xmm7,%xmm8 - .byte 68,15,89,211 // mulps %xmm3,%xmm10 - .byte 68,15,88,215 // addps %xmm7,%xmm10 - .byte 65,15,89,217 // mulps %xmm9,%xmm3 + .byte 65,15,89,218 // mulps %xmm10,%xmm3 .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 68,15,95,211 // maxps %xmm3,%xmm10 - .byte 69,15,95,194 // maxps %xmm10,%xmm8 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 65,15,40,216 // movaps %xmm8,%xmm3 .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,59 // je 1bc2c <_sk_lerp_565_sse2+0x103> - .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 + .byte 116,59 // je 1c1fb <_sk_lerp_565_sse2+0x114> + .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,27 // je 1bc17 <_sk_lerp_565_sse2+0xee> + .byte 116,27 // je 1c1e6 <_sk_lerp_565_sse2+0xff> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,77,255,255,255 // jne 1bb53 <_sk_lerp_565_sse2+0x2a> + .byte 15,133,60,255,255,255 // jne 1c111 <_sk_lerp_565_sse2+0x2a> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 102,69,15,112,200,69 // pshufd $0x45,%xmm8,%xmm9 - .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8 - .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 - .byte 242,69,15,16,200 // movsd %xmm8,%xmm9 - .byte 233,39,255,255,255 // jmpq 1bb53 <_sk_lerp_565_sse2+0x2a> + .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 + .byte 102,71,15,110,12,89 // movd (%r9,%r11,2),%xmm9 + .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 + .byte 242,69,15,16,193 // movsd %xmm9,%xmm8 + .byte 233,22,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax - .byte 102,68,15,110,200 // movd %eax,%xmm9 - .byte 233,24,255,255,255 // jmpq 1bb53 <_sk_lerp_565_sse2+0x2a> + .byte 102,68,15,110,192 // movd %eax,%xmm8 + .byte 233,7,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a> HIDDEN _sk_load_tables_sse2 .globl _sk_load_tables_sse2 @@ -44021,12 +44551,12 @@ _sk_load_tables_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,36,1,0,0 // jne 1bd6d <_sk_load_tables_sse2+0x132> + .byte 15,133,36,1,0,0 // jne 1c33c <_sk_load_tables_sse2+0x132> .byte 243,69,15,111,12,145 // movdqu (%r9,%rdx,4),%xmm9 .byte 65,87 // push %r15 .byte 65,86 // push %r14 .byte 83 // push %rbx - .byte 102,68,15,111,5,35,252,0,0 // movdqa 0xfc23(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,68,15,111,5,84,252,0,0 // movdqa 0xfc54(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 @@ -44082,7 +44612,7 @@ _sk_load_tables_sse2: .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 102,65,15,114,209,24 // psrld $0x18,%xmm9 .byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3 - .byte 15,89,29,108,252,0,0 // mulps 0xfc6c(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,29,157,252,0,0 // mulps 0xfc9d(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -44091,18 +44621,18 @@ _sk_load_tables_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,45 // je 1bda7 <_sk_load_tables_sse2+0x16c> + .byte 116,45 // je 1c376 <_sk_load_tables_sse2+0x16c> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 1bd9c <_sk_load_tables_sse2+0x161> + .byte 116,23 // je 1c36b <_sk_load_tables_sse2+0x161> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,192,254,255,255 // jne 1bc4f <_sk_load_tables_sse2+0x14> + .byte 15,133,192,254,255,255 // jne 1c21e <_sk_load_tables_sse2+0x14> .byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0 .byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9 .byte 102,69,15,18,12,145 // movlpd (%r9,%rdx,4),%xmm9 - .byte 233,168,254,255,255 // jmpq 1bc4f <_sk_load_tables_sse2+0x14> + .byte 233,168,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14> .byte 102,69,15,110,12,145 // movd (%r9,%rdx,4),%xmm9 - .byte 233,157,254,255,255 // jmpq 1bc4f <_sk_load_tables_sse2+0x14> + .byte 233,157,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14> HIDDEN _sk_load_tables_u16_be_sse2 .globl _sk_load_tables_u16_be_sse2 @@ -44112,7 +44642,7 @@ _sk_load_tables_u16_be_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,101,1,0,0 // jne 1bf2d <_sk_load_tables_u16_be_sse2+0x17b> + .byte 15,133,101,1,0,0 // jne 1c4fc <_sk_load_tables_u16_be_sse2+0x17b> .byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0 .byte 102,67,15,16,76,81,16 // movupd 0x10(%r9,%r10,2),%xmm1 .byte 65,87 // push %r15 @@ -44124,7 +44654,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,21,65,252,0,0 // movdqa 0xfc41(%rip),%xmm10 # 2ba40 <_sk_overlay_sse2_8bit+0x107f> + .byte 102,68,15,111,21,114,252,0,0 // movdqa 0xfc72(%rip),%xmm10 # 2c040 <_sk_overlay_sse2_8bit+0x108b> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,194 // pand %xmm10,%xmm0 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 @@ -44186,7 +44716,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,235,217 // por %xmm9,%xmm3 .byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,60,251,0,0 // mulps 0xfb3c(%rip),%xmm3 # 2ba60 <_sk_overlay_sse2_8bit+0x109f> + .byte 15,89,29,109,251,0,0 // mulps 0xfb6d(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -44194,17 +44724,17 @@ _sk_load_tables_u16_be_sse2: .byte 255,224 // jmpq *%rax .byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,17 // jne 1bf4a <_sk_load_tables_u16_be_sse2+0x198> + .byte 117,17 // jne 1c519 <_sk_load_tables_u16_be_sse2+0x198> .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 102,15,20,193 // unpcklpd %xmm1,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 - .byte 233,139,254,255,255 // jmpq 1bdd5 <_sk_load_tables_u16_be_sse2+0x23> + .byte 233,139,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23> .byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,118,254,255,255 // jb 1bdd5 <_sk_load_tables_u16_be_sse2+0x23> + .byte 15,130,118,254,255,255 // jb 1c3a4 <_sk_load_tables_u16_be_sse2+0x23> .byte 242,67,15,16,76,81,16 // movsd 0x10(%r9,%r10,2),%xmm1 - .byte 233,106,254,255,255 // jmpq 1bdd5 <_sk_load_tables_u16_be_sse2+0x23> + .byte 233,106,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23> HIDDEN _sk_load_tables_rgb_u16_be_sse2 .globl _sk_load_tables_rgb_u16_be_sse2 @@ -44214,7 +44744,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,84,1,0,0 // jne 1c0d1 <_sk_load_tables_rgb_u16_be_sse2+0x166> + .byte 15,133,84,1,0,0 // jne 1c6a0 <_sk_load_tables_rgb_u16_be_sse2+0x166> .byte 243,71,15,111,28,81 // movdqu (%r9,%r10,2),%xmm11 .byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1 .byte 102,15,115,217,4 // psrldq $0x4,%xmm1 @@ -44229,7 +44759,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10 .byte 102,65,15,111,195 // movdqa %xmm11,%xmm0 .byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0 - .byte 102,68,15,111,5,123,250,0,0 // movdqa 0xfa7b(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f> + .byte 102,68,15,111,5,172,250,0,0 // movdqa 0xfaac(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 @@ -44285,7 +44815,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 15,20,211 // unpcklps %xmm3,%xmm2 .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,6,247,0,0 // movaps 0xf706(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,55,247,0,0 // movaps 0xf737(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 91 // pop %rbx .byte 65,94 // pop %r14 .byte 65,95 // pop %r15 @@ -44294,21 +44824,21 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,71,15,196,92,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm11 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,14 // jne 1c0f7 <_sk_load_tables_rgb_u16_be_sse2+0x18c> + .byte 117,14 // jne 1c6c6 <_sk_load_tables_rgb_u16_be_sse2+0x18c> .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 - .byte 233,172,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38> + .byte 233,172,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38> .byte 102,71,15,110,84,81,6 // movd 0x6(%r9,%r10,2),%xmm10 .byte 102,71,15,196,84,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm10 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 1c128 <_sk_load_tables_rgb_u16_be_sse2+0x1bd> + .byte 114,24 // jb 1c6f7 <_sk_load_tables_rgb_u16_be_sse2+0x1bd> .byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1 .byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,123,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38> + .byte 233,123,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38> .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,114,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38> + .byte 233,114,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38> HIDDEN _sk_byte_tables_sse2 .globl _sk_byte_tables_sse2 @@ -44319,7 +44849,7 @@ _sk_byte_tables_sse2: .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,111,247,0,0 // movaps 0xf76f(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,160,247,0,0 // movaps 0xf7a0(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,73,15,126,193 // movq %xmm0,%r9 @@ -44347,7 +44877,7 @@ _sk_byte_tables_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,25,248,0,0 // movaps 0xf819(%rip),%xmm10 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,21,74,248,0,0 // movaps 0xf84a(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -44468,7 +44998,7 @@ _sk_byte_tables_rgb_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,81,246,0,0 // movaps 0xf651(%rip),%xmm10 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,21,130,246,0,0 // movaps 0xf682(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -44675,15 +45205,15 @@ _sk_parametric_r_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,37,244,0,0 // mulps 0xf425(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,21,45,244,0,0 // andps 0xf42d(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,21,85,241,0,0 // orps 0xf155(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,13,45,244,0,0 // addps 0xf42d(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 68,15,40,37,53,244,0,0 // movaps 0xf435(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,13,86,244,0,0 // mulps 0xf456(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,21,94,244,0,0 // andps 0xf45e(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,21,134,241,0,0 // orps 0xf186(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,13,94,244,0,0 // addps 0xf45e(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 68,15,40,37,102,244,0,0 // movaps 0xf466(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,53,244,0,0 // addps 0xf435(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 68,15,40,37,61,244,0,0 // movaps 0xf43d(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,21,102,244,0,0 // addps 0xf466(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 68,15,40,37,110,244,0,0 // movaps 0xf46e(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -44691,22 +45221,22 @@ _sk_parametric_r_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,23,241,0,0 // movaps 0xf117(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,72,241,0,0 // movaps 0xf148(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,11,244,0,0 // addps 0xf40b(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 68,15,40,37,19,244,0,0 // movaps 0xf413(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,13,60,244,0,0 // addps 0xf43c(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,19,244,0,0 // movaps 0xf413(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,23,244,0,0 // movaps 0xf417(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 68,15,40,45,72,244,0,0 // movaps 0xf448(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,23,244,0,0 // mulps 0xf417(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 68,15,89,45,72,244,0,0 // mulps 0xf448(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -44742,15 +45272,15 @@ _sk_parametric_g_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,231,242,0,0 // mulps 0xf2e7(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,21,239,242,0,0 // andps 0xf2ef(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,21,23,240,0,0 // orps 0xf017(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,13,239,242,0,0 // addps 0xf2ef(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 68,15,40,37,247,242,0,0 // movaps 0xf2f7(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,13,24,243,0,0 // mulps 0xf318(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,21,32,243,0,0 // andps 0xf320(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,21,72,240,0,0 // orps 0xf048(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,13,32,243,0,0 // addps 0xf320(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 68,15,40,37,40,243,0,0 // movaps 0xf328(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,247,242,0,0 // addps 0xf2f7(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 68,15,40,37,255,242,0,0 // movaps 0xf2ff(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,21,40,243,0,0 // addps 0xf328(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 68,15,40,37,48,243,0,0 // movaps 0xf330(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -44758,22 +45288,22 @@ _sk_parametric_g_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,217,239,0,0 // movaps 0xefd9(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,10,240,0,0 // movaps 0xf00a(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,205,242,0,0 // addps 0xf2cd(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 68,15,40,37,213,242,0,0 // movaps 0xf2d5(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,13,254,242,0,0 // addps 0xf2fe(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,213,242,0,0 // movaps 0xf2d5(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,217,242,0,0 // movaps 0xf2d9(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 68,15,40,45,10,243,0,0 // movaps 0xf30a(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,217,242,0,0 // mulps 0xf2d9(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 68,15,89,45,10,243,0,0 // mulps 0xf30a(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -44809,15 +45339,15 @@ _sk_parametric_b_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,169,241,0,0 // mulps 0xf1a9(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,21,177,241,0,0 // andps 0xf1b1(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,21,217,238,0,0 // orps 0xeed9(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,13,177,241,0,0 // addps 0xf1b1(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 68,15,40,37,185,241,0,0 // movaps 0xf1b9(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,13,218,241,0,0 // mulps 0xf1da(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,21,226,241,0,0 // andps 0xf1e2(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,21,10,239,0,0 // orps 0xef0a(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,13,226,241,0,0 // addps 0xf1e2(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 68,15,40,37,234,241,0,0 // movaps 0xf1ea(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,185,241,0,0 // addps 0xf1b9(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 68,15,40,37,193,241,0,0 // movaps 0xf1c1(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,21,234,241,0,0 // addps 0xf1ea(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 68,15,40,37,242,241,0,0 // movaps 0xf1f2(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -44825,22 +45355,22 @@ _sk_parametric_b_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,155,238,0,0 // movaps 0xee9b(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,204,238,0,0 // movaps 0xeecc(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,143,241,0,0 // addps 0xf18f(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 68,15,40,37,151,241,0,0 // movaps 0xf197(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,13,192,241,0,0 // addps 0xf1c0(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,151,241,0,0 // movaps 0xf197(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,155,241,0,0 // movaps 0xf19b(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 68,15,40,45,204,241,0,0 // movaps 0xf1cc(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,155,241,0,0 // mulps 0xf19b(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 68,15,89,45,204,241,0,0 // mulps 0xf1cc(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -44876,15 +45406,15 @@ _sk_parametric_a_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,107,240,0,0 // mulps 0xf06b(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 68,15,84,21,115,240,0,0 // andps 0xf073(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,86,21,155,237,0,0 // orps 0xed9b(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> - .byte 68,15,88,13,115,240,0,0 // addps 0xf073(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> - .byte 68,15,40,37,123,240,0,0 // movaps 0xf07b(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,89,13,156,240,0,0 // mulps 0xf09c(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 68,15,84,21,164,240,0,0 // andps 0xf0a4(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,86,21,204,237,0,0 // orps 0xedcc(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> + .byte 68,15,88,13,164,240,0,0 // addps 0xf0a4(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> + .byte 68,15,40,37,172,240,0,0 // movaps 0xf0ac(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,123,240,0,0 // addps 0xf07b(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> - .byte 68,15,40,37,131,240,0,0 // movaps 0xf083(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,88,21,172,240,0,0 // addps 0xf0ac(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> + .byte 68,15,40,37,180,240,0,0 // movaps 0xf0b4(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -44892,22 +45422,22 @@ _sk_parametric_a_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,93,237,0,0 // movaps 0xed5d(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,142,237,0,0 // movaps 0xed8e(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,81,240,0,0 // addps 0xf051(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> - .byte 68,15,40,37,89,240,0,0 // movaps 0xf059(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 68,15,88,13,130,240,0,0 // addps 0xf082(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> + .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,89,240,0,0 // movaps 0xf059(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,93,240,0,0 // movaps 0xf05d(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 68,15,40,45,142,240,0,0 // movaps 0xf08e(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,93,240,0,0 // mulps 0xf05d(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 68,15,89,45,142,240,0,0 // mulps 0xf08e(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -44932,19 +45462,19 @@ _sk_gamma_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0 - .byte 15,89,5,104,239,0,0 // mulps 0xef68(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 15,84,21,113,239,0,0 // andps 0xef71(%rip),%xmm2 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 68,15,40,53,153,236,0,0 // movaps 0xec99(%rip),%xmm14 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,89,5,153,239,0,0 // mulps 0xef99(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 15,84,21,162,239,0,0 // andps 0xefa2(%rip),%xmm2 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 68,15,40,53,202,236,0,0 // movaps 0xecca(%rip),%xmm14 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,86,214 // orps %xmm14,%xmm2 - .byte 68,15,40,37,109,239,0,0 // movaps 0xef6d(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df> + .byte 68,15,40,37,158,239,0,0 // movaps 0xef9e(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb> .byte 65,15,88,196 // addps %xmm12,%xmm0 - .byte 68,15,40,29,113,239,0,0 // movaps 0xef71(%rip),%xmm11 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef> + .byte 68,15,40,29,162,239,0,0 // movaps 0xefa2(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb> .byte 15,40,226 // movaps %xmm2,%xmm4 .byte 65,15,89,227 // mulps %xmm11,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 68,15,40,21,111,239,0,0 // movaps 0xef6f(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff> + .byte 68,15,40,21,160,239,0,0 // movaps 0xefa0(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b> .byte 65,15,88,210 // addps %xmm10,%xmm2 - .byte 68,15,40,45,115,239,0,0 // movaps 0xef73(%rip),%xmm13 # 2bad0 <_sk_overlay_sse2_8bit+0x110f> + .byte 68,15,40,45,164,239,0,0 // movaps 0xefa4(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b> .byte 65,15,40,229 // movaps %xmm13,%xmm4 .byte 15,94,226 // divps %xmm2,%xmm4 .byte 72,173 // lods %ds:(%rsi),%rax @@ -44956,27 +45486,27 @@ _sk_gamma_sse2: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,194,226,1 // cmpltps %xmm2,%xmm4 - .byte 68,15,40,13,67,236,0,0 // movaps 0xec43(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,13,116,236,0,0 // movaps 0xec74(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 65,15,84,225 // andps %xmm9,%xmm4 .byte 15,92,212 // subps %xmm4,%xmm2 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 15,40,53,63,239,0,0 // movaps 0xef3f(%rip),%xmm6 # 2bae0 <_sk_overlay_sse2_8bit+0x111f> + .byte 15,40,53,112,239,0,0 // movaps 0xef70(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b> .byte 15,88,198 // addps %xmm6,%xmm0 - .byte 15,40,61,85,239,0,0 // movaps 0xef55(%rip),%xmm7 # 2bb00 <_sk_overlay_sse2_8bit+0x113f> + .byte 15,40,61,134,239,0,0 // movaps 0xef86(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b> .byte 15,40,239 // movaps %xmm7,%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,212 // movaps %xmm4,%xmm2 - .byte 15,40,37,53,239,0,0 // movaps 0xef35(%rip),%xmm4 # 2baf0 <_sk_overlay_sse2_8bit+0x112f> + .byte 15,40,37,102,239,0,0 // movaps 0xef66(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b> .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 15,92,194 // subps %xmm2,%xmm0 - .byte 68,15,40,61,71,239,0,0 // movaps 0xef47(%rip),%xmm15 # 2bb10 <_sk_overlay_sse2_8bit+0x114f> + .byte 68,15,40,61,120,239,0,0 // movaps 0xef78(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b> .byte 65,15,40,215 // movaps %xmm15,%xmm2 .byte 15,94,213 // divps %xmm5,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 15,89,5,163,238,0,0 // mulps 0xeea3(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 15,84,13,172,238,0,0 // andps 0xeeac(%rip),%xmm1 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> + .byte 15,89,5,212,238,0,0 // mulps 0xeed4(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 15,84,13,221,238,0,0 // andps 0xeedd(%rip),%xmm1 # 2c090 <_sk_overlay_sse2_8bit+0x10db> .byte 65,15,86,206 // orps %xmm14,%xmm1 .byte 65,15,88,196 // addps %xmm12,%xmm0 .byte 15,40,233 // movaps %xmm1,%xmm5 @@ -45006,9 +45536,9 @@ _sk_gamma_sse2: .byte 15,94,206 // divps %xmm6,%xmm1 .byte 15,88,200 // addps %xmm0,%xmm1 .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0 - .byte 15,89,5,50,238,0,0 // mulps 0xee32(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf> - .byte 15,84,29,59,238,0,0 // andps 0xee3b(%rip),%xmm3 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf> - .byte 15,86,29,100,235,0,0 // orps 0xeb64(%rip),%xmm3 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,89,5,99,238,0,0 // mulps 0xee63(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb> + .byte 15,84,29,108,238,0,0 // andps 0xee6c(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db> + .byte 15,86,29,149,235,0,0 // orps 0xeb95(%rip),%xmm3 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,88,196 // addps %xmm12,%xmm0 .byte 68,15,89,219 // mulps %xmm3,%xmm11 .byte 65,15,92,195 // subps %xmm11,%xmm0 @@ -45030,7 +45560,7 @@ _sk_gamma_sse2: .byte 15,92,253 // subps %xmm5,%xmm7 .byte 68,15,94,255 // divps %xmm7,%xmm15 .byte 68,15,88,248 // addps %xmm0,%xmm15 - .byte 15,40,5,113,238,0,0 // movaps 0xee71(%rip),%xmm0 # 2bb20 <_sk_overlay_sse2_8bit+0x115f> + .byte 15,40,5,162,238,0,0 // movaps 0xeea2(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b> .byte 15,89,208 // mulps %xmm0,%xmm2 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 68,15,89,248 // mulps %xmm0,%xmm15 @@ -45049,29 +45579,29 @@ HIDDEN _sk_lab_to_xyz_sse2 .globl _sk_lab_to_xyz_sse2 FUNCTION(_sk_lab_to_xyz_sse2) _sk_lab_to_xyz_sse2: - .byte 15,89,5,70,238,0,0 // mulps 0xee46(%rip),%xmm0 # 2bb30 <_sk_overlay_sse2_8bit+0x116f> - .byte 68,15,40,5,190,235,0,0 // movaps 0xebbe(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 15,89,5,119,238,0,0 // mulps 0xee77(%rip),%xmm0 # 2c130 <_sk_overlay_sse2_8bit+0x117b> + .byte 68,15,40,5,239,235,0,0 // movaps 0xebef(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 65,15,89,200 // mulps %xmm8,%xmm1 - .byte 68,15,40,13,66,238,0,0 // movaps 0xee42(%rip),%xmm9 # 2bb40 <_sk_overlay_sse2_8bit+0x117f> + .byte 68,15,40,13,115,238,0,0 // movaps 0xee73(%rip),%xmm9 # 2c140 <_sk_overlay_sse2_8bit+0x118b> .byte 65,15,88,201 // addps %xmm9,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 65,15,88,209 // addps %xmm9,%xmm2 - .byte 15,88,5,63,238,0,0 // addps 0xee3f(%rip),%xmm0 # 2bb50 <_sk_overlay_sse2_8bit+0x118f> - .byte 15,89,5,72,238,0,0 // mulps 0xee48(%rip),%xmm0 # 2bb60 <_sk_overlay_sse2_8bit+0x119f> - .byte 15,89,13,81,238,0,0 // mulps 0xee51(%rip),%xmm1 # 2bb70 <_sk_overlay_sse2_8bit+0x11af> + .byte 15,88,5,112,238,0,0 // addps 0xee70(%rip),%xmm0 # 2c150 <_sk_overlay_sse2_8bit+0x119b> + .byte 15,89,5,121,238,0,0 // mulps 0xee79(%rip),%xmm0 # 2c160 <_sk_overlay_sse2_8bit+0x11ab> + .byte 15,89,13,130,238,0,0 // mulps 0xee82(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,21,87,238,0,0 // mulps 0xee57(%rip),%xmm2 # 2bb80 <_sk_overlay_sse2_8bit+0x11bf> + .byte 15,89,21,136,238,0,0 // mulps 0xee88(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 68,15,92,202 // subps %xmm2,%xmm9 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 .byte 68,15,89,225 // mulps %xmm1,%xmm12 - .byte 15,40,21,76,238,0,0 // movaps 0xee4c(%rip),%xmm2 # 2bb90 <_sk_overlay_sse2_8bit+0x11cf> + .byte 15,40,21,125,238,0,0 // movaps 0xee7d(%rip),%xmm2 # 2c190 <_sk_overlay_sse2_8bit+0x11db> .byte 68,15,40,194 // movaps %xmm2,%xmm8 .byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8 - .byte 68,15,40,21,75,238,0,0 // movaps 0xee4b(%rip),%xmm10 # 2bba0 <_sk_overlay_sse2_8bit+0x11df> + .byte 68,15,40,21,124,238,0,0 // movaps 0xee7c(%rip),%xmm10 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb> .byte 65,15,88,202 // addps %xmm10,%xmm1 - .byte 68,15,40,29,79,238,0,0 // movaps 0xee4f(%rip),%xmm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x11ef> + .byte 68,15,40,29,128,238,0,0 // movaps 0xee80(%rip),%xmm11 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 69,15,84,224 // andps %xmm8,%xmm12 .byte 68,15,85,193 // andnps %xmm1,%xmm8 @@ -45095,8 +45625,8 @@ _sk_lab_to_xyz_sse2: .byte 15,84,194 // andps %xmm2,%xmm0 .byte 65,15,85,209 // andnps %xmm9,%xmm2 .byte 15,86,208 // orps %xmm0,%xmm2 - .byte 68,15,89,5,255,237,0,0 // mulps 0xedff(%rip),%xmm8 # 2bbc0 <_sk_overlay_sse2_8bit+0x11ff> - .byte 15,89,21,8,238,0,0 // mulps 0xee08(%rip),%xmm2 # 2bbd0 <_sk_overlay_sse2_8bit+0x120f> + .byte 68,15,89,5,48,238,0,0 // mulps 0xee30(%rip),%xmm8 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b> + .byte 15,89,21,57,238,0,0 // mulps 0xee39(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -45112,13 +45642,13 @@ _sk_load_a8_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,46 // jne 1ce16 <_sk_load_a8_sse2+0x46> + .byte 117,46 // jne 1d3e5 <_sk_load_a8_sse2+0x46> .byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,5,130,234,0,0 // pand 0xea82(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,5,179,234,0,0 // pand 0xeab3(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,200,235,0,0 // mulps 0xebc8(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,29,249,235,0,0 // mulps 0xebf9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 @@ -45127,12 +45657,12 @@ _sk_load_a8_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,54 // je 1ce59 <_sk_load_a8_sse2+0x89> + .byte 116,54 // je 1d428 <_sk_load_a8_sse2+0x89> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1ce42 <_sk_load_a8_sse2+0x72> + .byte 116,21 // je 1d411 <_sk_load_a8_sse2+0x72> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,195 // jne 1cdf6 <_sk_load_a8_sse2+0x26> + .byte 117,195 // jne 1d3c5 <_sk_load_a8_sse2+0x26> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -45141,10 +45671,10 @@ _sk_load_a8_sse2: .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 235,157 // jmp 1cdf6 <_sk_load_a8_sse2+0x26> + .byte 235,157 // jmp 1d3c5 <_sk_load_a8_sse2+0x26> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,146 // jmp 1cdf6 <_sk_load_a8_sse2+0x26> + .byte 235,146 // jmp 1d3c5 <_sk_load_a8_sse2+0x26> HIDDEN _sk_load_a8_dst_sse2 .globl _sk_load_a8_dst_sse2 @@ -45157,13 +45687,13 @@ _sk_load_a8_dst_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,46 // jne 1ceaa <_sk_load_a8_dst_sse2+0x46> + .byte 117,46 // jne 1d479 <_sk_load_a8_dst_sse2+0x46> .byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,37,238,233,0,0 // pand 0xe9ee(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,37,31,234,0,0 // pand 0xea1f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,252 // cvtdq2ps %xmm4,%xmm7 - .byte 15,89,61,52,235,0,0 // mulps 0xeb34(%rip),%xmm7 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,61,101,235,0,0 // mulps 0xeb65(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 102,15,87,237 // xorpd %xmm5,%xmm5 @@ -45172,12 +45702,12 @@ _sk_load_a8_dst_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,54 // je 1ceed <_sk_load_a8_dst_sse2+0x89> + .byte 116,54 // je 1d4bc <_sk_load_a8_dst_sse2+0x89> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1ced6 <_sk_load_a8_dst_sse2+0x72> + .byte 116,21 // je 1d4a5 <_sk_load_a8_dst_sse2+0x72> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,195 // jne 1ce8a <_sk_load_a8_dst_sse2+0x26> + .byte 117,195 // jne 1d459 <_sk_load_a8_dst_sse2+0x26> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -45186,10 +45716,10 @@ _sk_load_a8_dst_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 235,157 // jmp 1ce8a <_sk_load_a8_dst_sse2+0x26> + .byte 235,157 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 - .byte 235,146 // jmp 1ce8a <_sk_load_a8_dst_sse2+0x26> + .byte 235,146 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26> HIDDEN _sk_gather_a8_sse2 .globl _sk_gather_a8_sse2 @@ -45231,7 +45761,7 @@ _sk_gather_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,69,234,0,0 // mulps 0xea45(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,29,118,234,0,0 // mulps 0xea76(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -45250,7 +45780,7 @@ _sk_store_a8_sse2: .byte 77,15,175,202 // imul %r10,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 - .byte 68,15,40,5,249,232,0,0 // movaps 0xe8f9(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,42,233,0,0 // movaps 0xe92a(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,65,15,114,240,16 // pslld $0x10,%xmm8 @@ -45258,7 +45788,7 @@ _sk_store_a8_sse2: .byte 102,69,15,107,192 // packssdw %xmm8,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,13 // jne 1cfe8 <_sk_store_a8_sse2+0x4c> + .byte 117,13 // jne 1d5b7 <_sk_store_a8_sse2+0x4c> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 67,137,4,25 // mov %eax,(%r9,%r11,1) .byte 72,173 // lods %ds:(%rsi),%rax @@ -45268,24 +45798,24 @@ _sk_store_a8_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,59 // je 1d03a <_sk_store_a8_sse2+0x9e> + .byte 116,59 // je 1d609 <_sk_store_a8_sse2+0x9e> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,22 // je 1d01b <_sk_store_a8_sse2+0x7f> + .byte 116,22 // je 1d5ea <_sk_store_a8_sse2+0x7f> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,217 // jne 1cfe4 <_sk_store_a8_sse2+0x48> + .byte 117,217 // jne 1d5b3 <_sk_store_a8_sse2+0x48> .byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp) .byte 138,68,36,240 // mov -0x10(%rsp),%al .byte 67,136,68,25,2 // mov %al,0x2(%r9,%r11,1) - .byte 102,68,15,219,5,92,232,0,0 // pand 0xe85c(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,68,15,219,5,141,232,0,0 // pand 0xe88d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,67,137,4,25 // mov %ax,(%r9,%r11,1) - .byte 235,170 // jmp 1cfe4 <_sk_store_a8_sse2+0x48> + .byte 235,170 // jmp 1d5b3 <_sk_store_a8_sse2+0x48> .byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp) .byte 138,68,36,216 // mov -0x28(%rsp),%al .byte 67,136,4,25 // mov %al,(%r9,%r11,1) - .byte 235,153 // jmp 1cfe4 <_sk_store_a8_sse2+0x48> + .byte 235,153 // jmp 1d5b3 <_sk_store_a8_sse2+0x48> HIDDEN _sk_load_g8_sse2 .globl _sk_load_g8_sse2 @@ -45298,27 +45828,27 @@ _sk_load_g8_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,49 // jne 1d094 <_sk_load_g8_sse2+0x49> + .byte 117,49 // jne 1d663 <_sk_load_g8_sse2+0x49> .byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,5,7,232,0,0 // pand 0xe807(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,5,56,232,0,0 // pand 0xe838(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,77,233,0,0 // mulps 0xe94d(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,5,126,233,0,0 // mulps 0xe97e(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,68,231,0,0 // movaps 0xe744(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,117,231,0,0 // movaps 0xe775(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,54 // je 1d0d7 <_sk_load_g8_sse2+0x8c> + .byte 116,54 // je 1d6a6 <_sk_load_g8_sse2+0x8c> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1d0c0 <_sk_load_g8_sse2+0x75> + .byte 116,21 // je 1d68f <_sk_load_g8_sse2+0x75> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,192 // jne 1d071 <_sk_load_g8_sse2+0x26> + .byte 117,192 // jne 1d640 <_sk_load_g8_sse2+0x26> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -45327,10 +45857,10 @@ _sk_load_g8_sse2: .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 235,154 // jmp 1d071 <_sk_load_g8_sse2+0x26> + .byte 235,154 // jmp 1d640 <_sk_load_g8_sse2+0x26> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,143 // jmp 1d071 <_sk_load_g8_sse2+0x26> + .byte 235,143 // jmp 1d640 <_sk_load_g8_sse2+0x26> HIDDEN _sk_load_g8_dst_sse2 .globl _sk_load_g8_dst_sse2 @@ -45343,27 +45873,27 @@ _sk_load_g8_dst_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,49 // jne 1d12b <_sk_load_g8_dst_sse2+0x49> + .byte 117,49 // jne 1d6fa <_sk_load_g8_dst_sse2+0x49> .byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,37,112,231,0,0 // pand 0xe770(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,219,37,161,231,0,0 // pand 0xe7a1(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,182,232,0,0 // mulps 0xe8b6(%rip),%xmm4 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,37,231,232,0,0 // mulps 0xe8e7(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,173,230,0,0 // movaps 0xe6ad(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,61,222,230,0,0 // movaps 0xe6de(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,54 // je 1d16e <_sk_load_g8_dst_sse2+0x8c> + .byte 116,54 // je 1d73d <_sk_load_g8_dst_sse2+0x8c> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1d157 <_sk_load_g8_dst_sse2+0x75> + .byte 116,21 // je 1d726 <_sk_load_g8_dst_sse2+0x75> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,192 // jne 1d108 <_sk_load_g8_dst_sse2+0x26> + .byte 117,192 // jne 1d6d7 <_sk_load_g8_dst_sse2+0x26> .byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -45372,10 +45902,10 @@ _sk_load_g8_dst_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 235,154 // jmp 1d108 <_sk_load_g8_dst_sse2+0x26> + .byte 235,154 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26> .byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 - .byte 235,143 // jmp 1d108 <_sk_load_g8_dst_sse2+0x26> + .byte 235,143 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26> HIDDEN _sk_gather_g8_sse2 .globl _sk_gather_g8_sse2 @@ -45417,9 +45947,9 @@ _sk_gather_g8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,196,231,0,0 // mulps 0xe7c4(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 15,89,5,245,231,0,0 // mulps 0xe7f5(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,187,229,0,0 // movaps 0xe5bb(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,236,229,0,0 // movaps 0xe5ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 91 // pop %rbx @@ -45438,42 +45968,42 @@ _sk_load_565_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,83 // jne 1d28d <_sk_load_565_sse2+0x6e> + .byte 117,83 // jne 1d85c <_sk_load_565_sse2+0x6e> .byte 243,67,15,126,20,89 // movq (%r9,%r11,2),%xmm2 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,148,231,0,0 // movdqa 0xe794(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> + .byte 102,15,111,5,197,231,0,0 // movdqa 0xe7c5(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,150,231,0,0 // mulps 0xe796(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,15,111,13,158,231,0,0 // movdqa 0xe79e(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> + .byte 15,89,5,199,231,0,0 // mulps 0xe7c7(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,13,207,231,0,0 // movdqa 0xe7cf(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,160,231,0,0 // mulps 0xe7a0(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,15,219,21,168,231,0,0 // pand 0xe7a8(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 15,89,13,209,231,0,0 // mulps 0xe7d1(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,15,219,21,217,231,0,0 // pand 0xe7d9(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,174,231,0,0 // mulps 0xe7ae(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> + .byte 15,89,21,223,231,0,0 // mulps 0xe7df(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,69,229,0,0 // movaps 0xe545(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,118,229,0,0 // movaps 0xe576(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,50 // je 1d2cc <_sk_load_565_sse2+0xad> + .byte 116,50 // je 1d89b <_sk_load_565_sse2+0xad> .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1d2b9 <_sk_load_565_sse2+0x9a> + .byte 116,21 // je 1d888 <_sk_load_565_sse2+0x9a> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,154 // jne 1d244 <_sk_load_565_sse2+0x25> + .byte 117,154 // jne 1d813 <_sk_load_565_sse2+0x25> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2 .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,208 // movsd %xmm0,%xmm2 - .byte 233,120,255,255,255 // jmpq 1d244 <_sk_load_565_sse2+0x25> + .byte 233,120,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,208 // movd %eax,%xmm2 - .byte 233,106,255,255,255 // jmpq 1d244 <_sk_load_565_sse2+0x25> + .byte 233,106,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25> HIDDEN _sk_load_565_dst_sse2 .globl _sk_load_565_dst_sse2 @@ -45487,42 +46017,42 @@ _sk_load_565_dst_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,83 // jne 1d348 <_sk_load_565_dst_sse2+0x6e> + .byte 117,83 // jne 1d917 <_sk_load_565_dst_sse2+0x6e> .byte 243,67,15,126,52,89 // movq (%r9,%r11,2),%xmm6 .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6 - .byte 102,15,111,37,217,230,0,0 // movdqa 0xe6d9(%rip),%xmm4 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> + .byte 102,15,111,37,10,231,0,0 // movdqa 0xe70a(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,219,230,0,0 // mulps 0xe6db(%rip),%xmm4 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,15,111,45,227,230,0,0 // movdqa 0xe6e3(%rip),%xmm5 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> + .byte 15,89,37,12,231,0,0 // mulps 0xe70c(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,45,20,231,0,0 // movdqa 0xe714(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b> .byte 102,15,219,238 // pand %xmm6,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,229,230,0,0 // mulps 0xe6e5(%rip),%xmm5 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,15,219,53,237,230,0,0 // pand 0xe6ed(%rip),%xmm6 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 15,89,45,22,231,0,0 // mulps 0xe716(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,15,219,53,30,231,0,0 // pand 0xe71e(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,243,230,0,0 // mulps 0xe6f3(%rip),%xmm6 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> + .byte 15,89,53,36,231,0,0 // mulps 0xe724(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,138,228,0,0 // movaps 0xe48a(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,61,187,228,0,0 // movaps 0xe4bb(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,50 // je 1d387 <_sk_load_565_dst_sse2+0xad> + .byte 116,50 // je 1d956 <_sk_load_565_dst_sse2+0xad> .byte 102,15,239,246 // pxor %xmm6,%xmm6 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1d374 <_sk_load_565_dst_sse2+0x9a> + .byte 116,21 // je 1d943 <_sk_load_565_dst_sse2+0x9a> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,154 // jne 1d2ff <_sk_load_565_dst_sse2+0x25> + .byte 117,154 // jne 1d8ce <_sk_load_565_dst_sse2+0x25> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6 .byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 .byte 242,15,16,244 // movsd %xmm4,%xmm6 - .byte 233,120,255,255,255 // jmpq 1d2ff <_sk_load_565_dst_sse2+0x25> + .byte 233,120,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,240 // movd %eax,%xmm6 - .byte 233,106,255,255,255 // jmpq 1d2ff <_sk_load_565_dst_sse2+0x25> + .byte 233,106,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25> HIDDEN _sk_gather_565_sse2 .globl _sk_gather_565_sse2 @@ -45557,19 +46087,19 @@ _sk_gather_565_sse2: .byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,197,229,0,0 // movdqa 0xe5c5(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f> + .byte 102,15,111,5,246,229,0,0 // movdqa 0xe5f6(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,199,229,0,0 // mulps 0xe5c7(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f> - .byte 102,15,111,13,207,229,0,0 // movdqa 0xe5cf(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f> + .byte 15,89,5,248,229,0,0 // mulps 0xe5f8(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b> + .byte 102,15,111,13,0,230,0,0 // movdqa 0xe600(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,209,229,0,0 // mulps 0xe5d1(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f> - .byte 102,15,219,21,217,229,0,0 // pand 0xe5d9(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f> + .byte 15,89,13,2,230,0,0 // mulps 0xe602(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b> + .byte 102,15,219,21,10,230,0,0 // pand 0xe60a(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,223,229,0,0 // mulps 0xe5df(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f> + .byte 15,89,21,16,230,0,0 // mulps 0xe610(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,118,227,0,0 // movaps 0xe376(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,167,227,0,0 // movaps 0xe3a7(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -45584,12 +46114,12 @@ _sk_store_565_sse2: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 - .byte 68,15,40,5,117,231,0,0 // movaps 0xe775(%rip),%xmm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x122f> + .byte 68,15,40,5,166,231,0,0 // movaps 0xe7a6(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,106,231,0,0 // movaps 0xe76a(%rip),%xmm10 # 2bc00 <_sk_overlay_sse2_8bit+0x123f> + .byte 68,15,40,21,155,231,0,0 // movaps 0xe79b(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -45601,7 +46131,7 @@ _sk_store_565_sse2: .byte 102,65,15,114,224,16 // psrad $0x10,%xmm8 .byte 102,69,15,107,192 // packssdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 1d4d8 <_sk_store_565_sse2+0x7b> + .byte 117,10 // jne 1daa7 <_sk_store_565_sse2+0x7b> .byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -45609,19 +46139,19 @@ _sk_store_565_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,38 // je 1d510 <_sk_store_565_sse2+0xb3> + .byte 116,38 // je 1dadf <_sk_store_565_sse2+0xb3> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,18 // je 1d502 <_sk_store_565_sse2+0xa5> + .byte 116,18 // je 1dad1 <_sk_store_565_sse2+0xa5> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,222 // jne 1d4d4 <_sk_store_565_sse2+0x77> + .byte 117,222 // jne 1daa3 <_sk_store_565_sse2+0x77> .byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax .byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2) - .byte 235,196 // jmp 1d4d4 <_sk_store_565_sse2+0x77> + .byte 235,196 // jmp 1daa3 <_sk_store_565_sse2+0x77> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2) - .byte 235,184 // jmp 1d4d4 <_sk_store_565_sse2+0x77> + .byte 235,184 // jmp 1daa3 <_sk_store_565_sse2+0x77> HIDDEN _sk_load_4444_sse2 .globl _sk_load_4444_sse2 @@ -45635,45 +46165,45 @@ _sk_load_4444_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 1d599 <_sk_load_4444_sse2+0x7d> + .byte 117,98 // jne 1db68 <_sk_load_4444_sse2+0x7d> .byte 243,67,15,126,28,89 // movq (%r9,%r11,2),%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,199,230,0,0 // movdqa 0xe6c7(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f> + .byte 102,15,111,5,248,230,0,0 // movdqa 0xe6f8(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,201,230,0,0 // mulps 0xe6c9(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f> - .byte 102,15,111,13,209,230,0,0 // movdqa 0xe6d1(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f> + .byte 15,89,5,250,230,0,0 // mulps 0xe6fa(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b> + .byte 102,15,111,13,2,231,0,0 // movdqa 0xe702(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,211,230,0,0 // mulps 0xe6d3(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f> - .byte 102,15,111,21,219,230,0,0 // movdqa 0xe6db(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f> + .byte 15,89,13,4,231,0,0 // mulps 0xe704(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b> + .byte 102,15,111,21,12,231,0,0 // movdqa 0xe70c(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,221,230,0,0 // mulps 0xe6dd(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f> - .byte 102,15,219,29,229,230,0,0 // pand 0xe6e5(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af> + .byte 15,89,21,14,231,0,0 // mulps 0xe70e(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab> + .byte 102,15,219,29,22,231,0,0 // pand 0xe716(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,235,230,0,0 // mulps 0xe6eb(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf> + .byte 15,89,29,28,231,0,0 // mulps 0xe71c(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,50 // je 1d5d8 <_sk_load_4444_sse2+0xbc> + .byte 116,50 // je 1dba7 <_sk_load_4444_sse2+0xbc> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1d5c5 <_sk_load_4444_sse2+0xa9> + .byte 116,21 // je 1db94 <_sk_load_4444_sse2+0xa9> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,139 // jne 1d541 <_sk_load_4444_sse2+0x25> + .byte 117,139 // jne 1db10 <_sk_load_4444_sse2+0x25> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,216 // movsd %xmm0,%xmm3 - .byte 233,105,255,255,255 // jmpq 1d541 <_sk_load_4444_sse2+0x25> + .byte 233,105,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,216 // movd %eax,%xmm3 - .byte 233,91,255,255,255 // jmpq 1d541 <_sk_load_4444_sse2+0x25> + .byte 233,91,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25> HIDDEN _sk_load_4444_dst_sse2 .globl _sk_load_4444_dst_sse2 @@ -45687,45 +46217,45 @@ _sk_load_4444_dst_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 1d663 <_sk_load_4444_dst_sse2+0x7d> + .byte 117,98 // jne 1dc32 <_sk_load_4444_dst_sse2+0x7d> .byte 243,67,15,126,60,89 // movq (%r9,%r11,2),%xmm7 .byte 102,15,97,248 // punpcklwd %xmm0,%xmm7 - .byte 102,15,111,37,253,229,0,0 // movdqa 0xe5fd(%rip),%xmm4 # 2bc10 <_sk_overlay_sse2_8bit+0x124f> + .byte 102,15,111,37,46,230,0,0 // movdqa 0xe62e(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,255,229,0,0 // mulps 0xe5ff(%rip),%xmm4 # 2bc20 <_sk_overlay_sse2_8bit+0x125f> - .byte 102,15,111,45,7,230,0,0 // movdqa 0xe607(%rip),%xmm5 # 2bc30 <_sk_overlay_sse2_8bit+0x126f> + .byte 15,89,37,48,230,0,0 // mulps 0xe630(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b> + .byte 102,15,111,45,56,230,0,0 // movdqa 0xe638(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b> .byte 102,15,219,239 // pand %xmm7,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,9,230,0,0 // mulps 0xe609(%rip),%xmm5 # 2bc40 <_sk_overlay_sse2_8bit+0x127f> - .byte 102,15,111,53,17,230,0,0 // movdqa 0xe611(%rip),%xmm6 # 2bc50 <_sk_overlay_sse2_8bit+0x128f> + .byte 15,89,45,58,230,0,0 // mulps 0xe63a(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b> + .byte 102,15,111,53,66,230,0,0 // movdqa 0xe642(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b> .byte 102,15,219,247 // pand %xmm7,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,19,230,0,0 // mulps 0xe613(%rip),%xmm6 # 2bc60 <_sk_overlay_sse2_8bit+0x129f> - .byte 102,15,219,61,27,230,0,0 // pand 0xe61b(%rip),%xmm7 # 2bc70 <_sk_overlay_sse2_8bit+0x12af> + .byte 15,89,53,68,230,0,0 // mulps 0xe644(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab> + .byte 102,15,219,61,76,230,0,0 // pand 0xe64c(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb> .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 15,89,61,33,230,0,0 // mulps 0xe621(%rip),%xmm7 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf> + .byte 15,89,61,82,230,0,0 // mulps 0xe652(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,50 // je 1d6a2 <_sk_load_4444_dst_sse2+0xbc> + .byte 116,50 // je 1dc71 <_sk_load_4444_dst_sse2+0xbc> .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,21 // je 1d68f <_sk_load_4444_dst_sse2+0xa9> + .byte 116,21 // je 1dc5e <_sk_load_4444_dst_sse2+0xa9> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,139 // jne 1d60b <_sk_load_4444_dst_sse2+0x25> + .byte 117,139 // jne 1dbda <_sk_load_4444_dst_sse2+0x25> .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7 .byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 .byte 242,15,16,252 // movsd %xmm4,%xmm7 - .byte 233,105,255,255,255 // jmpq 1d60b <_sk_load_4444_dst_sse2+0x25> + .byte 233,105,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25> .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 102,15,110,248 // movd %eax,%xmm7 - .byte 233,91,255,255,255 // jmpq 1d60b <_sk_load_4444_dst_sse2+0x25> + .byte 233,91,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25> HIDDEN _sk_gather_4444_sse2 .globl _sk_gather_4444_sse2 @@ -45760,21 +46290,21 @@ _sk_gather_4444_sse2: .byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,218,228,0,0 // movdqa 0xe4da(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f> + .byte 102,15,111,5,11,229,0,0 // movdqa 0xe50b(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,220,228,0,0 // mulps 0xe4dc(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f> - .byte 102,15,111,13,228,228,0,0 // movdqa 0xe4e4(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f> + .byte 15,89,5,13,229,0,0 // mulps 0xe50d(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b> + .byte 102,15,111,13,21,229,0,0 // movdqa 0xe515(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,230,228,0,0 // mulps 0xe4e6(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f> - .byte 102,15,111,21,238,228,0,0 // movdqa 0xe4ee(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f> + .byte 15,89,13,23,229,0,0 // mulps 0xe517(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b> + .byte 102,15,111,21,31,229,0,0 // movdqa 0xe51f(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,240,228,0,0 // mulps 0xe4f0(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f> - .byte 102,15,219,29,248,228,0,0 // pand 0xe4f8(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af> + .byte 15,89,21,33,229,0,0 // mulps 0xe521(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab> + .byte 102,15,219,29,41,229,0,0 // pand 0xe529(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,254,228,0,0 // mulps 0xe4fe(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf> + .byte 15,89,29,47,229,0,0 // mulps 0xe52f(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -45790,7 +46320,7 @@ _sk_store_4444_sse2: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 76,99,218 // movslq %edx,%r11 - .byte 68,15,40,5,235,228,0,0 // movaps 0xe4eb(%rip),%xmm8 # 2bc90 <_sk_overlay_sse2_8bit+0x12cf> + .byte 68,15,40,5,28,229,0,0 // movaps 0xe51c(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -45812,7 +46342,7 @@ _sk_store_4444_sse2: .byte 102,65,15,114,224,16 // psrad $0x10,%xmm8 .byte 102,69,15,107,192 // packssdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 1d816 <_sk_store_4444_sse2+0x8f> + .byte 117,10 // jne 1dde5 <_sk_store_4444_sse2+0x8f> .byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -45820,19 +46350,19 @@ _sk_store_4444_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,38 // je 1d84e <_sk_store_4444_sse2+0xc7> + .byte 116,38 // je 1de1d <_sk_store_4444_sse2+0xc7> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,18 // je 1d840 <_sk_store_4444_sse2+0xb9> + .byte 116,18 // je 1de0f <_sk_store_4444_sse2+0xb9> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,222 // jne 1d812 <_sk_store_4444_sse2+0x8b> + .byte 117,222 // jne 1dde1 <_sk_store_4444_sse2+0x8b> .byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax .byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2) - .byte 235,196 // jmp 1d812 <_sk_store_4444_sse2+0x8b> + .byte 235,196 // jmp 1dde1 <_sk_store_4444_sse2+0x8b> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2) - .byte 235,184 // jmp 1d812 <_sk_store_4444_sse2+0x8b> + .byte 235,184 // jmp 1dde1 <_sk_store_4444_sse2+0x8b> HIDDEN _sk_load_8888_sse2 .globl _sk_load_8888_sse2 @@ -45846,13 +46376,13 @@ _sk_load_8888_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 1d8d8 <_sk_load_8888_sse2+0x7e> + .byte 117,98 // jne 1dea7 <_sk_load_8888_sse2+0x7e> .byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9 - .byte 102,15,111,21,252,223,0,0 // movdqa 0xdffc(%rip),%xmm2 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,21,45,224,0,0 // movdqa 0xe02d(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,56,225,0,0 // movaps 0xe138(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,105,225,0,0 // movaps 0xe169(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -45872,18 +46402,18 @@ _sk_load_8888_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,41 // je 1d90e <_sk_load_8888_sse2+0xb4> + .byte 116,41 // je 1dedd <_sk_load_8888_sse2+0xb4> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,19 // je 1d903 <_sk_load_8888_sse2+0xa9> + .byte 116,19 // je 1ded2 <_sk_load_8888_sse2+0xa9> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,134 // jne 1d87c <_sk_load_8888_sse2+0x22> + .byte 117,134 // jne 1de4b <_sk_load_8888_sse2+0x22> .byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0 .byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9 .byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9 - .byte 233,110,255,255,255 // jmpq 1d87c <_sk_load_8888_sse2+0x22> + .byte 233,110,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22> .byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9 - .byte 233,99,255,255,255 // jmpq 1d87c <_sk_load_8888_sse2+0x22> + .byte 233,99,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22> HIDDEN _sk_load_8888_dst_sse2 .globl _sk_load_8888_dst_sse2 @@ -45897,13 +46427,13 @@ _sk_load_8888_dst_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 1d997 <_sk_load_8888_dst_sse2+0x7e> + .byte 117,98 // jne 1df66 <_sk_load_8888_dst_sse2+0x7e> .byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9 - .byte 102,15,111,53,61,223,0,0 // movdqa 0xdf3d(%rip),%xmm6 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,53,110,223,0,0 // movdqa 0xdf6e(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,225 // movdqa %xmm9,%xmm4 .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 68,15,40,5,121,224,0,0 // movaps 0xe079(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,170,224,0,0 // movaps 0xe0aa(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,224 // mulps %xmm8,%xmm4 .byte 102,65,15,111,233 // movdqa %xmm9,%xmm5 .byte 102,15,114,213,8 // psrld $0x8,%xmm5 @@ -45923,18 +46453,18 @@ _sk_load_8888_dst_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,41 // je 1d9cd <_sk_load_8888_dst_sse2+0xb4> + .byte 116,41 // je 1df9c <_sk_load_8888_dst_sse2+0xb4> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,19 // je 1d9c2 <_sk_load_8888_dst_sse2+0xa9> + .byte 116,19 // je 1df91 <_sk_load_8888_dst_sse2+0xa9> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,134 // jne 1d93b <_sk_load_8888_dst_sse2+0x22> + .byte 117,134 // jne 1df0a <_sk_load_8888_dst_sse2+0x22> .byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4 .byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9 .byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9 - .byte 233,110,255,255,255 // jmpq 1d93b <_sk_load_8888_dst_sse2+0x22> + .byte 233,110,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22> .byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9 - .byte 233,99,255,255,255 // jmpq 1d93b <_sk_load_8888_dst_sse2+0x22> + .byte 233,99,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22> HIDDEN _sk_gather_8888_sse2 .globl _sk_gather_8888_sse2 @@ -45968,11 +46498,11 @@ _sk_gather_8888_sse2: .byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,38,222,0,0 // movdqa 0xde26(%rip),%xmm2 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,21,87,222,0,0 // movdqa 0xde57(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,98,223,0,0 // movaps 0xdf62(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,147,223,0,0 // movaps 0xdf93(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -46002,7 +46532,7 @@ _sk_store_8888_sse2: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 68,15,40,5,226,221,0,0 // movaps 0xdde2(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,19,222,0,0 // movaps 0xde13(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -46021,24 +46551,24 @@ _sk_store_8888_sse2: .byte 102,69,15,235,193 // por %xmm9,%xmm8 .byte 102,69,15,235,194 // por %xmm10,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 1db2e <_sk_store_8888_sse2+0x7f> + .byte 117,10 // jne 1e0fd <_sk_store_8888_sse2+0x7f> .byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,33 // je 1db5c <_sk_store_8888_sse2+0xad> + .byte 116,33 // je 1e12b <_sk_store_8888_sse2+0xad> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,19 // je 1db54 <_sk_store_8888_sse2+0xa5> + .byte 116,19 // je 1e123 <_sk_store_8888_sse2+0xa5> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,227 // jne 1db2a <_sk_store_8888_sse2+0x7b> + .byte 117,227 // jne 1e0f9 <_sk_store_8888_sse2+0x7b> .byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9 .byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4) .byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4) - .byte 235,206 // jmp 1db2a <_sk_store_8888_sse2+0x7b> + .byte 235,206 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b> .byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4) - .byte 235,198 // jmp 1db2a <_sk_store_8888_sse2+0x7b> + .byte 235,198 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b> HIDDEN _sk_load_bgra_sse2 .globl _sk_load_bgra_sse2 @@ -46052,13 +46582,13 @@ _sk_load_bgra_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 1dbe2 <_sk_load_bgra_sse2+0x7e> + .byte 117,98 // jne 1e1b1 <_sk_load_bgra_sse2+0x7e> .byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9 - .byte 102,15,111,5,242,220,0,0 // movdqa 0xdcf2(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,5,35,221,0,0 // movdqa 0xdd23(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,219,200 // pand %xmm0,%xmm1 .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2 - .byte 68,15,40,5,46,222,0,0 // movaps 0xde2e(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,95,222,0,0 // movaps 0xde5f(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -46078,18 +46608,18 @@ _sk_load_bgra_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,41 // je 1dc18 <_sk_load_bgra_sse2+0xb4> + .byte 116,41 // je 1e1e7 <_sk_load_bgra_sse2+0xb4> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,19 // je 1dc0d <_sk_load_bgra_sse2+0xa9> + .byte 116,19 // je 1e1dc <_sk_load_bgra_sse2+0xa9> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,134 // jne 1db86 <_sk_load_bgra_sse2+0x22> + .byte 117,134 // jne 1e155 <_sk_load_bgra_sse2+0x22> .byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0 .byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9 .byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9 - .byte 233,110,255,255,255 // jmpq 1db86 <_sk_load_bgra_sse2+0x22> + .byte 233,110,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22> .byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9 - .byte 233,99,255,255,255 // jmpq 1db86 <_sk_load_bgra_sse2+0x22> + .byte 233,99,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22> HIDDEN _sk_load_bgra_dst_sse2 .globl _sk_load_bgra_dst_sse2 @@ -46103,13 +46633,13 @@ _sk_load_bgra_dst_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 1dca1 <_sk_load_bgra_dst_sse2+0x7e> + .byte 117,98 // jne 1e270 <_sk_load_bgra_dst_sse2+0x7e> .byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9 - .byte 102,15,111,37,51,220,0,0 // movdqa 0xdc33(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,37,100,220,0,0 // movdqa 0xdc64(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,233 // movdqa %xmm9,%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 - .byte 68,15,40,5,111,221,0,0 // movaps 0xdd6f(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,160,221,0,0 // movaps 0xdda0(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,240 // mulps %xmm8,%xmm6 .byte 102,65,15,111,233 // movdqa %xmm9,%xmm5 .byte 102,15,114,213,8 // psrld $0x8,%xmm5 @@ -46129,18 +46659,18 @@ _sk_load_bgra_dst_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,41 // je 1dcd7 <_sk_load_bgra_dst_sse2+0xb4> + .byte 116,41 // je 1e2a6 <_sk_load_bgra_dst_sse2+0xb4> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,19 // je 1dccc <_sk_load_bgra_dst_sse2+0xa9> + .byte 116,19 // je 1e29b <_sk_load_bgra_dst_sse2+0xa9> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,134 // jne 1dc45 <_sk_load_bgra_dst_sse2+0x22> + .byte 117,134 // jne 1e214 <_sk_load_bgra_dst_sse2+0x22> .byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4 .byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9 .byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9 - .byte 233,110,255,255,255 // jmpq 1dc45 <_sk_load_bgra_dst_sse2+0x22> + .byte 233,110,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22> .byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9 - .byte 233,99,255,255,255 // jmpq 1dc45 <_sk_load_bgra_dst_sse2+0x22> + .byte 233,99,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22> HIDDEN _sk_gather_bgra_sse2 .globl _sk_gather_bgra_sse2 @@ -46174,11 +46704,11 @@ _sk_gather_bgra_sse2: .byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,5,28,219,0,0 // movdqa 0xdb1c(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf> + .byte 102,15,111,5,77,219,0,0 // movdqa 0xdb4d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb> .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,219,200 // pand %xmm0,%xmm1 .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2 - .byte 68,15,40,5,88,220,0,0 // movaps 0xdc58(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f> + .byte 68,15,40,5,137,220,0,0 // movaps 0xdc89(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -46208,7 +46738,7 @@ _sk_store_bgra_sse2: .byte 73,193,225,2 // shl $0x2,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 68,15,40,5,216,218,0,0 // movaps 0xdad8(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef> + .byte 68,15,40,5,9,219,0,0 // movaps 0xdb09(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb> .byte 68,15,40,202 // movaps %xmm2,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -46227,24 +46757,24 @@ _sk_store_bgra_sse2: .byte 102,69,15,235,193 // por %xmm9,%xmm8 .byte 102,69,15,235,194 // por %xmm10,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 1de38 <_sk_store_bgra_sse2+0x7f> + .byte 117,10 // jne 1e407 <_sk_store_bgra_sse2+0x7f> .byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,33 // je 1de66 <_sk_store_bgra_sse2+0xad> + .byte 116,33 // je 1e435 <_sk_store_bgra_sse2+0xad> .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,19 // je 1de5e <_sk_store_bgra_sse2+0xa5> + .byte 116,19 // je 1e42d <_sk_store_bgra_sse2+0xa5> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 117,227 // jne 1de34 <_sk_store_bgra_sse2+0x7b> + .byte 117,227 // jne 1e403 <_sk_store_bgra_sse2+0x7b> .byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9 .byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4) .byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4) - .byte 235,206 // jmp 1de34 <_sk_store_bgra_sse2+0x7b> + .byte 235,206 // jmp 1e403 <_sk_store_bgra_sse2+0x7b> .byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4) - .byte 235,198 // jmp 1de34 <_sk_store_bgra_sse2+0x7b> + .byte 235,198 // jmp 1e403 <_sk_store_bgra_sse2+0x7b> HIDDEN _sk_load_f16_sse2 .globl _sk_load_f16_sse2 @@ -46258,7 +46788,7 @@ _sk_load_f16_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,98,1,0,0 // jne 1dff0 <_sk_load_f16_sse2+0x182> + .byte 15,133,98,1,0,0 // jne 1e5bf <_sk_load_f16_sse2+0x182> .byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0 .byte 102,65,15,16,76,193,16 // movupd 0x10(%r9,%rax,8),%xmm1 .byte 102,68,15,40,192 // movapd %xmm0,%xmm8 @@ -46270,7 +46800,7 @@ _sk_load_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,208,221,0,0 // movdqa 0xddd0(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df> + .byte 102,68,15,111,13,1,222,0,0 // movdqa 0xde01(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -46278,11 +46808,11 @@ _sk_load_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,197,221,0,0 // movdqa 0xddc5(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff> + .byte 102,68,15,111,29,246,221,0,0 // movdqa 0xddf6(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,199,221,0,0 // movdqa 0xddc7(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> + .byte 102,68,15,111,37,248,221,0,0 // movdqa 0xddf8(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,106,223,0,0 // movdqa 0xdf6a(%rip),%xmm3 # 2be80 <_sk_overlay_sse2_8bit+0x14bf> + .byte 102,15,111,29,155,223,0,0 // movdqa 0xdf9b(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -46330,17 +46860,17 @@ _sk_load_f16_sse2: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,17 // jne 1e00d <_sk_load_f16_sse2+0x19f> + .byte 117,17 // jne 1e5dc <_sk_load_f16_sse2+0x19f> .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 102,15,20,193 // unpcklpd %xmm1,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 - .byte 233,142,254,255,255 // jmpq 1de9b <_sk_load_f16_sse2+0x2d> + .byte 233,142,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d> .byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,121,254,255,255 // jb 1de9b <_sk_load_f16_sse2+0x2d> + .byte 15,130,121,254,255,255 // jb 1e46a <_sk_load_f16_sse2+0x2d> .byte 242,65,15,16,76,193,16 // movsd 0x10(%r9,%rax,8),%xmm1 - .byte 233,109,254,255,255 // jmpq 1de9b <_sk_load_f16_sse2+0x2d> + .byte 233,109,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d> HIDDEN _sk_load_f16_dst_sse2 .globl _sk_load_f16_dst_sse2 @@ -46354,7 +46884,7 @@ _sk_load_f16_dst_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,98,1,0,0 // jne 1e1b0 <_sk_load_f16_dst_sse2+0x182> + .byte 15,133,98,1,0,0 // jne 1e77f <_sk_load_f16_dst_sse2+0x182> .byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4 .byte 102,65,15,16,108,193,16 // movupd 0x10(%r9,%rax,8),%xmm5 .byte 102,68,15,40,196 // movapd %xmm4,%xmm8 @@ -46366,7 +46896,7 @@ _sk_load_f16_dst_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,238 // movdqa %xmm14,%xmm5 .byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5 - .byte 102,68,15,111,13,16,220,0,0 // movdqa 0xdc10(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df> + .byte 102,68,15,111,13,65,220,0,0 // movdqa 0xdc41(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb> .byte 102,15,111,229 // movdqa %xmm5,%xmm4 .byte 102,65,15,219,225 // pand %xmm9,%xmm4 .byte 102,15,239,236 // pxor %xmm4,%xmm5 @@ -46374,11 +46904,11 @@ _sk_load_f16_dst_sse2: .byte 102,68,15,111,237 // movdqa %xmm5,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,236 // por %xmm4,%xmm13 - .byte 102,68,15,111,29,5,220,0,0 // movdqa 0xdc05(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff> + .byte 102,68,15,111,29,54,220,0,0 // movdqa 0xdc36(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,7,220,0,0 // movdqa 0xdc07(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> + .byte 102,68,15,111,37,56,220,0,0 // movdqa 0xdc38(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> .byte 102,65,15,239,236 // pxor %xmm12,%xmm5 - .byte 102,15,111,61,170,221,0,0 // movdqa 0xddaa(%rip),%xmm7 # 2be80 <_sk_overlay_sse2_8bit+0x14bf> + .byte 102,15,111,61,219,221,0,0 // movdqa 0xdddb(%rip),%xmm7 # 2c480 <_sk_overlay_sse2_8bit+0x14cb> .byte 102,15,111,231 // movdqa %xmm7,%xmm4 .byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4 .byte 102,65,15,223,229 // pandn %xmm13,%xmm4 @@ -46426,17 +46956,17 @@ _sk_load_f16_dst_sse2: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,17 // jne 1e1cd <_sk_load_f16_dst_sse2+0x19f> + .byte 117,17 // jne 1e79c <_sk_load_f16_dst_sse2+0x19f> .byte 102,15,87,237 // xorpd %xmm5,%xmm5 .byte 102,15,20,229 // unpcklpd %xmm5,%xmm4 .byte 102,15,87,237 // xorpd %xmm5,%xmm5 - .byte 233,142,254,255,255 // jmpq 1e05b <_sk_load_f16_dst_sse2+0x2d> + .byte 233,142,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d> .byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4 .byte 102,15,87,237 // xorpd %xmm5,%xmm5 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,121,254,255,255 // jb 1e05b <_sk_load_f16_dst_sse2+0x2d> + .byte 15,130,121,254,255,255 // jb 1e62a <_sk_load_f16_dst_sse2+0x2d> .byte 242,65,15,16,108,193,16 // movsd 0x10(%r9,%rax,8),%xmm5 - .byte 233,109,254,255,255 // jmpq 1e05b <_sk_load_f16_dst_sse2+0x2d> + .byte 233,109,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d> HIDDEN _sk_gather_f16_sse2 .globl _sk_gather_f16_sse2 @@ -46478,7 +47008,7 @@ _sk_gather_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,9,218,0,0 // movdqa 0xda09(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df> + .byte 102,68,15,111,13,58,218,0,0 // movdqa 0xda3a(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -46486,11 +47016,11 @@ _sk_gather_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,254,217,0,0 // movdqa 0xd9fe(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff> + .byte 102,68,15,111,29,47,218,0,0 // movdqa 0xda2f(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,0,218,0,0 // movdqa 0xda00(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> + .byte 102,68,15,111,37,49,218,0,0 // movdqa 0xda31(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,163,219,0,0 // movdqa 0xdba3(%rip),%xmm3 # 2be80 <_sk_overlay_sse2_8bit+0x14bf> + .byte 102,15,111,29,212,219,0,0 // movdqa 0xdbd4(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -46549,17 +47079,17 @@ _sk_store_f16_sse2: .byte 73,193,225,3 // shl $0x3,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 72,99,194 // movslq %edx,%rax - .byte 102,68,15,111,21,248,216,0,0 // movdqa 0xd8f8(%rip),%xmm10 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> + .byte 102,68,15,111,21,41,217,0,0 // movdqa 0xd929(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12 .byte 102,69,15,219,226 // pand %xmm10,%xmm12 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,239,236 // pxor %xmm12,%xmm13 - .byte 102,68,15,111,13,235,216,0,0 // movdqa 0xd8eb(%rip),%xmm9 # 2bce0 <_sk_overlay_sse2_8bit+0x131f> + .byte 102,68,15,111,13,28,217,0,0 // movdqa 0xd91c(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b> .byte 102,65,15,114,212,16 // psrld $0x10,%xmm12 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8 .byte 102,65,15,114,213,13 // psrld $0xd,%xmm13 - .byte 102,68,15,111,29,220,216,0,0 // movdqa 0xd8dc(%rip),%xmm11 # 2bcf0 <_sk_overlay_sse2_8bit+0x132f> + .byte 102,68,15,111,29,13,217,0,0 // movdqa 0xd90d(%rip),%xmm11 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b> .byte 102,69,15,235,227 // por %xmm11,%xmm12 .byte 102,69,15,254,229 // paddd %xmm13,%xmm12 .byte 102,65,15,114,244,16 // pslld $0x10,%xmm12 @@ -46611,7 +47141,7 @@ _sk_store_f16_sse2: .byte 102,69,15,111,200 // movdqa %xmm8,%xmm9 .byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 1e536 <_sk_store_f16_sse2+0x17e> + .byte 117,21 // jne 1eb05 <_sk_store_f16_sse2+0x17e> .byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8) .byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8 .byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8) @@ -46619,13 +47149,13 @@ _sk_store_f16_sse2: .byte 255,224 // jmpq *%rax .byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 1e532 <_sk_store_f16_sse2+0x17a> + .byte 116,240 // je 1eb01 <_sk_store_f16_sse2+0x17a> .byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 1e532 <_sk_store_f16_sse2+0x17a> + .byte 114,227 // jb 1eb01 <_sk_store_f16_sse2+0x17a> .byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8 .byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8) - .byte 235,213 // jmp 1e532 <_sk_store_f16_sse2+0x17a> + .byte 235,213 // jmp 1eb01 <_sk_store_f16_sse2+0x17a> HIDDEN _sk_load_u16_be_sse2 .globl _sk_load_u16_be_sse2 @@ -46640,7 +47170,7 @@ _sk_load_u16_be_sse2: .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,190,0,0,0 // jne 1e642 <_sk_load_u16_be_sse2+0xe5> + .byte 15,133,190,0,0,0 // jne 1ec11 <_sk_load_u16_be_sse2+0xe5> .byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0 .byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -46657,7 +47187,7 @@ _sk_load_u16_be_sse2: .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,5,139,212,0,0 // movaps 0xd48b(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f> + .byte 68,15,40,5,188,212,0,0 // movaps 0xd4bc(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -46685,17 +47215,17 @@ _sk_load_u16_be_sse2: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,17 // jne 1e65f <_sk_load_u16_be_sse2+0x102> + .byte 117,17 // jne 1ec2e <_sk_load_u16_be_sse2+0x102> .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 102,15,20,193 // unpcklpd %xmm1,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 - .byte 233,50,255,255,255 // jmpq 1e591 <_sk_load_u16_be_sse2+0x34> + .byte 233,50,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34> .byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,29,255,255,255 // jb 1e591 <_sk_load_u16_be_sse2+0x34> + .byte 15,130,29,255,255,255 // jb 1eb60 <_sk_load_u16_be_sse2+0x34> .byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1 - .byte 233,17,255,255,255 // jmpq 1e591 <_sk_load_u16_be_sse2+0x34> + .byte 233,17,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34> HIDDEN _sk_load_rgb_u16_be_sse2 .globl _sk_load_rgb_u16_be_sse2 @@ -46712,7 +47242,7 @@ _sk_load_rgb_u16_be_sse2: .byte 72,141,4,64 // lea (%rax,%rax,2),%rax .byte 72,193,248,32 // sar $0x20,%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,175,0,0,0 // jne 1e75a <_sk_load_rgb_u16_be_sse2+0xda> + .byte 15,133,175,0,0,0 // jne 1ed29 <_sk_load_rgb_u16_be_sse2+0xda> .byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2 .byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3 .byte 102,15,115,219,4 // psrldq $0x4,%xmm3 @@ -46733,7 +47263,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,13,81,211,0,0 // movaps 0xd351(%rip),%xmm9 # 2ba60 <_sk_overlay_sse2_8bit+0x109f> + .byte 68,15,40,13,130,211,0,0 // movaps 0xd382(%rip),%xmm9 # 2c060 <_sk_overlay_sse2_8bit+0x10ab> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -46750,27 +47280,27 @@ _sk_load_rgb_u16_be_sse2: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,120,208,0,0 // movaps 0xd078(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,169,208,0,0 // movaps 0xd0a9(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 255,224 // jmpq *%rax .byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2 .byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 1e77f <_sk_load_rgb_u16_be_sse2+0xff> + .byte 117,13 // jne 1ed4e <_sk_load_rgb_u16_be_sse2+0xff> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,80,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f> + .byte 233,80,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f> .byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0 .byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 1e7b0 <_sk_load_rgb_u16_be_sse2+0x130> + .byte 114,24 // jb 1ed7f <_sk_load_rgb_u16_be_sse2+0x130> .byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3 .byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,31,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f> + .byte 233,31,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f> .byte 102,15,239,219 // pxor %xmm3,%xmm3 - .byte 233,22,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f> + .byte 233,22,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f> HIDDEN _sk_store_u16_be_sse2 .globl _sk_store_u16_be_sse2 @@ -46784,7 +47314,7 @@ _sk_store_u16_be_sse2: .byte 77,1,201 // add %r9,%r9 .byte 76,3,8 // add (%rax),%r9 .byte 73,99,194 // movslq %r10d,%rax - .byte 68,15,40,21,33,213,0,0 // movaps 0xd521(%rip),%xmm10 # 2bd00 <_sk_overlay_sse2_8bit+0x133f> + .byte 68,15,40,21,82,213,0,0 // movaps 0xd552(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -46829,7 +47359,7 @@ _sk_store_u16_be_sse2: .byte 102,69,15,111,208 // movdqa %xmm8,%xmm10 .byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 1e8d9 <_sk_store_u16_be_sse2+0x120> + .byte 117,21 // jne 1eea8 <_sk_store_u16_be_sse2+0x120> .byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2) .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2) @@ -46837,13 +47367,13 @@ _sk_store_u16_be_sse2: .byte 255,224 // jmpq *%rax .byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 1e8d5 <_sk_store_u16_be_sse2+0x11c> + .byte 116,240 // je 1eea4 <_sk_store_u16_be_sse2+0x11c> .byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 1e8d5 <_sk_store_u16_be_sse2+0x11c> + .byte 114,227 // jb 1eea4 <_sk_store_u16_be_sse2+0x11c> .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2) - .byte 235,213 // jmp 1e8d5 <_sk_store_u16_be_sse2+0x11c> + .byte 235,213 // jmp 1eea4 <_sk_store_u16_be_sse2+0x11c> HIDDEN _sk_load_f32_sse2 .globl _sk_load_f32_sse2 @@ -46859,7 +47389,7 @@ _sk_load_f32_sse2: .byte 73,99,194 // movslq %r10d,%rax .byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 1e96b <_sk_load_f32_sse2+0x6b> + .byte 117,66 // jne 1ef3a <_sk_load_f32_sse2+0x6b> .byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0 .byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3 .byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9 @@ -46879,17 +47409,17 @@ _sk_load_f32_sse2: .byte 255,224 // jmpq *%rax .byte 69,15,87,201 // xorps %xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,8 // jne 1e97d <_sk_load_f32_sse2+0x7d> + .byte 117,8 // jne 1ef4c <_sk_load_f32_sse2+0x7d> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 235,190 // jmp 1e93b <_sk_load_f32_sse2+0x3b> + .byte 235,190 // jmp 1ef0a <_sk_load_f32_sse2+0x3b> .byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,8 // jb 1e991 <_sk_load_f32_sse2+0x91> + .byte 114,8 // jb 1ef60 <_sk_load_f32_sse2+0x91> .byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3 - .byte 235,170 // jmp 1e93b <_sk_load_f32_sse2+0x3b> + .byte 235,170 // jmp 1ef0a <_sk_load_f32_sse2+0x3b> .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 235,165 // jmp 1e93b <_sk_load_f32_sse2+0x3b> + .byte 235,165 // jmp 1ef0a <_sk_load_f32_sse2+0x3b> HIDDEN _sk_load_f32_dst_sse2 .globl _sk_load_f32_dst_sse2 @@ -46905,7 +47435,7 @@ _sk_load_f32_dst_sse2: .byte 73,99,194 // movslq %r10d,%rax .byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 1ea01 <_sk_load_f32_dst_sse2+0x6b> + .byte 117,66 // jne 1efd0 <_sk_load_f32_dst_sse2+0x6b> .byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4 .byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7 .byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9 @@ -46925,17 +47455,17 @@ _sk_load_f32_dst_sse2: .byte 255,224 // jmpq *%rax .byte 69,15,87,201 // xorps %xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,8 // jne 1ea13 <_sk_load_f32_dst_sse2+0x7d> + .byte 117,8 // jne 1efe2 <_sk_load_f32_dst_sse2+0x7d> .byte 15,87,255 // xorps %xmm7,%xmm7 .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 235,190 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b> + .byte 235,190 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b> .byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,8 // jb 1ea27 <_sk_load_f32_dst_sse2+0x91> + .byte 114,8 // jb 1eff6 <_sk_load_f32_dst_sse2+0x91> .byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7 - .byte 235,170 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b> + .byte 235,170 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b> .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 235,165 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b> + .byte 235,165 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b> HIDDEN _sk_store_f32_sse2 .globl _sk_store_f32_sse2 @@ -46964,7 +47494,7 @@ _sk_store_f32_sse2: .byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9 .byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4) .byte 77,133,192 // test %r8,%r8 - .byte 117,29 // jne 1eaa9 <_sk_store_f32_sse2+0x7d> + .byte 117,29 // jne 1f078 <_sk_store_f32_sse2+0x7d> .byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10 .byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4) .byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4) @@ -46972,12 +47502,12 @@ _sk_store_f32_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,246 // je 1eaa5 <_sk_store_f32_sse2+0x79> + .byte 116,246 // je 1f074 <_sk_store_f32_sse2+0x79> .byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,234 // jb 1eaa5 <_sk_store_f32_sse2+0x79> + .byte 114,234 // jb 1f074 <_sk_store_f32_sse2+0x79> .byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4) - .byte 235,225 // jmp 1eaa5 <_sk_store_f32_sse2+0x79> + .byte 235,225 // jmp 1f074 <_sk_store_f32_sse2+0x79> HIDDEN _sk_clamp_x_sse2 .globl _sk_clamp_x_sse2 @@ -47023,7 +47553,7 @@ _sk_repeat_x_sse2: .byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8 .byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,142,204,0,0 // andps 0xcc8e(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,84,21,191,204,0,0 // andps 0xccbf(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 @@ -47049,7 +47579,7 @@ _sk_repeat_y_sse2: .byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8 .byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,52,204,0,0 // andps 0xcc34(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,84,21,101,204,0,0 // andps 0xcc65(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 @@ -47075,13 +47605,13 @@ _sk_mirror_x_sse2: .byte 65,15,92,193 // subps %xmm9,%xmm0 .byte 243,69,15,88,210 // addss %xmm10,%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 - .byte 243,68,15,89,29,9,194,0,0 // mulss 0xc209(%rip),%xmm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 243,68,15,89,29,46,194,0,0 // mulss 0xc22e(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 68,15,89,216 // mulps %xmm0,%xmm11 .byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8 .byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12 .byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11 - .byte 68,15,84,29,186,203,0,0 // andps 0xcbba(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,84,29,235,203,0,0 // andps 0xcbeb(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 69,15,92,227 // subps %xmm11,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 @@ -47110,13 +47640,13 @@ _sk_mirror_y_sse2: .byte 65,15,92,201 // subps %xmm9,%xmm1 .byte 243,69,15,88,210 // addss %xmm10,%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 - .byte 243,68,15,89,29,132,193,0,0 // mulss 0xc184(%rip),%xmm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f> + .byte 243,68,15,89,29,169,193,0,0 // mulss 0xc1a9(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f> .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 68,15,89,217 // mulps %xmm1,%xmm11 .byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8 .byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12 .byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11 - .byte 68,15,84,29,53,203,0,0 // andps 0xcb35(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,84,29,102,203,0,0 // andps 0xcb66(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 69,15,92,227 // subps %xmm11,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 @@ -47139,7 +47669,7 @@ FUNCTION(_sk_clamp_x_1_sse2) _sk_clamp_x_1_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,236,202,0,0 // minps 0xcaec(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,93,5,29,203,0,0 // minps 0xcb1d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -47152,7 +47682,7 @@ _sk_repeat_x_1_sse2: .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,84,13,202,202,0,0 // andps 0xcaca(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,84,13,251,202,0,0 // andps 0xcafb(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 65,15,92,192 // subps %xmm8,%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -47162,14 +47692,14 @@ HIDDEN _sk_mirror_x_1_sse2 .globl _sk_mirror_x_1_sse2 FUNCTION(_sk_mirror_x_1_sse2) _sk_mirror_x_1_sse2: - .byte 68,15,40,5,22,203,0,0 // movaps 0xcb16(%rip),%xmm8 # 2b830 <_sk_overlay_sse2_8bit+0xe6f> + .byte 68,15,40,5,71,203,0,0 // movaps 0xcb47(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,154,202,0,0 // movaps 0xca9a(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,13,203,202,0,0 // movaps 0xcacb(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,144,202,0,0 // andps 0xca90(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,84,13,193,202,0,0 // andps 0xcac1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,88,210 // addps %xmm10,%xmm10 @@ -47185,10 +47715,10 @@ HIDDEN _sk_luminance_to_alpha_sse2 FUNCTION(_sk_luminance_to_alpha_sse2) _sk_luminance_to_alpha_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,166,207,0,0 // mulps 0xcfa6(%rip),%xmm0 # 2bd10 <_sk_overlay_sse2_8bit+0x134f> - .byte 15,89,13,175,207,0,0 // mulps 0xcfaf(%rip),%xmm1 # 2bd20 <_sk_overlay_sse2_8bit+0x135f> + .byte 15,89,5,215,207,0,0 // mulps 0xcfd7(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b> + .byte 15,89,13,224,207,0,0 // mulps 0xcfe0(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,181,207,0,0 // mulps 0xcfb5(%rip),%xmm3 # 2bd30 <_sk_overlay_sse2_8bit+0x136f> + .byte 15,89,29,230,207,0,0 // mulps 0xcfe6(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -47500,9 +48030,9 @@ _sk_evenly_spaced_gradient_sse2: .byte 72,139,24 // mov (%rax),%rbx .byte 76,139,112,8 // mov 0x8(%rax),%r14 .byte 72,255,203 // dec %rbx - .byte 120,7 // js 1f21b <_sk_evenly_spaced_gradient_sse2+0x18> + .byte 120,7 // js 1f7ea <_sk_evenly_spaced_gradient_sse2+0x18> .byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1 - .byte 235,21 // jmp 1f230 <_sk_evenly_spaced_gradient_sse2+0x2d> + .byte 235,21 // jmp 1f7ff <_sk_evenly_spaced_gradient_sse2+0x2d> .byte 73,137,217 // mov %rbx,%r9 .byte 73,209,233 // shr %r9 .byte 131,227,1 // and $0x1,%ebx @@ -47600,15 +48130,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2 .globl _sk_gauss_a_to_rgba_sse2 FUNCTION(_sk_gauss_a_to_rgba_sse2) _sk_gauss_a_to_rgba_sse2: - .byte 15,40,5,132,201,0,0 // movaps 0xc984(%rip),%xmm0 # 2bd40 <_sk_overlay_sse2_8bit+0x137f> + .byte 15,40,5,181,201,0,0 // movaps 0xc9b5(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,138,201,0,0 // addps 0xc98a(%rip),%xmm0 # 2bd50 <_sk_overlay_sse2_8bit+0x138f> + .byte 15,88,5,187,201,0,0 // addps 0xc9bb(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,144,201,0,0 // addps 0xc990(%rip),%xmm0 # 2bd60 <_sk_overlay_sse2_8bit+0x139f> + .byte 15,88,5,193,201,0,0 // addps 0xc9c1(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,150,201,0,0 // addps 0xc996(%rip),%xmm0 # 2bd70 <_sk_overlay_sse2_8bit+0x13af> + .byte 15,88,5,199,201,0,0 // addps 0xc9c7(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,156,201,0,0 // addps 0xc99c(%rip),%xmm0 # 2bd80 <_sk_overlay_sse2_8bit+0x13bf> + .byte 15,88,5,205,201,0,0 // addps 0xc9cd(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -47626,12 +48156,12 @@ _sk_gradient_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,249,2 // cmp $0x2,%r9 - .byte 114,50 // jb 1f437 <_sk_gradient_sse2+0x46> + .byte 114,50 // jb 1fa06 <_sk_gradient_sse2+0x46> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,197,195,0,0 // movaps 0xc3c5(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 15,40,21,246,195,0,0 // movaps 0xc3f6(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 243,15,16,27 // movss (%rbx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -47639,7 +48169,7 @@ _sk_gradient_sse2: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,201 // dec %r9 - .byte 117,228 // jne 1f41b <_sk_gradient_sse2+0x2a> + .byte 117,228 // jne 1f9ea <_sk_gradient_sse2+0x2a> .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 .byte 102,73,15,126,211 // movq %xmm2,%r11 .byte 69,137,217 // mov %r11d,%r9d @@ -47778,29 +48308,29 @@ _sk_xy_to_unit_angle_sse2: .byte 69,15,94,220 // divps %xmm12,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 - .byte 68,15,40,45,38,199,0,0 // movaps 0xc726(%rip),%xmm13 # 2bd90 <_sk_overlay_sse2_8bit+0x13cf> + .byte 68,15,40,45,87,199,0,0 // movaps 0xc757(%rip),%xmm13 # 2c390 <_sk_overlay_sse2_8bit+0x13db> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,42,199,0,0 // addps 0xc72a(%rip),%xmm13 # 2bda0 <_sk_overlay_sse2_8bit+0x13df> + .byte 68,15,88,45,91,199,0,0 // addps 0xc75b(%rip),%xmm13 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,46,199,0,0 // addps 0xc72e(%rip),%xmm13 # 2bdb0 <_sk_overlay_sse2_8bit+0x13ef> + .byte 68,15,88,45,95,199,0,0 // addps 0xc75f(%rip),%xmm13 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,50,199,0,0 // addps 0xc732(%rip),%xmm13 # 2bdc0 <_sk_overlay_sse2_8bit+0x13ff> + .byte 68,15,88,45,99,199,0,0 // addps 0xc763(%rip),%xmm13 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b> .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,40,21,49,199,0,0 // movaps 0xc731(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0x140f> + .byte 68,15,40,21,98,199,0,0 // movaps 0xc762(%rip),%xmm10 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b> .byte 69,15,92,213 // subps %xmm13,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,205 // andnps %xmm13,%xmm9 .byte 69,15,86,202 // orps %xmm10,%xmm9 .byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8 - .byte 68,15,40,21,4,193,0,0 // movaps 0xc104(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,21,53,193,0,0 // movaps 0xc135(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,84,208 // andps %xmm8,%xmm10 .byte 69,15,85,193 // andnps %xmm9,%xmm8 .byte 69,15,86,194 // orps %xmm10,%xmm8 .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9 - .byte 68,15,40,21,243,192,0,0 // movaps 0xc0f3(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,21,36,193,0,0 // movaps 0xc124(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,208 // subps %xmm8,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,200 // andnps %xmm8,%xmm9 @@ -47835,7 +48365,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2: .byte 243,69,15,89,203 // mulss %xmm11,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,88,200 // addps %xmm0,%xmm9 - .byte 68,15,89,13,154,198,0,0 // mulps 0xc69a(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f> + .byte 68,15,89,13,203,198,0,0 // mulps 0xc6cb(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 @@ -47843,7 +48373,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2: .byte 243,69,15,89,219 // mulss %xmm11,%xmm11 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,92,227 // subps %xmm11,%xmm12 - .byte 68,15,89,21,133,198,0,0 // mulps 0xc685(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f> + .byte 68,15,89,21,182,198,0,0 // mulps 0xc6b6(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 @@ -47852,8 +48382,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2: .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,92,193 // subps %xmm9,%xmm0 - .byte 68,15,87,13,61,197,0,0 // xorps 0xc53d(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> - .byte 68,15,89,5,37,192,0,0 // mulps 0xc025(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,87,13,110,197,0,0 // xorps 0xc56e(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> + .byte 68,15,89,5,86,192,0,0 // mulps 0xc056(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 @@ -47874,7 +48404,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2: .byte 243,69,15,89,203 // mulss %xmm11,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,88,200 // addps %xmm0,%xmm9 - .byte 68,15,89,13,252,197,0,0 // mulps 0xc5fc(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f> + .byte 68,15,89,13,45,198,0,0 // mulps 0xc62d(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 @@ -47882,7 +48412,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2: .byte 243,69,15,89,219 // mulss %xmm11,%xmm11 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,92,227 // subps %xmm11,%xmm12 - .byte 68,15,89,21,231,197,0,0 // mulps 0xc5e7(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f> + .byte 68,15,89,21,24,198,0,0 // mulps 0xc618(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 @@ -47891,8 +48421,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2: .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,92,193 // subps %xmm9,%xmm0 - .byte 68,15,87,13,159,196,0,0 // xorps 0xc49f(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> - .byte 68,15,89,5,135,191,0,0 // mulps 0xbf87(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,87,13,208,196,0,0 // xorps 0xc4d0(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> + .byte 68,15,89,5,184,191,0,0 // mulps 0xbfb8(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 @@ -47910,7 +48440,7 @@ _sk_xy_to_2pt_conical_linear_sse2: .byte 243,69,15,89,200 // mulss %xmm8,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,88,200 // addps %xmm0,%xmm9 - .byte 68,15,89,13,111,197,0,0 // mulps 0xc56f(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f> + .byte 68,15,89,13,160,197,0,0 // mulps 0xc5a0(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 69,15,89,210 // mulps %xmm10,%xmm10 @@ -47918,7 +48448,7 @@ _sk_xy_to_2pt_conical_linear_sse2: .byte 243,69,15,89,192 // mulss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 65,15,92,192 // subps %xmm8,%xmm0 - .byte 15,87,5,59,196,0,0 // xorps 0xc43b(%rip),%xmm0 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f> + .byte 15,87,5,108,196,0,0 // xorps 0xc46c(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b> .byte 65,15,94,193 // divps %xmm9,%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -47961,7 +48491,7 @@ HIDDEN _sk_save_xy_sse2 FUNCTION(_sk_save_xy_sse2) _sk_save_xy_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,193,190,0,0 // movaps 0xbec1(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,5,242,190,0,0 // movaps 0xbef2(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -47969,7 +48499,7 @@ _sk_save_xy_sse2: .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,40,217 // movaps %xmm9,%xmm11 .byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11 - .byte 68,15,40,37,172,190,0,0 // movaps 0xbeac(%rip),%xmm12 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 68,15,40,37,221,190,0,0 // movaps 0xbedd(%rip),%xmm12 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,84,220 // andps %xmm12,%xmm11 .byte 69,15,92,211 // subps %xmm11,%xmm10 .byte 69,15,92,202 // subps %xmm10,%xmm9 @@ -48016,8 +48546,8 @@ _sk_bilinear_nx_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,69,196,0,0 // addps 0xc445(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,13,190,0,0 // movaps 0xbe0d(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,5,118,196,0,0 // addps 0xc476(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,62,190,0,0 // movaps 0xbe3e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -48030,7 +48560,7 @@ _sk_bilinear_px_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,220,189,0,0 // addps 0xbddc(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,88,5,13,190,0,0 // addps 0xbe0d(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -48042,8 +48572,8 @@ _sk_bilinear_ny_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,254,195,0,0 // addps 0xc3fe(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,198,189,0,0 // movaps 0xbdc6(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,13,47,196,0,0 // addps 0xc42f(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,247,189,0,0 // movaps 0xbdf7(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -48056,7 +48586,7 @@ _sk_bilinear_py_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,148,189,0,0 // addps 0xbd94(%rip),%xmm1 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 15,88,13,197,189,0,0 // addps 0xbdc5(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -48068,13 +48598,13 @@ _sk_bicubic_n3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,199,195,0,0 // addps 0xc3c7(%rip),%xmm0 # 2be10 <_sk_overlay_sse2_8bit+0x144f> - .byte 68,15,40,13,127,189,0,0 // movaps 0xbd7f(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,5,248,195,0,0 // addps 0xc3f8(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b> + .byte 68,15,40,13,176,189,0,0 // movaps 0xbdb0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,187,195,0,0 // mulps 0xc3bb(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,13,83,191,0,0 // addps 0xbf53(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,13,236,195,0,0 // mulps 0xc3ec(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,13,132,191,0,0 // addps 0xbf84(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -48087,16 +48617,16 @@ _sk_bicubic_n1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,114,195,0,0 // addps 0xc372(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,58,189,0,0 // movaps 0xbd3a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,5,163,195,0,0 // addps 0xc3a3(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,107,189,0,0 // movaps 0xbd6b(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,142,195,0,0 // movaps 0xc38e(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,5,191,195,0,0 // movaps 0xc3bf(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,146,195,0,0 // addps 0xc392(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,5,195,195,0,0 // addps 0xc3c3(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,6,189,0,0 // addps 0xbd06(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,88,5,55,189,0,0 // addps 0xbd37(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,138,195,0,0 // addps 0xc38a(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,5,187,195,0,0 // addps 0xc3bb(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -48106,17 +48636,17 @@ HIDDEN _sk_bicubic_p1x_sse2 FUNCTION(_sk_bicubic_p1x_sse2) _sk_bicubic_p1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,228,188,0,0 // movaps 0xbce4(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,5,21,189,0,0 // movaps 0xbd15(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,64,195,0,0 // movaps 0xc340(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,21,113,195,0,0 // movaps 0xc371(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,68,195,0,0 // addps 0xc344(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,21,117,195,0,0 // addps 0xc375(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,64,195,0,0 // addps 0xc340(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,21,113,195,0,0 // addps 0xc371(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -48128,11 +48658,11 @@ _sk_bicubic_p3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,19,195,0,0 // addps 0xc313(%rip),%xmm0 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 15,88,5,68,195,0,0 // addps 0xc344(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,227,194,0,0 // mulps 0xc2e3(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,5,123,190,0,0 // addps 0xbe7b(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,5,20,195,0,0 // mulps 0xc314(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,5,172,190,0,0 // addps 0xbeac(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -48145,13 +48675,13 @@ _sk_bicubic_n3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,169,194,0,0 // addps 0xc2a9(%rip),%xmm1 # 2be10 <_sk_overlay_sse2_8bit+0x144f> - .byte 68,15,40,13,97,188,0,0 // movaps 0xbc61(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,13,218,194,0,0 // addps 0xc2da(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b> + .byte 68,15,40,13,146,188,0,0 // movaps 0xbc92(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,157,194,0,0 // mulps 0xc29d(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,13,53,190,0,0 // addps 0xbe35(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,13,206,194,0,0 // mulps 0xc2ce(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,13,102,190,0,0 // addps 0xbe66(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -48164,16 +48694,16 @@ _sk_bicubic_n1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,83,194,0,0 // addps 0xc253(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f> - .byte 68,15,40,13,27,188,0,0 // movaps 0xbc1b(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,88,13,132,194,0,0 // addps 0xc284(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b> + .byte 68,15,40,13,76,188,0,0 // movaps 0xbc4c(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,111,194,0,0 // movaps 0xc26f(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,5,160,194,0,0 // movaps 0xc2a0(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,115,194,0,0 // addps 0xc273(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,5,164,194,0,0 // addps 0xc2a4(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,231,187,0,0 // addps 0xbbe7(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,88,5,24,188,0,0 // addps 0xbc18(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,107,194,0,0 // addps 0xc26b(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,5,156,194,0,0 // addps 0xc29c(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -48183,17 +48713,17 @@ HIDDEN _sk_bicubic_p1y_sse2 FUNCTION(_sk_bicubic_p1y_sse2) _sk_bicubic_p1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,197,187,0,0 // movaps 0xbbc5(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff> + .byte 68,15,40,5,246,187,0,0 // movaps 0xbbf6(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,32,194,0,0 // movaps 0xc220(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f> + .byte 68,15,40,21,81,194,0,0 // movaps 0xc251(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,36,194,0,0 // addps 0xc224(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 68,15,88,21,85,194,0,0 // addps 0xc255(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,32,194,0,0 // addps 0xc220(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f> + .byte 68,15,88,21,81,194,0,0 // addps 0xc251(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -48205,11 +48735,11 @@ _sk_bicubic_p3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,242,193,0,0 // addps 0xc1f2(%rip),%xmm1 # 2be40 <_sk_overlay_sse2_8bit+0x147f> + .byte 15,88,13,35,194,0,0 // addps 0xc223(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,194,193,0,0 // mulps 0xc1c2(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f> - .byte 68,15,88,5,90,189,0,0 // addps 0xbd5a(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff> + .byte 68,15,89,5,243,193,0,0 // mulps 0xc1f3(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b> + .byte 68,15,88,5,139,189,0,0 // addps 0xbd8b(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -48358,7 +48888,7 @@ _sk_clut_3D_sse2: .byte 102,15,254,216 // paddd %xmm0,%xmm3 .byte 102,65,15,111,198 // movdqa %xmm14,%xmm0 .byte 102,15,254,195 // paddd %xmm3,%xmm0 - .byte 102,15,111,45,244,191,0,0 // movdqa 0xbff4(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,45,37,192,0,0 // movdqa 0xc025(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1 .byte 102,15,244,197 // pmuludq %xmm5,%xmm0 .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0 @@ -48381,7 +48911,7 @@ _sk_clut_3D_sse2: .byte 15,20,241 // unpcklps %xmm1,%xmm6 .byte 15,20,245 // unpcklps %xmm5,%xmm6 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,15,254,13,248,184,0,0 // paddd 0xb8f8(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,254,13,41,185,0,0 // paddd 0xb929(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5 .byte 102,73,15,126,233 // movq %xmm5,%r9 .byte 102,73,15,126,202 // movq %xmm1,%r10 @@ -48398,7 +48928,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5 .byte 15,20,253 // unpcklps %xmm5,%xmm7 .byte 15,20,249 // unpcklps %xmm1,%xmm7 - .byte 102,15,254,5,206,184,0,0 // paddd 0xb8ce(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,5,255,184,0,0 // paddd 0xb8ff(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,73,15,126,201 // movq %xmm1,%r9 .byte 102,73,15,126,194 // movq %xmm0,%r10 @@ -48415,7 +48945,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5 .byte 15,20,205 // unpcklps %xmm5,%xmm1 .byte 15,20,200 // unpcklps %xmm0,%xmm1 - .byte 15,40,45,229,190,0,0 // movaps 0xbee5(%rip),%xmm5 # 2be60 <_sk_overlay_sse2_8bit+0x149f> + .byte 15,40,45,22,191,0,0 // movaps 0xbf16(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab> .byte 15,88,229 // addps %xmm5,%xmm4 .byte 15,41,100,36,192 // movaps %xmm4,-0x40(%rsp) .byte 68,15,88,213 // addps %xmm5,%xmm10 @@ -48430,7 +48960,7 @@ _sk_clut_3D_sse2: .byte 102,15,127,68,36,160 // movdqa %xmm0,-0x60(%rsp) .byte 102,15,254,216 // paddd %xmm0,%xmm3 .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4 - .byte 102,15,111,5,174,190,0,0 // movdqa 0xbeae(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,5,223,190,0,0 // movdqa 0xbedf(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,244,216 // pmuludq %xmm0,%xmm3 .byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2 .byte 102,15,244,224 // pmuludq %xmm0,%xmm4 @@ -48452,7 +48982,7 @@ _sk_clut_3D_sse2: .byte 15,20,227 // unpcklps %xmm3,%xmm4 .byte 15,20,229 // unpcklps %xmm5,%xmm4 .byte 102,15,111,218 // movdqa %xmm2,%xmm3 - .byte 102,15,254,29,183,183,0,0 // paddd 0xb7b7(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,254,29,232,183,0,0 // paddd 0xb7e8(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5 .byte 102,73,15,126,233 // movq %xmm5,%r9 .byte 102,73,15,126,218 // movq %xmm3,%r10 @@ -48469,7 +48999,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0 .byte 15,20,216 // unpcklps %xmm0,%xmm3 .byte 15,20,221 // unpcklps %xmm5,%xmm3 - .byte 102,15,254,21,141,183,0,0 // paddd 0xb78d(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,21,190,183,0,0 // paddd 0xb7be(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0 .byte 102,73,15,126,193 // movq %xmm0,%r9 .byte 102,73,15,126,210 // movq %xmm2,%r10 @@ -48531,7 +49061,7 @@ _sk_clut_3D_sse2: .byte 68,15,20,193 // unpcklps %xmm1,%xmm8 .byte 68,15,20,199 // unpcklps %xmm7,%xmm8 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,68,15,111,21,88,182,0,0 // movdqa 0xb658(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,21,137,182,0,0 // movdqa 0xb689(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7 .byte 102,73,15,126,249 // movq %xmm7,%r9 @@ -48549,7 +49079,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5 .byte 15,20,205 // unpcklps %xmm5,%xmm1 .byte 15,20,207 // unpcklps %xmm7,%xmm1 - .byte 102,15,111,45,41,182,0,0 // movdqa 0xb629(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,111,45,90,182,0,0 // movdqa 0xb65a(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,254,197 // paddd %xmm5,%xmm0 .byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5 .byte 102,73,15,126,233 // movq %xmm5,%r9 @@ -48607,7 +49137,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7 .byte 68,15,20,223 // unpcklps %xmm7,%xmm11 .byte 68,15,20,221 // unpcklps %xmm5,%xmm11 - .byte 102,15,111,45,36,181,0,0 // movdqa 0xb524(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,111,45,85,181,0,0 // movdqa 0xb555(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,254,245 // paddd %xmm5,%xmm6 .byte 102,15,111,253 // movdqa %xmm5,%xmm7 .byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5 @@ -48654,7 +49184,7 @@ _sk_clut_3D_sse2: .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,254,201 // paddd %xmm9,%xmm1 .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2 - .byte 102,15,111,5,197,186,0,0 // movdqa 0xbac5(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,5,246,186,0,0 // movdqa 0xbaf6(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,244,200 // pmuludq %xmm0,%xmm1 .byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3 .byte 102,15,244,208 // pmuludq %xmm0,%xmm2 @@ -48676,7 +49206,7 @@ _sk_clut_3D_sse2: .byte 15,20,204 // unpcklps %xmm4,%xmm1 .byte 15,20,202 // unpcklps %xmm2,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,111,5,207,179,0,0 // movdqa 0xb3cf(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,5,0,180,0,0 // movdqa 0xb400(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,208 // paddd %xmm0,%xmm2 .byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4 .byte 102,73,15,126,225 // movq %xmm4,%r9 @@ -48752,7 +49282,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0 .byte 15,20,240 // unpcklps %xmm0,%xmm6 .byte 15,20,245 // unpcklps %xmm5,%xmm6 - .byte 102,15,254,29,160,178,0,0 // paddd 0xb2a0(%rip),%xmm3 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,29,209,178,0,0 // paddd 0xb2d1(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0 .byte 102,73,15,126,193 // movq %xmm0,%r9 .byte 102,73,15,126,218 // movq %xmm3,%r10 @@ -48803,7 +49333,7 @@ _sk_clut_3D_sse2: .byte 68,15,20,201 // unpcklps %xmm1,%xmm9 .byte 68,15,20,202 // unpcklps %xmm2,%xmm9 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,15,254,13,156,177,0,0 // paddd 0xb19c(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,254,13,205,177,0,0 // paddd 0xb1cd(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 .byte 102,73,15,126,209 // movq %xmm2,%r9 .byte 102,73,15,126,202 // movq %xmm1,%r10 @@ -48820,7 +49350,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2 .byte 68,15,20,242 // unpcklps %xmm2,%xmm14 .byte 68,15,20,241 // unpcklps %xmm1,%xmm14 - .byte 102,15,254,5,111,177,0,0 // paddd 0xb16f(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,5,160,177,0,0 // paddd 0xb1a0(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,73,15,126,201 // movq %xmm1,%r9 .byte 102,73,15,126,194 // movq %xmm0,%r10 @@ -48858,7 +49388,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7 .byte 15,20,199 // unpcklps %xmm7,%xmm0 .byte 15,20,193 // unpcklps %xmm1,%xmm0 - .byte 102,15,111,37,162,176,0,0 // movdqa 0xb0a2(%rip),%xmm4 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,37,211,176,0,0 // movdqa 0xb0d3(%rip),%xmm4 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,226 // paddd %xmm2,%xmm4 .byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1 .byte 102,73,15,126,201 // movq %xmm1,%r9 @@ -48876,7 +49406,7 @@ _sk_clut_3D_sse2: .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4 .byte 15,20,204 // unpcklps %xmm4,%xmm1 .byte 15,20,207 // unpcklps %xmm7,%xmm1 - .byte 102,15,254,21,116,176,0,0 // paddd 0xb074(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,21,165,176,0,0 // paddd 0xb0a5(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4 .byte 102,73,15,126,225 // movq %xmm4,%r9 .byte 102,73,15,126,210 // movq %xmm2,%r10 @@ -49029,7 +49559,7 @@ _sk_clut_4D_sse2: .byte 102,15,254,209 // paddd %xmm1,%xmm2 .byte 102,15,111,220 // movdqa %xmm4,%xmm3 .byte 102,15,254,218 // paddd %xmm2,%xmm3 - .byte 102,68,15,111,21,94,180,0,0 // movdqa 0xb45e(%rip),%xmm10 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,68,15,111,21,143,180,0,0 // movdqa 0xb48f(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,112,235,245 // pshufd $0xf5,%xmm3,%xmm5 .byte 102,65,15,244,218 // pmuludq %xmm10,%xmm3 .byte 102,15,112,227,232 // pshufd $0xe8,%xmm3,%xmm4 @@ -49052,7 +49582,7 @@ _sk_clut_4D_sse2: .byte 15,20,222 // unpcklps %xmm6,%xmm3 .byte 15,20,221 // unpcklps %xmm5,%xmm3 .byte 102,15,111,236 // movdqa %xmm4,%xmm5 - .byte 102,15,254,45,96,173,0,0 // paddd 0xad60(%rip),%xmm5 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,254,45,145,173,0,0 // paddd 0xad91(%rip),%xmm5 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6 .byte 102,73,15,126,241 // movq %xmm6,%r9 .byte 102,73,15,126,234 // movq %xmm5,%r10 @@ -49069,7 +49599,7 @@ _sk_clut_4D_sse2: .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7 .byte 15,20,247 // unpcklps %xmm7,%xmm6 .byte 15,20,245 // unpcklps %xmm5,%xmm6 - .byte 102,15,254,37,54,173,0,0 // paddd 0xad36(%rip),%xmm4 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,37,103,173,0,0 // paddd 0xad67(%rip),%xmm4 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5 .byte 102,73,15,126,233 // movq %xmm5,%r9 .byte 102,73,15,126,226 // movq %xmm4,%r10 @@ -49086,7 +49616,7 @@ _sk_clut_4D_sse2: .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7 .byte 15,20,239 // unpcklps %xmm7,%xmm5 .byte 15,20,236 // unpcklps %xmm4,%xmm5 - .byte 15,40,61,77,179,0,0 // movaps 0xb34d(%rip),%xmm7 # 2be60 <_sk_overlay_sse2_8bit+0x149f> + .byte 15,40,61,126,179,0,0 // movaps 0xb37e(%rip),%xmm7 # 2c460 <_sk_overlay_sse2_8bit+0x14ab> .byte 68,15,88,199 // addps %xmm7,%xmm8 .byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp) .byte 68,15,88,207 // addps %xmm7,%xmm9 @@ -49124,7 +49654,7 @@ _sk_clut_4D_sse2: .byte 68,15,20,234 // unpcklps %xmm2,%xmm13 .byte 68,15,20,239 // unpcklps %xmm7,%xmm13 .byte 102,15,111,208 // movdqa %xmm0,%xmm2 - .byte 102,15,254,21,20,172,0,0 // paddd 0xac14(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,254,21,69,172,0,0 // paddd 0xac45(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7 .byte 102,73,15,126,249 // movq %xmm7,%r9 .byte 102,73,15,126,210 // movq %xmm2,%r10 @@ -49141,7 +49671,7 @@ _sk_clut_4D_sse2: .byte 243,70,15,16,12,139 // movss (%rbx,%r9,4),%xmm9 .byte 65,15,20,209 // unpcklps %xmm9,%xmm2 .byte 15,20,215 // unpcklps %xmm7,%xmm2 - .byte 102,15,254,5,233,171,0,0 // paddd 0xabe9(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,5,26,172,0,0 // paddd 0xac1a(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7 .byte 102,73,15,126,249 // movq %xmm7,%r9 .byte 102,73,15,126,194 // movq %xmm0,%r10 @@ -49182,7 +49712,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,217 // movdqa %xmm1,%xmm3 .byte 102,15,254,92,36,160 // paddd -0x60(%rsp),%xmm3 .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4 - .byte 102,68,15,111,53,165,177,0,0 // movdqa 0xb1a5(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,68,15,111,53,214,177,0,0 // movdqa 0xb1d6(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3 .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3 .byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4 @@ -49203,7 +49733,7 @@ _sk_clut_4D_sse2: .byte 68,15,20,228 // unpcklps %xmm4,%xmm12 .byte 68,15,20,229 // unpcklps %xmm5,%xmm12 .byte 102,15,111,227 // movdqa %xmm3,%xmm4 - .byte 102,15,111,61,174,170,0,0 // movdqa 0xaaae(%rip),%xmm7 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,61,223,170,0,0 // movdqa 0xaadf(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,231 // paddd %xmm7,%xmm4 .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5 .byte 102,73,15,126,233 // movq %xmm5,%r9 @@ -49221,7 +49751,7 @@ _sk_clut_4D_sse2: .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5 .byte 15,20,245 // unpcklps %xmm5,%xmm6 .byte 15,20,244 // unpcklps %xmm4,%xmm6 - .byte 102,68,15,111,5,127,170,0,0 // movdqa 0xaa7f(%rip),%xmm8 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,5,176,170,0,0 // movdqa 0xaab0(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,65,15,254,216 // paddd %xmm8,%xmm3 .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4 .byte 102,73,15,126,225 // movq %xmm4,%r9 @@ -49335,7 +49865,7 @@ _sk_clut_4D_sse2: .byte 102,68,15,111,108,36,160 // movdqa -0x60(%rsp),%xmm13 .byte 102,65,15,254,205 // paddd %xmm13,%xmm1 .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2 - .byte 102,15,111,29,235,174,0,0 // movdqa 0xaeeb(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,29,28,175,0,0 // movdqa 0xaf1c(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,244,203 // pmuludq %xmm3,%xmm1 .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1 .byte 102,15,244,211 // pmuludq %xmm3,%xmm2 @@ -49357,7 +49887,7 @@ _sk_clut_4D_sse2: .byte 68,15,20,202 // unpcklps %xmm2,%xmm9 .byte 68,15,20,205 // unpcklps %xmm5,%xmm9 .byte 102,15,111,209 // movdqa %xmm1,%xmm2 - .byte 102,15,111,29,242,167,0,0 // movdqa 0xa7f2(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,29,35,168,0,0 // movdqa 0xa823(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5 .byte 102,73,15,126,233 // movq %xmm5,%r9 @@ -49465,7 +49995,7 @@ _sk_clut_4D_sse2: .byte 102,65,15,111,211 // movdqa %xmm11,%xmm2 .byte 102,65,15,254,213 // paddd %xmm13,%xmm2 .byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3 - .byte 102,15,111,5,179,172,0,0 // movdqa 0xacb3(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,5,228,172,0,0 // movdqa 0xace4(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,244,208 // pmuludq %xmm0,%xmm2 .byte 102,15,112,250,232 // pshufd $0xe8,%xmm2,%xmm7 .byte 102,15,244,216 // pmuludq %xmm0,%xmm3 @@ -49486,7 +50016,7 @@ _sk_clut_4D_sse2: .byte 68,15,20,202 // unpcklps %xmm2,%xmm9 .byte 68,15,20,203 // unpcklps %xmm3,%xmm9 .byte 102,15,111,215 // movdqa %xmm7,%xmm2 - .byte 102,15,111,5,190,165,0,0 // movdqa 0xa5be(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,5,239,165,0,0 // movdqa 0xa5ef(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,208 // paddd %xmm0,%xmm2 .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3 .byte 102,73,15,126,217 // movq %xmm3,%r9 @@ -49504,7 +50034,7 @@ _sk_clut_4D_sse2: .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3 .byte 15,20,243 // unpcklps %xmm3,%xmm6 .byte 15,20,242 // unpcklps %xmm2,%xmm6 - .byte 102,68,15,111,45,143,165,0,0 // movdqa 0xa58f(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,45,192,165,0,0 // movdqa 0xa5c0(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,65,15,254,253 // paddd %xmm13,%xmm7 .byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2 .byte 102,73,15,126,209 // movq %xmm2,%r9 @@ -49524,7 +50054,7 @@ _sk_clut_4D_sse2: .byte 15,20,250 // unpcklps %xmm2,%xmm7 .byte 102,68,15,254,220 // paddd %xmm4,%xmm11 .byte 102,65,15,112,219,245 // pshufd $0xf5,%xmm11,%xmm3 - .byte 102,15,111,37,165,171,0,0 // movdqa 0xaba5(%rip),%xmm4 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,37,214,171,0,0 // movdqa 0xabd6(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,68,15,244,220 // pmuludq %xmm4,%xmm11 .byte 102,65,15,112,211,232 // pshufd $0xe8,%xmm11,%xmm2 .byte 102,15,244,220 // pmuludq %xmm4,%xmm3 @@ -49625,7 +50155,7 @@ _sk_clut_4D_sse2: .byte 102,65,15,111,202 // movdqa %xmm10,%xmm1 .byte 102,15,254,200 // paddd %xmm0,%xmm1 .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2 - .byte 102,15,111,29,231,169,0,0 // movdqa 0xa9e7(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,29,24,170,0,0 // movdqa 0xaa18(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,244,203 // pmuludq %xmm3,%xmm1 .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1 .byte 102,15,244,211 // pmuludq %xmm3,%xmm2 @@ -49647,7 +50177,7 @@ _sk_clut_4D_sse2: .byte 15,20,212 // unpcklps %xmm4,%xmm2 .byte 15,20,211 // unpcklps %xmm3,%xmm2 .byte 102,15,111,217 // movdqa %xmm1,%xmm3 - .byte 102,15,111,61,240,162,0,0 // movdqa 0xa2f0(%rip),%xmm7 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,61,33,163,0,0 // movdqa 0xa321(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,223 // paddd %xmm7,%xmm3 .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4 .byte 102,73,15,126,225 // movq %xmm4,%r9 @@ -49665,7 +50195,7 @@ _sk_clut_4D_sse2: .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5 .byte 15,20,221 // unpcklps %xmm5,%xmm3 .byte 15,20,220 // unpcklps %xmm4,%xmm3 - .byte 102,68,15,111,13,193,162,0,0 // movdqa 0xa2c1(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,68,15,111,13,242,162,0,0 // movdqa 0xa2f2(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,65,15,254,201 // paddd %xmm9,%xmm1 .byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4 .byte 102,73,15,126,225 // movq %xmm4,%r9 @@ -49777,7 +50307,7 @@ _sk_clut_4D_sse2: .byte 68,15,20,246 // unpcklps %xmm6,%xmm14 .byte 68,15,20,243 // unpcklps %xmm3,%xmm14 .byte 102,15,111,220 // movdqa %xmm4,%xmm3 - .byte 102,68,15,111,21,180,160,0,0 // movdqa 0xa0b4(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,21,229,160,0,0 // movdqa 0xa0e5(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,65,15,254,218 // paddd %xmm10,%xmm3 .byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6 .byte 102,73,15,126,241 // movq %xmm6,%r9 @@ -49898,7 +50428,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,116,36,160 // movdqa -0x60(%rsp),%xmm6 .byte 102,15,254,198 // paddd %xmm6,%xmm0 .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1 - .byte 102,15,111,29,46,165,0,0 // movdqa 0xa52e(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,29,95,165,0,0 // movdqa 0xa55f(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,244,195 // pmuludq %xmm3,%xmm0 .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2 .byte 102,15,244,203 // pmuludq %xmm3,%xmm1 @@ -49920,7 +50450,7 @@ _sk_clut_4D_sse2: .byte 15,20,195 // unpcklps %xmm3,%xmm0 .byte 15,20,193 // unpcklps %xmm1,%xmm0 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 - .byte 102,68,15,111,5,54,158,0,0 // movdqa 0x9e36(%rip),%xmm8 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,68,15,111,5,103,158,0,0 // movdqa 0x9e67(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,65,15,254,200 // paddd %xmm8,%xmm1 .byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3 .byte 102,73,15,126,217 // movq %xmm3,%r9 @@ -50026,7 +50556,7 @@ _sk_clut_4D_sse2: .byte 102,15,254,124,36,128 // paddd -0x80(%rsp),%xmm7 .byte 102,15,254,247 // paddd %xmm7,%xmm6 .byte 102,15,112,206,245 // pshufd $0xf5,%xmm6,%xmm1 - .byte 102,15,111,21,248,162,0,0 // movdqa 0xa2f8(%rip),%xmm2 # 2be70 <_sk_overlay_sse2_8bit+0x14af> + .byte 102,15,111,21,41,163,0,0 // movdqa 0xa329(%rip),%xmm2 # 2c470 <_sk_overlay_sse2_8bit+0x14bb> .byte 102,15,244,242 // pmuludq %xmm2,%xmm6 .byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0 .byte 102,15,244,202 // pmuludq %xmm2,%xmm1 @@ -50048,7 +50578,7 @@ _sk_clut_4D_sse2: .byte 68,15,20,201 // unpcklps %xmm1,%xmm9 .byte 68,15,20,202 // unpcklps %xmm2,%xmm9 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,15,254,13,255,155,0,0 // paddd 0x9bff(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,254,13,48,156,0,0 // paddd 0x9c30(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 .byte 102,73,15,126,209 // movq %xmm2,%r9 .byte 102,73,15,126,202 // movq %xmm1,%r10 @@ -50104,7 +50634,7 @@ _sk_clut_4D_sse2: .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7 .byte 15,20,199 // unpcklps %xmm7,%xmm0 .byte 15,20,193 // unpcklps %xmm1,%xmm0 - .byte 102,15,111,53,5,155,0,0 // movdqa 0x9b05(%rip),%xmm6 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f> + .byte 102,15,111,53,54,155,0,0 // movdqa 0x9b36(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b> .byte 102,15,254,242 // paddd %xmm2,%xmm6 .byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1 .byte 102,73,15,126,201 // movq %xmm1,%r9 @@ -50122,7 +50652,7 @@ _sk_clut_4D_sse2: .byte 243,70,15,16,60,139 // movss (%rbx,%r9,4),%xmm15 .byte 65,15,20,207 // unpcklps %xmm15,%xmm1 .byte 15,20,207 // unpcklps %xmm7,%xmm1 - .byte 102,15,254,21,214,154,0,0 // paddd 0x9ad6(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f> + .byte 102,15,254,21,7,155,0,0 // paddd 0x9b07(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b> .byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7 .byte 102,73,15,126,249 // movq %xmm7,%r9 .byte 102,73,15,126,210 // movq %xmm2,%r10 @@ -50184,7 +50714,7 @@ _sk_clut_4D_sse2: .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 65,15,88,213 // addps %xmm13,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,187,153,0,0 // movaps 0x99bb(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f> + .byte 15,40,29,236,153,0,0 // movaps 0x99ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b> .byte 15,40,100,36,112 // movaps 0x70(%rsp),%xmm4 .byte 15,40,172,36,128,0,0,0 // movaps 0x80(%rsp),%xmm5 .byte 15,40,180,36,144,0,0,0 // movaps 0x90(%rsp),%xmm6 @@ -50192,6 +50722,7 @@ _sk_clut_4D_sse2: .byte 72,129,196,176,0,0,0 // add $0xb0,%rsp .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax + .byte 144 // nop HIDDEN _sk_start_pipeline_hsw_8bit .globl _sk_start_pipeline_hsw_8bit @@ -50214,7 +50745,7 @@ _sk_start_pipeline_hsw_8bit: .byte 73,137,246 // mov %rsi,%r14 .byte 72,137,77,168 // mov %rcx,-0x58(%rbp) .byte 73,57,207 // cmp %rcx,%r15 - .byte 115,102 // jae 21ed1 <_sk_start_pipeline_hsw_8bit+0x95> + .byte 115,102 // jae 224a1 <_sk_start_pipeline_hsw_8bit+0x95> .byte 72,139,69,208 // mov -0x30(%rbp),%rax .byte 72,141,64,16 // lea 0x10(%rax),%rax .byte 72,137,69,176 // mov %rax,-0x50(%rbp) @@ -50224,7 +50755,7 @@ _sk_start_pipeline_hsw_8bit: .byte 76,137,125,192 // mov %r15,-0x40(%rbp) .byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp) .byte 72,57,93,176 // cmp %rbx,-0x50(%rbp) - .byte 119,30 // ja 21eb3 <_sk_start_pipeline_hsw_8bit+0x77> + .byte 119,30 // ja 22483 <_sk_start_pipeline_hsw_8bit+0x77> .byte 76,137,231 // mov %r12,%rdi .byte 76,137,246 // mov %r14,%rsi .byte 65,255,213 // callq *%r13 @@ -50233,17 +50764,17 @@ _sk_start_pipeline_hsw_8bit: .byte 72,137,69,184 // mov %rax,-0x48(%rbp) .byte 72,131,193,32 // add $0x20,%rcx .byte 72,57,217 // cmp %rbx,%rcx - .byte 118,226 // jbe 21e95 <_sk_start_pipeline_hsw_8bit+0x59> + .byte 118,226 // jbe 22465 <_sk_start_pipeline_hsw_8bit+0x59> .byte 72,137,217 // mov %rbx,%rcx .byte 72,41,193 // sub %rax,%rcx - .byte 116,13 // je 21ec8 <_sk_start_pipeline_hsw_8bit+0x8c> + .byte 116,13 // je 22498 <_sk_start_pipeline_hsw_8bit+0x8c> .byte 72,137,77,200 // mov %rcx,-0x38(%rbp) .byte 76,137,231 // mov %r12,%rdi .byte 76,137,246 // mov %r14,%rsi .byte 65,255,213 // callq *%r13 .byte 73,255,199 // inc %r15 .byte 76,59,125,168 // cmp -0x58(%rbp),%r15 - .byte 117,170 // jne 21e7b <_sk_start_pipeline_hsw_8bit+0x3f> + .byte 117,170 // jne 2244b <_sk_start_pipeline_hsw_8bit+0x3f> .byte 72,131,196,56 // add $0x38,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -50275,7 +50806,7 @@ HIDDEN _sk_set_rgb_hsw_8bit FUNCTION(_sk_set_rgb_hsw_8bit) _sk_set_rgb_hsw_8bit: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 197,250,16,37,50,143,0,0 // vmovss 0x8f32(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 197,250,16,37,86,143,0,0 // vmovss 0x8f56(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 197,218,89,40 // vmulss (%rax),%xmm4,%xmm5 .byte 196,225,250,44,205 // vcvttss2si %xmm5,%rcx .byte 197,218,89,104,4 // vmulss 0x4(%rax),%xmm4,%xmm5 @@ -50288,7 +50819,7 @@ _sk_set_rgb_hsw_8bit: .byte 9,208 // or %edx,%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 .byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4 - .byte 197,253,111,45,106,148,0,0 // vmovdqa 0x946a(%rip),%ymm5 # 2b3a0 <_sk_overlay_sse2_8bit+0x9df> + .byte 197,253,111,45,154,148,0,0 // vmovdqa 0x949a(%rip),%ymm5 # 2b9a0 <_sk_overlay_sse2_8bit+0x9eb> .byte 197,245,219,205 // vpand %ymm5,%ymm1,%ymm1 .byte 197,253,219,197 // vpand %ymm5,%ymm0,%ymm0 .byte 197,221,235,192 // vpor %ymm0,%ymm4,%ymm0 @@ -50300,10 +50831,10 @@ HIDDEN _sk_premul_hsw_8bit .globl _sk_premul_hsw_8bit FUNCTION(_sk_premul_hsw_8bit) _sk_premul_hsw_8bit: - .byte 197,253,111,37,110,148,0,0 // vmovdqa 0x946e(%rip),%ymm4 # 2b3c0 <_sk_overlay_sse2_8bit+0x9ff> + .byte 197,253,111,37,158,148,0,0 // vmovdqa 0x949e(%rip),%ymm4 # 2b9c0 <_sk_overlay_sse2_8bit+0xa0b> .byte 196,226,125,0,236 // vpshufb %ymm4,%ymm0,%ymm5 .byte 196,226,117,0,228 // vpshufb %ymm4,%ymm1,%ymm4 - .byte 197,253,111,53,124,148,0,0 // vmovdqa 0x947c(%rip),%ymm6 # 2b3e0 <_sk_overlay_sse2_8bit+0xa1f> + .byte 197,253,111,53,172,148,0,0 // vmovdqa 0x94ac(%rip),%ymm6 # 2b9e0 <_sk_overlay_sse2_8bit+0xa2b> .byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4 .byte 197,213,235,238 // vpor %ymm6,%ymm5,%ymm5 .byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6 @@ -50343,7 +50874,7 @@ HIDDEN _sk_swap_rb_hsw_8bit .globl _sk_swap_rb_hsw_8bit FUNCTION(_sk_swap_rb_hsw_8bit) _sk_swap_rb_hsw_8bit: - .byte 197,253,111,37,244,147,0,0 // vmovdqa 0x93f4(%rip),%ymm4 # 2b400 <_sk_overlay_sse2_8bit+0xa3f> + .byte 197,253,111,37,36,148,0,0 // vmovdqa 0x9424(%rip),%ymm4 # 2ba00 <_sk_overlay_sse2_8bit+0xa4b> .byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0 .byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -50372,7 +50903,7 @@ _sk_load_8888_hsw_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,17 // jne 2205c <_sk_load_8888_hsw_8bit+0x32> + .byte 117,17 // jne 2262c <_sk_load_8888_hsw_8bit+0x32> .byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1 .byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -50382,14 +50913,14 @@ _sk_load_8888_hsw_8bit: .byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,231 // ja 22058 <_sk_load_8888_hsw_8bit+0x2e> + .byte 119,231 // ja 22628 <_sk_load_8888_hsw_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22194 <_sk_load_8888_hsw_8bit+0x16a> + .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22764 <_sk_load_8888_hsw_8bit+0x16a> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0 - .byte 235,203 // jmp 22058 <_sk_load_8888_hsw_8bit+0x2e> + .byte 235,203 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e> .byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50397,7 +50928,7 @@ _sk_load_8888_hsw_8bit: .byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4 .byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4 .byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0 - .byte 235,162 // jmp 22058 <_sk_load_8888_hsw_8bit+0x2e> + .byte 235,162 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e> .byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50410,7 +50941,7 @@ _sk_load_8888_hsw_8bit: .byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0 .byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4 .byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0 - .byte 233,83,255,255,255 // jmpq 22058 <_sk_load_8888_hsw_8bit+0x2e> + .byte 233,83,255,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e> .byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50419,7 +50950,7 @@ _sk_load_8888_hsw_8bit: .byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1 .byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0 .byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1 - .byte 233,23,255,255,255 // jmpq 22052 <_sk_load_8888_hsw_8bit+0x28> + .byte 233,23,255,255,255 // jmpq 22622 <_sk_load_8888_hsw_8bit+0x28> .byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50433,7 +50964,7 @@ _sk_load_8888_hsw_8bit: .byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0 .byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4 .byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1 - .byte 233,199,254,255,255 // jmpq 22058 <_sk_load_8888_hsw_8bit+0x2e> + .byte 233,199,254,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e> .byte 15,31,0 // nopl (%rax) .byte 241 // icebp .byte 254 // (bad) @@ -50486,7 +51017,7 @@ _sk_load_8888_dst_hsw_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,17 // jne 22202 <_sk_load_8888_dst_hsw_8bit+0x32> + .byte 117,17 // jne 227d2 <_sk_load_8888_dst_hsw_8bit+0x32> .byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3 .byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax @@ -50496,14 +51027,14 @@ _sk_load_8888_dst_hsw_8bit: .byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,231 // ja 221fe <_sk_load_8888_dst_hsw_8bit+0x2e> + .byte 119,231 // ja 227ce <_sk_load_8888_dst_hsw_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22338 <_sk_load_8888_dst_hsw_8bit+0x168> + .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22908 <_sk_load_8888_dst_hsw_8bit+0x168> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2 - .byte 235,203 // jmp 221fe <_sk_load_8888_dst_hsw_8bit+0x2e> + .byte 235,203 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e> .byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2 .byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50511,7 +51042,7 @@ _sk_load_8888_dst_hsw_8bit: .byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4 .byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4 .byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2 - .byte 235,162 // jmp 221fe <_sk_load_8888_dst_hsw_8bit+0x2e> + .byte 235,162 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e> .byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2 .byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50524,7 +51055,7 @@ _sk_load_8888_dst_hsw_8bit: .byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2 .byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4 .byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2 - .byte 233,83,255,255,255 // jmpq 221fe <_sk_load_8888_dst_hsw_8bit+0x2e> + .byte 233,83,255,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e> .byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2 .byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50533,7 +51064,7 @@ _sk_load_8888_dst_hsw_8bit: .byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3 .byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2 .byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3 - .byte 233,23,255,255,255 // jmpq 221f8 <_sk_load_8888_dst_hsw_8bit+0x28> + .byte 233,23,255,255,255 // jmpq 227c8 <_sk_load_8888_dst_hsw_8bit+0x28> .byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2 .byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50547,7 +51078,7 @@ _sk_load_8888_dst_hsw_8bit: .byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2 .byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4 .byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3 - .byte 233,199,254,255,255 // jmpq 221fe <_sk_load_8888_dst_hsw_8bit+0x2e> + .byte 233,199,254,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e> .byte 144 // nop .byte 243,254 // repz (bad) .byte 255 // (bad) @@ -50600,7 +51131,7 @@ _sk_store_8888_hsw_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,17 // jne 223a6 <_sk_store_8888_hsw_8bit+0x32> + .byte 117,17 // jne 22976 <_sk_store_8888_hsw_8bit+0x32> .byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4) .byte 196,161,126,127,76,130,32 // vmovdqu %ymm1,0x20(%rdx,%r8,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -50608,17 +51139,17 @@ _sk_store_8888_hsw_8bit: .byte 65,128,225,15 // and $0xf,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,239 // ja 223a2 <_sk_store_8888_hsw_8bit+0x2e> + .byte 119,239 // ja 22972 <_sk_store_8888_hsw_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22470 <_sk_store_8888_hsw_8bit+0xfc> + .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22a40 <_sk_store_8888_hsw_8bit+0xfc> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,161,121,126,4,130 // vmovd %xmm0,(%rdx,%r8,4) - .byte 235,211 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e> + .byte 235,211 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e> .byte 196,163,121,22,68,130,8,2 // vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4) .byte 196,161,121,214,4,130 // vmovq %xmm0,(%rdx,%r8,4) - .byte 235,195 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e> + .byte 235,195 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e> .byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4 .byte 196,163,121,22,100,130,24,2 // vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4) .byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4 @@ -50626,12 +51157,12 @@ _sk_store_8888_hsw_8bit: .byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4 .byte 196,161,121,126,100,130,16 // vmovd %xmm4,0x10(%rdx,%r8,4) .byte 196,161,122,127,4,130 // vmovdqu %xmm0,(%rdx,%r8,4) - .byte 235,146 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e> + .byte 235,146 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e> .byte 196,163,121,22,76,130,40,2 // vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4) .byte 196,163,121,22,76,130,36,1 // vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4) .byte 196,161,121,126,76,130,32 // vmovd %xmm1,0x20(%rdx,%r8,4) .byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4) - .byte 233,112,255,255,255 // jmpq 223a2 <_sk_store_8888_hsw_8bit+0x2e> + .byte 233,112,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e> .byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4 .byte 196,163,121,22,100,130,56,2 // vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4) .byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4 @@ -50640,7 +51171,7 @@ _sk_store_8888_hsw_8bit: .byte 196,161,121,126,100,130,48 // vmovd %xmm4,0x30(%rdx,%r8,4) .byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4) .byte 196,161,122,127,76,130,32 // vmovdqu %xmm1,0x20(%rdx,%r8,4) - .byte 233,53,255,255,255 // jmpq 223a2 <_sk_store_8888_hsw_8bit+0x2e> + .byte 233,53,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e> .byte 15,31,0 // nopl (%rax) .byte 87 // push %rdi .byte 255 // (bad) @@ -50653,7 +51184,7 @@ _sk_store_8888_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 125,255 // jge 22485 <_sk_store_8888_hsw_8bit+0x111> + .byte 125,255 // jge 22a55 <_sk_store_8888_hsw_8bit+0x111> .byte 255 // (bad) .byte 255,111,255 // ljmp *-0x1(%rdi) .byte 255 // (bad) @@ -50664,7 +51195,7 @@ _sk_store_8888_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 235,255 // jmp 2249d <_sk_store_8888_hsw_8bit+0x129> + .byte 235,255 // jmp 22a6d <_sk_store_8888_hsw_8bit+0x129> .byte 255 // (bad) .byte 255 // (bad) .byte 222,255 // fdivrp %st,%st(7) @@ -50690,10 +51221,10 @@ _sk_load_bgra_hsw_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,35 // jne 224f0 <_sk_load_bgra_hsw_8bit+0x44> + .byte 117,35 // jne 22ac0 <_sk_load_bgra_hsw_8bit+0x44> .byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1 .byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0 - .byte 197,253,111,37,62,143,0,0 // vmovdqa 0x8f3e(%rip),%ymm4 # 2b420 <_sk_overlay_sse2_8bit+0xa5f> + .byte 197,253,111,37,110,143,0,0 // vmovdqa 0x8f6e(%rip),%ymm4 # 2ba20 <_sk_overlay_sse2_8bit+0xa6b> .byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0 .byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -50703,14 +51234,14 @@ _sk_load_bgra_hsw_8bit: .byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,213 // ja 224da <_sk_load_bgra_hsw_8bit+0x2e> + .byte 119,213 // ja 22aaa <_sk_load_bgra_hsw_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22628 <_sk_load_bgra_hsw_8bit+0x17c> + .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22bf8 <_sk_load_bgra_hsw_8bit+0x17c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0 - .byte 235,185 // jmp 224da <_sk_load_bgra_hsw_8bit+0x2e> + .byte 235,185 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e> .byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50718,7 +51249,7 @@ _sk_load_bgra_hsw_8bit: .byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4 .byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4 .byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0 - .byte 235,144 // jmp 224da <_sk_load_bgra_hsw_8bit+0x2e> + .byte 235,144 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e> .byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50731,7 +51262,7 @@ _sk_load_bgra_hsw_8bit: .byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0 .byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4 .byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0 - .byte 233,65,255,255,255 // jmpq 224da <_sk_load_bgra_hsw_8bit+0x2e> + .byte 233,65,255,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e> .byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50740,7 +51271,7 @@ _sk_load_bgra_hsw_8bit: .byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1 .byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0 .byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1 - .byte 233,5,255,255,255 // jmpq 224d4 <_sk_load_bgra_hsw_8bit+0x28> + .byte 233,5,255,255,255 // jmpq 22aa4 <_sk_load_bgra_hsw_8bit+0x28> .byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -50754,7 +51285,7 @@ _sk_load_bgra_hsw_8bit: .byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0 .byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4 .byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1 - .byte 233,181,254,255,255 // jmpq 224da <_sk_load_bgra_hsw_8bit+0x2e> + .byte 233,181,254,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e> .byte 15,31,0 // nopl (%rax) .byte 241 // icebp .byte 254 // (bad) @@ -50805,10 +51336,10 @@ _sk_load_bgra_dst_hsw_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,35 // jne 226a8 <_sk_load_bgra_dst_hsw_8bit+0x44> + .byte 117,35 // jne 22c78 <_sk_load_bgra_dst_hsw_8bit+0x44> .byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3 .byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2 - .byte 197,253,111,37,166,141,0,0 // vmovdqa 0x8da6(%rip),%ymm4 # 2b440 <_sk_overlay_sse2_8bit+0xa7f> + .byte 197,253,111,37,214,141,0,0 // vmovdqa 0x8dd6(%rip),%ymm4 # 2ba40 <_sk_overlay_sse2_8bit+0xa8b> .byte 196,226,109,0,212 // vpshufb %ymm4,%ymm2,%ymm2 .byte 196,226,101,0,220 // vpshufb %ymm4,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -50818,14 +51349,14 @@ _sk_load_bgra_dst_hsw_8bit: .byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,213 // ja 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e> + .byte 119,213 // ja 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 227e0 <_sk_load_bgra_dst_hsw_8bit+0x17c> + .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22db0 <_sk_load_bgra_dst_hsw_8bit+0x17c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2 - .byte 235,185 // jmp 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e> + .byte 235,185 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e> .byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2 .byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50833,7 +51364,7 @@ _sk_load_bgra_dst_hsw_8bit: .byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4 .byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4 .byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2 - .byte 235,144 // jmp 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e> + .byte 235,144 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e> .byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2 .byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50846,7 +51377,7 @@ _sk_load_bgra_dst_hsw_8bit: .byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2 .byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4 .byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2 - .byte 233,65,255,255,255 // jmpq 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e> + .byte 233,65,255,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e> .byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2 .byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50855,7 +51386,7 @@ _sk_load_bgra_dst_hsw_8bit: .byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3 .byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2 .byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3 - .byte 233,5,255,255,255 // jmpq 2268c <_sk_load_bgra_dst_hsw_8bit+0x28> + .byte 233,5,255,255,255 // jmpq 22c5c <_sk_load_bgra_dst_hsw_8bit+0x28> .byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2 .byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -50869,7 +51400,7 @@ _sk_load_bgra_dst_hsw_8bit: .byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2 .byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4 .byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3 - .byte 233,181,254,255,255 // jmpq 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e> + .byte 233,181,254,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e> .byte 15,31,0 // nopl (%rax) .byte 241 // icebp .byte 254 // (bad) @@ -50919,11 +51450,11 @@ _sk_store_bgra_hsw_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx - .byte 197,253,111,37,32,140,0,0 // vmovdqa 0x8c20(%rip),%ymm4 # 2b460 <_sk_overlay_sse2_8bit+0xa9f> + .byte 197,253,111,37,80,140,0,0 // vmovdqa 0x8c50(%rip),%ymm4 # 2ba60 <_sk_overlay_sse2_8bit+0xaab> .byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5 .byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4 .byte 77,133,201 // test %r9,%r9 - .byte 117,17 // jne 22860 <_sk_store_bgra_hsw_8bit+0x44> + .byte 117,17 // jne 22e30 <_sk_store_bgra_hsw_8bit+0x44> .byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4) .byte 196,161,126,127,108,130,32 // vmovdqu %ymm5,0x20(%rdx,%r8,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -50931,17 +51462,17 @@ _sk_store_bgra_hsw_8bit: .byte 65,128,225,15 // and $0xf,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,239 // ja 2285c <_sk_store_bgra_hsw_8bit+0x40> + .byte 119,239 // ja 22e2c <_sk_store_bgra_hsw_8bit+0x40> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 22928 <_sk_store_bgra_hsw_8bit+0x10c> + .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 22ef8 <_sk_store_bgra_hsw_8bit+0x10c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,161,121,126,36,130 // vmovd %xmm4,(%rdx,%r8,4) - .byte 235,211 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40> + .byte 235,211 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40> .byte 196,163,121,22,100,130,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4) .byte 196,161,121,214,36,130 // vmovq %xmm4,(%rdx,%r8,4) - .byte 235,195 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40> + .byte 235,195 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40> .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5 .byte 196,163,121,22,108,130,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4) .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5 @@ -50949,12 +51480,12 @@ _sk_store_bgra_hsw_8bit: .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5 .byte 196,161,121,126,108,130,16 // vmovd %xmm5,0x10(%rdx,%r8,4) .byte 196,161,122,127,36,130 // vmovdqu %xmm4,(%rdx,%r8,4) - .byte 235,146 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40> + .byte 235,146 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40> .byte 196,163,121,22,108,130,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4) .byte 196,163,121,22,108,130,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4) .byte 196,161,121,126,108,130,32 // vmovd %xmm5,0x20(%rdx,%r8,4) .byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4) - .byte 233,112,255,255,255 // jmpq 2285c <_sk_store_bgra_hsw_8bit+0x40> + .byte 233,112,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40> .byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6 .byte 196,163,121,22,116,130,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4) .byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6 @@ -50963,7 +51494,7 @@ _sk_store_bgra_hsw_8bit: .byte 196,161,121,126,116,130,48 // vmovd %xmm6,0x30(%rdx,%r8,4) .byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4) .byte 196,161,122,127,108,130,32 // vmovdqu %xmm5,0x20(%rdx,%r8,4) - .byte 233,53,255,255,255 // jmpq 2285c <_sk_store_bgra_hsw_8bit+0x40> + .byte 233,53,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40> .byte 144 // nop .byte 89 // pop %rcx .byte 255 // (bad) @@ -50976,7 +51507,7 @@ _sk_store_bgra_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 127,255 // jg 2293d <_sk_store_bgra_hsw_8bit+0x121> + .byte 127,255 // jg 22f0d <_sk_store_bgra_hsw_8bit+0x121> .byte 255 // (bad) .byte 255,113,255 // pushq -0x1(%rcx) .byte 255 // (bad) @@ -51014,7 +51545,7 @@ _sk_load_a8_hsw_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,35 // jne 229a4 <_sk_load_a8_hsw_8bit+0x40> + .byte 117,35 // jne 22f74 <_sk_load_a8_hsw_8bit+0x40> .byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0 .byte 197,249,112,200,78 // vpshufd $0x4e,%xmm0,%xmm1 .byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1 @@ -51027,35 +51558,35 @@ _sk_load_a8_hsw_8bit: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,210 // ja 22987 <_sk_load_a8_hsw_8bit+0x23> + .byte 119,210 // ja 22f57 <_sk_load_a8_hsw_8bit+0x23> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 22a80 <_sk_load_a8_hsw_8bit+0x11c> + .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 23050 <_sk_load_a8_hsw_8bit+0x11c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,179 // jmp 22987 <_sk_load_a8_hsw_8bit+0x23> + .byte 235,179 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0 .byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0 - .byte 235,150 // jmp 22987 <_sk_load_a8_hsw_8bit+0x23> + .byte 235,150 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,105,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23> + .byte 233,105,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,60,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23> + .byte 233,60,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0 @@ -51063,7 +51594,7 @@ _sk_load_a8_hsw_8bit: .byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1 .byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1 .byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0 - .byte 233,7,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23> + .byte 233,7,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23> .byte 73,255 // rex.WB (bad) .byte 255 // (bad) .byte 255,96,255 // jmpq *-0x1(%rax) @@ -51073,7 +51604,7 @@ _sk_load_a8_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 125,255 // jge 22a95 <_sk_load_a8_hsw_8bit+0x131> + .byte 125,255 // jge 23065 <_sk_load_a8_hsw_8bit+0x131> .byte 255 // (bad) .byte 255,113,255 // pushq -0x1(%rcx) .byte 255 // (bad) @@ -51110,7 +51641,7 @@ _sk_load_a8_dst_hsw_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,35 // jne 22afc <_sk_load_a8_dst_hsw_8bit+0x40> + .byte 117,35 // jne 230cc <_sk_load_a8_dst_hsw_8bit+0x40> .byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2 .byte 197,249,112,218,78 // vpshufd $0x4e,%xmm2,%xmm3 .byte 196,226,125,49,219 // vpmovzxbd %xmm3,%ymm3 @@ -51123,35 +51654,35 @@ _sk_load_a8_dst_hsw_8bit: .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,210 // ja 22adf <_sk_load_a8_dst_hsw_8bit+0x23> + .byte 119,210 // ja 230af <_sk_load_a8_dst_hsw_8bit+0x23> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 22bd8 <_sk_load_a8_dst_hsw_8bit+0x11c> + .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 231a8 <_sk_load_a8_dst_hsw_8bit+0x11c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 197,249,110,208 // vmovd %eax,%xmm2 - .byte 235,179 // jmp 22adf <_sk_load_a8_dst_hsw_8bit+0x23> + .byte 235,179 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2 .byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax .byte 197,249,110,216 // vmovd %eax,%xmm3 .byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2 - .byte 235,150 // jmp 22adf <_sk_load_a8_dst_hsw_8bit+0x23> + .byte 235,150 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3 .byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2 - .byte 233,105,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23> + .byte 233,105,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3 .byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2 - .byte 233,60,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23> + .byte 233,60,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2 @@ -51159,7 +51690,7 @@ _sk_load_a8_dst_hsw_8bit: .byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3 .byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3 .byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2 - .byte 233,7,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23> + .byte 233,7,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23> .byte 73,255 // rex.WB (bad) .byte 255 // (bad) .byte 255,96,255 // jmpq *-0x1(%rax) @@ -51169,7 +51700,7 @@ _sk_load_a8_dst_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 125,255 // jge 22bed <_sk_load_a8_dst_hsw_8bit+0x131> + .byte 125,255 // jge 231bd <_sk_load_a8_dst_hsw_8bit+0x131> .byte 255 // (bad) .byte 255,113,255 // pushq -0x1(%rcx) .byte 255 // (bad) @@ -51205,49 +51736,49 @@ _sk_store_a8_hsw_8bit: .byte 72,99,87,8 // movslq 0x8(%rdi),%rdx .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx - .byte 197,253,111,37,76,136,0,0 // vmovdqa 0x884c(%rip),%ymm4 # 2b480 <_sk_overlay_sse2_8bit+0xabf> + .byte 197,253,111,37,124,136,0,0 // vmovdqa 0x887c(%rip),%ymm4 # 2ba80 <_sk_overlay_sse2_8bit+0xacb> .byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5 .byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5 - .byte 197,249,111,53,73,146,0,0 // vmovdqa 0x9249(%rip),%xmm6 # 2be90 <_sk_overlay_sse2_8bit+0x14cf> + .byte 197,249,111,53,121,146,0,0 // vmovdqa 0x9279(%rip),%xmm6 # 2c490 <_sk_overlay_sse2_8bit+0x14db> .byte 196,226,81,0,238 // vpshufb %xmm6,%xmm5,%xmm5 .byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4 .byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4 .byte 196,226,89,0,230 // vpshufb %xmm6,%xmm4,%xmm4 .byte 197,217,108,229 // vpunpcklqdq %xmm5,%xmm4,%xmm4 .byte 77,133,201 // test %r9,%r9 - .byte 117,10 // jne 22c6f <_sk_store_a8_hsw_8bit+0x5b> + .byte 117,10 // jne 2323f <_sk_store_a8_hsw_8bit+0x5b> .byte 196,161,122,127,36,2 // vmovdqu %xmm4,(%rdx,%r8,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 65,128,225,15 // and $0xf,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,239 // ja 22c6b <_sk_store_a8_hsw_8bit+0x57> + .byte 119,239 // ja 2323b <_sk_store_a8_hsw_8bit+0x57> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 22d10 <_sk_store_a8_hsw_8bit+0xfc> + .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 232e0 <_sk_store_a8_hsw_8bit+0xfc> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,163,121,20,36,2,0 // vpextrb $0x0,%xmm4,(%rdx,%r8,1) - .byte 235,210 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57> + .byte 235,210 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57> .byte 196,163,121,20,100,2,2,2 // vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1) .byte 196,163,121,21,36,2,0 // vpextrw $0x0,%xmm4,(%rdx,%r8,1) - .byte 235,193 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57> + .byte 235,193 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57> .byte 196,163,121,20,100,2,6,6 // vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1) .byte 196,163,121,20,100,2,5,5 // vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1) .byte 196,163,121,20,100,2,4,4 // vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1) .byte 196,161,121,126,36,2 // vmovd %xmm4,(%rdx,%r8,1) - .byte 235,161 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57> + .byte 235,161 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57> .byte 196,163,121,20,100,2,10,10 // vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1) .byte 196,163,121,20,100,2,9,9 // vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1) .byte 196,163,121,20,100,2,8,8 // vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1) - .byte 235,32 // jmp 22d04 <_sk_store_a8_hsw_8bit+0xf0> + .byte 235,32 // jmp 232d4 <_sk_store_a8_hsw_8bit+0xf0> .byte 196,163,121,20,100,2,14,14 // vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1) .byte 196,163,121,20,100,2,13,13 // vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1) .byte 196,163,121,20,100,2,12,12 // vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1) .byte 196,163,121,22,100,2,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1) .byte 196,161,121,214,36,2 // vmovq %xmm4,(%rdx,%r8,1) - .byte 233,92,255,255,255 // jmpq 22c6b <_sk_store_a8_hsw_8bit+0x57> + .byte 233,92,255,255,255 // jmpq 2323b <_sk_store_a8_hsw_8bit+0x57> .byte 144 // nop .byte 128,255,255 // cmp $0xff,%bh .byte 255,145,255,255,255,137 // callq *-0x76000001(%rcx) @@ -51295,15 +51826,15 @@ _sk_load_g8_hsw_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,61 // jne 22da6 <_sk_load_g8_hsw_8bit+0x5a> + .byte 117,61 // jne 23376 <_sk_load_g8_hsw_8bit+0x5a> .byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0 .byte 196,226,125,49,200 // vpmovzxbd %xmm0,%ymm1 .byte 197,249,112,192,78 // vpshufd $0x4e,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 - .byte 196,226,125,88,37,13,130,0,0 // vpbroadcastd 0x820d(%rip),%ymm4 # 2af94 <_sk_overlay_sse2_8bit+0x5d3> + .byte 196,226,125,88,37,49,130,0,0 // vpbroadcastd 0x8231(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3> .byte 196,226,125,64,236 // vpmulld %ymm4,%ymm0,%ymm5 .byte 196,226,117,64,196 // vpmulld %ymm4,%ymm1,%ymm0 - .byte 196,226,125,88,13,254,129,0,0 // vpbroadcastd 0x81fe(%rip),%ymm1 # 2af98 <_sk_overlay_sse2_8bit+0x5d7> + .byte 196,226,125,88,13,34,130,0,0 // vpbroadcastd 0x8222(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x5d7> .byte 197,253,235,193 // vpor %ymm1,%ymm0,%ymm0 .byte 197,213,235,201 // vpor %ymm1,%ymm5,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -51312,35 +51843,35 @@ _sk_load_g8_hsw_8bit: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,184 // ja 22d6f <_sk_load_g8_hsw_8bit+0x23> + .byte 119,184 // ja 2333f <_sk_load_g8_hsw_8bit+0x23> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 22e88 <_sk_load_g8_hsw_8bit+0x13c> + .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23458 <_sk_load_g8_hsw_8bit+0x13c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,153 // jmp 22d6f <_sk_load_g8_hsw_8bit+0x23> + .byte 235,153 // jmp 2333f <_sk_load_g8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0 .byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,121,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23> + .byte 233,121,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,76,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23> + .byte 233,76,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,31,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23> + .byte 233,31,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0 .byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0 @@ -51348,7 +51879,7 @@ _sk_load_g8_hsw_8bit: .byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1 .byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1 .byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0 - .byte 233,234,254,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23> + .byte 233,234,254,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23> .byte 15,31,0 // nopl (%rax) .byte 67,255 // rex.XB (bad) .byte 255 // (bad) @@ -51360,7 +51891,7 @@ _sk_load_g8_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 122,255 // jp 22e9d <_sk_load_g8_hsw_8bit+0x151> + .byte 122,255 // jp 2346d <_sk_load_g8_hsw_8bit+0x151> .byte 255 // (bad) .byte 255,110,255 // ljmp *-0x1(%rsi) .byte 255 // (bad) @@ -51396,15 +51927,15 @@ _sk_load_g8_dst_hsw_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,61 // jne 22f1e <_sk_load_g8_dst_hsw_8bit+0x5a> + .byte 117,61 // jne 234ee <_sk_load_g8_dst_hsw_8bit+0x5a> .byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2 .byte 196,226,125,49,218 // vpmovzxbd %xmm2,%ymm3 .byte 197,249,112,210,78 // vpshufd $0x4e,%xmm2,%xmm2 .byte 196,226,125,49,210 // vpmovzxbd %xmm2,%ymm2 - .byte 196,226,125,88,37,149,128,0,0 // vpbroadcastd 0x8095(%rip),%ymm4 # 2af94 <_sk_overlay_sse2_8bit+0x5d3> + .byte 196,226,125,88,37,185,128,0,0 // vpbroadcastd 0x80b9(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3> .byte 196,226,109,64,236 // vpmulld %ymm4,%ymm2,%ymm5 .byte 196,226,101,64,212 // vpmulld %ymm4,%ymm3,%ymm2 - .byte 196,226,125,88,29,134,128,0,0 // vpbroadcastd 0x8086(%rip),%ymm3 # 2af98 <_sk_overlay_sse2_8bit+0x5d7> + .byte 196,226,125,88,29,170,128,0,0 // vpbroadcastd 0x80aa(%rip),%ymm3 # 2b58c <_sk_overlay_sse2_8bit+0x5d7> .byte 197,237,235,211 // vpor %ymm3,%ymm2,%ymm2 .byte 197,213,235,219 // vpor %ymm3,%ymm5,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -51413,35 +51944,35 @@ _sk_load_g8_dst_hsw_8bit: .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,184 // ja 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23> + .byte 119,184 // ja 234b7 <_sk_load_g8_dst_hsw_8bit+0x23> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23000 <_sk_load_g8_dst_hsw_8bit+0x13c> + .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 235d0 <_sk_load_g8_dst_hsw_8bit+0x13c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 197,249,110,208 // vmovd %eax,%xmm2 - .byte 235,153 // jmp 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23> + .byte 235,153 // jmp 234b7 <_sk_load_g8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2 .byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax .byte 197,249,110,216 // vmovd %eax,%xmm3 .byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2 - .byte 233,121,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23> + .byte 233,121,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3 .byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2 - .byte 233,76,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23> + .byte 233,76,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3 .byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2 - .byte 233,31,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23> + .byte 233,31,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23> .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2 .byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2 .byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2 @@ -51449,7 +51980,7 @@ _sk_load_g8_dst_hsw_8bit: .byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3 .byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3 .byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2 - .byte 233,234,254,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23> + .byte 233,234,254,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23> .byte 15,31,0 // nopl (%rax) .byte 67,255 // rex.XB (bad) .byte 255 // (bad) @@ -51461,7 +51992,7 @@ _sk_load_g8_dst_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 122,255 // jp 23015 <_sk_load_g8_dst_hsw_8bit+0x151> + .byte 122,255 // jp 235e5 <_sk_load_g8_dst_hsw_8bit+0x151> .byte 255 // (bad) .byte 255,110,255 // ljmp *-0x1(%rsi) .byte 255 // (bad) @@ -51498,10 +52029,10 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,222,0,0,0 // jne 2313f <_sk_srcover_rgba_8888_hsw_8bit+0x103> + .byte 15,133,222,0,0,0 // jne 2370f <_sk_srcover_rgba_8888_hsw_8bit+0x103> .byte 196,33,126,111,76,138,32 // vmovdqu 0x20(%rdx,%r9,4),%ymm9 .byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11 - .byte 197,253,111,53,42,132,0,0 // vmovdqa 0x842a(%rip),%ymm6 # 2b4a0 <_sk_overlay_sse2_8bit+0xadf> + .byte 197,253,111,53,90,132,0,0 // vmovdqa 0x845a(%rip),%ymm6 # 2baa0 <_sk_overlay_sse2_8bit+0xaeb> .byte 196,226,117,0,254 // vpshufb %ymm6,%ymm1,%ymm7 .byte 196,226,125,0,246 // vpshufb %ymm6,%ymm0,%ymm6 .byte 196,66,125,48,195 // vpmovzxbw %xmm11,%ymm8 @@ -51539,7 +52070,7 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 197,221,252,224 // vpaddb %ymm0,%ymm4,%ymm4 .byte 197,213,252,233 // vpaddb %ymm1,%ymm5,%ymm5 .byte 77,133,192 // test %r8,%r8 - .byte 117,72 // jne 23176 <_sk_srcover_rgba_8888_hsw_8bit+0x13a> + .byte 117,72 // jne 23746 <_sk_srcover_rgba_8888_hsw_8bit+0x13a> .byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4) .byte 196,161,126,127,108,138,32 // vmovdqu %ymm5,0x20(%rdx,%r9,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -51550,25 +52081,25 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 196,65,37,239,219 // vpxor %ymm11,%ymm11,%ymm11 .byte 254,200 // dec %al .byte 60,14 // cmp $0xe,%al - .byte 15,135,22,255,255,255 // ja 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32> + .byte 15,135,22,255,255,255 // ja 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32> .byte 15,182,192 // movzbl %al,%eax - .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 2334c <_sk_srcover_rgba_8888_hsw_8bit+0x310> + .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 2391c <_sk_srcover_rgba_8888_hsw_8bit+0x310> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,33,121,110,28,138 // vmovd (%rdx,%r9,4),%xmm11 - .byte 233,248,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32> + .byte 233,248,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32> .byte 65,128,224,15 // and $0xf,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,14 // cmp $0xe,%r8b - .byte 119,184 // ja 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff> + .byte 119,184 // ja 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff> .byte 65,15,182,192 // movzbl %r8b,%eax - .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23388 <_sk_srcover_rgba_8888_hsw_8bit+0x34c> + .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23958 <_sk_srcover_rgba_8888_hsw_8bit+0x34c> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 196,161,121,126,36,138 // vmovd %xmm4,(%rdx,%r9,4) - .byte 235,156 // jmp 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff> + .byte 235,156 // jmp 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff> .byte 196,161,121,110,100,138,8 // vmovd 0x8(%rdx,%r9,4),%xmm4 .byte 196,226,121,89,236 // vpbroadcastq %xmm4,%xmm5 .byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9 @@ -51576,7 +52107,7 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 196,162,121,53,52,138 // vpmovzxdq (%rdx,%r9,4),%xmm6 .byte 197,249,112,246,232 // vpshufd $0xe8,%xmm6,%xmm6 .byte 196,99,37,2,222,3 // vpblendd $0x3,%ymm6,%ymm11,%ymm11 - .byte 233,162,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32> + .byte 233,162,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32> .byte 196,161,121,110,100,138,24 // vmovd 0x18(%rdx,%r9,4),%xmm4 .byte 196,226,125,89,236 // vpbroadcastq %xmm4,%ymm5 .byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9 @@ -51589,7 +52120,7 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 196,99,37,56,222,1 // vinserti128 $0x1,%xmm6,%ymm11,%ymm11 .byte 196,161,122,111,52,138 // vmovdqu (%rdx,%r9,4),%xmm6 .byte 196,67,77,2,219,240 // vpblendd $0xf0,%ymm11,%ymm6,%ymm11 - .byte 233,82,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32> + .byte 233,82,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32> .byte 196,161,121,110,100,138,40 // vmovd 0x28(%rdx,%r9,4),%xmm4 .byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 @@ -51598,7 +52129,7 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 196,99,53,2,205,15 // vpblendd $0xf,%ymm5,%ymm9,%ymm9 .byte 196,161,121,110,108,138,32 // vmovd 0x20(%rdx,%r9,4),%xmm5 .byte 196,99,53,2,205,1 // vpblendd $0x1,%ymm5,%ymm9,%ymm9 - .byte 233,22,254,255,255 // jmpq 23068 <_sk_srcover_rgba_8888_hsw_8bit+0x2c> + .byte 233,22,254,255,255 // jmpq 23638 <_sk_srcover_rgba_8888_hsw_8bit+0x2c> .byte 196,161,121,110,100,138,56 // vmovd 0x38(%rdx,%r9,4),%xmm4 .byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 @@ -51612,10 +52143,10 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11 .byte 196,161,122,111,116,138,32 // vmovdqu 0x20(%rdx,%r9,4),%xmm6 .byte 196,67,77,2,201,240 // vpblendd $0xf0,%ymm9,%ymm6,%ymm9 - .byte 233,198,253,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32> + .byte 233,198,253,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32> .byte 196,163,121,22,100,138,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4) .byte 196,161,121,214,36,138 // vmovq %xmm4,(%rdx,%r9,4) - .byte 233,128,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff> + .byte 233,128,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff> .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5 .byte 196,163,121,22,108,138,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4) .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5 @@ -51623,12 +52154,12 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5 .byte 196,161,121,126,108,138,16 // vmovd %xmm5,0x10(%rdx,%r9,4) .byte 196,161,122,127,36,138 // vmovdqu %xmm4,(%rdx,%r9,4) - .byte 233,76,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff> + .byte 233,76,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff> .byte 196,163,121,22,108,138,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4) .byte 196,163,121,22,108,138,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4) .byte 196,161,121,126,108,138,32 // vmovd %xmm5,0x20(%rdx,%r9,4) .byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4) - .byte 233,42,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff> + .byte 233,42,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff> .byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6 .byte 196,163,121,22,116,138,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4) .byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6 @@ -51637,7 +52168,7 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 196,161,121,126,116,138,48 // vmovd %xmm6,0x30(%rdx,%r9,4) .byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4) .byte 196,161,122,127,108,138,32 // vmovdqu %xmm5,0x20(%rdx,%r9,4) - .byte 233,239,253,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff> + .byte 233,239,253,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff> .byte 31 // (bad) .byte 254 // (bad) .byte 255 // (bad) @@ -51687,7 +52218,7 @@ _sk_srcover_rgba_8888_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 126,255 // jle 233a5 <_sk_srcover_rgba_8888_hsw_8bit+0x369> + .byte 126,255 // jle 23975 <_sk_srcover_rgba_8888_hsw_8bit+0x369> .byte 255 // (bad) .byte 255,119,255 // pushq -0x1(%rdi) .byte 255 // (bad) @@ -51709,7 +52240,7 @@ FUNCTION(_sk_scale_1_float_hsw_8bit) _sk_scale_1_float_hsw_8bit: .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,250,16,32 // vmovss (%rax),%xmm4 - .byte 197,218,89,37,94,122,0,0 // vmulss 0x7a5e(%rip),%xmm4,%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 197,218,89,37,130,122,0,0 // vmulss 0x7a82(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 197,250,44,196 // vcvttss2si %xmm4,%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 .byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4 @@ -51719,7 +52250,7 @@ _sk_scale_1_float_hsw_8bit: .byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6 .byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1 .byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1 - .byte 197,221,219,37,185,128,0,0 // vpand 0x80b9(%rip),%ymm4,%ymm4 # 2b4c0 <_sk_overlay_sse2_8bit+0xaff> + .byte 197,221,219,37,233,128,0,0 // vpand 0x80e9(%rip),%ymm4,%ymm4 # 2bac0 <_sk_overlay_sse2_8bit+0xb0b> .byte 197,221,213,249 // vpmullw %ymm1,%ymm4,%ymm7 .byte 197,93,213,198 // vpmullw %ymm6,%ymm4,%ymm8 .byte 197,93,213,200 // vpmullw %ymm0,%ymm4,%ymm9 @@ -51753,12 +52284,12 @@ _sk_scale_u8_hsw_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 15,133,191,0,0,0 // jne 2353f <_sk_scale_u8_hsw_8bit+0xe0> + .byte 15,133,191,0,0,0 // jne 23b0f <_sk_scale_u8_hsw_8bit+0xe0> .byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4 .byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5 .byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4 .byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4 - .byte 197,253,111,53,67,128,0,0 // vmovdqa 0x8043(%rip),%ymm6 # 2b4e0 <_sk_overlay_sse2_8bit+0xb1f> + .byte 197,253,111,53,115,128,0,0 // vmovdqa 0x8073(%rip),%ymm6 # 2bae0 <_sk_overlay_sse2_8bit+0xb2b> .byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4 .byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5 .byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6 @@ -51797,35 +52328,35 @@ _sk_scale_u8_hsw_8bit: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 15,135,50,255,255,255 // ja 23486 <_sk_scale_u8_hsw_8bit+0x27> + .byte 15,135,50,255,255,255 // ja 23a56 <_sk_scale_u8_hsw_8bit+0x27> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23628 <_sk_scale_u8_hsw_8bit+0x1c9> + .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23bf8 <_sk_scale_u8_hsw_8bit+0x1c9> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 233,16,255,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27> + .byte 233,16,255,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4 .byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax .byte 197,249,110,232 // vmovd %eax,%xmm5 .byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,240,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27> + .byte 233,240,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5 .byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,195,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27> + .byte 233,195,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5 .byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4 - .byte 233,150,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27> + .byte 233,150,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4 @@ -51833,7 +52364,7 @@ _sk_scale_u8_hsw_8bit: .byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5 .byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5 .byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4 - .byte 233,97,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27> + .byte 233,97,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27> .byte 15,31,0 // nopl (%rax) .byte 64,255 // rex (bad) .byte 255 // (bad) @@ -51845,7 +52376,7 @@ _sk_scale_u8_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 122,255 // jp 2363d <_sk_scale_u8_hsw_8bit+0x1de> + .byte 122,255 // jp 23c0d <_sk_scale_u8_hsw_8bit+0x1de> .byte 255 // (bad) .byte 255,110,255 // ljmp *-0x1(%rsi) .byte 255 // (bad) @@ -51875,7 +52406,7 @@ FUNCTION(_sk_lerp_1_float_hsw_8bit) _sk_lerp_1_float_hsw_8bit: .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,250,16,32 // vmovss (%rax),%xmm4 - .byte 197,218,89,37,190,119,0,0 // vmulss 0x77be(%rip),%xmm4,%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 197,218,89,37,226,119,0,0 // vmulss 0x77e2(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 197,250,44,196 // vcvttss2si %xmm4,%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 .byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4 @@ -51885,7 +52416,7 @@ _sk_lerp_1_float_hsw_8bit: .byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6 .byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1 .byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1 - .byte 197,221,219,61,89,126,0,0 // vpand 0x7e59(%rip),%ymm4,%ymm7 # 2b500 <_sk_overlay_sse2_8bit+0xb3f> + .byte 197,221,219,61,137,126,0,0 // vpand 0x7e89(%rip),%ymm4,%ymm7 # 2bb00 <_sk_overlay_sse2_8bit+0xb4b> .byte 197,69,213,193 // vpmullw %ymm1,%ymm7,%ymm8 .byte 197,69,213,206 // vpmullw %ymm6,%ymm7,%ymm9 .byte 197,69,213,208 // vpmullw %ymm0,%ymm7,%ymm10 @@ -51950,12 +52481,12 @@ _sk_lerp_u8_hsw_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 15,133,106,1,0,0 // jne 2391f <_sk_lerp_u8_hsw_8bit+0x18b> + .byte 15,133,106,1,0,0 // jne 23eef <_sk_lerp_u8_hsw_8bit+0x18b> .byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4 .byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5 .byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4 .byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4 - .byte 197,253,111,53,78,125,0,0 // vmovdqa 0x7d4e(%rip),%ymm6 # 2b520 <_sk_overlay_sse2_8bit+0xb5f> + .byte 197,253,111,53,126,125,0,0 // vmovdqa 0x7d7e(%rip),%ymm6 # 2bb20 <_sk_overlay_sse2_8bit+0xb6b> .byte 196,98,93,0,206 // vpshufb %ymm6,%ymm4,%ymm9 .byte 196,98,85,0,222 // vpshufb %ymm6,%ymm5,%ymm11 .byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6 @@ -52029,35 +52560,35 @@ _sk_lerp_u8_hsw_8bit: .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 15,135,135,254,255,255 // ja 237bb <_sk_lerp_u8_hsw_8bit+0x27> + .byte 15,135,135,254,255,255 // ja 23d8b <_sk_lerp_u8_hsw_8bit+0x27> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23a08 <_sk_lerp_u8_hsw_8bit+0x274> + .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23fd8 <_sk_lerp_u8_hsw_8bit+0x274> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 197,249,110,224 // vmovd %eax,%xmm4 - .byte 233,101,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27> + .byte 233,101,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4 .byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax .byte 197,249,110,232 // vmovd %eax,%xmm5 .byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,69,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27> + .byte 233,69,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5 .byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4 - .byte 233,24,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27> + .byte 233,24,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5 .byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4 - .byte 233,235,253,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27> + .byte 233,235,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27> .byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4 .byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4 .byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4 @@ -52065,7 +52596,7 @@ _sk_lerp_u8_hsw_8bit: .byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5 .byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5 .byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4 - .byte 233,182,253,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27> + .byte 233,182,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27> .byte 15,31,0 // nopl (%rax) .byte 64,255 // rex (bad) .byte 255 // (bad) @@ -52077,7 +52608,7 @@ _sk_lerp_u8_hsw_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 122,255 // jp 23a1d <_sk_lerp_u8_hsw_8bit+0x289> + .byte 122,255 // jp 23fed <_sk_lerp_u8_hsw_8bit+0x289> .byte 255 // (bad) .byte 255,110,255 // ljmp *-0x1(%rsi) .byte 255 // (bad) @@ -52124,7 +52655,7 @@ HIDDEN _sk_black_color_hsw_8bit FUNCTION(_sk_black_color_hsw_8bit) _sk_black_color_hsw_8bit: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,49,117,0,0 // vbroadcastss 0x7531(%rip),%ymm0 # 2af98 <_sk_overlay_sse2_8bit+0x5d7> + .byte 196,226,125,24,5,85,117,0,0 // vbroadcastss 0x7555(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x5d7> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 255,224 // jmpq *%rax @@ -52150,7 +52681,7 @@ HIDDEN _sk_srcatop_hsw_8bit .globl _sk_srcatop_hsw_8bit FUNCTION(_sk_srcatop_hsw_8bit) _sk_srcatop_hsw_8bit: - .byte 197,125,111,5,179,122,0,0 // vmovdqa 0x7ab3(%rip),%ymm8 # 2b540 <_sk_overlay_sse2_8bit+0xb7f> + .byte 197,125,111,5,227,122,0,0 // vmovdqa 0x7ae3(%rip),%ymm8 # 2bb40 <_sk_overlay_sse2_8bit+0xb8b> .byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4 .byte 196,194,109,0,232 // vpshufb %ymm8,%ymm2,%ymm5 .byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10 @@ -52227,7 +52758,7 @@ HIDDEN _sk_dstatop_hsw_8bit .globl _sk_dstatop_hsw_8bit FUNCTION(_sk_dstatop_hsw_8bit) _sk_dstatop_hsw_8bit: - .byte 197,125,111,5,110,121,0,0 // vmovdqa 0x796e(%rip),%ymm8 # 2b560 <_sk_overlay_sse2_8bit+0xb9f> + .byte 197,125,111,5,158,121,0,0 // vmovdqa 0x799e(%rip),%ymm8 # 2bb60 <_sk_overlay_sse2_8bit+0xbab> .byte 196,194,117,0,224 // vpshufb %ymm8,%ymm1,%ymm4 .byte 196,194,125,0,232 // vpshufb %ymm8,%ymm0,%ymm5 .byte 196,98,125,48,210 // vpmovzxbw %xmm2,%ymm10 @@ -52304,7 +52835,7 @@ HIDDEN _sk_srcin_hsw_8bit .globl _sk_srcin_hsw_8bit FUNCTION(_sk_srcin_hsw_8bit) _sk_srcin_hsw_8bit: - .byte 197,253,111,37,37,120,0,0 // vmovdqa 0x7825(%rip),%ymm4 # 2b580 <_sk_overlay_sse2_8bit+0xbbf> + .byte 197,253,111,37,85,120,0,0 // vmovdqa 0x7855(%rip),%ymm4 # 2bb80 <_sk_overlay_sse2_8bit+0xbcb> .byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5 .byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4 .byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6 @@ -52344,7 +52875,7 @@ HIDDEN _sk_dstin_hsw_8bit .globl _sk_dstin_hsw_8bit FUNCTION(_sk_dstin_hsw_8bit) _sk_dstin_hsw_8bit: - .byte 197,253,111,37,155,119,0,0 // vmovdqa 0x779b(%rip),%ymm4 # 2b5a0 <_sk_overlay_sse2_8bit+0xbdf> + .byte 197,253,111,37,203,119,0,0 // vmovdqa 0x77cb(%rip),%ymm4 # 2bba0 <_sk_overlay_sse2_8bit+0xbeb> .byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1 .byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0 .byte 196,226,125,48,226 // vpmovzxbw %xmm2,%ymm4 @@ -52384,7 +52915,7 @@ HIDDEN _sk_srcout_hsw_8bit .globl _sk_srcout_hsw_8bit FUNCTION(_sk_srcout_hsw_8bit) _sk_srcout_hsw_8bit: - .byte 197,253,111,37,15,119,0,0 // vmovdqa 0x770f(%rip),%ymm4 # 2b5c0 <_sk_overlay_sse2_8bit+0xbff> + .byte 197,253,111,37,63,119,0,0 // vmovdqa 0x773f(%rip),%ymm4 # 2bbc0 <_sk_overlay_sse2_8bit+0xc0b> .byte 196,226,109,0,236 // vpshufb %ymm4,%ymm2,%ymm5 .byte 196,226,101,0,228 // vpshufb %ymm4,%ymm3,%ymm4 .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6 @@ -52427,7 +52958,7 @@ HIDDEN _sk_dstout_hsw_8bit .globl _sk_dstout_hsw_8bit FUNCTION(_sk_dstout_hsw_8bit) _sk_dstout_hsw_8bit: - .byte 197,253,111,37,121,118,0,0 // vmovdqa 0x7679(%rip),%ymm4 # 2b5e0 <_sk_overlay_sse2_8bit+0xc1f> + .byte 197,253,111,37,169,118,0,0 // vmovdqa 0x76a9(%rip),%ymm4 # 2bbe0 <_sk_overlay_sse2_8bit+0xc2b> .byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0 .byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1 .byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4 @@ -52470,7 +53001,7 @@ HIDDEN _sk_srcover_hsw_8bit .globl _sk_srcover_hsw_8bit FUNCTION(_sk_srcover_hsw_8bit) _sk_srcover_hsw_8bit: - .byte 197,253,111,37,225,117,0,0 // vmovdqa 0x75e1(%rip),%ymm4 # 2b600 <_sk_overlay_sse2_8bit+0xc3f> + .byte 197,253,111,37,17,118,0,0 // vmovdqa 0x7611(%rip),%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0xc4b> .byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5 .byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4 .byte 196,98,125,48,202 // vpmovzxbw %xmm2,%ymm9 @@ -52514,7 +53045,7 @@ HIDDEN _sk_dstover_hsw_8bit .globl _sk_dstover_hsw_8bit FUNCTION(_sk_dstover_hsw_8bit) _sk_dstover_hsw_8bit: - .byte 197,253,111,37,66,117,0,0 // vmovdqa 0x7542(%rip),%ymm4 # 2b620 <_sk_overlay_sse2_8bit+0xc5f> + .byte 197,253,111,37,114,117,0,0 // vmovdqa 0x7572(%rip),%ymm4 # 2bc20 <_sk_overlay_sse2_8bit+0xc6b> .byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5 .byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4 .byte 196,98,125,48,200 // vpmovzxbw %xmm0,%ymm9 @@ -52597,7 +53128,7 @@ FUNCTION(_sk_multiply_hsw_8bit) _sk_multiply_hsw_8bit: .byte 197,253,111,243 // vmovdqa %ymm3,%ymm6 .byte 197,253,111,218 // vmovdqa %ymm2,%ymm3 - .byte 197,125,111,13,3,116,0,0 // vmovdqa 0x7403(%rip),%ymm9 # 2b640 <_sk_overlay_sse2_8bit+0xc7f> + .byte 197,125,111,13,51,116,0,0 // vmovdqa 0x7433(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0xc8b> .byte 196,194,101,0,225 // vpshufb %ymm9,%ymm3,%ymm4 .byte 196,194,77,0,233 // vpshufb %ymm9,%ymm6,%ymm5 .byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10 @@ -52741,7 +53272,7 @@ HIDDEN _sk_xor__hsw_8bit .globl _sk_xor__hsw_8bit FUNCTION(_sk_xor__hsw_8bit) _sk_xor__hsw_8bit: - .byte 197,125,111,13,145,113,0,0 // vmovdqa 0x7191(%rip),%ymm9 # 2b660 <_sk_overlay_sse2_8bit+0xc9f> + .byte 197,125,111,13,193,113,0,0 // vmovdqa 0x71c1(%rip),%ymm9 # 2bc60 <_sk_overlay_sse2_8bit+0xcab> .byte 196,194,109,0,225 // vpshufb %ymm9,%ymm2,%ymm4 .byte 196,194,101,0,249 // vpshufb %ymm9,%ymm3,%ymm7 .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -52816,11 +53347,20 @@ _sk_xor__hsw_8bit: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_plus__hsw_8bit +.globl _sk_plus__hsw_8bit +FUNCTION(_sk_plus__hsw_8bit) +_sk_plus__hsw_8bit: + .byte 197,253,220,194 // vpaddusb %ymm2,%ymm0,%ymm0 + .byte 197,245,220,203 // vpaddusb %ymm3,%ymm1,%ymm1 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_darken_hsw_8bit .globl _sk_darken_hsw_8bit FUNCTION(_sk_darken_hsw_8bit) _sk_darken_hsw_8bit: - .byte 197,125,111,5,63,112,0,0 // vmovdqa 0x703f(%rip),%ymm8 # 2b680 <_sk_overlay_sse2_8bit+0xcbf> + .byte 197,125,111,5,99,112,0,0 // vmovdqa 0x7063(%rip),%ymm8 # 2bc80 <_sk_overlay_sse2_8bit+0xccb> .byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4 .byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6 .byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10 @@ -52893,7 +53433,7 @@ _sk_darken_hsw_8bit: .byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6 .byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1 .byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0 - .byte 196,226,125,88,37,236,103,0,0 // vpbroadcastd 0x67ec(%rip),%ymm4 # 2af9c <_sk_overlay_sse2_8bit+0x5db> + .byte 196,226,125,88,37,4,104,0,0 // vpbroadcastd 0x6804(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db> .byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0 .byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -52903,7 +53443,7 @@ HIDDEN _sk_lighten_hsw_8bit .globl _sk_lighten_hsw_8bit FUNCTION(_sk_lighten_hsw_8bit) _sk_lighten_hsw_8bit: - .byte 197,125,111,5,216,110,0,0 // vmovdqa 0x6ed8(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0xcdf> + .byte 197,125,111,5,252,110,0,0 // vmovdqa 0x6efc(%rip),%ymm8 # 2bca0 <_sk_overlay_sse2_8bit+0xceb> .byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4 .byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6 .byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10 @@ -52976,7 +53516,7 @@ _sk_lighten_hsw_8bit: .byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6 .byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1 .byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0 - .byte 196,226,125,88,37,101,102,0,0 // vpbroadcastd 0x6665(%rip),%ymm4 # 2af9c <_sk_overlay_sse2_8bit+0x5db> + .byte 196,226,125,88,37,125,102,0,0 // vpbroadcastd 0x667d(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db> .byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0 .byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -53016,7 +53556,7 @@ _sk_exclusion_hsw_8bit: .byte 196,227,77,56,252,1 // vinserti128 $0x1,%xmm4,%ymm6,%ymm7 .byte 196,227,77,70,228,49 // vperm2i128 $0x31,%ymm4,%ymm6,%ymm4 .byte 197,197,103,228 // vpackuswb %ymm4,%ymm7,%ymm4 - .byte 197,253,111,53,218,108,0,0 // vmovdqa 0x6cda(%rip),%ymm6 # 2b6c0 <_sk_overlay_sse2_8bit+0xcff> + .byte 197,253,111,53,254,108,0,0 // vmovdqa 0x6cfe(%rip),%ymm6 # 2bcc0 <_sk_overlay_sse2_8bit+0xd0b> .byte 197,221,219,254 // vpand %ymm6,%ymm4,%ymm7 .byte 197,213,219,246 // vpand %ymm6,%ymm5,%ymm6 .byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0 @@ -53032,7 +53572,7 @@ HIDDEN _sk_difference_hsw_8bit .globl _sk_difference_hsw_8bit FUNCTION(_sk_difference_hsw_8bit) _sk_difference_hsw_8bit: - .byte 197,125,111,5,206,108,0,0 // vmovdqa 0x6cce(%rip),%ymm8 # 2b6e0 <_sk_overlay_sse2_8bit+0xd1f> + .byte 197,125,111,5,242,108,0,0 // vmovdqa 0x6cf2(%rip),%ymm8 # 2bce0 <_sk_overlay_sse2_8bit+0xd2b> .byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4 .byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6 .byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10 @@ -53099,7 +53639,7 @@ _sk_difference_hsw_8bit: .byte 197,197,103,237 // vpackuswb %ymm5,%ymm7,%ymm5 .byte 197,181,218,228 // vpminub %ymm4,%ymm9,%ymm4 .byte 197,165,218,237 // vpminub %ymm5,%ymm11,%ymm5 - .byte 197,253,111,53,152,107,0,0 // vmovdqa 0x6b98(%rip),%ymm6 # 2b700 <_sk_overlay_sse2_8bit+0xd3f> + .byte 197,253,111,53,188,107,0,0 // vmovdqa 0x6bbc(%rip),%ymm6 # 2bd00 <_sk_overlay_sse2_8bit+0xd4b> .byte 197,213,219,254 // vpand %ymm6,%ymm5,%ymm7 .byte 197,221,219,246 // vpand %ymm6,%ymm4,%ymm6 .byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0 @@ -53125,7 +53665,7 @@ _sk_hardlight_hsw_8bit: .byte 196,227,125,57,203,1 // vextracti128 $0x1,%ymm1,%xmm3 .byte 196,98,125,48,195 // vpmovzxbw %xmm3,%ymm8 .byte 197,126,127,132,36,192,0,0,0 // vmovdqu %ymm8,0xc0(%rsp) - .byte 197,253,111,29,77,107,0,0 // vmovdqa 0x6b4d(%rip),%ymm3 # 2b720 <_sk_overlay_sse2_8bit+0xd5f> + .byte 197,253,111,29,113,107,0,0 // vmovdqa 0x6b71(%rip),%ymm3 # 2bd20 <_sk_overlay_sse2_8bit+0xd6b> .byte 196,226,125,0,227 // vpshufb %ymm3,%ymm0,%ymm4 .byte 196,226,117,0,203 // vpshufb %ymm3,%ymm1,%ymm1 .byte 197,125,111,251 // vmovdqa %ymm3,%ymm15 @@ -53154,7 +53694,7 @@ _sk_hardlight_hsw_8bit: .byte 196,65,125,111,231 // vmovdqa %ymm15,%ymm12 .byte 196,194,93,0,220 // vpshufb %ymm12,%ymm4,%ymm3 .byte 196,226,125,48,211 // vpmovzxbw %xmm3,%ymm2 - .byte 196,226,125,121,5,207,106,0,0 // vpbroadcastw 0x6acf(%rip),%ymm0 # 2b740 <_sk_overlay_sse2_8bit+0xd7f> + .byte 196,226,125,121,5,243,106,0,0 // vpbroadcastw 0x6af3(%rip),%ymm0 # 2bd40 <_sk_overlay_sse2_8bit+0xd8b> .byte 197,109,239,248 // vpxor %ymm0,%ymm2,%ymm15 .byte 197,133,213,207 // vpmullw %ymm7,%ymm15,%ymm1 .byte 197,254,127,140,36,32,1,0,0 // vmovdqu %ymm1,0x120(%rsp) @@ -53254,7 +53794,7 @@ _sk_hardlight_hsw_8bit: .byte 197,254,111,116,36,224 // vmovdqu -0x20(%rsp),%ymm6 .byte 197,205,253,52,36 // vpaddw (%rsp),%ymm6,%ymm6 .byte 196,193,53,253,252 // vpaddw %ymm12,%ymm9,%ymm7 - .byte 196,98,125,121,5,199,104,0,0 // vpbroadcastw 0x68c7(%rip),%ymm8 # 2b742 <_sk_overlay_sse2_8bit+0xd81> + .byte 196,98,125,121,5,235,104,0,0 // vpbroadcastw 0x68eb(%rip),%ymm8 # 2bd42 <_sk_overlay_sse2_8bit+0xd8d> .byte 196,193,93,253,224 // vpaddw %ymm8,%ymm4,%ymm4 .byte 197,229,253,220 // vpaddw %ymm4,%ymm3,%ymm3 .byte 196,193,85,253,224 // vpaddw %ymm8,%ymm5,%ymm4 @@ -53263,7 +53803,7 @@ _sk_hardlight_hsw_8bit: .byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1 .byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4 .byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0 - .byte 196,226,125,121,37,156,104,0,0 // vpbroadcastw 0x689c(%rip),%ymm4 # 2b744 <_sk_overlay_sse2_8bit+0xd83> + .byte 196,226,125,121,37,192,104,0,0 // vpbroadcastw 0x68c0(%rip),%ymm4 # 2bd44 <_sk_overlay_sse2_8bit+0xd8f> .byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0 .byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1 .byte 197,237,228,212 // vpmulhuw %ymm4,%ymm2,%ymm2 @@ -53290,7 +53830,7 @@ FUNCTION(_sk_overlay_hsw_8bit) _sk_overlay_hsw_8bit: .byte 72,129,236,152,1,0,0 // sub $0x198,%rsp .byte 197,252,17,140,36,64,1,0,0 // vmovups %ymm1,0x140(%rsp) - .byte 197,253,111,45,66,104,0,0 // vmovdqa 0x6842(%rip),%ymm5 # 2b760 <_sk_overlay_sse2_8bit+0xd9f> + .byte 197,253,111,45,102,104,0,0 // vmovdqa 0x6866(%rip),%ymm5 # 2bd60 <_sk_overlay_sse2_8bit+0xdab> .byte 197,253,111,226 // vmovdqa %ymm2,%ymm4 .byte 196,227,125,57,225,1 // vextracti128 $0x1,%ymm4,%xmm1 .byte 196,98,125,48,193 // vpmovzxbw %xmm1,%ymm8 @@ -53325,7 +53865,7 @@ _sk_overlay_hsw_8bit: .byte 197,93,117,251 // vpcmpeqw %ymm3,%ymm4,%ymm15 .byte 197,253,111,216 // vmovdqa %ymm0,%ymm3 .byte 196,226,125,48,227 // vpmovzxbw %xmm3,%ymm4 - .byte 196,226,125,121,5,156,103,0,0 // vpbroadcastw 0x679c(%rip),%ymm0 # 2b780 <_sk_overlay_sse2_8bit+0xdbf> + .byte 196,226,125,121,5,192,103,0,0 // vpbroadcastw 0x67c0(%rip),%ymm0 # 2bd80 <_sk_overlay_sse2_8bit+0xdcb> .byte 197,117,239,232 // vpxor %ymm0,%ymm1,%ymm13 .byte 197,21,213,212 // vpmullw %ymm4,%ymm13,%ymm10 .byte 197,126,127,148,36,192,0,0,0 // vmovdqu %ymm10,0xc0(%rsp) @@ -53426,7 +53966,7 @@ _sk_overlay_hsw_8bit: .byte 197,254,111,116,36,192 // vmovdqu -0x40(%rsp),%ymm6 .byte 197,205,253,116,36,224 // vpaddw -0x20(%rsp),%ymm6,%ymm6 .byte 196,193,29,253,253 // vpaddw %ymm13,%ymm12,%ymm7 - .byte 196,98,125,121,5,167,101,0,0 // vpbroadcastw 0x65a7(%rip),%ymm8 # 2b782 <_sk_overlay_sse2_8bit+0xdc1> + .byte 196,98,125,121,5,203,101,0,0 // vpbroadcastw 0x65cb(%rip),%ymm8 # 2bd82 <_sk_overlay_sse2_8bit+0xdcd> .byte 196,193,109,253,208 // vpaddw %ymm8,%ymm2,%ymm2 .byte 197,229,253,210 // vpaddw %ymm2,%ymm3,%ymm2 .byte 196,193,85,253,216 // vpaddw %ymm8,%ymm5,%ymm3 @@ -53435,7 +53975,7 @@ _sk_overlay_hsw_8bit: .byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1 .byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4 .byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0 - .byte 196,226,125,121,37,124,101,0,0 // vpbroadcastw 0x657c(%rip),%ymm4 # 2b784 <_sk_overlay_sse2_8bit+0xdc3> + .byte 196,226,125,121,37,160,101,0,0 // vpbroadcastw 0x65a0(%rip),%ymm4 # 2bd84 <_sk_overlay_sse2_8bit+0xdcf> .byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0 .byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1 .byte 197,229,228,220 // vpmulhuw %ymm4,%ymm3,%ymm3 @@ -53480,7 +54020,7 @@ _sk_start_pipeline_sse41_8bit: .byte 73,137,246 // mov %rsi,%r14 .byte 72,137,77,168 // mov %rcx,-0x58(%rbp) .byte 73,57,207 // cmp %rcx,%r15 - .byte 115,102 // jae 25301 <_sk_start_pipeline_sse41_8bit+0x95> + .byte 115,102 // jae 258dd <_sk_start_pipeline_sse41_8bit+0x95> .byte 72,139,69,208 // mov -0x30(%rbp),%rax .byte 72,141,64,8 // lea 0x8(%rax),%rax .byte 72,137,69,176 // mov %rax,-0x50(%rbp) @@ -53490,7 +54030,7 @@ _sk_start_pipeline_sse41_8bit: .byte 72,137,69,184 // mov %rax,-0x48(%rbp) .byte 76,137,125,192 // mov %r15,-0x40(%rbp) .byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp) - .byte 119,30 // ja 252e3 <_sk_start_pipeline_sse41_8bit+0x77> + .byte 119,30 // ja 258bf <_sk_start_pipeline_sse41_8bit+0x77> .byte 76,137,231 // mov %r12,%rdi .byte 76,137,246 // mov %r14,%rsi .byte 65,255,213 // callq *%r13 @@ -53499,17 +54039,17 @@ _sk_start_pipeline_sse41_8bit: .byte 72,137,69,184 // mov %rax,-0x48(%rbp) .byte 72,131,193,16 // add $0x10,%rcx .byte 72,57,217 // cmp %rbx,%rcx - .byte 118,226 // jbe 252c5 <_sk_start_pipeline_sse41_8bit+0x59> + .byte 118,226 // jbe 258a1 <_sk_start_pipeline_sse41_8bit+0x59> .byte 72,137,217 // mov %rbx,%rcx .byte 72,41,193 // sub %rax,%rcx - .byte 116,13 // je 252f8 <_sk_start_pipeline_sse41_8bit+0x8c> + .byte 116,13 // je 258d4 <_sk_start_pipeline_sse41_8bit+0x8c> .byte 72,137,77,200 // mov %rcx,-0x38(%rbp) .byte 76,137,231 // mov %r12,%rdi .byte 76,137,246 // mov %r14,%rsi .byte 65,255,213 // callq *%r13 .byte 73,255,199 // inc %r15 .byte 76,59,125,168 // cmp -0x58(%rbp),%r15 - .byte 117,170 // jne 252ab <_sk_start_pipeline_sse41_8bit+0x3f> + .byte 117,170 // jne 25887 <_sk_start_pipeline_sse41_8bit+0x3f> .byte 72,131,196,56 // add $0x38,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -53541,7 +54081,7 @@ HIDDEN _sk_set_rgb_sse41_8bit FUNCTION(_sk_set_rgb_sse41_8bit) _sk_set_rgb_sse41_8bit: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 243,15,16,37,1,91,0,0 // movss 0x5b01(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 243,15,16,37,25,91,0,0 // movss 0x5b19(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 243,15,16,40 // movss (%rax),%xmm5 .byte 243,15,89,236 // mulss %xmm4,%xmm5 .byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx @@ -53556,7 +54096,7 @@ _sk_set_rgb_sse41_8bit: .byte 9,208 // or %edx,%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4 - .byte 102,15,111,45,49,107,0,0 // movdqa 0x6b31(%rip),%xmm5 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,45,85,107,0,0 // movdqa 0x6b55(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,219,205 // pand %xmm5,%xmm1 .byte 102,15,219,197 // pand %xmm5,%xmm0 .byte 102,15,235,196 // por %xmm4,%xmm0 @@ -53570,12 +54110,12 @@ FUNCTION(_sk_premul_sse41_8bit) _sk_premul_sse41_8bit: .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,111,232 // movdqa %xmm0,%xmm5 - .byte 102,15,111,5,29,107,0,0 // movdqa 0x6b1d(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,5,65,107,0,0 // movdqa 0x6b41(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,15,111,253 // movdqa %xmm5,%xmm7 .byte 102,15,56,0,248 // pshufb %xmm0,%xmm7 .byte 102,15,111,244 // movdqa %xmm4,%xmm6 .byte 102,15,56,0,240 // pshufb %xmm0,%xmm6 - .byte 102,15,111,5,243,106,0,0 // movdqa 0x6af3(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,5,23,107,0,0 // movdqa 0x6b17(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,235,240 // por %xmm0,%xmm6 .byte 102,15,235,248 // por %xmm0,%xmm7 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 @@ -53608,7 +54148,7 @@ HIDDEN _sk_swap_rb_sse41_8bit .globl _sk_swap_rb_sse41_8bit FUNCTION(_sk_swap_rb_sse41_8bit) _sk_swap_rb_sse41_8bit: - .byte 102,15,111,37,144,106,0,0 // movdqa 0x6a90(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff> + .byte 102,15,111,37,180,106,0,0 // movdqa 0x6ab4(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b> .byte 102,15,56,0,196 // pshufb %xmm4,%xmm0 .byte 102,15,56,0,204 // pshufb %xmm4,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -53637,7 +54177,7 @@ _sk_load_8888_sse41_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,17 // jne 25480 <_sk_load_8888_sse41_8bit+0x32> + .byte 117,17 // jne 25a5c <_sk_load_8888_sse41_8bit+0x32> .byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1 .byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -53647,24 +54187,24 @@ _sk_load_8888_sse41_8bit: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,231 // ja 2547c <_sk_load_8888_sse41_8bit+0x2e> + .byte 119,231 // ja 25a58 <_sk_load_8888_sse41_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 254ec <_sk_load_8888_sse41_8bit+0x9e> + .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 25ac8 <_sk_load_8888_sse41_8bit+0x9e> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0 - .byte 235,203 // jmp 2547c <_sk_load_8888_sse41_8bit+0x2e> + .byte 235,203 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e> .byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 .byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4 .byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0 - .byte 235,177 // jmp 2547c <_sk_load_8888_sse41_8bit+0x2e> + .byte 235,177 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e> .byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0 .byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1 .byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1 .byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1 - .byte 235,139 // jmp 25476 <_sk_load_8888_sse41_8bit+0x28> + .byte 235,139 // jmp 25a52 <_sk_load_8888_sse41_8bit+0x28> .byte 144 // nop .byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp .byte 255 // (bad) @@ -53676,7 +54216,7 @@ _sk_load_8888_sse41_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 235,255 // jmp 25501 <_sk_load_8888_sse41_8bit+0xb3> + .byte 235,255 // jmp 25add <_sk_load_8888_sse41_8bit+0xb3> .byte 255 // (bad) .byte 255 // (bad) .byte 223,255 // (bad) @@ -53696,7 +54236,7 @@ _sk_load_8888_dst_sse41_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,17 // jne 2553a <_sk_load_8888_dst_sse41_8bit+0x32> + .byte 117,17 // jne 25b16 <_sk_load_8888_dst_sse41_8bit+0x32> .byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3 .byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax @@ -53706,24 +54246,24 @@ _sk_load_8888_dst_sse41_8bit: .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,231 // ja 25536 <_sk_load_8888_dst_sse41_8bit+0x2e> + .byte 119,231 // ja 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 255a8 <_sk_load_8888_dst_sse41_8bit+0xa0> + .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 25b84 <_sk_load_8888_dst_sse41_8bit+0xa0> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2 - .byte 235,203 // jmp 25536 <_sk_load_8888_dst_sse41_8bit+0x2e> + .byte 235,203 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e> .byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2 .byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2 .byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4 .byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2 - .byte 235,177 // jmp 25536 <_sk_load_8888_dst_sse41_8bit+0x2e> + .byte 235,177 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e> .byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2 .byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3 .byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3 .byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3 - .byte 235,139 // jmp 25530 <_sk_load_8888_dst_sse41_8bit+0x28> + .byte 235,139 // jmp 25b0c <_sk_load_8888_dst_sse41_8bit+0x28> .byte 15,31,0 // nopl (%rax) .byte 187,255,255,255,207 // mov $0xcfffffff,%ebx .byte 255 // (bad) @@ -53735,7 +54275,7 @@ _sk_load_8888_dst_sse41_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,221 // jmpq ffffffffde0255c0 <_sk_overlay_sse2_8bit+0xffffffffddffabff> + .byte 233,255,255,255,221 // jmpq ffffffffde025b9c <_sk_overlay_sse2_8bit+0xffffffffddffabe7> .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -53753,7 +54293,7 @@ _sk_store_8888_sse41_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,192 // test %r8,%r8 - .byte 117,17 // jne 255f6 <_sk_store_8888_sse41_8bit+0x32> + .byte 117,17 // jne 25bd2 <_sk_store_8888_sse41_8bit+0x32> .byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4) .byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -53761,22 +54301,22 @@ _sk_store_8888_sse41_8bit: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,239 // ja 255f2 <_sk_store_8888_sse41_8bit+0x2e> + .byte 119,239 // ja 25bce <_sk_store_8888_sse41_8bit+0x2e> .byte 65,15,182,192 // movzbl %r8b,%eax - .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 25654 <_sk_store_8888_sse41_8bit+0x90> + .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 25c30 <_sk_store_8888_sse41_8bit+0x90> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4) - .byte 235,211 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e> + .byte 235,211 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e> .byte 102,66,15,58,22,68,138,8,2 // pextrd $0x2,%xmm0,0x8(%rdx,%r9,4) .byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4) - .byte 235,194 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e> + .byte 235,194 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e> .byte 102,66,15,58,22,76,138,24,2 // pextrd $0x2,%xmm1,0x18(%rdx,%r9,4) .byte 102,66,15,58,22,76,138,20,1 // pextrd $0x1,%xmm1,0x14(%rdx,%r9,4) .byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4) .byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4) - .byte 235,161 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e> + .byte 235,161 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e> .byte 15,31,0 // nopl (%rax) .byte 195 // retq .byte 255 // (bad) @@ -53815,10 +54355,10 @@ _sk_load_bgra_sse41_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,35 // jne 256b4 <_sk_load_bgra_sse41_8bit+0x44> + .byte 117,35 // jne 25c90 <_sk_load_bgra_sse41_8bit+0x44> .byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1 .byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0 - .byte 102,15,111,37,26,104,0,0 // movdqa 0x681a(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff> + .byte 102,15,111,37,62,104,0,0 // movdqa 0x683e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b> .byte 102,15,56,0,196 // pshufb %xmm4,%xmm0 .byte 102,15,56,0,204 // pshufb %xmm4,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -53828,24 +54368,24 @@ _sk_load_bgra_sse41_8bit: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,213 // ja 2569e <_sk_load_bgra_sse41_8bit+0x2e> + .byte 119,213 // ja 25c7a <_sk_load_bgra_sse41_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25724 <_sk_load_bgra_sse41_8bit+0xb4> + .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25d00 <_sk_load_bgra_sse41_8bit+0xb4> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0 - .byte 235,185 // jmp 2569e <_sk_load_bgra_sse41_8bit+0x2e> + .byte 235,185 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e> .byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 .byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4 .byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0 - .byte 235,159 // jmp 2569e <_sk_load_bgra_sse41_8bit+0x2e> + .byte 235,159 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e> .byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0 .byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1 .byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1 .byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1 - .byte 233,118,255,255,255 // jmpq 25698 <_sk_load_bgra_sse41_8bit+0x28> + .byte 233,118,255,255,255 // jmpq 25c74 <_sk_load_bgra_sse41_8bit+0x28> .byte 102,144 // xchg %ax,%ax .byte 185,255,255,255,205 // mov $0xcdffffff,%ecx .byte 255 // (bad) @@ -53878,10 +54418,10 @@ _sk_load_bgra_dst_sse41_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,35 // jne 25784 <_sk_load_bgra_dst_sse41_8bit+0x44> + .byte 117,35 // jne 25d60 <_sk_load_bgra_dst_sse41_8bit+0x44> .byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3 .byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2 - .byte 102,15,111,37,74,103,0,0 // movdqa 0x674a(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff> + .byte 102,15,111,37,110,103,0,0 // movdqa 0x676e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b> .byte 102,15,56,0,212 // pshufb %xmm4,%xmm2 .byte 102,15,56,0,220 // pshufb %xmm4,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -53891,24 +54431,24 @@ _sk_load_bgra_dst_sse41_8bit: .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,213 // ja 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e> + .byte 119,213 // ja 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 257f4 <_sk_load_bgra_dst_sse41_8bit+0xb4> + .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25dd0 <_sk_load_bgra_dst_sse41_8bit+0xb4> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2 - .byte 235,185 // jmp 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e> + .byte 235,185 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e> .byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2 .byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2 .byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4 .byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2 - .byte 235,159 // jmp 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e> + .byte 235,159 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e> .byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2 .byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3 .byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3 .byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3 - .byte 233,118,255,255,255 // jmpq 25768 <_sk_load_bgra_dst_sse41_8bit+0x28> + .byte 233,118,255,255,255 // jmpq 25d44 <_sk_load_bgra_dst_sse41_8bit+0x28> .byte 102,144 // xchg %ax,%ax .byte 185,255,255,255,205 // mov $0xcdffffff,%ecx .byte 255 // (bad) @@ -53940,13 +54480,13 @@ _sk_store_bgra_sse41_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx - .byte 102,15,111,53,140,102,0,0 // movdqa 0x668c(%rip),%xmm6 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff> + .byte 102,15,111,53,176,102,0,0 // movdqa 0x66b0(%rip),%xmm6 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b> .byte 102,15,111,233 // movdqa %xmm1,%xmm5 .byte 102,15,56,0,238 // pshufb %xmm6,%xmm5 .byte 102,15,111,224 // movdqa %xmm0,%xmm4 .byte 102,15,56,0,230 // pshufb %xmm6,%xmm4 .byte 77,133,192 // test %r8,%r8 - .byte 117,17 // jne 2585c <_sk_store_bgra_sse41_8bit+0x4c> + .byte 117,17 // jne 25e38 <_sk_store_bgra_sse41_8bit+0x4c> .byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4) .byte 243,66,15,127,108,138,16 // movdqu %xmm5,0x10(%rdx,%r9,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -53954,22 +54494,22 @@ _sk_store_bgra_sse41_8bit: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,239 // ja 25858 <_sk_store_bgra_sse41_8bit+0x48> + .byte 119,239 // ja 25e34 <_sk_store_bgra_sse41_8bit+0x48> .byte 65,15,182,192 // movzbl %r8b,%eax - .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 258b8 <_sk_store_bgra_sse41_8bit+0xa8> + .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 25e94 <_sk_store_bgra_sse41_8bit+0xa8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,126,36,138 // movd %xmm4,(%rdx,%r9,4) - .byte 235,211 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48> + .byte 235,211 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48> .byte 102,66,15,58,22,100,138,8,2 // pextrd $0x2,%xmm4,0x8(%rdx,%r9,4) .byte 102,66,15,214,36,138 // movq %xmm4,(%rdx,%r9,4) - .byte 235,194 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48> + .byte 235,194 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48> .byte 102,66,15,58,22,108,138,24,2 // pextrd $0x2,%xmm5,0x18(%rdx,%r9,4) .byte 102,66,15,58,22,108,138,20,1 // pextrd $0x1,%xmm5,0x14(%rdx,%r9,4) .byte 102,66,15,126,108,138,16 // movd %xmm5,0x10(%rdx,%r9,4) .byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4) - .byte 235,161 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48> + .byte 235,161 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48> .byte 144 // nop .byte 197,255,255 // (bad) .byte 255,214 // callq *%rsi @@ -54004,9 +54544,9 @@ _sk_load_a8_sse41_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,42 // jne 2591b <_sk_load_a8_sse41_8bit+0x47> + .byte 117,42 // jne 25ef7 <_sk_load_a8_sse41_8bit+0x47> .byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1 - .byte 102,15,219,13,144,94,0,0 // pand 0x5e90(%rip),%xmm1 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,13,180,94,0,0 // pand 0x5eb4(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 102,15,105,204 // punpckhwd %xmm4,%xmm1 @@ -54018,15 +54558,15 @@ _sk_load_a8_sse41_8bit: .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,204 // ja 258f8 <_sk_load_a8_sse41_8bit+0x24> + .byte 119,204 // ja 25ed4 <_sk_load_a8_sse41_8bit+0x24> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 259ac <_sk_load_a8_sse41_8bit+0xd8> + .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 25f88 <_sk_load_a8_sse41_8bit+0xd8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,200 // movd %eax,%xmm1 - .byte 235,173 // jmp 258f8 <_sk_load_a8_sse41_8bit+0x24> + .byte 235,173 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1 @@ -54034,7 +54574,7 @@ _sk_load_a8_sse41_8bit: .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0 .byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1 - .byte 235,136 // jmp 258f8 <_sk_load_a8_sse41_8bit+0x24> + .byte 235,136 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1 @@ -54045,7 +54585,7 @@ _sk_load_a8_sse41_8bit: .byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0 .byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0 .byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1 - .byte 233,77,255,255,255 // jmpq 258f8 <_sk_load_a8_sse41_8bit+0x24> + .byte 233,77,255,255,255 // jmpq 25ed4 <_sk_load_a8_sse41_8bit+0x24> .byte 144 // nop .byte 148 // xchg %eax,%esp .byte 255 // (bad) @@ -54054,7 +54594,7 @@ _sk_load_a8_sse41_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf0259bc <_sk_overlay_sse2_8bit+0xffffffffdeffaffb> + .byte 233,255,255,255,222 // jmpq ffffffffdf025f98 <_sk_overlay_sse2_8bit+0xffffffffdeffafe3> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -54077,9 +54617,9 @@ _sk_load_a8_dst_sse41_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,42 // jne 25a0f <_sk_load_a8_dst_sse41_8bit+0x47> + .byte 117,42 // jne 25feb <_sk_load_a8_dst_sse41_8bit+0x47> .byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3 - .byte 102,15,219,29,156,93,0,0 // pand 0x5d9c(%rip),%xmm3 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,29,192,93,0,0 // pand 0x5dc0(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2 .byte 102,15,105,220 // punpckhwd %xmm4,%xmm3 @@ -54091,15 +54631,15 @@ _sk_load_a8_dst_sse41_8bit: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,204 // ja 259ec <_sk_load_a8_dst_sse41_8bit+0x24> + .byte 119,204 // ja 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 25aa0 <_sk_load_a8_dst_sse41_8bit+0xd8> + .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 2607c <_sk_load_a8_dst_sse41_8bit+0xd8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,216 // movd %eax,%xmm3 - .byte 235,173 // jmp 259ec <_sk_load_a8_dst_sse41_8bit+0x24> + .byte 235,173 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3 @@ -54107,7 +54647,7 @@ _sk_load_a8_dst_sse41_8bit: .byte 102,15,110,208 // movd %eax,%xmm2 .byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2 .byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3 - .byte 235,136 // jmp 259ec <_sk_load_a8_dst_sse41_8bit+0x24> + .byte 235,136 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3 @@ -54118,7 +54658,7 @@ _sk_load_a8_dst_sse41_8bit: .byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2 .byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2 .byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3 - .byte 233,77,255,255,255 // jmpq 259ec <_sk_load_a8_dst_sse41_8bit+0x24> + .byte 233,77,255,255,255 // jmpq 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24> .byte 144 // nop .byte 148 // xchg %eax,%esp .byte 255 // (bad) @@ -54127,7 +54667,7 @@ _sk_load_a8_dst_sse41_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf025ab0 <_sk_overlay_sse2_8bit+0xffffffffdeffb0ef> + .byte 233,255,255,255,222 // jmpq ffffffffdf02608c <_sk_overlay_sse2_8bit+0xffffffffdeffb0d7> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -54149,39 +54689,39 @@ _sk_store_a8_sse41_8bit: .byte 72,99,87,8 // movslq 0x8(%rdi),%rdx .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx - .byte 102,15,111,45,244,99,0,0 // movdqa 0x63f4(%rip),%xmm5 # 2bed0 <_sk_overlay_sse2_8bit+0x150f> + .byte 102,15,111,45,24,100,0,0 // movdqa 0x6418(%rip),%xmm5 # 2c4d0 <_sk_overlay_sse2_8bit+0x151b> .byte 102,15,111,241 // movdqa %xmm1,%xmm6 .byte 102,15,56,0,245 // pshufb %xmm5,%xmm6 .byte 102,15,111,224 // movdqa %xmm0,%xmm4 .byte 102,15,56,0,229 // pshufb %xmm5,%xmm4 .byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4 .byte 77,133,201 // test %r9,%r9 - .byte 117,19 // jne 25b0a <_sk_store_a8_sse41_8bit+0x4e> - .byte 102,15,56,0,37,144,99,0,0 // pshufb 0x6390(%rip),%xmm4 # 2be90 <_sk_overlay_sse2_8bit+0x14cf> + .byte 117,19 // jne 260e6 <_sk_store_a8_sse41_8bit+0x4e> + .byte 102,15,56,0,37,180,99,0,0 // pshufb 0x63b4(%rip),%xmm4 # 2c490 <_sk_overlay_sse2_8bit+0x14db> .byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,239 // ja 25b06 <_sk_store_a8_sse41_8bit+0x4a> + .byte 119,239 // ja 260e2 <_sk_store_a8_sse41_8bit+0x4a> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 25b80 <_sk_store_a8_sse41_8bit+0xc4> + .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 2615c <_sk_store_a8_sse41_8bit+0xc4> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,58,20,36,2,0 // pextrb $0x0,%xmm4,(%rdx,%r8,1) - .byte 235,209 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a> + .byte 235,209 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a> .byte 102,66,15,58,20,100,2,2,4 // pextrb $0x4,%xmm4,0x2(%rdx,%r8,1) - .byte 102,15,56,0,37,89,92,0,0 // pshufb 0x5c59(%rip),%xmm4 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf> + .byte 102,15,56,0,37,125,92,0,0 // pshufb 0x5c7d(%rip),%xmm4 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb> .byte 102,66,15,58,21,36,2,0 // pextrw $0x0,%xmm4,(%rdx,%r8,1) - .byte 235,181 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a> + .byte 235,181 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a> .byte 102,66,15,58,20,100,2,6,12 // pextrb $0xc,%xmm4,0x6(%rdx,%r8,1) .byte 102,66,15,58,20,100,2,5,10 // pextrb $0xa,%xmm4,0x5(%rdx,%r8,1) .byte 102,66,15,58,20,100,2,4,8 // pextrb $0x8,%xmm4,0x4(%rdx,%r8,1) - .byte 102,15,56,0,37,59,92,0,0 // pshufb 0x5c3b(%rip),%xmm4 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef> + .byte 102,15,56,0,37,95,92,0,0 // pshufb 0x5c5f(%rip),%xmm4 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb> .byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1) - .byte 235,137 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a> + .byte 235,137 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a> .byte 15,31,0 // nopl (%rax) .byte 171 // stos %eax,%es:(%rdi) .byte 255 // (bad) @@ -54217,16 +54757,16 @@ _sk_load_g8_sse41_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,66 // jne 25bfb <_sk_load_g8_sse41_8bit+0x5f> + .byte 117,66 // jne 261d7 <_sk_load_g8_sse41_8bit+0x5f> .byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1 - .byte 102,15,219,13,200,91,0,0 // pand 0x5bc8(%rip),%xmm1 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,13,236,91,0,0 // pand 0x5bec(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 102,15,105,204 // punpckhwd %xmm4,%xmm1 - .byte 102,15,111,37,3,99,0,0 // movdqa 0x6303(%rip),%xmm4 # 2bee0 <_sk_overlay_sse2_8bit+0x151f> + .byte 102,15,111,37,39,99,0,0 // movdqa 0x6327(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b> .byte 102,15,56,64,204 // pmulld %xmm4,%xmm1 .byte 102,15,56,64,196 // pmulld %xmm4,%xmm0 - .byte 102,15,111,37,177,98,0,0 // movdqa 0x62b1(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,37,213,98,0,0 // movdqa 0x62d5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,235,196 // por %xmm4,%xmm0 .byte 102,15,235,204 // por %xmm4,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -54235,15 +54775,15 @@ _sk_load_g8_sse41_8bit: .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,180 // ja 25bc0 <_sk_load_g8_sse41_8bit+0x24> + .byte 119,180 // ja 2619c <_sk_load_g8_sse41_8bit+0x24> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 25c90 <_sk_load_g8_sse41_8bit+0xf4> + .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2626c <_sk_load_g8_sse41_8bit+0xf4> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,200 // movd %eax,%xmm1 - .byte 235,149 // jmp 25bc0 <_sk_load_g8_sse41_8bit+0x24> + .byte 235,149 // jmp 2619c <_sk_load_g8_sse41_8bit+0x24> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1 @@ -54251,7 +54791,7 @@ _sk_load_g8_sse41_8bit: .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0 .byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1 - .byte 233,109,255,255,255 // jmpq 25bc0 <_sk_load_g8_sse41_8bit+0x24> + .byte 233,109,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1 @@ -54262,7 +54802,7 @@ _sk_load_g8_sse41_8bit: .byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0 .byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0 .byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1 - .byte 233,50,255,255,255 // jmpq 25bc0 <_sk_load_g8_sse41_8bit+0x24> + .byte 233,50,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24> .byte 102,144 // xchg %ax,%ax .byte 144 // nop .byte 255 // (bad) @@ -54271,7 +54811,7 @@ _sk_load_g8_sse41_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,221 // callq ffffffffde025ca0 <_sk_overlay_sse2_8bit+0xffffffffddffb2df> + .byte 232,255,255,255,221 // callq ffffffffde02627c <_sk_overlay_sse2_8bit+0xffffffffddffb2c7> .byte 255 // (bad) .byte 255 // (bad) .byte 255,210 // callq *%rdx @@ -54294,16 +54834,16 @@ _sk_load_g8_dst_sse41_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,66 // jne 25d0b <_sk_load_g8_dst_sse41_8bit+0x5f> + .byte 117,66 // jne 262e7 <_sk_load_g8_dst_sse41_8bit+0x5f> .byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3 - .byte 102,15,219,29,184,90,0,0 // pand 0x5ab8(%rip),%xmm3 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,29,220,90,0,0 // pand 0x5adc(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2 .byte 102,15,105,220 // punpckhwd %xmm4,%xmm3 - .byte 102,15,111,37,243,97,0,0 // movdqa 0x61f3(%rip),%xmm4 # 2bee0 <_sk_overlay_sse2_8bit+0x151f> + .byte 102,15,111,37,23,98,0,0 // movdqa 0x6217(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b> .byte 102,15,56,64,220 // pmulld %xmm4,%xmm3 .byte 102,15,56,64,212 // pmulld %xmm4,%xmm2 - .byte 102,15,111,37,161,97,0,0 // movdqa 0x61a1(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,37,197,97,0,0 // movdqa 0x61c5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,235,212 // por %xmm4,%xmm2 .byte 102,15,235,220 // por %xmm4,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -54312,15 +54852,15 @@ _sk_load_g8_dst_sse41_8bit: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,180 // ja 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24> + .byte 119,180 // ja 262ac <_sk_load_g8_dst_sse41_8bit+0x24> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 25da0 <_sk_load_g8_dst_sse41_8bit+0xf4> + .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2637c <_sk_load_g8_dst_sse41_8bit+0xf4> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,216 // movd %eax,%xmm3 - .byte 235,149 // jmp 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24> + .byte 235,149 // jmp 262ac <_sk_load_g8_dst_sse41_8bit+0x24> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3 @@ -54328,7 +54868,7 @@ _sk_load_g8_dst_sse41_8bit: .byte 102,15,110,208 // movd %eax,%xmm2 .byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2 .byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3 - .byte 233,109,255,255,255 // jmpq 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24> + .byte 233,109,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3 @@ -54339,7 +54879,7 @@ _sk_load_g8_dst_sse41_8bit: .byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2 .byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2 .byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3 - .byte 233,50,255,255,255 // jmpq 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24> + .byte 233,50,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24> .byte 102,144 // xchg %ax,%ax .byte 144 // nop .byte 255 // (bad) @@ -54348,7 +54888,7 @@ _sk_load_g8_dst_sse41_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,221 // callq ffffffffde025db0 <_sk_overlay_sse2_8bit+0xffffffffddffb3ef> + .byte 232,255,255,255,221 // callq ffffffffde02638c <_sk_overlay_sse2_8bit+0xffffffffddffb3d7> .byte 255 // (bad) .byte 255 // (bad) .byte 255,210 // callq *%rdx @@ -54372,11 +54912,11 @@ _sk_srcover_rgba_8888_sse41_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,206,0,0,0 // jne 25eaf <_sk_srcover_rgba_8888_sse41_8bit+0xf3> + .byte 15,133,206,0,0,0 // jne 2648b <_sk_srcover_rgba_8888_sse41_8bit+0xf3> .byte 243,70,15,111,68,138,16 // movdqu 0x10(%rdx,%r9,4),%xmm8 .byte 243,70,15,111,12,138 // movdqu (%rdx,%r9,4),%xmm9 .byte 77,133,192 // test %r8,%r8 - .byte 102,15,111,37,183,96,0,0 // movdqa 0x60b7(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,37,219,96,0,0 // movdqa 0x60db(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,15,111,241 // movdqa %xmm1,%xmm6 .byte 102,15,56,0,244 // pshufb %xmm4,%xmm6 .byte 102,15,111,248 // movdqa %xmm0,%xmm7 @@ -54410,7 +54950,7 @@ _sk_srcover_rgba_8888_sse41_8bit: .byte 102,68,15,248,204 // psubb %xmm4,%xmm9 .byte 102,68,15,252,200 // paddb %xmm0,%xmm9 .byte 102,68,15,252,193 // paddb %xmm1,%xmm8 - .byte 117,72 // jne 25ee6 <_sk_srcover_rgba_8888_sse41_8bit+0x12a> + .byte 117,72 // jne 264c2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a> .byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4) .byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -54421,43 +54961,43 @@ _sk_srcover_rgba_8888_sse41_8bit: .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 254,200 // dec %al .byte 60,6 // cmp $0x6,%al - .byte 15,135,38,255,255,255 // ja 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32> + .byte 15,135,38,255,255,255 // ja 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32> .byte 15,182,192 // movzbl %al,%eax - .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 25f8c <_sk_srcover_rgba_8888_sse41_8bit+0x1d0> + .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 26568 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,70,15,110,12,138 // movd (%rdx,%r9,4),%xmm9 - .byte 233,8,255,255,255 // jmpq 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32> + .byte 233,8,255,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32> .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,184 // ja 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef> + .byte 119,184 // ja 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef> .byte 65,15,182,192 // movzbl %r8b,%eax - .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 25fa8 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec> + .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 26584 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4) - .byte 235,156 // jmp 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef> + .byte 235,156 // jmp 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef> .byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4 .byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9 .byte 243,66,15,126,36,138 // movq (%rdx,%r9,4),%xmm4 .byte 102,68,15,58,14,204,15 // pblendw $0xf,%xmm4,%xmm9 - .byte 233,192,254,255,255 // jmpq 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32> + .byte 233,192,254,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32> .byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4 .byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8 .byte 102,70,15,58,34,68,138,20,1 // pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8 .byte 102,70,15,58,34,68,138,16,0 // pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8 - .byte 233,150,254,255,255 // jmpq 25de8 <_sk_srcover_rgba_8888_sse41_8bit+0x2c> + .byte 233,150,254,255,255 // jmpq 263c4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c> .byte 102,70,15,58,22,76,138,8,2 // pextrd $0x2,%xmm9,0x8(%rdx,%r9,4) .byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4) - .byte 233,69,255,255,255 // jmpq 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef> + .byte 233,69,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef> .byte 102,70,15,58,22,68,138,24,2 // pextrd $0x2,%xmm8,0x18(%rdx,%r9,4) .byte 102,70,15,58,22,68,138,20,1 // pextrd $0x1,%xmm8,0x14(%rdx,%r9,4) .byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4) .byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4) - .byte 233,33,255,255,255 // jmpq 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef> + .byte 233,33,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef> .byte 102,144 // xchg %ax,%ax .byte 79,255 // rex.WRXB (bad) .byte 255 // (bad) @@ -54498,7 +55038,7 @@ _sk_scale_1_float_sse41_8bit: .byte 102,15,111,232 // movdqa %xmm0,%xmm5 .byte 72,173 // lods %ds:(%rsi),%rax .byte 243,15,16,0 // movss (%rax),%xmm0 - .byte 243,15,89,5,86,78,0,0 // mulss 0x4e56(%rip),%xmm0 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 243,15,89,5,110,78,0,0 // mulss 0x4e6e(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 243,15,44,192 // cvttss2si %xmm0,%eax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,68,15,56,48,197 // pmovzxbw %xmm5,%xmm8 @@ -54506,7 +55046,7 @@ _sk_scale_1_float_sse41_8bit: .byte 102,68,15,56,48,204 // pmovzxbw %xmm4,%xmm9 .byte 102,15,104,224 // punpckhbw %xmm0,%xmm4 .byte 102,15,110,240 // movd %eax,%xmm6 - .byte 102,15,56,0,53,238,94,0,0 // pshufb 0x5eee(%rip),%xmm6 # 2bef0 <_sk_overlay_sse2_8bit+0x152f> + .byte 102,15,56,0,53,18,95,0,0 // pshufb 0x5f12(%rip),%xmm6 # 2c4f0 <_sk_overlay_sse2_8bit+0x153b> .byte 102,15,111,206 // movdqa %xmm6,%xmm1 .byte 102,65,15,213,201 // pmullw %xmm9,%xmm1 .byte 102,15,111,198 // movdqa %xmm6,%xmm0 @@ -54539,13 +55079,13 @@ _sk_scale_u8_sse41_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 15,133,160,0,0,0 // jne 26113 <_sk_scale_u8_sse41_8bit+0xc1> + .byte 15,133,160,0,0,0 // jne 266ef <_sk_scale_u8_sse41_8bit+0xc1> .byte 102,66,15,56,48,52,2 // pmovzxbw (%rdx,%r8,1),%xmm6 - .byte 102,15,219,53,14,87,0,0 // pand 0x570e(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,53,50,87,0,0 // pand 0x5732(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,15,111,254 // movdqa %xmm6,%xmm7 - .byte 102,15,56,0,61,108,94,0,0 // pshufb 0x5e6c(%rip),%xmm7 # 2bf00 <_sk_overlay_sse2_8bit+0x153f> - .byte 102,15,56,0,53,115,94,0,0 // pshufb 0x5e73(%rip),%xmm6 # 2bf10 <_sk_overlay_sse2_8bit+0x154f> + .byte 102,15,56,0,61,144,94,0,0 // pshufb 0x5e90(%rip),%xmm7 # 2c500 <_sk_overlay_sse2_8bit+0x154b> + .byte 102,15,56,0,53,151,94,0,0 // pshufb 0x5e97(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0x155b> .byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9 .byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0 .byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10 @@ -54576,15 +55116,15 @@ _sk_scale_u8_sse41_8bit: .byte 102,15,239,246 // pxor %xmm6,%xmm6 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,82,255,255,255 // ja 2607a <_sk_scale_u8_sse41_8bit+0x28> + .byte 15,135,82,255,255,255 // ja 26656 <_sk_scale_u8_sse41_8bit+0x28> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 261b0 <_sk_scale_u8_sse41_8bit+0x15e> + .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 2678c <_sk_scale_u8_sse41_8bit+0x15e> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,240 // movd %eax,%xmm6 - .byte 233,48,255,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28> + .byte 233,48,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,246 // pxor %xmm6,%xmm6 .byte 102,15,196,240,2 // pinsrw $0x2,%eax,%xmm6 @@ -54592,7 +55132,7 @@ _sk_scale_u8_sse41_8bit: .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4 .byte 102,15,58,14,244,3 // pblendw $0x3,%xmm4,%xmm6 - .byte 233,8,255,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28> + .byte 233,8,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,246 // pxor %xmm6,%xmm6 .byte 102,15,196,240,6 // pinsrw $0x6,%eax,%xmm6 @@ -54603,7 +55143,7 @@ _sk_scale_u8_sse41_8bit: .byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4 .byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4 .byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6 - .byte 233,205,254,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28> + .byte 233,205,254,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28> .byte 15,31,0 // nopl (%rax) .byte 140,255 // mov %?,%edi .byte 255 // (bad) @@ -54630,7 +55170,7 @@ FUNCTION(_sk_lerp_1_float_sse41_8bit) _sk_lerp_1_float_sse41_8bit: .byte 72,173 // lods %ds:(%rsi),%rax .byte 243,15,16,32 // movss (%rax),%xmm4 - .byte 243,15,89,37,86,76,0,0 // mulss 0x4c56(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 243,15,89,37,110,76,0,0 // mulss 0x4c6e(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 243,15,44,196 // cvttss2si %xmm4,%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,96,228 // punpcklbw %xmm4,%xmm4 @@ -54641,7 +55181,7 @@ _sk_lerp_1_float_sse41_8bit: .byte 102,65,15,104,193 // punpckhbw %xmm9,%xmm0 .byte 102,68,15,56,48,217 // pmovzxbw %xmm1,%xmm11 .byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1 - .byte 102,15,56,0,61,11,93,0,0 // pshufb 0x5d0b(%rip),%xmm7 # 2bf20 <_sk_overlay_sse2_8bit+0x155f> + .byte 102,15,56,0,61,47,93,0,0 // pshufb 0x5d2f(%rip),%xmm7 # 2c520 <_sk_overlay_sse2_8bit+0x156b> .byte 102,68,15,111,231 // movdqa %xmm7,%xmm12 .byte 102,69,15,213,227 // pmullw %xmm11,%xmm12 .byte 102,68,15,111,239 // movdqa %xmm7,%xmm13 @@ -54702,13 +55242,13 @@ _sk_lerp_u8_sse41_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 15,133,46,1,0,0 // jne 2643d <_sk_lerp_u8_sse41_8bit+0x14f> + .byte 15,133,46,1,0,0 // jne 26a19 <_sk_lerp_u8_sse41_8bit+0x14f> .byte 102,66,15,56,48,60,2 // pmovzxbw (%rdx,%r8,1),%xmm7 - .byte 102,15,219,61,114,84,0,0 // pand 0x5472(%rip),%xmm7 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,61,150,84,0,0 // pand 0x5496(%rip),%xmm7 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,15,111,247 // movdqa %xmm7,%xmm6 - .byte 102,15,56,0,53,208,91,0,0 // pshufb 0x5bd0(%rip),%xmm6 # 2bf00 <_sk_overlay_sse2_8bit+0x153f> - .byte 102,15,56,0,61,215,91,0,0 // pshufb 0x5bd7(%rip),%xmm7 # 2bf10 <_sk_overlay_sse2_8bit+0x154f> + .byte 102,15,56,0,53,244,91,0,0 // pshufb 0x5bf4(%rip),%xmm6 # 2c500 <_sk_overlay_sse2_8bit+0x154b> + .byte 102,15,56,0,61,251,91,0,0 // pshufb 0x5bfb(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0x155b> .byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9 .byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0 .byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10 @@ -54768,15 +55308,15 @@ _sk_lerp_u8_sse41_8bit: .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,196,254,255,255 // ja 26316 <_sk_lerp_u8_sse41_8bit+0x28> + .byte 15,135,196,254,255,255 // ja 268f2 <_sk_lerp_u8_sse41_8bit+0x28> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 264d8 <_sk_lerp_u8_sse41_8bit+0x1ea> + .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 26ab4 <_sk_lerp_u8_sse41_8bit+0x1ea> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,248 // movd %eax,%xmm7 - .byte 233,162,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28> + .byte 233,162,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 102,15,196,248,2 // pinsrw $0x2,%eax,%xmm7 @@ -54784,7 +55324,7 @@ _sk_lerp_u8_sse41_8bit: .byte 102,15,110,232 // movd %eax,%xmm5 .byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5 .byte 102,15,58,14,253,3 // pblendw $0x3,%xmm5,%xmm7 - .byte 233,122,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28> + .byte 233,122,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 102,15,196,248,6 // pinsrw $0x6,%eax,%xmm7 @@ -54795,7 +55335,7 @@ _sk_lerp_u8_sse41_8bit: .byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5 .byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5 .byte 102,15,58,14,253,15 // pblendw $0xf,%xmm5,%xmm7 - .byte 233,63,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28> + .byte 233,63,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28> .byte 144 // nop .byte 142,255 // mov %edi,%? .byte 255 // (bad) @@ -54803,7 +55343,7 @@ _sk_lerp_u8_sse41_8bit: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf0264e8 <_sk_overlay_sse2_8bit+0xffffffffdeffbb27> + .byte 233,255,255,255,222 // jmpq ffffffffdf026ac4 <_sk_overlay_sse2_8bit+0xffffffffdeffbb0f> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -54837,7 +55377,7 @@ HIDDEN _sk_black_color_sse41_8bit FUNCTION(_sk_black_color_sse41_8bit) _sk_black_color_sse41_8bit: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,5,143,89,0,0 // movaps 0x598f(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 15,40,5,179,89,0,0 // movaps 0x59b3(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 255,224 // jmpq *%rax @@ -54863,7 +55403,7 @@ HIDDEN _sk_srcatop_sse41_8bit .globl _sk_srcatop_sse41_8bit FUNCTION(_sk_srcatop_sse41_8bit) _sk_srcatop_sse41_8bit: - .byte 102,68,15,111,21,123,89,0,0 // movdqa 0x597b(%rip),%xmm10 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,68,15,111,21,159,89,0,0 // movdqa 0x599f(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,219 // movdqa %xmm3,%xmm11 .byte 102,68,15,56,48,195 // pmovzxbw %xmm3,%xmm8 .byte 102,15,111,235 // movdqa %xmm3,%xmm5 @@ -54933,7 +55473,7 @@ HIDDEN _sk_dstatop_sse41_8bit .globl _sk_dstatop_sse41_8bit FUNCTION(_sk_dstatop_sse41_8bit) _sk_dstatop_sse41_8bit: - .byte 102,68,15,111,29,64,88,0,0 // movdqa 0x5840(%rip),%xmm11 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,68,15,111,29,100,88,0,0 // movdqa 0x5864(%rip),%xmm11 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,69,15,56,0,235 // pshufb %xmm11,%xmm13 .byte 102,68,15,111,248 // movdqa %xmm0,%xmm15 @@ -55005,7 +55545,7 @@ FUNCTION(_sk_srcin_sse41_8bit) _sk_srcin_sse41_8bit: .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,111,232 // movdqa %xmm0,%xmm5 - .byte 102,15,111,5,247,86,0,0 // movdqa 0x56f7(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,5,27,87,0,0 // movdqa 0x571b(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,15,111,243 // movdqa %xmm3,%xmm6 .byte 102,15,56,0,240 // pshufb %xmm0,%xmm6 .byte 102,15,111,250 // movdqa %xmm2,%xmm7 @@ -55040,7 +55580,7 @@ HIDDEN _sk_dstin_sse41_8bit .globl _sk_dstin_sse41_8bit FUNCTION(_sk_dstin_sse41_8bit) _sk_dstin_sse41_8bit: - .byte 102,15,111,37,106,86,0,0 // movdqa 0x566a(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,37,142,86,0,0 // movdqa 0x568e(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,15,56,0,204 // pshufb %xmm4,%xmm1 .byte 102,15,56,0,196 // pshufb %xmm4,%xmm0 .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 @@ -55079,7 +55619,7 @@ FUNCTION(_sk_srcout_sse41_8bit) _sk_srcout_sse41_8bit: .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,111,232 // movdqa %xmm0,%xmm5 - .byte 102,15,111,5,205,85,0,0 // movdqa 0x55cd(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,5,241,85,0,0 // movdqa 0x55f1(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,15,111,250 // movdqa %xmm2,%xmm7 .byte 102,15,56,0,248 // pshufb %xmm0,%xmm7 .byte 102,15,111,243 // movdqa %xmm3,%xmm6 @@ -55117,7 +55657,7 @@ HIDDEN _sk_dstout_sse41_8bit .globl _sk_dstout_sse41_8bit FUNCTION(_sk_dstout_sse41_8bit) _sk_dstout_sse41_8bit: - .byte 102,15,111,37,52,85,0,0 // movdqa 0x5534(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,37,88,85,0,0 // movdqa 0x5558(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,15,56,0,196 // pshufb %xmm4,%xmm0 .byte 102,15,56,0,204 // pshufb %xmm4,%xmm1 .byte 102,15,118,228 // pcmpeqd %xmm4,%xmm4 @@ -55157,7 +55697,7 @@ HIDDEN _sk_srcover_sse41_8bit .globl _sk_srcover_sse41_8bit FUNCTION(_sk_srcover_sse41_8bit) _sk_srcover_sse41_8bit: - .byte 102,15,111,53,147,84,0,0 // movdqa 0x5493(%rip),%xmm6 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,53,183,84,0,0 // movdqa 0x54b7(%rip),%xmm6 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,217 // movdqa %xmm1,%xmm11 .byte 102,68,15,56,0,222 // pshufb %xmm6,%xmm11 .byte 102,15,111,232 // movdqa %xmm0,%xmm5 @@ -55198,7 +55738,7 @@ HIDDEN _sk_dstover_sse41_8bit .globl _sk_dstover_sse41_8bit FUNCTION(_sk_dstover_sse41_8bit) _sk_dstover_sse41_8bit: - .byte 102,68,15,111,5,227,83,0,0 // movdqa 0x53e3(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,68,15,111,5,7,84,0,0 // movdqa 0x5407(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,209 // movdqa %xmm1,%xmm10 .byte 102,68,15,56,48,201 // pmovzxbw %xmm1,%xmm9 .byte 102,15,252,203 // paddb %xmm3,%xmm1 @@ -55277,7 +55817,7 @@ _sk_multiply_sse41_8bit: .byte 102,15,111,218 // movdqa %xmm2,%xmm3 .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,68,15,111,53,161,82,0,0 // movdqa 0x52a1(%rip),%xmm14 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,68,15,111,53,197,82,0,0 // movdqa 0x52c5(%rip),%xmm14 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,195 // movdqa %xmm3,%xmm8 .byte 102,15,111,235 // movdqa %xmm3,%xmm5 .byte 102,65,15,56,0,238 // pshufb %xmm14,%xmm5 @@ -55406,7 +55946,7 @@ HIDDEN _sk_xor__sse41_8bit .globl _sk_xor__sse41_8bit FUNCTION(_sk_xor__sse41_8bit) _sk_xor__sse41_8bit: - .byte 102,68,15,111,21,95,80,0,0 // movdqa 0x505f(%rip),%xmm10 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,68,15,111,21,131,80,0,0 // movdqa 0x5083(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,226 // movdqa %xmm2,%xmm12 .byte 102,68,15,56,48,194 // pmovzxbw %xmm2,%xmm8 .byte 102,15,111,234 // movdqa %xmm2,%xmm5 @@ -55474,12 +56014,21 @@ _sk_xor__sse41_8bit: .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 255,224 // jmpq *%rax +HIDDEN _sk_plus__sse41_8bit +.globl _sk_plus__sse41_8bit +FUNCTION(_sk_plus__sse41_8bit) +_sk_plus__sse41_8bit: + .byte 102,15,220,194 // paddusb %xmm2,%xmm0 + .byte 102,15,220,203 // paddusb %xmm3,%xmm1 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_darken_sse41_8bit .globl _sk_darken_sse41_8bit FUNCTION(_sk_darken_sse41_8bit) _sk_darken_sse41_8bit: .byte 102,68,15,111,240 // movdqa %xmm0,%xmm14 - .byte 102,68,15,111,5,18,79,0,0 // movdqa 0x4f12(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,68,15,111,5,42,79,0,0 // movdqa 0x4f2a(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,219 // movdqa %xmm3,%xmm11 .byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9 .byte 102,15,111,243 // movdqa %xmm3,%xmm6 @@ -55546,7 +56095,7 @@ _sk_darken_sse41_8bit: .byte 102,15,248,231 // psubb %xmm7,%xmm4 .byte 102,15,248,206 // psubb %xmm6,%xmm1 .byte 102,68,15,248,245 // psubb %xmm5,%xmm14 - .byte 15,40,5,70,78,0,0 // movaps 0x4e46(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 15,40,5,94,78,0,0 // movaps 0x4e5e(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14 .byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -55558,7 +56107,7 @@ HIDDEN _sk_lighten_sse41_8bit FUNCTION(_sk_lighten_sse41_8bit) _sk_lighten_sse41_8bit: .byte 102,68,15,111,240 // movdqa %xmm0,%xmm14 - .byte 102,68,15,111,5,163,77,0,0 // movdqa 0x4da3(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,68,15,111,5,187,77,0,0 // movdqa 0x4dbb(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,219 // movdqa %xmm3,%xmm11 .byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9 .byte 102,15,111,243 // movdqa %xmm3,%xmm6 @@ -55625,7 +56174,7 @@ _sk_lighten_sse41_8bit: .byte 102,15,248,231 // psubb %xmm7,%xmm4 .byte 102,15,248,206 // psubb %xmm6,%xmm1 .byte 102,68,15,248,245 // psubb %xmm5,%xmm14 - .byte 15,40,5,215,76,0,0 // movaps 0x4cd7(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 15,40,5,239,76,0,0 // movaps 0x4cef(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14 .byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -55665,7 +56214,7 @@ _sk_exclusion_sse41_8bit: .byte 102,15,113,215,8 // psrlw $0x8,%xmm7 .byte 102,15,103,253 // packuswb %xmm5,%xmm7 .byte 102,15,103,230 // packuswb %xmm6,%xmm4 - .byte 102,15,111,45,45,76,0,0 // movdqa 0x4c2d(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 102,15,111,45,69,76,0,0 // movdqa 0x4c45(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,15,248,204 // psubb %xmm4,%xmm1 .byte 102,15,219,229 // pand %xmm5,%xmm4 .byte 102,15,219,239 // pand %xmm7,%xmm5 @@ -55680,7 +56229,7 @@ HIDDEN _sk_difference_sse41_8bit FUNCTION(_sk_difference_sse41_8bit) _sk_difference_sse41_8bit: .byte 102,68,15,111,193 // movdqa %xmm1,%xmm8 - .byte 102,15,111,13,132,75,0,0 // movdqa 0x4b84(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,13,156,75,0,0 // movdqa 0x4b9c(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,111,219 // movdqa %xmm3,%xmm11 .byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9 .byte 102,15,111,243 // movdqa %xmm3,%xmm6 @@ -55718,7 +56267,7 @@ _sk_difference_sse41_8bit: .byte 102,15,113,214,8 // psrlw $0x8,%xmm6 .byte 102,15,113,215,8 // psrlw $0x8,%xmm7 .byte 102,15,103,254 // packuswb %xmm6,%xmm7 - .byte 102,15,111,37,201,74,0,0 // movdqa 0x4ac9(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,37,225,74,0,0 // movdqa 0x4ae1(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,15,56,0,204 // pshufb %xmm4,%xmm1 .byte 102,15,56,0,236 // pshufb %xmm4,%xmm5 .byte 102,69,15,104,236 // punpckhbw %xmm12,%xmm13 @@ -55743,7 +56292,7 @@ _sk_difference_sse41_8bit: .byte 102,15,103,241 // packuswb %xmm1,%xmm6 .byte 102,65,15,218,230 // pminub %xmm14,%xmm4 .byte 102,15,218,247 // pminub %xmm7,%xmm6 - .byte 102,15,111,13,204,74,0,0 // movdqa 0x4acc(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 102,15,111,13,228,74,0,0 // movdqa 0x4ae4(%rip),%xmm1 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,68,15,248,198 // psubb %xmm6,%xmm8 .byte 102,15,219,241 // pand %xmm1,%xmm6 .byte 102,15,219,204 // pand %xmm4,%xmm1 @@ -55772,7 +56321,7 @@ _sk_hardlight_sse41_8bit: .byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp) .byte 102,69,15,56,48,221 // pmovzxbw %xmm13,%xmm11 .byte 102,68,15,127,92,36,48 // movdqa %xmm11,0x30(%rsp) - .byte 102,15,111,13,214,73,0,0 // movdqa 0x49d6(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,13,238,73,0,0 // movdqa 0x49ee(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14 .byte 102,68,15,56,0,233 // pshufb %xmm1,%xmm13 .byte 102,69,15,56,48,205 // pmovzxbw %xmm13,%xmm9 @@ -55821,7 +56370,7 @@ _sk_hardlight_sse41_8bit: .byte 102,65,15,56,58,242 // pminuw %xmm10,%xmm6 .byte 102,15,117,240 // pcmpeqw %xmm0,%xmm6 .byte 102,15,127,116,36,64 // movdqa %xmm6,0x40(%rsp) - .byte 102,15,111,53,186,65,0,0 // movdqa 0x41ba(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,111,53,210,65,0,0 // movdqa 0x41d2(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,111,199 // movdqa %xmm7,%xmm0 .byte 102,15,239,198 // pxor %xmm6,%xmm0 .byte 102,65,15,213,192 // pmullw %xmm8,%xmm0 @@ -55928,7 +56477,7 @@ _sk_hardlight_sse41_8bit: .byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6 .byte 102,15,253,124,36,144 // paddw -0x70(%rsp),%xmm7 .byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5 - .byte 102,15,111,5,74,71,0,0 // movdqa 0x474a(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f> + .byte 102,15,111,5,98,71,0,0 // movdqa 0x4762(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b> .byte 102,68,15,253,216 // paddw %xmm0,%xmm11 .byte 102,68,15,253,219 // paddw %xmm3,%xmm11 .byte 102,15,253,240 // paddw %xmm0,%xmm6 @@ -55937,7 +56486,7 @@ _sk_hardlight_sse41_8bit: .byte 102,15,253,252 // paddw %xmm4,%xmm7 .byte 102,15,253,232 // paddw %xmm0,%xmm5 .byte 102,15,253,234 // paddw %xmm2,%xmm5 - .byte 102,15,111,5,48,71,0,0 // movdqa 0x4730(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f> + .byte 102,15,111,5,72,71,0,0 // movdqa 0x4748(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b> .byte 102,15,228,240 // pmulhuw %xmm0,%xmm6 .byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11 .byte 102,15,228,232 // pmulhuw %xmm0,%xmm5 @@ -55972,7 +56521,7 @@ _sk_overlay_sse41_8bit: .byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp) .byte 102,65,15,56,48,206 // pmovzxbw %xmm14,%xmm1 .byte 102,15,127,140,36,144,0,0,0 // movdqa %xmm1,0x90(%rsp) - .byte 102,15,111,13,249,69,0,0 // movdqa 0x45f9(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef> + .byte 102,15,111,13,17,70,0,0 // movdqa 0x4611(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb> .byte 102,68,15,56,0,249 // pshufb %xmm1,%xmm15 .byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14 .byte 102,65,15,56,48,238 // pmovzxbw %xmm14,%xmm5 @@ -56024,7 +56573,7 @@ _sk_overlay_sse41_8bit: .byte 102,65,15,56,58,221 // pminuw %xmm13,%xmm3 .byte 102,15,117,216 // pcmpeqw %xmm0,%xmm3 .byte 102,15,127,92,36,48 // movdqa %xmm3,0x30(%rsp) - .byte 102,15,111,53,203,61,0,0 // movdqa 0x3dcb(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,111,53,227,61,0,0 // movdqa 0x3de3(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,239,198 // pxor %xmm6,%xmm0 .byte 102,15,213,196 // pmullw %xmm4,%xmm0 @@ -56133,7 +56682,7 @@ _sk_overlay_sse41_8bit: .byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6 .byte 102,68,15,253,4,36 // paddw (%rsp),%xmm8 .byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5 - .byte 102,15,111,5,87,67,0,0 // movdqa 0x4357(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f> + .byte 102,15,111,5,111,67,0,0 // movdqa 0x436f(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b> .byte 102,68,15,253,216 // paddw %xmm0,%xmm11 .byte 102,69,15,253,217 // paddw %xmm9,%xmm11 .byte 102,15,253,240 // paddw %xmm0,%xmm6 @@ -56142,7 +56691,7 @@ _sk_overlay_sse41_8bit: .byte 102,68,15,253,195 // paddw %xmm3,%xmm8 .byte 102,15,253,232 // paddw %xmm0,%xmm5 .byte 102,15,253,234 // paddw %xmm2,%xmm5 - .byte 102,15,111,5,59,67,0,0 // movdqa 0x433b(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f> + .byte 102,15,111,5,83,67,0,0 // movdqa 0x4353(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b> .byte 102,15,228,240 // pmulhuw %xmm0,%xmm6 .byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11 .byte 102,15,228,232 // pmulhuw %xmm0,%xmm5 @@ -56184,7 +56733,7 @@ _sk_start_pipeline_sse2_8bit: .byte 73,137,246 // mov %rsi,%r14 .byte 72,137,77,168 // mov %rcx,-0x58(%rbp) .byte 73,57,207 // cmp %rcx,%r15 - .byte 115,102 // jae 27d01 <_sk_start_pipeline_sse2_8bit+0x95> + .byte 115,102 // jae 282e9 <_sk_start_pipeline_sse2_8bit+0x95> .byte 72,139,69,208 // mov -0x30(%rbp),%rax .byte 72,141,64,8 // lea 0x8(%rax),%rax .byte 72,137,69,176 // mov %rax,-0x50(%rbp) @@ -56194,7 +56743,7 @@ _sk_start_pipeline_sse2_8bit: .byte 72,137,69,184 // mov %rax,-0x48(%rbp) .byte 76,137,125,192 // mov %r15,-0x40(%rbp) .byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp) - .byte 119,30 // ja 27ce3 <_sk_start_pipeline_sse2_8bit+0x77> + .byte 119,30 // ja 282cb <_sk_start_pipeline_sse2_8bit+0x77> .byte 76,137,231 // mov %r12,%rdi .byte 76,137,246 // mov %r14,%rsi .byte 65,255,213 // callq *%r13 @@ -56203,17 +56752,17 @@ _sk_start_pipeline_sse2_8bit: .byte 72,137,69,184 // mov %rax,-0x48(%rbp) .byte 72,131,193,16 // add $0x10,%rcx .byte 72,57,217 // cmp %rbx,%rcx - .byte 118,226 // jbe 27cc5 <_sk_start_pipeline_sse2_8bit+0x59> + .byte 118,226 // jbe 282ad <_sk_start_pipeline_sse2_8bit+0x59> .byte 72,137,217 // mov %rbx,%rcx .byte 72,41,193 // sub %rax,%rcx - .byte 116,13 // je 27cf8 <_sk_start_pipeline_sse2_8bit+0x8c> + .byte 116,13 // je 282e0 <_sk_start_pipeline_sse2_8bit+0x8c> .byte 72,137,77,200 // mov %rcx,-0x38(%rbp) .byte 76,137,231 // mov %r12,%rdi .byte 76,137,246 // mov %r14,%rsi .byte 65,255,213 // callq *%r13 .byte 73,255,199 // inc %r15 .byte 76,59,125,168 // cmp -0x58(%rbp),%r15 - .byte 117,170 // jne 27cab <_sk_start_pipeline_sse2_8bit+0x3f> + .byte 117,170 // jne 28293 <_sk_start_pipeline_sse2_8bit+0x3f> .byte 72,131,196,56 // add $0x38,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -56245,7 +56794,7 @@ HIDDEN _sk_set_rgb_sse2_8bit FUNCTION(_sk_set_rgb_sse2_8bit) _sk_set_rgb_sse2_8bit: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 243,15,16,37,1,49,0,0 // movss 0x3101(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 243,15,16,37,13,49,0,0 // movss 0x310d(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 243,15,16,40 // movss (%rax),%xmm5 .byte 243,15,89,236 // mulss %xmm4,%xmm5 .byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx @@ -56260,7 +56809,7 @@ _sk_set_rgb_sse2_8bit: .byte 9,208 // or %edx,%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4 - .byte 102,15,111,45,49,65,0,0 // movdqa 0x4131(%rip),%xmm5 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,45,73,65,0,0 // movdqa 0x4149(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,219,205 // pand %xmm5,%xmm1 .byte 102,15,219,197 // pand %xmm5,%xmm0 .byte 102,15,235,196 // por %xmm4,%xmm0 @@ -56285,7 +56834,7 @@ _sk_premul_sse2_8bit: .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 242,15,112,192,95 // pshuflw $0x5f,%xmm0,%xmm0 .byte 243,15,112,248,95 // pshufhw $0x5f,%xmm0,%xmm7 - .byte 102,15,111,5,213,64,0,0 // movdqa 0x40d5(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,5,237,64,0,0 // movdqa 0x40ed(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,235,248 // por %xmm0,%xmm7 .byte 102,15,235,240 // por %xmm0,%xmm6 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 @@ -56366,7 +56915,7 @@ _sk_load_8888_sse2_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,16 // jne 27eeb <_sk_load_8888_sse2_8bit+0x31> + .byte 117,16 // jne 284d3 <_sk_load_8888_sse2_8bit+0x31> .byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1 .byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -56376,18 +56925,18 @@ _sk_load_8888_sse2_8bit: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,231 // ja 27ee7 <_sk_load_8888_sse2_8bit+0x2d> + .byte 119,231 // ja 284cf <_sk_load_8888_sse2_8bit+0x2d> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 27f5c <_sk_load_8888_sse2_8bit+0xa2> + .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 28544 <_sk_load_8888_sse2_8bit+0xa2> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0 - .byte 235,203 // jmp 27ee7 <_sk_load_8888_sse2_8bit+0x2d> + .byte 235,203 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d> .byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 .byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0 - .byte 235,183 // jmp 27ee7 <_sk_load_8888_sse2_8bit+0x2d> + .byte 235,183 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d> .byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0 .byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1 .byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0 @@ -56396,7 +56945,7 @@ _sk_load_8888_sse2_8bit: .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0 .byte 243,15,16,200 // movss %xmm0,%xmm1 - .byte 235,134 // jmp 27ee1 <_sk_load_8888_sse2_8bit+0x27> + .byte 235,134 // jmp 284c9 <_sk_load_8888_sse2_8bit+0x27> .byte 144 // nop .byte 184,255,255,255,204 // mov $0xccffffff,%eax .byte 255 // (bad) @@ -56428,7 +56977,7 @@ _sk_load_8888_dst_sse2_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,16 // jne 27fa9 <_sk_load_8888_dst_sse2_8bit+0x31> + .byte 117,16 // jne 28591 <_sk_load_8888_dst_sse2_8bit+0x31> .byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3 .byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax @@ -56438,18 +56987,18 @@ _sk_load_8888_dst_sse2_8bit: .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,231 // ja 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d> + .byte 119,231 // ja 2858d <_sk_load_8888_dst_sse2_8bit+0x2d> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 2801c <_sk_load_8888_dst_sse2_8bit+0xa4> + .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 28604 <_sk_load_8888_dst_sse2_8bit+0xa4> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2 - .byte 235,203 // jmp 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d> + .byte 235,203 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d> .byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2 .byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2 .byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2 - .byte 235,183 // jmp 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d> + .byte 235,183 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d> .byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2 .byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3 .byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2 @@ -56458,7 +57007,7 @@ _sk_load_8888_dst_sse2_8bit: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2 .byte 243,15,16,218 // movss %xmm2,%xmm3 - .byte 235,134 // jmp 27f9f <_sk_load_8888_dst_sse2_8bit+0x27> + .byte 235,134 // jmp 28587 <_sk_load_8888_dst_sse2_8bit+0x27> .byte 15,31,0 // nopl (%rax) .byte 182,255 // mov $0xff,%dh .byte 255 // (bad) @@ -56493,7 +57042,7 @@ _sk_store_8888_sse2_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,192 // test %r8,%r8 - .byte 117,17 // jne 2806a <_sk_store_8888_sse2_8bit+0x32> + .byte 117,17 // jne 28652 <_sk_store_8888_sse2_8bit+0x32> .byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4) .byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -56501,25 +57050,25 @@ _sk_store_8888_sse2_8bit: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,239 // ja 28066 <_sk_store_8888_sse2_8bit+0x2e> + .byte 119,239 // ja 2864e <_sk_store_8888_sse2_8bit+0x2e> .byte 65,15,182,192 // movzbl %r8b,%eax - .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 280d0 <_sk_store_8888_sse2_8bit+0x98> + .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 286b8 <_sk_store_8888_sse2_8bit+0x98> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4) - .byte 235,211 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e> + .byte 235,211 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e> .byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4 .byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4) .byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4) - .byte 235,191 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e> + .byte 235,191 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e> .byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4 .byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4) .byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4 .byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4) .byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4) .byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4) - .byte 235,152 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e> + .byte 235,152 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e> .byte 102,144 // xchg %ax,%ax .byte 187,255,255,255,207 // mov $0xcfffffff,%ebx .byte 255 // (bad) @@ -56555,7 +57104,7 @@ _sk_load_bgra_sse2_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,92 // jne 28169 <_sk_load_bgra_sse2_8bit+0x7d> + .byte 117,92 // jne 28751 <_sk_load_bgra_sse2_8bit+0x7d> .byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1 .byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0 .byte 102,15,239,228 // pxor %xmm4,%xmm4 @@ -56582,18 +57131,18 @@ _sk_load_bgra_sse2_8bit: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,155 // ja 28119 <_sk_load_bgra_sse2_8bit+0x2d> + .byte 119,155 // ja 28701 <_sk_load_bgra_sse2_8bit+0x2d> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 281e4 <_sk_load_bgra_sse2_8bit+0xf8> + .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 287cc <_sk_load_bgra_sse2_8bit+0xf8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0 - .byte 233,124,255,255,255 // jmpq 28119 <_sk_load_bgra_sse2_8bit+0x2d> + .byte 233,124,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d> .byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 .byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0 - .byte 233,101,255,255,255 // jmpq 28119 <_sk_load_bgra_sse2_8bit+0x2d> + .byte 233,101,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d> .byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0 .byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1 .byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0 @@ -56602,7 +57151,7 @@ _sk_load_bgra_sse2_8bit: .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0 .byte 243,15,16,200 // movss %xmm0,%xmm1 - .byte 233,49,255,255,255 // jmpq 28113 <_sk_load_bgra_sse2_8bit+0x27> + .byte 233,49,255,255,255 // jmpq 286fb <_sk_load_bgra_sse2_8bit+0x27> .byte 102,144 // xchg %ax,%ax .byte 174 // scas %es:(%rdi),%al .byte 255 // (bad) @@ -56639,7 +57188,7 @@ _sk_load_bgra_dst_sse2_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,92 // jne 2827d <_sk_load_bgra_dst_sse2_8bit+0x7d> + .byte 117,92 // jne 28865 <_sk_load_bgra_dst_sse2_8bit+0x7d> .byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3 .byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2 .byte 102,15,239,228 // pxor %xmm4,%xmm4 @@ -56666,18 +57215,18 @@ _sk_load_bgra_dst_sse2_8bit: .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,155 // ja 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d> + .byte 119,155 // ja 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 282f8 <_sk_load_bgra_dst_sse2_8bit+0xf8> + .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 288e0 <_sk_load_bgra_dst_sse2_8bit+0xf8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2 - .byte 233,124,255,255,255 // jmpq 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d> + .byte 233,124,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d> .byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2 .byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2 .byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2 - .byte 233,101,255,255,255 // jmpq 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d> + .byte 233,101,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d> .byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2 .byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3 .byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2 @@ -56686,7 +57235,7 @@ _sk_load_bgra_dst_sse2_8bit: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2 .byte 243,15,16,218 // movss %xmm2,%xmm3 - .byte 233,49,255,255,255 // jmpq 28227 <_sk_load_bgra_dst_sse2_8bit+0x27> + .byte 233,49,255,255,255 // jmpq 2880f <_sk_load_bgra_dst_sse2_8bit+0x27> .byte 102,144 // xchg %ax,%ax .byte 174 // scas %es:(%rdi),%al .byte 255 // (bad) @@ -56742,7 +57291,7 @@ _sk_store_bgra_sse2_8bit: .byte 243,15,112,237,198 // pshufhw $0xc6,%xmm5,%xmm5 .byte 102,15,103,238 // packuswb %xmm6,%xmm5 .byte 77,133,192 // test %r8,%r8 - .byte 117,17 // jne 2839a <_sk_store_bgra_sse2_8bit+0x86> + .byte 117,17 // jne 28982 <_sk_store_bgra_sse2_8bit+0x86> .byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4) .byte 243,66,15,127,100,138,16 // movdqu %xmm4,0x10(%rdx,%r9,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -56750,25 +57299,25 @@ _sk_store_bgra_sse2_8bit: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,239 // ja 28396 <_sk_store_bgra_sse2_8bit+0x82> + .byte 119,239 // ja 2897e <_sk_store_bgra_sse2_8bit+0x82> .byte 65,15,182,192 // movzbl %r8b,%eax - .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 28400 <_sk_store_bgra_sse2_8bit+0xec> + .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 289e8 <_sk_store_bgra_sse2_8bit+0xec> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,66,15,126,44,138 // movd %xmm5,(%rdx,%r9,4) - .byte 235,211 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82> + .byte 235,211 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82> .byte 102,15,112,229,78 // pshufd $0x4e,%xmm5,%xmm4 .byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4) .byte 102,66,15,214,44,138 // movq %xmm5,(%rdx,%r9,4) - .byte 235,191 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82> + .byte 235,191 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82> .byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6 .byte 102,66,15,126,116,138,24 // movd %xmm6,0x18(%rdx,%r9,4) .byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6 .byte 102,66,15,126,116,138,20 // movd %xmm6,0x14(%rdx,%r9,4) .byte 102,66,15,126,100,138,16 // movd %xmm4,0x10(%rdx,%r9,4) .byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4) - .byte 235,152 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82> + .byte 235,152 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82> .byte 102,144 // xchg %ax,%ax .byte 187,255,255,255,207 // mov $0xcfffffff,%ebx .byte 255 // (bad) @@ -56803,10 +57352,10 @@ _sk_load_a8_sse2_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,48 // jne 28469 <_sk_load_a8_sse2_8bit+0x4d> + .byte 117,48 // jne 28a51 <_sk_load_a8_sse2_8bit+0x4d> .byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 - .byte 102,15,84,5,69,51,0,0 // andpd 0x3345(%rip),%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,84,5,93,51,0,0 // andpd 0x335d(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,40,200 // movapd %xmm0,%xmm1 .byte 102,15,105,204 // punpckhwd %xmm4,%xmm1 @@ -56819,15 +57368,15 @@ _sk_load_a8_sse2_8bit: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,201 // ja 28443 <_sk_load_a8_sse2_8bit+0x27> + .byte 119,201 // ja 28a2b <_sk_load_a8_sse2_8bit+0x27> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 284f4 <_sk_load_a8_sse2_8bit+0xd8> + .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28adc <_sk_load_a8_sse2_8bit+0xd8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,170 // jmp 28443 <_sk_load_a8_sse2_8bit+0x27> + .byte 235,170 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0 @@ -56835,7 +57384,7 @@ _sk_load_a8_sse2_8bit: .byte 102,15,110,200 // movd %eax,%xmm1 .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 243,15,16,193 // movss %xmm1,%xmm0 - .byte 235,136 // jmp 28443 <_sk_load_a8_sse2_8bit+0x27> + .byte 235,136 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0 @@ -56846,7 +57395,7 @@ _sk_load_a8_sse2_8bit: .byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1 .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 233,80,255,255,255 // jmpq 28443 <_sk_load_a8_sse2_8bit+0x27> + .byte 233,80,255,255,255 // jmpq 28a2b <_sk_load_a8_sse2_8bit+0x27> .byte 144 // nop .byte 154 // (bad) .byte 255 // (bad) @@ -56880,10 +57429,10 @@ _sk_load_a8_dst_sse2_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,48 // jne 2855d <_sk_load_a8_dst_sse2_8bit+0x4d> + .byte 117,48 // jne 28b45 <_sk_load_a8_dst_sse2_8bit+0x4d> .byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2 .byte 102,15,96,208 // punpcklbw %xmm0,%xmm2 - .byte 102,15,84,21,81,50,0,0 // andpd 0x3251(%rip),%xmm2 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,84,21,105,50,0,0 // andpd 0x3269(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,40,218 // movapd %xmm2,%xmm3 .byte 102,15,105,220 // punpckhwd %xmm4,%xmm3 @@ -56896,15 +57445,15 @@ _sk_load_a8_dst_sse2_8bit: .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,201 // ja 28537 <_sk_load_a8_dst_sse2_8bit+0x27> + .byte 119,201 // ja 28b1f <_sk_load_a8_dst_sse2_8bit+0x27> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 285e8 <_sk_load_a8_dst_sse2_8bit+0xd8> + .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28bd0 <_sk_load_a8_dst_sse2_8bit+0xd8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,208 // movd %eax,%xmm2 - .byte 235,170 // jmp 28537 <_sk_load_a8_dst_sse2_8bit+0x27> + .byte 235,170 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2 @@ -56912,7 +57461,7 @@ _sk_load_a8_dst_sse2_8bit: .byte 102,15,110,216 // movd %eax,%xmm3 .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3 .byte 243,15,16,211 // movss %xmm3,%xmm2 - .byte 235,136 // jmp 28537 <_sk_load_a8_dst_sse2_8bit+0x27> + .byte 235,136 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2 @@ -56923,7 +57472,7 @@ _sk_load_a8_dst_sse2_8bit: .byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3 .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3 .byte 242,15,16,211 // movsd %xmm3,%xmm2 - .byte 233,80,255,255,255 // jmpq 28537 <_sk_load_a8_dst_sse2_8bit+0x27> + .byte 233,80,255,255,255 // jmpq 28b1f <_sk_load_a8_dst_sse2_8bit+0x27> .byte 144 // nop .byte 154 // (bad) .byte 255 // (bad) @@ -56966,8 +57515,8 @@ _sk_store_a8_sse2_8bit: .byte 102,15,114,228,16 // psrad $0x10,%xmm4 .byte 102,15,107,229 // packssdw %xmm5,%xmm4 .byte 77,133,201 // test %r9,%r9 - .byte 117,22 // jne 28661 <_sk_store_a8_sse2_8bit+0x5d> - .byte 102,15,219,37,61,49,0,0 // pand 0x313d(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 117,22 // jne 28c49 <_sk_store_a8_sse2_8bit+0x5d> + .byte 102,15,219,37,85,49,0,0 // pand 0x3155(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1) .byte 72,173 // lods %ds:(%rsi),%rax @@ -56975,24 +57524,24 @@ _sk_store_a8_sse2_8bit: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,239 // ja 2865d <_sk_store_a8_sse2_8bit+0x59> + .byte 119,239 // ja 28c45 <_sk_store_a8_sse2_8bit+0x59> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 286fc <_sk_store_a8_sse2_8bit+0xf8> + .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 28ce4 <_sk_store_a8_sse2_8bit+0xf8> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,15,127,100,36,168 // movdqa %xmm4,-0x58(%rsp) .byte 138,68,36,168 // mov -0x58(%rsp),%al .byte 66,136,4,2 // mov %al,(%rdx,%r8,1) - .byte 235,203 // jmp 2865d <_sk_store_a8_sse2_8bit+0x59> + .byte 235,203 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59> .byte 102,15,127,100,36,184 // movdqa %xmm4,-0x48(%rsp) .byte 138,68,36,188 // mov -0x44(%rsp),%al .byte 66,136,68,2,2 // mov %al,0x2(%rdx,%r8,1) - .byte 102,15,219,37,231,48,0,0 // pand 0x30e7(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,37,255,48,0,0 // pand 0x30ff(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,126,224 // movd %xmm4,%eax .byte 102,66,137,4,2 // mov %ax,(%rdx,%r8,1) - .byte 235,165 // jmp 2865d <_sk_store_a8_sse2_8bit+0x59> + .byte 235,165 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59> .byte 102,15,127,100,36,232 // movdqa %xmm4,-0x18(%rsp) .byte 138,68,36,244 // mov -0xc(%rsp),%al .byte 66,136,68,2,6 // mov %al,0x6(%rdx,%r8,1) @@ -57002,17 +57551,17 @@ _sk_store_a8_sse2_8bit: .byte 102,15,127,100,36,200 // movdqa %xmm4,-0x38(%rsp) .byte 138,68,36,208 // mov -0x30(%rsp),%al .byte 66,136,68,2,4 // mov %al,0x4(%rdx,%r8,1) - .byte 102,15,219,37,163,48,0,0 // pand 0x30a3(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,37,187,48,0,0 // pand 0x30bb(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1) - .byte 233,97,255,255,255 // jmpq 2865d <_sk_store_a8_sse2_8bit+0x59> + .byte 233,97,255,255,255 // jmpq 28c45 <_sk_store_a8_sse2_8bit+0x59> .byte 134,255 // xchg %bh,%bh .byte 255 // (bad) .byte 255,165,255,255,255,150 // jmpq *-0x69000001(%rbp) .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,218 // jmpq ffffffffdb02870c <_sk_overlay_sse2_8bit+0xffffffffdaffdd4b> + .byte 233,255,255,255,218 // jmpq ffffffffdb028cf4 <_sk_overlay_sse2_8bit+0xffffffffdaffdd3f> .byte 255 // (bad) .byte 255 // (bad) .byte 255,203 // dec %ebx @@ -57036,15 +57585,15 @@ _sk_load_g8_sse2_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,116 // jne 287a9 <_sk_load_g8_sse2_8bit+0x91> + .byte 117,116 // jne 28d91 <_sk_load_g8_sse2_8bit+0x91> .byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 - .byte 102,15,84,5,73,48,0,0 // andpd 0x3049(%rip),%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,84,5,97,48,0,0 // andpd 0x3061(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,40,224 // movapd %xmm0,%xmm4 .byte 102,15,97,225 // punpcklwd %xmm1,%xmm4 .byte 102,15,105,193 // punpckhwd %xmm1,%xmm0 - .byte 102,15,111,45,129,55,0,0 // movdqa 0x3781(%rip),%xmm5 # 2bee0 <_sk_overlay_sse2_8bit+0x151f> + .byte 102,15,111,45,153,55,0,0 // movdqa 0x3799(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b> .byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6 .byte 102,15,244,197 // pmuludq %xmm5,%xmm0 .byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1 @@ -57057,7 +57606,7 @@ _sk_load_g8_sse2_8bit: .byte 102,15,244,245 // pmuludq %xmm5,%xmm6 .byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4 .byte 102,15,98,196 // punpckldq %xmm4,%xmm0 - .byte 102,15,111,37,3,55,0,0 // movdqa 0x3703(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,37,27,55,0,0 // movdqa 0x371b(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,235,196 // por %xmm4,%xmm0 .byte 102,15,235,204 // por %xmm4,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax @@ -57066,15 +57615,15 @@ _sk_load_g8_sse2_8bit: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,133 // ja 2873f <_sk_load_g8_sse2_8bit+0x27> + .byte 119,133 // ja 28d27 <_sk_load_g8_sse2_8bit+0x27> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 2883c <_sk_load_g8_sse2_8bit+0x124> + .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28e24 <_sk_load_g8_sse2_8bit+0x124> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 233,99,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27> + .byte 233,99,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0 @@ -57082,7 +57631,7 @@ _sk_load_g8_sse2_8bit: .byte 102,15,110,200 // movd %eax,%xmm1 .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 243,15,16,193 // movss %xmm1,%xmm0 - .byte 233,62,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27> + .byte 233,62,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0 @@ -57093,7 +57642,7 @@ _sk_load_g8_sse2_8bit: .byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1 .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 233,6,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27> + .byte 233,6,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27> .byte 15,31,0 // nopl (%rax) .byte 146 // xchg %eax,%edx .byte 255 // (bad) @@ -57128,15 +57677,15 @@ _sk_load_g8_dst_sse2_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 117,116 // jne 288e9 <_sk_load_g8_dst_sse2_8bit+0x91> + .byte 117,116 // jne 28ed1 <_sk_load_g8_dst_sse2_8bit+0x91> .byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2 .byte 102,15,96,208 // punpcklbw %xmm0,%xmm2 - .byte 102,15,84,21,9,47,0,0 // andpd 0x2f09(%rip),%xmm2 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,84,21,33,47,0,0 // andpd 0x2f21(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,40,226 // movapd %xmm2,%xmm4 .byte 102,15,97,227 // punpcklwd %xmm3,%xmm4 .byte 102,15,105,211 // punpckhwd %xmm3,%xmm2 - .byte 102,15,111,45,65,54,0,0 // movdqa 0x3641(%rip),%xmm5 # 2bee0 <_sk_overlay_sse2_8bit+0x151f> + .byte 102,15,111,45,89,54,0,0 // movdqa 0x3659(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b> .byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6 .byte 102,15,244,213 // pmuludq %xmm5,%xmm2 .byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3 @@ -57149,7 +57698,7 @@ _sk_load_g8_dst_sse2_8bit: .byte 102,15,244,245 // pmuludq %xmm5,%xmm6 .byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4 .byte 102,15,98,212 // punpckldq %xmm4,%xmm2 - .byte 102,15,111,37,195,53,0,0 // movdqa 0x35c3(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 102,15,111,37,219,53,0,0 // movdqa 0x35db(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 102,15,235,212 // por %xmm4,%xmm2 .byte 102,15,235,220 // por %xmm4,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -57158,15 +57707,15 @@ _sk_load_g8_dst_sse2_8bit: .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,133 // ja 2887f <_sk_load_g8_dst_sse2_8bit+0x27> + .byte 119,133 // ja 28e67 <_sk_load_g8_dst_sse2_8bit+0x27> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 2897c <_sk_load_g8_dst_sse2_8bit+0x124> + .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28f64 <_sk_load_g8_dst_sse2_8bit+0x124> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,208 // movd %eax,%xmm2 - .byte 233,99,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27> + .byte 233,99,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2 @@ -57174,7 +57723,7 @@ _sk_load_g8_dst_sse2_8bit: .byte 102,15,110,216 // movd %eax,%xmm3 .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3 .byte 243,15,16,211 // movss %xmm3,%xmm2 - .byte 233,62,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27> + .byte 233,62,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2 @@ -57185,7 +57734,7 @@ _sk_load_g8_dst_sse2_8bit: .byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3 .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3 .byte 242,15,16,211 // movsd %xmm3,%xmm2 - .byte 233,6,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27> + .byte 233,6,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27> .byte 15,31,0 // nopl (%rax) .byte 146 // xchg %eax,%edx .byte 255 // (bad) @@ -57221,7 +57770,7 @@ _sk_srcover_rgba_8888_sse2_8bit: .byte 72,193,226,2 // shl $0x2,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,192 // test %r8,%r8 - .byte 15,133,253,0,0,0 // jne 28aba <_sk_srcover_rgba_8888_sse2_8bit+0x122> + .byte 15,133,253,0,0,0 // jne 290a2 <_sk_srcover_rgba_8888_sse2_8bit+0x122> .byte 70,15,16,68,138,16 // movups 0x10(%rdx,%r9,4),%xmm8 .byte 102,70,15,16,12,138 // movupd (%rdx,%r9,4),%xmm9 .byte 77,133,192 // test %r8,%r8 @@ -57270,7 +57819,7 @@ _sk_srcover_rgba_8888_sse2_8bit: .byte 102,68,15,248,207 // psubb %xmm7,%xmm9 .byte 102,68,15,252,200 // paddb %xmm0,%xmm9 .byte 102,68,15,252,193 // paddb %xmm1,%xmm8 - .byte 117,72 // jne 28af1 <_sk_srcover_rgba_8888_sse2_8bit+0x159> + .byte 117,72 // jne 290d9 <_sk_srcover_rgba_8888_sse2_8bit+0x159> .byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4) .byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -57281,29 +57830,29 @@ _sk_srcover_rgba_8888_sse2_8bit: .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 254,200 // dec %al .byte 60,6 // cmp $0x6,%al - .byte 15,135,246,254,255,255 // ja 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31> + .byte 15,135,246,254,255,255 // ja 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31> .byte 15,182,192 // movzbl %al,%eax - .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 28bac <_sk_srcover_rgba_8888_sse2_8bit+0x214> + .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 29194 <_sk_srcover_rgba_8888_sse2_8bit+0x214> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 243,70,15,16,12,138 // movss (%rdx,%r9,4),%xmm9 - .byte 233,216,254,255,255 // jmpq 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31> + .byte 233,216,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31> .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,184 // ja 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + .byte 119,184 // ja 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e> .byte 65,15,182,192 // movzbl %r8b,%eax - .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 28bc8 <_sk_srcover_rgba_8888_sse2_8bit+0x230> + .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 291b0 <_sk_srcover_rgba_8888_sse2_8bit+0x230> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4) - .byte 235,156 // jmp 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + .byte 235,156 // jmp 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e> .byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4 .byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9 .byte 102,70,15,18,12,138 // movlpd (%rdx,%r9,4),%xmm9 - .byte 233,151,254,255,255 // jmpq 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31> + .byte 233,151,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31> .byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4 .byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8 .byte 243,66,15,16,100,138,20 // movss 0x14(%rdx,%r9,4),%xmm4 @@ -57312,23 +57861,23 @@ _sk_srcover_rgba_8888_sse2_8bit: .byte 68,15,40,196 // movaps %xmm4,%xmm8 .byte 243,66,15,16,100,138,16 // movss 0x10(%rdx,%r9,4),%xmm4 .byte 243,68,15,16,196 // movss %xmm4,%xmm8 - .byte 233,94,254,255,255 // jmpq 289c3 <_sk_srcover_rgba_8888_sse2_8bit+0x2b> + .byte 233,94,254,255,255 // jmpq 28fab <_sk_srcover_rgba_8888_sse2_8bit+0x2b> .byte 102,65,15,112,225,78 // pshufd $0x4e,%xmm9,%xmm4 .byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4) .byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4) - .byte 233,57,255,255,255 // jmpq 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + .byte 233,57,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e> .byte 102,65,15,112,224,78 // pshufd $0x4e,%xmm8,%xmm4 .byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4) .byte 102,65,15,112,224,229 // pshufd $0xe5,%xmm8,%xmm4 .byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4) .byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4) .byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4) - .byte 233,13,255,255,255 // jmpq 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + .byte 233,13,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e> .byte 15,31,0 // nopl (%rax) .byte 58,255 // cmp %bh,%bh .byte 255 // (bad) .byte 255 // (bad) - .byte 123,255 // jnp 28bb1 <_sk_srcover_rgba_8888_sse2_8bit+0x219> + .byte 123,255 // jnp 29199 <_sk_srcover_rgba_8888_sse2_8bit+0x219> .byte 255 // (bad) .byte 255,110,255 // ljmp *-0x1(%rsi) .byte 255 // (bad) @@ -57366,7 +57915,7 @@ _sk_scale_1_float_sse2_8bit: .byte 102,68,15,111,200 // movdqa %xmm0,%xmm9 .byte 72,173 // lods %ds:(%rsi),%rax .byte 243,15,16,0 // movss (%rax),%xmm0 - .byte 243,15,89,5,52,34,0,0 // mulss 0x2234(%rip),%xmm0 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 243,15,89,5,64,34,0,0 // mulss 0x2240(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 243,15,44,192 // cvttss2si %xmm0,%eax .byte 102,15,239,246 // pxor %xmm6,%xmm6 .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 @@ -57378,7 +57927,7 @@ _sk_scale_1_float_sse2_8bit: .byte 102,15,96,246 // punpcklbw %xmm6,%xmm6 .byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6 .byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6 - .byte 102,15,219,53,91,43,0,0 // pand 0x2b5b(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,219,53,115,43,0,0 // pand 0x2b73(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,111,254 // movdqa %xmm6,%xmm7 .byte 102,65,15,213,248 // pmullw %xmm8,%xmm7 .byte 102,15,111,230 // movdqa %xmm6,%xmm4 @@ -57411,10 +57960,10 @@ _sk_scale_u8_sse2_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 15,133,239,0,0,0 // jne 28d95 <_sk_scale_u8_sse2_8bit+0x110> + .byte 15,133,239,0,0,0 // jne 2937d <_sk_scale_u8_sse2_8bit+0x110> .byte 243,66,15,126,36,2 // movq (%rdx,%r8,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 - .byte 102,15,84,37,216,42,0,0 // andpd 0x2ad8(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,84,37,240,42,0,0 // andpd 0x2af0(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,15,40,236 // movapd %xmm4,%xmm5 .byte 102,65,15,105,232 // punpckhwd %xmm8,%xmm5 @@ -57467,15 +58016,15 @@ _sk_scale_u8_sse2_8bit: .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,6,255,255,255 // ja 28cb0 <_sk_scale_u8_sse2_8bit+0x2b> + .byte 15,135,6,255,255,255 // ja 29298 <_sk_scale_u8_sse2_8bit+0x2b> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28e2c <_sk_scale_u8_sse2_8bit+0x1a7> + .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 29414 <_sk_scale_u8_sse2_8bit+0x1a7> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,224 // movd %eax,%xmm4 - .byte 233,228,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b> + .byte 233,228,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,196,224,2 // pinsrw $0x2,%eax,%xmm4 @@ -57483,7 +58032,7 @@ _sk_scale_u8_sse2_8bit: .byte 102,15,110,232 // movd %eax,%xmm5 .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 243,15,16,229 // movss %xmm5,%xmm4 - .byte 233,191,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b> + .byte 233,191,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 102,15,196,224,6 // pinsrw $0x6,%eax,%xmm4 @@ -57494,7 +58043,7 @@ _sk_scale_u8_sse2_8bit: .byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5 .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 233,135,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b> + .byte 233,135,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b> .byte 15,31,0 // nopl (%rax) .byte 146 // xchg %eax,%edx .byte 255 // (bad) @@ -57523,7 +58072,7 @@ FUNCTION(_sk_lerp_1_float_sse2_8bit) _sk_lerp_1_float_sse2_8bit: .byte 72,173 // lods %ds:(%rsi),%rax .byte 243,15,16,32 // movss (%rax),%xmm4 - .byte 243,15,89,37,218,31,0,0 // mulss 0x1fda(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f> + .byte 243,15,89,37,230,31,0,0 // mulss 0x1fe6(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f> .byte 243,15,44,196 // cvttss2si %xmm4,%eax .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,96,228 // punpcklbw %xmm4,%xmm4 @@ -57536,7 +58085,7 @@ _sk_lerp_1_float_sse2_8bit: .byte 102,68,15,111,217 // movdqa %xmm1,%xmm11 .byte 102,69,15,96,217 // punpcklbw %xmm9,%xmm11 .byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1 - .byte 102,15,111,53,249,40,0,0 // movdqa 0x28f9(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,111,53,17,41,0,0 // movdqa 0x2911(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,65,15,219,240 // pand %xmm8,%xmm6 .byte 102,15,111,230 // movdqa %xmm6,%xmm4 .byte 102,15,213,225 // pmullw %xmm1,%xmm4 @@ -57601,10 +58150,10 @@ _sk_lerp_u8_sse2_8bit: .byte 72,15,175,209 // imul %rcx,%rdx .byte 72,3,16 // add (%rax),%rdx .byte 77,133,201 // test %r9,%r9 - .byte 15,133,141,1,0,0 // jne 2912c <_sk_lerp_u8_sse2_8bit+0x1ae> + .byte 15,133,141,1,0,0 // jne 29714 <_sk_lerp_u8_sse2_8bit+0x1ae> .byte 243,66,15,126,44,2 // movq (%rdx,%r8,1),%xmm5 .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 - .byte 102,15,84,45,223,39,0,0 // andpd 0x27df(%rip),%xmm5 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,84,45,247,39,0,0 // andpd 0x27f7(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,15,40,229 // movapd %xmm5,%xmm4 .byte 102,65,15,105,224 // punpckhwd %xmm8,%xmm4 @@ -57690,15 +58239,15 @@ _sk_lerp_u8_sse2_8bit: .byte 102,15,239,237 // pxor %xmm5,%xmm5 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,104,254,255,255 // ja 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b> + .byte 15,135,104,254,255,255 // ja 29591 <_sk_lerp_u8_sse2_8bit+0x2b> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 291c0 <_sk_lerp_u8_sse2_8bit+0x242> + .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 297a8 <_sk_lerp_u8_sse2_8bit+0x242> .byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax .byte 72,1,200 // add %rcx,%rax .byte 255,224 // jmpq *%rax .byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax .byte 102,15,110,232 // movd %eax,%xmm5 - .byte 233,70,254,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b> + .byte 233,70,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b> .byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax .byte 102,15,239,237 // pxor %xmm5,%xmm5 .byte 102,15,196,232,2 // pinsrw $0x2,%eax,%xmm5 @@ -57706,7 +58255,7 @@ _sk_lerp_u8_sse2_8bit: .byte 102,15,110,224 // movd %eax,%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 243,15,16,236 // movss %xmm4,%xmm5 - .byte 233,33,254,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b> + .byte 233,33,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b> .byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax .byte 102,15,239,237 // pxor %xmm5,%xmm5 .byte 102,15,196,232,6 // pinsrw $0x6,%eax,%xmm5 @@ -57717,7 +58266,7 @@ _sk_lerp_u8_sse2_8bit: .byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 242,15,16,236 // movsd %xmm4,%xmm5 - .byte 233,233,253,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b> + .byte 233,233,253,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b> .byte 149 // xchg %eax,%ebp .byte 255 // (bad) .byte 255 // (bad) @@ -57762,7 +58311,7 @@ HIDDEN _sk_black_color_sse2_8bit FUNCTION(_sk_black_color_sse2_8bit) _sk_black_color_sse2_8bit: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,5,167,44,0,0 // movaps 0x2ca7(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df> + .byte 15,40,5,191,44,0,0 // movaps 0x2cbf(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 255,224 // jmpq *%rax @@ -58559,6 +59108,15 @@ _sk_xor__sse2_8bit: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_plus__sse2_8bit +.globl _sk_plus__sse2_8bit +FUNCTION(_sk_plus__sse2_8bit) +_sk_plus__sse2_8bit: + .byte 102,15,220,194 // paddusb %xmm2,%xmm0 + .byte 102,15,220,203 // paddusb %xmm3,%xmm1 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_darken_sse2_8bit .globl _sk_darken_sse2_8bit FUNCTION(_sk_darken_sse2_8bit) @@ -58654,7 +59212,7 @@ _sk_darken_sse2_8bit: .byte 102,65,15,248,234 // psubb %xmm10,%xmm5 .byte 102,15,248,207 // psubb %xmm7,%xmm1 .byte 102,15,248,196 // psubb %xmm4,%xmm0 - .byte 102,15,111,37,66,30,0,0 // movdqa 0x1e42(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 102,15,111,37,78,30,0,0 // movdqa 0x1e4e(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 102,15,111,252 // movdqa %xmm4,%xmm7 .byte 102,15,223,248 // pandn %xmm0,%xmm7 @@ -58762,7 +59320,7 @@ _sk_lighten_sse2_8bit: .byte 102,65,15,248,234 // psubb %xmm10,%xmm5 .byte 102,15,248,207 // psubb %xmm7,%xmm1 .byte 102,15,248,196 // psubb %xmm4,%xmm0 - .byte 102,15,111,37,86,28,0,0 // movdqa 0x1c56(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 102,15,111,37,98,28,0,0 // movdqa 0x1c62(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 102,15,111,252 // movdqa %xmm4,%xmm7 .byte 102,15,223,248 // pandn %xmm0,%xmm7 @@ -58812,7 +59370,7 @@ _sk_exclusion_sse2_8bit: .byte 102,15,113,214,8 // psrlw $0x8,%xmm6 .byte 102,15,103,244 // packuswb %xmm4,%xmm6 .byte 102,15,103,239 // packuswb %xmm7,%xmm5 - .byte 102,15,111,37,137,27,0,0 // movdqa 0x1b89(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 102,15,111,37,149,27,0,0 // movdqa 0x1b95(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,15,248,205 // psubb %xmm5,%xmm1 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 102,15,219,230 // pand %xmm6,%xmm4 @@ -58911,7 +59469,7 @@ _sk_difference_sse2_8bit: .byte 102,65,15,103,244 // packuswb %xmm12,%xmm6 .byte 102,65,15,218,226 // pminub %xmm10,%xmm4 .byte 102,65,15,218,243 // pminub %xmm11,%xmm6 - .byte 102,15,111,45,198,25,0,0 // movdqa 0x19c6(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0x156f> + .byte 102,15,111,45,210,25,0,0 // movdqa 0x19d2(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b> .byte 102,15,248,206 // psubb %xmm6,%xmm1 .byte 102,15,219,245 // pand %xmm5,%xmm6 .byte 102,15,219,236 // pand %xmm4,%xmm5 @@ -59008,7 +59566,7 @@ _sk_hardlight_sse2_8bit: .byte 102,68,15,111,220 // movdqa %xmm4,%xmm11 .byte 102,69,15,217,211 // psubusw %xmm11,%xmm10 .byte 102,68,15,117,213 // pcmpeqw %xmm5,%xmm10 - .byte 102,15,111,45,97,16,0,0 // movdqa 0x1061(%rip),%xmm5 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,111,45,109,16,0,0 // movdqa 0x106d(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,111,198 // movdqa %xmm6,%xmm0 .byte 102,15,239,197 // pxor %xmm5,%xmm0 .byte 102,65,15,213,198 // pmullw %xmm14,%xmm0 @@ -59112,7 +59670,7 @@ _sk_hardlight_sse2_8bit: .byte 102,68,15,253,124,36,32 // paddw 0x20(%rsp),%xmm15 .byte 102,68,15,253,76,36,144 // paddw -0x70(%rsp),%xmm9 .byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5 - .byte 102,15,111,5,5,22,0,0 // movdqa 0x1605(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f> + .byte 102,15,111,5,17,22,0,0 // movdqa 0x1611(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b> .byte 102,15,253,208 // paddw %xmm0,%xmm2 .byte 102,68,15,253,210 // paddw %xmm2,%xmm10 .byte 102,68,15,253,248 // paddw %xmm0,%xmm15 @@ -59121,7 +59679,7 @@ _sk_hardlight_sse2_8bit: .byte 102,69,15,253,193 // paddw %xmm9,%xmm8 .byte 102,15,253,232 // paddw %xmm0,%xmm5 .byte 102,15,253,233 // paddw %xmm1,%xmm5 - .byte 102,15,111,5,232,21,0,0 // movdqa 0x15e8(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f> + .byte 102,15,111,5,244,21,0,0 // movdqa 0x15f4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b> .byte 102,15,228,232 // pmulhuw %xmm0,%xmm5 .byte 102,68,15,228,192 // pmulhuw %xmm0,%xmm8 .byte 102,68,15,228,248 // pmulhuw %xmm0,%xmm15 @@ -59226,7 +59784,7 @@ _sk_overlay_sse2_8bit: .byte 102,15,217,234 // psubusw %xmm2,%xmm5 .byte 102,15,117,236 // pcmpeqw %xmm4,%xmm5 .byte 102,15,127,108,36,32 // movdqa %xmm5,0x20(%rsp) - .byte 102,15,111,53,49,12,0,0 // movdqa 0xc31(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf> + .byte 102,15,111,53,61,12,0,0 // movdqa 0xc3d(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb> .byte 102,15,111,194 // movdqa %xmm2,%xmm0 .byte 102,15,239,198 // pxor %xmm6,%xmm0 .byte 102,65,15,213,199 // pmullw %xmm15,%xmm0 @@ -59334,7 +59892,7 @@ _sk_overlay_sse2_8bit: .byte 102,68,15,253,92,36,240 // paddw -0x10(%rsp),%xmm11 .byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5 .byte 102,15,253,116,36,144 // paddw -0x70(%rsp),%xmm6 - .byte 102,15,111,5,196,17,0,0 // movdqa 0x11c4(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f> + .byte 102,15,111,5,208,17,0,0 // movdqa 0x11d0(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b> .byte 102,68,15,253,224 // paddw %xmm0,%xmm12 .byte 102,68,15,253,227 // paddw %xmm3,%xmm12 .byte 102,68,15,253,216 // paddw %xmm0,%xmm11 @@ -59343,7 +59901,7 @@ _sk_overlay_sse2_8bit: .byte 102,15,253,234 // paddw %xmm2,%xmm5 .byte 102,15,253,240 // paddw %xmm0,%xmm6 .byte 102,15,253,241 // paddw %xmm1,%xmm6 - .byte 102,15,111,5,168,17,0,0 // movdqa 0x11a8(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f> + .byte 102,15,111,5,180,17,0,0 // movdqa 0x11b4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b> .byte 102,15,228,240 // pmulhuw %xmm0,%xmm6 .byte 102,15,228,232 // pmulhuw %xmm0,%xmm5 .byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11 @@ -59377,14 +59935,14 @@ BALIGN4 .byte 252 // cld .byte 190,0,0,128,191 // mov $0xbf800000,%esi .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 2ae64 <.literal4+0x64> + .byte 224,64 // loopne 2b458 <.literal4+0x64> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 2ae6d <.literal4+0x6d> + .byte 71,225,61 // rex.RXB loope 2b461 <.literal4+0x6d> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 2ae77 <.literal4+0x77> + .byte 127,67 // jg 2b46b <.literal4+0x77> .byte 145 // xchg %eax,%ecx .byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi) .byte 10,215 // or %bh,%dl @@ -59417,7 +59975,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 2ae8d <.literal4+0x8d> + .byte 224,7 // loopne 2b481 <.literal4+0x8d> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -59428,8 +59986,8 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 2aea0 <.literal4+0xa0> - .byte 119,115 // ja 2af15 <.literal4+0x115> + .byte 127,0 // jg 2b494 <.literal4+0xa0> + .byte 119,115 // ja 2b509 <.literal4+0x115> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -59452,12 +60010,12 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 2af2b <.literal4+0x12b> + .byte 118,63 // jbe 2b51f <.literal4+0x12b> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 2af3a <.literal4+0x13a> + .byte 124,66 // jl 2b52e <.literal4+0x13a> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -59467,9 +60025,9 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 2af5d <.literal4+0x15d> + .byte 112,65 // jo 2b551 <.literal4+0x15d> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 2af67 <.literal4+0x167> + .byte 127,71 // jg 2b55b <.literal4+0x167> .byte 208 // (bad) .byte 179,89 // mov $0x59,%bl .byte 62,89 // ds pop %rcx @@ -59496,15 +60054,15 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 128,0,0 // addb $0x0,(%rax) .byte 0,191,0,0,192,191 // add %bh,-0x40400000(%rdi) - .byte 114,28 // jb 2af86 <.literal4+0x186> + .byte 114,28 // jb 2b57a <.literal4+0x186> .byte 199 // (bad) .byte 62,0,0 // add %al,%ds:(%rax) .byte 192,63,85 // sarb $0x55,(%rdi) .byte 85 // push %rbp .byte 149 // xchg %eax,%ebp .byte 191,57,142,99,61 // mov $0x3d638e39,%edi - .byte 114,249 // jb 2af73 <.literal4+0x173> - .byte 127,63 // jg 2afbb <_sk_overlay_sse2_8bit+0x5fa> + .byte 114,249 // jb 2b567 <.literal4+0x173> + .byte 127,63 // jg 2b5af <_sk_overlay_sse2_8bit+0x5fa> .byte 3,0 // add (%rax),%eax .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,4 // add %al,0x4000000(%rax) @@ -59540,16 +60098,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02afc8 <_sk_overlay_sse2_8bit+0xa000607> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b5c8 <_sk_overlay_sse2_8bit+0xa000613> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202afd0 <_sk_overlay_sse2_8bit+0x1200060f> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b5d0 <_sk_overlay_sse2_8bit+0x1200061b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02afd8 <_sk_overlay_sse2_8bit+0x1a000617> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b5d8 <_sk_overlay_sse2_8bit+0x1a000623> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302afe0 <_sk_overlay_sse2_8bit+0x300061f> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b5e0 <_sk_overlay_sse2_8bit+0x300062b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -59592,16 +60150,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b028 <_sk_overlay_sse2_8bit+0xa000667> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b628 <_sk_overlay_sse2_8bit+0xa000673> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b030 <_sk_overlay_sse2_8bit+0x1200066f> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b630 <_sk_overlay_sse2_8bit+0x1200067b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b038 <_sk_overlay_sse2_8bit+0x1a000677> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b638 <_sk_overlay_sse2_8bit+0x1a000683> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b040 <_sk_overlay_sse2_8bit+0x300067f> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b640 <_sk_overlay_sse2_8bit+0x300068b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -59644,16 +60202,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b088 <_sk_overlay_sse2_8bit+0xa0006c7> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b688 <_sk_overlay_sse2_8bit+0xa0006d3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b090 <_sk_overlay_sse2_8bit+0x120006cf> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b690 <_sk_overlay_sse2_8bit+0x120006db> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b098 <_sk_overlay_sse2_8bit+0x1a0006d7> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b698 <_sk_overlay_sse2_8bit+0x1a0006e3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b0a0 <_sk_overlay_sse2_8bit+0x30006df> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b6a0 <_sk_overlay_sse2_8bit+0x30006eb> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -59696,16 +60254,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b0e8 <_sk_overlay_sse2_8bit+0xa000727> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b6e8 <_sk_overlay_sse2_8bit+0xa000733> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b0f0 <_sk_overlay_sse2_8bit+0x1200072f> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b6f0 <_sk_overlay_sse2_8bit+0x1200073b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b0f8 <_sk_overlay_sse2_8bit+0x1a000737> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b6f8 <_sk_overlay_sse2_8bit+0x1a000743> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b100 <_sk_overlay_sse2_8bit+0x300073f> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b700 <_sk_overlay_sse2_8bit+0x300074b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -59748,16 +60306,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b148 <_sk_overlay_sse2_8bit+0xa000787> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b748 <_sk_overlay_sse2_8bit+0xa000793> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b150 <_sk_overlay_sse2_8bit+0x1200078f> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b750 <_sk_overlay_sse2_8bit+0x1200079b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b158 <_sk_overlay_sse2_8bit+0x1a000797> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b758 <_sk_overlay_sse2_8bit+0x1a0007a3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b160 <_sk_overlay_sse2_8bit+0x300079f> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b760 <_sk_overlay_sse2_8bit+0x30007ab> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -59800,16 +60358,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b1a8 <_sk_overlay_sse2_8bit+0xa0007e7> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b7a8 <_sk_overlay_sse2_8bit+0xa0007f3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b1b0 <_sk_overlay_sse2_8bit+0x120007ef> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b7b0 <_sk_overlay_sse2_8bit+0x120007fb> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b1b8 <_sk_overlay_sse2_8bit+0x1a0007f7> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b7b8 <_sk_overlay_sse2_8bit+0x1a000803> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b1c0 <_sk_overlay_sse2_8bit+0x30007ff> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b7c0 <_sk_overlay_sse2_8bit+0x300080b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -59852,16 +60410,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b208 <_sk_overlay_sse2_8bit+0xa000847> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b808 <_sk_overlay_sse2_8bit+0xa000853> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b210 <_sk_overlay_sse2_8bit+0x1200084f> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b810 <_sk_overlay_sse2_8bit+0x1200085b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b218 <_sk_overlay_sse2_8bit+0x1a000857> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b818 <_sk_overlay_sse2_8bit+0x1a000863> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b220 <_sk_overlay_sse2_8bit+0x300085f> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b820 <_sk_overlay_sse2_8bit+0x300086b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -59904,16 +60462,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b268 <_sk_overlay_sse2_8bit+0xa0008a7> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b868 <_sk_overlay_sse2_8bit+0xa0008b3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b270 <_sk_overlay_sse2_8bit+0x120008af> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b870 <_sk_overlay_sse2_8bit+0x120008bb> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b278 <_sk_overlay_sse2_8bit+0x1a0008b7> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b878 <_sk_overlay_sse2_8bit+0x1a0008c3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b280 <_sk_overlay_sse2_8bit+0x30008bf> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b880 <_sk_overlay_sse2_8bit+0x30008cb> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -60750,11 +61308,11 @@ BALIGN16 .byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax) .byte 191,0,0,224,64 // mov $0x40e00000,%edi .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 2b888 <.literal16+0xf8> + .byte 224,64 // loopne 2be88 <.literal16+0xf8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 2b88c <.literal16+0xfc> + .byte 224,64 // loopne 2be8c <.literal16+0xfc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 2b890 <.literal16+0x100> + .byte 224,64 // loopne 2be90 <.literal16+0x100> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -60774,13 +61332,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 2b8b1 <.literal16+0x121> + .byte 71,225,61 // rex.RXB loope 2beb1 <.literal16+0x121> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 2b8b5 <.literal16+0x125> + .byte 71,225,61 // rex.RXB loope 2beb5 <.literal16+0x125> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 2b8b9 <.literal16+0x129> + .byte 71,225,61 // rex.RXB loope 2beb9 <.literal16+0x129> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 2b8bd <.literal16+0x12d> + .byte 71,225,61 // rex.RXB loope 2bebd <.literal16+0x12d> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -60791,10 +61349,10 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b898 <_sk_overlay_sse2_8bit+0xa000ed7> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02be98 <_sk_overlay_sse2_8bit+0xa000ee3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302b8a0 <_sk_overlay_sse2_8bit+0x3000edf> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302bea0 <_sk_overlay_sse2_8bit+0x3000eeb> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -60809,11 +61367,11 @@ BALIGN16 .byte 255,0 // incl (%rax) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 2b8fb <.literal16+0x16b> + .byte 127,67 // jg 2befb <.literal16+0x16b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 2b8ff <.literal16+0x16f> + .byte 127,67 // jg 2beff <.literal16+0x16f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 2b903 <.literal16+0x173> + .byte 127,67 // jg 2bf03 <.literal16+0x173> .byte 145 // xchg %eax,%ecx .byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi) .byte 145 // xchg %eax,%ecx @@ -60964,13 +61522,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 2ba09 <.literal16+0x279> + .byte 224,7 // loopne 2c009 <.literal16+0x279> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 2ba0d <.literal16+0x27d> + .byte 224,7 // loopne 2c00d <.literal16+0x27d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 2ba11 <.literal16+0x281> + .byte 224,7 // loopne 2c011 <.literal16+0x281> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 2ba15 <.literal16+0x285> + .byte 224,7 // loopne 2c015 <.literal16+0x285> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -61030,17 +61588,17 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 2ba94 <.literal16+0x304> + .byte 127,0 // jg 2c094 <.literal16+0x304> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 2ba98 <.literal16+0x308> + .byte 127,0 // jg 2c098 <.literal16+0x308> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 2ba9c <.literal16+0x30c> + .byte 127,0 // jg 2c09c <.literal16+0x30c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 2baa0 <.literal16+0x310> - .byte 119,115 // ja 2bb15 <.literal16+0x385> + .byte 127,0 // jg 2c0a0 <.literal16+0x310> + .byte 119,115 // ja 2c115 <.literal16+0x385> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -61051,7 +61609,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 2ba79 <.literal16+0x2e9> + .byte 117,191 // jne 2c079 <.literal16+0x2e9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -61063,7 +61621,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a5faba <_sk_overlay_sse2_8bit+0xffffffffe9a350f9> + .byte 233,220,63,163,233 // jmpq ffffffffe9a600ba <_sk_overlay_sse2_8bit+0xffffffffe9a35105> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -61153,16 +61711,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 2bc03 <.literal16+0x473> + .byte 118,63 // jbe 2c203 <.literal16+0x473> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 2bc07 <.literal16+0x477> + .byte 118,63 // jbe 2c207 <.literal16+0x477> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 2bc0b <.literal16+0x47b> + .byte 118,63 // jbe 2c20b <.literal16+0x47b> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 2bc0f <.literal16+0x47f> + .byte 118,63 // jbe 2c20f <.literal16+0x47f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -61183,13 +61741,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 2bc46 <.literal16+0x4b6> + .byte 124,66 // jl 2c246 <.literal16+0x4b6> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 2bc4a <.literal16+0x4ba> + .byte 124,66 // jl 2c24a <.literal16+0x4ba> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 2bc4e <.literal16+0x4be> + .byte 124,66 // jl 2c24e <.literal16+0x4be> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 2bc52 <.literal16+0x4c2> + .byte 124,66 // jl 2c252 <.literal16+0x4c2> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -61235,13 +61793,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 2bcd5 <.literal16+0x545> + .byte 112,65 // jo 2c2d5 <.literal16+0x545> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 2bcd9 <.literal16+0x549> + .byte 112,65 // jo 2c2d9 <.literal16+0x549> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 2bcdd <.literal16+0x54d> + .byte 112,65 // jo 2c2dd <.literal16+0x54d> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 2bce1 <.literal16+0x551> + .byte 112,65 // jo 2c2e1 <.literal16+0x551> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -61280,13 +61838,13 @@ BALIGN16 .byte 64,254 // rex (bad) .byte 255,0 // incl (%rax) .byte 255 // (bad) - .byte 127,71 // jg 2bd4b <.literal16+0x5bb> + .byte 127,71 // jg 2c34b <.literal16+0x5bb> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 2bd4f <.literal16+0x5bf> + .byte 127,71 // jg 2c34f <.literal16+0x5bf> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 2bd53 <.literal16+0x5c3> + .byte 127,71 // jg 2c353 <.literal16+0x5c3> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 2bd57 <.literal16+0x5c7> + .byte 127,71 // jg 2c357 <.literal16+0x5c7> .byte 208 // (bad) .byte 179,89 // mov $0x59,%bl .byte 62,208 // ds (bad) @@ -61316,10 +61874,10 @@ BALIGN16 .byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax .byte 152 // cwtl .byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx) - .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2ce5a <_sk_overlay_sse2_8bit+0x2dc02499> + .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2d45a <_sk_overlay_sse2_8bit+0x2dc024a5> .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 2bd8c <.literal16+0x5fc> + .byte 120,57 // js 2c38c <.literal16+0x5fc> .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil @@ -61384,13 +61942,13 @@ BALIGN16 .byte 192,191,0,0,192,191,0 // sarb $0x0,-0x40400000(%rdi) .byte 0,192 // add %al,%al .byte 191,0,0,192,191 // mov $0xbfc00000,%edi - .byte 114,28 // jb 2be3e <.literal16+0x6ae> + .byte 114,28 // jb 2c43e <.literal16+0x6ae> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 2be42 <.literal16+0x6b2> + .byte 62,114,28 // jb,pt 2c442 <.literal16+0x6b2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 2be46 <.literal16+0x6b6> + .byte 62,114,28 // jb,pt 2c446 <.literal16+0x6b6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 2be4a <.literal16+0x6ba> + .byte 62,114,28 // jb,pt 2c44a <.literal16+0x6ba> .byte 199 // (bad) .byte 62,85 // ds push %rbp .byte 85 // push %rbp @@ -61409,15 +61967,15 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d664c95 <_sk_overlay_sse2_8bit+0x3d63a2d4> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d665295 <_sk_overlay_sse2_8bit+0x3d63a2e0> .byte 57,142,99,61,114,249 // cmp %ecx,-0x68dc29d(%rsi) - .byte 127,63 // jg 2bea3 <.literal16+0x713> - .byte 114,249 // jb 2be5f <.literal16+0x6cf> - .byte 127,63 // jg 2bea7 <.literal16+0x717> - .byte 114,249 // jb 2be63 <.literal16+0x6d3> - .byte 127,63 // jg 2beab <.literal16+0x71b> - .byte 114,249 // jb 2be67 <.literal16+0x6d7> - .byte 127,63 // jg 2beaf <.literal16+0x71f> + .byte 127,63 // jg 2c4a3 <.literal16+0x713> + .byte 114,249 // jb 2c45f <.literal16+0x6cf> + .byte 127,63 // jg 2c4a7 <.literal16+0x717> + .byte 114,249 // jb 2c463 <.literal16+0x6d3> + .byte 127,63 // jg 2c4ab <.literal16+0x71b> + .byte 114,249 // jb 2c467 <.literal16+0x6d7> + .byte 127,63 // jg 2c4af <.literal16+0x71f> .byte 3,0 // add (%rax),%eax .byte 0,0 // add %al,(%rax) .byte 3,0 // add (%rax),%eax @@ -61524,14 +62082,14 @@ BALIGN16 .byte 255 // (bad) .byte 255 // (bad) .byte 255,0 // incl (%rax) - .byte 127,0 // jg 2bf42 <.literal16+0x7b2> - .byte 127,0 // jg 2bf44 <.literal16+0x7b4> - .byte 127,0 // jg 2bf46 <.literal16+0x7b6> - .byte 127,0 // jg 2bf48 <.literal16+0x7b8> - .byte 127,0 // jg 2bf4a <.literal16+0x7ba> - .byte 127,0 // jg 2bf4c <.literal16+0x7bc> - .byte 127,0 // jg 2bf4e <.literal16+0x7be> - .byte 127,0 // jg 2bf50 <.literal16+0x7c0> + .byte 127,0 // jg 2c542 <.literal16+0x7b2> + .byte 127,0 // jg 2c544 <.literal16+0x7b4> + .byte 127,0 // jg 2c546 <.literal16+0x7b6> + .byte 127,0 // jg 2c548 <.literal16+0x7b8> + .byte 127,0 // jg 2c54a <.literal16+0x7ba> + .byte 127,0 // jg 2c54c <.literal16+0x7bc> + .byte 127,0 // jg 2c54e <.literal16+0x7be> + .byte 127,0 // jg 2c550 <.literal16+0x7c0> .byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax) .byte 129 // .byte 0x81 .byte 128 // .byte 0x80 @@ -61629,7 +62187,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,2 // movd (%edx),%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,144,230,144,0,0 // movaps 0x90e6(%eax),%xmm2 + .byte 15,40,144,102,146,0,0 // movaps 0x9266(%eax),%xmm2 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,6 // movups (%esi),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -61644,7 +62202,7 @@ _sk_seed_shader_sse2: .byte 15,41,82,32 // movaps %xmm2,0x20(%edx) .byte 15,41,82,16 // movaps %xmm2,0x10(%edx) .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,144,246,144,0,0 // movaps 0x90f6(%eax),%xmm2 + .byte 15,40,144,118,146,0,0 // movaps 0x9276(%eax),%xmm2 .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 86 // push %esi .byte 82 // push %edx @@ -61677,16 +62235,16 @@ _sk_dither_sse2: .byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4 .byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7 .byte 102,15,239,253 // pxor %xmm5,%xmm7 - .byte 102,15,111,177,137,144,0,0 // movdqa 0x9089(%ecx),%xmm6 + .byte 102,15,111,177,9,146,0,0 // movdqa 0x9209(%ecx),%xmm6 .byte 102,15,111,207 // movdqa %xmm7,%xmm1 .byte 102,15,219,206 // pand %xmm6,%xmm1 .byte 102,15,219,245 // pand %xmm5,%xmm6 - .byte 102,15,111,129,169,144,0,0 // movdqa 0x90a9(%ecx),%xmm0 + .byte 102,15,111,129,41,146,0,0 // movdqa 0x9229(%ecx),%xmm0 .byte 102,15,111,231 // movdqa %xmm7,%xmm4 .byte 102,15,219,224 // pand %xmm0,%xmm4 .byte 102,15,219,197 // pand %xmm5,%xmm0 - .byte 102,15,219,185,153,144,0,0 // pand 0x9099(%ecx),%xmm7 - .byte 102,15,219,169,153,144,0,0 // pand 0x9099(%ecx),%xmm5 + .byte 102,15,219,185,25,146,0,0 // pand 0x9219(%ecx),%xmm7 + .byte 102,15,219,169,25,146,0,0 // pand 0x9219(%ecx),%xmm5 .byte 102,15,114,246,4 // pslld $0x4,%xmm6 .byte 102,15,254,192 // paddd %xmm0,%xmm0 .byte 102,15,235,198 // por %xmm6,%xmm0 @@ -61701,8 +62259,8 @@ _sk_dither_sse2: .byte 102,15,114,215,1 // psrld $0x1,%xmm7 .byte 102,15,235,231 // por %xmm7,%xmm4 .byte 15,91,196 // cvtdq2ps %xmm4,%xmm0 - .byte 15,89,129,185,144,0,0 // mulps 0x90b9(%ecx),%xmm0 - .byte 15,88,129,201,144,0,0 // addps 0x90c9(%ecx),%xmm0 + .byte 15,89,129,57,146,0,0 // mulps 0x9239(%ecx),%xmm0 + .byte 15,88,129,73,146,0,0 // addps 0x9249(%ecx),%xmm0 .byte 243,15,16,14 // movss (%esi),%xmm1 .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1 .byte 15,89,200 // mulps %xmm0,%xmm1 @@ -61770,7 +62328,7 @@ _sk_black_color_sse2: .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 141,81,4 // lea 0x4(%ecx),%edx .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,152,153,143,0,0 // movaps 0x8f99(%eax),%xmm3 + .byte 15,40,152,25,145,0,0 // movaps 0x9119(%eax),%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,87,201 // xorps %xmm1,%xmm1 .byte 15,87,210 // xorps %xmm2,%xmm2 @@ -61793,7 +62351,7 @@ _sk_white_color_sse2: .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 141,81,4 // lea 0x4(%ecx),%edx .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,128,121,143,0,0 // movaps 0x8f79(%eax),%xmm0 + .byte 15,40,128,249,144,0,0 // movaps 0x90f9(%eax),%xmm0 .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,40,216 // movaps %xmm0,%xmm3 @@ -61883,7 +62441,7 @@ _sk_srcatop_sse2: .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 - .byte 15,40,170,218,142,0,0 // movaps 0x8eda(%edx),%xmm5 + .byte 15,40,170,90,144,0,0 // movaps 0x905a(%edx),%xmm5 .byte 15,92,235 // subps %xmm3,%xmm5 .byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6 .byte 15,89,245 // mulps %xmm5,%xmm6 @@ -61922,7 +62480,7 @@ _sk_dstatop_sse2: .byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5 .byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6 .byte 15,89,243 // mulps %xmm3,%xmm6 - .byte 15,40,162,139,142,0,0 // movaps 0x8e8b(%edx),%xmm4 + .byte 15,40,162,11,144,0,0 // movaps 0x900b(%edx),%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,88,198 // addps %xmm6,%xmm0 @@ -62006,7 +62564,7 @@ _sk_srcout_sse2: .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 139,85,8 // mov 0x8(%ebp),%edx - .byte 15,40,160,218,141,0,0 // movaps 0x8dda(%eax),%xmm4 + .byte 15,40,160,90,143,0,0 // movaps 0x8f5a(%eax),%xmm4 .byte 15,92,98,64 // subps 0x40(%edx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,89,204 // mulps %xmm4,%xmm1 @@ -62032,7 +62590,7 @@ _sk_dstout_sse2: .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 139,85,8 // mov 0x8(%ebp),%edx - .byte 15,40,160,178,141,0,0 // movaps 0x8db2(%eax),%xmm4 + .byte 15,40,160,50,143,0,0 // movaps 0x8f32(%eax),%xmm4 .byte 15,92,227 // subps %xmm3,%xmm4 .byte 15,40,66,16 // movaps 0x10(%edx),%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -62062,7 +62620,7 @@ _sk_srcover_sse2: .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 139,85,8 // mov 0x8(%ebp),%edx - .byte 15,40,160,123,141,0,0 // movaps 0x8d7b(%eax),%xmm4 + .byte 15,40,160,251,142,0,0 // movaps 0x8efb(%eax),%xmm4 .byte 15,92,227 // subps %xmm3,%xmm4 .byte 15,40,106,16 // movaps 0x10(%edx),%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -62096,7 +62654,7 @@ _sk_dstover_sse2: .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 15,40,106,64 // movaps 0x40(%edx),%xmm5 - .byte 15,40,160,59,141,0,0 // movaps 0x8d3b(%eax),%xmm4 + .byte 15,40,160,187,142,0,0 // movaps 0x8ebb(%eax),%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,88,66,16 // addps 0x10(%edx),%xmm0 @@ -62152,7 +62710,7 @@ _sk_multiply_sse2: .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 15,40,80,64 // movaps 0x40(%eax),%xmm2 .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp) - .byte 15,40,129,204,140,0,0 // movaps 0x8ccc(%ecx),%xmm0 + .byte 15,40,129,76,142,0,0 // movaps 0x8e4c(%ecx),%xmm0 .byte 15,40,240 // movaps %xmm0,%xmm6 .byte 15,92,242 // subps %xmm2,%xmm6 .byte 15,40,254 // movaps %xmm6,%xmm7 @@ -62207,17 +62765,24 @@ _sk_plus__sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 139,77,8 // mov 0x8(%ebp),%ecx - .byte 15,88,65,16 // addps 0x10(%ecx),%xmm0 - .byte 15,88,73,32 // addps 0x20(%ecx),%xmm1 - .byte 15,88,81,48 // addps 0x30(%ecx),%xmm2 - .byte 15,88,89,64 // addps 0x40(%ecx),%xmm3 - .byte 141,80,4 // lea 0x4(%eax),%edx + .byte 232,0,0,0,0 // call 64a <_sk_plus__sse2+0xb> + .byte 88 // pop %eax + .byte 139,77,12 // mov 0xc(%ebp),%ecx + .byte 139,85,8 // mov 0x8(%ebp),%edx + .byte 15,88,66,16 // addps 0x10(%edx),%xmm0 + .byte 15,40,160,182,141,0,0 // movaps 0x8db6(%eax),%xmm4 + .byte 15,93,196 // minps %xmm4,%xmm0 + .byte 15,88,74,32 // addps 0x20(%edx),%xmm1 + .byte 15,93,204 // minps %xmm4,%xmm1 + .byte 15,88,82,48 // addps 0x30(%edx),%xmm2 + .byte 15,93,212 // minps %xmm4,%xmm2 + .byte 15,88,90,64 // addps 0x40(%edx),%xmm3 + .byte 15,93,220 // minps %xmm4,%xmm3 + .byte 141,65,4 // lea 0x4(%ecx),%eax .byte 131,236,8 // sub $0x8,%esp + .byte 80 // push %eax .byte 82 // push %edx - .byte 81 // push %ecx - .byte 255,16 // call *(%eax) + .byte 255,17 // call *(%ecx) .byte 131,196,24 // add $0x18,%esp .byte 93 // pop %ebp .byte 195 // ret @@ -62272,12 +62837,12 @@ _sk_xor__sse2: .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp .byte 15,40,227 // movaps %xmm3,%xmm4 - .byte 232,0,0,0,0 // call 6df <_sk_xor__sse2+0xe> + .byte 232,0,0,0,0 // call 6f8 <_sk_xor__sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5 - .byte 15,40,154,161,139,0,0 // movaps 0x8ba1(%edx),%xmm3 + .byte 15,40,154,24,141,0,0 // movaps 0x8d18(%edx),%xmm3 .byte 15,40,243 // movaps %xmm3,%xmm6 .byte 15,92,245 // subps %xmm5,%xmm6 .byte 15,89,198 // mulps %xmm6,%xmm0 @@ -62313,7 +62878,7 @@ _sk_darken_sse2: .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 747 <_sk_darken_sse2+0xe> + .byte 232,0,0,0,0 // call 760 <_sk_darken_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -62339,7 +62904,7 @@ _sk_darken_sse2: .byte 15,89,203 // mulps %xmm3,%xmm1 .byte 15,95,209 // maxps %xmm1,%xmm2 .byte 15,92,234 // subps %xmm2,%xmm5 - .byte 15,40,138,73,139,0,0 // movaps 0x8b49(%edx),%xmm1 + .byte 15,40,138,192,140,0,0 // movaps 0x8cc0(%edx),%xmm1 .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,89,206 // mulps %xmm6,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -62362,7 +62927,7 @@ _sk_lighten_sse2: .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 7c7 <_sk_lighten_sse2+0xe> + .byte 232,0,0,0,0 // call 7e0 <_sk_lighten_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -62388,7 +62953,7 @@ _sk_lighten_sse2: .byte 15,89,203 // mulps %xmm3,%xmm1 .byte 15,93,209 // minps %xmm1,%xmm2 .byte 15,92,234 // subps %xmm2,%xmm5 - .byte 15,40,138,217,138,0,0 // movaps 0x8ad9(%edx),%xmm1 + .byte 15,40,138,80,140,0,0 // movaps 0x8c50(%edx),%xmm1 .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,89,206 // mulps %xmm6,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -62412,7 +62977,7 @@ _sk_difference_sse2: .byte 131,236,8 // sub $0x8,%esp .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call 84a <_sk_difference_sse2+0x11> + .byte 232,0,0,0,0 // call 863 <_sk_difference_sse2+0x11> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -62441,7 +63006,7 @@ _sk_difference_sse2: .byte 15,93,214 // minps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 15,40,146,102,138,0,0 // movaps 0x8a66(%edx),%xmm2 + .byte 15,40,146,221,139,0,0 // movaps 0x8bdd(%edx),%xmm2 .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,213 // mulps %xmm5,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -62463,7 +63028,7 @@ _sk_exclusion_sse2: .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 8d0 <_sk_exclusion_sse2+0xe> + .byte 232,0,0,0,0 // call 8e9 <_sk_exclusion_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -62485,7 +63050,7 @@ _sk_exclusion_sse2: .byte 15,89,202 // mulps %xmm2,%xmm1 .byte 15,88,201 // addps %xmm1,%xmm1 .byte 15,92,233 // subps %xmm1,%xmm5 - .byte 15,40,138,240,137,0,0 // movaps 0x89f0(%edx),%xmm1 + .byte 15,40,138,103,139,0,0 // movaps 0x8b67(%edx),%xmm1 .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -62511,7 +63076,7 @@ _sk_colorburn_sse2: .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 94f <_sk_colorburn_sse2+0x19> + .byte 232,0,0,0,0 // call 968 <_sk_colorburn_sse2+0x19> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 15,40,72,64 // movaps 0x40(%eax),%xmm1 @@ -62526,7 +63091,7 @@ _sk_colorburn_sse2: .byte 15,93,198 // minps %xmm6,%xmm0 .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,92,232 // subps %xmm0,%xmm5 - .byte 15,40,177,129,137,0,0 // movaps 0x8981(%ecx),%xmm6 + .byte 15,40,177,248,138,0,0 // movaps 0x8af8(%ecx),%xmm6 .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,92,193 // subps %xmm1,%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) @@ -62639,11 +63204,11 @@ _sk_colordodge_sse2: .byte 15,40,243 // movaps %xmm3,%xmm6 .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp) - .byte 232,0,0,0,0 // call ad8 <_sk_colordodge_sse2+0x16> + .byte 232,0,0,0,0 // call af1 <_sk_colordodge_sse2+0x16> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 15,40,72,16 // movaps 0x10(%eax),%xmm1 - .byte 15,40,145,8,136,0,0 // movaps 0x8808(%ecx),%xmm2 + .byte 15,40,145,127,137,0,0 // movaps 0x897f(%ecx),%xmm2 .byte 15,40,226 // movaps %xmm2,%xmm4 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,250 // movaps %xmm2,%xmm7 @@ -62756,11 +63321,11 @@ _sk_hardlight_sse2: .byte 15,40,243 // movaps %xmm3,%xmm6 .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp) - .byte 232,0,0,0,0 // call c39 <_sk_hardlight_sse2+0x16> + .byte 232,0,0,0,0 // call c52 <_sk_hardlight_sse2+0x16> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 15,40,72,64 // movaps 0x40(%eax),%xmm1 - .byte 15,40,145,183,134,0,0 // movaps 0x86b7(%ecx),%xmm2 + .byte 15,40,145,46,136,0,0 // movaps 0x882e(%ecx),%xmm2 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 .byte 15,40,225 // movaps %xmm1,%xmm4 @@ -62866,11 +63431,11 @@ _sk_overlay_sse2: .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp) .byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp) .byte 15,40,232 // movaps %xmm0,%xmm5 - .byte 232,0,0,0,0 // call d84 <_sk_overlay_sse2+0x1a> + .byte 232,0,0,0,0 // call d9d <_sk_overlay_sse2+0x1a> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 15,40,80,64 // movaps 0x40(%eax),%xmm2 - .byte 15,40,161,124,133,0,0 // movaps 0x857c(%ecx),%xmm4 + .byte 15,40,161,243,134,0,0 // movaps 0x86f3(%ecx),%xmm4 .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 15,92,242 // subps %xmm2,%xmm6 .byte 15,40,206 // movaps %xmm6,%xmm1 @@ -62995,20 +63560,20 @@ _sk_softlight_sse2: .byte 15,40,241 // movaps %xmm1,%xmm6 .byte 15,89,246 // mulps %xmm6,%xmm6 .byte 15,88,241 // addps %xmm1,%xmm6 - .byte 232,0,0,0,0 // call f14 <_sk_softlight_sse2+0x52> + .byte 232,0,0,0,0 // call f2d <_sk_softlight_sse2+0x52> .byte 89 // pop %ecx .byte 15,40,194 // movaps %xmm2,%xmm0 - .byte 15,40,137,12,132,0,0 // movaps 0x840c(%ecx),%xmm1 + .byte 15,40,137,131,133,0,0 // movaps 0x8583(%ecx),%xmm1 .byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp) .byte 15,88,193 // addps %xmm1,%xmm0 .byte 15,89,198 // mulps %xmm6,%xmm0 - .byte 15,40,185,252,131,0,0 // movaps 0x83fc(%ecx),%xmm7 + .byte 15,40,185,115,133,0,0 // movaps 0x8573(%ecx),%xmm7 .byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp) .byte 15,92,250 // subps %xmm2,%xmm7 .byte 15,82,242 // rsqrtps %xmm2,%xmm6 .byte 15,83,206 // rcpps %xmm6,%xmm1 .byte 15,92,202 // subps %xmm2,%xmm1 - .byte 15,40,161,28,132,0,0 // movaps 0x841c(%ecx),%xmm4 + .byte 15,40,161,147,133,0,0 // movaps 0x8593(%ecx),%xmm4 .byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp) .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 @@ -63204,7 +63769,7 @@ _sk_hue_sse2: .byte 15,93,200 // minps %xmm0,%xmm1 .byte 15,92,225 // subps %xmm1,%xmm4 .byte 15,41,101,168 // movaps %xmm4,-0x58(%ebp) - .byte 232,0,0,0,0 // call 11d5 <_sk_hue_sse2+0x4f> + .byte 232,0,0,0,0 // call 11ee <_sk_hue_sse2+0x4f> .byte 89 // pop %ecx .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,40,197 // movaps %xmm5,%xmm0 @@ -63214,7 +63779,7 @@ _sk_hue_sse2: .byte 15,40,226 // movaps %xmm2,%xmm4 .byte 15,40,72,64 // movaps 0x40(%eax),%xmm1 .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp) - .byte 15,40,169,155,129,0,0 // movaps 0x819b(%ecx),%xmm5 + .byte 15,40,169,18,131,0,0 // movaps 0x8312(%ecx),%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 .byte 15,89,197 // mulps %xmm5,%xmm0 .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp) @@ -63247,17 +63812,17 @@ _sk_hue_sse2: .byte 15,89,233 // mulps %xmm1,%xmm5 .byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp) .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,153,107,129,0,0 // movaps 0x816b(%ecx),%xmm3 + .byte 15,40,153,226,130,0,0 // movaps 0x82e2(%ecx),%xmm3 .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) .byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6 .byte 15,40,206 // movaps %xmm6,%xmm1 .byte 15,89,203 // mulps %xmm3,%xmm1 - .byte 15,40,153,123,129,0,0 // movaps 0x817b(%ecx),%xmm3 + .byte 15,40,153,242,130,0,0 // movaps 0x82f2(%ecx),%xmm3 .byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5 .byte 15,40,253 // movaps %xmm5,%xmm7 .byte 15,89,251 // mulps %xmm3,%xmm7 .byte 15,88,249 // addps %xmm1,%xmm7 - .byte 15,40,137,155,129,0,0 // movaps 0x819b(%ecx),%xmm1 + .byte 15,40,137,18,131,0,0 // movaps 0x8312(%ecx),%xmm1 .byte 15,92,77,184 // subps -0x48(%ebp),%xmm1 .byte 15,89,241 // mulps %xmm1,%xmm6 .byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp) @@ -63267,7 +63832,7 @@ _sk_hue_sse2: .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1 .byte 15,89,241 // mulps %xmm1,%xmm6 .byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp) - .byte 15,40,169,139,129,0,0 // movaps 0x818b(%ecx),%xmm5 + .byte 15,40,169,2,131,0,0 // movaps 0x8302(%ecx),%xmm5 .byte 15,89,205 // mulps %xmm5,%xmm1 .byte 15,88,207 // addps %xmm7,%xmm1 .byte 15,94,212 // divps %xmm4,%xmm2 @@ -63458,19 +64023,19 @@ _sk_saturation_sse2: .byte 15,89,221 // mulps %xmm5,%xmm3 .byte 15,40,211 // movaps %xmm3,%xmm2 .byte 15,89,253 // mulps %xmm5,%xmm7 - .byte 232,0,0,0,0 // call 1529 <_sk_saturation_sse2+0xb0> + .byte 232,0,0,0,0 // call 1542 <_sk_saturation_sse2+0xb0> .byte 89 // pop %ecx - .byte 15,40,153,87,126,0,0 // movaps 0x7e57(%ecx),%xmm3 + .byte 15,40,153,206,127,0,0 // movaps 0x7fce(%ecx),%xmm3 .byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp) .byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,40,153,103,126,0,0 // movaps 0x7e67(%ecx),%xmm3 + .byte 15,40,153,222,127,0,0 // movaps 0x7fde(%ecx),%xmm3 .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) .byte 15,40,238 // movaps %xmm6,%xmm5 .byte 15,89,235 // mulps %xmm3,%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 15,40,129,135,126,0,0 // movaps 0x7e87(%ecx),%xmm0 + .byte 15,40,129,254,127,0,0 // movaps 0x7ffe(%ecx),%xmm0 .byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp) .byte 15,92,69,216 // subps -0x28(%ebp),%xmm0 .byte 15,89,200 // mulps %xmm0,%xmm1 @@ -63482,7 +64047,7 @@ _sk_saturation_sse2: .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp) .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 15,40,129,119,126,0,0 // movaps 0x7e77(%ecx),%xmm0 + .byte 15,40,129,238,127,0,0 // movaps 0x7fee(%ecx),%xmm0 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 15,88,205 // addps %xmm5,%xmm1 .byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5 @@ -63636,21 +64201,21 @@ _sk_color_sse2: .byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp) .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp) - .byte 232,0,0,0,0 // call 1784 <_sk_color_sse2+0x2a> + .byte 232,0,0,0,0 // call 179d <_sk_color_sse2+0x2a> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 15,40,80,16 // movaps 0x10(%eax),%xmm2 .byte 15,40,72,32 // movaps 0x20(%eax),%xmm1 - .byte 15,40,177,60,124,0,0 // movaps 0x7c3c(%ecx),%xmm6 + .byte 15,40,177,179,125,0,0 // movaps 0x7db3(%ecx),%xmm6 .byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp) .byte 15,40,194 // movaps %xmm2,%xmm0 .byte 15,89,198 // mulps %xmm6,%xmm0 - .byte 15,40,153,76,124,0,0 // movaps 0x7c4c(%ecx),%xmm3 + .byte 15,40,153,195,125,0,0 // movaps 0x7dc3(%ecx),%xmm3 .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp) .byte 15,40,241 // movaps %xmm1,%xmm6 .byte 15,89,243 // mulps %xmm3,%xmm6 .byte 15,88,240 // addps %xmm0,%xmm6 - .byte 15,40,129,108,124,0,0 // movaps 0x7c6c(%ecx),%xmm0 + .byte 15,40,129,227,125,0,0 // movaps 0x7de3(%ecx),%xmm0 .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp) .byte 15,92,69,200 // subps -0x38(%ebp),%xmm0 .byte 15,89,208 // mulps %xmm0,%xmm2 @@ -63660,7 +64225,7 @@ _sk_color_sse2: .byte 15,40,80,48 // movaps 0x30(%eax),%xmm2 .byte 15,89,194 // mulps %xmm2,%xmm0 .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp) - .byte 15,40,137,92,124,0,0 // movaps 0x7c5c(%ecx),%xmm1 + .byte 15,40,137,211,125,0,0 // movaps 0x7dd3(%ecx),%xmm1 .byte 15,89,209 // mulps %xmm1,%xmm2 .byte 15,88,214 // addps %xmm6,%xmm2 .byte 15,40,88,64 // movaps 0x40(%eax),%xmm3 @@ -63816,21 +64381,21 @@ _sk_luminosity_sse2: .byte 137,229 // mov %esp,%ebp .byte 129,236,184,0,0,0 // sub $0xb8,%esp .byte 15,40,242 // movaps %xmm2,%xmm6 - .byte 232,0,0,0,0 // call 19e7 <_sk_luminosity_sse2+0x11> + .byte 232,0,0,0,0 // call 1a00 <_sk_luminosity_sse2+0x11> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax - .byte 15,40,161,25,122,0,0 // movaps 0x7a19(%ecx),%xmm4 + .byte 15,40,161,144,123,0,0 // movaps 0x7b90(%ecx),%xmm4 .byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp) .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,89,212 // mulps %xmm4,%xmm2 - .byte 15,40,161,41,122,0,0 // movaps 0x7a29(%ecx),%xmm4 + .byte 15,40,161,160,123,0,0 // movaps 0x7ba0(%ecx),%xmm4 .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp) .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 15,88,234 // addps %xmm2,%xmm5 .byte 15,40,80,64 // movaps 0x40(%eax),%xmm2 .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp) - .byte 15,40,161,73,122,0,0 // movaps 0x7a49(%ecx),%xmm4 + .byte 15,40,161,192,123,0,0 // movaps 0x7bc0(%ecx),%xmm4 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,250 // subps %xmm2,%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 @@ -63840,7 +64405,7 @@ _sk_luminosity_sse2: .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp) .byte 15,40,214 // movaps %xmm6,%xmm2 - .byte 15,40,137,57,122,0,0 // movaps 0x7a39(%ecx),%xmm1 + .byte 15,40,137,176,123,0,0 // movaps 0x7bb0(%ecx),%xmm1 .byte 15,89,209 // mulps %xmm1,%xmm2 .byte 15,88,213 // addps %xmm5,%xmm2 .byte 15,40,104,16 // movaps 0x10(%eax),%xmm5 @@ -64002,7 +64567,7 @@ _sk_srcover_rgba_8888_sse2: .byte 131,236,44 // sub $0x2c,%esp .byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp) .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp) - .byte 232,0,0,0,0 // call 1c52 <_sk_srcover_rgba_8888_sse2+0x17> + .byte 232,0,0,0,0 // call 1c6b <_sk_srcover_rgba_8888_sse2+0x17> .byte 95 // pop %edi .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -64014,9 +64579,9 @@ _sk_srcover_rgba_8888_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,49 // mov (%ecx),%esi - .byte 15,133,224,0,0,0 // jne 1d54 <_sk_srcover_rgba_8888_sse2+0x119> + .byte 15,133,224,0,0,0 // jne 1d6d <_sk_srcover_rgba_8888_sse2+0x119> .byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2 - .byte 102,15,111,167,238,119,0,0 // movdqa 0x77ee(%edi),%xmm4 + .byte 102,15,111,167,101,121,0,0 // movdqa 0x7965(%edi),%xmm4 .byte 102,15,111,234 // movdqa %xmm2,%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 102,15,111,242 // movdqa %xmm2,%xmm6 @@ -64027,9 +64592,9 @@ _sk_srcover_rgba_8888_sse2: .byte 102,15,219,252 // pand %xmm4,%xmm7 .byte 15,91,229 // cvtdq2ps %xmm5,%xmm4 .byte 15,41,97,16 // movaps %xmm4,0x10(%ecx) - .byte 15,40,175,254,119,0,0 // movaps 0x77fe(%edi),%xmm5 + .byte 15,40,175,117,121,0,0 // movaps 0x7975(%edi),%xmm5 .byte 15,92,235 // subps %xmm3,%xmm5 - .byte 15,40,143,14,120,0,0 // movaps 0x780e(%edi),%xmm1 + .byte 15,40,143,133,121,0,0 // movaps 0x7985(%edi),%xmm1 .byte 15,89,193 // mulps %xmm1,%xmm0 .byte 15,89,229 // mulps %xmm5,%xmm4 .byte 15,88,224 // addps %xmm0,%xmm4 @@ -64062,7 +64627,7 @@ _sk_srcover_rgba_8888_sse2: .byte 102,15,235,194 // por %xmm2,%xmm0 .byte 102,15,235,193 // por %xmm1,%xmm0 .byte 133,219 // test %ebx,%ebx - .byte 117,95 // jne 1d8f <_sk_srcover_rgba_8888_sse2+0x154> + .byte 117,95 // jne 1da8 <_sk_srcover_rgba_8888_sse2+0x154> .byte 243,15,127,4,178 // movdqu %xmm0,(%edx,%esi,4) .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp @@ -64083,33 +64648,33 @@ _sk_srcover_rgba_8888_sse2: .byte 136,69,243 // mov %al,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,80 // je 1db3 <_sk_srcover_rgba_8888_sse2+0x178> + .byte 116,80 // je 1dcc <_sk_srcover_rgba_8888_sse2+0x178> .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 116,21 // je 1d85 <_sk_srcover_rgba_8888_sse2+0x14a> + .byte 116,21 // je 1d9e <_sk_srcover_rgba_8888_sse2+0x14a> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 15,133,255,254,255,255 // jne 1c79 <_sk_srcover_rgba_8888_sse2+0x3e> + .byte 15,133,255,254,255,255 // jne 1c92 <_sk_srcover_rgba_8888_sse2+0x3e> .byte 102,15,110,84,178,8 // movd 0x8(%edx,%esi,4),%xmm2 .byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2 .byte 102,15,18,20,178 // movlpd (%edx,%esi,4),%xmm2 - .byte 233,234,254,255,255 // jmp 1c79 <_sk_srcover_rgba_8888_sse2+0x3e> + .byte 233,234,254,255,255 // jmp 1c92 <_sk_srcover_rgba_8888_sse2+0x3e> .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,41 // je 1dc0 <_sk_srcover_rgba_8888_sse2+0x185> + .byte 116,41 // je 1dd9 <_sk_srcover_rgba_8888_sse2+0x185> .byte 128,251,2 // cmp $0x2,%bl - .byte 116,16 // je 1dac <_sk_srcover_rgba_8888_sse2+0x171> + .byte 116,16 // je 1dc5 <_sk_srcover_rgba_8888_sse2+0x171> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,148 // jne 1d35 <_sk_srcover_rgba_8888_sse2+0xfa> + .byte 117,148 // jne 1d4e <_sk_srcover_rgba_8888_sse2+0xfa> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,15,126,76,178,8 // movd %xmm1,0x8(%edx,%esi,4) .byte 102,15,214,4,178 // movq %xmm0,(%edx,%esi,4) - .byte 235,130 // jmp 1d35 <_sk_srcover_rgba_8888_sse2+0xfa> + .byte 235,130 // jmp 1d4e <_sk_srcover_rgba_8888_sse2+0xfa> .byte 102,15,110,20,178 // movd (%edx,%esi,4),%xmm2 .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 233,185,254,255,255 // jmp 1c79 <_sk_srcover_rgba_8888_sse2+0x3e> + .byte 233,185,254,255,255 // jmp 1c92 <_sk_srcover_rgba_8888_sse2+0x3e> .byte 102,15,126,4,178 // movd %xmm0,(%edx,%esi,4) - .byte 233,107,255,255,255 // jmp 1d35 <_sk_srcover_rgba_8888_sse2+0xfa> + .byte 233,107,255,255,255 // jmp 1d4e <_sk_srcover_rgba_8888_sse2+0xfa> HIDDEN _sk_clamp_0_sse2 .globl _sk_clamp_0_sse2 @@ -64140,10 +64705,10 @@ _sk_clamp_1_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 1dfe <_sk_clamp_1_sse2+0xb> + .byte 232,0,0,0,0 // call 1e17 <_sk_clamp_1_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx - .byte 15,40,160,114,118,0,0 // movaps 0x7672(%eax),%xmm4 + .byte 15,40,160,233,119,0,0 // movaps 0x77e9(%eax),%xmm4 .byte 15,93,196 // minps %xmm4,%xmm0 .byte 15,93,204 // minps %xmm4,%xmm1 .byte 15,93,212 // minps %xmm4,%xmm2 @@ -64164,10 +64729,10 @@ _sk_clamp_a_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 1e31 <_sk_clamp_a_sse2+0xb> + .byte 232,0,0,0,0 // call 1e4a <_sk_clamp_a_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx - .byte 15,93,152,79,118,0,0 // minps 0x764f(%eax),%xmm3 + .byte 15,93,152,198,119,0,0 // minps 0x77c6(%eax),%xmm3 .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -64187,12 +64752,12 @@ _sk_clamp_a_dst_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 1e61 <_sk_clamp_a_dst_sse2+0xb> + .byte 232,0,0,0,0 // call 1e7a <_sk_clamp_a_dst_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 15,40,98,64 // movaps 0x40(%edx),%xmm4 - .byte 15,93,160,47,118,0,0 // minps 0x762f(%eax),%xmm4 + .byte 15,93,160,166,119,0,0 // minps 0x77a6(%eax),%xmm4 .byte 15,41,98,64 // movaps %xmm4,0x40(%edx) .byte 15,40,106,16 // movaps 0x10(%edx),%xmm5 .byte 15,93,236 // minps %xmm4,%xmm5 @@ -64263,10 +64828,10 @@ _sk_invert_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 1f0c <_sk_invert_sse2+0xb> + .byte 232,0,0,0,0 // call 1f25 <_sk_invert_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx - .byte 15,40,160,148,117,0,0 // movaps 0x7594(%eax),%xmm4 + .byte 15,40,160,11,119,0,0 // movaps 0x770b(%eax),%xmm4 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,92,232 // subps %xmm0,%xmm5 .byte 15,40,244 // movaps %xmm4,%xmm6 @@ -64385,11 +64950,11 @@ _sk_unpremul_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 200a <_sk_unpremul_sse2+0xb> + .byte 232,0,0,0,0 // call 2023 <_sk_unpremul_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 15,40,168,166,116,0,0 // movaps 0x74a6(%eax),%xmm5 + .byte 15,40,168,29,118,0,0 // movaps 0x761d(%eax),%xmm5 .byte 15,94,235 // divps %xmm3,%xmm5 .byte 15,194,227,4 // cmpneqps %xmm3,%xmm4 .byte 15,84,229 // andps %xmm5,%xmm4 @@ -64416,23 +64981,23 @@ _sk_from_srgb_sse2: .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,40,217 // movaps %xmm1,%xmm3 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 2054 <_sk_from_srgb_sse2+0x18> + .byte 232,0,0,0,0 // call 206d <_sk_from_srgb_sse2+0x18> .byte 88 // pop %eax .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,89,201 // mulps %xmm1,%xmm1 - .byte 15,40,160,124,116,0,0 // movaps 0x747c(%eax),%xmm4 + .byte 15,40,160,243,117,0,0 // movaps 0x75f3(%eax),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 - .byte 15,40,176,140,116,0,0 // movaps 0x748c(%eax),%xmm6 + .byte 15,40,176,3,118,0,0 // movaps 0x7603(%eax),%xmm6 .byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp) .byte 15,88,198 // addps %xmm6,%xmm0 .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,176,108,116,0,0 // movaps 0x746c(%eax),%xmm6 + .byte 15,40,176,227,117,0,0 // movaps 0x75e3(%eax),%xmm6 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,89,206 // mulps %xmm6,%xmm1 - .byte 15,40,184,156,116,0,0 // movaps 0x749c(%eax),%xmm7 + .byte 15,40,184,19,118,0,0 // movaps 0x7613(%eax),%xmm7 .byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp) .byte 15,88,199 // addps %xmm7,%xmm0 - .byte 15,40,184,172,116,0,0 // movaps 0x74ac(%eax),%xmm7 + .byte 15,40,184,35,118,0,0 // movaps 0x7623(%eax),%xmm7 .byte 15,194,215,1 // cmpltps %xmm7,%xmm2 .byte 15,84,202 // andps %xmm2,%xmm1 .byte 15,85,208 // andnps %xmm0,%xmm2 @@ -64486,24 +65051,24 @@ _sk_from_srgb_dst_sse2: .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp) .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp) .byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp) - .byte 232,0,0,0,0 // call 212f <_sk_from_srgb_dst_sse2+0x1b> + .byte 232,0,0,0,0 // call 2148 <_sk_from_srgb_dst_sse2+0x1b> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 15,40,72,16 // movaps 0x10(%eax),%xmm1 .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,89,237 // mulps %xmm5,%xmm5 - .byte 15,40,161,241,115,0,0 // movaps 0x73f1(%ecx),%xmm4 + .byte 15,40,161,104,117,0,0 // movaps 0x7568(%ecx),%xmm4 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 - .byte 15,40,177,1,116,0,0 // movaps 0x7401(%ecx),%xmm6 + .byte 15,40,177,120,117,0,0 // movaps 0x7578(%ecx),%xmm6 .byte 15,88,198 // addps %xmm6,%xmm0 .byte 15,89,197 // mulps %xmm5,%xmm0 - .byte 15,40,169,225,115,0,0 // movaps 0x73e1(%ecx),%xmm5 + .byte 15,40,169,88,117,0,0 // movaps 0x7558(%ecx),%xmm5 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,89,213 // mulps %xmm5,%xmm2 - .byte 15,40,185,17,116,0,0 // movaps 0x7411(%ecx),%xmm7 + .byte 15,40,185,136,117,0,0 // movaps 0x7588(%ecx),%xmm7 .byte 15,88,199 // addps %xmm7,%xmm0 - .byte 15,40,153,33,116,0,0 // movaps 0x7421(%ecx),%xmm3 + .byte 15,40,153,152,117,0,0 // movaps 0x7598(%ecx),%xmm3 .byte 15,194,203,1 // cmpltps %xmm3,%xmm1 .byte 15,84,209 // andps %xmm1,%xmm2 .byte 15,85,200 // andnps %xmm0,%xmm1 @@ -64562,28 +65127,28 @@ _sk_to_srgb_sse2: .byte 15,40,250 // movaps %xmm2,%xmm7 .byte 15,40,241 // movaps %xmm1,%xmm6 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 221a <_sk_to_srgb_sse2+0x18> + .byte 232,0,0,0,0 // call 2233 <_sk_to_srgb_sse2+0x18> .byte 88 // pop %eax .byte 15,82,218 // rsqrtps %xmm2,%xmm3 - .byte 15,40,160,86,115,0,0 // movaps 0x7356(%eax),%xmm4 + .byte 15,40,160,205,116,0,0 // movaps 0x74cd(%eax),%xmm4 .byte 15,40,235 // movaps %xmm3,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 - .byte 15,40,128,102,115,0,0 // movaps 0x7366(%eax),%xmm0 + .byte 15,40,128,221,116,0,0 // movaps 0x74dd(%eax),%xmm0 .byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 .byte 15,89,235 // mulps %xmm3,%xmm5 - .byte 15,40,128,118,115,0,0 // movaps 0x7376(%eax),%xmm0 + .byte 15,40,128,237,116,0,0 // movaps 0x74ed(%eax),%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 15,40,128,134,115,0,0 // movaps 0x7386(%eax),%xmm0 + .byte 15,40,128,253,116,0,0 // movaps 0x74fd(%eax),%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) .byte 15,88,216 // addps %xmm0,%xmm3 .byte 15,83,195 // rcpps %xmm3,%xmm0 .byte 15,89,197 // mulps %xmm5,%xmm0 - .byte 15,40,168,70,115,0,0 // movaps 0x7346(%eax),%xmm5 + .byte 15,40,168,189,116,0,0 // movaps 0x74bd(%eax),%xmm5 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,89,205 // mulps %xmm5,%xmm1 - .byte 15,40,152,150,115,0,0 // movaps 0x7396(%eax),%xmm3 + .byte 15,40,152,13,117,0,0 // movaps 0x750d(%eax),%xmm3 .byte 15,194,211,1 // cmpltps %xmm3,%xmm2 .byte 15,84,202 // andps %xmm2,%xmm1 .byte 15,85,208 // andnps %xmm0,%xmm2 @@ -64640,60 +65205,62 @@ _sk_rgb_to_hsl_sse2: .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp) .byte 15,40,249 // movaps %xmm1,%xmm7 .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 2311 <_sk_rgb_to_hsl_sse2+0x15> + .byte 232,0,0,0,0 // call 232a <_sk_rgb_to_hsl_sse2+0x15> .byte 88 // pop %eax - .byte 15,40,204 // movaps %xmm4,%xmm1 - .byte 15,95,207 // maxps %xmm7,%xmm1 - .byte 15,95,202 // maxps %xmm2,%xmm1 + .byte 15,40,199 // movaps %xmm7,%xmm0 + .byte 15,95,194 // maxps %xmm2,%xmm0 .byte 15,40,220 // movaps %xmm4,%xmm3 - .byte 15,93,223 // minps %xmm7,%xmm3 - .byte 15,93,218 // minps %xmm2,%xmm3 - .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) - .byte 15,40,193 // movaps %xmm1,%xmm0 - .byte 15,92,195 // subps %xmm3,%xmm0 + .byte 15,95,216 // maxps %xmm0,%xmm3 + .byte 15,40,199 // movaps %xmm7,%xmm0 + .byte 15,93,194 // minps %xmm2,%xmm0 + .byte 15,40,204 // movaps %xmm4,%xmm1 + .byte 15,93,200 // minps %xmm0,%xmm1 + .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp) + .byte 15,40,195 // movaps %xmm3,%xmm0 + .byte 15,92,193 // subps %xmm1,%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) - .byte 15,40,152,175,114,0,0 // movaps 0x72af(%eax),%xmm3 - .byte 15,94,216 // divps %xmm0,%xmm3 + .byte 15,40,136,38,116,0,0 // movaps 0x7426(%eax),%xmm1 + .byte 15,94,200 // divps %xmm0,%xmm1 .byte 15,40,199 // movaps %xmm7,%xmm0 .byte 15,92,194 // subps %xmm2,%xmm0 - .byte 15,89,195 // mulps %xmm3,%xmm0 + .byte 15,89,193 // mulps %xmm1,%xmm0 .byte 15,40,239 // movaps %xmm7,%xmm5 .byte 15,194,234,1 // cmpltps %xmm2,%xmm5 - .byte 15,84,168,191,114,0,0 // andps 0x72bf(%eax),%xmm5 + .byte 15,84,168,54,116,0,0 // andps 0x7436(%eax),%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 15,40,193 // movaps %xmm1,%xmm0 + .byte 15,40,195 // movaps %xmm3,%xmm0 .byte 15,194,196,0 // cmpeqps %xmm4,%xmm0 - .byte 15,40,241 // movaps %xmm1,%xmm6 + .byte 15,40,243 // movaps %xmm3,%xmm6 .byte 15,194,247,0 // cmpeqps %xmm7,%xmm6 .byte 15,92,212 // subps %xmm4,%xmm2 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,89,211 // mulps %xmm3,%xmm2 - .byte 15,89,227 // mulps %xmm3,%xmm4 - .byte 15,40,152,207,114,0,0 // movaps 0x72cf(%eax),%xmm3 - .byte 15,88,211 // addps %xmm3,%xmm2 - .byte 15,88,160,223,114,0,0 // addps 0x72df(%eax),%xmm4 + .byte 15,89,209 // mulps %xmm1,%xmm2 + .byte 15,89,225 // mulps %xmm1,%xmm4 + .byte 15,40,136,70,116,0,0 // movaps 0x7446(%eax),%xmm1 + .byte 15,88,209 // addps %xmm1,%xmm2 + .byte 15,88,160,86,116,0,0 // addps 0x7456(%eax),%xmm4 .byte 15,84,214 // andps %xmm6,%xmm2 .byte 15,85,244 // andnps %xmm4,%xmm6 .byte 15,86,242 // orps %xmm2,%xmm6 .byte 15,84,232 // andps %xmm0,%xmm5 .byte 15,85,198 // andnps %xmm6,%xmm0 .byte 15,86,197 // orps %xmm5,%xmm0 - .byte 15,40,225 // movaps %xmm1,%xmm4 + .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2 .byte 15,194,226,4 // cmpneqps %xmm2,%xmm4 - .byte 15,92,217 // subps %xmm1,%xmm3 - .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 15,40,168,255,114,0,0 // movaps 0x72ff(%eax),%xmm5 - .byte 15,92,218 // subps %xmm2,%xmm3 - .byte 15,40,209 // movaps %xmm1,%xmm2 + .byte 15,92,203 // subps %xmm3,%xmm1 + .byte 15,88,218 // addps %xmm2,%xmm3 + .byte 15,40,168,118,116,0,0 // movaps 0x7476(%eax),%xmm5 + .byte 15,92,202 // subps %xmm2,%xmm1 + .byte 15,40,211 // movaps %xmm3,%xmm2 .byte 15,89,213 // mulps %xmm5,%xmm2 .byte 15,194,234,1 // cmpltps %xmm2,%xmm5 - .byte 15,84,221 // andps %xmm5,%xmm3 - .byte 15,85,233 // andnps %xmm1,%xmm5 - .byte 15,86,235 // orps %xmm3,%xmm5 + .byte 15,84,205 // andps %xmm5,%xmm1 + .byte 15,85,235 // andnps %xmm3,%xmm5 + .byte 15,86,233 // orps %xmm1,%xmm5 .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1 .byte 15,94,205 // divps %xmm5,%xmm1 - .byte 15,89,128,239,114,0,0 // mulps 0x72ef(%eax),%xmm0 + .byte 15,89,128,102,116,0,0 // mulps 0x7466(%eax),%xmm0 .byte 15,84,196 // andps %xmm4,%xmm0 .byte 15,84,204 // andps %xmm4,%xmm1 .byte 139,69,12 // mov 0xc(%ebp),%eax @@ -64716,9 +65283,9 @@ _sk_hsl_to_rgb_sse2: .byte 129,236,200,0,0,0 // sub $0xc8,%esp .byte 15,41,157,56,255,255,255 // movaps %xmm3,-0xc8(%ebp) .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp) - .byte 232,0,0,0,0 // call 2406 <_sk_hsl_to_rgb_sse2+0x19> + .byte 232,0,0,0,0 // call 2425 <_sk_hsl_to_rgb_sse2+0x19> .byte 88 // pop %eax - .byte 15,40,160,26,114,0,0 // movaps 0x721a(%eax),%xmm4 + .byte 15,40,160,139,115,0,0 // movaps 0x738b(%eax),%xmm4 .byte 15,40,220 // movaps %xmm4,%xmm3 .byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp) .byte 15,194,218,2 // cmpleps %xmm2,%xmm3 @@ -64731,13 +65298,13 @@ _sk_hsl_to_rgb_sse2: .byte 15,84,243 // andps %xmm3,%xmm6 .byte 15,85,217 // andnps %xmm1,%xmm3 .byte 15,86,222 // orps %xmm6,%xmm3 - .byte 15,40,168,42,114,0,0 // movaps 0x722a(%eax),%xmm5 + .byte 15,40,168,155,115,0,0 // movaps 0x739b(%eax),%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 .byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,194,193,1 // cmpltps %xmm1,%xmm0 - .byte 15,40,176,58,114,0,0 // movaps 0x723a(%eax),%xmm6 + .byte 15,40,176,171,115,0,0 // movaps 0x73ab(%eax),%xmm6 .byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp) .byte 15,84,198 // andps %xmm6,%xmm0 .byte 15,92,200 // subps %xmm0,%xmm1 @@ -64747,19 +65314,19 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,88,210 // addps %xmm2,%xmm2 .byte 15,92,211 // subps %xmm3,%xmm2 - .byte 15,40,184,74,114,0,0 // movaps 0x724a(%eax),%xmm7 + .byte 15,40,184,187,115,0,0 // movaps 0x73bb(%eax),%xmm7 .byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp) .byte 15,194,253,2 // cmpleps %xmm5,%xmm7 .byte 15,92,218 // subps %xmm2,%xmm3 .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp) .byte 15,40,204 // movaps %xmm4,%xmm1 .byte 15,194,205,2 // cmpleps %xmm5,%xmm1 - .byte 15,40,160,122,114,0,0 // movaps 0x727a(%eax),%xmm4 + .byte 15,40,160,235,115,0,0 // movaps 0x73eb(%eax),%xmm4 .byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp) .byte 15,194,229,2 // cmpleps %xmm5,%xmm4 - .byte 15,40,176,90,114,0,0 // movaps 0x725a(%eax),%xmm6 + .byte 15,40,176,203,115,0,0 // movaps 0x73cb(%eax),%xmm6 .byte 15,89,238 // mulps %xmm6,%xmm5 - .byte 15,40,128,106,114,0,0 // movaps 0x726a(%eax),%xmm0 + .byte 15,40,128,219,115,0,0 // movaps 0x73db(%eax),%xmm0 .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp) .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 @@ -64785,18 +65352,18 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,203 // movaps %xmm3,%xmm1 .byte 15,194,200,1 // cmpltps %xmm0,%xmm1 - .byte 15,84,136,58,114,0,0 // andps 0x723a(%eax),%xmm1 + .byte 15,84,136,171,115,0,0 // andps 0x73ab(%eax),%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 .byte 15,40,203 // movaps %xmm3,%xmm1 .byte 15,92,200 // subps %xmm0,%xmm1 - .byte 15,40,128,74,114,0,0 // movaps 0x724a(%eax),%xmm0 + .byte 15,40,128,187,115,0,0 // movaps 0x73bb(%eax),%xmm0 .byte 15,194,193,2 // cmpleps %xmm1,%xmm0 - .byte 15,40,152,26,114,0,0 // movaps 0x721a(%eax),%xmm3 + .byte 15,40,152,139,115,0,0 // movaps 0x738b(%eax),%xmm3 .byte 15,194,217,2 // cmpleps %xmm1,%xmm3 - .byte 15,40,160,122,114,0,0 // movaps 0x727a(%eax),%xmm4 + .byte 15,40,160,235,115,0,0 // movaps 0x73eb(%eax),%xmm4 .byte 15,194,225,2 // cmpleps %xmm1,%xmm4 .byte 15,89,206 // mulps %xmm6,%xmm1 - .byte 15,40,168,106,114,0,0 // movaps 0x726a(%eax),%xmm5 + .byte 15,40,168,219,115,0,0 // movaps 0x73db(%eax),%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 .byte 15,89,239 // mulps %xmm7,%xmm5 .byte 15,88,234 // addps %xmm2,%xmm5 @@ -64816,7 +65383,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7 .byte 15,85,252 // andnps %xmm4,%xmm7 .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3 - .byte 15,88,152,138,114,0,0 // addps 0x728a(%eax),%xmm3 + .byte 15,88,152,251,115,0,0 // addps 0x73fb(%eax),%xmm3 .byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,203 // movaps %xmm3,%xmm1 @@ -64903,7 +65470,7 @@ _sk_scale_u8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 2680 <_sk_scale_u8_sse2+0xe> + .byte 232,0,0,0,0 // call 269f <_sk_scale_u8_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -64914,13 +65481,13 @@ _sk_scale_u8_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,65 // jne 26dc <_sk_scale_u8_sse2+0x6a> + .byte 117,65 // jne 26fb <_sk_scale_u8_sse2+0x6a> .byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,162,32,112,0,0 // pand 0x7020(%edx),%xmm4 + .byte 102,15,219,162,145,113,0,0 // pand 0x7191(%edx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,162,48,112,0,0 // mulps 0x7030(%edx),%xmm4 + .byte 15,89,162,161,113,0,0 // mulps 0x71a1(%edx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 15,89,212 // mulps %xmm4,%xmm2 @@ -64939,12 +65506,12 @@ _sk_scale_u8_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,50 // je 2716 <_sk_scale_u8_sse2+0xa4> + .byte 116,50 // je 2735 <_sk_scale_u8_sse2+0xa4> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 2700 <_sk_scale_u8_sse2+0x8e> + .byte 116,19 // je 271f <_sk_scale_u8_sse2+0x8e> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,182 // jne 26a8 <_sk_scale_u8_sse2+0x36> + .byte 117,182 // jne 26c7 <_sk_scale_u8_sse2+0x36> .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx .byte 102,15,110,227 // movd %ebx,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -64953,10 +65520,100 @@ _sk_scale_u8_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 235,146 // jmp 26a8 <_sk_scale_u8_sse2+0x36> + .byte 235,146 // jmp 26c7 <_sk_scale_u8_sse2+0x36> .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi .byte 102,15,110,230 // movd %esi,%xmm4 - .byte 235,136 // jmp 26a8 <_sk_scale_u8_sse2+0x36> + .byte 235,136 // jmp 26c7 <_sk_scale_u8_sse2+0x36> + +HIDDEN _sk_scale_565_sse2 +.globl _sk_scale_565_sse2 +FUNCTION(_sk_scale_565_sse2) +_sk_scale_565_sse2: + .byte 85 // push %ebp + .byte 137,229 // mov %esp,%ebp + .byte 83 // push %ebx + .byte 87 // push %edi + .byte 86 // push %esi + .byte 131,236,44 // sub $0x2c,%esp + .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp) + .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp) + .byte 102,15,111,200 // movdqa %xmm0,%xmm1 + .byte 232,0,0,0,0 // call 2759 <_sk_scale_565_sse2+0x1a> + .byte 90 // pop %edx + .byte 139,69,12 // mov 0xc(%ebp),%eax + .byte 139,77,8 // mov 0x8(%ebp),%ecx + .byte 139,56 // mov (%eax),%edi + .byte 139,119,4 // mov 0x4(%edi),%esi + .byte 15,175,113,4 // imul 0x4(%ecx),%esi + .byte 1,246 // add %esi,%esi + .byte 3,55 // add (%edi),%esi + .byte 139,89,8 // mov 0x8(%ecx),%ebx + .byte 133,219 // test %ebx,%ebx + .byte 139,57 // mov (%ecx),%edi + .byte 15,133,157,0,0,0 // jne 2817 <_sk_scale_565_sse2+0xd8> + .byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6 + .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6 + .byte 102,15,111,162,247,112,0,0 // movdqa 0x70f7(%edx),%xmm4 + .byte 102,15,219,230 // pand %xmm6,%xmm4 + .byte 15,91,212 // cvtdq2ps %xmm4,%xmm2 + .byte 15,89,146,7,113,0,0 // mulps 0x7107(%edx),%xmm2 + .byte 102,15,111,170,23,113,0,0 // movdqa 0x7117(%edx),%xmm5 + .byte 102,15,219,238 // pand %xmm6,%xmm5 + .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 + .byte 15,89,170,39,113,0,0 // mulps 0x7127(%edx),%xmm5 + .byte 102,15,219,178,55,113,0,0 // pand 0x7137(%edx),%xmm6 + .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 + .byte 15,89,178,71,113,0,0 // mulps 0x7147(%edx),%xmm6 + .byte 15,40,253 // movaps %xmm5,%xmm7 + .byte 15,93,254 // minps %xmm6,%xmm7 + .byte 15,40,226 // movaps %xmm2,%xmm4 + .byte 15,93,231 // minps %xmm7,%xmm4 + .byte 15,40,253 // movaps %xmm5,%xmm7 + .byte 15,95,254 // maxps %xmm6,%xmm7 + .byte 15,40,194 // movaps %xmm2,%xmm0 + .byte 15,95,199 // maxps %xmm7,%xmm0 + .byte 15,40,251 // movaps %xmm3,%xmm7 + .byte 15,194,121,64,1 // cmpltps 0x40(%ecx),%xmm7 + .byte 15,84,231 // andps %xmm7,%xmm4 + .byte 15,85,248 // andnps %xmm0,%xmm7 + .byte 15,86,252 // orps %xmm4,%xmm7 + .byte 15,89,209 // mulps %xmm1,%xmm2 + .byte 15,89,109,216 // mulps -0x28(%ebp),%xmm5 + .byte 15,89,117,200 // mulps -0x38(%ebp),%xmm6 + .byte 15,89,251 // mulps %xmm3,%xmm7 + .byte 141,80,8 // lea 0x8(%eax),%edx + .byte 131,236,8 // sub $0x8,%esp + .byte 15,40,194 // movaps %xmm2,%xmm0 + .byte 15,40,205 // movaps %xmm5,%xmm1 + .byte 15,40,214 // movaps %xmm6,%xmm2 + .byte 15,40,223 // movaps %xmm7,%xmm3 + .byte 82 // push %edx + .byte 81 // push %ecx + .byte 255,80,4 // call *0x4(%eax) + .byte 131,196,60 // add $0x3c,%esp + .byte 94 // pop %esi + .byte 95 // pop %edi + .byte 91 // pop %ebx + .byte 93 // pop %ebp + .byte 195 // ret + .byte 128,227,3 // and $0x3,%bl + .byte 128,251,1 // cmp $0x1,%bl + .byte 116,50 // je 2851 <_sk_scale_565_sse2+0x112> + .byte 102,15,239,246 // pxor %xmm6,%xmm6 + .byte 128,251,2 // cmp $0x2,%bl + .byte 116,23 // je 283f <_sk_scale_565_sse2+0x100> + .byte 128,251,3 // cmp $0x3,%bl + .byte 15,133,82,255,255,255 // jne 2783 <_sk_scale_565_sse2+0x44> + .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx + .byte 102,15,110,227 // movd %ebx,%xmm4 + .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6 + .byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4 + .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 + .byte 242,15,16,244 // movsd %xmm4,%xmm6 + .byte 233,50,255,255,255 // jmp 2783 <_sk_scale_565_sse2+0x44> + .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi + .byte 102,15,110,246 // movd %esi,%xmm6 + .byte 233,37,255,255,255 // jmp 2783 <_sk_scale_565_sse2+0x44> HIDDEN _sk_lerp_1_float_sse2 .globl _sk_lerp_1_float_sse2 @@ -65005,7 +65662,7 @@ _sk_lerp_u8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 2788 <_sk_lerp_u8_sse2+0xe> + .byte 232,0,0,0,0 // call 28c6 <_sk_lerp_u8_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -65016,13 +65673,13 @@ _sk_lerp_u8_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,102 // jne 2809 <_sk_lerp_u8_sse2+0x8f> + .byte 117,102 // jne 2947 <_sk_lerp_u8_sse2+0x8f> .byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,162,56,111,0,0 // pand 0x6f38(%edx),%xmm4 + .byte 102,15,219,162,234,111,0,0 // pand 0x6fea(%edx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,162,72,111,0,0 // mulps 0x6f48(%edx),%xmm4 + .byte 15,89,162,250,111,0,0 // mulps 0x6ffa(%edx),%xmm4 .byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5 .byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6 .byte 15,92,197 // subps %xmm5,%xmm0 @@ -65052,12 +65709,12 @@ _sk_lerp_u8_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,53 // je 2846 <_sk_lerp_u8_sse2+0xcc> + .byte 116,53 // je 2984 <_sk_lerp_u8_sse2+0xcc> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 282d <_sk_lerp_u8_sse2+0xb3> + .byte 116,19 // je 296b <_sk_lerp_u8_sse2+0xb3> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,145 // jne 27b0 <_sk_lerp_u8_sse2+0x36> + .byte 117,145 // jne 28ee <_sk_lerp_u8_sse2+0x36> .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx .byte 102,15,110,227 // movd %ebx,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -65066,10 +65723,10 @@ _sk_lerp_u8_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 233,106,255,255,255 // jmp 27b0 <_sk_lerp_u8_sse2+0x36> + .byte 233,106,255,255,255 // jmp 28ee <_sk_lerp_u8_sse2+0x36> .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi .byte 102,15,110,230 // movd %esi,%xmm4 - .byte 233,93,255,255,255 // jmp 27b0 <_sk_lerp_u8_sse2+0x36> + .byte 233,93,255,255,255 // jmp 28ee <_sk_lerp_u8_sse2+0x36> HIDDEN _sk_lerp_565_sse2 .globl _sk_lerp_565_sse2 @@ -65080,8 +65737,12 @@ _sk_lerp_565_sse2: .byte 83 // push %ebx .byte 87 // push %edi .byte 86 // push %esi - .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 2861 <_sk_lerp_565_sse2+0xe> + .byte 131,236,108 // sub $0x6c,%esp + .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp) + .byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp) + .byte 15,41,77,152 // movaps %xmm1,-0x68(%ebp) + .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp) + .byte 232,0,0,0,0 // call 29b0 <_sk_lerp_565_sse2+0x1f> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -65093,49 +65754,62 @@ _sk_lerp_565_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 15,133,163,0,0,0 // jne 2925 <_sk_lerp_565_sse2+0xd2> - .byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6 - .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6 - .byte 102,15,111,162,127,110,0,0 // movdqa 0x6e7f(%edx),%xmm4 - .byte 102,15,219,230 // pand %xmm6,%xmm4 - .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,162,143,110,0,0 // mulps 0x6e8f(%edx),%xmm4 - .byte 102,15,111,170,159,110,0,0 // movdqa 0x6e9f(%edx),%xmm5 - .byte 102,15,219,238 // pand %xmm6,%xmm5 - .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,170,175,110,0,0 // mulps 0x6eaf(%edx),%xmm5 - .byte 102,15,219,178,191,110,0,0 // pand 0x6ebf(%edx),%xmm6 + .byte 15,133,211,0,0,0 // jne 2aa4 <_sk_lerp_565_sse2+0x113> + .byte 243,15,126,44,126 // movq (%esi,%edi,2),%xmm5 + .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 + .byte 102,15,111,162,32,111,0,0 // movdqa 0x6f20(%edx),%xmm4 + .byte 102,15,219,229 // pand %xmm5,%xmm4 + .byte 15,91,204 // cvtdq2ps %xmm4,%xmm1 + .byte 15,89,138,48,111,0,0 // mulps 0x6f30(%edx),%xmm1 + .byte 102,15,111,178,64,111,0,0 // movdqa 0x6f40(%edx),%xmm6 + .byte 102,15,219,245 // pand %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,178,207,110,0,0 // mulps 0x6ecf(%edx),%xmm6 - .byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7 - .byte 15,92,199 // subps %xmm7,%xmm0 - .byte 15,89,196 // mulps %xmm4,%xmm0 - .byte 15,88,199 // addps %xmm7,%xmm0 - .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7 - .byte 15,92,207 // subps %xmm7,%xmm1 - .byte 15,89,205 // mulps %xmm5,%xmm1 - .byte 15,88,207 // addps %xmm7,%xmm1 - .byte 15,40,121,48 // movaps 0x30(%ecx),%xmm7 - .byte 15,92,215 // subps %xmm7,%xmm2 - .byte 15,89,214 // mulps %xmm6,%xmm2 - .byte 15,88,215 // addps %xmm7,%xmm2 - .byte 15,40,121,64 // movaps 0x40(%ecx),%xmm7 - .byte 15,92,223 // subps %xmm7,%xmm3 - .byte 15,89,227 // mulps %xmm3,%xmm4 - .byte 15,89,235 // mulps %xmm3,%xmm5 - .byte 15,89,222 // mulps %xmm6,%xmm3 - .byte 15,88,231 // addps %xmm7,%xmm4 - .byte 15,88,239 // addps %xmm7,%xmm5 - .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 15,95,235 // maxps %xmm3,%xmm5 - .byte 15,95,229 // maxps %xmm5,%xmm4 + .byte 15,89,178,80,111,0,0 // mulps 0x6f50(%edx),%xmm6 + .byte 102,15,219,170,96,111,0,0 // pand 0x6f60(%edx),%xmm5 + .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2 + .byte 15,89,146,112,111,0,0 // mulps 0x6f70(%edx),%xmm2 + .byte 15,40,218 // movaps %xmm2,%xmm3 + .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp) + .byte 15,40,254 // movaps %xmm6,%xmm7 + .byte 15,40,65,32 // movaps 0x20(%ecx),%xmm0 + .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) + .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4 + .byte 15,92,224 // subps %xmm0,%xmm4 + .byte 15,89,230 // mulps %xmm6,%xmm4 + .byte 15,93,243 // minps %xmm3,%xmm6 + .byte 15,40,209 // movaps %xmm1,%xmm2 + .byte 15,40,65,16 // movaps 0x10(%ecx),%xmm0 + .byte 15,40,109,184 // movaps -0x48(%ebp),%xmm5 + .byte 15,92,232 // subps %xmm0,%xmm5 + .byte 15,89,233 // mulps %xmm1,%xmm5 + .byte 15,93,206 // minps %xmm6,%xmm1 + .byte 15,40,113,64 // movaps 0x40(%ecx),%xmm6 + .byte 15,95,251 // maxps %xmm3,%xmm7 + .byte 15,95,215 // maxps %xmm7,%xmm2 + .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3 + .byte 15,40,251 // movaps %xmm3,%xmm7 + .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 + .byte 15,84,207 // andps %xmm7,%xmm1 + .byte 15,85,250 // andnps %xmm2,%xmm7 + .byte 15,86,249 // orps %xmm1,%xmm7 + .byte 15,88,232 // addps %xmm0,%xmm5 + .byte 15,88,101,216 // addps -0x28(%ebp),%xmm4 + .byte 15,40,65,48 // movaps 0x30(%ecx),%xmm0 + .byte 15,40,85,136 // movaps -0x78(%ebp),%xmm2 + .byte 15,92,208 // subps %xmm0,%xmm2 + .byte 15,89,85,200 // mulps -0x38(%ebp),%xmm2 + .byte 15,88,208 // addps %xmm0,%xmm2 + .byte 15,92,222 // subps %xmm6,%xmm3 + .byte 15,89,223 // mulps %xmm7,%xmm3 + .byte 15,88,222 // addps %xmm6,%xmm3 .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,220 // movaps %xmm4,%xmm3 + .byte 15,40,197 // movaps %xmm5,%xmm0 + .byte 15,40,204 // movaps %xmm4,%xmm1 .byte 82 // push %edx .byte 81 // push %ecx .byte 255,80,4 // call *0x4(%eax) - .byte 131,196,28 // add $0x1c,%esp + .byte 131,196,124 // add $0x7c,%esp .byte 94 // pop %esi .byte 95 // pop %edi .byte 91 // pop %ebx @@ -65143,22 +65817,22 @@ _sk_lerp_565_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,50 // je 295f <_sk_lerp_565_sse2+0x10c> - .byte 102,15,239,246 // pxor %xmm6,%xmm6 + .byte 116,50 // je 2ade <_sk_lerp_565_sse2+0x14d> + .byte 102,15,239,237 // pxor %xmm5,%xmm5 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,23 // je 294d <_sk_lerp_565_sse2+0xfa> + .byte 116,23 // je 2acc <_sk_lerp_565_sse2+0x13b> .byte 128,251,3 // cmp $0x3,%bl - .byte 15,133,76,255,255,255 // jne 288b <_sk_lerp_565_sse2+0x38> + .byte 15,133,28,255,255,255 // jne 29da <_sk_lerp_565_sse2+0x49> .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx .byte 102,15,110,227 // movd %ebx,%xmm4 - .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6 + .byte 102,15,112,236,69 // pshufd $0x45,%xmm4,%xmm5 .byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 242,15,16,244 // movsd %xmm4,%xmm6 - .byte 233,44,255,255,255 // jmp 288b <_sk_lerp_565_sse2+0x38> + .byte 242,15,16,236 // movsd %xmm4,%xmm5 + .byte 233,252,254,255,255 // jmp 29da <_sk_lerp_565_sse2+0x49> .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi - .byte 102,15,110,246 // movd %esi,%xmm6 - .byte 233,31,255,255,255 // jmp 288b <_sk_lerp_565_sse2+0x38> + .byte 102,15,110,238 // movd %esi,%xmm5 + .byte 233,239,254,255,255 // jmp 29da <_sk_lerp_565_sse2+0x49> HIDDEN _sk_load_tables_sse2 .globl _sk_load_tables_sse2 @@ -65170,7 +65844,7 @@ _sk_load_tables_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 297a <_sk_load_tables_sse2+0xe> + .byte 232,0,0,0,0 // call 2af9 <_sk_load_tables_sse2+0xe> .byte 90 // pop %edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -65179,9 +65853,9 @@ _sk_load_tables_sse2: .byte 133,192 // test %eax,%eax .byte 139,54 // mov (%esi),%esi .byte 139,30 // mov (%esi),%ebx - .byte 15,133,19,1,0,0 // jne 2aa5 <_sk_load_tables_sse2+0x139> + .byte 15,133,19,1,0,0 // jne 2c24 <_sk_load_tables_sse2+0x139> .byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3 - .byte 102,15,111,146,198,109,0,0 // movdqa 0x6dc6(%edx),%xmm2 + .byte 102,15,111,146,55,110,0,0 // movdqa 0x6e37(%edx),%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1 @@ -65237,7 +65911,7 @@ _sk_load_tables_sse2: .byte 15,20,215 // unpcklps %xmm7,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,154,214,109,0,0 // mulps 0x6dd6(%edx),%xmm3 + .byte 15,89,154,71,110,0,0 // mulps 0x6e47(%edx),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 137,194 // mov %eax,%edx .byte 141,66,8 // lea 0x8(%edx),%eax @@ -65253,18 +65927,18 @@ _sk_load_tables_sse2: .byte 195 // ret .byte 36,3 // and $0x3,%al .byte 60,1 // cmp $0x1,%al - .byte 116,37 // je 2ad0 <_sk_load_tables_sse2+0x164> + .byte 116,37 // je 2c4f <_sk_load_tables_sse2+0x164> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 60,2 // cmp $0x2,%al - .byte 116,19 // je 2ac6 <_sk_load_tables_sse2+0x15a> + .byte 116,19 // je 2c45 <_sk_load_tables_sse2+0x15a> .byte 60,3 // cmp $0x3,%al - .byte 15,133,220,254,255,255 // jne 2997 <_sk_load_tables_sse2+0x2b> + .byte 15,133,220,254,255,255 // jne 2b16 <_sk_load_tables_sse2+0x2b> .byte 102,15,110,68,187,8 // movd 0x8(%ebx,%edi,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,15,18,28,187 // movlpd (%ebx,%edi,4),%xmm3 - .byte 233,199,254,255,255 // jmp 2997 <_sk_load_tables_sse2+0x2b> + .byte 233,199,254,255,255 // jmp 2b16 <_sk_load_tables_sse2+0x2b> .byte 102,15,110,28,187 // movd (%ebx,%edi,4),%xmm3 - .byte 233,189,254,255,255 // jmp 2997 <_sk_load_tables_sse2+0x2b> + .byte 233,189,254,255,255 // jmp 2b16 <_sk_load_tables_sse2+0x2b> HIDDEN _sk_load_tables_u16_be_sse2 .globl _sk_load_tables_u16_be_sse2 @@ -65276,7 +65950,7 @@ _sk_load_tables_u16_be_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,44 // sub $0x2c,%esp - .byte 232,0,0,0,0 // call 2ae8 <_sk_load_tables_u16_be_sse2+0xe> + .byte 232,0,0,0,0 // call 2c67 <_sk_load_tables_u16_be_sse2+0xe> .byte 90 // pop %edx .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 139,69,8 // mov 0x8(%ebp),%eax @@ -65287,7 +65961,7 @@ _sk_load_tables_u16_be_sse2: .byte 139,57 // mov (%ecx),%edi .byte 139,15 // mov (%edi),%ecx .byte 190,255,0,255,0 // mov $0xff00ff,%esi - .byte 15,133,166,1,0,0 // jne 2cae <_sk_load_tables_u16_be_sse2+0x1d4> + .byte 15,133,166,1,0,0 // jne 2e2d <_sk_load_tables_u16_be_sse2+0x1d4> .byte 102,15,16,4,89 // movupd (%ecx,%ebx,2),%xmm0 .byte 243,15,111,76,89,16 // movdqu 0x10(%ecx,%ebx,2),%xmm1 .byte 102,15,40,216 // movapd %xmm0,%xmm3 @@ -65384,7 +66058,7 @@ _sk_load_tables_u16_be_sse2: .byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3 .byte 102,15,97,223 // punpcklwd %xmm7,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,154,120,108,0,0 // mulps 0x6c78(%edx),%xmm3 + .byte 15,89,154,233,108,0,0 // mulps 0x6ce9(%edx),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 137,193 // mov %eax,%ecx .byte 141,65,8 // lea 0x8(%ecx),%eax @@ -65401,12 +66075,12 @@ _sk_load_tables_u16_be_sse2: .byte 242,15,16,4,89 // movsd (%ecx,%ebx,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,248,1 // cmp $0x1,%eax - .byte 15,132,83,254,255,255 // je 2b13 <_sk_load_tables_u16_be_sse2+0x39> + .byte 15,132,83,254,255,255 // je 2c92 <_sk_load_tables_u16_be_sse2+0x39> .byte 102,15,22,68,89,8 // movhpd 0x8(%ecx,%ebx,2),%xmm0 .byte 131,248,3 // cmp $0x3,%eax - .byte 15,130,68,254,255,255 // jb 2b13 <_sk_load_tables_u16_be_sse2+0x39> + .byte 15,130,68,254,255,255 // jb 2c92 <_sk_load_tables_u16_be_sse2+0x39> .byte 243,15,126,76,89,16 // movq 0x10(%ecx,%ebx,2),%xmm1 - .byte 233,57,254,255,255 // jmp 2b13 <_sk_load_tables_u16_be_sse2+0x39> + .byte 233,57,254,255,255 // jmp 2c92 <_sk_load_tables_u16_be_sse2+0x39> HIDDEN _sk_load_tables_rgb_u16_be_sse2 .globl _sk_load_tables_rgb_u16_be_sse2 @@ -65418,7 +66092,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,28 // sub $0x1c,%esp - .byte 232,0,0,0,0 // call 2ce8 <_sk_load_tables_rgb_u16_be_sse2+0xe> + .byte 232,0,0,0,0 // call 2e67 <_sk_load_tables_rgb_u16_be_sse2+0xe> .byte 88 // pop %eax .byte 137,69,240 // mov %eax,-0x10(%ebp) .byte 139,69,12 // mov 0xc(%ebp),%eax @@ -65429,7 +66103,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 139,56 // mov (%eax),%edi .byte 139,7 // mov (%edi),%eax .byte 190,255,0,255,0 // mov $0xff00ff,%esi - .byte 15,133,141,1,0,0 // jne 2e96 <_sk_load_tables_rgb_u16_be_sse2+0x1bc> + .byte 15,133,141,1,0,0 // jne 3015 <_sk_load_tables_rgb_u16_be_sse2+0x1bc> .byte 243,15,111,12,88 // movdqu (%eax,%ebx,2),%xmm1 .byte 243,15,111,92,88,8 // movdqu 0x8(%eax,%ebx,2),%xmm3 .byte 102,15,115,219,4 // psrldq $0x4,%xmm3 @@ -65523,7 +66197,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 141,65,8 // lea 0x8(%ecx),%eax .byte 131,236,8 // sub $0x8,%esp .byte 139,85,240 // mov -0x10(%ebp),%edx - .byte 15,40,162,136,106,0,0 // movaps 0x6a88(%edx),%xmm4 + .byte 15,40,162,249,106,0,0 // movaps 0x6af9(%edx),%xmm4 .byte 15,40,195 // movaps %xmm3,%xmm0 .byte 15,40,220 // movaps %xmm4,%xmm3 .byte 80 // push %eax @@ -65539,20 +66213,20 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,15,196,76,88,4,2 // pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1 .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 131,249,1 // cmp $0x1,%ecx - .byte 117,13 // jne 2eb8 <_sk_load_tables_rgb_u16_be_sse2+0x1de> + .byte 117,13 // jne 3037 <_sk_load_tables_rgb_u16_be_sse2+0x1de> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,115,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51> + .byte 233,115,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51> .byte 102,15,110,68,88,6 // movd 0x6(%eax,%ebx,2),%xmm0 .byte 102,15,196,68,88,10,2 // pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0 .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 131,249,3 // cmp $0x3,%ecx - .byte 114,18 // jb 2ee0 <_sk_load_tables_rgb_u16_be_sse2+0x206> + .byte 114,18 // jb 305f <_sk_load_tables_rgb_u16_be_sse2+0x206> .byte 102,15,110,92,88,12 // movd 0xc(%eax,%ebx,2),%xmm3 .byte 102,15,196,92,88,16,2 // pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3 - .byte 233,75,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51> + .byte 233,75,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51> .byte 102,15,239,219 // pxor %xmm3,%xmm3 - .byte 233,66,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51> + .byte 233,66,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51> HIDDEN _sk_byte_tables_sse2 .globl _sk_byte_tables_sse2 @@ -65564,11 +66238,11 @@ _sk_byte_tables_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 2ef7 <_sk_byte_tables_sse2+0xe> + .byte 232,0,0,0,0 // call 3076 <_sk_byte_tables_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,8 // mov (%eax),%ecx - .byte 15,40,162,137,104,0,0 // movaps 0x6889(%edx),%xmm4 + .byte 15,40,162,250,104,0,0 // movaps 0x68fa(%edx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5 @@ -65590,7 +66264,7 @@ _sk_byte_tables_sse2: .byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0 .byte 139,65,4 // mov 0x4(%ecx),%eax .byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0 - .byte 15,40,170,153,104,0,0 // movaps 0x6899(%edx),%xmm5 + .byte 15,40,170,10,105,0,0 // movaps 0x690a(%edx),%xmm5 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6 @@ -65715,12 +66389,12 @@ _sk_byte_tables_rgb_sse2: .byte 15,182,60,31 // movzbl (%edi,%ebx,1),%edi .byte 193,231,8 // shl $0x8,%edi .byte 9,215 // or %edx,%edi - .byte 232,0,0,0,0 // call 30f7 <_sk_byte_tables_rgb_sse2+0x65> + .byte 232,0,0,0,0 // call 3276 <_sk_byte_tables_rgb_sse2+0x65> .byte 90 // pop %edx .byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0 .byte 139,121,4 // mov 0x4(%ecx),%edi .byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0 - .byte 15,40,170,169,102,0,0 // movaps 0x66a9(%edx),%xmm5 + .byte 15,40,170,26,103,0,0 // movaps 0x671a(%edx),%xmm5 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6 @@ -65956,7 +66630,7 @@ _sk_parametric_r_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call 33c6 <_sk_parametric_r_sse2+0x18> + .byte 232,0,0,0,0 // call 3545 <_sk_parametric_r_sse2+0x18> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,8 // mov (%eax),%ecx @@ -65976,15 +66650,15 @@ _sk_parametric_r_sse2: .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,88,245 // addps %xmm5,%xmm6 .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5 - .byte 15,89,170,234,99,0,0 // mulps 0x63ea(%edx),%xmm5 - .byte 15,84,178,250,99,0,0 // andps 0x63fa(%edx),%xmm6 - .byte 15,86,178,10,100,0,0 // orps 0x640a(%edx),%xmm6 - .byte 15,88,170,26,100,0,0 // addps 0x641a(%edx),%xmm5 - .byte 15,40,186,42,100,0,0 // movaps 0x642a(%edx),%xmm7 + .byte 15,89,170,91,100,0,0 // mulps 0x645b(%edx),%xmm5 + .byte 15,84,178,107,100,0,0 // andps 0x646b(%edx),%xmm6 + .byte 15,86,178,123,100,0,0 // orps 0x647b(%edx),%xmm6 + .byte 15,88,170,139,100,0,0 // addps 0x648b(%edx),%xmm5 + .byte 15,40,186,155,100,0,0 // movaps 0x649b(%edx),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,88,178,58,100,0,0 // addps 0x643a(%edx),%xmm6 - .byte 15,40,186,74,100,0,0 // movaps 0x644a(%edx),%xmm7 + .byte 15,88,178,171,100,0,0 // addps 0x64ab(%edx),%xmm6 + .byte 15,40,186,187,100,0,0 // movaps 0x64bb(%edx),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 243,15,16,49 // movss (%ecx),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 @@ -65994,21 +66668,21 @@ _sk_parametric_r_sse2: .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,194,199,1 // cmpltps %xmm7,%xmm0 - .byte 15,40,178,90,100,0,0 // movaps 0x645a(%edx),%xmm6 + .byte 15,40,178,203,100,0,0 // movaps 0x64cb(%edx),%xmm6 .byte 15,84,198 // andps %xmm6,%xmm0 .byte 15,92,248 // subps %xmm0,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,199 // subps %xmm7,%xmm0 - .byte 15,88,170,106,100,0,0 // addps 0x646a(%edx),%xmm5 - .byte 15,40,186,122,100,0,0 // movaps 0x647a(%edx),%xmm7 + .byte 15,88,170,219,100,0,0 // addps 0x64db(%edx),%xmm5 + .byte 15,40,186,235,100,0,0 // movaps 0x64eb(%edx),%xmm7 .byte 15,89,248 // mulps %xmm0,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,40,186,138,100,0,0 // movaps 0x648a(%edx),%xmm7 + .byte 15,40,186,251,100,0,0 // movaps 0x64fb(%edx),%xmm7 .byte 15,92,248 // subps %xmm0,%xmm7 - .byte 15,40,130,154,100,0,0 // movaps 0x649a(%edx),%xmm0 + .byte 15,40,130,11,101,0,0 // movaps 0x650b(%edx),%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 15,88,197 // addps %xmm5,%xmm0 - .byte 15,89,130,170,100,0,0 // mulps 0x64aa(%edx),%xmm0 + .byte 15,89,130,27,101,0,0 // mulps 0x651b(%edx),%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -66042,7 +66716,7 @@ _sk_parametric_g_sse2: .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 34fd <_sk_parametric_g_sse2+0x15> + .byte 232,0,0,0,0 // call 367c <_sk_parametric_g_sse2+0x15> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,8 // mov (%eax),%ecx @@ -66062,15 +66736,15 @@ _sk_parametric_g_sse2: .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,88,245 // addps %xmm5,%xmm6 .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5 - .byte 15,89,170,131,99,0,0 // mulps 0x6383(%edx),%xmm5 - .byte 15,84,178,147,99,0,0 // andps 0x6393(%edx),%xmm6 - .byte 15,86,178,163,99,0,0 // orps 0x63a3(%edx),%xmm6 - .byte 15,88,170,179,99,0,0 // addps 0x63b3(%edx),%xmm5 - .byte 15,40,186,195,99,0,0 // movaps 0x63c3(%edx),%xmm7 + .byte 15,89,170,244,99,0,0 // mulps 0x63f4(%edx),%xmm5 + .byte 15,84,178,4,100,0,0 // andps 0x6404(%edx),%xmm6 + .byte 15,86,178,20,100,0,0 // orps 0x6414(%edx),%xmm6 + .byte 15,88,170,36,100,0,0 // addps 0x6424(%edx),%xmm5 + .byte 15,40,186,52,100,0,0 // movaps 0x6434(%edx),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,88,178,211,99,0,0 // addps 0x63d3(%edx),%xmm6 - .byte 15,40,186,227,99,0,0 // movaps 0x63e3(%edx),%xmm7 + .byte 15,88,178,68,100,0,0 // addps 0x6444(%edx),%xmm6 + .byte 15,40,186,84,100,0,0 // movaps 0x6454(%edx),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 243,15,16,49 // movss (%ecx),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 @@ -66080,21 +66754,21 @@ _sk_parametric_g_sse2: .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,194,199,1 // cmpltps %xmm7,%xmm0 - .byte 15,40,178,243,99,0,0 // movaps 0x63f3(%edx),%xmm6 + .byte 15,40,178,100,100,0,0 // movaps 0x6464(%edx),%xmm6 .byte 15,84,198 // andps %xmm6,%xmm0 .byte 15,92,248 // subps %xmm0,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,199 // subps %xmm7,%xmm0 - .byte 15,88,170,3,100,0,0 // addps 0x6403(%edx),%xmm5 - .byte 15,40,186,19,100,0,0 // movaps 0x6413(%edx),%xmm7 + .byte 15,88,170,116,100,0,0 // addps 0x6474(%edx),%xmm5 + .byte 15,40,186,132,100,0,0 // movaps 0x6484(%edx),%xmm7 .byte 15,89,248 // mulps %xmm0,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,40,186,35,100,0,0 // movaps 0x6423(%edx),%xmm7 + .byte 15,40,186,148,100,0,0 // movaps 0x6494(%edx),%xmm7 .byte 15,92,248 // subps %xmm0,%xmm7 - .byte 15,40,130,51,100,0,0 // movaps 0x6433(%edx),%xmm0 + .byte 15,40,130,164,100,0,0 // movaps 0x64a4(%edx),%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 15,88,197 // addps %xmm5,%xmm0 - .byte 15,89,130,67,100,0,0 // mulps 0x6443(%edx),%xmm0 + .byte 15,89,130,180,100,0,0 // mulps 0x64b4(%edx),%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -66127,7 +66801,7 @@ _sk_parametric_b_sse2: .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) .byte 15,40,217 // movaps %xmm1,%xmm3 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call 3631 <_sk_parametric_b_sse2+0x15> + .byte 232,0,0,0,0 // call 37b0 <_sk_parametric_b_sse2+0x15> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,8 // mov (%eax),%ecx @@ -66147,15 +66821,15 @@ _sk_parametric_b_sse2: .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,88,245 // addps %xmm5,%xmm6 .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5 - .byte 15,89,170,31,99,0,0 // mulps 0x631f(%edx),%xmm5 - .byte 15,84,178,47,99,0,0 // andps 0x632f(%edx),%xmm6 - .byte 15,86,178,63,99,0,0 // orps 0x633f(%edx),%xmm6 - .byte 15,88,170,79,99,0,0 // addps 0x634f(%edx),%xmm5 - .byte 15,40,186,95,99,0,0 // movaps 0x635f(%edx),%xmm7 + .byte 15,89,170,144,99,0,0 // mulps 0x6390(%edx),%xmm5 + .byte 15,84,178,160,99,0,0 // andps 0x63a0(%edx),%xmm6 + .byte 15,86,178,176,99,0,0 // orps 0x63b0(%edx),%xmm6 + .byte 15,88,170,192,99,0,0 // addps 0x63c0(%edx),%xmm5 + .byte 15,40,186,208,99,0,0 // movaps 0x63d0(%edx),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,88,178,111,99,0,0 // addps 0x636f(%edx),%xmm6 - .byte 15,40,186,127,99,0,0 // movaps 0x637f(%edx),%xmm7 + .byte 15,88,178,224,99,0,0 // addps 0x63e0(%edx),%xmm6 + .byte 15,40,186,240,99,0,0 // movaps 0x63f0(%edx),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 243,15,16,49 // movss (%ecx),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 @@ -66165,21 +66839,21 @@ _sk_parametric_b_sse2: .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,194,199,1 // cmpltps %xmm7,%xmm0 - .byte 15,40,178,143,99,0,0 // movaps 0x638f(%edx),%xmm6 + .byte 15,40,178,0,100,0,0 // movaps 0x6400(%edx),%xmm6 .byte 15,84,198 // andps %xmm6,%xmm0 .byte 15,92,248 // subps %xmm0,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,199 // subps %xmm7,%xmm0 - .byte 15,88,170,159,99,0,0 // addps 0x639f(%edx),%xmm5 - .byte 15,40,186,175,99,0,0 // movaps 0x63af(%edx),%xmm7 + .byte 15,88,170,16,100,0,0 // addps 0x6410(%edx),%xmm5 + .byte 15,40,186,32,100,0,0 // movaps 0x6420(%edx),%xmm7 .byte 15,89,248 // mulps %xmm0,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,40,186,191,99,0,0 // movaps 0x63bf(%edx),%xmm7 + .byte 15,40,186,48,100,0,0 // movaps 0x6430(%edx),%xmm7 .byte 15,92,248 // subps %xmm0,%xmm7 - .byte 15,40,130,207,99,0,0 // movaps 0x63cf(%edx),%xmm0 + .byte 15,40,130,64,100,0,0 // movaps 0x6440(%edx),%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 15,88,197 // addps %xmm5,%xmm0 - .byte 15,89,130,223,99,0,0 // mulps 0x63df(%edx),%xmm0 + .byte 15,89,130,80,100,0,0 // mulps 0x6450(%edx),%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -66212,7 +66886,7 @@ _sk_parametric_a_sse2: .byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp) .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call 3765 <_sk_parametric_a_sse2+0x15> + .byte 232,0,0,0,0 // call 38e4 <_sk_parametric_a_sse2+0x15> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,8 // mov (%eax),%ecx @@ -66232,15 +66906,15 @@ _sk_parametric_a_sse2: .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,88,245 // addps %xmm5,%xmm6 .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5 - .byte 15,89,170,187,98,0,0 // mulps 0x62bb(%edx),%xmm5 - .byte 15,84,178,203,98,0,0 // andps 0x62cb(%edx),%xmm6 - .byte 15,86,178,219,98,0,0 // orps 0x62db(%edx),%xmm6 - .byte 15,88,170,235,98,0,0 // addps 0x62eb(%edx),%xmm5 - .byte 15,40,186,251,98,0,0 // movaps 0x62fb(%edx),%xmm7 + .byte 15,89,170,44,99,0,0 // mulps 0x632c(%edx),%xmm5 + .byte 15,84,178,60,99,0,0 // andps 0x633c(%edx),%xmm6 + .byte 15,86,178,76,99,0,0 // orps 0x634c(%edx),%xmm6 + .byte 15,88,170,92,99,0,0 // addps 0x635c(%edx),%xmm5 + .byte 15,40,186,108,99,0,0 // movaps 0x636c(%edx),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,88,178,11,99,0,0 // addps 0x630b(%edx),%xmm6 - .byte 15,40,186,27,99,0,0 // movaps 0x631b(%edx),%xmm7 + .byte 15,88,178,124,99,0,0 // addps 0x637c(%edx),%xmm6 + .byte 15,40,186,140,99,0,0 // movaps 0x638c(%edx),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 243,15,16,49 // movss (%ecx),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 @@ -66250,21 +66924,21 @@ _sk_parametric_a_sse2: .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,194,199,1 // cmpltps %xmm7,%xmm0 - .byte 15,40,178,43,99,0,0 // movaps 0x632b(%edx),%xmm6 + .byte 15,40,178,156,99,0,0 // movaps 0x639c(%edx),%xmm6 .byte 15,84,198 // andps %xmm6,%xmm0 .byte 15,92,248 // subps %xmm0,%xmm7 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,199 // subps %xmm7,%xmm0 - .byte 15,88,170,59,99,0,0 // addps 0x633b(%edx),%xmm5 - .byte 15,40,186,75,99,0,0 // movaps 0x634b(%edx),%xmm7 + .byte 15,88,170,172,99,0,0 // addps 0x63ac(%edx),%xmm5 + .byte 15,40,186,188,99,0,0 // movaps 0x63bc(%edx),%xmm7 .byte 15,89,248 // mulps %xmm0,%xmm7 .byte 15,92,239 // subps %xmm7,%xmm5 - .byte 15,40,186,91,99,0,0 // movaps 0x635b(%edx),%xmm7 + .byte 15,40,186,204,99,0,0 // movaps 0x63cc(%edx),%xmm7 .byte 15,92,248 // subps %xmm0,%xmm7 - .byte 15,40,130,107,99,0,0 // movaps 0x636b(%edx),%xmm0 + .byte 15,40,130,220,99,0,0 // movaps 0x63dc(%edx),%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 15,88,197 // addps %xmm5,%xmm0 - .byte 15,89,130,123,99,0,0 // mulps 0x637b(%edx),%xmm0 + .byte 15,89,130,236,99,0,0 // mulps 0x63ec(%edx),%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -66296,18 +66970,18 @@ _sk_gamma_sse2: .byte 131,236,40 // sub $0x28,%esp .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,40,216 // movaps %xmm0,%xmm3 - .byte 232,0,0,0,0 // call 3896 <_sk_gamma_sse2+0x12> + .byte 232,0,0,0,0 // call 3a15 <_sk_gamma_sse2+0x12> .byte 88 // pop %eax .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0 - .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0 - .byte 15,84,152,106,98,0,0 // andps 0x626a(%eax),%xmm3 - .byte 15,86,152,122,98,0,0 // orps 0x627a(%eax),%xmm3 - .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0 + .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0 + .byte 15,84,152,219,98,0,0 // andps 0x62db(%eax),%xmm3 + .byte 15,86,152,235,98,0,0 // orps 0x62eb(%eax),%xmm3 + .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0 .byte 15,40,227 // movaps %xmm3,%xmm4 - .byte 15,89,160,154,98,0,0 // mulps 0x629a(%eax),%xmm4 + .byte 15,89,160,11,99,0,0 // mulps 0x630b(%eax),%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 15,88,152,170,98,0,0 // addps 0x62aa(%eax),%xmm3 - .byte 15,40,160,186,98,0,0 // movaps 0x62ba(%eax),%xmm4 + .byte 15,88,152,27,99,0,0 // addps 0x631b(%eax),%xmm3 + .byte 15,40,160,43,99,0,0 // movaps 0x632b(%eax),%xmm4 .byte 15,94,227 // divps %xmm3,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 .byte 139,77,12 // mov 0xc(%ebp),%ecx @@ -66320,30 +66994,30 @@ _sk_gamma_sse2: .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,194,227,1 // cmpltps %xmm3,%xmm4 - .byte 15,84,160,202,98,0,0 // andps 0x62ca(%eax),%xmm4 + .byte 15,84,160,59,99,0,0 // andps 0x633b(%eax),%xmm4 .byte 15,92,220 // subps %xmm4,%xmm3 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,92,227 // subps %xmm3,%xmm4 - .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0 - .byte 15,40,176,250,98,0,0 // movaps 0x62fa(%eax),%xmm6 + .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0 + .byte 15,40,176,107,99,0,0 // movaps 0x636b(%eax),%xmm6 .byte 15,92,244 // subps %xmm4,%xmm6 - .byte 15,40,168,234,98,0,0 // movaps 0x62ea(%eax),%xmm5 + .byte 15,40,168,91,99,0,0 // movaps 0x635b(%eax),%xmm5 .byte 15,89,229 // mulps %xmm5,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 15,40,152,10,99,0,0 // movaps 0x630a(%eax),%xmm3 + .byte 15,40,152,123,99,0,0 // movaps 0x637b(%eax),%xmm3 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 15,94,230 // divps %xmm6,%xmm4 .byte 15,88,224 // addps %xmm0,%xmm4 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0 - .byte 15,84,136,106,98,0,0 // andps 0x626a(%eax),%xmm1 - .byte 15,86,136,122,98,0,0 // orps 0x627a(%eax),%xmm1 - .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0 + .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0 + .byte 15,84,136,219,98,0,0 // andps 0x62db(%eax),%xmm1 + .byte 15,86,136,235,98,0,0 // orps 0x62eb(%eax),%xmm1 + .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0 .byte 15,40,241 // movaps %xmm1,%xmm6 - .byte 15,89,176,154,98,0,0 // mulps 0x629a(%eax),%xmm6 + .byte 15,89,176,11,99,0,0 // mulps 0x630b(%eax),%xmm6 .byte 15,92,198 // subps %xmm6,%xmm0 - .byte 15,88,136,170,98,0,0 // addps 0x62aa(%eax),%xmm1 - .byte 15,40,176,186,98,0,0 // movaps 0x62ba(%eax),%xmm6 + .byte 15,88,136,27,99,0,0 // addps 0x631b(%eax),%xmm1 + .byte 15,40,176,43,99,0,0 // movaps 0x632b(%eax),%xmm6 .byte 15,94,241 // divps %xmm1,%xmm6 .byte 15,92,198 // subps %xmm6,%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 @@ -66351,12 +67025,12 @@ _sk_gamma_sse2: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,40,240 // movaps %xmm0,%xmm6 .byte 15,194,241,1 // cmpltps %xmm1,%xmm6 - .byte 15,84,176,202,98,0,0 // andps 0x62ca(%eax),%xmm6 + .byte 15,84,176,59,99,0,0 // andps 0x633b(%eax),%xmm6 .byte 15,92,206 // subps %xmm6,%xmm1 .byte 15,40,240 // movaps %xmm0,%xmm6 .byte 15,92,241 // subps %xmm1,%xmm6 - .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0 - .byte 15,40,184,250,98,0,0 // movaps 0x62fa(%eax),%xmm7 + .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0 + .byte 15,40,184,107,99,0,0 // movaps 0x636b(%eax),%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,89,245 // mulps %xmm5,%xmm6 .byte 15,92,198 // subps %xmm6,%xmm0 @@ -66364,15 +67038,15 @@ _sk_gamma_sse2: .byte 15,94,207 // divps %xmm7,%xmm1 .byte 15,88,200 // addps %xmm0,%xmm1 .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0 - .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0 - .byte 15,84,144,106,98,0,0 // andps 0x626a(%eax),%xmm2 - .byte 15,86,144,122,98,0,0 // orps 0x627a(%eax),%xmm2 - .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0 - .byte 15,40,176,154,98,0,0 // movaps 0x629a(%eax),%xmm6 + .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0 + .byte 15,84,144,219,98,0,0 // andps 0x62db(%eax),%xmm2 + .byte 15,86,144,235,98,0,0 // orps 0x62eb(%eax),%xmm2 + .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0 + .byte 15,40,176,11,99,0,0 // movaps 0x630b(%eax),%xmm6 .byte 15,89,242 // mulps %xmm2,%xmm6 .byte 15,92,198 // subps %xmm6,%xmm0 - .byte 15,88,144,170,98,0,0 // addps 0x62aa(%eax),%xmm2 - .byte 15,40,176,186,98,0,0 // movaps 0x62ba(%eax),%xmm6 + .byte 15,88,144,27,99,0,0 // addps 0x631b(%eax),%xmm2 + .byte 15,40,176,43,99,0,0 // movaps 0x632b(%eax),%xmm6 .byte 15,94,242 // divps %xmm2,%xmm6 .byte 15,92,198 // subps %xmm6,%xmm0 .byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0 @@ -66380,18 +67054,18 @@ _sk_gamma_sse2: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 15,40,240 // movaps %xmm0,%xmm6 .byte 15,194,242,1 // cmpltps %xmm2,%xmm6 - .byte 15,84,176,202,98,0,0 // andps 0x62ca(%eax),%xmm6 + .byte 15,84,176,59,99,0,0 // andps 0x633b(%eax),%xmm6 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,240 // movaps %xmm0,%xmm6 .byte 15,92,242 // subps %xmm2,%xmm6 - .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0 + .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0 .byte 15,89,238 // mulps %xmm6,%xmm5 .byte 15,92,197 // subps %xmm5,%xmm0 - .byte 15,40,144,250,98,0,0 // movaps 0x62fa(%eax),%xmm2 + .byte 15,40,144,107,99,0,0 // movaps 0x636b(%eax),%xmm2 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,94,218 // divps %xmm2,%xmm3 .byte 15,88,216 // addps %xmm0,%xmm3 - .byte 15,40,128,26,99,0,0 // movaps 0x631a(%eax),%xmm0 + .byte 15,40,128,139,99,0,0 // movaps 0x638b(%eax),%xmm0 .byte 15,89,224 // mulps %xmm0,%xmm4 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 15,89,216 // mulps %xmm0,%xmm3 @@ -66418,31 +67092,31 @@ _sk_lab_to_xyz_sse2: .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 3a7e <_sk_lab_to_xyz_sse2+0x15> + .byte 232,0,0,0,0 // call 3bfd <_sk_lab_to_xyz_sse2+0x15> .byte 88 // pop %eax - .byte 15,89,144,66,97,0,0 // mulps 0x6142(%eax),%xmm2 - .byte 15,40,160,82,97,0,0 // movaps 0x6152(%eax),%xmm4 + .byte 15,89,144,179,97,0,0 // mulps 0x61b3(%eax),%xmm2 + .byte 15,40,160,195,97,0,0 // movaps 0x61c3(%eax),%xmm4 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 15,40,168,98,97,0,0 // movaps 0x6162(%eax),%xmm5 + .byte 15,40,168,211,97,0,0 // movaps 0x61d3(%eax),%xmm5 .byte 15,88,205 // addps %xmm5,%xmm1 .byte 15,89,220 // mulps %xmm4,%xmm3 .byte 15,88,221 // addps %xmm5,%xmm3 - .byte 15,88,144,114,97,0,0 // addps 0x6172(%eax),%xmm2 - .byte 15,89,144,130,97,0,0 // mulps 0x6182(%eax),%xmm2 - .byte 15,89,136,146,97,0,0 // mulps 0x6192(%eax),%xmm1 + .byte 15,88,144,227,97,0,0 // addps 0x61e3(%eax),%xmm2 + .byte 15,89,144,243,97,0,0 // mulps 0x61f3(%eax),%xmm2 + .byte 15,89,136,3,98,0,0 // mulps 0x6203(%eax),%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 15,89,152,162,97,0,0 // mulps 0x61a2(%eax),%xmm3 + .byte 15,89,152,19,98,0,0 // mulps 0x6213(%eax),%xmm3 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,92,235 // subps %xmm3,%xmm5 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,152,178,97,0,0 // movaps 0x61b2(%eax),%xmm3 + .byte 15,40,152,35,98,0,0 // movaps 0x6223(%eax),%xmm3 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 15,194,224,1 // cmpltps %xmm0,%xmm4 - .byte 15,40,176,194,97,0,0 // movaps 0x61c2(%eax),%xmm6 + .byte 15,40,176,51,98,0,0 // movaps 0x6233(%eax),%xmm6 .byte 15,88,206 // addps %xmm6,%xmm1 - .byte 15,40,184,210,97,0,0 // movaps 0x61d2(%eax),%xmm7 + .byte 15,40,184,67,98,0,0 // movaps 0x6243(%eax),%xmm7 .byte 15,89,207 // mulps %xmm7,%xmm1 .byte 15,84,196 // andps %xmm4,%xmm0 .byte 15,85,225 // andnps %xmm1,%xmm4 @@ -66467,8 +67141,8 @@ _sk_lab_to_xyz_sse2: .byte 15,85,221 // andnps %xmm5,%xmm3 .byte 15,86,216 // orps %xmm0,%xmm3 .byte 139,77,12 // mov 0xc(%ebp),%ecx - .byte 15,89,160,226,97,0,0 // mulps 0x61e2(%eax),%xmm4 - .byte 15,89,152,242,97,0,0 // mulps 0x61f2(%eax),%xmm3 + .byte 15,89,160,83,98,0,0 // mulps 0x6253(%eax),%xmm4 + .byte 15,89,152,99,98,0,0 // mulps 0x6263(%eax),%xmm3 .byte 141,65,4 // lea 0x4(%ecx),%eax .byte 131,236,8 // sub $0x8,%esp .byte 15,40,196 // movaps %xmm4,%xmm0 @@ -66491,7 +67165,7 @@ _sk_load_a8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 3b6e <_sk_load_a8_sse2+0xe> + .byte 232,0,0,0,0 // call 3ced <_sk_load_a8_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -66502,13 +67176,13 @@ _sk_load_a8_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,60 // jne 3bc5 <_sk_load_a8_sse2+0x65> + .byte 117,60 // jne 3d44 <_sk_load_a8_sse2+0x65> .byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,130,18,97,0,0 // pand 0x6112(%edx),%xmm0 + .byte 102,15,219,130,131,97,0,0 // pand 0x6183(%edx),%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,154,34,97,0,0 // mulps 0x6122(%edx),%xmm3 + .byte 15,89,154,147,97,0,0 // mulps 0x6193(%edx),%xmm3 .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -66525,12 +67199,12 @@ _sk_load_a8_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,50 // je 3bff <_sk_load_a8_sse2+0x9f> + .byte 116,50 // je 3d7e <_sk_load_a8_sse2+0x9f> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 3be9 <_sk_load_a8_sse2+0x89> + .byte 116,19 // je 3d68 <_sk_load_a8_sse2+0x89> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,187 // jne 3b96 <_sk_load_a8_sse2+0x36> + .byte 117,187 // jne 3d15 <_sk_load_a8_sse2+0x36> .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx .byte 102,15,110,195 // movd %ebx,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -66539,10 +67213,10 @@ _sk_load_a8_sse2: .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 235,151 // jmp 3b96 <_sk_load_a8_sse2+0x36> + .byte 235,151 // jmp 3d15 <_sk_load_a8_sse2+0x36> .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi .byte 102,15,110,198 // movd %esi,%xmm0 - .byte 235,141 // jmp 3b96 <_sk_load_a8_sse2+0x36> + .byte 235,141 // jmp 3d15 <_sk_load_a8_sse2+0x36> HIDDEN _sk_load_a8_dst_sse2 .globl _sk_load_a8_dst_sse2 @@ -66567,15 +67241,15 @@ _sk_load_a8_dst_sse2: .byte 102,15,127,97,32 // movdqa %xmm4,0x20(%ecx) .byte 102,15,127,97,16 // movdqa %xmm4,0x10(%ecx) .byte 133,219 // test %ebx,%ebx - .byte 232,0,0,0,0 // call 3c42 <_sk_load_a8_dst_sse2+0x39> + .byte 232,0,0,0,0 // call 3dc1 <_sk_load_a8_dst_sse2+0x39> .byte 90 // pop %edx - .byte 117,54 // jne 3c7b <_sk_load_a8_dst_sse2+0x72> + .byte 117,54 // jne 3dfa <_sk_load_a8_dst_sse2+0x72> .byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,162,94,96,0,0 // pand 0x605e(%edx),%xmm4 + .byte 102,15,219,162,207,96,0,0 // pand 0x60cf(%edx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,162,110,96,0,0 // mulps 0x606e(%edx),%xmm4 + .byte 15,89,162,223,96,0,0 // mulps 0x60df(%edx),%xmm4 .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx) .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp @@ -66590,11 +67264,11 @@ _sk_load_a8_dst_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,46 // je 3cb1 <_sk_load_a8_dst_sse2+0xa8> + .byte 116,46 // je 3e30 <_sk_load_a8_dst_sse2+0xa8> .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 3c9b <_sk_load_a8_dst_sse2+0x92> + .byte 116,19 // je 3e1a <_sk_load_a8_dst_sse2+0x92> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,197 // jne 3c52 <_sk_load_a8_dst_sse2+0x49> + .byte 117,197 // jne 3dd1 <_sk_load_a8_dst_sse2+0x49> .byte 15,182,92,55,2 // movzbl 0x2(%edi,%esi,1),%ebx .byte 102,15,110,227 // movd %ebx,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -66603,10 +67277,10 @@ _sk_load_a8_dst_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 235,161 // jmp 3c52 <_sk_load_a8_dst_sse2+0x49> + .byte 235,161 // jmp 3dd1 <_sk_load_a8_dst_sse2+0x49> .byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi .byte 102,15,110,230 // movd %esi,%xmm4 - .byte 235,151 // jmp 3c52 <_sk_load_a8_dst_sse2+0x49> + .byte 235,151 // jmp 3dd1 <_sk_load_a8_dst_sse2+0x49> HIDDEN _sk_gather_a8_sse2 .globl _sk_gather_a8_sse2 @@ -66647,13 +67321,13 @@ _sk_gather_a8_sse2: .byte 9,202 // or %ecx,%edx .byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0 .byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0 - .byte 232,0,0,0,0 // call 3d40 <_sk_gather_a8_sse2+0x85> + .byte 232,0,0,0,0 // call 3ebf <_sk_gather_a8_sse2+0x85> .byte 89 // pop %ecx .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,153,128,95,0,0 // mulps 0x5f80(%ecx),%xmm3 + .byte 15,89,153,241,95,0,0 // mulps 0x5ff1(%ecx),%xmm3 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 131,236,8 // sub $0x8,%esp .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -66678,7 +67352,7 @@ _sk_store_a8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,60 // sub $0x3c,%esp - .byte 232,0,0,0,0 // call 3d84 <_sk_store_a8_sse2+0xe> + .byte 232,0,0,0,0 // call 3f03 <_sk_store_a8_sse2+0xe> .byte 94 // pop %esi .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -66687,7 +67361,7 @@ _sk_store_a8_sse2: .byte 15,175,81,4 // imul 0x4(%ecx),%edx .byte 3,23 // add (%edi),%edx .byte 139,89,8 // mov 0x8(%ecx),%ebx - .byte 15,40,166,76,95,0,0 // movaps 0x5f4c(%esi),%xmm4 + .byte 15,40,166,189,95,0,0 // movaps 0x5fbd(%esi),%xmm4 .byte 15,89,227 // mulps %xmm3,%xmm4 .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4 .byte 102,15,114,244,16 // pslld $0x10,%xmm4 @@ -66696,7 +67370,7 @@ _sk_store_a8_sse2: .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,26 // jne 3dd9 <_sk_store_a8_sse2+0x63> + .byte 117,26 // jne 3f58 <_sk_store_a8_sse2+0x63> .byte 102,15,126,230 // movd %xmm4,%esi .byte 137,52,58 // mov %esi,(%edx,%edi,1) .byte 141,80,8 // lea 0x8(%eax),%edx @@ -66714,26 +67388,26 @@ _sk_store_a8_sse2: .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,57 // je 3e22 <_sk_store_a8_sse2+0xac> + .byte 116,57 // je 3fa1 <_sk_store_a8_sse2+0xac> .byte 128,251,2 // cmp $0x2,%bl - .byte 116,17 // je 3dff <_sk_store_a8_sse2+0x89> + .byte 116,17 // je 3f7e <_sk_store_a8_sse2+0x89> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,211 // jne 3dc6 <_sk_store_a8_sse2+0x50> + .byte 117,211 // jne 3f45 <_sk_store_a8_sse2+0x50> .byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp) .byte 138,93,208 // mov -0x30(%ebp),%bl .byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1) .byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4 - .byte 102,15,219,166,92,95,0,0 // pand 0x5f5c(%esi),%xmm4 + .byte 102,15,219,166,205,95,0,0 // pand 0x5fcd(%esi),%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,126,230 // movd %xmm4,%esi .byte 102,137,52,58 // mov %si,(%edx,%edi,1) - .byte 235,164 // jmp 3dc6 <_sk_store_a8_sse2+0x50> + .byte 235,164 // jmp 3f45 <_sk_store_a8_sse2+0x50> .byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp) .byte 138,93,216 // mov -0x28(%ebp),%bl .byte 136,28,58 // mov %bl,(%edx,%edi,1) - .byte 235,151 // jmp 3dc6 <_sk_store_a8_sse2+0x50> + .byte 235,151 // jmp 3f45 <_sk_store_a8_sse2+0x50> HIDDEN _sk_load_g8_sse2 .globl _sk_load_g8_sse2 @@ -66745,7 +67419,7 @@ _sk_load_g8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 3e3d <_sk_load_g8_sse2+0xe> + .byte 232,0,0,0,0 // call 3fbc <_sk_load_g8_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -66756,16 +67430,16 @@ _sk_load_g8_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,63 // jne 3e97 <_sk_load_g8_sse2+0x68> + .byte 117,63 // jne 4016 <_sk_load_g8_sse2+0x68> .byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,130,179,94,0,0 // pand 0x5eb3(%edx),%xmm0 + .byte 102,15,219,130,36,95,0,0 // pand 0x5f24(%edx),%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,130,195,94,0,0 // mulps 0x5ec3(%edx),%xmm0 + .byte 15,89,130,52,95,0,0 // mulps 0x5f34(%edx),%xmm0 .byte 141,112,8 // lea 0x8(%eax),%esi .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,154,211,94,0,0 // movaps 0x5ed3(%edx),%xmm3 + .byte 15,40,154,68,95,0,0 // movaps 0x5f44(%edx),%xmm3 .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 86 // push %esi @@ -66779,12 +67453,12 @@ _sk_load_g8_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,50 // je 3ed1 <_sk_load_g8_sse2+0xa2> + .byte 116,50 // je 4050 <_sk_load_g8_sse2+0xa2> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 3ebb <_sk_load_g8_sse2+0x8c> + .byte 116,19 // je 403a <_sk_load_g8_sse2+0x8c> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,184 // jne 3e65 <_sk_load_g8_sse2+0x36> + .byte 117,184 // jne 3fe4 <_sk_load_g8_sse2+0x36> .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx .byte 102,15,110,195 // movd %ebx,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -66793,10 +67467,10 @@ _sk_load_g8_sse2: .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 235,148 // jmp 3e65 <_sk_load_g8_sse2+0x36> + .byte 235,148 // jmp 3fe4 <_sk_load_g8_sse2+0x36> .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi .byte 102,15,110,198 // movd %esi,%xmm0 - .byte 235,138 // jmp 3e65 <_sk_load_g8_sse2+0x36> + .byte 235,138 // jmp 3fe4 <_sk_load_g8_sse2+0x36> HIDDEN _sk_load_g8_dst_sse2 .globl _sk_load_g8_dst_sse2 @@ -66808,7 +67482,7 @@ _sk_load_g8_dst_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 3ee9 <_sk_load_g8_dst_sse2+0xe> + .byte 232,0,0,0,0 // call 4068 <_sk_load_g8_dst_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -66819,17 +67493,17 @@ _sk_load_g8_dst_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,73 // jne 3f4d <_sk_load_g8_dst_sse2+0x72> + .byte 117,73 // jne 40cc <_sk_load_g8_dst_sse2+0x72> .byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,162,55,94,0,0 // pand 0x5e37(%edx),%xmm4 + .byte 102,15,219,162,168,94,0,0 // pand 0x5ea8(%edx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,162,71,94,0,0 // mulps 0x5e47(%edx),%xmm4 + .byte 15,89,162,184,94,0,0 // mulps 0x5eb8(%edx),%xmm4 .byte 15,41,97,48 // movaps %xmm4,0x30(%ecx) .byte 15,41,97,32 // movaps %xmm4,0x20(%ecx) .byte 15,41,97,16 // movaps %xmm4,0x10(%ecx) - .byte 15,40,162,87,94,0,0 // movaps 0x5e57(%edx),%xmm4 + .byte 15,40,162,200,94,0,0 // movaps 0x5ec8(%edx),%xmm4 .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx) .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp @@ -66844,12 +67518,12 @@ _sk_load_g8_dst_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,50 // je 3f87 <_sk_load_g8_dst_sse2+0xac> + .byte 116,50 // je 4106 <_sk_load_g8_dst_sse2+0xac> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 3f71 <_sk_load_g8_dst_sse2+0x96> + .byte 116,19 // je 40f0 <_sk_load_g8_dst_sse2+0x96> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,174 // jne 3f11 <_sk_load_g8_dst_sse2+0x36> + .byte 117,174 // jne 4090 <_sk_load_g8_dst_sse2+0x36> .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx .byte 102,15,110,227 // movd %ebx,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 @@ -66858,10 +67532,10 @@ _sk_load_g8_dst_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 235,138 // jmp 3f11 <_sk_load_g8_dst_sse2+0x36> + .byte 235,138 // jmp 4090 <_sk_load_g8_dst_sse2+0x36> .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi .byte 102,15,110,230 // movd %esi,%xmm4 - .byte 235,128 // jmp 3f11 <_sk_load_g8_dst_sse2+0x36> + .byte 235,128 // jmp 4090 <_sk_load_g8_dst_sse2+0x36> HIDDEN _sk_gather_g8_sse2 .globl _sk_gather_g8_sse2 @@ -66901,17 +67575,17 @@ _sk_gather_g8_sse2: .byte 193,226,8 // shl $0x8,%edx .byte 9,202 // or %ecx,%edx .byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0 - .byte 232,0,0,0,0 // call 4011 <_sk_gather_g8_sse2+0x80> + .byte 232,0,0,0,0 // call 4190 <_sk_gather_g8_sse2+0x80> .byte 89 // pop %ecx .byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,129,63,93,0,0 // mulps 0x5d3f(%ecx),%xmm0 + .byte 15,89,129,176,93,0,0 // mulps 0x5db0(%ecx),%xmm0 .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,153,79,93,0,0 // movaps 0x5d4f(%ecx),%xmm3 + .byte 15,40,153,192,93,0,0 // movaps 0x5dc0(%ecx),%xmm3 .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 82 // push %edx @@ -66933,7 +67607,7 @@ _sk_load_565_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 405c <_sk_load_565_sse2+0xe> + .byte 232,0,0,0,0 // call 41db <_sk_load_565_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -66945,23 +67619,23 @@ _sk_load_565_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,97 // jne 40da <_sk_load_565_sse2+0x8c> + .byte 117,97 // jne 4259 <_sk_load_565_sse2+0x8c> .byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,130,20,93,0,0 // movdqa 0x5d14(%edx),%xmm0 + .byte 102,15,111,130,133,93,0,0 // movdqa 0x5d85(%edx),%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,130,36,93,0,0 // mulps 0x5d24(%edx),%xmm0 - .byte 102,15,111,138,52,93,0,0 // movdqa 0x5d34(%edx),%xmm1 + .byte 15,89,130,149,93,0,0 // mulps 0x5d95(%edx),%xmm0 + .byte 102,15,111,138,165,93,0,0 // movdqa 0x5da5(%edx),%xmm1 .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,138,68,93,0,0 // mulps 0x5d44(%edx),%xmm1 - .byte 102,15,219,146,84,93,0,0 // pand 0x5d54(%edx),%xmm2 + .byte 15,89,138,181,93,0,0 // mulps 0x5db5(%edx),%xmm1 + .byte 102,15,219,146,197,93,0,0 // pand 0x5dc5(%edx),%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,146,100,93,0,0 // mulps 0x5d64(%edx),%xmm2 + .byte 15,89,146,213,93,0,0 // mulps 0x5dd5(%edx),%xmm2 .byte 141,112,8 // lea 0x8(%eax),%esi .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,154,116,93,0,0 // movaps 0x5d74(%edx),%xmm3 + .byte 15,40,154,229,93,0,0 // movaps 0x5de5(%edx),%xmm3 .byte 86 // push %esi .byte 81 // push %ecx .byte 255,80,4 // call *0x4(%eax) @@ -66973,22 +67647,22 @@ _sk_load_565_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,46 // je 4110 <_sk_load_565_sse2+0xc2> + .byte 116,46 // je 428f <_sk_load_565_sse2+0xc2> .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 40fe <_sk_load_565_sse2+0xb0> + .byte 116,19 // je 427d <_sk_load_565_sse2+0xb0> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,146 // jne 4082 <_sk_load_565_sse2+0x34> + .byte 117,146 // jne 4201 <_sk_load_565_sse2+0x34> .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx .byte 102,15,110,195 // movd %ebx,%xmm0 .byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2 .byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,208 // movsd %xmm0,%xmm2 - .byte 233,114,255,255,255 // jmp 4082 <_sk_load_565_sse2+0x34> + .byte 233,114,255,255,255 // jmp 4201 <_sk_load_565_sse2+0x34> .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi .byte 102,15,110,214 // movd %esi,%xmm2 - .byte 233,101,255,255,255 // jmp 4082 <_sk_load_565_sse2+0x34> + .byte 233,101,255,255,255 // jmp 4201 <_sk_load_565_sse2+0x34> HIDDEN _sk_load_565_dst_sse2 .globl _sk_load_565_dst_sse2 @@ -67000,7 +67674,7 @@ _sk_load_565_dst_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 412b <_sk_load_565_dst_sse2+0xe> + .byte 232,0,0,0,0 // call 42aa <_sk_load_565_dst_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67012,24 +67686,24 @@ _sk_load_565_dst_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,113 // jne 41b9 <_sk_load_565_dst_sse2+0x9c> + .byte 117,113 // jne 4338 <_sk_load_565_dst_sse2+0x9c> .byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,111,170,181,92,0,0 // movdqa 0x5cb5(%edx),%xmm5 + .byte 102,15,111,170,38,93,0,0 // movdqa 0x5d26(%edx),%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,170,197,92,0,0 // mulps 0x5cc5(%edx),%xmm5 + .byte 15,89,170,54,93,0,0 // mulps 0x5d36(%edx),%xmm5 .byte 15,41,105,16 // movaps %xmm5,0x10(%ecx) - .byte 102,15,111,170,213,92,0,0 // movdqa 0x5cd5(%edx),%xmm5 + .byte 102,15,111,170,70,93,0,0 // movdqa 0x5d46(%edx),%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,170,229,92,0,0 // mulps 0x5ce5(%edx),%xmm5 + .byte 15,89,170,86,93,0,0 // mulps 0x5d56(%edx),%xmm5 .byte 15,41,105,32 // movaps %xmm5,0x20(%ecx) - .byte 102,15,219,162,245,92,0,0 // pand 0x5cf5(%edx),%xmm4 + .byte 102,15,219,162,102,93,0,0 // pand 0x5d66(%edx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,162,5,93,0,0 // mulps 0x5d05(%edx),%xmm4 + .byte 15,89,162,118,93,0,0 // mulps 0x5d76(%edx),%xmm4 .byte 15,41,97,48 // movaps %xmm4,0x30(%ecx) - .byte 15,40,162,21,93,0,0 // movaps 0x5d15(%edx),%xmm4 + .byte 15,40,162,134,93,0,0 // movaps 0x5d86(%edx),%xmm4 .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx) .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp @@ -67044,22 +67718,22 @@ _sk_load_565_dst_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,46 // je 41ef <_sk_load_565_dst_sse2+0xd2> + .byte 116,46 // je 436e <_sk_load_565_dst_sse2+0xd2> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 41dd <_sk_load_565_dst_sse2+0xc0> + .byte 116,19 // je 435c <_sk_load_565_dst_sse2+0xc0> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,130 // jne 4151 <_sk_load_565_dst_sse2+0x34> + .byte 117,130 // jne 42d0 <_sk_load_565_dst_sse2+0x34> .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx .byte 102,15,110,227 // movd %ebx,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 .byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 233,98,255,255,255 // jmp 4151 <_sk_load_565_dst_sse2+0x34> + .byte 233,98,255,255,255 // jmp 42d0 <_sk_load_565_dst_sse2+0x34> .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi .byte 102,15,110,230 // movd %esi,%xmm4 - .byte 233,85,255,255,255 // jmp 4151 <_sk_load_565_dst_sse2+0x34> + .byte 233,85,255,255,255 // jmp 42d0 <_sk_load_565_dst_sse2+0x34> HIDDEN _sk_gather_565_sse2 .globl _sk_gather_565_sse2 @@ -67094,25 +67768,25 @@ _sk_gather_565_sse2: .byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2 .byte 102,15,126,193 // movd %xmm0,%ecx .byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx - .byte 232,0,0,0,0 // call 4277 <_sk_gather_565_sse2+0x7b> + .byte 232,0,0,0,0 // call 43f6 <_sk_gather_565_sse2+0x7b> .byte 90 // pop %edx .byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,130,217,91,0,0 // movdqa 0x5bd9(%edx),%xmm0 + .byte 102,15,111,130,74,92,0,0 // movdqa 0x5c4a(%edx),%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,130,233,91,0,0 // mulps 0x5be9(%edx),%xmm0 - .byte 102,15,111,138,249,91,0,0 // movdqa 0x5bf9(%edx),%xmm1 + .byte 15,89,130,90,92,0,0 // mulps 0x5c5a(%edx),%xmm0 + .byte 102,15,111,138,106,92,0,0 // movdqa 0x5c6a(%edx),%xmm1 .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,138,9,92,0,0 // mulps 0x5c09(%edx),%xmm1 - .byte 102,15,219,146,25,92,0,0 // pand 0x5c19(%edx),%xmm2 + .byte 15,89,138,122,92,0,0 // mulps 0x5c7a(%edx),%xmm1 + .byte 102,15,219,146,138,92,0,0 // pand 0x5c8a(%edx),%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,146,41,92,0,0 // mulps 0x5c29(%edx),%xmm2 + .byte 15,89,146,154,92,0,0 // mulps 0x5c9a(%edx),%xmm2 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,154,57,92,0,0 // movaps 0x5c39(%edx),%xmm3 + .byte 15,40,154,170,92,0,0 // movaps 0x5caa(%edx),%xmm3 .byte 81 // push %ecx .byte 255,117,8 // pushl 0x8(%ebp) .byte 255,80,4 // call *0x4(%eax) @@ -67130,7 +67804,7 @@ _sk_store_565_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 42ea <_sk_store_565_sse2+0xe> + .byte 232,0,0,0,0 // call 4469 <_sk_store_565_sse2+0xe> .byte 95 // pop %edi .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67140,8 +67814,8 @@ _sk_store_565_sse2: .byte 1,210 // add %edx,%edx .byte 3,22 // add (%esi),%edx .byte 139,49 // mov (%ecx),%esi - .byte 15,40,167,214,91,0,0 // movaps 0x5bd6(%edi),%xmm4 - .byte 15,40,175,230,91,0,0 // movaps 0x5be6(%edi),%xmm5 + .byte 15,40,167,71,92,0,0 // movaps 0x5c47(%edi),%xmm4 + .byte 15,40,175,87,92,0,0 // movaps 0x5c57(%edi),%xmm5 .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 15,40,240 // movaps %xmm0,%xmm6 .byte 15,89,244 // mulps %xmm4,%xmm6 @@ -67161,7 +67835,7 @@ _sk_store_565_sse2: .byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5 .byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp) .byte 133,219 // test %ebx,%ebx - .byte 117,34 // jne 437e <_sk_store_565_sse2+0xa2> + .byte 117,34 // jne 44fd <_sk_store_565_sse2+0xa2> .byte 102,15,126,231 // movd %xmm4,%edi .byte 102,15,126,235 // movd %xmm5,%ebx .byte 137,60,114 // mov %edi,(%edx,%esi,2) @@ -67181,20 +67855,20 @@ _sk_store_565_sse2: .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,37 // je 43b4 <_sk_store_565_sse2+0xd8> + .byte 116,37 // je 4533 <_sk_store_565_sse2+0xd8> .byte 128,251,2 // cmp $0x2,%bl - .byte 116,15 // je 43a3 <_sk_store_565_sse2+0xc7> + .byte 116,15 // je 4522 <_sk_store_565_sse2+0xc7> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,210 // jne 436b <_sk_store_565_sse2+0x8f> + .byte 117,210 // jne 44ea <_sk_store_565_sse2+0x8f> .byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi .byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2) .byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4 .byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4 .byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2) - .byte 235,183 // jmp 436b <_sk_store_565_sse2+0x8f> + .byte 235,183 // jmp 44ea <_sk_store_565_sse2+0x8f> .byte 102,15,126,231 // movd %xmm4,%edi .byte 102,137,60,114 // mov %di,(%edx,%esi,2) - .byte 235,173 // jmp 436b <_sk_store_565_sse2+0x8f> + .byte 235,173 // jmp 44ea <_sk_store_565_sse2+0x8f> HIDDEN _sk_load_4444_sse2 .globl _sk_load_4444_sse2 @@ -67206,7 +67880,7 @@ _sk_load_4444_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 43cc <_sk_load_4444_sse2+0xe> + .byte 232,0,0,0,0 // call 454b <_sk_load_4444_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67218,24 +67892,24 @@ _sk_load_4444_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,112 // jne 4459 <_sk_load_4444_sse2+0x9b> + .byte 117,112 // jne 45d8 <_sk_load_4444_sse2+0x9b> .byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,130,20,91,0,0 // movdqa 0x5b14(%edx),%xmm0 + .byte 102,15,111,130,133,91,0,0 // movdqa 0x5b85(%edx),%xmm0 .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,130,36,91,0,0 // mulps 0x5b24(%edx),%xmm0 - .byte 102,15,111,138,52,91,0,0 // movdqa 0x5b34(%edx),%xmm1 + .byte 15,89,130,149,91,0,0 // mulps 0x5b95(%edx),%xmm0 + .byte 102,15,111,138,165,91,0,0 // movdqa 0x5ba5(%edx),%xmm1 .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,138,68,91,0,0 // mulps 0x5b44(%edx),%xmm1 - .byte 102,15,111,146,84,91,0,0 // movdqa 0x5b54(%edx),%xmm2 + .byte 15,89,138,181,91,0,0 // mulps 0x5bb5(%edx),%xmm1 + .byte 102,15,111,146,197,91,0,0 // movdqa 0x5bc5(%edx),%xmm2 .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,146,100,91,0,0 // mulps 0x5b64(%edx),%xmm2 - .byte 102,15,219,154,116,91,0,0 // pand 0x5b74(%edx),%xmm3 + .byte 15,89,146,213,91,0,0 // mulps 0x5bd5(%edx),%xmm2 + .byte 102,15,219,154,229,91,0,0 // pand 0x5be5(%edx),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,154,132,91,0,0 // mulps 0x5b84(%edx),%xmm3 + .byte 15,89,154,245,91,0,0 // mulps 0x5bf5(%edx),%xmm3 .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp .byte 82 // push %edx @@ -67249,22 +67923,22 @@ _sk_load_4444_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,46 // je 448f <_sk_load_4444_sse2+0xd1> + .byte 116,46 // je 460e <_sk_load_4444_sse2+0xd1> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,19 // je 447d <_sk_load_4444_sse2+0xbf> + .byte 116,19 // je 45fc <_sk_load_4444_sse2+0xbf> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,131 // jne 43f2 <_sk_load_4444_sse2+0x34> + .byte 117,131 // jne 4571 <_sk_load_4444_sse2+0x34> .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx .byte 102,15,110,195 // movd %ebx,%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,216 // movsd %xmm0,%xmm3 - .byte 233,99,255,255,255 // jmp 43f2 <_sk_load_4444_sse2+0x34> + .byte 233,99,255,255,255 // jmp 4571 <_sk_load_4444_sse2+0x34> .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi .byte 102,15,110,222 // movd %esi,%xmm3 - .byte 233,86,255,255,255 // jmp 43f2 <_sk_load_4444_sse2+0x34> + .byte 233,86,255,255,255 // jmp 4571 <_sk_load_4444_sse2+0x34> HIDDEN _sk_load_4444_dst_sse2 .globl _sk_load_4444_dst_sse2 @@ -67276,7 +67950,7 @@ _sk_load_4444_dst_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 44aa <_sk_load_4444_dst_sse2+0xe> + .byte 232,0,0,0,0 // call 4629 <_sk_load_4444_dst_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67288,27 +67962,27 @@ _sk_load_4444_dst_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 15,133,128,0,0,0 // jne 454b <_sk_load_4444_dst_sse2+0xaf> + .byte 15,133,128,0,0,0 // jne 46ca <_sk_load_4444_dst_sse2+0xaf> .byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,111,170,182,90,0,0 // movdqa 0x5ab6(%edx),%xmm5 + .byte 102,15,111,170,39,91,0,0 // movdqa 0x5b27(%edx),%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,170,198,90,0,0 // mulps 0x5ac6(%edx),%xmm5 + .byte 15,89,170,55,91,0,0 // mulps 0x5b37(%edx),%xmm5 .byte 15,41,105,16 // movaps %xmm5,0x10(%ecx) - .byte 102,15,111,170,214,90,0,0 // movdqa 0x5ad6(%edx),%xmm5 + .byte 102,15,111,170,71,91,0,0 // movdqa 0x5b47(%edx),%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,170,230,90,0,0 // mulps 0x5ae6(%edx),%xmm5 + .byte 15,89,170,87,91,0,0 // mulps 0x5b57(%edx),%xmm5 .byte 15,41,105,32 // movaps %xmm5,0x20(%ecx) - .byte 102,15,111,170,246,90,0,0 // movdqa 0x5af6(%edx),%xmm5 + .byte 102,15,111,170,103,91,0,0 // movdqa 0x5b67(%edx),%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,170,6,91,0,0 // mulps 0x5b06(%edx),%xmm5 + .byte 15,89,170,119,91,0,0 // mulps 0x5b77(%edx),%xmm5 .byte 15,41,105,48 // movaps %xmm5,0x30(%ecx) - .byte 102,15,219,162,22,91,0,0 // pand 0x5b16(%edx),%xmm4 + .byte 102,15,219,162,135,91,0,0 // pand 0x5b87(%edx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,162,38,91,0,0 // mulps 0x5b26(%edx),%xmm4 + .byte 15,89,162,151,91,0,0 // mulps 0x5b97(%edx),%xmm4 .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx) .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp @@ -67323,22 +67997,22 @@ _sk_load_4444_dst_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,50 // je 4585 <_sk_load_4444_dst_sse2+0xe9> + .byte 116,50 // je 4704 <_sk_load_4444_dst_sse2+0xe9> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,23 // je 4573 <_sk_load_4444_dst_sse2+0xd7> + .byte 116,23 // je 46f2 <_sk_load_4444_dst_sse2+0xd7> .byte 128,251,3 // cmp $0x3,%bl - .byte 15,133,111,255,255,255 // jne 44d4 <_sk_load_4444_dst_sse2+0x38> + .byte 15,133,111,255,255,255 // jne 4653 <_sk_load_4444_dst_sse2+0x38> .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx .byte 102,15,110,227 // movd %ebx,%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 .byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 - .byte 233,79,255,255,255 // jmp 44d4 <_sk_load_4444_dst_sse2+0x38> + .byte 233,79,255,255,255 // jmp 4653 <_sk_load_4444_dst_sse2+0x38> .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi .byte 102,15,110,230 // movd %esi,%xmm4 - .byte 233,66,255,255,255 // jmp 44d4 <_sk_load_4444_dst_sse2+0x38> + .byte 233,66,255,255,255 // jmp 4653 <_sk_load_4444_dst_sse2+0x38> HIDDEN _sk_gather_4444_sse2 .globl _sk_gather_4444_sse2 @@ -67374,25 +68048,25 @@ _sk_gather_4444_sse2: .byte 102,15,126,193 // movd %xmm0,%ecx .byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx .byte 102,15,196,217,3 // pinsrw $0x3,%ecx,%xmm3 - .byte 232,0,0,0,0 // call 4612 <_sk_gather_4444_sse2+0x80> + .byte 232,0,0,0,0 // call 4791 <_sk_gather_4444_sse2+0x80> .byte 89 // pop %ecx .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,129,206,89,0,0 // movdqa 0x59ce(%ecx),%xmm0 + .byte 102,15,111,129,63,90,0,0 // movdqa 0x5a3f(%ecx),%xmm0 .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,129,222,89,0,0 // mulps 0x59de(%ecx),%xmm0 - .byte 102,15,111,137,238,89,0,0 // movdqa 0x59ee(%ecx),%xmm1 + .byte 15,89,129,79,90,0,0 // mulps 0x5a4f(%ecx),%xmm0 + .byte 102,15,111,137,95,90,0,0 // movdqa 0x5a5f(%ecx),%xmm1 .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,137,254,89,0,0 // mulps 0x59fe(%ecx),%xmm1 - .byte 102,15,111,145,14,90,0,0 // movdqa 0x5a0e(%ecx),%xmm2 + .byte 15,89,137,111,90,0,0 // mulps 0x5a6f(%ecx),%xmm1 + .byte 102,15,111,145,127,90,0,0 // movdqa 0x5a7f(%ecx),%xmm2 .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,145,30,90,0,0 // mulps 0x5a1e(%ecx),%xmm2 - .byte 102,15,219,153,46,90,0,0 // pand 0x5a2e(%ecx),%xmm3 + .byte 15,89,145,143,90,0,0 // mulps 0x5a8f(%ecx),%xmm2 + .byte 102,15,219,153,159,90,0,0 // pand 0x5a9f(%ecx),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,153,62,90,0,0 // mulps 0x5a3e(%ecx),%xmm3 + .byte 15,89,153,175,90,0,0 // mulps 0x5aaf(%ecx),%xmm3 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 131,236,8 // sub $0x8,%esp .byte 81 // push %ecx @@ -67412,7 +68086,7 @@ _sk_store_4444_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 468f <_sk_store_4444_sse2+0xe> + .byte 232,0,0,0,0 // call 480e <_sk_store_4444_sse2+0xe> .byte 95 // pop %edi .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67422,7 +68096,7 @@ _sk_store_4444_sse2: .byte 1,210 // add %edx,%edx .byte 3,22 // add (%esi),%edx .byte 139,49 // mov (%ecx),%esi - .byte 15,40,167,209,89,0,0 // movaps 0x59d1(%edi),%xmm4 + .byte 15,40,167,66,90,0,0 // movaps 0x5a42(%edi),%xmm4 .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -67448,7 +68122,7 @@ _sk_store_4444_sse2: .byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5 .byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp) .byte 133,219 // test %ebx,%ebx - .byte 117,34 // jne 4732 <_sk_store_4444_sse2+0xb1> + .byte 117,34 // jne 48b1 <_sk_store_4444_sse2+0xb1> .byte 102,15,126,231 // movd %xmm4,%edi .byte 102,15,126,235 // movd %xmm5,%ebx .byte 137,60,114 // mov %edi,(%edx,%esi,2) @@ -67468,20 +68142,20 @@ _sk_store_4444_sse2: .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,37 // je 4768 <_sk_store_4444_sse2+0xe7> + .byte 116,37 // je 48e7 <_sk_store_4444_sse2+0xe7> .byte 128,251,2 // cmp $0x2,%bl - .byte 116,15 // je 4757 <_sk_store_4444_sse2+0xd6> + .byte 116,15 // je 48d6 <_sk_store_4444_sse2+0xd6> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,210 // jne 471f <_sk_store_4444_sse2+0x9e> + .byte 117,210 // jne 489e <_sk_store_4444_sse2+0x9e> .byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi .byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2) .byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4 .byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4 .byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2) - .byte 235,183 // jmp 471f <_sk_store_4444_sse2+0x9e> + .byte 235,183 // jmp 489e <_sk_store_4444_sse2+0x9e> .byte 102,15,126,231 // movd %xmm4,%edi .byte 102,137,60,114 // mov %di,(%edx,%esi,2) - .byte 235,173 // jmp 471f <_sk_store_4444_sse2+0x9e> + .byte 235,173 // jmp 489e <_sk_store_4444_sse2+0x9e> HIDDEN _sk_load_8888_sse2 .globl _sk_load_8888_sse2 @@ -67493,7 +68167,7 @@ _sk_load_8888_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 4780 <_sk_load_8888_sse2+0xe> + .byte 232,0,0,0,0 // call 48ff <_sk_load_8888_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67505,13 +68179,13 @@ _sk_load_8888_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,102 // jne 4804 <_sk_load_8888_sse2+0x92> + .byte 117,102 // jne 4983 <_sk_load_8888_sse2+0x92> .byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3 - .byte 102,15,111,146,240,88,0,0 // movdqa 0x58f0(%edx),%xmm2 + .byte 102,15,111,146,97,89,0,0 // movdqa 0x5961(%edx),%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,162,0,89,0,0 // movaps 0x5900(%edx),%xmm4 + .byte 15,40,162,113,89,0,0 // movaps 0x5971(%edx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -67539,18 +68213,18 @@ _sk_load_8888_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,35 // je 482f <_sk_load_8888_sse2+0xbd> + .byte 116,35 // je 49ae <_sk_load_8888_sse2+0xbd> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,16 // je 4825 <_sk_load_8888_sse2+0xb3> + .byte 116,16 // je 49a4 <_sk_load_8888_sse2+0xb3> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,137 // jne 47a3 <_sk_load_8888_sse2+0x31> + .byte 117,137 // jne 4922 <_sk_load_8888_sse2+0x31> .byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3 - .byte 233,116,255,255,255 // jmp 47a3 <_sk_load_8888_sse2+0x31> + .byte 233,116,255,255,255 // jmp 4922 <_sk_load_8888_sse2+0x31> .byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3 - .byte 233,106,255,255,255 // jmp 47a3 <_sk_load_8888_sse2+0x31> + .byte 233,106,255,255,255 // jmp 4922 <_sk_load_8888_sse2+0x31> HIDDEN _sk_load_8888_dst_sse2 .globl _sk_load_8888_dst_sse2 @@ -67562,7 +68236,7 @@ _sk_load_8888_dst_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 4847 <_sk_load_8888_dst_sse2+0xe> + .byte 232,0,0,0,0 // call 49c6 <_sk_load_8888_dst_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67574,13 +68248,13 @@ _sk_load_8888_dst_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,118 // jne 48db <_sk_load_8888_dst_sse2+0xa2> + .byte 117,118 // jne 4a5a <_sk_load_8888_dst_sse2+0xa2> .byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4 - .byte 102,15,111,170,73,88,0,0 // movdqa 0x5849(%edx),%xmm5 + .byte 102,15,111,170,186,88,0,0 // movdqa 0x58ba(%edx),%xmm5 .byte 102,15,111,244 // movdqa %xmm4,%xmm6 .byte 102,15,219,245 // pand %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,40,186,89,88,0,0 // movaps 0x5859(%edx),%xmm7 + .byte 15,40,186,202,88,0,0 // movaps 0x58ca(%edx),%xmm7 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,41,113,16 // movaps %xmm6,0x10(%ecx) .byte 102,15,111,244 // movdqa %xmm4,%xmm6 @@ -67612,18 +68286,18 @@ _sk_load_8888_dst_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,39 // je 490a <_sk_load_8888_dst_sse2+0xd1> + .byte 116,39 // je 4a89 <_sk_load_8888_dst_sse2+0xd1> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,20 // je 4900 <_sk_load_8888_dst_sse2+0xc7> + .byte 116,20 // je 4a7f <_sk_load_8888_dst_sse2+0xc7> .byte 128,251,3 // cmp $0x3,%bl - .byte 15,133,117,255,255,255 // jne 486a <_sk_load_8888_dst_sse2+0x31> + .byte 15,133,117,255,255,255 // jne 49e9 <_sk_load_8888_dst_sse2+0x31> .byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 .byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4 - .byte 233,96,255,255,255 // jmp 486a <_sk_load_8888_dst_sse2+0x31> + .byte 233,96,255,255,255 // jmp 49e9 <_sk_load_8888_dst_sse2+0x31> .byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4 - .byte 233,86,255,255,255 // jmp 486a <_sk_load_8888_dst_sse2+0x31> + .byte 233,86,255,255,255 // jmp 49e9 <_sk_load_8888_dst_sse2+0x31> HIDDEN _sk_gather_8888_sse2 .globl _sk_gather_8888_sse2 @@ -67657,16 +68331,16 @@ _sk_gather_8888_sse2: .byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3 .byte 102,15,126,193 // movd %xmm0,%ecx .byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0 - .byte 232,0,0,0,0 // call 498a <_sk_gather_8888_sse2+0x76> + .byte 232,0,0,0,0 // call 4b09 <_sk_gather_8888_sse2+0x76> .byte 89 // pop %ecx .byte 102,15,98,202 // punpckldq %xmm2,%xmm1 .byte 102,15,98,216 // punpckldq %xmm0,%xmm3 .byte 102,15,98,217 // punpckldq %xmm1,%xmm3 - .byte 102,15,111,145,38,87,0,0 // movdqa 0x5726(%ecx),%xmm2 + .byte 102,15,111,145,151,87,0,0 // movdqa 0x5797(%ecx),%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,161,54,87,0,0 // movaps 0x5736(%ecx),%xmm4 + .byte 15,40,161,167,87,0,0 // movaps 0x57a7(%ecx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -67700,7 +68374,7 @@ _sk_store_8888_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 4a05 <_sk_store_8888_sse2+0xe> + .byte 232,0,0,0,0 // call 4b84 <_sk_store_8888_sse2+0xe> .byte 95 // pop %edi .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67710,7 +68384,7 @@ _sk_store_8888_sse2: .byte 193,226,2 // shl $0x2,%edx .byte 3,22 // add (%esi),%edx .byte 139,49 // mov (%ecx),%esi - .byte 15,40,167,203,86,0,0 // movaps 0x56cb(%edi),%xmm4 + .byte 15,40,167,60,87,0,0 // movaps 0x573c(%edi),%xmm4 .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -67730,7 +68404,7 @@ _sk_store_8888_sse2: .byte 102,15,235,229 // por %xmm5,%xmm4 .byte 102,15,235,230 // por %xmm6,%xmm4 .byte 133,219 // test %ebx,%ebx - .byte 117,24 // jne 4a82 <_sk_store_8888_sse2+0x8b> + .byte 117,24 // jne 4c01 <_sk_store_8888_sse2+0x8b> .byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4) .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp @@ -67745,17 +68419,17 @@ _sk_store_8888_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,28 // je 4aa6 <_sk_store_8888_sse2+0xaf> + .byte 116,28 // je 4c25 <_sk_store_8888_sse2+0xaf> .byte 128,251,2 // cmp $0x2,%bl - .byte 116,16 // je 4a9f <_sk_store_8888_sse2+0xa8> + .byte 116,16 // je 4c1e <_sk_store_8888_sse2+0xa8> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,219 // jne 4a6f <_sk_store_8888_sse2+0x78> + .byte 117,219 // jne 4bee <_sk_store_8888_sse2+0x78> .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5 .byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4) .byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4) - .byte 235,201 // jmp 4a6f <_sk_store_8888_sse2+0x78> + .byte 235,201 // jmp 4bee <_sk_store_8888_sse2+0x78> .byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4) - .byte 235,194 // jmp 4a6f <_sk_store_8888_sse2+0x78> + .byte 235,194 // jmp 4bee <_sk_store_8888_sse2+0x78> HIDDEN _sk_load_bgra_sse2 .globl _sk_load_bgra_sse2 @@ -67767,7 +68441,7 @@ _sk_load_bgra_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 4abb <_sk_load_bgra_sse2+0xe> + .byte 232,0,0,0,0 // call 4c3a <_sk_load_bgra_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67779,13 +68453,13 @@ _sk_load_bgra_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,102 // jne 4b3f <_sk_load_bgra_sse2+0x92> + .byte 117,102 // jne 4cbe <_sk_load_bgra_sse2+0x92> .byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3 - .byte 102,15,111,130,37,86,0,0 // movdqa 0x5625(%edx),%xmm0 + .byte 102,15,111,130,150,86,0,0 // movdqa 0x5696(%edx),%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,219,200 // pand %xmm0,%xmm1 .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2 - .byte 15,40,162,53,86,0,0 // movaps 0x5635(%edx),%xmm4 + .byte 15,40,162,166,86,0,0 // movaps 0x56a6(%edx),%xmm4 .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -67813,18 +68487,18 @@ _sk_load_bgra_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,35 // je 4b6a <_sk_load_bgra_sse2+0xbd> + .byte 116,35 // je 4ce9 <_sk_load_bgra_sse2+0xbd> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,16 // je 4b60 <_sk_load_bgra_sse2+0xb3> + .byte 116,16 // je 4cdf <_sk_load_bgra_sse2+0xb3> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,137 // jne 4ade <_sk_load_bgra_sse2+0x31> + .byte 117,137 // jne 4c5d <_sk_load_bgra_sse2+0x31> .byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3 - .byte 233,116,255,255,255 // jmp 4ade <_sk_load_bgra_sse2+0x31> + .byte 233,116,255,255,255 // jmp 4c5d <_sk_load_bgra_sse2+0x31> .byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3 - .byte 233,106,255,255,255 // jmp 4ade <_sk_load_bgra_sse2+0x31> + .byte 233,106,255,255,255 // jmp 4c5d <_sk_load_bgra_sse2+0x31> HIDDEN _sk_load_bgra_dst_sse2 .globl _sk_load_bgra_dst_sse2 @@ -67836,7 +68510,7 @@ _sk_load_bgra_dst_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 4b82 <_sk_load_bgra_dst_sse2+0xe> + .byte 232,0,0,0,0 // call 4d01 <_sk_load_bgra_dst_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67848,13 +68522,13 @@ _sk_load_bgra_dst_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 117,118 // jne 4c16 <_sk_load_bgra_dst_sse2+0xa2> + .byte 117,118 // jne 4d95 <_sk_load_bgra_dst_sse2+0xa2> .byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4 - .byte 102,15,111,170,126,85,0,0 // movdqa 0x557e(%edx),%xmm5 + .byte 102,15,111,170,239,85,0,0 // movdqa 0x55ef(%edx),%xmm5 .byte 102,15,111,244 // movdqa %xmm4,%xmm6 .byte 102,15,219,245 // pand %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,40,186,142,85,0,0 // movaps 0x558e(%edx),%xmm7 + .byte 15,40,186,255,85,0,0 // movaps 0x55ff(%edx),%xmm7 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,41,113,48 // movaps %xmm6,0x30(%ecx) .byte 102,15,111,244 // movdqa %xmm4,%xmm6 @@ -67886,18 +68560,18 @@ _sk_load_bgra_dst_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,39 // je 4c45 <_sk_load_bgra_dst_sse2+0xd1> + .byte 116,39 // je 4dc4 <_sk_load_bgra_dst_sse2+0xd1> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,20 // je 4c3b <_sk_load_bgra_dst_sse2+0xc7> + .byte 116,20 // je 4dba <_sk_load_bgra_dst_sse2+0xc7> .byte 128,251,3 // cmp $0x3,%bl - .byte 15,133,117,255,255,255 // jne 4ba5 <_sk_load_bgra_dst_sse2+0x31> + .byte 15,133,117,255,255,255 // jne 4d24 <_sk_load_bgra_dst_sse2+0x31> .byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4 .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4 .byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4 - .byte 233,96,255,255,255 // jmp 4ba5 <_sk_load_bgra_dst_sse2+0x31> + .byte 233,96,255,255,255 // jmp 4d24 <_sk_load_bgra_dst_sse2+0x31> .byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4 - .byte 233,86,255,255,255 // jmp 4ba5 <_sk_load_bgra_dst_sse2+0x31> + .byte 233,86,255,255,255 // jmp 4d24 <_sk_load_bgra_dst_sse2+0x31> HIDDEN _sk_gather_bgra_sse2 .globl _sk_gather_bgra_sse2 @@ -67931,16 +68605,16 @@ _sk_gather_bgra_sse2: .byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3 .byte 102,15,126,193 // movd %xmm0,%ecx .byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0 - .byte 232,0,0,0,0 // call 4cc5 <_sk_gather_bgra_sse2+0x76> + .byte 232,0,0,0,0 // call 4e44 <_sk_gather_bgra_sse2+0x76> .byte 89 // pop %ecx .byte 102,15,98,202 // punpckldq %xmm2,%xmm1 .byte 102,15,98,216 // punpckldq %xmm0,%xmm3 .byte 102,15,98,217 // punpckldq %xmm1,%xmm3 - .byte 102,15,111,129,91,84,0,0 // movdqa 0x545b(%ecx),%xmm0 + .byte 102,15,111,129,204,84,0,0 // movdqa 0x54cc(%ecx),%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,219,200 // pand %xmm0,%xmm1 .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2 - .byte 15,40,161,107,84,0,0 // movaps 0x546b(%ecx),%xmm4 + .byte 15,40,161,220,84,0,0 // movaps 0x54dc(%ecx),%xmm4 .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -67974,7 +68648,7 @@ _sk_store_bgra_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,12 // sub $0xc,%esp - .byte 232,0,0,0,0 // call 4d40 <_sk_store_bgra_sse2+0xe> + .byte 232,0,0,0,0 // call 4ebf <_sk_store_bgra_sse2+0xe> .byte 95 // pop %edi .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -67984,7 +68658,7 @@ _sk_store_bgra_sse2: .byte 193,226,2 // shl $0x2,%edx .byte 3,22 // add (%esi),%edx .byte 139,49 // mov (%ecx),%esi - .byte 15,40,167,0,84,0,0 // movaps 0x5400(%edi),%xmm4 + .byte 15,40,167,113,84,0,0 // movaps 0x5471(%edi),%xmm4 .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -68004,7 +68678,7 @@ _sk_store_bgra_sse2: .byte 102,15,235,229 // por %xmm5,%xmm4 .byte 102,15,235,230 // por %xmm6,%xmm4 .byte 133,219 // test %ebx,%ebx - .byte 117,24 // jne 4dbd <_sk_store_bgra_sse2+0x8b> + .byte 117,24 // jne 4f3c <_sk_store_bgra_sse2+0x8b> .byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4) .byte 141,80,8 // lea 0x8(%eax),%edx .byte 131,236,8 // sub $0x8,%esp @@ -68019,17 +68693,17 @@ _sk_store_bgra_sse2: .byte 195 // ret .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,28 // je 4de1 <_sk_store_bgra_sse2+0xaf> + .byte 116,28 // je 4f60 <_sk_store_bgra_sse2+0xaf> .byte 128,251,2 // cmp $0x2,%bl - .byte 116,16 // je 4dda <_sk_store_bgra_sse2+0xa8> + .byte 116,16 // je 4f59 <_sk_store_bgra_sse2+0xa8> .byte 128,251,3 // cmp $0x3,%bl - .byte 117,219 // jne 4daa <_sk_store_bgra_sse2+0x78> + .byte 117,219 // jne 4f29 <_sk_store_bgra_sse2+0x78> .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5 .byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4) .byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4) - .byte 235,201 // jmp 4daa <_sk_store_bgra_sse2+0x78> + .byte 235,201 // jmp 4f29 <_sk_store_bgra_sse2+0x78> .byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4) - .byte 235,194 // jmp 4daa <_sk_store_bgra_sse2+0x78> + .byte 235,194 // jmp 4f29 <_sk_store_bgra_sse2+0x78> HIDDEN _sk_load_f16_sse2 .globl _sk_load_f16_sse2 @@ -68041,7 +68715,7 @@ _sk_load_f16_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,92 // sub $0x5c,%esp - .byte 232,0,0,0,0 // call 4df6 <_sk_load_f16_sse2+0xe> + .byte 232,0,0,0,0 // call 4f75 <_sk_load_f16_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -68053,7 +68727,7 @@ _sk_load_f16_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 15,133,160,1,0,0 // jne 4fb8 <_sk_load_f16_sse2+0x1d0> + .byte 15,133,160,1,0,0 // jne 5137 <_sk_load_f16_sse2+0x1d0> .byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0 .byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1 .byte 102,15,40,216 // movapd %xmm0,%xmm3 @@ -68081,7 +68755,7 @@ _sk_load_f16_sse2: .byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp) .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 - .byte 102,15,111,154,90,83,0,0 // movdqa 0x535a(%edx),%xmm3 + .byte 102,15,111,154,203,83,0,0 // movdqa 0x53cb(%edx),%xmm3 .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,219,227 // pand %xmm3,%xmm4 .byte 102,15,239,204 // pxor %xmm4,%xmm1 @@ -68114,15 +68788,15 @@ _sk_load_f16_sse2: .byte 102,15,111,199 // movdqa %xmm7,%xmm0 .byte 102,15,114,240,13 // pslld $0xd,%xmm0 .byte 102,15,235,195 // por %xmm3,%xmm0 - .byte 102,15,111,154,106,83,0,0 // movdqa 0x536a(%edx),%xmm3 + .byte 102,15,111,154,219,83,0,0 // movdqa 0x53db(%edx),%xmm3 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,254,243 // paddd %xmm3,%xmm6 .byte 102,15,254,235 // paddd %xmm3,%xmm5 .byte 102,15,254,195 // paddd %xmm3,%xmm0 - .byte 102,15,111,154,122,83,0,0 // movdqa 0x537a(%edx),%xmm3 + .byte 102,15,111,154,235,83,0,0 // movdqa 0x53eb(%edx),%xmm3 .byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp) .byte 102,15,239,203 // pxor %xmm3,%xmm1 - .byte 102,15,111,154,138,83,0,0 // movdqa 0x538a(%edx),%xmm3 + .byte 102,15,111,154,251,83,0,0 // movdqa 0x53fb(%edx),%xmm3 .byte 102,15,111,227 // movdqa %xmm3,%xmm4 .byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4 .byte 102,15,223,226 // pandn %xmm2,%xmm4 @@ -68154,12 +68828,12 @@ _sk_load_f16_sse2: .byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,251,1 // cmp $0x1,%ebx - .byte 15,132,89,254,255,255 // je 4e23 <_sk_load_f16_sse2+0x3b> + .byte 15,132,89,254,255,255 // je 4fa2 <_sk_load_f16_sse2+0x3b> .byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0 .byte 131,251,3 // cmp $0x3,%ebx - .byte 15,130,74,254,255,255 // jb 4e23 <_sk_load_f16_sse2+0x3b> + .byte 15,130,74,254,255,255 // jb 4fa2 <_sk_load_f16_sse2+0x3b> .byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1 - .byte 233,63,254,255,255 // jmp 4e23 <_sk_load_f16_sse2+0x3b> + .byte 233,63,254,255,255 // jmp 4fa2 <_sk_load_f16_sse2+0x3b> HIDDEN _sk_load_f16_dst_sse2 .globl _sk_load_f16_dst_sse2 @@ -68175,7 +68849,7 @@ _sk_load_f16_dst_sse2: .byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp) .byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp) .byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp) - .byte 232,0,0,0,0 // call 500c <_sk_load_f16_dst_sse2+0x28> + .byte 232,0,0,0,0 // call 518b <_sk_load_f16_dst_sse2+0x28> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,77,8 // mov 0x8(%ebp),%ecx @@ -68187,7 +68861,7 @@ _sk_load_f16_dst_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 133,219 // test %ebx,%ebx .byte 139,57 // mov (%ecx),%edi - .byte 15,133,206,1,0,0 // jne 51fc <_sk_load_f16_dst_sse2+0x218> + .byte 15,133,206,1,0,0 // jne 537b <_sk_load_f16_dst_sse2+0x218> .byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0 .byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -68215,7 +68889,7 @@ _sk_load_f16_dst_sse2: .byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp) .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,15,97,225 // punpcklwd %xmm1,%xmm4 - .byte 102,15,111,154,132,81,0,0 // movdqa 0x5184(%edx),%xmm3 + .byte 102,15,111,154,245,81,0,0 // movdqa 0x51f5(%edx),%xmm3 .byte 102,15,111,212 // movdqa %xmm4,%xmm2 .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 102,15,239,226 // pxor %xmm2,%xmm4 @@ -68223,13 +68897,13 @@ _sk_load_f16_dst_sse2: .byte 102,15,111,204 // movdqa %xmm4,%xmm1 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,15,111,146,164,81,0,0 // movdqa 0x51a4(%edx),%xmm2 + .byte 102,15,111,146,21,82,0,0 // movdqa 0x5215(%edx),%xmm2 .byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp) .byte 102,15,239,226 // pxor %xmm2,%xmm4 - .byte 102,15,111,178,180,81,0,0 // movdqa 0x51b4(%edx),%xmm6 + .byte 102,15,111,178,37,82,0,0 // movdqa 0x5225(%edx),%xmm6 .byte 102,15,111,254 // movdqa %xmm6,%xmm7 .byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7 - .byte 102,15,111,146,148,81,0,0 // movdqa 0x5194(%edx),%xmm2 + .byte 102,15,111,146,5,82,0,0 // movdqa 0x5205(%edx),%xmm2 .byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp) .byte 102,15,254,202 // paddd %xmm2,%xmm1 .byte 102,15,223,249 // pandn %xmm1,%xmm7 @@ -68297,12 +68971,12 @@ _sk_load_f16_dst_sse2: .byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,251,1 // cmp $0x1,%ebx - .byte 15,132,43,254,255,255 // je 5039 <_sk_load_f16_dst_sse2+0x55> + .byte 15,132,43,254,255,255 // je 51b8 <_sk_load_f16_dst_sse2+0x55> .byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0 .byte 131,251,3 // cmp $0x3,%ebx - .byte 15,130,28,254,255,255 // jb 5039 <_sk_load_f16_dst_sse2+0x55> + .byte 15,130,28,254,255,255 // jb 51b8 <_sk_load_f16_dst_sse2+0x55> .byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1 - .byte 233,17,254,255,255 // jmp 5039 <_sk_load_f16_dst_sse2+0x55> + .byte 233,17,254,255,255 // jmp 51b8 <_sk_load_f16_dst_sse2+0x55> HIDDEN _sk_gather_f16_sse2 .globl _sk_gather_f16_sse2 @@ -68340,7 +69014,7 @@ _sk_gather_f16_sse2: .byte 102,15,126,194 // movd %xmm0,%edx .byte 102,15,110,68,209,4 // movd 0x4(%ecx,%edx,8),%xmm0 .byte 102,15,110,60,209 // movd (%ecx,%edx,8),%xmm7 - .byte 232,0,0,0,0 // call 52b6 <_sk_gather_f16_sse2+0x8e> + .byte 232,0,0,0,0 // call 5435 <_sk_gather_f16_sse2+0x8e> .byte 89 // pop %ecx .byte 102,15,98,202 // punpckldq %xmm2,%xmm1 .byte 102,15,98,227 // punpckldq %xmm3,%xmm4 @@ -68373,7 +69047,7 @@ _sk_gather_f16_sse2: .byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp) .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 - .byte 102,15,111,153,26,79,0,0 // movdqa 0x4f1a(%ecx),%xmm3 + .byte 102,15,111,153,139,79,0,0 // movdqa 0x4f8b(%ecx),%xmm3 .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,219,227 // pand %xmm3,%xmm4 .byte 102,15,239,204 // pxor %xmm4,%xmm1 @@ -68406,15 +69080,15 @@ _sk_gather_f16_sse2: .byte 102,15,111,199 // movdqa %xmm7,%xmm0 .byte 102,15,114,240,13 // pslld $0xd,%xmm0 .byte 102,15,235,195 // por %xmm3,%xmm0 - .byte 102,15,111,153,42,79,0,0 // movdqa 0x4f2a(%ecx),%xmm3 + .byte 102,15,111,153,155,79,0,0 // movdqa 0x4f9b(%ecx),%xmm3 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,254,243 // paddd %xmm3,%xmm6 .byte 102,15,254,235 // paddd %xmm3,%xmm5 .byte 102,15,254,195 // paddd %xmm3,%xmm0 - .byte 102,15,111,153,58,79,0,0 // movdqa 0x4f3a(%ecx),%xmm3 + .byte 102,15,111,153,171,79,0,0 // movdqa 0x4fab(%ecx),%xmm3 .byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp) .byte 102,15,239,203 // pxor %xmm3,%xmm1 - .byte 102,15,111,153,74,79,0,0 // movdqa 0x4f4a(%ecx),%xmm3 + .byte 102,15,111,153,187,79,0,0 // movdqa 0x4fbb(%ecx),%xmm3 .byte 102,15,111,227 // movdqa %xmm3,%xmm4 .byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4 .byte 102,15,223,226 // pandn %xmm2,%xmm4 @@ -68453,20 +69127,20 @@ _sk_store_f16_sse2: .byte 131,236,80 // sub $0x50,%esp .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 102,15,111,218 // movdqa %xmm2,%xmm3 - .byte 232,0,0,0,0 // call 5479 <_sk_store_f16_sse2+0x15> + .byte 232,0,0,0,0 // call 55f8 <_sk_store_f16_sse2+0x15> .byte 88 // pop %eax - .byte 102,15,111,176,151,77,0,0 // movdqa 0x4d97(%eax),%xmm6 + .byte 102,15,111,176,8,78,0,0 // movdqa 0x4e08(%eax),%xmm6 .byte 102,15,111,208 // movdqa %xmm0,%xmm2 .byte 102,15,219,214 // pand %xmm6,%xmm2 .byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp) .byte 102,15,111,232 // movdqa %xmm0,%xmm5 .byte 102,15,239,234 // pxor %xmm2,%xmm5 - .byte 102,15,111,160,167,77,0,0 // movdqa 0x4da7(%eax),%xmm4 + .byte 102,15,111,160,24,78,0,0 // movdqa 0x4e18(%eax),%xmm4 .byte 102,15,114,210,16 // psrld $0x10,%xmm2 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0 .byte 102,15,114,213,13 // psrld $0xd,%xmm5 - .byte 102,15,111,184,183,77,0,0 // movdqa 0x4db7(%eax),%xmm7 + .byte 102,15,111,184,40,78,0,0 // movdqa 0x4e28(%eax),%xmm7 .byte 102,15,254,215 // paddd %xmm7,%xmm2 .byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp) .byte 102,15,254,213 // paddd %xmm5,%xmm2 @@ -68528,7 +69202,7 @@ _sk_store_f16_sse2: .byte 3,55 // add (%edi),%esi .byte 139,121,8 // mov 0x8(%ecx),%edi .byte 133,255 // test %edi,%edi - .byte 117,53 // jne 55eb <_sk_store_f16_sse2+0x187> + .byte 117,53 // jne 576a <_sk_store_f16_sse2+0x187> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,98,197 // punpckldq %xmm5,%xmm0 .byte 243,15,127,4,214 // movdqu %xmm0,(%esi,%edx,8) @@ -68551,13 +69225,13 @@ _sk_store_f16_sse2: .byte 102,15,98,213 // punpckldq %xmm5,%xmm2 .byte 102,15,214,20,214 // movq %xmm2,(%esi,%edx,8) .byte 131,255,1 // cmp $0x1,%edi - .byte 116,208 // je 55cd <_sk_store_f16_sse2+0x169> + .byte 116,208 // je 574c <_sk_store_f16_sse2+0x169> .byte 102,15,23,84,214,8 // movhpd %xmm2,0x8(%esi,%edx,8) .byte 131,255,3 // cmp $0x3,%edi - .byte 114,197 // jb 55cd <_sk_store_f16_sse2+0x169> + .byte 114,197 // jb 574c <_sk_store_f16_sse2+0x169> .byte 102,15,106,205 // punpckhdq %xmm5,%xmm1 .byte 102,15,214,76,214,16 // movq %xmm1,0x10(%esi,%edx,8) - .byte 235,185 // jmp 55cd <_sk_store_f16_sse2+0x169> + .byte 235,185 // jmp 574c <_sk_store_f16_sse2+0x169> HIDDEN _sk_load_u16_be_sse2 .globl _sk_load_u16_be_sse2 @@ -68580,9 +69254,9 @@ _sk_load_u16_be_sse2: .byte 139,89,8 // mov 0x8(%ecx),%ebx .byte 193,230,2 // shl $0x2,%esi .byte 133,219 // test %ebx,%ebx - .byte 232,0,0,0,0 // call 563f <_sk_load_u16_be_sse2+0x2b> + .byte 232,0,0,0,0 // call 57be <_sk_load_u16_be_sse2+0x2b> .byte 90 // pop %edx - .byte 15,133,11,1,0,0 // jne 5751 <_sk_load_u16_be_sse2+0x13d> + .byte 15,133,11,1,0,0 // jne 58d0 <_sk_load_u16_be_sse2+0x13d> .byte 102,15,16,4,119 // movupd (%edi,%esi,2),%xmm0 .byte 243,15,111,76,119,16 // movdqu 0x10(%edi,%esi,2),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -68603,7 +69277,7 @@ _sk_load_u16_be_sse2: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,97,195 // punpcklwd %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,162,1,76,0,0 // movaps 0x4c01(%edx),%xmm4 + .byte 15,40,162,114,76,0,0 // movaps 0x4c72(%edx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -68653,12 +69327,12 @@ _sk_load_u16_be_sse2: .byte 242,15,16,4,119 // movsd (%edi,%esi,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,251,1 // cmp $0x1,%ebx - .byte 15,132,238,254,255,255 // je 5651 <_sk_load_u16_be_sse2+0x3d> + .byte 15,132,238,254,255,255 // je 57d0 <_sk_load_u16_be_sse2+0x3d> .byte 102,15,22,68,119,8 // movhpd 0x8(%edi,%esi,2),%xmm0 .byte 131,251,3 // cmp $0x3,%ebx - .byte 15,130,223,254,255,255 // jb 5651 <_sk_load_u16_be_sse2+0x3d> + .byte 15,130,223,254,255,255 // jb 57d0 <_sk_load_u16_be_sse2+0x3d> .byte 243,15,126,76,119,16 // movq 0x10(%edi,%esi,2),%xmm1 - .byte 233,212,254,255,255 // jmp 5651 <_sk_load_u16_be_sse2+0x3d> + .byte 233,212,254,255,255 // jmp 57d0 <_sk_load_u16_be_sse2+0x3d> HIDDEN _sk_load_rgb_u16_be_sse2 .globl _sk_load_rgb_u16_be_sse2 @@ -68680,9 +69354,9 @@ _sk_load_rgb_u16_be_sse2: .byte 3,50 // add (%edx),%esi .byte 107,25,3 // imul $0x3,(%ecx),%ebx .byte 133,255 // test %edi,%edi - .byte 232,0,0,0,0 // call 57a6 <_sk_load_rgb_u16_be_sse2+0x29> + .byte 232,0,0,0,0 // call 5925 <_sk_load_rgb_u16_be_sse2+0x29> .byte 90 // pop %edx - .byte 15,133,240,0,0,0 // jne 589d <_sk_load_rgb_u16_be_sse2+0x120> + .byte 15,133,240,0,0,0 // jne 5a1c <_sk_load_rgb_u16_be_sse2+0x120> .byte 243,15,111,20,94 // movdqu (%esi,%ebx,2),%xmm2 .byte 243,15,111,92,94,8 // movdqu 0x8(%esi,%ebx,2),%xmm3 .byte 102,15,115,219,4 // psrldq $0x4,%xmm3 @@ -68707,7 +69381,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,97,195 // punpcklwd %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,170,170,74,0,0 // movaps 0x4aaa(%edx),%xmm5 + .byte 15,40,170,27,75,0,0 // movaps 0x4b1b(%edx),%xmm5 .byte 15,89,197 // mulps %xmm5,%xmm0 .byte 102,15,111,204 // movdqa %xmm4,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -68733,7 +69407,7 @@ _sk_load_rgb_u16_be_sse2: .byte 15,89,213 // mulps %xmm5,%xmm2 .byte 141,112,8 // lea 0x8(%eax),%esi .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,154,186,74,0,0 // movaps 0x4aba(%edx),%xmm3 + .byte 15,40,154,43,75,0,0 // movaps 0x4b2b(%edx),%xmm3 .byte 86 // push %esi .byte 81 // push %ecx .byte 255,80,4 // call *0x4(%eax) @@ -68747,20 +69421,20 @@ _sk_load_rgb_u16_be_sse2: .byte 102,15,196,84,94,4,2 // pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,255,1 // cmp $0x1,%edi - .byte 117,13 // jne 58bf <_sk_load_rgb_u16_be_sse2+0x142> + .byte 117,13 // jne 5a3e <_sk_load_rgb_u16_be_sse2+0x142> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,16,255,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52> + .byte 233,16,255,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52> .byte 102,15,110,68,94,6 // movd 0x6(%esi,%ebx,2),%xmm0 .byte 102,15,196,68,94,10,2 // pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,255,3 // cmp $0x3,%edi - .byte 114,18 // jb 58e7 <_sk_load_rgb_u16_be_sse2+0x16a> + .byte 114,18 // jb 5a66 <_sk_load_rgb_u16_be_sse2+0x16a> .byte 102,15,110,92,94,12 // movd 0xc(%esi,%ebx,2),%xmm3 .byte 102,15,196,92,94,16,2 // pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3 - .byte 233,232,254,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52> + .byte 233,232,254,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52> .byte 102,15,239,219 // pxor %xmm3,%xmm3 - .byte 233,223,254,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52> + .byte 233,223,254,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52> HIDDEN _sk_store_u16_be_sse2 .globl _sk_store_u16_be_sse2 @@ -68772,9 +69446,9 @@ _sk_store_u16_be_sse2: .byte 86 // push %esi .byte 131,236,16 // sub $0x10,%esp .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) - .byte 232,0,0,0,0 // call 5901 <_sk_store_u16_be_sse2+0x11> + .byte 232,0,0,0,0 // call 5a80 <_sk_store_u16_be_sse2+0x11> .byte 88 // pop %eax - .byte 15,40,176,111,73,0,0 // movaps 0x496f(%eax),%xmm6 + .byte 15,40,176,224,73,0,0 // movaps 0x49e0(%eax),%xmm6 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,89,230 // mulps %xmm6,%xmm4 .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4 @@ -68827,7 +69501,7 @@ _sk_store_u16_be_sse2: .byte 139,121,8 // mov 0x8(%ecx),%edi .byte 193,226,2 // shl $0x2,%edx .byte 133,255 // test %edi,%edi - .byte 117,45 // jne 5a03 <_sk_store_u16_be_sse2+0x113> + .byte 117,45 // jne 5b82 <_sk_store_u16_be_sse2+0x113> .byte 102,15,111,220 // movdqa %xmm4,%xmm3 .byte 102,15,98,221 // punpckldq %xmm5,%xmm3 .byte 243,15,127,28,86 // movdqu %xmm3,(%esi,%edx,2) @@ -68848,13 +69522,13 @@ _sk_store_u16_be_sse2: .byte 102,15,98,245 // punpckldq %xmm5,%xmm6 .byte 102,15,214,52,86 // movq %xmm6,(%esi,%edx,2) .byte 131,255,1 // cmp $0x1,%edi - .byte 116,216 // je 59ed <_sk_store_u16_be_sse2+0xfd> + .byte 116,216 // je 5b6c <_sk_store_u16_be_sse2+0xfd> .byte 102,15,23,116,86,8 // movhpd %xmm6,0x8(%esi,%edx,2) .byte 131,255,3 // cmp $0x3,%edi - .byte 114,205 // jb 59ed <_sk_store_u16_be_sse2+0xfd> + .byte 114,205 // jb 5b6c <_sk_store_u16_be_sse2+0xfd> .byte 102,15,106,229 // punpckhdq %xmm5,%xmm4 .byte 102,15,214,100,86,16 // movq %xmm4,0x10(%esi,%edx,2) - .byte 235,193 // jmp 59ed <_sk_store_u16_be_sse2+0xfd> + .byte 235,193 // jmp 5b6c <_sk_store_u16_be_sse2+0xfd> HIDDEN _sk_load_f32_sse2 .globl _sk_load_f32_sse2 @@ -68877,7 +69551,7 @@ _sk_load_f32_sse2: .byte 15,16,36,23 // movups (%edi,%edx,1),%xmm4 .byte 139,121,8 // mov 0x8(%ecx),%edi .byte 133,255 // test %edi,%edi - .byte 117,71 // jne 5aa3 <_sk_load_f32_sse2+0x77> + .byte 117,71 // jne 5c22 <_sk_load_f32_sse2+0x77> .byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2 .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3 .byte 15,16,68,178,48 // movups 0x30(%edx,%esi,4),%xmm0 @@ -68905,17 +69579,17 @@ _sk_load_f32_sse2: .byte 195 // ret .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 131,255,1 // cmp $0x1,%edi - .byte 117,8 // jne 5ab3 <_sk_load_f32_sse2+0x87> + .byte 117,8 // jne 5c32 <_sk_load_f32_sse2+0x87> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 235,184 // jmp 5a6b <_sk_load_f32_sse2+0x3f> + .byte 235,184 // jmp 5bea <_sk_load_f32_sse2+0x3f> .byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2 .byte 131,255,3 // cmp $0x3,%edi - .byte 114,7 // jb 5ac4 <_sk_load_f32_sse2+0x98> + .byte 114,7 // jb 5c43 <_sk_load_f32_sse2+0x98> .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3 - .byte 235,167 // jmp 5a6b <_sk_load_f32_sse2+0x3f> + .byte 235,167 // jmp 5bea <_sk_load_f32_sse2+0x3f> .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 235,162 // jmp 5a6b <_sk_load_f32_sse2+0x3f> + .byte 235,162 // jmp 5bea <_sk_load_f32_sse2+0x3f> HIDDEN _sk_load_f32_dst_sse2 .globl _sk_load_f32_dst_sse2 @@ -68941,7 +69615,7 @@ _sk_load_f32_dst_sse2: .byte 15,16,52,23 // movups (%edi,%edx,1),%xmm6 .byte 139,121,8 // mov 0x8(%ecx),%edi .byte 133,255 // test %edi,%edi - .byte 117,97 // jne 5b65 <_sk_load_f32_dst_sse2+0x9c> + .byte 117,97 // jne 5ce4 <_sk_load_f32_dst_sse2+0x9c> .byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7 .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3 .byte 15,16,84,178,48 // movups 0x30(%edx,%esi,4),%xmm2 @@ -68975,17 +69649,17 @@ _sk_load_f32_dst_sse2: .byte 195 // ret .byte 15,87,210 // xorps %xmm2,%xmm2 .byte 131,255,1 // cmp $0x1,%edi - .byte 117,8 // jne 5b75 <_sk_load_f32_dst_sse2+0xac> + .byte 117,8 // jne 5cf4 <_sk_load_f32_dst_sse2+0xac> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 235,158 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a> + .byte 235,158 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a> .byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7 .byte 131,255,3 // cmp $0x3,%edi - .byte 114,7 // jb 5b86 <_sk_load_f32_dst_sse2+0xbd> + .byte 114,7 // jb 5d05 <_sk_load_f32_dst_sse2+0xbd> .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3 - .byte 235,141 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a> + .byte 235,141 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a> .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 235,136 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a> + .byte 235,136 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a> HIDDEN _sk_store_f32_sse2 .globl _sk_store_f32_sse2 @@ -69023,7 +69697,7 @@ _sk_store_f32_sse2: .byte 15,40,238 // movaps %xmm6,%xmm5 .byte 102,15,20,239 // unpcklpd %xmm7,%xmm5 .byte 133,255 // test %edi,%edi - .byte 117,40 // jne 5c11 <_sk_store_f32_sse2+0x86> + .byte 117,40 // jne 5d90 <_sk_store_f32_sse2+0x86> .byte 102,15,21,247 // unpckhpd %xmm7,%xmm6 .byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4) .byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4) @@ -69040,12 +69714,12 @@ _sk_store_f32_sse2: .byte 93 // pop %ebp .byte 195 // ret .byte 131,255,1 // cmp $0x1,%edi - .byte 116,232 // je 5bfe <_sk_store_f32_sse2+0x73> + .byte 116,232 // je 5d7d <_sk_store_f32_sse2+0x73> .byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4) .byte 131,255,3 // cmp $0x3,%edi - .byte 114,222 // jb 5bfe <_sk_store_f32_sse2+0x73> + .byte 114,222 // jb 5d7d <_sk_store_f32_sse2+0x73> .byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4) - .byte 235,214 // jmp 5bfe <_sk_store_f32_sse2+0x73> + .byte 235,214 // jmp 5d7d <_sk_store_f32_sse2+0x73> HIDDEN _sk_clamp_x_sse2 .globl _sk_clamp_x_sse2 @@ -69106,7 +69780,7 @@ _sk_repeat_x_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 5ca5 <_sk_repeat_x_sse2+0xb> + .byte 232,0,0,0,0 // call 5e24 <_sk_repeat_x_sse2+0xb> .byte 89 // pop %ecx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,16 // mov (%eax),%edx @@ -69117,7 +69791,7 @@ _sk_repeat_x_sse2: .byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4 .byte 15,91,252 // cvtdq2ps %xmm4,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,177,219,69,0,0 // andps 0x45db(%ecx),%xmm6 + .byte 15,84,177,76,70,0,0 // andps 0x464c(%ecx),%xmm6 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -69144,7 +69818,7 @@ _sk_repeat_y_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 5d0b <_sk_repeat_y_sse2+0xb> + .byte 232,0,0,0,0 // call 5e8a <_sk_repeat_y_sse2+0xb> .byte 89 // pop %ecx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,16 // mov (%eax),%edx @@ -69155,7 +69829,7 @@ _sk_repeat_y_sse2: .byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4 .byte 15,91,252 // cvtdq2ps %xmm4,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,177,133,69,0,0 // andps 0x4585(%ecx),%xmm6 + .byte 15,84,177,246,69,0,0 // andps 0x45f6(%ecx),%xmm6 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -69182,7 +69856,7 @@ _sk_mirror_x_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 5d71 <_sk_mirror_x_sse2+0xb> + .byte 232,0,0,0,0 // call 5ef0 <_sk_mirror_x_sse2+0xb> .byte 89 // pop %ecx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,16 // mov (%eax),%edx @@ -69191,13 +69865,13 @@ _sk_mirror_x_sse2: .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 243,15,89,177,175,74,0,0 // mulss 0x4aaf(%ecx),%xmm6 + .byte 243,15,89,177,32,75,0,0 // mulss 0x4b20(%ecx),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,177,47,69,0,0 // andps 0x452f(%ecx),%xmm6 + .byte 15,84,177,160,69,0,0 // andps 0x45a0(%ecx),%xmm6 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 243,15,88,237 // addss %xmm5,%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -69228,7 +69902,7 @@ _sk_mirror_y_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 5df6 <_sk_mirror_y_sse2+0xb> + .byte 232,0,0,0,0 // call 5f75 <_sk_mirror_y_sse2+0xb> .byte 89 // pop %ecx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,16 // mov (%eax),%edx @@ -69237,13 +69911,13 @@ _sk_mirror_y_sse2: .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,92,204 // subps %xmm4,%xmm1 - .byte 243,15,89,177,46,74,0,0 // mulss 0x4a2e(%ecx),%xmm6 + .byte 243,15,89,177,159,74,0,0 // mulss 0x4a9f(%ecx),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 .byte 15,89,241 // mulps %xmm1,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,177,186,68,0,0 // andps 0x44ba(%ecx),%xmm6 + .byte 15,84,177,43,69,0,0 // andps 0x452b(%ecx),%xmm6 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 243,15,88,237 // addss %xmm5,%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 @@ -69274,12 +69948,12 @@ _sk_clamp_x_1_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 5e7b <_sk_clamp_x_1_sse2+0xb> + .byte 232,0,0,0,0 // call 5ffa <_sk_clamp_x_1_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,95,224 // maxps %xmm0,%xmm4 - .byte 15,93,160,69,68,0,0 // minps 0x4445(%eax),%xmm4 + .byte 15,93,160,182,68,0,0 // minps 0x44b6(%eax),%xmm4 .byte 141,65,4 // lea 0x4(%ecx),%eax .byte 131,236,8 // sub $0x8,%esp .byte 15,40,196 // movaps %xmm4,%xmm0 @@ -69297,14 +69971,14 @@ _sk_repeat_x_1_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 5eab <_sk_repeat_x_1_sse2+0xb> + .byte 232,0,0,0,0 // call 602a <_sk_repeat_x_1_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 243,15,91,224 // cvttps2dq %xmm0,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,194,236,1 // cmpltps %xmm4,%xmm5 - .byte 15,84,168,37,68,0,0 // andps 0x4425(%eax),%xmm5 + .byte 15,84,168,150,68,0,0 // andps 0x4496(%eax),%xmm5 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 .byte 141,65,4 // lea 0x4(%ecx),%eax @@ -69323,17 +69997,17 @@ _sk_mirror_x_1_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 5ee6 <_sk_mirror_x_1_sse2+0xb> + .byte 232,0,0,0,0 // call 6065 <_sk_mirror_x_1_sse2+0xb> .byte 89 // pop %ecx .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 15,40,161,250,67,0,0 // movaps 0x43fa(%ecx),%xmm4 + .byte 15,40,161,107,68,0,0 // movaps 0x446b(%ecx),%xmm4 .byte 15,88,196 // addps %xmm4,%xmm0 - .byte 15,40,169,10,68,0,0 // movaps 0x440a(%ecx),%xmm5 + .byte 15,40,169,123,68,0,0 // movaps 0x447b(%ecx),%xmm5 .byte 15,89,232 // mulps %xmm0,%xmm5 .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,194,238,1 // cmpltps %xmm6,%xmm5 - .byte 15,84,169,26,68,0,0 // andps 0x441a(%ecx),%xmm5 + .byte 15,84,169,139,68,0,0 // andps 0x448b(%ecx),%xmm5 .byte 15,87,255 // xorps %xmm7,%xmm7 .byte 15,92,245 // subps %xmm5,%xmm6 .byte 15,88,246 // addps %xmm6,%xmm6 @@ -69358,13 +70032,13 @@ _sk_luminance_to_alpha_sse2: .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 232,0,0,0,0 // call 5f44 <_sk_luminance_to_alpha_sse2+0xe> + .byte 232,0,0,0,0 // call 60c3 <_sk_luminance_to_alpha_sse2+0xe> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx - .byte 15,89,128,204,67,0,0 // mulps 0x43cc(%eax),%xmm0 - .byte 15,89,136,220,67,0,0 // mulps 0x43dc(%eax),%xmm1 + .byte 15,89,128,61,68,0,0 // mulps 0x443d(%eax),%xmm0 + .byte 15,89,136,77,68,0,0 // mulps 0x444d(%eax),%xmm1 .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,152,236,67,0,0 // mulps 0x43ec(%eax),%xmm3 + .byte 15,89,152,93,68,0,0 // mulps 0x445d(%eax),%xmm3 .byte 15,88,217 // addps %xmm1,%xmm3 .byte 141,65,4 // lea 0x4(%ecx),%eax .byte 131,236,8 // sub $0x8,%esp @@ -69754,7 +70428,7 @@ _sk_evenly_spaced_gradient_sse2: .byte 86 // push %esi .byte 131,236,60 // sub $0x3c,%esp .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp) - .byte 232,0,0,0,0 // call 63e1 <_sk_evenly_spaced_gradient_sse2+0x12> + .byte 232,0,0,0,0 // call 6560 <_sk_evenly_spaced_gradient_sse2+0x12> .byte 90 // pop %edx .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 141,65,4 // lea 0x4(%ecx),%eax @@ -69765,12 +70439,12 @@ _sk_evenly_spaced_gradient_sse2: .byte 78 // dec %esi .byte 102,15,110,206 // movd %esi,%xmm1 .byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1 - .byte 102,15,111,146,95,63,0,0 // movdqa 0x3f5f(%edx),%xmm2 + .byte 102,15,111,146,208,63,0,0 // movdqa 0x3fd0(%edx),%xmm2 .byte 102,15,219,209 // pand %xmm1,%xmm2 - .byte 102,15,235,146,111,63,0,0 // por 0x3f6f(%edx),%xmm2 + .byte 102,15,235,146,224,63,0,0 // por 0x3fe0(%edx),%xmm2 .byte 102,15,114,209,16 // psrld $0x10,%xmm1 - .byte 102,15,235,138,127,63,0,0 // por 0x3f7f(%edx),%xmm1 - .byte 15,88,138,143,63,0,0 // addps 0x3f8f(%edx),%xmm1 + .byte 102,15,235,138,240,63,0,0 // por 0x3ff0(%edx),%xmm1 + .byte 15,88,138,0,64,0,0 // addps 0x4000(%edx),%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1 @@ -69877,18 +70551,18 @@ _sk_gauss_a_to_rgba_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 6597 <_sk_gauss_a_to_rgba_sse2+0xb> + .byte 232,0,0,0,0 // call 6716 <_sk_gauss_a_to_rgba_sse2+0xb> .byte 88 // pop %eax .byte 139,77,12 // mov 0xc(%ebp),%ecx - .byte 15,40,128,233,61,0,0 // movaps 0x3de9(%eax),%xmm0 + .byte 15,40,128,90,62,0,0 // movaps 0x3e5a(%eax),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,128,249,61,0,0 // addps 0x3df9(%eax),%xmm0 + .byte 15,88,128,106,62,0,0 // addps 0x3e6a(%eax),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,128,9,62,0,0 // addps 0x3e09(%eax),%xmm0 + .byte 15,88,128,122,62,0,0 // addps 0x3e7a(%eax),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,128,25,62,0,0 // addps 0x3e19(%eax),%xmm0 + .byte 15,88,128,138,62,0,0 // addps 0x3e8a(%eax),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,128,41,62,0,0 // addps 0x3e29(%eax),%xmm0 + .byte 15,88,128,154,62,0,0 // addps 0x3e9a(%eax),%xmm0 .byte 141,65,4 // lea 0x4(%ecx),%eax .byte 131,236,8 // sub $0x8,%esp .byte 15,40,200 // movaps %xmm0,%xmm1 @@ -69911,7 +70585,7 @@ _sk_gradient_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,60 // sub $0x3c,%esp - .byte 232,0,0,0,0 // call 65f2 <_sk_gradient_sse2+0xe> + .byte 232,0,0,0,0 // call 6771 <_sk_gradient_sse2+0xe> .byte 95 // pop %edi .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 141,81,4 // lea 0x4(%ecx),%edx @@ -69920,12 +70594,12 @@ _sk_gradient_sse2: .byte 139,17 // mov (%ecx),%edx .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,250,2 // cmp $0x2,%edx - .byte 114,43 // jb 6634 <_sk_gradient_sse2+0x50> + .byte 114,43 // jb 67b3 <_sk_gradient_sse2+0x50> .byte 139,113,36 // mov 0x24(%ecx),%esi .byte 74 // dec %edx .byte 131,198,4 // add $0x4,%esi .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,151,222,61,0,0 // movaps 0x3dde(%edi),%xmm2 + .byte 15,40,151,79,62,0,0 // movaps 0x3e4f(%edi),%xmm2 .byte 243,15,16,30 // movss (%esi),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -69933,7 +70607,7 @@ _sk_gradient_sse2: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 131,198,4 // add $0x4,%esi .byte 74 // dec %edx - .byte 117,231 // jne 661b <_sk_gradient_sse2+0x37> + .byte 117,231 // jne 679a <_sk_gradient_sse2+0x37> .byte 102,15,126,202 // movd %xmm1,%edx .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2 .byte 102,15,126,214 // movd %xmm2,%esi @@ -70085,7 +70759,7 @@ _sk_xy_to_unit_angle_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call 682e <_sk_xy_to_unit_angle_sse2+0x18> + .byte 232,0,0,0,0 // call 69ad <_sk_xy_to_unit_angle_sse2+0x18> .byte 88 // pop %eax .byte 15,87,237 // xorps %xmm5,%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 @@ -70100,30 +70774,30 @@ _sk_xy_to_unit_angle_sse2: .byte 15,94,247 // divps %xmm7,%xmm6 .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,255 // mulps %xmm7,%xmm7 - .byte 15,40,128,178,59,0,0 // movaps 0x3bb2(%eax),%xmm0 + .byte 15,40,128,35,60,0,0 // movaps 0x3c23(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 15,88,128,194,59,0,0 // addps 0x3bc2(%eax),%xmm0 + .byte 15,88,128,51,60,0,0 // addps 0x3c33(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 15,88,128,210,59,0,0 // addps 0x3bd2(%eax),%xmm0 + .byte 15,88,128,67,60,0,0 // addps 0x3c43(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 15,88,128,226,59,0,0 // addps 0x3be2(%eax),%xmm0 + .byte 15,88,128,83,60,0,0 // addps 0x3c53(%eax),%xmm0 .byte 15,89,198 // mulps %xmm6,%xmm0 .byte 15,194,236,1 // cmpltps %xmm4,%xmm5 - .byte 15,40,176,242,59,0,0 // movaps 0x3bf2(%eax),%xmm6 + .byte 15,40,176,99,60,0,0 // movaps 0x3c63(%eax),%xmm6 .byte 15,92,240 // subps %xmm0,%xmm6 .byte 15,84,245 // andps %xmm5,%xmm6 .byte 15,85,232 // andnps %xmm0,%xmm5 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,86,238 // orps %xmm6,%xmm5 .byte 15,194,204,1 // cmpltps %xmm4,%xmm1 - .byte 15,40,128,2,60,0,0 // movaps 0x3c02(%eax),%xmm0 + .byte 15,40,128,115,60,0,0 // movaps 0x3c73(%eax),%xmm0 .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,84,193 // andps %xmm1,%xmm0 .byte 15,85,205 // andnps %xmm5,%xmm1 .byte 15,86,200 // orps %xmm0,%xmm1 .byte 15,40,194 // movaps %xmm2,%xmm0 .byte 15,194,196,1 // cmpltps %xmm4,%xmm0 - .byte 15,40,168,18,60,0,0 // movaps 0x3c12(%eax),%xmm5 + .byte 15,40,168,131,60,0,0 // movaps 0x3c83(%eax),%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 .byte 15,84,232 // andps %xmm0,%xmm5 .byte 15,85,193 // andnps %xmm1,%xmm0 @@ -70184,15 +70858,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2: .byte 15,40,241 // movaps %xmm1,%xmm6 .byte 15,89,246 // mulps %xmm6,%xmm6 .byte 15,88,240 // addps %xmm0,%xmm6 - .byte 232,0,0,0,0 // call 694b <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31> + .byte 232,0,0,0,0 // call 6aca <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31> .byte 90 // pop %edx .byte 243,15,89,237 // mulss %xmm5,%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,92,245 // subps %xmm5,%xmm6 .byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0 .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0 - .byte 15,89,162,5,59,0,0 // mulps 0x3b05(%edx),%xmm4 - .byte 15,89,130,21,59,0,0 // mulps 0x3b15(%edx),%xmm0 + .byte 15,89,162,118,59,0,0 // mulps 0x3b76(%edx),%xmm4 + .byte 15,89,130,134,59,0,0 // mulps 0x3b86(%edx),%xmm0 .byte 15,89,198 // mulps %xmm6,%xmm0 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,237 // mulps %xmm5,%xmm5 @@ -70200,11 +70874,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2: .byte 15,81,237 // sqrtps %xmm5,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 15,87,162,37,59,0,0 // xorps 0x3b25(%edx),%xmm4 + .byte 15,87,162,150,59,0,0 // xorps 0x3b96(%edx),%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 - .byte 15,89,170,53,59,0,0 // mulps 0x3b35(%edx),%xmm5 + .byte 15,89,170,166,59,0,0 // mulps 0x3ba6(%edx),%xmm5 .byte 15,89,197 // mulps %xmm5,%xmm0 .byte 15,89,229 // mulps %xmm5,%xmm4 .byte 15,95,196 // maxps %xmm4,%xmm0 @@ -70235,15 +70909,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2: .byte 15,40,241 // movaps %xmm1,%xmm6 .byte 15,89,246 // mulps %xmm6,%xmm6 .byte 15,88,240 // addps %xmm0,%xmm6 - .byte 232,0,0,0,0 // call 69e9 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31> + .byte 232,0,0,0,0 // call 6b68 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31> .byte 90 // pop %edx .byte 243,15,89,237 // mulss %xmm5,%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,92,245 // subps %xmm5,%xmm6 .byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0 .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0 - .byte 15,89,162,167,58,0,0 // mulps 0x3aa7(%edx),%xmm4 - .byte 15,89,130,183,58,0,0 // mulps 0x3ab7(%edx),%xmm0 + .byte 15,89,162,24,59,0,0 // mulps 0x3b18(%edx),%xmm4 + .byte 15,89,130,40,59,0,0 // mulps 0x3b28(%edx),%xmm0 .byte 15,89,198 // mulps %xmm6,%xmm0 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,237 // mulps %xmm5,%xmm5 @@ -70251,11 +70925,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2: .byte 15,81,237 // sqrtps %xmm5,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 15,87,162,199,58,0,0 // xorps 0x3ac7(%edx),%xmm4 + .byte 15,87,162,56,59,0,0 // xorps 0x3b38(%edx),%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 - .byte 15,89,170,215,58,0,0 // mulps 0x3ad7(%edx),%xmm5 + .byte 15,89,170,72,59,0,0 // mulps 0x3b48(%edx),%xmm5 .byte 15,89,197 // mulps %xmm5,%xmm0 .byte 15,89,229 // mulps %xmm5,%xmm4 .byte 15,93,196 // minps %xmm4,%xmm0 @@ -70275,7 +70949,7 @@ _sk_xy_to_2pt_conical_linear_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 131,236,8 // sub $0x8,%esp - .byte 232,0,0,0,0 // call 6a61 <_sk_xy_to_2pt_conical_linear_sse2+0xb> + .byte 232,0,0,0,0 // call 6be0 <_sk_xy_to_2pt_conical_linear_sse2+0xb> .byte 89 // pop %ecx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,16 // mov (%eax),%edx @@ -70284,7 +70958,7 @@ _sk_xy_to_2pt_conical_linear_sse2: .byte 243,15,89,236 // mulss %xmm4,%xmm5 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 15,89,169,111,58,0,0 // mulps 0x3a6f(%ecx),%xmm5 + .byte 15,89,169,224,58,0,0 // mulps 0x3ae0(%ecx),%xmm5 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 15,40,241 // movaps %xmm1,%xmm6 .byte 15,89,246 // mulps %xmm6,%xmm6 @@ -70292,7 +70966,7 @@ _sk_xy_to_2pt_conical_linear_sse2: .byte 243,15,89,228 // mulss %xmm4,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 15,87,129,127,58,0,0 // xorps 0x3a7f(%ecx),%xmm0 + .byte 15,87,129,240,58,0,0 // xorps 0x3af0(%ecx),%xmm0 .byte 15,94,197 // divps %xmm5,%xmm0 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 131,236,8 // sub $0x8,%esp @@ -70366,16 +71040,16 @@ _sk_save_xy_sse2: .byte 131,236,24 // sub $0x18,%esp .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp) .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 232,0,0,0,0 // call 6b3e <_sk_save_xy_sse2+0x12> + .byte 232,0,0,0,0 // call 6cbd <_sk_save_xy_sse2+0x12> .byte 88 // pop %eax - .byte 15,40,160,178,57,0,0 // movaps 0x39b2(%eax),%xmm4 + .byte 15,40,160,35,58,0,0 // movaps 0x3a23(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,88,236 // addps %xmm4,%xmm5 .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,40,253 // movaps %xmm5,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,144,194,57,0,0 // movaps 0x39c2(%eax),%xmm2 + .byte 15,40,144,51,58,0,0 // movaps 0x3a33(%eax),%xmm2 .byte 15,84,250 // andps %xmm2,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,92,238 // subps %xmm6,%xmm5 @@ -70450,15 +71124,15 @@ _sk_bilinear_nx_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6c20 <_sk_bilinear_nx_sse2+0xa> + .byte 232,0,0,0,0 // call 6d9f <_sk_bilinear_nx_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,6 // movups (%esi),%xmm0 .byte 15,16,102,64 // movups 0x40(%esi),%xmm4 - .byte 15,88,128,240,56,0,0 // addps 0x38f0(%eax),%xmm0 - .byte 15,40,168,0,57,0,0 // movaps 0x3900(%eax),%xmm5 + .byte 15,88,128,97,57,0,0 // addps 0x3961(%eax),%xmm0 + .byte 15,40,168,113,57,0,0 // movaps 0x3971(%eax),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax @@ -70479,14 +71153,14 @@ _sk_bilinear_px_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6c63 <_sk_bilinear_px_sse2+0xa> + .byte 232,0,0,0,0 // call 6de2 <_sk_bilinear_px_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,6 // movups (%esi),%xmm0 .byte 15,16,102,64 // movups 0x40(%esi),%xmm4 - .byte 15,88,128,205,56,0,0 // addps 0x38cd(%eax),%xmm0 + .byte 15,88,128,62,57,0,0 // addps 0x393e(%eax),%xmm0 .byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax .byte 131,236,8 // sub $0x8,%esp @@ -70506,15 +71180,15 @@ _sk_bilinear_ny_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6c9c <_sk_bilinear_ny_sse2+0xa> + .byte 232,0,0,0,0 // call 6e1b <_sk_bilinear_ny_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,78,32 // movups 0x20(%esi),%xmm1 .byte 15,16,102,96 // movups 0x60(%esi),%xmm4 - .byte 15,88,136,164,56,0,0 // addps 0x38a4(%eax),%xmm1 - .byte 15,40,168,180,56,0,0 // movaps 0x38b4(%eax),%xmm5 + .byte 15,88,136,21,57,0,0 // addps 0x3915(%eax),%xmm1 + .byte 15,40,168,37,57,0,0 // movaps 0x3925(%eax),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax @@ -70535,14 +71209,14 @@ _sk_bilinear_py_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6ce0 <_sk_bilinear_py_sse2+0xa> + .byte 232,0,0,0,0 // call 6e5f <_sk_bilinear_py_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,78,32 // movups 0x20(%esi),%xmm1 .byte 15,16,102,96 // movups 0x60(%esi),%xmm4 - .byte 15,88,136,128,56,0,0 // addps 0x3880(%eax),%xmm1 + .byte 15,88,136,241,56,0,0 // addps 0x38f1(%eax),%xmm1 .byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax .byte 131,236,8 // sub $0x8,%esp @@ -70562,20 +71236,20 @@ _sk_bicubic_n3x_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6d1a <_sk_bicubic_n3x_sse2+0xa> + .byte 232,0,0,0,0 // call 6e99 <_sk_bicubic_n3x_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,6 // movups (%esi),%xmm0 .byte 15,16,102,64 // movups 0x40(%esi),%xmm4 - .byte 15,88,128,86,56,0,0 // addps 0x3856(%eax),%xmm0 - .byte 15,40,168,102,56,0,0 // movaps 0x3866(%eax),%xmm5 + .byte 15,88,128,199,56,0,0 // addps 0x38c7(%eax),%xmm0 + .byte 15,40,168,215,56,0,0 // movaps 0x38d7(%eax),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,89,228 // mulps %xmm4,%xmm4 - .byte 15,89,168,118,56,0,0 // mulps 0x3876(%eax),%xmm5 - .byte 15,88,168,134,56,0,0 // addps 0x3886(%eax),%xmm5 + .byte 15,89,168,231,56,0,0 // mulps 0x38e7(%eax),%xmm5 + .byte 15,88,168,247,56,0,0 // addps 0x38f7(%eax),%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax @@ -70596,23 +71270,23 @@ _sk_bicubic_n1x_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6d74 <_sk_bicubic_n1x_sse2+0xa> + .byte 232,0,0,0,0 // call 6ef3 <_sk_bicubic_n1x_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,6 // movups (%esi),%xmm0 .byte 15,16,102,64 // movups 0x40(%esi),%xmm4 - .byte 15,88,128,60,56,0,0 // addps 0x383c(%eax),%xmm0 - .byte 15,40,168,76,56,0,0 // movaps 0x384c(%eax),%xmm5 + .byte 15,88,128,173,56,0,0 // addps 0x38ad(%eax),%xmm0 + .byte 15,40,168,189,56,0,0 // movaps 0x38bd(%eax),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,160,92,56,0,0 // movaps 0x385c(%eax),%xmm4 + .byte 15,40,160,205,56,0,0 // movaps 0x38cd(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,160,108,56,0,0 // addps 0x386c(%eax),%xmm4 + .byte 15,88,160,221,56,0,0 // addps 0x38dd(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,160,124,56,0,0 // addps 0x387c(%eax),%xmm4 + .byte 15,88,160,237,56,0,0 // addps 0x38ed(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,160,140,56,0,0 // addps 0x388c(%eax),%xmm4 + .byte 15,88,160,253,56,0,0 // addps 0x38fd(%eax),%xmm4 .byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax .byte 131,236,8 // sub $0x8,%esp @@ -70632,22 +71306,22 @@ _sk_bicubic_p1x_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6ddc <_sk_bicubic_p1x_sse2+0xa> + .byte 232,0,0,0,0 // call 6f5b <_sk_bicubic_p1x_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi - .byte 15,40,160,52,56,0,0 // movaps 0x3834(%eax),%xmm4 + .byte 15,40,160,165,56,0,0 // movaps 0x38a5(%eax),%xmm4 .byte 15,16,6 // movups (%esi),%xmm0 .byte 15,16,110,64 // movups 0x40(%esi),%xmm5 .byte 15,88,196 // addps %xmm4,%xmm0 - .byte 15,40,176,68,56,0,0 // movaps 0x3844(%eax),%xmm6 + .byte 15,40,176,181,56,0,0 // movaps 0x38b5(%eax),%xmm6 .byte 15,89,245 // mulps %xmm5,%xmm6 - .byte 15,88,176,84,56,0,0 // addps 0x3854(%eax),%xmm6 + .byte 15,88,176,197,56,0,0 // addps 0x38c5(%eax),%xmm6 .byte 15,89,245 // mulps %xmm5,%xmm6 .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,89,245 // mulps %xmm5,%xmm6 - .byte 15,88,176,100,56,0,0 // addps 0x3864(%eax),%xmm6 + .byte 15,88,176,213,56,0,0 // addps 0x38d5(%eax),%xmm6 .byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax .byte 131,236,8 // sub $0x8,%esp @@ -70667,18 +71341,18 @@ _sk_bicubic_p3x_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6e39 <_sk_bicubic_p3x_sse2+0xa> + .byte 232,0,0,0,0 // call 6fb8 <_sk_bicubic_p3x_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,6 // movups (%esi),%xmm0 .byte 15,16,102,64 // movups 0x40(%esi),%xmm4 - .byte 15,88,128,23,56,0,0 // addps 0x3817(%eax),%xmm0 + .byte 15,88,128,136,56,0,0 // addps 0x3888(%eax),%xmm0 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,237 // mulps %xmm5,%xmm5 - .byte 15,89,160,39,56,0,0 // mulps 0x3827(%eax),%xmm4 - .byte 15,88,160,55,56,0,0 // addps 0x3837(%eax),%xmm4 + .byte 15,89,160,152,56,0,0 // mulps 0x3898(%eax),%xmm4 + .byte 15,88,160,168,56,0,0 // addps 0x38a8(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 .byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax @@ -70699,20 +71373,20 @@ _sk_bicubic_n3y_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6e89 <_sk_bicubic_n3y_sse2+0xa> + .byte 232,0,0,0,0 // call 7008 <_sk_bicubic_n3y_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,78,32 // movups 0x20(%esi),%xmm1 .byte 15,16,102,96 // movups 0x60(%esi),%xmm4 - .byte 15,88,136,247,55,0,0 // addps 0x37f7(%eax),%xmm1 - .byte 15,40,168,7,56,0,0 // movaps 0x3807(%eax),%xmm5 + .byte 15,88,136,104,56,0,0 // addps 0x3868(%eax),%xmm1 + .byte 15,40,168,120,56,0,0 // movaps 0x3878(%eax),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,89,228 // mulps %xmm4,%xmm4 - .byte 15,89,168,23,56,0,0 // mulps 0x3817(%eax),%xmm5 - .byte 15,88,168,39,56,0,0 // addps 0x3827(%eax),%xmm5 + .byte 15,89,168,136,56,0,0 // mulps 0x3888(%eax),%xmm5 + .byte 15,88,168,152,56,0,0 // addps 0x3898(%eax),%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax @@ -70733,23 +71407,23 @@ _sk_bicubic_n1y_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6ee4 <_sk_bicubic_n1y_sse2+0xa> + .byte 232,0,0,0,0 // call 7063 <_sk_bicubic_n1y_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,78,32 // movups 0x20(%esi),%xmm1 .byte 15,16,102,96 // movups 0x60(%esi),%xmm4 - .byte 15,88,136,220,55,0,0 // addps 0x37dc(%eax),%xmm1 - .byte 15,40,168,236,55,0,0 // movaps 0x37ec(%eax),%xmm5 + .byte 15,88,136,77,56,0,0 // addps 0x384d(%eax),%xmm1 + .byte 15,40,168,93,56,0,0 // movaps 0x385d(%eax),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,160,252,55,0,0 // movaps 0x37fc(%eax),%xmm4 + .byte 15,40,160,109,56,0,0 // movaps 0x386d(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,160,12,56,0,0 // addps 0x380c(%eax),%xmm4 + .byte 15,88,160,125,56,0,0 // addps 0x387d(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,160,28,56,0,0 // addps 0x381c(%eax),%xmm4 + .byte 15,88,160,141,56,0,0 // addps 0x388d(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,160,44,56,0,0 // addps 0x382c(%eax),%xmm4 + .byte 15,88,160,157,56,0,0 // addps 0x389d(%eax),%xmm4 .byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax .byte 131,236,8 // sub $0x8,%esp @@ -70769,22 +71443,22 @@ _sk_bicubic_p1y_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6f4d <_sk_bicubic_p1y_sse2+0xa> + .byte 232,0,0,0,0 // call 70cc <_sk_bicubic_p1y_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi - .byte 15,40,160,211,55,0,0 // movaps 0x37d3(%eax),%xmm4 + .byte 15,40,160,68,56,0,0 // movaps 0x3844(%eax),%xmm4 .byte 15,16,78,32 // movups 0x20(%esi),%xmm1 .byte 15,16,110,96 // movups 0x60(%esi),%xmm5 .byte 15,88,204 // addps %xmm4,%xmm1 - .byte 15,40,176,227,55,0,0 // movaps 0x37e3(%eax),%xmm6 + .byte 15,40,176,84,56,0,0 // movaps 0x3854(%eax),%xmm6 .byte 15,89,245 // mulps %xmm5,%xmm6 - .byte 15,88,176,243,55,0,0 // addps 0x37f3(%eax),%xmm6 + .byte 15,88,176,100,56,0,0 // addps 0x3864(%eax),%xmm6 .byte 15,89,245 // mulps %xmm5,%xmm6 .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,89,245 // mulps %xmm5,%xmm6 - .byte 15,88,176,3,56,0,0 // addps 0x3803(%eax),%xmm6 + .byte 15,88,176,116,56,0,0 // addps 0x3874(%eax),%xmm6 .byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax .byte 131,236,8 // sub $0x8,%esp @@ -70804,18 +71478,18 @@ _sk_bicubic_p3y_sse2: .byte 137,229 // mov %esp,%ebp .byte 86 // push %esi .byte 80 // push %eax - .byte 232,0,0,0,0 // call 6fab <_sk_bicubic_p3y_sse2+0xa> + .byte 232,0,0,0,0 // call 712a <_sk_bicubic_p3y_sse2+0xa> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi .byte 15,16,78,32 // movups 0x20(%esi),%xmm1 .byte 15,16,102,96 // movups 0x60(%esi),%xmm4 - .byte 15,88,136,181,55,0,0 // addps 0x37b5(%eax),%xmm1 + .byte 15,88,136,38,56,0,0 // addps 0x3826(%eax),%xmm1 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,237 // mulps %xmm5,%xmm5 - .byte 15,89,160,197,55,0,0 // mulps 0x37c5(%eax),%xmm4 - .byte 15,88,160,213,55,0,0 // addps 0x37d5(%eax),%xmm4 + .byte 15,89,160,54,56,0,0 // mulps 0x3836(%eax),%xmm4 + .byte 15,88,160,70,56,0,0 // addps 0x3846(%eax),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 .byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi) .byte 141,66,8 // lea 0x8(%edx),%eax @@ -70960,7 +71634,7 @@ _sk_clut_3D_sse2: .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1 .byte 102,15,98,233 // punpckldq %xmm1,%xmm5 .byte 102,15,127,173,104,255,255,255 // movdqa %xmm5,-0x98(%ebp) - .byte 232,0,0,0,0 // call 719f <_sk_clut_3D_sse2+0xff> + .byte 232,0,0,0,0 // call 731e <_sk_clut_3D_sse2+0xff> .byte 90 // pop %edx .byte 243,15,91,196 // cvttps2dq %xmm4,%xmm0 .byte 102,15,127,133,232,254,255,255 // movdqa %xmm0,-0x118(%ebp) @@ -70969,7 +71643,7 @@ _sk_clut_3D_sse2: .byte 102,15,254,208 // paddd %xmm0,%xmm2 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,254,202 // paddd %xmm2,%xmm1 - .byte 102,15,111,130,1,54,0,0 // movdqa 0x3601(%edx),%xmm0 + .byte 102,15,111,130,114,54,0,0 // movdqa 0x3672(%edx),%xmm0 .byte 102,15,127,133,88,255,255,255 // movdqa %xmm0,-0xa8(%ebp) .byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4 .byte 102,15,244,200 // pmuludq %xmm0,%xmm1 @@ -70993,7 +71667,7 @@ _sk_clut_3D_sse2: .byte 15,20,196 // unpcklps %xmm4,%xmm0 .byte 15,20,199 // unpcklps %xmm7,%xmm0 .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp) - .byte 102,15,111,130,17,54,0,0 // movdqa 0x3611(%edx),%xmm0 + .byte 102,15,111,130,130,54,0,0 // movdqa 0x3682(%edx),%xmm0 .byte 102,15,127,133,72,255,255,255 // movdqa %xmm0,-0xb8(%ebp) .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,254,224 // paddd %xmm0,%xmm4 @@ -71011,7 +71685,7 @@ _sk_clut_3D_sse2: .byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4 .byte 15,20,252 // unpcklps %xmm4,%xmm7 .byte 15,20,248 // unpcklps %xmm0,%xmm7 - .byte 102,15,111,130,33,54,0,0 // movdqa 0x3621(%edx),%xmm0 + .byte 102,15,111,130,146,54,0,0 // movdqa 0x3692(%edx),%xmm0 .byte 102,15,127,69,216 // movdqa %xmm0,-0x28(%ebp) .byte 102,15,254,200 // paddd %xmm0,%xmm1 .byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0 @@ -71028,7 +71702,7 @@ _sk_clut_3D_sse2: .byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0 .byte 15,20,232 // unpcklps %xmm0,%xmm5 .byte 15,20,236 // unpcklps %xmm4,%xmm5 - .byte 15,40,130,241,53,0,0 // movaps 0x35f1(%edx),%xmm0 + .byte 15,40,130,98,54,0,0 // movaps 0x3662(%edx),%xmm0 .byte 15,88,240 // addps %xmm0,%xmm6 .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp) .byte 15,40,141,56,255,255,255 // movaps -0xc8(%ebp),%xmm1 @@ -71641,7 +72315,7 @@ _sk_clut_4D_sse2: .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1 .byte 102,15,98,209 // punpckldq %xmm1,%xmm2 .byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp) - .byte 232,0,0,0,0 // call 7d15 <_sk_clut_4D_sse2+0x179> + .byte 232,0,0,0,0 // call 7e94 <_sk_clut_4D_sse2+0x179> .byte 89 // pop %ecx .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,41,165,120,254,255,255 // movaps %xmm4,-0x188(%ebp) @@ -71654,7 +72328,7 @@ _sk_clut_4D_sse2: .byte 102,15,254,245 // paddd %xmm5,%xmm6 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 .byte 102,15,254,206 // paddd %xmm6,%xmm1 - .byte 102,15,111,153,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm3 + .byte 102,15,111,153,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm3 .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2 .byte 102,15,244,203 // pmuludq %xmm3,%xmm1 .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1 @@ -71677,7 +72351,7 @@ _sk_clut_4D_sse2: .byte 15,20,218 // unpcklps %xmm2,%xmm3 .byte 15,20,221 // unpcklps %xmm5,%xmm3 .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) - .byte 102,15,111,153,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm3 + .byte 102,15,111,153,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm3 .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5 @@ -71695,7 +72369,7 @@ _sk_clut_4D_sse2: .byte 15,20,215 // unpcklps %xmm7,%xmm2 .byte 15,20,213 // unpcklps %xmm5,%xmm2 .byte 15,41,149,136,254,255,255 // movaps %xmm2,-0x178(%ebp) - .byte 102,15,254,137,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm1 + .byte 102,15,254,137,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm1 .byte 102,15,112,233,229 // pshufd $0xe5,%xmm1,%xmm5 .byte 102,15,126,232 // movd %xmm5,%eax .byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5 @@ -71711,7 +72385,7 @@ _sk_clut_4D_sse2: .byte 15,20,207 // unpcklps %xmm7,%xmm1 .byte 15,20,205 // unpcklps %xmm5,%xmm1 .byte 15,41,141,152,254,255,255 // movaps %xmm1,-0x168(%ebp) - .byte 15,40,185,187,42,0,0 // movaps 0x2abb(%ecx),%xmm7 + .byte 15,40,185,44,43,0,0 // movaps 0x2b2c(%ecx),%xmm7 .byte 15,88,231 // addps %xmm7,%xmm4 .byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp) .byte 15,40,141,232,254,255,255 // movaps -0x118(%ebp),%xmm1 @@ -71732,7 +72406,7 @@ _sk_clut_4D_sse2: .byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp) .byte 102,15,254,241 // paddd %xmm1,%xmm6 .byte 102,15,112,254,245 // pshufd $0xf5,%xmm6,%xmm7 - .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1 + .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1 .byte 102,15,244,241 // pmuludq %xmm1,%xmm6 .byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0 .byte 102,15,244,249 // pmuludq %xmm1,%xmm7 @@ -71769,7 +72443,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5 .byte 15,20,221 // unpcklps %xmm5,%xmm3 .byte 15,20,217 // unpcklps %xmm1,%xmm3 - .byte 102,15,111,177,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm6 + .byte 102,15,111,177,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm6 .byte 102,15,254,198 // paddd %xmm6,%xmm0 .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1 .byte 102,15,126,200 // movd %xmm1,%eax @@ -71817,7 +72491,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,234 // movdqa %xmm2,%xmm5 .byte 102,15,254,77,168 // paddd -0x58(%ebp),%xmm1 .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2 - .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0 + .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0 .byte 102,15,244,200 // pmuludq %xmm0,%xmm1 .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1 .byte 102,15,244,208 // pmuludq %xmm0,%xmm2 @@ -71839,7 +72513,7 @@ _sk_clut_4D_sse2: .byte 15,20,195 // unpcklps %xmm3,%xmm0 .byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp) .byte 102,15,111,209 // movdqa %xmm1,%xmm2 - .byte 102,15,111,129,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm0 + .byte 102,15,111,129,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm0 .byte 102,15,254,208 // paddd %xmm0,%xmm2 .byte 102,15,111,224 // movdqa %xmm0,%xmm4 .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3 @@ -71875,7 +72549,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,254,69,184 // paddd -0x48(%ebp),%xmm0 .byte 102,15,112,216,245 // pshufd $0xf5,%xmm0,%xmm3 - .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1 + .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1 .byte 102,15,244,193 // pmuludq %xmm1,%xmm0 .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2 .byte 102,15,244,217 // pmuludq %xmm1,%xmm3 @@ -71911,7 +72585,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0 .byte 15,20,224 // unpcklps %xmm0,%xmm4 .byte 15,20,227 // unpcklps %xmm3,%xmm4 - .byte 102,15,111,153,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm3 + .byte 102,15,111,153,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm3 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0 .byte 102,15,126,192 // movd %xmm0,%eax @@ -71975,7 +72649,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0 .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1 - .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2 + .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2 .byte 102,15,244,194 // pmuludq %xmm2,%xmm0 .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0 .byte 102,15,244,202 // pmuludq %xmm2,%xmm1 @@ -71997,7 +72671,7 @@ _sk_clut_4D_sse2: .byte 15,20,214 // unpcklps %xmm6,%xmm2 .byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp) .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,15,111,145,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm2 + .byte 102,15,111,145,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm2 .byte 102,15,254,202 // paddd %xmm2,%xmm1 .byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6 .byte 102,15,126,240 // movd %xmm6,%eax @@ -72030,7 +72704,7 @@ _sk_clut_4D_sse2: .byte 15,20,206 // unpcklps %xmm6,%xmm1 .byte 102,15,254,109,184 // paddd -0x48(%ebp),%xmm5 .byte 102,15,112,245,245 // pshufd $0xf5,%xmm5,%xmm6 - .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0 + .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0 .byte 102,15,244,232 // pmuludq %xmm0,%xmm5 .byte 102,15,112,253,232 // pshufd $0xe8,%xmm5,%xmm7 .byte 102,15,244,240 // pmuludq %xmm0,%xmm6 @@ -72066,7 +72740,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2 .byte 15,20,234 // unpcklps %xmm2,%xmm5 .byte 15,20,238 // unpcklps %xmm6,%xmm5 - .byte 102,15,111,153,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm3 + .byte 102,15,111,153,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm3 .byte 102,15,254,251 // paddd %xmm3,%xmm7 .byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2 .byte 102,15,126,208 // movd %xmm2,%eax @@ -72100,7 +72774,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0 .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1 - .byte 102,15,111,177,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm6 + .byte 102,15,111,177,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm6 .byte 102,15,244,198 // pmuludq %xmm6,%xmm0 .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2 .byte 102,15,244,206 // pmuludq %xmm6,%xmm1 @@ -72122,7 +72796,7 @@ _sk_clut_4D_sse2: .byte 15,20,193 // unpcklps %xmm1,%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) .byte 102,15,111,202 // movdqa %xmm2,%xmm1 - .byte 102,15,254,137,219,42,0,0 // paddd 0x2adb(%ecx),%xmm1 + .byte 102,15,254,137,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm1 .byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6 .byte 102,15,126,240 // movd %xmm6,%eax .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6 @@ -72156,7 +72830,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,212 // movdqa %xmm4,%xmm2 .byte 102,15,254,85,184 // paddd -0x48(%ebp),%xmm2 .byte 102,15,112,194,245 // pshufd $0xf5,%xmm2,%xmm0 - .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1 + .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1 .byte 102,15,244,209 // pmuludq %xmm1,%xmm2 .byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4 .byte 102,15,244,193 // pmuludq %xmm1,%xmm0 @@ -72177,7 +72851,7 @@ _sk_clut_4D_sse2: .byte 15,20,200 // unpcklps %xmm0,%xmm1 .byte 15,20,206 // unpcklps %xmm6,%xmm1 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 - .byte 102,15,254,129,219,42,0,0 // paddd 0x2adb(%ecx),%xmm0 + .byte 102,15,254,129,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm0 .byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6 .byte 102,15,126,240 // movd %xmm6,%eax .byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6 @@ -72192,7 +72866,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0 .byte 15,20,208 // unpcklps %xmm0,%xmm2 .byte 15,20,214 // unpcklps %xmm6,%xmm2 - .byte 102,15,254,161,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm4 + .byte 102,15,254,161,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm4 .byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0 .byte 102,15,126,192 // movd %xmm0,%eax .byte 102,15,112,196,78 // pshufd $0x4e,%xmm4,%xmm0 @@ -72260,7 +72934,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,69,168 // movdqa -0x58(%ebp),%xmm0 .byte 102,15,254,193 // paddd %xmm1,%xmm0 .byte 102,15,112,224,245 // pshufd $0xf5,%xmm0,%xmm4 - .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2 + .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2 .byte 102,15,244,194 // pmuludq %xmm2,%xmm0 .byte 102,15,112,216,232 // pshufd $0xe8,%xmm0,%xmm3 .byte 102,15,244,226 // pmuludq %xmm2,%xmm4 @@ -72283,7 +72957,7 @@ _sk_clut_4D_sse2: .byte 15,20,196 // unpcklps %xmm4,%xmm0 .byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp) .byte 102,15,111,227 // movdqa %xmm3,%xmm4 - .byte 102,15,111,145,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm2 + .byte 102,15,111,145,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm2 .byte 102,15,254,226 // paddd %xmm2,%xmm4 .byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5 .byte 102,15,126,232 // movd %xmm5,%eax @@ -72299,7 +72973,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4 .byte 15,20,236 // unpcklps %xmm4,%xmm5 .byte 15,20,238 // unpcklps %xmm6,%xmm5 - .byte 102,15,254,153,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm3 + .byte 102,15,254,153,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm3 .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4 .byte 102,15,126,224 // movd %xmm4,%eax .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4 @@ -72351,7 +73025,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2 .byte 15,20,218 // unpcklps %xmm2,%xmm3 .byte 15,20,223 // unpcklps %xmm7,%xmm3 - .byte 102,15,254,161,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm4 + .byte 102,15,254,161,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm4 .byte 102,15,112,212,229 // pshufd $0xe5,%xmm4,%xmm2 .byte 102,15,126,208 // movd %xmm2,%eax .byte 102,15,112,212,78 // pshufd $0x4e,%xmm4,%xmm2 @@ -72384,7 +73058,7 @@ _sk_clut_4D_sse2: .byte 102,15,127,133,56,255,255,255 // movdqa %xmm0,-0xc8(%ebp) .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0 .byte 102,15,112,208,245 // pshufd $0xf5,%xmm0,%xmm2 - .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1 + .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1 .byte 102,15,244,193 // pmuludq %xmm1,%xmm0 .byte 102,15,112,240,232 // pshufd $0xe8,%xmm0,%xmm6 .byte 102,15,244,209 // pmuludq %xmm1,%xmm2 @@ -72406,7 +73080,7 @@ _sk_clut_4D_sse2: .byte 15,20,194 // unpcklps %xmm2,%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) .byte 102,15,111,214 // movdqa %xmm6,%xmm2 - .byte 102,15,111,153,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm3 + .byte 102,15,111,153,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm3 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5 .byte 102,15,126,232 // movd %xmm5,%eax @@ -72422,7 +73096,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2 .byte 15,20,234 // unpcklps %xmm2,%xmm5 .byte 15,20,239 // unpcklps %xmm7,%xmm5 - .byte 102,15,254,177,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm6 + .byte 102,15,254,177,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm6 .byte 102,15,112,214,229 // pshufd $0xe5,%xmm6,%xmm2 .byte 102,15,126,208 // movd %xmm2,%eax .byte 102,15,112,214,78 // pshufd $0x4e,%xmm6,%xmm2 @@ -72475,7 +73149,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0 .byte 15,20,216 // unpcklps %xmm0,%xmm3 .byte 15,20,218 // unpcklps %xmm2,%xmm3 - .byte 102,15,254,185,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm7 + .byte 102,15,254,185,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm7 .byte 102,15,112,199,229 // pshufd $0xe5,%xmm7,%xmm0 .byte 102,15,126,192 // movd %xmm0,%eax .byte 102,15,112,199,78 // pshufd $0x4e,%xmm7,%xmm0 @@ -72525,7 +73199,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,233 // movdqa %xmm1,%xmm5 .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0 .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1 - .byte 102,15,111,153,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm3 + .byte 102,15,111,153,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm3 .byte 102,15,244,195 // pmuludq %xmm3,%xmm0 .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2 .byte 102,15,244,203 // pmuludq %xmm3,%xmm1 @@ -72547,7 +73221,7 @@ _sk_clut_4D_sse2: .byte 15,20,193 // unpcklps %xmm1,%xmm0 .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp) .byte 102,15,111,202 // movdqa %xmm2,%xmm1 - .byte 102,15,111,177,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm6 + .byte 102,15,111,177,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm6 .byte 102,15,254,206 // paddd %xmm6,%xmm1 .byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3 .byte 102,15,126,216 // movd %xmm3,%eax @@ -72563,7 +73237,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4 .byte 15,20,204 // unpcklps %xmm4,%xmm1 .byte 15,20,203 // unpcklps %xmm3,%xmm1 - .byte 102,15,111,185,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm7 + .byte 102,15,111,185,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm7 .byte 102,15,254,215 // paddd %xmm7,%xmm2 .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3 .byte 102,15,126,216 // movd %xmm3,%eax @@ -72582,7 +73256,7 @@ _sk_clut_4D_sse2: .byte 102,15,111,221 // movdqa %xmm5,%xmm3 .byte 102,15,254,93,184 // paddd -0x48(%ebp),%xmm3 .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4 - .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0 + .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0 .byte 102,15,244,216 // pmuludq %xmm0,%xmm3 .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3 .byte 102,15,244,224 // pmuludq %xmm0,%xmm4 @@ -72651,7 +73325,7 @@ _sk_clut_4D_sse2: .byte 102,15,254,193 // paddd %xmm1,%xmm0 .byte 102,15,111,241 // movdqa %xmm1,%xmm6 .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1 - .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2 + .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2 .byte 102,15,244,194 // pmuludq %xmm2,%xmm0 .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0 .byte 102,15,244,202 // pmuludq %xmm2,%xmm1 @@ -72674,7 +73348,7 @@ _sk_clut_4D_sse2: .byte 15,20,218 // unpcklps %xmm2,%xmm3 .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp) .byte 102,15,111,200 // movdqa %xmm0,%xmm1 - .byte 102,15,254,137,219,42,0,0 // paddd 0x2adb(%ecx),%xmm1 + .byte 102,15,254,137,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm1 .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2 .byte 102,15,126,208 // movd %xmm2,%eax .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 @@ -72690,7 +73364,7 @@ _sk_clut_4D_sse2: .byte 15,20,217 // unpcklps %xmm1,%xmm3 .byte 15,20,218 // unpcklps %xmm2,%xmm3 .byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp) - .byte 102,15,254,129,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm0 + .byte 102,15,254,129,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm0 .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1 .byte 102,15,126,200 // movd %xmm1,%eax .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 @@ -72727,7 +73401,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7 .byte 15,20,199 // unpcklps %xmm7,%xmm0 .byte 15,20,193 // unpcklps %xmm1,%xmm0 - .byte 102,15,111,177,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm6 + .byte 102,15,111,177,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm6 .byte 102,15,254,242 // paddd %xmm2,%xmm6 .byte 102,15,112,206,229 // pshufd $0xe5,%xmm6,%xmm1 .byte 102,15,126,200 // movd %xmm1,%eax @@ -72743,7 +73417,7 @@ _sk_clut_4D_sse2: .byte 243,15,16,52,178 // movss (%edx,%esi,4),%xmm6 .byte 15,20,206 // unpcklps %xmm6,%xmm1 .byte 15,20,207 // unpcklps %xmm7,%xmm1 - .byte 102,15,254,145,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm2 + .byte 102,15,254,145,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm2 .byte 102,15,112,242,229 // pshufd $0xe5,%xmm2,%xmm6 .byte 102,15,126,240 // movd %xmm6,%eax .byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6 @@ -72813,7 +73487,7 @@ _sk_clut_4D_sse2: .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 141,86,8 // lea 0x8(%esi),%edx .byte 131,236,8 // sub $0x8,%esp - .byte 15,40,153,251,42,0,0 // movaps 0x2afb(%ecx),%xmm3 + .byte 15,40,153,108,43,0,0 // movaps 0x2b6c(%ecx),%xmm3 .byte 82 // push %edx .byte 80 // push %eax .byte 255,86,4 // call *0x4(%esi) @@ -72974,16 +73648,22 @@ BALIGN16 .byte 63 // aas .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) - .byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%eax) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) + .byte 63 // aas + .byte 0,0 // add %al,(%eax) + .byte 128,63,0 // cmpb $0x0,(%edi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) .byte 191,0,0,128,191 // mov $0xbf800000,%edi .byte 0,0 // add %al,(%eax) - .byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%edi) + .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%edi) .byte 0,224 // add %ah,%al .byte 64 // inc %eax .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 937c <.literal16+0x1fc> + .byte 224,64 // loopne 9508 <.literal16+0x208> .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 9380 <.literal16+0x200> + .byte 224,64 // loopne 950c <.literal16+0x20c> + .byte 0,0 // add %al,(%eax) + .byte 224,64 // loopne 9510 <.literal16+0x210> .byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999 .byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999 .byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax @@ -72994,16 +73674,16 @@ BALIGN16 .byte 63 // aas .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 93a1 <.literal16+0x221> + .byte 225,61 // loope 9531 <.literal16+0x231> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 93a5 <.literal16+0x225> + .byte 225,61 // loope 9535 <.literal16+0x235> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 93a9 <.literal16+0x229> + .byte 225,61 // loope 9539 <.literal16+0x239> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 93ad <.literal16+0x22d> + .byte 225,61 // loope 953d <.literal16+0x23d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73020,16 +73700,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 93e1 <.literal16+0x261> + .byte 225,61 // loope 9571 <.literal16+0x271> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 93e5 <.literal16+0x265> + .byte 225,61 // loope 9575 <.literal16+0x275> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 93e9 <.literal16+0x269> + .byte 225,61 // loope 9579 <.literal16+0x279> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 93ed <.literal16+0x26d> + .byte 225,61 // loope 957d <.literal16+0x27d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73046,16 +73726,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 9421 <.literal16+0x2a1> + .byte 225,61 // loope 95b1 <.literal16+0x2b1> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 9425 <.literal16+0x2a5> + .byte 225,61 // loope 95b5 <.literal16+0x2b5> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 9429 <.literal16+0x2a9> + .byte 225,61 // loope 95b9 <.literal16+0x2b9> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 942d <.literal16+0x2ad> + .byte 225,61 // loope 95bd <.literal16+0x2bd> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73072,16 +73752,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 9461 <.literal16+0x2e1> + .byte 225,61 // loope 95f1 <.literal16+0x2f1> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 9465 <.literal16+0x2e5> + .byte 225,61 // loope 95f5 <.literal16+0x2f5> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 9469 <.literal16+0x2e9> + .byte 225,61 // loope 95f9 <.literal16+0x2f9> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 946d <.literal16+0x2ed> + .byte 225,61 // loope 95fd <.literal16+0x2fd> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73103,11 +73783,11 @@ BALIGN16 .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax) .byte 67 // inc %ebx .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 94ab <.literal16+0x32b> + .byte 127,67 // jg 963b <.literal16+0x33b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 94af <.literal16+0x32f> + .byte 127,67 // jg 963f <.literal16+0x33f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 94b3 <.literal16+0x333> + .byte 127,67 // jg 9643 <.literal16+0x343> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73357,7 +74037,53 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax) .byte 128,59,129 // cmpb $0x81,(%ebx) - .byte 128,128,59,255,0,0,0 // addb $0x0,0xff3b(%eax) + .byte 128,128,59,0,248,0,0 // addb $0x0,0xf8003b(%eax) + .byte 0,248 // add %bh,%al + .byte 0,0 // add %al,(%eax) + .byte 0,248 // add %bh,%al + .byte 0,0 // add %al,(%eax) + .byte 0,248 // add %bh,%al + .byte 0,0 // add %al,(%eax) + .byte 8,33 // or %ah,(%ecx) + .byte 132,55 // test %dh,(%edi) + .byte 8,33 // or %ah,(%ecx) + .byte 132,55 // test %dh,(%edi) + .byte 8,33 // or %ah,(%ecx) + .byte 132,55 // test %dh,(%edi) + .byte 8,33 // or %ah,(%ecx) + .byte 132,55 // test %dh,(%edi) + .byte 224,7 // loopne 9879 <.literal16+0x579> + .byte 0,0 // add %al,(%eax) + .byte 224,7 // loopne 987d <.literal16+0x57d> + .byte 0,0 // add %al,(%eax) + .byte 224,7 // loopne 9881 <.literal16+0x581> + .byte 0,0 // add %al,(%eax) + .byte 224,7 // loopne 9885 <.literal16+0x585> + .byte 0,0 // add %al,(%eax) + .byte 33,8 // and %ecx,(%eax) + .byte 2,58 // add (%edx),%bh + .byte 33,8 // and %ecx,(%eax) + .byte 2,58 // add (%edx),%bh + .byte 33,8 // and %ecx,(%eax) + .byte 2,58 // add (%edx),%bh + .byte 33,8 // and %ecx,(%eax) + .byte 2,58 // add (%edx),%bh + .byte 31 // pop %ds + .byte 0,0 // add %al,(%eax) + .byte 0,31 // add %bl,(%edi) + .byte 0,0 // add %al,(%eax) + .byte 0,31 // add %bl,(%edi) + .byte 0,0 // add %al,(%eax) + .byte 0,31 // add %bl,(%edi) + .byte 0,0 // add %al,(%eax) + .byte 0,8 // add %cl,(%eax) + .byte 33,4,61,8,33,4,61 // and %eax,0x3d042108(,%edi,1) + .byte 8,33 // or %ah,(%ecx) + .byte 4,61 // add $0x3d,%al + .byte 8,33 // or %ah,(%ecx) + .byte 4,61 // add $0x3d,%al + .byte 255,0 // incl (%eax) + .byte 0,0 // add %al,(%eax) .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 255,0 // incl (%eax) @@ -73381,13 +74107,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 9709 <.literal16+0x589> + .byte 224,7 // loopne 98f9 <.literal16+0x5f9> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 970d <.literal16+0x58d> + .byte 224,7 // loopne 98fd <.literal16+0x5fd> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9711 <.literal16+0x591> + .byte 224,7 // loopne 9901 <.literal16+0x601> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9715 <.literal16+0x595> + .byte 224,7 // loopne 9905 <.literal16+0x605> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -73436,11 +74162,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,127,67 // add %bh,0x43(%edi) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 97cb <.literal16+0x64b> + .byte 127,67 // jg 99bb <.literal16+0x6bb> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 97cf <.literal16+0x64f> + .byte 127,67 // jg 99bf <.literal16+0x6bf> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 97d3 <.literal16+0x653> + .byte 127,67 // jg 99c3 <.literal16+0x6c3> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax) .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax) @@ -73455,16 +74181,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 97c4 <.literal16+0x644> + .byte 127,0 // jg 99b4 <.literal16+0x6b4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 97c8 <.literal16+0x648> + .byte 127,0 // jg 99b8 <.literal16+0x6b8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 97cc <.literal16+0x64c> + .byte 127,0 // jg 99bc <.literal16+0x6bc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 97d0 <.literal16+0x650> + .byte 127,0 // jg 99c0 <.literal16+0x6c0> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -73473,7 +74199,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 9855 <.literal16+0x6d5> + .byte 119,115 // ja 9a45 <.literal16+0x745> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -73484,7 +74210,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 97b9 <.literal16+0x639> + .byte 117,191 // jne 99a9 <.literal16+0x6a9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -73500,7 +74226,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3d7f6 <_sk_clut_4D_sse2+0xe9a35c5a> + .byte 233,220,63,163,233 // jmp e9a3d9e6 <_sk_clut_4D_sse2+0xe9a35ccb> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73555,16 +74281,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 9894 <.literal16+0x714> + .byte 127,0 // jg 9a84 <.literal16+0x784> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9898 <.literal16+0x718> + .byte 127,0 // jg 9a88 <.literal16+0x788> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 989c <.literal16+0x71c> + .byte 127,0 // jg 9a8c <.literal16+0x78c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 98a0 <.literal16+0x720> + .byte 127,0 // jg 9a90 <.literal16+0x790> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -73573,7 +74299,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 9925 <.literal16+0x7a5> + .byte 119,115 // ja 9b15 <.literal16+0x815> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -73584,7 +74310,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 9889 <.literal16+0x709> + .byte 117,191 // jne 9a79 <.literal16+0x779> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -73600,7 +74326,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3d8c6 <_sk_clut_4D_sse2+0xe9a35d2a> + .byte 233,220,63,163,233 // jmp e9a3dab6 <_sk_clut_4D_sse2+0xe9a35d9b> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73655,16 +74381,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 9964 <.literal16+0x7e4> + .byte 127,0 // jg 9b54 <.literal16+0x854> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9968 <.literal16+0x7e8> + .byte 127,0 // jg 9b58 <.literal16+0x858> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 996c <.literal16+0x7ec> + .byte 127,0 // jg 9b5c <.literal16+0x85c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9970 <.literal16+0x7f0> + .byte 127,0 // jg 9b60 <.literal16+0x860> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -73673,7 +74399,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 99f5 <.literal16+0x875> + .byte 119,115 // ja 9be5 <.literal16+0x8e5> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -73684,7 +74410,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 9959 <.literal16+0x7d9> + .byte 117,191 // jne 9b49 <.literal16+0x849> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -73700,7 +74426,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3d996 <_sk_clut_4D_sse2+0xe9a35dfa> + .byte 233,220,63,163,233 // jmp e9a3db86 <_sk_clut_4D_sse2+0xe9a35e6b> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73755,16 +74481,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 9a34 <.literal16+0x8b4> + .byte 127,0 // jg 9c24 <.literal16+0x924> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9a38 <.literal16+0x8b8> + .byte 127,0 // jg 9c28 <.literal16+0x928> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9a3c <.literal16+0x8bc> + .byte 127,0 // jg 9c2c <.literal16+0x92c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9a40 <.literal16+0x8c0> + .byte 127,0 // jg 9c30 <.literal16+0x930> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -73773,7 +74499,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 9ac5 <.literal16+0x945> + .byte 119,115 // ja 9cb5 <.literal16+0x9b5> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -73784,7 +74510,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 9a29 <.literal16+0x8a9> + .byte 117,191 // jne 9c19 <.literal16+0x919> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -73800,7 +74526,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3da66 <_sk_clut_4D_sse2+0xe9a35eca> + .byte 233,220,63,163,233 // jmp e9a3dc56 <_sk_clut_4D_sse2+0xe9a35f3b> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73855,16 +74581,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 9b04 <.literal16+0x984> + .byte 127,0 // jg 9cf4 <.literal16+0x9f4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9b08 <.literal16+0x988> + .byte 127,0 // jg 9cf8 <.literal16+0x9f8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9b0c <.literal16+0x98c> + .byte 127,0 // jg 9cfc <.literal16+0x9fc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9b10 <.literal16+0x990> + .byte 127,0 // jg 9d00 <.literal16+0xa00> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -73873,7 +74599,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 9b95 <.literal16+0xa15> + .byte 119,115 // ja 9d85 <.literal16+0xa85> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -73884,7 +74610,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 9af9 <.literal16+0x979> + .byte 117,191 // jne 9ce9 <.literal16+0x9e9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -73900,7 +74626,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3db36 <_sk_clut_4D_sse2+0xe9a35f9a> + .byte 233,220,63,163,233 // jmp e9a3dd26 <_sk_clut_4D_sse2+0xe9a3600b> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -73951,13 +74677,13 @@ BALIGN16 .byte 200,66,0,0 // enter $0x42,$0x0 .byte 200,66,0,0 // enter $0x42,$0x0 .byte 200,66,0,0 // enter $0x42,$0x0 - .byte 127,67 // jg 9c17 <.literal16+0xa97> + .byte 127,67 // jg 9e07 <.literal16+0xb07> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c1b <.literal16+0xa9b> + .byte 127,67 // jg 9e0b <.literal16+0xb0b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c1f <.literal16+0xa9f> + .byte 127,67 // jg 9e0f <.literal16+0xb0f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c23 <.literal16+0xaa3> + .byte 127,67 // jg 9e13 <.literal16+0xb13> .byte 0,0 // add %al,(%eax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%eax) @@ -74008,16 +74734,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%ebx) .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 9ca3 <.literal16+0xb23> + .byte 118,63 // jbe 9e93 <.literal16+0xb93> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 9ca7 <.literal16+0xb27> + .byte 118,63 // jbe 9e97 <.literal16+0xb97> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 9cab <.literal16+0xb2b> + .byte 118,63 // jbe 9e9b <.literal16+0xb9b> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 9caf <.literal16+0xb2f> + .byte 118,63 // jbe 9e9f <.literal16+0xb9f> .byte 246,64,83,63 // testb $0x3f,0x53(%eax) .byte 246,64,83,63 // testb $0x3f,0x53(%eax) .byte 246,64,83,63 // testb $0x3f,0x53(%eax) @@ -74046,11 +74772,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%ebx) .byte 0,127,67 // add %bh,0x43(%edi) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9d1b <.literal16+0xb9b> + .byte 127,67 // jg 9f0b <.literal16+0xc0b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9d1f <.literal16+0xb9f> + .byte 127,67 // jg 9f0f <.literal16+0xc0f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9d23 <.literal16+0xba3> + .byte 127,67 // jg 9f13 <.literal16+0xc13> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 0,0 // add %al,(%eax) @@ -74112,13 +74838,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 9d99 <.literal16+0xc19> + .byte 224,7 // loopne 9f89 <.literal16+0xc89> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9d9d <.literal16+0xc1d> + .byte 224,7 // loopne 9f8d <.literal16+0xc8d> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9da1 <.literal16+0xc21> + .byte 224,7 // loopne 9f91 <.literal16+0xc91> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9da5 <.literal16+0xc25> + .byte 224,7 // loopne 9f95 <.literal16+0xc95> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -74164,13 +74890,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 9e09 <.literal16+0xc89> + .byte 224,7 // loopne 9ff9 <.literal16+0xcf9> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9e0d <.literal16+0xc8d> + .byte 224,7 // loopne 9ffd <.literal16+0xcfd> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9e11 <.literal16+0xc91> + .byte 224,7 // loopne a001 <.literal16+0xd01> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9e15 <.literal16+0xc95> + .byte 224,7 // loopne a005 <.literal16+0xd05> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -74216,13 +74942,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 9e79 <.literal16+0xcf9> + .byte 224,7 // loopne a069 <.literal16+0xd69> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9e7d <.literal16+0xcfd> + .byte 224,7 // loopne a06d <.literal16+0xd6d> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9e81 <.literal16+0xd01> + .byte 224,7 // loopne a071 <.literal16+0xd71> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9e85 <.literal16+0xd05> + .byte 224,7 // loopne a075 <.literal16+0xd75> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -74264,13 +74990,13 @@ BALIGN16 .byte 248 // clc .byte 65 // inc %ecx .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9f16 <.literal16+0xd96> + .byte 124,66 // jl a106 <.literal16+0xe06> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9f1a <.literal16+0xd9a> + .byte 124,66 // jl a10a <.literal16+0xe0a> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9f1e <.literal16+0xd9e> + .byte 124,66 // jl a10e <.literal16+0xe0e> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9f22 <.literal16+0xda2> + .byte 124,66 // jl a112 <.literal16+0xe12> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%eax) .byte 0,240 // add %dh,%al @@ -74404,13 +75130,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo a0a5 <.literal16+0xf25> + .byte 112,65 // jo a295 <.literal16+0xf95> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo a0a9 <.literal16+0xf29> + .byte 112,65 // jo a299 <.literal16+0xf99> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo a0ad <.literal16+0xf2d> + .byte 112,65 // jo a29d <.literal16+0xf9d> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo a0b1 <.literal16+0xf31> + .byte 112,65 // jo a2a1 <.literal16+0xfa1> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 255,0 // incl (%eax) @@ -74441,11 +75167,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg a11b <.literal16+0xf9b> + .byte 127,67 // jg a30b <.literal16+0x100b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg a11f <.literal16+0xf9f> + .byte 127,67 // jg a30f <.literal16+0x100f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg a123 <.literal16+0xfa3> + .byte 127,67 // jg a313 <.literal16+0x1013> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 255,0 // incl (%eax) @@ -74476,11 +75202,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg a18b <.literal16+0x100b> + .byte 127,67 // jg a37b <.literal16+0x107b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg a18f <.literal16+0x100f> + .byte 127,67 // jg a37f <.literal16+0x107f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg a193 <.literal16+0x1013> + .byte 127,67 // jg a383 <.literal16+0x1083> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) .byte 0,0 // add %al,(%eax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) @@ -74579,13 +75305,13 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 255 // (bad) - .byte 127,71 // jg a2bb <.literal16+0x113b> + .byte 127,71 // jg a4ab <.literal16+0x11ab> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg a2bf <.literal16+0x113f> + .byte 127,71 // jg a4af <.literal16+0x11af> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg a2c3 <.literal16+0x1143> + .byte 127,71 // jg a4b3 <.literal16+0x11b3> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg a2c7 <.literal16+0x1147> + .byte 127,71 // jg a4b7 <.literal16+0x11b7> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -74693,7 +75419,7 @@ BALIGN16 .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110 .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js a3cc <.literal16+0x124c> + .byte 120,57 // js a5bc <.literal16+0x12bc> .byte 64 // inc %eax .byte 18,120,57 // adc 0x39(%eax),%bh .byte 64 // inc %eax @@ -74886,11 +75612,11 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,114 // cmpb $0x72,(%edi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt a5b2 <.literal16+0x1432> + .byte 62,114,28 // jb,pt a7a2 <.literal16+0x14a2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a5b6 <.literal16+0x1436> + .byte 62,114,28 // jb,pt a7a6 <.literal16+0x14a6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a5ba <.literal16+0x143a> + .byte 62,114,28 // jb,pt a7aa <.literal16+0x14aa> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -74969,13 +75695,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%edi) .byte 0,192 // add %al,%al .byte 63 // aas - .byte 114,28 // jb a67e <.literal16+0x14fe> + .byte 114,28 // jb a86e <.literal16+0x156e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a682 <.literal16+0x1502> + .byte 62,114,28 // jb,pt a872 <.literal16+0x1572> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a686 <.literal16+0x1506> + .byte 62,114,28 // jb,pt a876 <.literal16+0x1576> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a68a <.literal16+0x150a> + .byte 62,114,28 // jb,pt a87a <.literal16+0x157a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -74996,11 +75722,11 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,114 // cmpb $0x72,(%edi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt a6c2 <.literal16+0x1542> + .byte 62,114,28 // jb,pt a8b2 <.literal16+0x15b2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a6c6 <.literal16+0x1546> + .byte 62,114,28 // jb,pt a8b6 <.literal16+0x15b6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a6ca <.literal16+0x154a> + .byte 62,114,28 // jb,pt a8ba <.literal16+0x15ba> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -75079,13 +75805,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%edi) .byte 0,192 // add %al,%al .byte 63 // aas - .byte 114,28 // jb a78e <.literal16+0x160e> + .byte 114,28 // jb a97e <.literal16+0x167e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a792 <.literal16+0x1612> + .byte 62,114,28 // jb,pt a982 <.literal16+0x1682> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a796 <.literal16+0x1616> + .byte 62,114,28 // jb,pt a986 <.literal16+0x1686> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a79a <.literal16+0x161a> + .byte 62,114,28 // jb,pt a98a <.literal16+0x168a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -75095,14 +75821,14 @@ BALIGN16 .byte 170 // stos %al,%es:(%edi) .byte 170 // stos %al,%es:(%edi) .byte 190,171,170,170,190 // mov $0xbeaaaaab,%esi - .byte 114,249 // jb a78b <.literal16+0x160b> - .byte 127,63 // jg a7d3 <.literal16+0x1653> - .byte 114,249 // jb a78f <.literal16+0x160f> - .byte 127,63 // jg a7d7 <.literal16+0x1657> - .byte 114,249 // jb a793 <.literal16+0x1613> - .byte 127,63 // jg a7db <.literal16+0x165b> - .byte 114,249 // jb a797 <.literal16+0x1617> - .byte 127,63 // jg a7df <.literal16+0x165f> + .byte 114,249 // jb a97b <.literal16+0x167b> + .byte 127,63 // jg a9c3 <.literal16+0x16c3> + .byte 114,249 // jb a97f <.literal16+0x167f> + .byte 127,63 // jg a9c7 <.literal16+0x16c7> + .byte 114,249 // jb a983 <.literal16+0x1683> + .byte 127,63 // jg a9cb <.literal16+0x16cb> + .byte 114,249 // jb a987 <.literal16+0x1687> + .byte 127,63 // jg a9cf <.literal16+0x16cf> .byte 3,0 // add (%eax),%eax .byte 0,0 // add %al,(%eax) .byte 3,0 // add (%eax),%eax @@ -75127,14 +75853,14 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 2,0 // add (%eax),%al .byte 0,0 // add %al,(%eax) - .byte 114,249 // jb a7cb <.literal16+0x164b> - .byte 127,63 // jg a813 <.literal16+0x1693> - .byte 114,249 // jb a7cf <.literal16+0x164f> - .byte 127,63 // jg a817 <.literal16+0x1697> - .byte 114,249 // jb a7d3 <.literal16+0x1653> - .byte 127,63 // jg a81b <.literal16+0x169b> - .byte 114,249 // jb a7d7 <.literal16+0x1657> - .byte 127,63 // jg a81f <.literal16+0x169f> + .byte 114,249 // jb a9bb <.literal16+0x16bb> + .byte 127,63 // jg aa03 <.literal16+0x1703> + .byte 114,249 // jb a9bf <.literal16+0x16bf> + .byte 127,63 // jg aa07 <.literal16+0x1707> + .byte 114,249 // jb a9c3 <.literal16+0x16c3> + .byte 127,63 // jg aa0b <.literal16+0x170b> + .byte 114,249 // jb a9c7 <.literal16+0x16c7> + .byte 127,63 // jg aa0f <.literal16+0x170f> .byte 3,0 // add (%eax),%eax .byte 0,0 // add %al,(%eax) .byte 3,0 // add (%eax),%eax diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S index eee638a8c3..f681ed5531 100644 --- a/src/jumper/SkJumper_generated_win.S +++ b/src/jumper/SkJumper_generated_win.S @@ -101,7 +101,7 @@ _sk_seed_shader_hsw LABEL PROC DB 197,249,110,194 ; vmovd %edx,%xmm0 DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,45,180,2,0 ; vbroadcastss 0x2b42d(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,13,25,186,2,0 ; vbroadcastss 0x2ba19(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0 DB 197,249,110,209 ; vmovd %ecx,%xmm2 @@ -109,7 +109,7 @@ _sk_seed_shader_hsw LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,21,13,180,2,0 ; vbroadcastss 0x2b40d(%rip),%ymm2 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,21,249,185,2,0 ; vbroadcastss 0x2b9f9(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 @@ -126,13 +126,13 @@ _sk_dither_hsw LABEL PROC DB 197,121,110,201 ; vmovd %ecx,%xmm9 DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9 DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9 - DB 196,98,125,88,21,212,179,2,0 ; vpbroadcastd 0x2b3d4(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,98,125,88,21,192,185,2,0 ; vpbroadcastd 0x2b9c0(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11 DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11 DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10 DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10 - DB 196,98,125,88,37,185,179,2,0 ; vpbroadcastd 0x2b3b9(%rip),%ymm12 # 2b598 <_sk_overlay_sse2_8bit+0x477> - DB 196,98,125,88,45,180,179,2,0 ; vpbroadcastd 0x2b3b4(%rip),%ymm13 # 2b59c <_sk_overlay_sse2_8bit+0x47b> + DB 196,98,125,88,37,165,185,2,0 ; vpbroadcastd 0x2b9a5(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477> + DB 196,98,125,88,45,160,185,2,0 ; vpbroadcastd 0x2b9a0(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b> DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14 DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14 DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13 @@ -147,8 +147,8 @@ _sk_dither_hsw LABEL PROC DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8 DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,102,179,2,0 ; vbroadcastss 0x2b366(%rip),%ymm9 # 2b5a0 <_sk_overlay_sse2_8bit+0x47f> - DB 196,98,125,24,21,97,179,2,0 ; vbroadcastss 0x2b361(%rip),%ymm10 # 2b5a4 <_sk_overlay_sse2_8bit+0x483> + DB 196,98,125,24,13,82,185,2,0 ; vbroadcastss 0x2b952(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f> + DB 196,98,125,24,21,77,185,2,0 ; vbroadcastss 0x2b94d(%rip),%ymm10 # 2bb90 <_sk_overlay_sse2_8bit+0x483> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8 DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 @@ -178,7 +178,7 @@ _sk_uniform_color_hsw LABEL PROC PUBLIC _sk_black_color_hsw _sk_black_color_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,233,178,2,0 ; vbroadcastss 0x2b2e9(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,213,184,2,0 ; vbroadcastss 0x2b8d5(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 @@ -187,7 +187,7 @@ _sk_black_color_hsw LABEL PROC PUBLIC _sk_white_color_hsw _sk_white_color_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,208,178,2,0 ; vbroadcastss 0x2b2d0(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,188,184,2,0 ; vbroadcastss 0x2b8bc(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 197,252,40,216 ; vmovaps %ymm0,%ymm3 @@ -225,7 +225,7 @@ _sk_clear_hsw LABEL PROC PUBLIC _sk_srcatop_hsw _sk_srcatop_hsw LABEL PROC DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0 - DB 196,98,125,24,5,111,178,2,0 ; vbroadcastss 0x2b26f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,91,184,2,0 ; vbroadcastss 0x2b85b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0 DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1 @@ -239,7 +239,7 @@ _sk_srcatop_hsw LABEL PROC PUBLIC _sk_dstatop_hsw _sk_dstatop_hsw LABEL PROC - DB 196,98,125,24,5,62,178,2,0 ; vbroadcastss 0x2b23e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,42,184,2,0 ; vbroadcastss 0x2b82a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -272,7 +272,7 @@ _sk_dstin_hsw LABEL PROC PUBLIC _sk_srcout_hsw _sk_srcout_hsw LABEL PROC - DB 196,98,125,24,5,225,177,2,0 ; vbroadcastss 0x2b1e1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,205,183,2,0 ; vbroadcastss 0x2b7cd(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -283,7 +283,7 @@ _sk_srcout_hsw LABEL PROC PUBLIC _sk_dstout_hsw _sk_dstout_hsw LABEL PROC - DB 196,226,125,24,5,192,177,2,0 ; vbroadcastss 0x2b1c0(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,172,183,2,0 ; vbroadcastss 0x2b7ac(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3 DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0 DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1 @@ -294,7 +294,7 @@ _sk_dstout_hsw LABEL PROC PUBLIC _sk_srcover_hsw _sk_srcover_hsw LABEL PROC - DB 196,98,125,24,5,159,177,2,0 ; vbroadcastss 0x2b19f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,139,183,2,0 ; vbroadcastss 0x2b78b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0 DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -305,7 +305,7 @@ _sk_srcover_hsw LABEL PROC PUBLIC _sk_dstover_hsw _sk_dstover_hsw LABEL PROC - DB 196,98,125,24,5,122,177,2,0 ; vbroadcastss 0x2b17a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,102,183,2,0 ; vbroadcastss 0x2b766(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0 DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -325,7 +325,7 @@ _sk_modulate_hsw LABEL PROC PUBLIC _sk_multiply_hsw _sk_multiply_hsw LABEL PROC - DB 196,98,125,24,5,65,177,2,0 ; vbroadcastss 0x2b141(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,45,183,2,0 ; vbroadcastss 0x2b72d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -346,9 +346,14 @@ _sk_multiply_hsw LABEL PROC PUBLIC _sk_plus__hsw _sk_plus__hsw LABEL PROC DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0 + DB 196,98,125,24,5,220,182,2,0 ; vbroadcastss 0x2b6dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> + DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1 + DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2 + DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3 + DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -367,7 +372,7 @@ _sk_screen_hsw LABEL PROC PUBLIC _sk_xor__hsw _sk_xor__hsw LABEL PROC - DB 196,98,125,24,5,184,176,2,0 ; vbroadcastss 0x2b0b8(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,135,182,2,0 ; vbroadcastss 0x2b687(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -399,7 +404,7 @@ _sk_darken_hsw LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,60,176,2,0 ; vbroadcastss 0x2b03c(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,11,182,2,0 ; vbroadcastss 0x2b60b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -422,7 +427,7 @@ _sk_lighten_hsw LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,231,175,2,0 ; vbroadcastss 0x2afe7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,182,181,2,0 ; vbroadcastss 0x2b5b6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -448,7 +453,7 @@ _sk_difference_hsw LABEL PROC DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,134,175,2,0 ; vbroadcastss 0x2af86(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,85,181,2,0 ; vbroadcastss 0x2b555(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -468,7 +473,7 @@ _sk_exclusion_hsw LABEL PROC DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,64,175,2,0 ; vbroadcastss 0x2af40(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,15,181,2,0 ; vbroadcastss 0x2b50f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -476,7 +481,7 @@ _sk_exclusion_hsw LABEL PROC PUBLIC _sk_colorburn_hsw _sk_colorburn_hsw LABEL PROC - DB 196,98,125,24,5,42,175,2,0 ; vbroadcastss 0x2af2a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,249,180,2,0 ; vbroadcastss 0x2b4f9(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11 DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10 @@ -532,7 +537,7 @@ _sk_colorburn_hsw LABEL PROC PUBLIC _sk_colordodge_hsw _sk_colordodge_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,13,58,174,2,0 ; vbroadcastss 0x2ae3a(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,13,9,180,2,0 ; vbroadcastss 0x2b409(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9 @@ -583,7 +588,7 @@ _sk_colordodge_hsw LABEL PROC PUBLIC _sk_hardlight_hsw _sk_hardlight_hsw LABEL PROC - DB 196,98,125,24,5,84,173,2,0 ; vbroadcastss 0x2ad54(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,35,179,2,0 ; vbroadcastss 0x2b323(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -632,7 +637,7 @@ _sk_hardlight_hsw LABEL PROC PUBLIC _sk_overlay_hsw _sk_overlay_hsw LABEL PROC - DB 196,98,125,24,5,136,172,2,0 ; vbroadcastss 0x2ac88(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,87,178,2,0 ; vbroadcastss 0x2b257(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -692,10 +697,10 @@ _sk_softlight_hsw LABEL PROC DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8 DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8 DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,29,159,171,2,0 ; vbroadcastss 0x2ab9f(%rip),%ymm11 # 2b5a8 <_sk_overlay_sse2_8bit+0x487> + DB 196,98,125,24,29,110,177,2,0 ; vbroadcastss 0x2b16e(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487> DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12 DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8 - DB 196,98,125,24,37,144,171,2,0 ; vbroadcastss 0x2ab90(%rip),%ymm12 # 2b5ac <_sk_overlay_sse2_8bit+0x48b> + DB 196,98,125,24,37,95,177,2,0 ; vbroadcastss 0x2b15f(%rip),%ymm12 # 2bb98 <_sk_overlay_sse2_8bit+0x48b> DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8 DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14 DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14 @@ -705,7 +710,7 @@ _sk_softlight_hsw LABEL PROC DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15 DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14 DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15 - DB 196,98,125,24,5,63,171,2,0 ; vbroadcastss 0x2ab3f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,14,177,2,0 ; vbroadcastss 0x2b10e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13 DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0 DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -818,11 +823,11 @@ _sk_hue_hsw LABEL PROC DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10 DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10 DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - DB 196,98,125,24,53,82,169,2,0 ; vbroadcastss 0x2a952(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> - DB 196,98,125,24,61,77,169,2,0 ; vbroadcastss 0x2a94d(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,53,33,175,2,0 ; vbroadcastss 0x2af21(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,61,28,175,2,0 ; vbroadcastss 0x2af1c(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13 - DB 196,226,125,24,5,62,169,2,0 ; vbroadcastss 0x2a93e(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,226,125,24,5,13,175,2,0 ; vbroadcastss 0x2af0d(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13 DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10 DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -877,7 +882,7 @@ _sk_hue_hsw LABEL PROC DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9 DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8 - DB 196,226,125,24,13,255,167,2,0 ; vbroadcastss 0x2a7ff(%rip),%ymm1 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,13,206,173,2,0 ; vbroadcastss 0x2adce(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11 @@ -931,11 +936,11 @@ _sk_saturation_hsw LABEL PROC DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10 DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10 DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - DB 196,98,125,24,53,44,167,2,0 ; vbroadcastss 0x2a72c(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> - DB 196,98,125,24,61,39,167,2,0 ; vbroadcastss 0x2a727(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,53,251,172,2,0 ; vbroadcastss 0x2acfb(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,61,246,172,2,0 ; vbroadcastss 0x2acf6(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13 - DB 196,226,125,24,5,24,167,2,0 ; vbroadcastss 0x2a718(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,226,125,24,5,231,172,2,0 ; vbroadcastss 0x2ace7(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13 DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10 DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -990,7 +995,7 @@ _sk_saturation_hsw LABEL PROC DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9 DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8 - DB 196,226,125,24,13,217,165,2,0 ; vbroadcastss 0x2a5d9(%rip),%ymm1 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,13,168,171,2,0 ; vbroadcastss 0x2aba8(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11 @@ -1018,11 +1023,11 @@ _sk_color_hsw LABEL PROC DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8 DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10 DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11 - DB 196,98,125,24,45,136,165,2,0 ; vbroadcastss 0x2a588(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> - DB 196,98,125,24,53,131,165,2,0 ; vbroadcastss 0x2a583(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,45,87,171,2,0 ; vbroadcastss 0x2ab57(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,53,82,171,2,0 ; vbroadcastss 0x2ab52(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12 DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12 - DB 196,98,125,24,61,116,165,2,0 ; vbroadcastss 0x2a574(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,98,125,24,61,67,171,2,0 ; vbroadcastss 0x2ab43(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12 DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9 DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -1078,7 +1083,7 @@ _sk_color_hsw LABEL PROC DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1 DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8 DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9 - DB 196,226,125,24,5,42,164,2,0 ; vbroadcastss 0x2a42a(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,249,169,2,0 ; vbroadcastss 0x2a9f9(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -1106,11 +1111,11 @@ _sk_luminosity_hsw LABEL PROC DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10 DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11 - DB 196,98,125,24,45,217,163,2,0 ; vbroadcastss 0x2a3d9(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> - DB 196,98,125,24,53,212,163,2,0 ; vbroadcastss 0x2a3d4(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,45,168,169,2,0 ; vbroadcastss 0x2a9a8(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,53,163,169,2,0 ; vbroadcastss 0x2a9a3(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12 DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12 - DB 196,98,125,24,61,197,163,2,0 ; vbroadcastss 0x2a3c5(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,98,125,24,61,148,169,2,0 ; vbroadcastss 0x2a994(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12 DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9 DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -1166,7 +1171,7 @@ _sk_luminosity_hsw LABEL PROC DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1 DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8 DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9 - DB 196,226,125,24,5,123,162,2,0 ; vbroadcastss 0x2a27b(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,74,168,2,0 ; vbroadcastss 0x2a84a(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -1195,19 +1200,19 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,180,0,0,0 ; jne 142f <_sk_srcover_rgba_8888_hsw+0xd5> + DB 15,133,180,0,0,0 ; jne 144c <_sk_srcover_rgba_8888_hsw+0xd5> DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7 - DB 197,197,219,37,183,163,2,0 ; vpand 0x2a3b7(%rip),%ymm7,%ymm4 # 2b740 <_sk_overlay_sse2_8bit+0x61f> + DB 197,197,219,37,122,169,2,0 ; vpand 0x2a97a(%rip),%ymm7,%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0x613> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,69,0,45,202,163,2,0 ; vpshufb 0x2a3ca(%rip),%ymm7,%ymm5 # 2b760 <_sk_overlay_sse2_8bit+0x63f> + DB 196,226,69,0,45,141,169,2,0 ; vpshufb 0x2a98d(%rip),%ymm7,%ymm5 # 2bd40 <_sk_overlay_sse2_8bit+0x633> DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,69,0,53,221,163,2,0 ; vpshufb 0x2a3dd(%rip),%ymm7,%ymm6 # 2b780 <_sk_overlay_sse2_8bit+0x65f> + DB 196,226,69,0,53,160,169,2,0 ; vpshufb 0x2a9a0(%rip),%ymm7,%ymm6 # 2bd60 <_sk_overlay_sse2_8bit+0x653> DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,215,161,2,0 ; vbroadcastss 0x2a1d7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,166,167,2,0 ; vbroadcastss 0x2a7a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 - DB 196,98,125,24,13,246,161,2,0 ; vbroadcastss 0x2a1f6(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,13,197,167,2,0 ; vbroadcastss 0x2a7c5(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0 DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1 @@ -1227,7 +1232,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 196,65,53,235,202 ; vpor %ymm10,%ymm9,%ymm9 DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 1466 <_sk_srcover_rgba_8888_hsw+0x10c> + DB 117,66 ; jne 1483 <_sk_srcover_rgba_8888_hsw+0x10c> DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -1237,33 +1242,33 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,58,255,255,255 ; ja 1381 <_sk_srcover_rgba_8888_hsw+0x27> + DB 15,135,58,255,255,255 ; ja 139e <_sk_srcover_rgba_8888_hsw+0x27> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,254,0,0,0 ; lea 0xfe(%rip),%r11 # 1550 <_sk_srcover_rgba_8888_hsw+0x1f6> + DB 76,141,29,253,0,0,0 ; lea 0xfd(%rip),%r11 # 156c <_sk_srcover_rgba_8888_hsw+0x1f5> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7 - DB 233,27,255,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27> + DB 233,27,255,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27> DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,180 ; ja 142a <_sk_srcover_rgba_8888_hsw+0xd0> + DB 119,180 ; ja 1447 <_sk_srcover_rgba_8888_hsw+0xd0> DB 65,15,182,194 ; movzbl %r10b,%eax - DB 76,141,21,235,0,0,0 ; lea 0xeb(%rip),%r10 # 156c <_sk_srcover_rgba_8888_hsw+0x212> + DB 76,141,21,234,0,0,0 ; lea 0xea(%rip),%r10 # 1588 <_sk_srcover_rgba_8888_hsw+0x211> DB 73,99,4,130 ; movslq (%r10,%rax,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4) - DB 235,152 ; jmp 142a <_sk_srcover_rgba_8888_hsw+0xd0> + DB 235,152 ; jmp 1447 <_sk_srcover_rgba_8888_hsw+0xd0> DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4 DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7 DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4 DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7 - DB 233,200,254,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27> + DB 233,200,254,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27> DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4 DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 @@ -1276,10 +1281,10 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7 DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4 DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - DB 233,121,254,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27> + DB 233,121,254,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27> DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4) - DB 233,15,255,255,255 ; jmpq 142a <_sk_srcover_rgba_8888_hsw+0xd0> + DB 233,15,255,255,255 ; jmpq 1447 <_sk_srcover_rgba_8888_hsw+0xd0> DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 @@ -1287,35 +1292,33 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4) DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4) - DB 233,219,254,255,255 ; jmpq 142a <_sk_srcover_rgba_8888_hsw+0xd0> - DB 144 ; nop - DB 11,255 ; or %edi,%edi + DB 233,219,254,255,255 ; jmpq 1447 <_sk_srcover_rgba_8888_hsw+0xd0> + DB 12,255 ; or $0xff,%al DB 255 ; (bad) - DB 255,88,255 ; lcall *-0x1(%rax) + DB 255,89,255 ; lcall *-0x1(%rcx) DB 255 ; (bad) - DB 255,66,255 ; incl -0x1(%rdx) + DB 255,67,255 ; incl -0x1(%rbx) DB 255 ; (bad) - DB 255,167,255,255,255,147 ; jmpq *-0x6c000001(%rdi) + DB 255,168,255,255,255,148 ; ljmp *-0x6b000001(%rax) DB 255 ; (bad) DB 255 ; (bad) + DB 255,128,255,255,255,106 ; incl 0x6affffff(%rax) DB 255 ; (bad) - DB 127,255 ; jg 1565 <_sk_srcover_rgba_8888_hsw+0x20b> DB 255 ; (bad) - DB 255,105,255 ; ljmp *-0x1(%rcx) + DB 255,31 ; lcall *(%rdi) DB 255 ; (bad) - DB 255,30 ; lcall *(%rsi) DB 255 ; (bad) + DB 255,165,255,255,255,157 ; jmpq *-0x62000001(%rbp) DB 255 ; (bad) - DB 255,164,255,255,255,156,255 ; jmpq *-0x630001(%rdi,%rdi,8) DB 255 ; (bad) DB 255 ; (bad) - DB 216,255 ; fdivr %st(7),%st + DB 217,255 ; fcos DB 255 ; (bad) - DB 255,203 ; dec %ebx + DB 255,204 ; dec %esp DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 189,255,255,255,175 ; mov $0xafffffff,%ebp + DB 190,255,255,255,176 ; mov $0xb0ffffff,%esi DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -1332,7 +1335,7 @@ _sk_clamp_0_hsw LABEL PROC PUBLIC _sk_clamp_1_hsw _sk_clamp_1_hsw LABEL PROC - DB 196,98,125,24,5,226,159,2,0 ; vbroadcastss 0x29fe2(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,178,165,2,0 ; vbroadcastss 0x2a5b2(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 @@ -1342,7 +1345,7 @@ _sk_clamp_1_hsw LABEL PROC PUBLIC _sk_clamp_a_hsw _sk_clamp_a_hsw LABEL PROC - DB 196,98,125,24,5,193,159,2,0 ; vbroadcastss 0x29fc1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,145,165,2,0 ; vbroadcastss 0x2a591(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0 DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1 @@ -1352,7 +1355,7 @@ _sk_clamp_a_hsw LABEL PROC PUBLIC _sk_clamp_a_dst_hsw _sk_clamp_a_dst_hsw LABEL PROC - DB 196,98,125,24,5,163,159,2,0 ; vbroadcastss 0x29fa3(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,115,165,2,0 ; vbroadcastss 0x2a573(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7 DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4 DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5 @@ -1379,7 +1382,7 @@ _sk_swap_rb_hsw LABEL PROC PUBLIC _sk_invert_hsw _sk_invert_hsw LABEL PROC - DB 196,98,125,24,5,94,159,2,0 ; vbroadcastss 0x29f5e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,46,165,2,0 ; vbroadcastss 0x2a52e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0 DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 @@ -1425,7 +1428,7 @@ PUBLIC _sk_unpremul_hsw _sk_unpremul_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9 - DB 196,98,125,24,21,238,158,2,0 ; vbroadcastss 0x29eee(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,21,190,164,2,0 ; vbroadcastss 0x2a4be(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10 DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -1436,16 +1439,16 @@ _sk_unpremul_hsw LABEL PROC PUBLIC _sk_from_srgb_hsw _sk_from_srgb_hsw LABEL PROC - DB 196,98,125,24,5,251,158,2,0 ; vbroadcastss 0x29efb(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f> + DB 196,98,125,24,5,203,164,2,0 ; vbroadcastss 0x2a4cb(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10 - DB 196,98,125,24,29,237,158,2,0 ; vbroadcastss 0x29eed(%rip),%ymm11 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3> - DB 196,98,125,24,37,208,158,2,0 ; vbroadcastss 0x29ed0(%rip),%ymm12 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,29,189,164,2,0 ; vbroadcastss 0x2a4bd(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3> + DB 196,98,125,24,37,160,164,2,0 ; vbroadcastss 0x2a4a0(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13 - DB 196,98,125,24,53,213,158,2,0 ; vbroadcastss 0x29ed5(%rip),%ymm14 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7> + DB 196,98,125,24,53,165,164,2,0 ; vbroadcastss 0x2a4a5(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7> DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13 - DB 196,98,125,24,21,203,158,2,0 ; vbroadcastss 0x29ecb(%rip),%ymm10 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab> + DB 196,98,125,24,21,155,164,2,0 ; vbroadcastss 0x2a49b(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab> DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0 DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0 DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9 @@ -1466,16 +1469,16 @@ _sk_from_srgb_hsw LABEL PROC PUBLIC _sk_from_srgb_dst_hsw _sk_from_srgb_dst_hsw LABEL PROC - DB 196,98,125,24,5,99,158,2,0 ; vbroadcastss 0x29e63(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f> + DB 196,98,125,24,5,51,164,2,0 ; vbroadcastss 0x2a433(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f> DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9 DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10 - DB 196,98,125,24,29,85,158,2,0 ; vbroadcastss 0x29e55(%rip),%ymm11 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3> - DB 196,98,125,24,37,56,158,2,0 ; vbroadcastss 0x29e38(%rip),%ymm12 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,29,37,164,2,0 ; vbroadcastss 0x2a425(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3> + DB 196,98,125,24,37,8,164,2,0 ; vbroadcastss 0x2a408(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13 - DB 196,98,125,24,53,61,158,2,0 ; vbroadcastss 0x29e3d(%rip),%ymm14 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7> + DB 196,98,125,24,53,13,164,2,0 ; vbroadcastss 0x2a40d(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7> DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13 - DB 196,98,125,24,21,51,158,2,0 ; vbroadcastss 0x29e33(%rip),%ymm10 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab> + DB 196,98,125,24,21,3,164,2,0 ; vbroadcastss 0x2a403(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab> DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4 DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4 DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9 @@ -1497,19 +1500,19 @@ _sk_from_srgb_dst_hsw LABEL PROC PUBLIC _sk_to_srgb_hsw _sk_to_srgb_hsw LABEL PROC DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9 - DB 196,98,125,24,5,215,157,2,0 ; vbroadcastss 0x29dd7(%rip),%ymm8 # 2b5d0 <_sk_overlay_sse2_8bit+0x4af> + DB 196,98,125,24,5,167,163,2,0 ; vbroadcastss 0x2a3a7(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af> DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10 - DB 196,98,125,24,29,205,157,2,0 ; vbroadcastss 0x29dcd(%rip),%ymm11 # 2b5d4 <_sk_overlay_sse2_8bit+0x4b3> - DB 196,98,125,24,37,200,157,2,0 ; vbroadcastss 0x29dc8(%rip),%ymm12 # 2b5d8 <_sk_overlay_sse2_8bit+0x4b7> + DB 196,98,125,24,29,157,163,2,0 ; vbroadcastss 0x2a39d(%rip),%ymm11 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3> + DB 196,98,125,24,37,152,163,2,0 ; vbroadcastss 0x2a398(%rip),%ymm12 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13 - DB 196,98,125,24,53,185,157,2,0 ; vbroadcastss 0x29db9(%rip),%ymm14 # 2b5dc <_sk_overlay_sse2_8bit+0x4bb> + DB 196,98,125,24,53,137,163,2,0 ; vbroadcastss 0x2a389(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb> DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13 - DB 196,98,125,24,61,175,157,2,0 ; vbroadcastss 0x29daf(%rip),%ymm15 # 2b5e0 <_sk_overlay_sse2_8bit+0x4bf> + DB 196,98,125,24,61,127,163,2,0 ; vbroadcastss 0x2a37f(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf> DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9 DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9 DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9 - DB 196,98,125,24,45,155,157,2,0 ; vbroadcastss 0x29d9b(%rip),%ymm13 # 2b5e4 <_sk_overlay_sse2_8bit+0x4c3> + DB 196,98,125,24,45,107,163,2,0 ; vbroadcastss 0x2a36b(%rip),%ymm13 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3> DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9 @@ -1536,31 +1539,31 @@ _sk_to_srgb_hsw LABEL PROC PUBLIC _sk_rgb_to_hsl_hsw _sk_rgb_to_hsl_hsw LABEL PROC - DB 197,124,95,193 ; vmaxps %ymm1,%ymm0,%ymm8 - DB 197,60,95,194 ; vmaxps %ymm2,%ymm8,%ymm8 - DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9 - DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9 + DB 197,116,95,194 ; vmaxps %ymm2,%ymm1,%ymm8 + DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8 + DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9 + DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9 DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,29,184,156,2,0 ; vbroadcastss 0x29cb8(%rip),%ymm11 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,29,134,162,2,0 ; vbroadcastss 0x2a286(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11 DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12 DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13 - DB 196,98,125,24,53,249,156,2,0 ; vbroadcastss 0x29cf9(%rip),%ymm14 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7> + DB 196,98,125,24,53,199,162,2,0 ; vbroadcastss 0x2a2c7(%rip),%ymm14 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7> DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15 DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13 DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12 DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2 DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13 - DB 196,98,125,24,53,224,156,2,0 ; vbroadcastss 0x29ce0(%rip),%ymm14 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf> + DB 196,98,125,24,53,174,162,2,0 ; vbroadcastss 0x2a2ae(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf> DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13 - DB 196,98,125,24,53,206,156,2,0 ; vbroadcastss 0x29cce(%rip),%ymm14 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb> + DB 196,98,125,24,53,156,162,2,0 ; vbroadcastss 0x2a29c(%rip),%ymm14 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb> DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2 DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1 DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1 DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0 DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0 DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1 - DB 196,98,125,24,29,69,156,2,0 ; vbroadcastss 0x29c45(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,29,19,162,2,0 ; vbroadcastss 0x2a213(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2 DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11 DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12 @@ -1570,7 +1573,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0 DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - DB 196,98,125,24,5,116,156,2,0 ; vbroadcastss 0x29c74(%rip),%ymm8 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3> + DB 196,98,125,24,5,66,162,2,0 ; vbroadcastss 0x2a242(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -1585,30 +1588,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp) DB 197,252,40,233 ; vmovaps %ymm1,%ymm5 DB 197,252,40,224 ; vmovaps %ymm0,%ymm4 - DB 196,98,125,24,5,203,155,2,0 ; vbroadcastss 0x29bcb(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,153,161,2,0 ; vbroadcastss 0x2a199(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9 DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10 DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11 DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9 DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10 - DB 196,98,125,24,13,10,156,2,0 ; vbroadcastss 0x29c0a(%rip),%ymm9 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb> + DB 196,98,125,24,13,216,161,2,0 ; vbroadcastss 0x2a1d8(%rip),%ymm9 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb> DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9 - DB 196,98,125,24,29,8,156,2,0 ; vbroadcastss 0x29c08(%rip),%ymm11 # 2b5f8 <_sk_overlay_sse2_8bit+0x4d7> + DB 196,98,125,24,29,214,161,2,0 ; vbroadcastss 0x2a1d6(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7> DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11 DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12 DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15 DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11 - DB 196,98,125,24,45,218,155,2,0 ; vbroadcastss 0x29bda(%rip),%ymm13 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7> + DB 196,98,125,24,45,168,161,2,0 ; vbroadcastss 0x2a1a8(%rip),%ymm13 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7> DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0 - DB 196,98,125,24,53,212,155,2,0 ; vbroadcastss 0x29bd4(%rip),%ymm14 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf> + DB 196,98,125,24,53,162,161,2,0 ; vbroadcastss 0x2a1a2(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf> DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12 DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12 - DB 196,226,125,24,29,206,155,2,0 ; vbroadcastss 0x29bce(%rip),%ymm3 # 2b5fc <_sk_overlay_sse2_8bit+0x4db> + DB 196,226,125,24,29,156,161,2,0 ; vbroadcastss 0x2a19c(%rip),%ymm3 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db> DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7 DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7 DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12 DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - DB 196,98,125,24,37,165,155,2,0 ; vbroadcastss 0x29ba5(%rip),%ymm12 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3> + DB 196,98,125,24,37,115,161,2,0 ; vbroadcastss 0x2a173(%rip),%ymm12 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3> DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15 DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0 DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -1624,7 +1627,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0 DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7 DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - DB 196,226,125,24,5,89,155,2,0 ; vbroadcastss 0x29b59(%rip),%ymm0 # 2b600 <_sk_overlay_sse2_8bit+0x4df> + DB 196,226,125,24,5,39,161,2,0 ; vbroadcastss 0x2a127(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df> DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0 DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 @@ -1673,12 +1676,12 @@ _sk_scale_u8_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,59 ; jne 1b9e <_sk_scale_u8_hsw+0x54> + DB 117,59 ; jne 1bbc <_sk_scale_u8_hsw+0x54> DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8 - DB 197,57,219,5,191,163,2,0 ; vpand 0x2a3bf(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,57,219,5,129,169,2,0 ; vpand 0x2a981(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,128,154,2,0 ; vbroadcastss 0x29a80(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,13,78,160,2,0 ; vbroadcastss 0x2a04e(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -1692,15 +1695,15 @@ _sk_scale_u8_hsw LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,182 ; ja 1b69 <_sk_scale_u8_hsw+0x1f> + DB 119,182 ; ja 1b87 <_sk_scale_u8_hsw+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 1c38 <_sk_scale_u8_hsw+0xee> + DB 76,141,29,124,0,0,0 ; lea 0x7c(%rip),%r11 # 1c58 <_sk_scale_u8_hsw+0xf0> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 235,151 ; jmp 1b69 <_sk_scale_u8_hsw+0x1f> + DB 235,151 ; jmp 1b87 <_sk_scale_u8_hsw+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -1708,7 +1711,7 @@ _sk_scale_u8_hsw LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,110,255,255,255 ; jmpq 1b69 <_sk_scale_u8_hsw+0x1f> + DB 233,110,255,255,255 ; jmpq 1b87 <_sk_scale_u8_hsw+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -1719,22 +1722,111 @@ _sk_scale_u8_hsw LABEL PROC DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,50,255,255,255 ; jmpq 1b69 <_sk_scale_u8_hsw+0x1f> - DB 144 ; nop - DB 143 ; (bad) + DB 233,50,255,255,255 ; jmpq 1b87 <_sk_scale_u8_hsw+0x1f> + DB 15,31,0 ; nopl (%rax) + DB 141 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 255,170,255,255,255,154 ; ljmp *-0x65000001(%rdx) + DB 255,168,255,255,255,152 ; ljmp *-0x67000001(%rax) DB 255 ; (bad) DB 255 ; (bad) + DB 255,231 ; jmpq *%rdi DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf001c48 <_sk_overlay_sse2_8bit+0xffffffffdefd6b27> DB 255 ; (bad) DB 255 ; (bad) - DB 255,211 ; callq *%rbx + DB 220,255 ; fdivr %st,%st(7) DB 255 ; (bad) + DB 255,209 ; callq *%rcx + DB 255 ; (bad) + DB 255 ; (bad) + DB 255,193 ; inc %ecx + DB 255 ; (bad) + DB 255 ; (bad) + DB 255 ; .byte 0xff + +PUBLIC _sk_scale_565_hsw +_sk_scale_565_hsw LABEL PROC + DB 83 ; push %rbx + DB 72,173 ; lods %ds:(%rsi),%rax + DB 76,99,80,8 ; movslq 0x8(%rax),%r10 + DB 76,99,201 ; movslq %ecx,%r9 + DB 77,15,175,202 ; imul %r10,%r9 + DB 77,1,201 ; add %r9,%r9 + DB 76,3,8 ; add (%rax),%r9 + DB 72,99,218 ; movslq %edx,%rbx + DB 77,133,192 ; test %r8,%r8 + DB 15,133,162,0,0,0 ; jne 1d36 <_sk_scale_565_hsw+0xc2> + DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8 + DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 + DB 196,98,125,88,13,76,159,2,0 ; vpbroadcastd 0x29f4c(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9 + DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 + DB 196,98,125,24,21,61,159,2,0 ; vbroadcastss 0x29f3d(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> + DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 + DB 196,98,125,88,21,51,159,2,0 ; vpbroadcastd 0x29f33(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> + DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10 + DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 + DB 196,98,125,24,29,36,159,2,0 ; vbroadcastss 0x29f24(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 + DB 196,98,125,88,29,26,159,2,0 ; vpbroadcastd 0x29f1a(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8 + DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 + DB 196,98,125,24,29,11,159,2,0 ; vbroadcastss 0x29f0b(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> + DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 + DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11 + DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12 + DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12 + DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13 + DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13 + DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11 + DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 + DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1 + DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2 + DB 197,164,89,219 ; vmulps %ymm3,%ymm11,%ymm3 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 91 ; pop %rbx + DB 255,224 ; jmpq *%rax + DB 69,137,194 ; mov %r8d,%r10d + DB 65,128,226,7 ; and $0x7,%r10b + DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 + DB 65,254,202 ; dec %r10b + DB 65,128,250,6 ; cmp $0x6,%r10b + DB 15,135,75,255,255,255 ; ja 1c9a <_sk_scale_565_hsw+0x26> + DB 69,15,182,210 ; movzbl %r10b,%r10d + DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 1dc0 <_sk_scale_565_hsw+0x14c> + DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax + DB 76,1,216 ; add %r11,%rax + DB 255,224 ; jmpq *%rax + DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax + DB 197,121,110,192 ; vmovd %eax,%xmm8 + DB 233,41,255,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26> + DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 + DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9 + DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 + DB 233,11,255,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26> + DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 + DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9 + DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 + DB 233,221,254,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26> + DB 15,31,0 ; nopl (%rax) + DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff DB 255 ; (bad) - DB 255,195 ; inc %ebx + DB 255 ; (bad) + DB 255 ; (bad) + DB 236 ; in (%dx),%al + DB 255 ; (bad) + DB 255 ; (bad) + DB 255,228 ; jmpq *%rsp + DB 255 ; (bad) + DB 255 ; (bad) + DB 255 ; (bad) + DB 220,255 ; fdivr %st,%st(7) + DB 255 ; (bad) + DB 255,207 ; dec %edi DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -1764,12 +1856,12 @@ _sk_lerp_u8_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,79 ; jne 1ceb <_sk_lerp_u8_hsw+0x68> + DB 117,79 ; jne 1e73 <_sk_lerp_u8_hsw+0x68> DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8 - DB 197,57,219,5,134,162,2,0 ; vpand 0x2a286(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,57,219,5,222,166,2,0 ; vpand 0x2a6de(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,71,153,2,0 ; vbroadcastss 0x29947(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,13,171,157,2,0 ; vbroadcastss 0x29dab(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -1787,15 +1879,15 @@ _sk_lerp_u8_hsw LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,162 ; ja 1ca2 <_sk_lerp_u8_hsw+0x1f> + DB 119,162 ; ja 1e2a <_sk_lerp_u8_hsw+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 1d84 <_sk_lerp_u8_hsw+0x101> + DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 1f0c <_sk_lerp_u8_hsw+0x101> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 235,131 ; jmp 1ca2 <_sk_lerp_u8_hsw+0x1f> + DB 235,131 ; jmp 1e2a <_sk_lerp_u8_hsw+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -1803,7 +1895,7 @@ _sk_lerp_u8_hsw LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,90,255,255,255 ; jmpq 1ca2 <_sk_lerp_u8_hsw+0x1f> + DB 233,90,255,255,255 ; jmpq 1e2a <_sk_lerp_u8_hsw+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -1814,7 +1906,7 @@ _sk_lerp_u8_hsw LABEL PROC DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,30,255,255,255 ; jmpq 1ca2 <_sk_lerp_u8_hsw+0x1f> + DB 233,30,255,255,255 ; jmpq 1e2a <_sk_lerp_u8_hsw+0x1f> DB 144 ; nop DB 255 ; (bad) DB 255 ; (bad) @@ -1847,24 +1939,30 @@ _sk_lerp_565_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,170,0,0,0 ; jne 1e6a <_sk_lerp_565_hsw+0xca> + DB 15,133,182,0,0,0 ; jne 1ffe <_sk_lerp_565_hsw+0xd6> DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8 DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 - DB 196,98,125,88,13,52,152,2,0 ; vpbroadcastd 0x29834(%rip),%ymm9 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,98,125,88,13,152,156,2,0 ; vpbroadcastd 0x29c98(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9 DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 - DB 196,98,125,24,21,37,152,2,0 ; vbroadcastss 0x29825(%rip),%ymm10 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,98,125,24,21,137,156,2,0 ; vbroadcastss 0x29c89(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 - DB 196,98,125,88,21,27,152,2,0 ; vpbroadcastd 0x2981b(%rip),%ymm10 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,98,125,88,21,127,156,2,0 ; vpbroadcastd 0x29c7f(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10 DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 - DB 196,98,125,24,29,12,152,2,0 ; vbroadcastss 0x2980c(%rip),%ymm11 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,98,125,24,29,112,156,2,0 ; vbroadcastss 0x29c70(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 - DB 196,98,125,88,29,2,152,2,0 ; vpbroadcastd 0x29802(%rip),%ymm11 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,98,125,88,29,102,156,2,0 ; vpbroadcastd 0x29c66(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,29,243,151,2,0 ; vbroadcastss 0x297f3(%rip),%ymm11 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,98,125,24,29,87,156,2,0 ; vbroadcastss 0x29c57(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 + DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11 + DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12 + DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12 + DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13 + DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13 + DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0 DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1 @@ -1872,11 +1970,7 @@ _sk_lerp_565_hsw LABEL PROC DB 197,236,92,214 ; vsubps %ymm6,%ymm2,%ymm2 DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2 DB 197,228,92,223 ; vsubps %ymm7,%ymm3,%ymm3 - DB 196,98,101,168,207 ; vfmadd213ps %ymm7,%ymm3,%ymm9 - DB 196,98,101,168,215 ; vfmadd213ps %ymm7,%ymm3,%ymm10 - DB 196,98,101,168,199 ; vfmadd213ps %ymm7,%ymm3,%ymm8 - DB 196,193,44,95,216 ; vmaxps %ymm8,%ymm10,%ymm3 - DB 197,180,95,219 ; vmaxps %ymm3,%ymm9,%ymm3 + DB 196,226,37,168,223 ; vfmadd213ps %ymm7,%ymm11,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -1885,27 +1979,27 @@ _sk_lerp_565_hsw LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,67,255,255,255 ; ja 1dc6 <_sk_lerp_565_hsw+0x26> + DB 15,135,55,255,255,255 ; ja 1f4e <_sk_lerp_565_hsw+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 1ef4 <_sk_lerp_565_hsw+0x154> + DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 2088 <_sk_lerp_565_hsw+0x160> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 233,33,255,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26> + DB 233,21,255,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,3,255,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26> + DB 233,247,254,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,213,254,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26> + DB 233,201,254,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26> DB 15,31,0 ; nopl (%rax) DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff DB 255 ; (bad) @@ -1930,23 +2024,23 @@ _sk_load_tables_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 77,133,192 ; test %r8,%r8 - DB 117,103 ; jne 1f81 <_sk_load_tables_hsw+0x71> + DB 117,103 ; jne 2115 <_sk_load_tables_hsw+0x71> DB 196,193,126,111,28,145 ; vmovdqu (%r9,%rdx,4),%ymm3 - DB 197,229,219,13,120,152,2,0 ; vpand 0x29878(%rip),%ymm3,%ymm1 # 2b7a0 <_sk_overlay_sse2_8bit+0x67f> + DB 197,229,219,13,196,156,2,0 ; vpand 0x29cc4(%rip),%ymm3,%ymm1 # 2bd80 <_sk_overlay_sse2_8bit+0x673> DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8 DB 76,139,72,8 ; mov 0x8(%rax),%r9 DB 76,139,80,16 ; mov 0x10(%rax),%r10 DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2 DB 196,194,109,146,4,137 ; vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0 - DB 196,226,101,0,21,120,152,2,0 ; vpshufb 0x29878(%rip),%ymm3,%ymm2 # 2b7c0 <_sk_overlay_sse2_8bit+0x69f> + DB 196,226,101,0,21,196,156,2,0 ; vpshufb 0x29cc4(%rip),%ymm3,%ymm2 # 2bda0 <_sk_overlay_sse2_8bit+0x693> DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9 DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1 DB 72,139,64,24 ; mov 0x18(%rax),%rax - DB 196,98,101,0,13,128,152,2,0 ; vpshufb 0x29880(%rip),%ymm3,%ymm9 # 2b7e0 <_sk_overlay_sse2_8bit+0x6bf> + DB 196,98,101,0,13,204,156,2,0 ; vpshufb 0x29ccc(%rip),%ymm3,%ymm9 # 2bdc0 <_sk_overlay_sse2_8bit+0x6b3> DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,140,150,2,0 ; vbroadcastss 0x2968c(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,228,154,2,0 ; vbroadcastss 0x29ae4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -1955,21 +2049,21 @@ _sk_load_tables_hsw LABEL PROC DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,139 ; ja 1f20 <_sk_load_tables_hsw+0x10> + DB 119,139 ; ja 20b4 <_sk_load_tables_hsw+0x10> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,140,0,0,0 ; lea 0x8c(%rip),%r11 # 202c <_sk_load_tables_hsw+0x11c> + DB 76,141,29,140,0,0,0 ; lea 0x8c(%rip),%r11 # 21c0 <_sk_load_tables_hsw+0x11c> DB 79,99,20,147 ; movslq (%r11,%r10,4),%r10 DB 77,1,218 ; add %r11,%r10 DB 65,255,226 ; jmpq *%r10 DB 196,193,121,110,28,145 ; vmovd (%r9,%rdx,4),%xmm3 - DB 233,107,255,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10> + DB 233,107,255,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10> DB 196,193,121,110,68,145,8 ; vmovd 0x8(%r9,%rdx,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3 DB 196,193,122,126,4,145 ; vmovq (%r9,%rdx,4),%xmm0 DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3 - DB 233,68,255,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10> + DB 233,68,255,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10> DB 196,193,121,110,68,145,24 ; vmovd 0x18(%r9,%rdx,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -1982,9 +2076,9 @@ _sk_load_tables_hsw LABEL PROC DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3 DB 196,193,122,111,4,145 ; vmovdqu (%r9,%rdx,4),%xmm0 DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - DB 233,245,254,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10> + DB 233,245,254,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10> DB 144 ; nop - DB 126,255 ; jle 202d <_sk_load_tables_hsw+0x11d> + DB 126,255 ; jle 21c1 <_sk_load_tables_hsw+0x11d> DB 255 ; (bad) DB 255,159,255,255,255,137 ; lcall *-0x76000001(%rdi) DB 255 ; (bad) @@ -2010,7 +2104,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,201,0,0,0 ; jne 2127 <_sk_load_tables_u16_be_hsw+0xdf> + DB 15,133,201,0,0,0 ; jne 22bb <_sk_load_tables_u16_be_hsw+0xdf> DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8 DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2 DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -2026,7 +2120,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1 DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2 DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8 - DB 197,121,111,21,129,158,2,0 ; vmovdqa 0x29e81(%rip),%xmm10 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,121,111,21,205,162,2,0 ; vmovdqa 0x2a2cd(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0 DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1 DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -2048,36 +2142,36 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3 DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,2,149,2,0 ; vbroadcastss 0x29502(%rip),%ymm8 # 2b620 <_sk_overlay_sse2_8bit+0x4ff> + DB 196,98,125,24,5,90,153,2,0 ; vbroadcastss 0x2995a(%rip),%ymm8 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 218d <_sk_load_tables_u16_be_hsw+0x145> + DB 116,85 ; je 2321 <_sk_load_tables_u16_be_hsw+0x145> DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 218d <_sk_load_tables_u16_be_hsw+0x145> + DB 114,72 ; jb 2321 <_sk_load_tables_u16_be_hsw+0x145> DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 219a <_sk_load_tables_u16_be_hsw+0x152> + DB 116,72 ; je 232e <_sk_load_tables_u16_be_hsw+0x152> DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 219a <_sk_load_tables_u16_be_hsw+0x152> + DB 114,59 ; jb 232e <_sk_load_tables_u16_be_hsw+0x152> DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,9,255,255,255 ; je 2079 <_sk_load_tables_u16_be_hsw+0x31> + DB 15,132,9,255,255,255 ; je 220d <_sk_load_tables_u16_be_hsw+0x31> DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,248,254,255,255 ; jb 2079 <_sk_load_tables_u16_be_hsw+0x31> + DB 15,130,248,254,255,255 ; jb 220d <_sk_load_tables_u16_be_hsw+0x31> DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9 - DB 233,236,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31> + DB 233,236,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,223,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31> + DB 233,223,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,214,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31> + DB 233,214,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31> PUBLIC _sk_load_tables_rgb_u16_be_hsw _sk_load_tables_rgb_u16_be_hsw LABEL PROC @@ -2085,7 +2179,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,193,0,0,0 ; jne 2276 <_sk_load_tables_rgb_u16_be_hsw+0xd3> + DB 15,133,193,0,0,0 ; jne 240a <_sk_load_tables_rgb_u16_be_hsw+0xd3> DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0 DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2 DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -2106,7 +2200,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3 DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2 DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8 - DB 197,121,111,13,17,157,2,0 ; vmovdqa 0x29d11(%rip),%xmm9 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,121,111,13,93,161,2,0 ; vmovdqa 0x2a15d(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0 DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1 DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -2123,46 +2217,46 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8 DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,28,147,2,0 ; vbroadcastss 0x2931c(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,116,151,2,0 ; vbroadcastss 0x29774(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 255,224 ; jmpq *%rax DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0 DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne 228f <_sk_load_tables_rgb_u16_be_hsw+0xec> - DB 233,90,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 117,5 ; jne 2423 <_sk_load_tables_rgb_u16_be_hsw+0xec> + DB 233,90,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46> DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1 DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb 22be <_sk_load_tables_rgb_u16_be_hsw+0x11b> + DB 114,26 ; jb 2452 <_sk_load_tables_rgb_u16_be_hsw+0x11b> DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1 DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne 22c3 <_sk_load_tables_rgb_u16_be_hsw+0x120> - DB 233,43,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46> - DB 233,38,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 117,10 ; jne 2457 <_sk_load_tables_rgb_u16_be_hsw+0x120> + DB 233,43,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,38,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46> DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1 DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb 22f2 <_sk_load_tables_rgb_u16_be_hsw+0x14f> + DB 114,26 ; jb 2486 <_sk_load_tables_rgb_u16_be_hsw+0x14f> DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1 DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne 22f7 <_sk_load_tables_rgb_u16_be_hsw+0x154> - DB 233,247,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46> - DB 233,242,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 117,10 ; jne 248b <_sk_load_tables_rgb_u16_be_hsw+0x154> + DB 233,247,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,242,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46> DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3 DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb 2320 <_sk_load_tables_rgb_u16_be_hsw+0x17d> + DB 114,20 ; jb 24b4 <_sk_load_tables_rgb_u16_be_hsw+0x17d> DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3 DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - DB 233,201,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46> - DB 233,196,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,201,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,196,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46> PUBLIC _sk_byte_tables_hsw _sk_byte_tables_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,140,146,2,0 ; vbroadcastss 0x2928c(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,228,150,2,0 ; vbroadcastss 0x296e4(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9 DB 196,65,249,126,201 ; vmovq %xmm9,%r9 @@ -2284,7 +2378,7 @@ _sk_byte_tables_hsw LABEL PROC DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,117,144,2,0 ; vbroadcastss 0x29075(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,205,148,2,0 ; vbroadcastss 0x294cd(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 @@ -2398,7 +2492,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,93,142,2,0 ; vbroadcastss 0x28e5d(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,181,146,2,0 ; vbroadcastss 0x292b5(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 @@ -2487,33 +2581,33 @@ _sk_parametric_r_hsw LABEL PROC DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10 DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,83,141,2,0 ; vbroadcastss 0x28d53(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> - DB 196,98,125,24,45,78,141,2,0 ; vbroadcastss 0x28d4e(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,171,145,2,0 ; vbroadcastss 0x291ab(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,45,166,145,2,0 ; vbroadcastss 0x291a6(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,164,140,2,0 ; vbroadcastss 0x28ca4(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,45,252,144,2,0 ; vbroadcastss 0x290fc(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,54,141,2,0 ; vbroadcastss 0x28d36(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,45,142,145,2,0 ; vbroadcastss 0x2918e(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,44,141,2,0 ; vbroadcastss 0x28d2c(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,29,132,145,2,0 ; vbroadcastss 0x29184(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,34,141,2,0 ; vbroadcastss 0x28d22(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,122,145,2,0 ; vbroadcastss 0x2917a(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,24,141,2,0 ; vbroadcastss 0x28d18(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,112,145,2,0 ; vbroadcastss 0x29170(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,249,140,2,0 ; vbroadcastss 0x28cf9(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,81,145,2,0 ; vbroadcastss 0x29151(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,239,140,2,0 ; vbroadcastss 0x28cef(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,71,145,2,0 ; vbroadcastss 0x29147(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11 - DB 196,226,125,24,5,229,140,2,0 ; vbroadcastss 0x28ce5(%rip),%ymm0 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,226,125,24,5,61,145,2,0 ; vbroadcastss 0x2913d(%rip),%ymm0 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0 - DB 196,98,125,24,21,219,140,2,0 ; vbroadcastss 0x28cdb(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,21,51,145,2,0 ; vbroadcastss 0x29133(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0 DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,21,206,140,2,0 ; vbroadcastss 0x28cce(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,38,145,2,0 ; vbroadcastss 0x29126(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2521,7 +2615,7 @@ _sk_parametric_r_hsw LABEL PROC DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,229,139,2,0 ; vbroadcastss 0x28be5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,61,144,2,0 ; vbroadcastss 0x2903d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2539,33 +2633,33 @@ _sk_parametric_g_hsw LABEL PROC DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10 DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,45,140,2,0 ; vbroadcastss 0x28c2d(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> - DB 196,98,125,24,45,40,140,2,0 ; vbroadcastss 0x28c28(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,133,144,2,0 ; vbroadcastss 0x29085(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,45,128,144,2,0 ; vbroadcastss 0x29080(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,126,139,2,0 ; vbroadcastss 0x28b7e(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,45,214,143,2,0 ; vbroadcastss 0x28fd6(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,16,140,2,0 ; vbroadcastss 0x28c10(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,45,104,144,2,0 ; vbroadcastss 0x29068(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,6,140,2,0 ; vbroadcastss 0x28c06(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,29,94,144,2,0 ; vbroadcastss 0x2905e(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,252,139,2,0 ; vbroadcastss 0x28bfc(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,84,144,2,0 ; vbroadcastss 0x29054(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,242,139,2,0 ; vbroadcastss 0x28bf2(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,74,144,2,0 ; vbroadcastss 0x2904a(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10 DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10 - DB 196,98,125,24,29,211,139,2,0 ; vbroadcastss 0x28bd3(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,43,144,2,0 ; vbroadcastss 0x2902b(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,201,139,2,0 ; vbroadcastss 0x28bc9(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,33,144,2,0 ; vbroadcastss 0x29021(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11 - DB 196,226,125,24,13,191,139,2,0 ; vbroadcastss 0x28bbf(%rip),%ymm1 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,226,125,24,13,23,144,2,0 ; vbroadcastss 0x29017(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1 - DB 196,98,125,24,21,181,139,2,0 ; vbroadcastss 0x28bb5(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,21,13,144,2,0 ; vbroadcastss 0x2900d(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1 - DB 196,98,125,24,21,168,139,2,0 ; vbroadcastss 0x28ba8(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,0,144,2,0 ; vbroadcastss 0x29000(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2573,7 +2667,7 @@ _sk_parametric_g_hsw LABEL PROC DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,5,191,138,2,0 ; vbroadcastss 0x28abf(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,23,143,2,0 ; vbroadcastss 0x28f17(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2591,33 +2685,33 @@ _sk_parametric_b_hsw LABEL PROC DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10 DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,7,139,2,0 ; vbroadcastss 0x28b07(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> - DB 196,98,125,24,45,2,139,2,0 ; vbroadcastss 0x28b02(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,95,143,2,0 ; vbroadcastss 0x28f5f(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,45,90,143,2,0 ; vbroadcastss 0x28f5a(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,88,138,2,0 ; vbroadcastss 0x28a58(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,45,176,142,2,0 ; vbroadcastss 0x28eb0(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,234,138,2,0 ; vbroadcastss 0x28aea(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,45,66,143,2,0 ; vbroadcastss 0x28f42(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,224,138,2,0 ; vbroadcastss 0x28ae0(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,29,56,143,2,0 ; vbroadcastss 0x28f38(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,214,138,2,0 ; vbroadcastss 0x28ad6(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,46,143,2,0 ; vbroadcastss 0x28f2e(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,204,138,2,0 ; vbroadcastss 0x28acc(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,36,143,2,0 ; vbroadcastss 0x28f24(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10 DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10 - DB 196,98,125,24,29,173,138,2,0 ; vbroadcastss 0x28aad(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,5,143,2,0 ; vbroadcastss 0x28f05(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,163,138,2,0 ; vbroadcastss 0x28aa3(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,251,142,2,0 ; vbroadcastss 0x28efb(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11 - DB 196,226,125,24,21,153,138,2,0 ; vbroadcastss 0x28a99(%rip),%ymm2 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,226,125,24,21,241,142,2,0 ; vbroadcastss 0x28ef1(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2 - DB 196,98,125,24,21,143,138,2,0 ; vbroadcastss 0x28a8f(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,21,231,142,2,0 ; vbroadcastss 0x28ee7(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2 DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2 - DB 196,98,125,24,21,130,138,2,0 ; vbroadcastss 0x28a82(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,218,142,2,0 ; vbroadcastss 0x28eda(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2625,7 +2719,7 @@ _sk_parametric_b_hsw LABEL PROC DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,153,137,2,0 ; vbroadcastss 0x28999(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,241,141,2,0 ; vbroadcastss 0x28df1(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2643,33 +2737,33 @@ _sk_parametric_a_hsw LABEL PROC DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10 DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,225,137,2,0 ; vbroadcastss 0x289e1(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> - DB 196,98,125,24,45,220,137,2,0 ; vbroadcastss 0x289dc(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,57,142,2,0 ; vbroadcastss 0x28e39(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,45,52,142,2,0 ; vbroadcastss 0x28e34(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,50,137,2,0 ; vbroadcastss 0x28932(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,45,138,141,2,0 ; vbroadcastss 0x28d8a(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,196,137,2,0 ; vbroadcastss 0x289c4(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,45,28,142,2,0 ; vbroadcastss 0x28e1c(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,186,137,2,0 ; vbroadcastss 0x289ba(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,29,18,142,2,0 ; vbroadcastss 0x28e12(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,176,137,2,0 ; vbroadcastss 0x289b0(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,8,142,2,0 ; vbroadcastss 0x28e08(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,166,137,2,0 ; vbroadcastss 0x289a6(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,254,141,2,0 ; vbroadcastss 0x28dfe(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10 DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10 - DB 196,98,125,24,29,135,137,2,0 ; vbroadcastss 0x28987(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,223,141,2,0 ; vbroadcastss 0x28ddf(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,125,137,2,0 ; vbroadcastss 0x2897d(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,213,141,2,0 ; vbroadcastss 0x28dd5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11 - DB 196,226,125,24,29,115,137,2,0 ; vbroadcastss 0x28973(%rip),%ymm3 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,226,125,24,29,203,141,2,0 ; vbroadcastss 0x28dcb(%rip),%ymm3 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3 - DB 196,98,125,24,21,105,137,2,0 ; vbroadcastss 0x28969(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,21,193,141,2,0 ; vbroadcastss 0x28dc1(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3 DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3 - DB 196,98,125,24,21,92,137,2,0 ; vbroadcastss 0x2895c(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,180,141,2,0 ; vbroadcastss 0x28db4(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2677,7 +2771,7 @@ _sk_parametric_a_hsw LABEL PROC DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3 - DB 196,98,125,24,5,115,136,2,0 ; vbroadcastss 0x28873(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,203,140,2,0 ; vbroadcastss 0x28ccb(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2694,35 +2788,35 @@ _sk_gamma_hsw LABEL PROC DB 197,252,40,241 ; vmovaps %ymm1,%ymm6 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10 - DB 196,98,125,24,29,192,136,2,0 ; vbroadcastss 0x288c0(%rip),%ymm11 # 2b624 <_sk_overlay_sse2_8bit+0x503> - DB 196,226,125,24,45,187,136,2,0 ; vbroadcastss 0x288bb(%rip),%ymm5 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,29,24,141,2,0 ; vbroadcastss 0x28d18(%rip),%ymm11 # 2bc10 <_sk_overlay_sse2_8bit+0x503> + DB 196,226,125,24,45,19,141,2,0 ; vbroadcastss 0x28d13(%rip),%ymm5 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9 - DB 196,226,125,24,37,18,136,2,0 ; vbroadcastss 0x28812(%rip),%ymm4 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,37,106,140,2,0 ; vbroadcastss 0x28c6a(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12 - DB 196,98,125,24,45,165,136,2,0 ; vbroadcastss 0x288a5(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,45,253,140,2,0 ; vbroadcastss 0x28cfd(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10 - DB 196,98,125,24,13,155,136,2,0 ; vbroadcastss 0x2889b(%rip),%ymm9 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,13,243,140,2,0 ; vbroadcastss 0x28cf3(%rip),%ymm9 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10 DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14 DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14 DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15 DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15 - DB 196,98,125,24,29,127,136,2,0 ; vbroadcastss 0x2887f(%rip),%ymm11 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,29,215,140,2,0 ; vbroadcastss 0x28cd7(%rip),%ymm11 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12 - DB 196,98,125,24,45,117,136,2,0 ; vbroadcastss 0x28875(%rip),%ymm13 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,45,205,140,2,0 ; vbroadcastss 0x28ccd(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12 DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10 DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12 DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10 DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8 DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8 - DB 196,226,125,24,21,81,136,2,0 ; vbroadcastss 0x28851(%rip),%ymm2 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,226,125,24,21,169,140,2,0 ; vbroadcastss 0x28ca9(%rip),%ymm2 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10 - DB 196,226,125,24,29,72,136,2,0 ; vbroadcastss 0x28848(%rip),%ymm3 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,226,125,24,29,160,140,2,0 ; vbroadcastss 0x28ca0(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10 - DB 196,226,125,24,13,62,136,2,0 ; vbroadcastss 0x2883e(%rip),%ymm1 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,226,125,24,13,150,140,2,0 ; vbroadcastss 0x28c96(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8 - DB 196,226,125,24,5,52,136,2,0 ; vbroadcastss 0x28834(%rip),%ymm0 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,226,125,24,5,140,140,2,0 ; vbroadcastss 0x28c8c(%rip),%ymm0 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8 DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8 DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6 @@ -2753,7 +2847,7 @@ _sk_gamma_hsw LABEL PROC DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1 DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0 DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0 - DB 196,226,125,24,13,165,135,2,0 ; vbroadcastss 0x287a5(%rip),%ymm1 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,226,125,24,13,253,139,2,0 ; vbroadcastss 0x28bfd(%rip),%ymm1 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2 DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3 DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4 @@ -2771,26 +2865,26 @@ _sk_gamma_hsw LABEL PROC PUBLIC _sk_lab_to_xyz_hsw _sk_lab_to_xyz_hsw LABEL PROC - DB 196,98,125,24,5,93,135,2,0 ; vbroadcastss 0x2875d(%rip),%ymm8 # 2b650 <_sk_overlay_sse2_8bit+0x52f> - DB 196,98,125,24,13,192,134,2,0 ; vbroadcastss 0x286c0(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> - DB 196,98,125,24,21,79,135,2,0 ; vbroadcastss 0x2874f(%rip),%ymm10 # 2b654 <_sk_overlay_sse2_8bit+0x533> + DB 196,98,125,24,5,181,139,2,0 ; vbroadcastss 0x28bb5(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f> + DB 196,98,125,24,13,24,139,2,0 ; vbroadcastss 0x28b18(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,21,167,139,2,0 ; vbroadcastss 0x28ba7(%rip),%ymm10 # 2bc40 <_sk_overlay_sse2_8bit+0x533> DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1 DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2 - DB 196,98,125,24,13,64,135,2,0 ; vbroadcastss 0x28740(%rip),%ymm9 # 2b658 <_sk_overlay_sse2_8bit+0x537> + DB 196,98,125,24,13,152,139,2,0 ; vbroadcastss 0x28b98(%rip),%ymm9 # 2bc44 <_sk_overlay_sse2_8bit+0x537> DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9 - DB 196,226,125,24,5,54,135,2,0 ; vbroadcastss 0x28736(%rip),%ymm0 # 2b65c <_sk_overlay_sse2_8bit+0x53b> + DB 196,226,125,24,5,142,139,2,0 ; vbroadcastss 0x28b8e(%rip),%ymm0 # 2bc48 <_sk_overlay_sse2_8bit+0x53b> DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 - DB 196,98,125,24,5,45,135,2,0 ; vbroadcastss 0x2872d(%rip),%ymm8 # 2b660 <_sk_overlay_sse2_8bit+0x53f> + DB 196,98,125,24,5,133,139,2,0 ; vbroadcastss 0x28b85(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f> DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8 - DB 196,98,125,24,13,35,135,2,0 ; vbroadcastss 0x28723(%rip),%ymm9 # 2b664 <_sk_overlay_sse2_8bit+0x543> + DB 196,98,125,24,13,123,139,2,0 ; vbroadcastss 0x28b7b(%rip),%ymm9 # 2bc50 <_sk_overlay_sse2_8bit+0x543> DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9 DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 - DB 196,226,125,24,21,16,135,2,0 ; vbroadcastss 0x28710(%rip),%ymm2 # 2b668 <_sk_overlay_sse2_8bit+0x547> + DB 196,226,125,24,21,104,139,2,0 ; vbroadcastss 0x28b68(%rip),%ymm2 # 2bc54 <_sk_overlay_sse2_8bit+0x547> DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10 - DB 196,98,125,24,29,6,135,2,0 ; vbroadcastss 0x28706(%rip),%ymm11 # 2b66c <_sk_overlay_sse2_8bit+0x54b> + DB 196,98,125,24,29,94,139,2,0 ; vbroadcastss 0x28b5e(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b> DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8 - DB 196,98,125,24,37,252,134,2,0 ; vbroadcastss 0x286fc(%rip),%ymm12 # 2b670 <_sk_overlay_sse2_8bit+0x54f> + DB 196,98,125,24,37,84,139,2,0 ; vbroadcastss 0x28b54(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f> DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8 DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8 DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1 @@ -2805,9 +2899,9 @@ _sk_lab_to_xyz_hsw LABEL PROC DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9 DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9 DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - DB 196,226,125,24,5,177,134,2,0 ; vbroadcastss 0x286b1(%rip),%ymm0 # 2b674 <_sk_overlay_sse2_8bit+0x553> + DB 196,226,125,24,5,9,139,2,0 ; vbroadcastss 0x28b09(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553> DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,168,134,2,0 ; vbroadcastss 0x286a8(%rip),%ymm8 # 2b678 <_sk_overlay_sse2_8bit+0x557> + DB 196,98,125,24,5,0,139,2,0 ; vbroadcastss 0x28b00(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2822,12 +2916,12 @@ _sk_load_a8_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,53 ; jne 3027 <_sk_load_a8_hsw+0x4e> + DB 117,53 ; jne 31bb <_sk_load_a8_hsw+0x4e> DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0 - DB 197,249,219,5,48,143,2,0 ; vpand 0x28f30(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,249,219,5,124,147,2,0 ; vpand 0x2937c(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,242,133,2,0 ; vbroadcastss 0x285f2(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,74,138,2,0 ; vbroadcastss 0x28a4a(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -2840,15 +2934,15 @@ _sk_load_a8_hsw LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,189 ; ja 2ff8 <_sk_load_a8_hsw+0x1f> + DB 119,189 ; ja 318c <_sk_load_a8_hsw+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 30c0 <_sk_load_a8_hsw+0xe7> + DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3254 <_sk_load_a8_hsw+0xe7> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,158 ; jmp 2ff8 <_sk_load_a8_hsw+0x1f> + DB 235,158 ; jmp 318c <_sk_load_a8_hsw+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -2856,7 +2950,7 @@ _sk_load_a8_hsw LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,118,255,255,255 ; jmpq 2ff8 <_sk_load_a8_hsw+0x1f> + DB 233,118,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -2867,7 +2961,7 @@ _sk_load_a8_hsw LABEL PROC DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,59,255,255,255 ; jmpq 2ff8 <_sk_load_a8_hsw+0x1f> + DB 233,59,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f> DB 15,31,0 ; nopl (%rax) DB 143 ; (bad) DB 255 ; (bad) @@ -2899,12 +2993,12 @@ _sk_load_a8_dst_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,53 ; jne 312a <_sk_load_a8_dst_hsw+0x4e> + DB 117,53 ; jne 32be <_sk_load_a8_dst_hsw+0x4e> DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4 - DB 197,217,219,37,45,142,2,0 ; vpand 0x28e2d(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,217,219,37,121,146,2,0 ; vpand 0x29279(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,239,132,2,0 ; vbroadcastss 0x284ef(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,45,71,137,2,0 ; vbroadcastss 0x28947(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 @@ -2917,15 +3011,15 @@ _sk_load_a8_dst_hsw LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,189 ; ja 30fb <_sk_load_a8_dst_hsw+0x1f> + DB 119,189 ; ja 328f <_sk_load_a8_dst_hsw+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 31c0 <_sk_load_a8_dst_hsw+0xe4> + DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 3354 <_sk_load_a8_dst_hsw+0xe4> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 235,158 ; jmp 30fb <_sk_load_a8_dst_hsw+0x1f> + DB 235,158 ; jmp 328f <_sk_load_a8_dst_hsw+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -2933,7 +3027,7 @@ _sk_load_a8_dst_hsw LABEL PROC DB 197,249,110,232 ; vmovd %eax,%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4 - DB 233,118,255,255,255 ; jmpq 30fb <_sk_load_a8_dst_hsw+0x1f> + DB 233,118,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -2944,7 +3038,7 @@ _sk_load_a8_dst_hsw LABEL PROC DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4 - DB 233,59,255,255,255 ; jmpq 30fb <_sk_load_a8_dst_hsw+0x1f> + DB 233,59,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f> DB 146 ; xchg %eax,%edx DB 255 ; (bad) DB 255 ; (bad) @@ -3003,7 +3097,7 @@ _sk_gather_a8_hsw LABEL PROC DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,114,131,2,0 ; vbroadcastss 0x28372(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,202,135,2,0 ; vbroadcastss 0x287ca(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -3020,14 +3114,14 @@ _sk_store_a8_hsw LABEL PROC DB 77,15,175,202 ; imul %r10,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,249,130,2,0 ; vbroadcastss 0x282f9(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,81,135,2,0 ; vbroadcastss 0x28751(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8 DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8 DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne 32ed <_sk_store_a8_hsw+0x47> + DB 117,11 ; jne 3481 <_sk_store_a8_hsw+0x47> DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -3036,25 +3130,25 @@ _sk_store_a8_hsw LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja 32e8 <_sk_store_a8_hsw+0x42> + DB 119,235 ; ja 347c <_sk_store_a8_hsw+0x42> DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8 DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 3364 <_sk_store_a8_hsw+0xbe> + DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 34f8 <_sk_store_a8_hsw+0xbe> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1) - DB 235,201 ; jmp 32e8 <_sk_store_a8_hsw+0x42> + DB 235,201 ; jmp 347c <_sk_store_a8_hsw+0x42> DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1) - DB 196,98,57,0,5,16,140,2,0 ; vpshufb 0x28c10(%rip),%xmm8,%xmm8 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f> + DB 196,98,57,0,5,92,144,2,0 ; vpshufb 0x2905c(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13> DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1) - DB 235,175 ; jmp 32e8 <_sk_store_a8_hsw+0x42> + DB 235,175 ; jmp 347c <_sk_store_a8_hsw+0x42> DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1) DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1) DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1) - DB 196,98,57,0,5,246,139,2,0 ; vpshufb 0x28bf6(%rip),%xmm8,%xmm8 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f> + DB 196,98,57,0,5,66,144,2,0 ; vpshufb 0x29042(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23> DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1) - DB 235,134 ; jmp 32e8 <_sk_store_a8_hsw+0x42> + DB 235,134 ; jmp 347c <_sk_store_a8_hsw+0x42> DB 102,144 ; xchg %ax,%ax DB 178,255 ; mov $0xff,%dl DB 255 ; (bad) @@ -3086,15 +3180,15 @@ _sk_load_g8_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,58 ; jne 33d3 <_sk_load_g8_hsw+0x53> + DB 117,58 ; jne 3567 <_sk_load_g8_hsw+0x53> DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0 - DB 197,249,219,5,137,139,2,0 ; vpand 0x28b89(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,249,219,5,213,143,2,0 ; vpand 0x28fd5(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,75,130,2,0 ; vbroadcastss 0x2824b(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,163,134,2,0 ; vbroadcastss 0x286a3(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,200,129,2,0 ; vbroadcastss 0x281c8(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,32,134,2,0 ; vbroadcastss 0x28620(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 91 ; pop %rbx @@ -3104,15 +3198,15 @@ _sk_load_g8_hsw LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,184 ; ja 339f <_sk_load_g8_hsw+0x1f> + DB 119,184 ; ja 3533 <_sk_load_g8_hsw+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 346c <_sk_load_g8_hsw+0xec> + DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3600 <_sk_load_g8_hsw+0xec> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,153 ; jmp 339f <_sk_load_g8_hsw+0x1f> + DB 235,153 ; jmp 3533 <_sk_load_g8_hsw+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -3120,7 +3214,7 @@ _sk_load_g8_hsw LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,113,255,255,255 ; jmpq 339f <_sk_load_g8_hsw+0x1f> + DB 233,113,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -3131,7 +3225,7 @@ _sk_load_g8_hsw LABEL PROC DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,54,255,255,255 ; jmpq 339f <_sk_load_g8_hsw+0x1f> + DB 233,54,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f> DB 15,31,0 ; nopl (%rax) DB 143 ; (bad) DB 255 ; (bad) @@ -3163,15 +3257,15 @@ _sk_load_g8_dst_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,58 ; jne 34db <_sk_load_g8_dst_hsw+0x53> + DB 117,58 ; jne 366f <_sk_load_g8_dst_hsw+0x53> DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4 - DB 197,217,219,37,129,138,2,0 ; vpand 0x28a81(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,217,219,37,205,142,2,0 ; vpand 0x28ecd(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,67,129,2,0 ; vbroadcastss 0x28143(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,45,155,133,2,0 ; vbroadcastss 0x2859b(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,192,128,2,0 ; vbroadcastss 0x280c0(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,61,24,133,2,0 ; vbroadcastss 0x28518(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,236 ; vmovaps %ymm4,%ymm5 DB 197,252,40,244 ; vmovaps %ymm4,%ymm6 DB 91 ; pop %rbx @@ -3181,15 +3275,15 @@ _sk_load_g8_dst_hsw LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,184 ; ja 34a7 <_sk_load_g8_dst_hsw+0x1f> + DB 119,184 ; ja 363b <_sk_load_g8_dst_hsw+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3574 <_sk_load_g8_dst_hsw+0xec> + DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3708 <_sk_load_g8_dst_hsw+0xec> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 235,153 ; jmp 34a7 <_sk_load_g8_dst_hsw+0x1f> + DB 235,153 ; jmp 363b <_sk_load_g8_dst_hsw+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -3197,7 +3291,7 @@ _sk_load_g8_dst_hsw LABEL PROC DB 197,249,110,232 ; vmovd %eax,%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4 - DB 233,113,255,255,255 ; jmpq 34a7 <_sk_load_g8_dst_hsw+0x1f> + DB 233,113,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -3208,7 +3302,7 @@ _sk_load_g8_dst_hsw LABEL PROC DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4 - DB 233,54,255,255,255 ; jmpq 34a7 <_sk_load_g8_dst_hsw+0x1f> + DB 233,54,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f> DB 15,31,0 ; nopl (%rax) DB 143 ; (bad) DB 255 ; (bad) @@ -3268,10 +3362,10 @@ _sk_gather_g8_hsw LABEL PROC DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,190,127,2,0 ; vbroadcastss 0x27fbe(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,22,132,2,0 ; vbroadcastss 0x28416(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,59,127,2,0 ; vbroadcastss 0x27f3b(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,147,131,2,0 ; vbroadcastss 0x28393(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -3287,26 +3381,26 @@ _sk_load_565_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,115 ; jne 36ee <_sk_load_565_hsw+0x8f> + DB 117,115 ; jne 3882 <_sk_load_565_hsw+0x8f> DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0 DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2 - DB 196,226,125,88,5,121,127,2,0 ; vpbroadcastd 0x27f79(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,226,125,88,5,209,131,2,0 ; vpbroadcastd 0x283d1(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,108,127,2,0 ; vbroadcastss 0x27f6c(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,226,125,24,13,196,131,2,0 ; vbroadcastss 0x283c4(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,99,127,2,0 ; vpbroadcastd 0x27f63(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,226,125,88,13,187,131,2,0 ; vpbroadcastd 0x283bb(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,86,127,2,0 ; vbroadcastss 0x27f56(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,226,125,24,29,174,131,2,0 ; vbroadcastss 0x283ae(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,88,29,77,127,2,0 ; vpbroadcastd 0x27f4d(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,226,125,88,29,165,131,2,0 ; vpbroadcastd 0x283a5(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,64,127,2,0 ; vbroadcastss 0x27f40(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,226,125,24,29,152,131,2,0 ; vbroadcastss 0x28398(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,165,126,2,0 ; vbroadcastss 0x27ea5(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,253,130,2,0 ; vbroadcastss 0x282fd(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d @@ -3314,27 +3408,27 @@ _sk_load_565_hsw LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,123,255,255,255 ; ja 3681 <_sk_load_565_hsw+0x22> + DB 15,135,123,255,255,255 ; ja 3815 <_sk_load_565_hsw+0x22> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3774 <_sk_load_565_hsw+0x115> + DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3908 <_sk_load_565_hsw+0x115> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,89,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22> + DB 233,89,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,60,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22> + DB 233,60,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,15,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22> + DB 233,15,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22> DB 102,144 ; xchg %ax,%ax DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -3366,26 +3460,26 @@ _sk_load_565_dst_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,115 ; jne 381f <_sk_load_565_dst_hsw+0x8f> + DB 117,115 ; jne 39b3 <_sk_load_565_dst_hsw+0x8f> DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4 DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6 - DB 196,226,125,88,37,72,126,2,0 ; vpbroadcastd 0x27e48(%rip),%ymm4 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,226,125,88,37,160,130,2,0 ; vpbroadcastd 0x282a0(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,59,126,2,0 ; vbroadcastss 0x27e3b(%rip),%ymm5 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,226,125,24,45,147,130,2,0 ; vbroadcastss 0x28293(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,88,45,50,126,2,0 ; vpbroadcastd 0x27e32(%rip),%ymm5 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,226,125,88,45,138,130,2,0 ; vpbroadcastd 0x2828a(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,61,37,126,2,0 ; vbroadcastss 0x27e25(%rip),%ymm7 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,226,125,24,61,125,130,2,0 ; vbroadcastss 0x2827d(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5 - DB 196,226,125,88,61,28,126,2,0 ; vpbroadcastd 0x27e1c(%rip),%ymm7 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,226,125,88,61,116,130,2,0 ; vpbroadcastd 0x28274(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,226,125,24,61,15,126,2,0 ; vbroadcastss 0x27e0f(%rip),%ymm7 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,226,125,24,61,103,130,2,0 ; vbroadcastss 0x28267(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,116,125,2,0 ; vbroadcastss 0x27d74(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,61,204,129,2,0 ; vbroadcastss 0x281cc(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d @@ -3393,27 +3487,27 @@ _sk_load_565_dst_hsw LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,123,255,255,255 ; ja 37b2 <_sk_load_565_dst_hsw+0x22> + DB 15,135,123,255,255,255 ; ja 3946 <_sk_load_565_dst_hsw+0x22> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 38a4 <_sk_load_565_dst_hsw+0x114> + DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3a38 <_sk_load_565_dst_hsw+0x114> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 233,89,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22> + DB 233,89,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5 DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4 - DB 233,60,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22> + DB 233,60,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5 DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4 - DB 233,15,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22> + DB 233,15,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22> DB 144 ; nop DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -3474,23 +3568,23 @@ _sk_gather_565_hsw LABEL PROC DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2 - DB 196,226,125,88,5,151,124,2,0 ; vpbroadcastd 0x27c97(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,226,125,88,5,239,128,2,0 ; vpbroadcastd 0x280ef(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,138,124,2,0 ; vbroadcastss 0x27c8a(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,226,125,24,13,226,128,2,0 ; vbroadcastss 0x280e2(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,129,124,2,0 ; vpbroadcastd 0x27c81(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,226,125,88,13,217,128,2,0 ; vpbroadcastd 0x280d9(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,116,124,2,0 ; vbroadcastss 0x27c74(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,226,125,24,29,204,128,2,0 ; vbroadcastss 0x280cc(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,88,29,107,124,2,0 ; vpbroadcastd 0x27c6b(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,226,125,88,29,195,128,2,0 ; vpbroadcastd 0x280c3(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,94,124,2,0 ; vbroadcastss 0x27c5e(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,226,125,24,29,182,128,2,0 ; vbroadcastss 0x280b6(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,195,123,2,0 ; vbroadcastss 0x27bc3(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,27,128,2,0 ; vbroadcastss 0x2801b(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 255,224 ; jmpq *%rax PUBLIC _sk_store_565_hsw @@ -3503,11 +3597,11 @@ _sk_store_565_hsw LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,141,124,2,0 ; vbroadcastss 0x27c8d(%rip),%ymm8 # 2b67c <_sk_overlay_sse2_8bit+0x55b> + DB 196,98,125,24,5,229,128,2,0 ; vbroadcastss 0x280e5(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9 - DB 196,98,125,24,21,120,124,2,0 ; vbroadcastss 0x27c78(%rip),%ymm10 # 2b680 <_sk_overlay_sse2_8bit+0x55f> + DB 196,98,125,24,21,208,128,2,0 ; vbroadcastss 0x280d0(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f> DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10 DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10 DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10 @@ -3518,7 +3612,7 @@ _sk_store_565_hsw LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne 3a47 <_sk_store_565_hsw+0x78> + DB 117,11 ; jne 3bdb <_sk_store_565_hsw+0x78> DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -3527,22 +3621,22 @@ _sk_store_565_hsw LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja 3a42 <_sk_store_565_hsw+0x73> + DB 119,235 ; ja 3bd6 <_sk_store_565_hsw+0x73> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3aa4 <_sk_store_565_hsw+0xd5> + DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3c38 <_sk_store_565_hsw+0xd5> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2) - DB 235,206 ; jmp 3a42 <_sk_store_565_hsw+0x73> + DB 235,206 ; jmp 3bd6 <_sk_store_565_hsw+0x73> DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2) - DB 235,190 ; jmp 3a42 <_sk_store_565_hsw+0x73> + DB 235,190 ; jmp 3bd6 <_sk_store_565_hsw+0x73> DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2) - DB 235,158 ; jmp 3a42 <_sk_store_565_hsw+0x73> + DB 235,158 ; jmp 3bd6 <_sk_store_565_hsw+0x73> DB 199 ; (bad) DB 255 ; (bad) DB 255 ; (bad) @@ -3560,7 +3654,7 @@ _sk_store_565_hsw LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,224 ; callq ffffffffe1003abc <_sk_overlay_sse2_8bit+0xffffffffe0fd899b> + DB 232,255,255,255,224 ; callq ffffffffe1003c50 <_sk_overlay_sse2_8bit+0xffffffffe0fd8543> DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -3576,28 +3670,28 @@ _sk_load_4444_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,139,0,0,0 ; jne 3b6b <_sk_load_4444_hsw+0xab> + DB 15,133,139,0,0,0 ; jne 3cff <_sk_load_4444_hsw+0xab> DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0 DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3 - DB 196,226,125,88,5,144,123,2,0 ; vpbroadcastd 0x27b90(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563> + DB 196,226,125,88,5,232,127,2,0 ; vpbroadcastd 0x27fe8(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563> DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,131,123,2,0 ; vbroadcastss 0x27b83(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567> + DB 196,226,125,24,13,219,127,2,0 ; vbroadcastss 0x27fdb(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,122,123,2,0 ; vpbroadcastd 0x27b7a(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b> + DB 196,226,125,88,13,210,127,2,0 ; vpbroadcastd 0x27fd2(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b> DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,109,123,2,0 ; vbroadcastss 0x27b6d(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f> + DB 196,226,125,24,21,197,127,2,0 ; vbroadcastss 0x27fc5(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,88,21,100,123,2,0 ; vpbroadcastd 0x27b64(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573> + DB 196,226,125,88,21,188,127,2,0 ; vpbroadcastd 0x27fbc(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573> DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,87,123,2,0 ; vbroadcastss 0x27b57(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577> + DB 196,98,125,24,5,175,127,2,0 ; vbroadcastss 0x27faf(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,88,5,77,123,2,0 ; vpbroadcastd 0x27b4d(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b> + DB 196,98,125,88,5,165,127,2,0 ; vpbroadcastd 0x27fa5(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b> DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,63,123,2,0 ; vbroadcastss 0x27b3f(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f> + DB 196,98,125,24,5,151,127,2,0 ; vbroadcastss 0x27f97(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -3607,27 +3701,27 @@ _sk_load_4444_hsw LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,99,255,255,255 ; ja 3ae6 <_sk_load_4444_hsw+0x26> + DB 15,135,99,255,255,255 ; ja 3c7a <_sk_load_4444_hsw+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3bf0 <_sk_load_4444_hsw+0x130> + DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3d84 <_sk_load_4444_hsw+0x130> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,65,255,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26> + DB 233,65,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,36,255,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26> + DB 233,36,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,247,254,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26> + DB 233,247,254,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26> DB 144 ; nop DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -3660,28 +3754,28 @@ _sk_load_4444_dst_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,139,0,0,0 ; jne 3cb7 <_sk_load_4444_dst_hsw+0xab> + DB 15,133,139,0,0,0 ; jne 3e4b <_sk_load_4444_dst_hsw+0xab> DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4 DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7 - DB 196,226,125,88,37,68,122,2,0 ; vpbroadcastd 0x27a44(%rip),%ymm4 # 2b684 <_sk_overlay_sse2_8bit+0x563> + DB 196,226,125,88,37,156,126,2,0 ; vpbroadcastd 0x27e9c(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563> DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,55,122,2,0 ; vbroadcastss 0x27a37(%rip),%ymm5 # 2b688 <_sk_overlay_sse2_8bit+0x567> + DB 196,226,125,24,45,143,126,2,0 ; vbroadcastss 0x27e8f(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,88,45,46,122,2,0 ; vpbroadcastd 0x27a2e(%rip),%ymm5 # 2b68c <_sk_overlay_sse2_8bit+0x56b> + DB 196,226,125,88,45,134,126,2,0 ; vpbroadcastd 0x27e86(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b> DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,53,33,122,2,0 ; vbroadcastss 0x27a21(%rip),%ymm6 # 2b690 <_sk_overlay_sse2_8bit+0x56f> + DB 196,226,125,24,53,121,126,2,0 ; vbroadcastss 0x27e79(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f> DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5 - DB 196,226,125,88,53,24,122,2,0 ; vpbroadcastd 0x27a18(%rip),%ymm6 # 2b694 <_sk_overlay_sse2_8bit+0x573> + DB 196,226,125,88,53,112,126,2,0 ; vpbroadcastd 0x27e70(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573> DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,98,125,24,5,11,122,2,0 ; vbroadcastss 0x27a0b(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577> + DB 196,98,125,24,5,99,126,2,0 ; vbroadcastss 0x27e63(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577> DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6 - DB 196,98,125,88,5,1,122,2,0 ; vpbroadcastd 0x27a01(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b> + DB 196,98,125,88,5,89,126,2,0 ; vpbroadcastd 0x27e59(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b> DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,243,121,2,0 ; vbroadcastss 0x279f3(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f> + DB 196,98,125,24,5,75,126,2,0 ; vbroadcastss 0x27e4b(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f> DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -3691,27 +3785,27 @@ _sk_load_4444_dst_hsw LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,99,255,255,255 ; ja 3c32 <_sk_load_4444_dst_hsw+0x26> + DB 15,135,99,255,255,255 ; ja 3dc6 <_sk_load_4444_dst_hsw+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3d3c <_sk_load_4444_dst_hsw+0x130> + DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3ed0 <_sk_load_4444_dst_hsw+0x130> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 233,65,255,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26> + DB 233,65,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5 DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4 - DB 233,36,255,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26> + DB 233,36,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5 DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4 - DB 233,247,254,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26> + DB 233,247,254,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26> DB 144 ; nop DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -3772,25 +3866,25 @@ _sk_gather_4444_hsw LABEL PROC DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3 - DB 196,226,125,88,5,123,120,2,0 ; vpbroadcastd 0x2787b(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563> + DB 196,226,125,88,5,211,124,2,0 ; vpbroadcastd 0x27cd3(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563> DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,110,120,2,0 ; vbroadcastss 0x2786e(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567> + DB 196,226,125,24,13,198,124,2,0 ; vbroadcastss 0x27cc6(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,101,120,2,0 ; vpbroadcastd 0x27865(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b> + DB 196,226,125,88,13,189,124,2,0 ; vpbroadcastd 0x27cbd(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b> DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,88,120,2,0 ; vbroadcastss 0x27858(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f> + DB 196,226,125,24,21,176,124,2,0 ; vbroadcastss 0x27cb0(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,88,21,79,120,2,0 ; vpbroadcastd 0x2784f(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573> + DB 196,226,125,88,21,167,124,2,0 ; vpbroadcastd 0x27ca7(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573> DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,66,120,2,0 ; vbroadcastss 0x27842(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577> + DB 196,98,125,24,5,154,124,2,0 ; vbroadcastss 0x27c9a(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,88,5,56,120,2,0 ; vpbroadcastd 0x27838(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b> + DB 196,98,125,88,5,144,124,2,0 ; vpbroadcastd 0x27c90(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b> DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,42,120,2,0 ; vbroadcastss 0x2782a(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f> + DB 196,98,125,24,5,130,124,2,0 ; vbroadcastss 0x27c82(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3805,7 +3899,7 @@ _sk_store_4444_hsw LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,5,120,2,0 ; vbroadcastss 0x27805(%rip),%ymm8 # 2b6a4 <_sk_overlay_sse2_8bit+0x583> + DB 196,98,125,24,5,93,124,2,0 ; vbroadcastss 0x27c5d(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9 @@ -3823,7 +3917,7 @@ _sk_store_4444_hsw LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne 3f03 <_sk_store_4444_hsw+0x84> + DB 117,11 ; jne 4097 <_sk_store_4444_hsw+0x84> DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -3832,22 +3926,22 @@ _sk_store_4444_hsw LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja 3efe <_sk_store_4444_hsw+0x7f> + DB 119,235 ; ja 4092 <_sk_store_4444_hsw+0x7f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3f60 <_sk_store_4444_hsw+0xe1> + DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 40f4 <_sk_store_4444_hsw+0xe1> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2) - DB 235,206 ; jmp 3efe <_sk_store_4444_hsw+0x7f> + DB 235,206 ; jmp 4092 <_sk_store_4444_hsw+0x7f> DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2) - DB 235,190 ; jmp 3efe <_sk_store_4444_hsw+0x7f> + DB 235,190 ; jmp 4092 <_sk_store_4444_hsw+0x7f> DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2) - DB 235,158 ; jmp 3efe <_sk_store_4444_hsw+0x7f> + DB 235,158 ; jmp 4092 <_sk_store_4444_hsw+0x7f> DB 199 ; (bad) DB 255 ; (bad) DB 255 ; (bad) @@ -3865,7 +3959,7 @@ _sk_store_4444_hsw LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,224 ; callq ffffffffe1003f78 <_sk_overlay_sse2_8bit+0xffffffffe0fd8e57> + DB 232,255,255,255,224 ; callq ffffffffe100410c <_sk_overlay_sse2_8bit+0xffffffffe0fd89ff> DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -3881,16 +3975,16 @@ _sk_load_8888_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,87 ; jne 3ff0 <_sk_load_8888_hsw+0x74> + DB 117,87 ; jne 4184 <_sk_load_8888_hsw+0x74> DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3 - DB 197,229,219,5,89,120,2,0 ; vpand 0x27859(%rip),%ymm3,%ymm0 # 2b800 <_sk_overlay_sse2_8bit+0x6df> + DB 197,229,219,5,165,124,2,0 ; vpand 0x27ca5(%rip),%ymm3,%ymm0 # 2bde0 <_sk_overlay_sse2_8bit+0x6d3> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,80,118,2,0 ; vbroadcastss 0x27650(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,168,122,2,0 ; vbroadcastss 0x27aa8(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,94,120,2,0 ; vpshufb 0x2785e(%rip),%ymm3,%ymm1 # 2b820 <_sk_overlay_sse2_8bit+0x6ff> + DB 196,226,101,0,13,170,124,2,0 ; vpshufb 0x27caa(%rip),%ymm3,%ymm1 # 2be00 <_sk_overlay_sse2_8bit+0x6f3> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,108,120,2,0 ; vpshufb 0x2786c(%rip),%ymm3,%ymm2 # 2b840 <_sk_overlay_sse2_8bit+0x71f> + DB 196,226,101,0,21,184,124,2,0 ; vpshufb 0x27cb8(%rip),%ymm3,%ymm2 # 2be20 <_sk_overlay_sse2_8bit+0x713> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3904,21 +3998,21 @@ _sk_load_8888_hsw LABEL PROC DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,155 ; ja 3f9f <_sk_load_8888_hsw+0x23> + DB 119,155 ; ja 4133 <_sk_load_8888_hsw+0x23> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 409c <_sk_load_8888_hsw+0x120> + DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4230 <_sk_load_8888_hsw+0x120> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3 - DB 233,124,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23> + DB 233,124,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23> DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3 DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0 DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3 - DB 233,85,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23> + DB 233,85,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23> DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -3931,9 +4025,9 @@ _sk_load_8888_hsw LABEL PROC DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3 DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0 DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - DB 233,6,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23> + DB 233,6,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23> DB 15,31,0 ; nopl (%rax) - DB 124,255 ; jl 409d <_sk_load_8888_hsw+0x121> + DB 124,255 ; jl 4231 <_sk_load_8888_hsw+0x121> DB 255 ; (bad) DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp) DB 255 ; (bad) @@ -3965,16 +4059,16 @@ _sk_load_8888_dst_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,87 ; jne 412c <_sk_load_8888_dst_hsw+0x74> + DB 117,87 ; jne 42c0 <_sk_load_8888_dst_hsw+0x74> DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7 - DB 197,197,219,37,125,119,2,0 ; vpand 0x2777d(%rip),%ymm7,%ymm4 # 2b860 <_sk_overlay_sse2_8bit+0x73f> + DB 197,197,219,37,201,123,2,0 ; vpand 0x27bc9(%rip),%ymm7,%ymm4 # 2be40 <_sk_overlay_sse2_8bit+0x733> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,98,125,24,5,20,117,2,0 ; vbroadcastss 0x27514(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,108,121,2,0 ; vbroadcastss 0x2796c(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4 - DB 196,226,69,0,45,130,119,2,0 ; vpshufb 0x27782(%rip),%ymm7,%ymm5 # 2b880 <_sk_overlay_sse2_8bit+0x75f> + DB 196,226,69,0,45,206,123,2,0 ; vpshufb 0x27bce(%rip),%ymm7,%ymm5 # 2be60 <_sk_overlay_sse2_8bit+0x753> DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5 - DB 196,226,69,0,53,144,119,2,0 ; vpshufb 0x27790(%rip),%ymm7,%ymm6 # 2b8a0 <_sk_overlay_sse2_8bit+0x77f> + DB 196,226,69,0,53,220,123,2,0 ; vpshufb 0x27bdc(%rip),%ymm7,%ymm6 # 2be80 <_sk_overlay_sse2_8bit+0x773> DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6 DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7 @@ -3988,21 +4082,21 @@ _sk_load_8888_dst_hsw LABEL PROC DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,155 ; ja 40db <_sk_load_8888_dst_hsw+0x23> + DB 119,155 ; ja 426f <_sk_load_8888_dst_hsw+0x23> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 41d8 <_sk_load_8888_dst_hsw+0x120> + DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 436c <_sk_load_8888_dst_hsw+0x120> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7 - DB 233,124,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23> + DB 233,124,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23> DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4 DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7 DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4 DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7 - DB 233,85,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23> + DB 233,85,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23> DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4 DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 @@ -4015,9 +4109,9 @@ _sk_load_8888_dst_hsw LABEL PROC DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7 DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4 DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - DB 233,6,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23> + DB 233,6,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23> DB 15,31,0 ; nopl (%rax) - DB 124,255 ; jl 41d9 <_sk_load_8888_dst_hsw+0x121> + DB 124,255 ; jl 436d <_sk_load_8888_dst_hsw+0x121> DB 255 ; (bad) DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp) DB 255 ; (bad) @@ -4049,14 +4143,14 @@ _sk_gather_8888_hsw LABEL PROC DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - DB 197,229,219,5,158,118,2,0 ; vpand 0x2769e(%rip),%ymm3,%ymm0 # 2b8c0 <_sk_overlay_sse2_8bit+0x79f> + DB 197,229,219,5,234,122,2,0 ; vpand 0x27aea(%rip),%ymm3,%ymm0 # 2bea0 <_sk_overlay_sse2_8bit+0x793> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,213,115,2,0 ; vbroadcastss 0x273d5(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,45,120,2,0 ; vbroadcastss 0x2782d(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,163,118,2,0 ; vpshufb 0x276a3(%rip),%ymm3,%ymm1 # 2b8e0 <_sk_overlay_sse2_8bit+0x7bf> + DB 196,226,101,0,13,239,122,2,0 ; vpshufb 0x27aef(%rip),%ymm3,%ymm1 # 2bec0 <_sk_overlay_sse2_8bit+0x7b3> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,177,118,2,0 ; vpshufb 0x276b1(%rip),%ymm3,%ymm2 # 2b900 <_sk_overlay_sse2_8bit+0x7df> + DB 196,226,101,0,21,253,122,2,0 ; vpshufb 0x27afd(%rip),%ymm3,%ymm2 # 2bee0 <_sk_overlay_sse2_8bit+0x7d3> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -4075,7 +4169,7 @@ _sk_store_8888_hsw LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,49,115,2,0 ; vbroadcastss 0x27331(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,137,119,2,0 ; vbroadcastss 0x27789(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -4091,7 +4185,7 @@ _sk_store_8888_hsw LABEL PROC DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8 DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne 42e4 <_sk_store_8888_hsw+0x7a> + DB 117,11 ; jne 4478 <_sk_store_8888_hsw+0x7a> DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -4100,17 +4194,17 @@ _sk_store_8888_hsw LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja 42df <_sk_store_8888_hsw+0x75> + DB 119,235 ; ja 4473 <_sk_store_8888_hsw+0x75> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 4354 <_sk_store_8888_hsw+0xea> + DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 44e8 <_sk_store_8888_hsw+0xea> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4) - DB 235,207 ; jmp 42df <_sk_store_8888_hsw+0x75> + DB 235,207 ; jmp 4473 <_sk_store_8888_hsw+0x75> DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4) - DB 235,191 ; jmp 42df <_sk_store_8888_hsw+0x75> + DB 235,191 ; jmp 4473 <_sk_store_8888_hsw+0x75> DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 @@ -4118,7 +4212,7 @@ _sk_store_8888_hsw LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4) DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4) - DB 235,142 ; jmp 42df <_sk_store_8888_hsw+0x75> + DB 235,142 ; jmp 4473 <_sk_store_8888_hsw+0x75> DB 15,31,0 ; nopl (%rax) DB 180,255 ; mov $0xff,%ah DB 255 ; (bad) @@ -4130,7 +4224,7 @@ _sk_store_8888_hsw LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,218 ; callq ffffffffdb004368 <_sk_overlay_sse2_8bit+0xffffffffdafd9247> + DB 232,255,255,255,218 ; callq ffffffffdb0044fc <_sk_overlay_sse2_8bit+0xffffffffdafd8def> DB 255 ; (bad) DB 255 ; (bad) DB 255,204 ; dec %esp @@ -4149,16 +4243,16 @@ _sk_load_bgra_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,87 ; jne 43e4 <_sk_load_bgra_hsw+0x74> + DB 117,87 ; jne 4578 <_sk_load_bgra_hsw+0x74> DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3 - DB 197,229,219,5,133,117,2,0 ; vpand 0x27585(%rip),%ymm3,%ymm0 # 2b920 <_sk_overlay_sse2_8bit+0x7ff> + DB 197,229,219,5,209,121,2,0 ; vpand 0x279d1(%rip),%ymm3,%ymm0 # 2bf00 <_sk_overlay_sse2_8bit+0x7f3> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,92,114,2,0 ; vbroadcastss 0x2725c(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,180,118,2,0 ; vbroadcastss 0x276b4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2 - DB 196,226,101,0,5,138,117,2,0 ; vpshufb 0x2758a(%rip),%ymm3,%ymm0 # 2b940 <_sk_overlay_sse2_8bit+0x81f> + DB 196,226,101,0,5,214,121,2,0 ; vpshufb 0x279d6(%rip),%ymm3,%ymm0 # 2bf20 <_sk_overlay_sse2_8bit+0x813> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1 - DB 196,226,101,0,5,152,117,2,0 ; vpshufb 0x27598(%rip),%ymm3,%ymm0 # 2b960 <_sk_overlay_sse2_8bit+0x83f> + DB 196,226,101,0,5,228,121,2,0 ; vpshufb 0x279e4(%rip),%ymm3,%ymm0 # 2bf40 <_sk_overlay_sse2_8bit+0x833> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -4172,21 +4266,21 @@ _sk_load_bgra_hsw LABEL PROC DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,155 ; ja 4393 <_sk_load_bgra_hsw+0x23> + DB 119,155 ; ja 4527 <_sk_load_bgra_hsw+0x23> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4490 <_sk_load_bgra_hsw+0x120> + DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4624 <_sk_load_bgra_hsw+0x120> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3 - DB 233,124,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23> + DB 233,124,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23> DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3 DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0 DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3 - DB 233,85,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23> + DB 233,85,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23> DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -4199,9 +4293,9 @@ _sk_load_bgra_hsw LABEL PROC DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3 DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0 DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - DB 233,6,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23> + DB 233,6,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23> DB 15,31,0 ; nopl (%rax) - DB 124,255 ; jl 4491 <_sk_load_bgra_hsw+0x121> + DB 124,255 ; jl 4625 <_sk_load_bgra_hsw+0x121> DB 255 ; (bad) DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp) DB 255 ; (bad) @@ -4233,16 +4327,16 @@ _sk_load_bgra_dst_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,87 ; jne 4520 <_sk_load_bgra_dst_hsw+0x74> + DB 117,87 ; jne 46b4 <_sk_load_bgra_dst_hsw+0x74> DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7 - DB 197,197,219,37,169,116,2,0 ; vpand 0x274a9(%rip),%ymm7,%ymm4 # 2b980 <_sk_overlay_sse2_8bit+0x85f> + DB 197,197,219,37,245,120,2,0 ; vpand 0x278f5(%rip),%ymm7,%ymm4 # 2bf60 <_sk_overlay_sse2_8bit+0x853> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,98,125,24,5,32,113,2,0 ; vbroadcastss 0x27120(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,120,117,2,0 ; vbroadcastss 0x27578(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6 - DB 196,226,69,0,37,174,116,2,0 ; vpshufb 0x274ae(%rip),%ymm7,%ymm4 # 2b9a0 <_sk_overlay_sse2_8bit+0x87f> + DB 196,226,69,0,37,250,120,2,0 ; vpshufb 0x278fa(%rip),%ymm7,%ymm4 # 2bf80 <_sk_overlay_sse2_8bit+0x873> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5 - DB 196,226,69,0,37,188,116,2,0 ; vpshufb 0x274bc(%rip),%ymm7,%ymm4 # 2b9c0 <_sk_overlay_sse2_8bit+0x89f> + DB 196,226,69,0,37,8,121,2,0 ; vpshufb 0x27908(%rip),%ymm7,%ymm4 # 2bfa0 <_sk_overlay_sse2_8bit+0x893> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4 DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7 @@ -4256,21 +4350,21 @@ _sk_load_bgra_dst_hsw LABEL PROC DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,155 ; ja 44cf <_sk_load_bgra_dst_hsw+0x23> + DB 119,155 ; ja 4663 <_sk_load_bgra_dst_hsw+0x23> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 45cc <_sk_load_bgra_dst_hsw+0x120> + DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4760 <_sk_load_bgra_dst_hsw+0x120> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7 - DB 233,124,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23> + DB 233,124,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23> DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4 DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7 DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4 DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7 - DB 233,85,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23> + DB 233,85,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23> DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4 DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 @@ -4283,9 +4377,9 @@ _sk_load_bgra_dst_hsw LABEL PROC DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7 DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4 DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - DB 233,6,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23> + DB 233,6,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23> DB 15,31,0 ; nopl (%rax) - DB 124,255 ; jl 45cd <_sk_load_bgra_dst_hsw+0x121> + DB 124,255 ; jl 4761 <_sk_load_bgra_dst_hsw+0x121> DB 255 ; (bad) DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp) DB 255 ; (bad) @@ -4317,14 +4411,14 @@ _sk_gather_bgra_hsw LABEL PROC DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - DB 197,229,219,5,202,115,2,0 ; vpand 0x273ca(%rip),%ymm3,%ymm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x8bf> + DB 197,229,219,5,22,120,2,0 ; vpand 0x27816(%rip),%ymm3,%ymm0 # 2bfc0 <_sk_overlay_sse2_8bit+0x8b3> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,225,111,2,0 ; vbroadcastss 0x26fe1(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,57,116,2,0 ; vbroadcastss 0x27439(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2 - DB 196,226,101,0,5,207,115,2,0 ; vpshufb 0x273cf(%rip),%ymm3,%ymm0 # 2ba00 <_sk_overlay_sse2_8bit+0x8df> + DB 196,226,101,0,5,27,120,2,0 ; vpshufb 0x2781b(%rip),%ymm3,%ymm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x8d3> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1 - DB 196,226,101,0,5,221,115,2,0 ; vpshufb 0x273dd(%rip),%ymm3,%ymm0 # 2ba20 <_sk_overlay_sse2_8bit+0x8ff> + DB 196,226,101,0,5,41,120,2,0 ; vpshufb 0x27829(%rip),%ymm3,%ymm0 # 2c000 <_sk_overlay_sse2_8bit+0x8f3> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -4343,7 +4437,7 @@ _sk_store_bgra_hsw LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,61,111,2,0 ; vbroadcastss 0x26f3d(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,149,115,2,0 ; vbroadcastss 0x27395(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -4359,7 +4453,7 @@ _sk_store_bgra_hsw LABEL PROC DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8 DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne 46d8 <_sk_store_bgra_hsw+0x7a> + DB 117,11 ; jne 486c <_sk_store_bgra_hsw+0x7a> DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -4368,17 +4462,17 @@ _sk_store_bgra_hsw LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja 46d3 <_sk_store_bgra_hsw+0x75> + DB 119,235 ; ja 4867 <_sk_store_bgra_hsw+0x75> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 4748 <_sk_store_bgra_hsw+0xea> + DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 48dc <_sk_store_bgra_hsw+0xea> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4) - DB 235,207 ; jmp 46d3 <_sk_store_bgra_hsw+0x75> + DB 235,207 ; jmp 4867 <_sk_store_bgra_hsw+0x75> DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4) - DB 235,191 ; jmp 46d3 <_sk_store_bgra_hsw+0x75> + DB 235,191 ; jmp 4867 <_sk_store_bgra_hsw+0x75> DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 @@ -4386,7 +4480,7 @@ _sk_store_bgra_hsw LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4) DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4) - DB 235,142 ; jmp 46d3 <_sk_store_bgra_hsw+0x75> + DB 235,142 ; jmp 4867 <_sk_store_bgra_hsw+0x75> DB 15,31,0 ; nopl (%rax) DB 180,255 ; mov $0xff,%ah DB 255 ; (bad) @@ -4398,7 +4492,7 @@ _sk_store_bgra_hsw LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,218 ; callq ffffffffdb00475c <_sk_overlay_sse2_8bit+0xffffffffdafd963b> + DB 232,255,255,255,218 ; callq ffffffffdb0048f0 <_sk_overlay_sse2_8bit+0xffffffffdafd91e3> DB 255 ; (bad) DB 255 ; (bad) DB 255,204 ; dec %esp @@ -4416,7 +4510,7 @@ _sk_load_f16_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,101 ; jne 47e5 <_sk_load_f16_hsw+0x81> + DB 117,101 ; jne 4979 <_sk_load_f16_hsw+0x81> DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8 DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2 DB 196,193,121,16,92,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm3 @@ -4442,29 +4536,29 @@ _sk_load_f16_hsw LABEL PROC DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 484b <_sk_load_f16_hsw+0xe7> + DB 116,85 ; je 49df <_sk_load_f16_hsw+0xe7> DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 484b <_sk_load_f16_hsw+0xe7> + DB 114,72 ; jb 49df <_sk_load_f16_hsw+0xe7> DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 4858 <_sk_load_f16_hsw+0xf4> + DB 116,72 ; je 49ec <_sk_load_f16_hsw+0xf4> DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 4858 <_sk_load_f16_hsw+0xf4> + DB 114,59 ; jb 49ec <_sk_load_f16_hsw+0xf4> DB 196,193,123,16,92,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,109,255,255,255 ; je 479b <_sk_load_f16_hsw+0x37> + DB 15,132,109,255,255,255 ; je 492f <_sk_load_f16_hsw+0x37> DB 196,193,97,22,92,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,92,255,255,255 ; jb 479b <_sk_load_f16_hsw+0x37> + DB 15,130,92,255,255,255 ; jb 492f <_sk_load_f16_hsw+0x37> DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9 - DB 233,80,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37> + DB 233,80,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,67,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37> + DB 233,67,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,58,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37> + DB 233,58,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37> PUBLIC _sk_load_f16_dst_hsw _sk_load_f16_dst_hsw LABEL PROC @@ -4476,7 +4570,7 @@ _sk_load_f16_dst_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,101 ; jne 48e2 <_sk_load_f16_dst_hsw+0x81> + DB 117,101 ; jne 4a76 <_sk_load_f16_dst_hsw+0x81> DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8 DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6 DB 196,193,121,16,124,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm7 @@ -4502,29 +4596,29 @@ _sk_load_f16_dst_hsw LABEL PROC DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 4948 <_sk_load_f16_dst_hsw+0xe7> + DB 116,85 ; je 4adc <_sk_load_f16_dst_hsw+0xe7> DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 4948 <_sk_load_f16_dst_hsw+0xe7> + DB 114,72 ; jb 4adc <_sk_load_f16_dst_hsw+0xe7> DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 4955 <_sk_load_f16_dst_hsw+0xf4> + DB 116,72 ; je 4ae9 <_sk_load_f16_dst_hsw+0xf4> DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 4955 <_sk_load_f16_dst_hsw+0xf4> + DB 114,59 ; jb 4ae9 <_sk_load_f16_dst_hsw+0xf4> DB 196,193,123,16,124,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm7 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,109,255,255,255 ; je 4898 <_sk_load_f16_dst_hsw+0x37> + DB 15,132,109,255,255,255 ; je 4a2c <_sk_load_f16_dst_hsw+0x37> DB 196,193,65,22,124,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,92,255,255,255 ; jb 4898 <_sk_load_f16_dst_hsw+0x37> + DB 15,130,92,255,255,255 ; jb 4a2c <_sk_load_f16_dst_hsw+0x37> DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9 - DB 233,80,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37> + DB 233,80,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37> DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7 DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6 - DB 233,67,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37> + DB 233,67,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37> DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7 - DB 233,58,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37> + DB 233,58,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37> PUBLIC _sk_gather_f16_hsw _sk_gather_f16_hsw LABEL PROC @@ -4583,7 +4677,7 @@ _sk_store_f16_hsw LABEL PROC DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9 DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,31 ; jne 4a63 <_sk_store_f16_hsw+0x7b> + DB 117,31 ; jne 4bf7 <_sk_store_f16_hsw+0x7b> DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8) DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8) DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8) @@ -4592,22 +4686,22 @@ _sk_store_f16_hsw LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 4a5f <_sk_store_f16_hsw+0x77> + DB 116,240 ; je 4bf3 <_sk_store_f16_hsw+0x77> DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 4a5f <_sk_store_f16_hsw+0x77> + DB 114,227 ; jb 4bf3 <_sk_store_f16_hsw+0x77> DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8) - DB 116,218 ; je 4a5f <_sk_store_f16_hsw+0x77> + DB 116,218 ; je 4bf3 <_sk_store_f16_hsw+0x77> DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb 4a5f <_sk_store_f16_hsw+0x77> + DB 114,205 ; jb 4bf3 <_sk_store_f16_hsw+0x77> DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8) - DB 116,196 ; je 4a5f <_sk_store_f16_hsw+0x77> + DB 116,196 ; je 4bf3 <_sk_store_f16_hsw+0x77> DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,183 ; jb 4a5f <_sk_store_f16_hsw+0x77> + DB 114,183 ; jb 4bf3 <_sk_store_f16_hsw+0x77> DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8) - DB 235,174 ; jmp 4a5f <_sk_store_f16_hsw+0x77> + DB 235,174 ; jmp 4bf3 <_sk_store_f16_hsw+0x77> PUBLIC _sk_load_u16_be_hsw _sk_load_u16_be_hsw LABEL PROC @@ -4620,7 +4714,7 @@ _sk_load_u16_be_hsw LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,204,0,0,0 ; jne 4ba4 <_sk_load_u16_be_hsw+0xf3> + DB 15,133,204,0,0,0 ; jne 4d38 <_sk_load_u16_be_hsw+0xf3> DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8 DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2 DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -4639,7 +4733,7 @@ _sk_load_u16_be_hsw LABEL PROC DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0 DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,231,106,2,0 ; vbroadcastss 0x26ae7(%rip),%ymm10 # 2b620 <_sk_overlay_sse2_8bit+0x4ff> + DB 196,98,125,24,21,63,111,2,0 ; vbroadcastss 0x26f3f(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -4667,29 +4761,29 @@ _sk_load_u16_be_hsw LABEL PROC DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 4c0a <_sk_load_u16_be_hsw+0x159> + DB 116,85 ; je 4d9e <_sk_load_u16_be_hsw+0x159> DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 4c0a <_sk_load_u16_be_hsw+0x159> + DB 114,72 ; jb 4d9e <_sk_load_u16_be_hsw+0x159> DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 4c17 <_sk_load_u16_be_hsw+0x166> + DB 116,72 ; je 4dab <_sk_load_u16_be_hsw+0x166> DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 4c17 <_sk_load_u16_be_hsw+0x166> + DB 114,59 ; jb 4dab <_sk_load_u16_be_hsw+0x166> DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,6,255,255,255 ; je 4af3 <_sk_load_u16_be_hsw+0x42> + DB 15,132,6,255,255,255 ; je 4c87 <_sk_load_u16_be_hsw+0x42> DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,245,254,255,255 ; jb 4af3 <_sk_load_u16_be_hsw+0x42> + DB 15,130,245,254,255,255 ; jb 4c87 <_sk_load_u16_be_hsw+0x42> DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9 - DB 233,233,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42> + DB 233,233,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,220,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42> + DB 233,220,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,211,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42> + DB 233,211,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42> PUBLIC _sk_load_rgb_u16_be_hsw _sk_load_rgb_u16_be_hsw LABEL PROC @@ -4704,7 +4798,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 72,141,4,64 ; lea (%rax,%rax,2),%rax DB 72,193,248,32 ; sar $0x20,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,204,0,0,0 ; jne 4d17 <_sk_load_rgb_u16_be_hsw+0xf7> + DB 15,133,204,0,0,0 ; jne 4eab <_sk_load_rgb_u16_be_hsw+0xf7> DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0 DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2 DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -4728,7 +4822,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0 DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,91,105,2,0 ; vbroadcastss 0x2695b(%rip),%ymm10 # 2b620 <_sk_overlay_sse2_8bit+0x4ff> + DB 196,98,125,24,21,179,109,2,0 ; vbroadcastss 0x26db3(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -4745,41 +4839,41 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,123,104,2,0 ; vbroadcastss 0x2687b(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,211,108,2,0 ; vbroadcastss 0x26cd3(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 255,224 ; jmpq *%rax DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0 DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne 4d30 <_sk_load_rgb_u16_be_hsw+0x110> - DB 233,79,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f> + DB 117,5 ; jne 4ec4 <_sk_load_rgb_u16_be_hsw+0x110> + DB 233,79,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f> DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1 DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb 4d5f <_sk_load_rgb_u16_be_hsw+0x13f> + DB 114,26 ; jb 4ef3 <_sk_load_rgb_u16_be_hsw+0x13f> DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1 DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne 4d64 <_sk_load_rgb_u16_be_hsw+0x144> - DB 233,32,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f> - DB 233,27,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f> + DB 117,10 ; jne 4ef8 <_sk_load_rgb_u16_be_hsw+0x144> + DB 233,32,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f> + DB 233,27,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f> DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1 DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb 4d93 <_sk_load_rgb_u16_be_hsw+0x173> + DB 114,26 ; jb 4f27 <_sk_load_rgb_u16_be_hsw+0x173> DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1 DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne 4d98 <_sk_load_rgb_u16_be_hsw+0x178> - DB 233,236,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f> - DB 233,231,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f> + DB 117,10 ; jne 4f2c <_sk_load_rgb_u16_be_hsw+0x178> + DB 233,236,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f> + DB 233,231,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f> DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3 DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb 4dc1 <_sk_load_rgb_u16_be_hsw+0x1a1> + DB 114,20 ; jb 4f55 <_sk_load_rgb_u16_be_hsw+0x1a1> DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3 DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - DB 233,190,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f> - DB 233,185,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f> + DB 233,190,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f> + DB 233,185,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f> PUBLIC _sk_store_u16_be_hsw _sk_store_u16_be_hsw LABEL PROC @@ -4791,7 +4885,7 @@ _sk_store_u16_be_hsw LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax - DB 196,98,125,24,5,187,104,2,0 ; vbroadcastss 0x268bb(%rip),%ymm8 # 2b6a8 <_sk_overlay_sse2_8bit+0x587> + DB 196,98,125,24,5,19,109,2,0 ; vbroadcastss 0x26d13(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10 @@ -4829,7 +4923,7 @@ _sk_store_u16_be_hsw LABEL PROC DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9 DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,31 ; jne 4ed1 <_sk_store_u16_be_hsw+0x10b> + DB 117,31 ; jne 5065 <_sk_store_u16_be_hsw+0x10b> DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2) DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2) DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2) @@ -4838,28 +4932,28 @@ _sk_store_u16_be_hsw LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 4ecd <_sk_store_u16_be_hsw+0x107> + DB 116,240 ; je 5061 <_sk_store_u16_be_hsw+0x107> DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 4ecd <_sk_store_u16_be_hsw+0x107> + DB 114,227 ; jb 5061 <_sk_store_u16_be_hsw+0x107> DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2) - DB 116,218 ; je 4ecd <_sk_store_u16_be_hsw+0x107> + DB 116,218 ; je 5061 <_sk_store_u16_be_hsw+0x107> DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb 4ecd <_sk_store_u16_be_hsw+0x107> + DB 114,205 ; jb 5061 <_sk_store_u16_be_hsw+0x107> DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2) - DB 116,196 ; je 4ecd <_sk_store_u16_be_hsw+0x107> + DB 116,196 ; je 5061 <_sk_store_u16_be_hsw+0x107> DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,183 ; jb 4ecd <_sk_store_u16_be_hsw+0x107> + DB 114,183 ; jb 5061 <_sk_store_u16_be_hsw+0x107> DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2) - DB 235,174 ; jmp 4ecd <_sk_store_u16_be_hsw+0x107> + DB 235,174 ; jmp 5061 <_sk_store_u16_be_hsw+0x107> PUBLIC _sk_load_f32_hsw _sk_load_f32_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,135,128,0,0,0 ; ja 4fab <_sk_load_f32_hsw+0x8c> + DB 15,135,128,0,0,0 ; ja 513f <_sk_load_f32_hsw+0x8c> DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d DB 76,99,88,8 ; movslq 0x8(%rax),%r11 DB 76,99,201 ; movslq %ecx,%r9 @@ -4867,7 +4961,7 @@ _sk_load_f32_hsw LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 77,99,210 ; movslq %r10d,%r10 - DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 4fd4 <_sk_load_f32_hsw+0xb5> + DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 5168 <_sk_load_f32_hsw+0xb5> DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax @@ -4913,7 +5007,7 @@ PUBLIC _sk_load_f32_dst_hsw _sk_load_f32_dst_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,135,128,0,0,0 ; ja 5080 <_sk_load_f32_dst_hsw+0x8c> + DB 15,135,128,0,0,0 ; ja 5214 <_sk_load_f32_dst_hsw+0x8c> DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d DB 76,99,88,8 ; movslq 0x8(%rax),%r11 DB 76,99,201 ; movslq %ecx,%r9 @@ -4921,7 +5015,7 @@ _sk_load_f32_dst_hsw LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 77,99,210 ; movslq %r10d,%r10 - DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 50a8 <_sk_load_f32_dst_hsw+0xb4> + DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 523c <_sk_load_f32_dst_hsw+0xb4> DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax @@ -4983,7 +5077,7 @@ _sk_store_f32_hsw LABEL PROC DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8 DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11 DB 77,133,192 ; test %r8,%r8 - DB 117,55 ; jne 5147 <_sk_store_f32_hsw+0x7f> + DB 117,55 ; jne 52db <_sk_store_f32_hsw+0x7f> DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -4996,22 +5090,22 @@ _sk_store_f32_hsw LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 5143 <_sk_store_f32_hsw+0x7b> + DB 116,240 ; je 52d7 <_sk_store_f32_hsw+0x7b> DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 5143 <_sk_store_f32_hsw+0x7b> + DB 114,227 ; jb 52d7 <_sk_store_f32_hsw+0x7b> DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4) - DB 116,218 ; je 5143 <_sk_store_f32_hsw+0x7b> + DB 116,218 ; je 52d7 <_sk_store_f32_hsw+0x7b> DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb 5143 <_sk_store_f32_hsw+0x7b> + DB 114,205 ; jb 52d7 <_sk_store_f32_hsw+0x7b> DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - DB 116,195 ; je 5143 <_sk_store_f32_hsw+0x7b> + DB 116,195 ; je 52d7 <_sk_store_f32_hsw+0x7b> DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,181 ; jb 5143 <_sk_store_f32_hsw+0x7b> + DB 114,181 ; jb 52d7 <_sk_store_f32_hsw+0x7b> DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - DB 235,171 ; jmp 5143 <_sk_store_f32_hsw+0x7b> + DB 235,171 ; jmp 52d7 <_sk_store_f32_hsw+0x7b> PUBLIC _sk_clamp_x_hsw _sk_clamp_x_hsw LABEL PROC @@ -5078,7 +5172,7 @@ _sk_mirror_x_hsw LABEL PROC DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11 DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0 DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8 - DB 197,178,89,5,23,99,2,0 ; vmulss 0x26317(%rip),%xmm9,%xmm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 197,178,89,5,111,103,2,0 ; vmulss 0x2676f(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0 DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0 @@ -5103,7 +5197,7 @@ _sk_mirror_y_hsw LABEL PROC DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11 DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1 DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8 - DB 197,178,89,13,179,98,2,0 ; vmulss 0x262b3(%rip),%xmm9,%xmm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 197,178,89,13,11,103,2,0 ; vmulss 0x2670b(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1 DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1 DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1 @@ -5123,7 +5217,7 @@ PUBLIC _sk_clamp_x_1_hsw _sk_clamp_x_1_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,104,98,2,0 ; vbroadcastss 0x26268(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,192,102,2,0 ; vbroadcastss 0x266c0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -5137,9 +5231,9 @@ _sk_repeat_x_1_hsw LABEL PROC PUBLIC _sk_mirror_x_1_hsw _sk_mirror_x_1_hsw LABEL PROC - DB 196,98,125,24,5,95,98,2,0 ; vbroadcastss 0x2625f(%rip),%ymm8 # 2b5a8 <_sk_overlay_sse2_8bit+0x487> + DB 196,98,125,24,5,183,102,2,0 ; vbroadcastss 0x266b7(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,13,53,98,2,0 ; vbroadcastss 0x26235(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,13,141,102,2,0 ; vbroadcastss 0x2668d(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9 DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9 DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9 @@ -5153,11 +5247,11 @@ _sk_mirror_x_1_hsw LABEL PROC PUBLIC _sk_luminance_to_alpha_hsw _sk_luminance_to_alpha_hsw LABEL PROC - DB 196,226,125,24,29,33,99,2,0 ; vbroadcastss 0x26321(%rip),%ymm3 # 2b6ac <_sk_overlay_sse2_8bit+0x58b> - DB 196,98,125,24,5,28,99,2,0 ; vbroadcastss 0x2631c(%rip),%ymm8 # 2b6b0 <_sk_overlay_sse2_8bit+0x58f> + DB 196,226,125,24,29,121,103,2,0 ; vbroadcastss 0x26779(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b> + DB 196,98,125,24,5,116,103,2,0 ; vbroadcastss 0x26774(%rip),%ymm8 # 2bc9c <_sk_overlay_sse2_8bit+0x58f> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1 - DB 196,226,125,24,29,13,99,2,0 ; vbroadcastss 0x2630d(%rip),%ymm3 # 2b6b4 <_sk_overlay_sse2_8bit+0x593> + DB 196,226,125,24,29,101,103,2,0 ; vbroadcastss 0x26765(%rip),%ymm3 # 2bca0 <_sk_overlay_sse2_8bit+0x593> DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -5341,9 +5435,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC DB 76,139,72,8 ; mov 0x8(%rax),%r9 DB 77,137,211 ; mov %r10,%r11 DB 73,255,203 ; dec %r11 - DB 120,7 ; js 56a0 <_sk_evenly_spaced_gradient_hsw+0x19> + DB 120,7 ; js 5834 <_sk_evenly_spaced_gradient_hsw+0x19> DB 196,193,242,42,203 ; vcvtsi2ss %r11,%xmm1,%xmm1 - DB 235,22 ; jmp 56b6 <_sk_evenly_spaced_gradient_hsw+0x2f> + DB 235,22 ; jmp 584a <_sk_evenly_spaced_gradient_hsw+0x2f> DB 76,137,219 ; mov %r11,%rbx DB 72,209,235 ; shr %rbx DB 65,131,227,1 ; and $0x1,%r11d @@ -5354,7 +5448,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1 DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11 DB 73,131,250,8 ; cmp $0x8,%r10 - DB 119,70 ; ja 570f <_sk_evenly_spaced_gradient_hsw+0x88> + DB 119,70 ; ja 58a3 <_sk_evenly_spaced_gradient_hsw+0x88> DB 196,66,37,22,1 ; vpermps (%r9),%ymm11,%ymm8 DB 72,139,88,40 ; mov 0x28(%rax),%rbx DB 196,98,37,22,11 ; vpermps (%rbx),%ymm11,%ymm9 @@ -5370,7 +5464,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC DB 196,226,37,22,27 ; vpermps (%rbx),%ymm11,%ymm3 DB 72,139,64,64 ; mov 0x40(%rax),%rax DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13 - DB 235,110 ; jmp 577d <_sk_evenly_spaced_gradient_hsw+0xf6> + DB 235,110 ; jmp 5911 <_sk_evenly_spaced_gradient_hsw+0xf6> DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,2,117,146,4,153 ; vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8 @@ -5405,14 +5499,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC PUBLIC _sk_gauss_a_to_rgba_hsw _sk_gauss_a_to_rgba_hsw LABEL PROC - DB 196,226,125,24,5,21,95,2,0 ; vbroadcastss 0x25f15(%rip),%ymm0 # 2b6b8 <_sk_overlay_sse2_8bit+0x597> - DB 196,226,125,24,13,16,95,2,0 ; vbroadcastss 0x25f10(%rip),%ymm1 # 2b6bc <_sk_overlay_sse2_8bit+0x59b> + DB 196,226,125,24,5,109,99,2,0 ; vbroadcastss 0x2636d(%rip),%ymm0 # 2bca4 <_sk_overlay_sse2_8bit+0x597> + DB 196,226,125,24,13,104,99,2,0 ; vbroadcastss 0x26368(%rip),%ymm1 # 2bca8 <_sk_overlay_sse2_8bit+0x59b> DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1 - DB 196,226,125,24,5,6,95,2,0 ; vbroadcastss 0x25f06(%rip),%ymm0 # 2b6c0 <_sk_overlay_sse2_8bit+0x59f> + DB 196,226,125,24,5,94,99,2,0 ; vbroadcastss 0x2635e(%rip),%ymm0 # 2bcac <_sk_overlay_sse2_8bit+0x59f> DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0 - DB 196,226,125,24,13,252,94,2,0 ; vbroadcastss 0x25efc(%rip),%ymm1 # 2b6c4 <_sk_overlay_sse2_8bit+0x5a3> + DB 196,226,125,24,13,84,99,2,0 ; vbroadcastss 0x26354(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3> DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1 - DB 196,226,125,24,5,242,94,2,0 ; vbroadcastss 0x25ef2(%rip),%ymm0 # 2b6c8 <_sk_overlay_sse2_8bit+0x5a7> + DB 196,226,125,24,5,74,99,2,0 ; vbroadcastss 0x2634a(%rip),%ymm0 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7> DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 @@ -5425,11 +5519,11 @@ _sk_gradient_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 73,131,249,1 ; cmp $0x1,%r9 - DB 15,134,180,0,0,0 ; jbe 58ae <_sk_gradient_hsw+0xc3> + DB 15,134,180,0,0,0 ; jbe 5a42 <_sk_gradient_hsw+0xc3> DB 76,139,80,72 ; mov 0x48(%rax),%r10 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 65,187,1,0,0,0 ; mov $0x1,%r11d - DB 196,226,125,24,21,131,93,2,0 ; vbroadcastss 0x25d83(%rip),%ymm2 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,226,125,24,21,219,97,2,0 ; vbroadcastss 0x261db(%rip),%ymm2 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9 DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3 DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3 @@ -5437,10 +5531,10 @@ _sk_gradient_hsw LABEL PROC DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9 DB 73,255,195 ; inc %r11 DB 77,57,217 ; cmp %r11,%r9 - DB 117,226 ; jne 5816 <_sk_gradient_hsw+0x2b> + DB 117,226 ; jne 59aa <_sk_gradient_hsw+0x2b> DB 76,139,80,8 ; mov 0x8(%rax),%r10 DB 73,131,249,8 ; cmp $0x8,%r9 - DB 118,121 ; jbe 58b7 <_sk_gradient_hsw+0xcc> + DB 118,121 ; jbe 5a4b <_sk_gradient_hsw+0xcc> DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,2,117,146,4,138 ; vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8 @@ -5464,7 +5558,7 @@ _sk_gradient_hsw LABEL PROC DB 196,130,21,146,28,137 ; vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3 DB 72,139,64,64 ; mov 0x40(%rax),%rax DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13 - DB 235,77 ; jmp 58fb <_sk_gradient_hsw+0x110> + DB 235,77 ; jmp 5a8f <_sk_gradient_hsw+0x110> DB 76,139,80,8 ; mov 0x8(%rax),%r10 DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 DB 196,66,53,22,2 ; vpermps (%r10),%ymm9,%ymm8 @@ -5520,24 +5614,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12 DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11 DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12 - DB 196,98,125,24,45,54,93,2,0 ; vbroadcastss 0x25d36(%rip),%ymm13 # 2b6cc <_sk_overlay_sse2_8bit+0x5ab> - DB 196,98,125,24,53,49,93,2,0 ; vbroadcastss 0x25d31(%rip),%ymm14 # 2b6d0 <_sk_overlay_sse2_8bit+0x5af> + DB 196,98,125,24,45,142,97,2,0 ; vbroadcastss 0x2618e(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab> + DB 196,98,125,24,53,137,97,2,0 ; vbroadcastss 0x26189(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af> DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14 - DB 196,98,125,24,45,39,93,2,0 ; vbroadcastss 0x25d27(%rip),%ymm13 # 2b6d4 <_sk_overlay_sse2_8bit+0x5b3> + DB 196,98,125,24,45,127,97,2,0 ; vbroadcastss 0x2617f(%rip),%ymm13 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3> DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13 - DB 196,98,125,24,53,29,93,2,0 ; vbroadcastss 0x25d1d(%rip),%ymm14 # 2b6d8 <_sk_overlay_sse2_8bit+0x5b7> + DB 196,98,125,24,53,117,97,2,0 ; vbroadcastss 0x26175(%rip),%ymm14 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7> DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14 DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11 DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,8,93,2,0 ; vbroadcastss 0x25d08(%rip),%ymm10 # 2b6dc <_sk_overlay_sse2_8bit+0x5bb> + DB 196,98,125,24,21,96,97,2,0 ; vbroadcastss 0x26160(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb> DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10 DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9 DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,21,158,91,2,0 ; vbroadcastss 0x25b9e(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,21,246,95,2,0 ; vbroadcastss 0x25ff6(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9 - DB 196,98,125,24,21,136,91,2,0 ; vbroadcastss 0x25b88(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,21,224,95,2,0 ; vbroadcastss 0x25fe0(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10 DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0 DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9 @@ -5561,23 +5655,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10 DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10 DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 - DB 196,98,125,24,29,136,92,2,0 ; vbroadcastss 0x25c88(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf> + DB 196,98,125,24,29,224,96,2,0 ; vbroadcastss 0x260e0(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11 DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11 DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0 DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,13,103,92,2,0 ; vbroadcastss 0x25c67(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3> + DB 196,98,125,24,13,191,96,2,0 ; vbroadcastss 0x260bf(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0 DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0 DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8 - DB 196,98,125,24,13,74,92,2,0 ; vbroadcastss 0x25c4a(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,125,24,13,162,96,2,0 ; vbroadcastss 0x260a2(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,219,90,2,0 ; vbroadcastss 0x25adb(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,29,51,95,2,0 ; vbroadcastss 0x25f33(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10 DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0 @@ -5594,23 +5688,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10 DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10 DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 - DB 196,98,125,24,29,240,91,2,0 ; vbroadcastss 0x25bf0(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf> + DB 196,98,125,24,29,72,96,2,0 ; vbroadcastss 0x26048(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11 DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11 DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0 DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,13,207,91,2,0 ; vbroadcastss 0x25bcf(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3> + DB 196,98,125,24,13,39,96,2,0 ; vbroadcastss 0x26027(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0 DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0 DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8 - DB 196,98,125,24,13,178,91,2,0 ; vbroadcastss 0x25bb2(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,125,24,13,10,96,2,0 ; vbroadcastss 0x2600a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,67,90,2,0 ; vbroadcastss 0x25a43(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,29,155,94,2,0 ; vbroadcastss 0x25e9b(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10 DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0 @@ -5626,14 +5720,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9 DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9 DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9 - DB 196,98,125,24,21,94,91,2,0 ; vbroadcastss 0x25b5e(%rip),%ymm10 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf> + DB 196,98,125,24,21,182,95,2,0 ; vbroadcastss 0x25fb6(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10 DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10 DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0 DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0 - DB 196,98,125,24,5,65,91,2,0 ; vbroadcastss 0x25b41(%rip),%ymm8 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,125,24,5,153,95,2,0 ; vbroadcastss 0x25f99(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0 DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -5667,7 +5761,7 @@ _sk_apply_vector_mask_hsw LABEL PROC PUBLIC _sk_save_xy_hsw _sk_save_xy_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,129,89,2,0 ; vbroadcastss 0x25981(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,217,93,2,0 ; vbroadcastss 0x25dd9(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9 DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 @@ -5697,9 +5791,9 @@ _sk_accumulate_hsw LABEL PROC PUBLIC _sk_bilinear_nx_hsw _sk_bilinear_nx_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,113,90,2,0 ; vbroadcastss 0x25a71(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,5,201,94,2,0 ; vbroadcastss 0x25ec9(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,8,89,2,0 ; vbroadcastss 0x25908(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,96,93,2,0 ; vbroadcastss 0x25d60(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5708,7 +5802,7 @@ _sk_bilinear_nx_hsw LABEL PROC PUBLIC _sk_bilinear_px_hsw _sk_bilinear_px_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,232,88,2,0 ; vbroadcastss 0x258e8(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,5,64,93,2,0 ; vbroadcastss 0x25d40(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -5718,9 +5812,9 @@ _sk_bilinear_px_hsw LABEL PROC PUBLIC _sk_bilinear_ny_hsw _sk_bilinear_ny_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,40,90,2,0 ; vbroadcastss 0x25a28(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,13,128,94,2,0 ; vbroadcastss 0x25e80(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,190,88,2,0 ; vbroadcastss 0x258be(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,22,93,2,0 ; vbroadcastss 0x25d16(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5729,7 +5823,7 @@ _sk_bilinear_ny_hsw LABEL PROC PUBLIC _sk_bilinear_py_hsw _sk_bilinear_py_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,158,88,2,0 ; vbroadcastss 0x2589e(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,13,246,92,2,0 ; vbroadcastss 0x25cf6(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -5739,13 +5833,13 @@ _sk_bilinear_py_hsw LABEL PROC PUBLIC _sk_bicubic_n3x_hsw _sk_bicubic_n3x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,225,89,2,0 ; vbroadcastss 0x259e1(%rip),%ymm0 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf> + DB 196,226,125,24,5,57,94,2,0 ; vbroadcastss 0x25e39(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,116,88,2,0 ; vbroadcastss 0x25874(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,204,92,2,0 ; vbroadcastss 0x25ccc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,209,88,2,0 ; vbroadcastss 0x258d1(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> - DB 196,98,125,24,29,188,89,2,0 ; vbroadcastss 0x259bc(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,41,93,2,0 ; vbroadcastss 0x25d29(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,29,20,94,2,0 ; vbroadcastss 0x25e14(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -5755,16 +5849,16 @@ _sk_bicubic_n3x_hsw LABEL PROC PUBLIC _sk_bicubic_n1x_hsw _sk_bicubic_n1x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,147,89,2,0 ; vbroadcastss 0x25993(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,5,235,93,2,0 ; vbroadcastss 0x25deb(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,42,88,2,0 ; vbroadcastss 0x2582a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,130,92,2,0 ; vbroadcastss 0x25c82(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,132,89,2,0 ; vbroadcastss 0x25984(%rip),%ymm9 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> - DB 196,98,125,24,21,127,89,2,0 ; vbroadcastss 0x2597f(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,13,220,93,2,0 ; vbroadcastss 0x25ddc(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,21,215,93,2,0 ; vbroadcastss 0x25dd7(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,13,1,88,2,0 ; vbroadcastss 0x25801(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,13,89,92,2,0 ; vbroadcastss 0x25c59(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9 - DB 196,98,125,24,21,103,89,2,0 ; vbroadcastss 0x25967(%rip),%ymm10 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,21,191,93,2,0 ; vbroadcastss 0x25dbf(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5773,14 +5867,14 @@ _sk_bicubic_n1x_hsw LABEL PROC PUBLIC _sk_bicubic_p1x_hsw _sk_bicubic_p1x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,215,87,2,0 ; vbroadcastss 0x257d7(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,47,92,2,0 ; vbroadcastss 0x25c2f(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0 DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9 - DB 196,98,125,24,21,49,89,2,0 ; vbroadcastss 0x25931(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> - DB 196,98,125,24,29,44,89,2,0 ; vbroadcastss 0x2592c(%rip),%ymm11 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,21,137,93,2,0 ; vbroadcastss 0x25d89(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,29,132,93,2,0 ; vbroadcastss 0x25d84(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11 DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11 - DB 196,98,125,24,5,29,89,2,0 ; vbroadcastss 0x2591d(%rip),%ymm8 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,5,117,93,2,0 ; vbroadcastss 0x25d75(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5789,12 +5883,12 @@ _sk_bicubic_p1x_hsw LABEL PROC PUBLIC _sk_bicubic_p3x_hsw _sk_bicubic_p3x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,249,88,2,0 ; vbroadcastss 0x258f9(%rip),%ymm0 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,226,125,24,5,81,93,2,0 ; vbroadcastss 0x25d51(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,234,87,2,0 ; vbroadcastss 0x257ea(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> - DB 196,98,125,24,29,213,88,2,0 ; vbroadcastss 0x258d5(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,66,92,2,0 ; vbroadcastss 0x25c42(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,29,45,93,2,0 ; vbroadcastss 0x25d2d(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -5804,13 +5898,13 @@ _sk_bicubic_p3x_hsw LABEL PROC PUBLIC _sk_bicubic_n3y_hsw _sk_bicubic_n3y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,176,88,2,0 ; vbroadcastss 0x258b0(%rip),%ymm1 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf> + DB 196,226,125,24,13,8,93,2,0 ; vbroadcastss 0x25d08(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,66,87,2,0 ; vbroadcastss 0x25742(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,154,91,2,0 ; vbroadcastss 0x25b9a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,159,87,2,0 ; vbroadcastss 0x2579f(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> - DB 196,98,125,24,29,138,88,2,0 ; vbroadcastss 0x2588a(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,247,91,2,0 ; vbroadcastss 0x25bf7(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,29,226,92,2,0 ; vbroadcastss 0x25ce2(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -5820,16 +5914,16 @@ _sk_bicubic_n3y_hsw LABEL PROC PUBLIC _sk_bicubic_n1y_hsw _sk_bicubic_n1y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,97,88,2,0 ; vbroadcastss 0x25861(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,13,185,92,2,0 ; vbroadcastss 0x25cb9(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,247,86,2,0 ; vbroadcastss 0x256f7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,79,91,2,0 ; vbroadcastss 0x25b4f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,81,88,2,0 ; vbroadcastss 0x25851(%rip),%ymm9 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> - DB 196,98,125,24,21,76,88,2,0 ; vbroadcastss 0x2584c(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,13,169,92,2,0 ; vbroadcastss 0x25ca9(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,21,164,92,2,0 ; vbroadcastss 0x25ca4(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,13,206,86,2,0 ; vbroadcastss 0x256ce(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,13,38,91,2,0 ; vbroadcastss 0x25b26(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9 - DB 196,98,125,24,21,52,88,2,0 ; vbroadcastss 0x25834(%rip),%ymm10 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,21,140,92,2,0 ; vbroadcastss 0x25c8c(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5838,14 +5932,14 @@ _sk_bicubic_n1y_hsw LABEL PROC PUBLIC _sk_bicubic_p1y_hsw _sk_bicubic_p1y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,164,86,2,0 ; vbroadcastss 0x256a4(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,252,90,2,0 ; vbroadcastss 0x25afc(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1 DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9 - DB 196,98,125,24,21,253,87,2,0 ; vbroadcastss 0x257fd(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> - DB 196,98,125,24,29,248,87,2,0 ; vbroadcastss 0x257f8(%rip),%ymm11 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,21,85,92,2,0 ; vbroadcastss 0x25c55(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,29,80,92,2,0 ; vbroadcastss 0x25c50(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11 DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11 - DB 196,98,125,24,5,233,87,2,0 ; vbroadcastss 0x257e9(%rip),%ymm8 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,5,65,92,2,0 ; vbroadcastss 0x25c41(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5854,12 +5948,12 @@ _sk_bicubic_p1y_hsw LABEL PROC PUBLIC _sk_bicubic_p3y_hsw _sk_bicubic_p3y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,197,87,2,0 ; vbroadcastss 0x257c5(%rip),%ymm1 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,226,125,24,13,29,92,2,0 ; vbroadcastss 0x25c1d(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,181,86,2,0 ; vbroadcastss 0x256b5(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> - DB 196,98,125,24,29,160,87,2,0 ; vbroadcastss 0x257a0(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,13,91,2,0 ; vbroadcastss 0x25b0d(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,29,248,91,2,0 ; vbroadcastss 0x25bf8(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -5989,19 +6083,19 @@ _sk_clut_3D_hsw LABEL PROC DB 197,254,127,76,36,32 ; vmovdqu %ymm1,0x20(%rsp) DB 72,139,0 ; mov (%rax),%rax DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1 - DB 196,226,125,88,61,115,85,2,0 ; vpbroadcastd 0x25573(%rip),%ymm7 # 2b708 <_sk_overlay_sse2_8bit+0x5e7> + DB 196,226,125,88,61,203,89,2,0 ; vpbroadcastd 0x259cb(%rip),%ymm7 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7> DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1 DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6 DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8 - DB 196,98,125,88,21,231,83,2,0 ; vpbroadcastd 0x253e7(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,98,125,88,21,63,88,2,0 ; vpbroadcastd 0x2583f(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 196,193,117,254,242 ; vpaddd %ymm10,%ymm1,%ymm6 DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11 DB 196,226,37,146,28,176 ; vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3 - DB 196,98,125,88,29,214,83,2,0 ; vpbroadcastd 0x253d6(%rip),%ymm11 # 2b59c <_sk_overlay_sse2_8bit+0x47b> + DB 196,98,125,88,29,46,88,2,0 ; vpbroadcastd 0x2582e(%rip),%ymm11 # 2bb88 <_sk_overlay_sse2_8bit+0x47b> DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1 DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6 DB 196,226,77,146,36,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4 - DB 196,98,125,24,45,38,85,2,0 ; vbroadcastss 0x25526(%rip),%ymm13 # 2b704 <_sk_overlay_sse2_8bit+0x5e3> + DB 196,98,125,24,45,126,89,2,0 ; vbroadcastss 0x2597e(%rip),%ymm13 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3> DB 196,193,124,88,245 ; vaddps %ymm13,%ymm0,%ymm6 DB 197,254,91,246 ; vcvttps2dq %ymm6,%ymm6 DB 196,226,77,64,205 ; vpmulld %ymm5,%ymm6,%ymm1 @@ -6219,19 +6313,19 @@ _sk_clut_4D_hsw LABEL PROC DB 197,126,91,245 ; vcvttps2dq %ymm5,%ymm14 DB 196,98,13,64,233 ; vpmulld %ymm1,%ymm14,%ymm13 DB 197,149,254,198 ; vpaddd %ymm6,%ymm13,%ymm0 - DB 196,98,125,88,21,159,80,2,0 ; vpbroadcastd 0x2509f(%rip),%ymm10 # 2b708 <_sk_overlay_sse2_8bit+0x5e7> + DB 196,98,125,88,21,247,84,2,0 ; vpbroadcastd 0x254f7(%rip),%ymm10 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7> DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0 DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8 DB 196,98,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15 - DB 196,98,125,88,29,18,79,2,0 ; vpbroadcastd 0x24f12(%rip),%ymm11 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,98,125,88,29,106,83,2,0 ; vpbroadcastd 0x2536a(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 196,65,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm8 DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9 DB 196,162,53,146,20,128 ; vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2 - DB 196,98,125,88,37,1,79,2,0 ; vpbroadcastd 0x24f01(%rip),%ymm12 # 2b59c <_sk_overlay_sse2_8bit+0x47b> + DB 196,98,125,88,37,89,83,2,0 ; vpbroadcastd 0x25359(%rip),%ymm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b> DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0 DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8 DB 196,226,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7 - DB 196,98,125,24,13,80,80,2,0 ; vbroadcastss 0x25050(%rip),%ymm9 # 2b704 <_sk_overlay_sse2_8bit+0x5e3> + DB 196,98,125,24,13,168,84,2,0 ; vbroadcastss 0x254a8(%rip),%ymm9 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3> DB 196,65,84,88,193 ; vaddps %ymm9,%ymm5,%ymm8 DB 196,65,126,91,192 ; vcvttps2dq %ymm8,%ymm8 DB 196,226,61,64,193 ; vpmulld %ymm1,%ymm8,%ymm0 @@ -6556,7 +6650,7 @@ _sk_clut_4D_hsw LABEL PROC DB 197,196,92,214 ; vsubps %ymm6,%ymm7,%ymm2 DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,223,71,2,0 ; vbroadcastss 0x247df(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,55,76,2,0 ; vbroadcastss 0x24c37(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,16,164,36,160,3,0,0 ; vmovups 0x3a0(%rsp),%ymm4 DB 197,252,16,172,36,192,3,0,0 ; vmovups 0x3c0(%rsp),%ymm5 DB 197,252,16,180,36,224,3,0,0 ; vmovups 0x3e0(%rsp),%ymm6 @@ -6597,13 +6691,13 @@ _sk_start_pipeline_avx LABEL PROC DB 73,137,246 ; mov %rsi,%r14 DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp) DB 76,57,203 ; cmp %r9,%rbx - DB 115,110 ; jae 6ecd <_sk_start_pipeline_avx+0xed> + DB 115,110 ; jae 7061 <_sk_start_pipeline_avx+0xed> DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax DB 72,141,64,8 ; lea 0x8(%rax),%rax DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp) DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp) - DB 119,43 ; ja 6eac <_sk_start_pipeline_avx+0xcc> + DB 119,43 ; ja 7040 <_sk_start_pipeline_avx+0xcc> DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12 DB 69,49,192 ; xor %r8d,%r8d DB 72,139,125,56 ; mov 0x38(%rbp),%rdi @@ -6615,17 +6709,17 @@ _sk_start_pipeline_avx LABEL PROC DB 73,131,196,16 ; add $0x10,%r12 DB 77,57,252 ; cmp %r15,%r12 DB 73,137,212 ; mov %rdx,%r12 - DB 118,220 ; jbe 6e88 <_sk_start_pipeline_avx+0xa8> + DB 118,220 ; jbe 701c <_sk_start_pipeline_avx+0xa8> DB 77,137,248 ; mov %r15,%r8 DB 73,41,208 ; sub %rdx,%r8 - DB 116,13 ; je 6ec1 <_sk_start_pipeline_avx+0xe1> + DB 116,13 ; je 7055 <_sk_start_pipeline_avx+0xe1> DB 72,139,125,56 ; mov 0x38(%rbp),%rdi DB 76,137,246 ; mov %r14,%rsi DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 72,255,195 ; inc %rbx DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx - DB 117,164 ; jne 6e71 <_sk_start_pipeline_avx+0x91> + DB 117,164 ; jne 7005 <_sk_start_pipeline_avx+0x91> DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6 DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7 DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8 @@ -6658,7 +6752,7 @@ _sk_seed_shader_avx LABEL PROC DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,71,70,2,0 ; vbroadcastss 0x24647(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,13,159,74,2,0 ; vbroadcastss 0x24a9f(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0 DB 197,249,110,209 ; vmovd %ecx,%xmm2 @@ -6667,7 +6761,7 @@ _sk_seed_shader_avx LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,21,33,70,2,0 ; vbroadcastss 0x24621(%rip),%ymm2 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,21,121,74,2,0 ; vbroadcastss 0x24a79(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 @@ -6689,7 +6783,7 @@ _sk_dither_avx LABEL PROC DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9 DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10 - DB 196,98,125,24,29,202,69,2,0 ; vbroadcastss 0x245ca(%rip),%ymm11 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,98,125,24,29,34,74,2,0 ; vbroadcastss 0x24a22(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9 DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12 DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9 @@ -6700,8 +6794,8 @@ _sk_dither_avx LABEL PROC DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11 DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11 DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - DB 196,98,125,24,37,139,69,2,0 ; vbroadcastss 0x2458b(%rip),%ymm12 # 2b598 <_sk_overlay_sse2_8bit+0x477> - DB 196,98,125,24,45,134,69,2,0 ; vbroadcastss 0x24586(%rip),%ymm13 # 2b59c <_sk_overlay_sse2_8bit+0x47b> + DB 196,98,125,24,37,227,73,2,0 ; vbroadcastss 0x249e3(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477> + DB 196,98,125,24,45,222,73,2,0 ; vbroadcastss 0x249de(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b> DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14 DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15 DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14 @@ -6728,9 +6822,9 @@ _sk_dither_avx LABEL PROC DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8 DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,241,68,2,0 ; vbroadcastss 0x244f1(%rip),%ymm9 # 2b5a0 <_sk_overlay_sse2_8bit+0x47f> + DB 196,98,125,24,13,73,73,2,0 ; vbroadcastss 0x24949(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,231,68,2,0 ; vbroadcastss 0x244e7(%rip),%ymm9 # 2b5a4 <_sk_overlay_sse2_8bit+0x483> + DB 196,98,125,24,13,63,73,2,0 ; vbroadcastss 0x2493f(%rip),%ymm9 # 2bb90 <_sk_overlay_sse2_8bit+0x483> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 @@ -6760,7 +6854,7 @@ _sk_uniform_color_avx LABEL PROC PUBLIC _sk_black_color_avx _sk_black_color_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,111,68,2,0 ; vbroadcastss 0x2446f(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,199,72,2,0 ; vbroadcastss 0x248c7(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 @@ -6769,7 +6863,7 @@ _sk_black_color_avx LABEL PROC PUBLIC _sk_white_color_avx _sk_white_color_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,86,68,2,0 ; vbroadcastss 0x24456(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,174,72,2,0 ; vbroadcastss 0x248ae(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 197,252,40,216 ; vmovaps %ymm0,%ymm3 @@ -6807,7 +6901,7 @@ _sk_clear_avx LABEL PROC PUBLIC _sk_srcatop_avx _sk_srcatop_avx LABEL PROC DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0 - DB 196,98,125,24,5,245,67,2,0 ; vbroadcastss 0x243f5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,77,72,2,0 ; vbroadcastss 0x2484d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -6826,7 +6920,7 @@ _sk_srcatop_avx LABEL PROC PUBLIC _sk_dstatop_avx _sk_dstatop_avx LABEL PROC DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 - DB 196,98,125,24,13,179,67,2,0 ; vbroadcastss 0x243b3(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,13,11,72,2,0 ; vbroadcastss 0x2480b(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0 @@ -6862,7 +6956,7 @@ _sk_dstin_avx LABEL PROC PUBLIC _sk_srcout_avx _sk_srcout_avx LABEL PROC - DB 196,98,125,24,5,78,67,2,0 ; vbroadcastss 0x2434e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,166,71,2,0 ; vbroadcastss 0x247a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -6873,7 +6967,7 @@ _sk_srcout_avx LABEL PROC PUBLIC _sk_dstout_avx _sk_dstout_avx LABEL PROC - DB 196,226,125,24,5,45,67,2,0 ; vbroadcastss 0x2432d(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,133,71,2,0 ; vbroadcastss 0x24785(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3 DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0 DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1 @@ -6884,7 +6978,7 @@ _sk_dstout_avx LABEL PROC PUBLIC _sk_srcover_avx _sk_srcover_avx LABEL PROC - DB 196,98,125,24,5,12,67,2,0 ; vbroadcastss 0x2430c(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,100,71,2,0 ; vbroadcastss 0x24764(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -6899,7 +6993,7 @@ _sk_srcover_avx LABEL PROC PUBLIC _sk_dstover_avx _sk_dstover_avx LABEL PROC - DB 196,98,125,24,5,219,66,2,0 ; vbroadcastss 0x242db(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,51,71,2,0 ; vbroadcastss 0x24733(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0 @@ -6923,7 +7017,7 @@ _sk_modulate_avx LABEL PROC PUBLIC _sk_multiply_avx _sk_multiply_avx LABEL PROC - DB 196,98,125,24,5,150,66,2,0 ; vbroadcastss 0x24296(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,238,70,2,0 ; vbroadcastss 0x246ee(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6952,9 +7046,14 @@ _sk_multiply_avx LABEL PROC PUBLIC _sk_plus__avx _sk_plus__avx LABEL PROC DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0 + DB 196,98,125,24,5,125,70,2,0 ; vbroadcastss 0x2467d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> + DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1 + DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2 + DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3 + DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -6977,7 +7076,7 @@ _sk_screen_avx LABEL PROC PUBLIC _sk_xor__avx _sk_xor__avx LABEL PROC - DB 196,98,125,24,5,225,65,2,0 ; vbroadcastss 0x241e1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,28,70,2,0 ; vbroadcastss 0x2461c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -7012,7 +7111,7 @@ _sk_darken_avx LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,93,65,2,0 ; vbroadcastss 0x2415d(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,152,69,2,0 ; vbroadcastss 0x24598(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -7036,7 +7135,7 @@ _sk_lighten_avx LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,5,65,2,0 ; vbroadcastss 0x24105(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,64,69,2,0 ; vbroadcastss 0x24540(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -7063,7 +7162,7 @@ _sk_difference_avx LABEL PROC DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,161,64,2,0 ; vbroadcastss 0x240a1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,220,68,2,0 ; vbroadcastss 0x244dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -7084,7 +7183,7 @@ _sk_exclusion_avx LABEL PROC DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,88,64,2,0 ; vbroadcastss 0x24058(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,147,68,2,0 ; vbroadcastss 0x24493(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -7093,7 +7192,7 @@ _sk_exclusion_avx LABEL PROC PUBLIC _sk_colorburn_avx _sk_colorburn_avx LABEL PROC - DB 196,98,125,24,5,63,64,2,0 ; vbroadcastss 0x2403f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,122,68,2,0 ; vbroadcastss 0x2447a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11 DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10 @@ -7153,7 +7252,7 @@ _sk_colorburn_avx LABEL PROC PUBLIC _sk_colordodge_avx _sk_colordodge_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,13,67,63,2,0 ; vbroadcastss 0x23f43(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,13,126,67,2,0 ; vbroadcastss 0x2437e(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9 @@ -7208,7 +7307,7 @@ _sk_colordodge_avx LABEL PROC PUBLIC _sk_hardlight_avx _sk_hardlight_avx LABEL PROC - DB 196,98,125,24,5,78,62,2,0 ; vbroadcastss 0x23e4e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,137,66,2,0 ; vbroadcastss 0x24289(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -7261,7 +7360,7 @@ _sk_hardlight_avx LABEL PROC PUBLIC _sk_overlay_avx _sk_overlay_avx LABEL PROC - DB 196,98,125,24,5,115,61,2,0 ; vbroadcastss 0x23d73(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,174,65,2,0 ; vbroadcastss 0x241ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -7326,10 +7425,10 @@ _sk_softlight_avx LABEL PROC DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8 DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11 DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8 - DB 196,98,125,24,29,118,60,2,0 ; vbroadcastss 0x23c76(%rip),%ymm11 # 2b5a8 <_sk_overlay_sse2_8bit+0x487> + DB 196,98,125,24,29,177,64,2,0 ; vbroadcastss 0x240b1(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487> DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13 DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8 - DB 196,98,125,24,45,103,60,2,0 ; vbroadcastss 0x23c67(%rip),%ymm13 # 2b5ac <_sk_overlay_sse2_8bit+0x48b> + DB 196,98,125,24,45,162,64,2,0 ; vbroadcastss 0x240a2(%rip),%ymm13 # 2bb98 <_sk_overlay_sse2_8bit+0x48b> DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14 DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8 DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14 @@ -7340,7 +7439,7 @@ _sk_softlight_avx LABEL PROC DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15 DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14 DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15 - DB 196,98,125,24,5,17,60,2,0 ; vbroadcastss 0x23c11(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,76,64,2,0 ; vbroadcastss 0x2404c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12 DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0 DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12 @@ -7467,12 +7566,12 @@ _sk_hue_avx LABEL PROC DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11 DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11 DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - DB 196,98,125,24,53,239,57,2,0 ; vbroadcastss 0x239ef(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,53,42,62,2,0 ; vbroadcastss 0x23e2a(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11 - DB 196,98,125,24,61,229,57,2,0 ; vbroadcastss 0x239e5(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,61,32,62,2,0 ; vbroadcastss 0x23e20(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 - DB 196,226,125,24,5,214,57,2,0 ; vbroadcastss 0x239d6(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,226,125,24,5,17,62,2,0 ; vbroadcastss 0x23e11(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13 @@ -7533,7 +7632,7 @@ _sk_hue_avx LABEL PROC DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10 DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,131,56,2,0 ; vbroadcastss 0x23883(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,190,60,2,0 ; vbroadcastss 0x23cbe(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -7590,12 +7689,12 @@ _sk_saturation_avx LABEL PROC DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11 DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11 DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - DB 196,98,125,24,53,167,55,2,0 ; vbroadcastss 0x237a7(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,53,226,59,2,0 ; vbroadcastss 0x23be2(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11 - DB 196,98,125,24,61,157,55,2,0 ; vbroadcastss 0x2379d(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,61,216,59,2,0 ; vbroadcastss 0x23bd8(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 - DB 196,226,125,24,5,142,55,2,0 ; vbroadcastss 0x2378e(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,226,125,24,5,201,59,2,0 ; vbroadcastss 0x23bc9(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13 @@ -7656,7 +7755,7 @@ _sk_saturation_avx LABEL PROC DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10 DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,59,54,2,0 ; vbroadcastss 0x2363b(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,118,58,2,0 ; vbroadcastss 0x23a76(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -7685,12 +7784,12 @@ _sk_color_avx LABEL PROC DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp) DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8 DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9 - DB 196,98,125,24,45,231,53,2,0 ; vbroadcastss 0x235e7(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,45,34,58,2,0 ; vbroadcastss 0x23a22(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10 - DB 196,98,125,24,53,221,53,2,0 ; vbroadcastss 0x235dd(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,53,24,58,2,0 ; vbroadcastss 0x23a18(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11 DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,61,206,53,2,0 ; vbroadcastss 0x235ce(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,98,125,24,61,9,58,2,0 ; vbroadcastss 0x23a09(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11 DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0 DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11 @@ -7753,7 +7852,7 @@ _sk_color_avx LABEL PROC DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9 DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0 DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8 - DB 196,226,125,24,5,105,52,2,0 ; vbroadcastss 0x23469(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,164,56,2,0 ; vbroadcastss 0x238a4(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -7783,12 +7882,12 @@ _sk_luminosity_avx LABEL PROC DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9 - DB 196,98,125,24,45,17,52,2,0 ; vbroadcastss 0x23411(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,45,76,56,2,0 ; vbroadcastss 0x2384c(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10 - DB 196,98,125,24,53,7,52,2,0 ; vbroadcastss 0x23407(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493> + DB 196,98,125,24,53,66,56,2,0 ; vbroadcastss 0x23842(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493> DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11 DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,61,248,51,2,0 ; vbroadcastss 0x233f8(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497> + DB 196,98,125,24,61,51,56,2,0 ; vbroadcastss 0x23833(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497> DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11 DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0 DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11 @@ -7851,7 +7950,7 @@ _sk_luminosity_avx LABEL PROC DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9 DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0 DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8 - DB 196,226,125,24,5,147,50,2,0 ; vbroadcastss 0x23293(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,5,206,54,2,0 ; vbroadcastss 0x236ce(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -7883,9 +7982,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,43,1,0,0 ; jne 8497 <_sk_srcover_rgba_8888_avx+0x14c> + DB 15,133,43,1,0,0 ; jne 8648 <_sk_srcover_rgba_8888_avx+0x14c> DB 196,65,125,16,4,153 ; vmovupd (%r9,%rbx,4),%ymm8 - DB 197,125,40,13,198,54,2,0 ; vmovapd 0x236c6(%rip),%ymm9 # 2ba40 <_sk_overlay_sse2_8bit+0x91f> + DB 197,125,40,13,245,58,2,0 ; vmovapd 0x23af5(%rip),%ymm9 # 2c020 <_sk_overlay_sse2_8bit+0x913> DB 196,193,61,84,225 ; vandpd %ymm9,%ymm8,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 DB 196,193,81,114,208,8 ; vpsrld $0x8,%xmm8,%xmm5 @@ -7903,9 +8002,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 197,193,114,215,24 ; vpsrld $0x18,%xmm7,%xmm7 DB 196,227,61,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm8,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,181,49,2,0 ; vbroadcastss 0x231b5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,240,53,2,0 ; vbroadcastss 0x235f0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 - DB 196,98,125,24,13,212,49,2,0 ; vbroadcastss 0x231d4(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,13,15,54,2,0 ; vbroadcastss 0x2360f(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10 DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0 @@ -7938,7 +8037,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 196,65,53,86,202 ; vorpd %ymm10,%ymm9,%ymm9 DB 196,65,61,86,193 ; vorpd %ymm9,%ymm8,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,67 ; jne 84cf <_sk_srcover_rgba_8888_avx+0x184> + DB 117,67 ; jne 8680 <_sk_srcover_rgba_8888_avx+0x184> DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -7948,33 +8047,33 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,194,254,255,255 ; ja 8372 <_sk_srcover_rgba_8888_avx+0x27> + DB 15,135,194,254,255,255 ; ja 8523 <_sk_srcover_rgba_8888_avx+0x27> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,5,1,0,0 ; lea 0x105(%rip),%r11 # 85c0 <_sk_srcover_rgba_8888_avx+0x275> + DB 76,141,29,4,1,0,0 ; lea 0x104(%rip),%r11 # 8770 <_sk_srcover_rgba_8888_avx+0x274> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,122,16,4,153 ; vmovss (%r9,%rbx,4),%xmm8 - DB 233,163,254,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27> + DB 233,163,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27> DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,179 ; ja 8492 <_sk_srcover_rgba_8888_avx+0x147> + DB 119,179 ; ja 8643 <_sk_srcover_rgba_8888_avx+0x147> DB 65,15,182,194 ; movzbl %r10b,%eax - DB 76,141,21,242,0,0,0 ; lea 0xf2(%rip),%r10 # 85dc <_sk_srcover_rgba_8888_avx+0x291> + DB 76,141,21,241,0,0,0 ; lea 0xf1(%rip),%r10 # 878c <_sk_srcover_rgba_8888_avx+0x290> DB 73,99,4,130 ; movslq (%r10,%rax,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4) - DB 235,151 ; jmp 8492 <_sk_srcover_rgba_8888_avx+0x147> + DB 235,151 ; jmp 8643 <_sk_srcover_rgba_8888_avx+0x147> DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4 DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 DB 196,99,85,12,196,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm8 DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4 DB 196,99,61,13,196,1 ; vblendpd $0x1,%ymm4,%ymm8,%ymm8 - DB 233,80,254,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27> + DB 233,80,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27> DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4 DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4 DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4 @@ -7988,10 +8087,10 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 196,99,61,24,196,1 ; vinsertf128 $0x1,%xmm4,%ymm8,%ymm8 DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4 DB 196,67,93,13,192,12 ; vblendpd $0xc,%ymm8,%ymm4,%ymm8 - DB 233,251,253,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27> + DB 233,251,253,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27> DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4) - DB 233,8,255,255,255 ; jmpq 8492 <_sk_srcover_rgba_8888_avx+0x147> + DB 233,8,255,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147> DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 @@ -7999,37 +8098,35 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4) DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4) - DB 233,212,254,255,255 ; jmpq 8492 <_sk_srcover_rgba_8888_avx+0x147> - DB 102,144 ; xchg %ax,%ax - DB 4,255 ; add $0xff,%al + DB 233,212,254,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147> + DB 144 ; nop + DB 5,255,255,255,82 ; add $0x52ffffff,%eax DB 255 ; (bad) - DB 255,81,255 ; callq *-0x1(%rcx) DB 255 ; (bad) DB 255 ; (bad) - DB 59,255 ; cmp %edi,%edi + DB 60,255 ; cmp $0xff,%al DB 255 ; (bad) - DB 255,166,255,255,255,146 ; jmpq *-0x6d000001(%rsi) + DB 255,167,255,255,255,147 ; jmpq *-0x6c000001(%rdi) DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 126,255 ; jle 85d5 <_sk_srcover_rgba_8888_avx+0x28a> + DB 127,255 ; jg 8785 <_sk_srcover_rgba_8888_avx+0x289> DB 255 ; (bad) - DB 255,98,255 ; jmpq *-0x1(%rdx) + DB 255,99,255 ; jmpq *-0x1(%rbx) DB 255 ; (bad) - DB 255,23 ; callq *(%rdi) + DB 255,24 ; lcall *(%rax) DB 255 ; (bad) DB 255 ; (bad) - DB 255,163,255,255,255,155 ; jmpq *-0x64000001(%rbx) + DB 255,164,255,255,255,156,255 ; jmpq *-0x630001(%rdi,%rdi,8) DB 255 ; (bad) DB 255 ; (bad) - DB 255,215 ; callq *%rdi - DB 255 ; (bad) + DB 216,255 ; fdivr %st(7),%st DB 255 ; (bad) - DB 255,202 ; dec %edx + DB 255,203 ; dec %ebx DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 188,255,255,255,174 ; mov $0xaeffffff,%esp + DB 189,255,255,255,175 ; mov $0xafffffff,%ebp DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -8046,7 +8143,7 @@ _sk_clamp_0_avx LABEL PROC PUBLIC _sk_clamp_1_avx _sk_clamp_1_avx LABEL PROC - DB 196,98,125,24,5,114,47,2,0 ; vbroadcastss 0x22f72(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,174,51,2,0 ; vbroadcastss 0x233ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 @@ -8056,7 +8153,7 @@ _sk_clamp_1_avx LABEL PROC PUBLIC _sk_clamp_a_avx _sk_clamp_a_avx LABEL PROC - DB 196,98,125,24,5,81,47,2,0 ; vbroadcastss 0x22f51(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,141,51,2,0 ; vbroadcastss 0x2338d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0 DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1 @@ -8066,7 +8163,7 @@ _sk_clamp_a_avx LABEL PROC PUBLIC _sk_clamp_a_dst_avx _sk_clamp_a_dst_avx LABEL PROC - DB 196,98,125,24,5,51,47,2,0 ; vbroadcastss 0x22f33(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,111,51,2,0 ; vbroadcastss 0x2336f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7 DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4 DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5 @@ -8093,7 +8190,7 @@ _sk_swap_rb_avx LABEL PROC PUBLIC _sk_invert_avx _sk_invert_avx LABEL PROC - DB 196,98,125,24,5,238,46,2,0 ; vbroadcastss 0x22eee(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,42,51,2,0 ; vbroadcastss 0x2332a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0 DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 @@ -8139,7 +8236,7 @@ PUBLIC _sk_unpremul_avx _sk_unpremul_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9 - DB 196,98,125,24,21,126,46,2,0 ; vbroadcastss 0x22e7e(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,21,186,50,2,0 ; vbroadcastss 0x232ba(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10 DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -8150,17 +8247,17 @@ _sk_unpremul_avx LABEL PROC PUBLIC _sk_from_srgb_avx _sk_from_srgb_avx LABEL PROC - DB 196,98,125,24,5,139,46,2,0 ; vbroadcastss 0x22e8b(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f> + DB 196,98,125,24,5,199,50,2,0 ; vbroadcastss 0x232c7(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10 - DB 196,98,125,24,29,105,46,2,0 ; vbroadcastss 0x22e69(%rip),%ymm11 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,29,165,50,2,0 ; vbroadcastss 0x232a5(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12 - DB 196,98,125,24,45,111,46,2,0 ; vbroadcastss 0x22e6f(%rip),%ymm13 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3> + DB 196,98,125,24,45,171,50,2,0 ; vbroadcastss 0x232ab(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,96,46,2,0 ; vbroadcastss 0x22e60(%rip),%ymm12 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7> + DB 196,98,125,24,37,156,50,2,0 ; vbroadcastss 0x2329c(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,53,86,46,2,0 ; vbroadcastss 0x22e56(%rip),%ymm14 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab> + DB 196,98,125,24,53,146,50,2,0 ; vbroadcastss 0x23292(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab> DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0 DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0 DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9 @@ -8184,17 +8281,17 @@ _sk_from_srgb_avx LABEL PROC PUBLIC _sk_from_srgb_dst_avx _sk_from_srgb_dst_avx LABEL PROC - DB 196,98,125,24,5,223,45,2,0 ; vbroadcastss 0x22ddf(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f> + DB 196,98,125,24,5,27,50,2,0 ; vbroadcastss 0x2321b(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f> DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9 DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10 - DB 196,98,125,24,29,189,45,2,0 ; vbroadcastss 0x22dbd(%rip),%ymm11 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f> + DB 196,98,125,24,29,249,49,2,0 ; vbroadcastss 0x231f9(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f> DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12 - DB 196,98,125,24,45,195,45,2,0 ; vbroadcastss 0x22dc3(%rip),%ymm13 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3> + DB 196,98,125,24,45,255,49,2,0 ; vbroadcastss 0x231ff(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,180,45,2,0 ; vbroadcastss 0x22db4(%rip),%ymm12 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7> + DB 196,98,125,24,37,240,49,2,0 ; vbroadcastss 0x231f0(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,53,170,45,2,0 ; vbroadcastss 0x22daa(%rip),%ymm14 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab> + DB 196,98,125,24,53,230,49,2,0 ; vbroadcastss 0x231e6(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab> DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4 DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4 DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9 @@ -8219,20 +8316,20 @@ _sk_from_srgb_dst_avx LABEL PROC PUBLIC _sk_to_srgb_avx _sk_to_srgb_avx LABEL PROC DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9 - DB 196,98,125,24,5,63,45,2,0 ; vbroadcastss 0x22d3f(%rip),%ymm8 # 2b5d0 <_sk_overlay_sse2_8bit+0x4af> + DB 196,98,125,24,5,123,49,2,0 ; vbroadcastss 0x2317b(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af> DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10 - DB 196,98,125,24,29,57,45,2,0 ; vbroadcastss 0x22d39(%rip),%ymm11 # 2b5d8 <_sk_overlay_sse2_8bit+0x4b7> + DB 196,98,125,24,29,117,49,2,0 ; vbroadcastss 0x23175(%rip),%ymm11 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7> DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12 - DB 196,98,125,24,45,39,45,2,0 ; vbroadcastss 0x22d27(%rip),%ymm13 # 2b5d4 <_sk_overlay_sse2_8bit+0x4b3> + DB 196,98,125,24,45,99,49,2,0 ; vbroadcastss 0x23163(%rip),%ymm13 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12 - DB 196,98,125,24,53,28,45,2,0 ; vbroadcastss 0x22d1c(%rip),%ymm14 # 2b5dc <_sk_overlay_sse2_8bit+0x4bb> + DB 196,98,125,24,53,88,49,2,0 ; vbroadcastss 0x23158(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb> DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12 - DB 196,98,125,24,61,18,45,2,0 ; vbroadcastss 0x22d12(%rip),%ymm15 # 2b5e0 <_sk_overlay_sse2_8bit+0x4bf> + DB 196,98,125,24,61,78,49,2,0 ; vbroadcastss 0x2314e(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf> DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9 DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9 DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9 - DB 196,98,125,24,37,254,44,2,0 ; vbroadcastss 0x22cfe(%rip),%ymm12 # 2b5e4 <_sk_overlay_sse2_8bit+0x4c3> + DB 196,98,125,24,37,58,49,2,0 ; vbroadcastss 0x2313a(%rip),%ymm12 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3> DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9 @@ -8262,12 +8359,12 @@ _sk_to_srgb_avx LABEL PROC PUBLIC _sk_rgb_to_hsl_avx _sk_rgb_to_hsl_avx LABEL PROC - DB 197,124,95,193 ; vmaxps %ymm1,%ymm0,%ymm8 - DB 197,60,95,194 ; vmaxps %ymm2,%ymm8,%ymm8 - DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9 - DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9 + DB 197,116,95,194 ; vmaxps %ymm2,%ymm1,%ymm8 + DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8 + DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9 + DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9 DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,29,12,44,2,0 ; vbroadcastss 0x22c0c(%rip),%ymm11 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,29,70,48,2,0 ; vbroadcastss 0x23046(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11 DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12 DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12 @@ -8277,19 +8374,19 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2 DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1 DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,57,44,2,0 ; vbroadcastss 0x22c39(%rip),%ymm11 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf> + DB 196,98,125,24,29,115,48,2,0 ; vbroadcastss 0x23073(%rip),%ymm11 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,39,44,2,0 ; vbroadcastss 0x22c27(%rip),%ymm11 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb> + DB 196,98,125,24,29,97,48,2,0 ; vbroadcastss 0x23061(%rip),%ymm11 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,15,44,2,0 ; vbroadcastss 0x22c0f(%rip),%ymm2 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7> + DB 196,226,125,24,21,73,48,2,0 ; vbroadcastss 0x23049(%rip),%ymm2 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7> DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14 DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2 DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0 DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2 DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0 DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1 - DB 196,98,125,24,37,138,43,2,0 ; vbroadcastss 0x22b8a(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,37,196,47,2,0 ; vbroadcastss 0x22fc4(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2 DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12 DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11 @@ -8299,7 +8396,7 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0 DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - DB 196,98,125,24,5,185,43,2,0 ; vbroadcastss 0x22bb9(%rip),%ymm8 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3> + DB 196,98,125,24,5,243,47,2,0 ; vbroadcastss 0x22ff3(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -8314,7 +8411,7 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp) DB 197,252,40,225 ; vmovaps %ymm1,%ymm4 DB 197,252,40,216 ; vmovaps %ymm0,%ymm3 - DB 196,98,125,24,5,16,43,2,0 ; vbroadcastss 0x22b10(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,74,47,2,0 ; vbroadcastss 0x22f4a(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9 DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10 DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11 @@ -8322,23 +8419,23 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10 DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,29,82,43,2,0 ; vbroadcastss 0x22b52(%rip),%ymm11 # 2b5f8 <_sk_overlay_sse2_8bit+0x4d7> + DB 196,98,125,24,29,140,47,2,0 ; vbroadcastss 0x22f8c(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7> DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11 DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12 DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15 DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11 - DB 196,98,125,24,37,36,43,2,0 ; vbroadcastss 0x22b24(%rip),%ymm12 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7> + DB 196,98,125,24,37,94,47,2,0 ; vbroadcastss 0x22f5e(%rip),%ymm12 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7> DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0 - DB 196,98,125,24,45,30,43,2,0 ; vbroadcastss 0x22b1e(%rip),%ymm13 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf> + DB 196,98,125,24,45,88,47,2,0 ; vbroadcastss 0x22f58(%rip),%ymm13 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf> DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14 DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14 DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14 - DB 196,226,125,24,13,19,43,2,0 ; vbroadcastss 0x22b13(%rip),%ymm1 # 2b5fc <_sk_overlay_sse2_8bit+0x4db> + DB 196,226,125,24,13,77,47,2,0 ; vbroadcastss 0x22f4d(%rip),%ymm1 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db> DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7 DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7 DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14 DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - DB 196,98,125,24,53,234,42,2,0 ; vbroadcastss 0x22aea(%rip),%ymm14 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3> + DB 196,98,125,24,53,36,47,2,0 ; vbroadcastss 0x22f24(%rip),%ymm14 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3> DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15 DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -8357,7 +8454,7 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6 DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6 DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - DB 196,226,125,24,5,148,42,2,0 ; vbroadcastss 0x22a94(%rip),%ymm0 # 2b600 <_sk_overlay_sse2_8bit+0x4df> + DB 196,226,125,24,5,206,46,2,0 ; vbroadcastss 0x22ece(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df> DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0 DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3 DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0 @@ -8408,15 +8505,15 @@ _sk_scale_u8_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,75 ; jne 8c79 <_sk_scale_u8_avx+0x64> + DB 117,75 ; jne 8e2b <_sk_scale_u8_avx+0x64> DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8 - DB 197,57,219,5,244,50,2,0 ; vpand 0x232f4(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,57,219,5,34,55,2,0 ; vpand 0x23722(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,165,41,2,0 ; vbroadcastss 0x229a5(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,13,223,45,2,0 ; vbroadcastss 0x22ddf(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -8430,15 +8527,15 @@ _sk_scale_u8_avx LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,166 ; ja 8c34 <_sk_scale_u8_avx+0x1f> + DB 119,166 ; ja 8de6 <_sk_scale_u8_avx+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,123,0,0,0 ; lea 0x7b(%rip),%r11 # 8d14 <_sk_scale_u8_avx+0xff> + DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 8ec4 <_sk_scale_u8_avx+0xfd> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 235,135 ; jmp 8c34 <_sk_scale_u8_avx+0x1f> + DB 235,135 ; jmp 8de6 <_sk_scale_u8_avx+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -8446,7 +8543,7 @@ _sk_scale_u8_avx LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8 - DB 233,94,255,255,255 ; jmpq 8c34 <_sk_scale_u8_avx+0x1f> + DB 233,94,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -8457,21 +8554,114 @@ _sk_scale_u8_avx LABEL PROC DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - DB 233,34,255,255,255 ; jmpq 8c34 <_sk_scale_u8_avx+0x1f> - DB 102,144 ; xchg %ax,%ax - DB 142,255 ; mov %edi,%? + DB 233,34,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f> + DB 144 ; nop DB 255 ; (bad) - DB 255,169,255,255,255,153 ; ljmp *-0x66000001(%rcx) DB 255 ; (bad) + DB 255,171,255,255,255,155 ; ljmp *-0x64000001(%rbx) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,221 ; callq ffffffffde008d24 <_sk_overlay_sse2_8bit+0xffffffffddfddc03> DB 255 ; (bad) + DB 234 ; (bad) DB 255 ; (bad) - DB 255,210 ; callq *%rdx DB 255 ; (bad) DB 255 ; (bad) - DB 255,194 ; inc %edx + DB 223,255 ; (bad) + DB 255 ; (bad) + DB 255,212 ; callq *%rsp + DB 255 ; (bad) + DB 255 ; (bad) + DB 255,196 ; inc %esp + DB 255 ; (bad) + DB 255 ; (bad) + DB 255 ; .byte 0xff + +PUBLIC _sk_scale_565_avx +_sk_scale_565_avx LABEL PROC + DB 83 ; push %rbx + DB 72,173 ; lods %ds:(%rsi),%rax + DB 76,99,80,8 ; movslq 0x8(%rax),%r10 + DB 76,99,201 ; movslq %ecx,%r9 + DB 77,15,175,202 ; imul %r10,%r9 + DB 77,1,201 ; add %r9,%r9 + DB 76,3,8 ; add (%rax),%r9 + DB 72,99,218 ; movslq %edx,%rbx + DB 77,133,192 ; test %r8,%r8 + DB 15,133,178,0,0,0 ; jne 8fb2 <_sk_scale_565_avx+0xd2> + DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8 + DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 + DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 + DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 + DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 + DB 196,98,125,24,13,208,44,2,0 ; vbroadcastss 0x22cd0(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9 + DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 + DB 196,98,125,24,21,193,44,2,0 ; vbroadcastss 0x22cc1(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> + DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 + DB 196,98,125,24,21,183,44,2,0 ; vbroadcastss 0x22cb7(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> + DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10 + DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 + DB 196,98,125,24,29,168,44,2,0 ; vbroadcastss 0x22ca8(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 + DB 196,98,125,24,29,158,44,2,0 ; vbroadcastss 0x22c9e(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8 + DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 + DB 196,98,125,24,29,143,44,2,0 ; vbroadcastss 0x22c8f(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> + DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 + DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11 + DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12 + DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12 + DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13 + DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13 + DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11 + DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 + DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1 + DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2 + DB 197,164,89,219 ; vmulps %ymm3,%ymm11,%ymm3 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 91 ; pop %rbx + DB 255,224 ; jmpq *%rax + DB 69,137,194 ; mov %r8d,%r10d + DB 65,128,226,7 ; and $0x7,%r10b + DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 + DB 65,254,202 ; dec %r10b + DB 65,128,250,6 ; cmp $0x6,%r10b + DB 15,135,59,255,255,255 ; ja 8f06 <_sk_scale_565_avx+0x26> + DB 69,15,182,210 ; movzbl %r10b,%r10d + DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 903c <_sk_scale_565_avx+0x15c> + DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax + DB 76,1,216 ; add %r11,%rax + DB 255,224 ; jmpq *%rax + DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax + DB 197,121,110,192 ; vmovd %eax,%xmm8 + DB 233,25,255,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26> + DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 + DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9 + DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8 + DB 233,251,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26> + DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 + DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 + DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9 + DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8 + DB 233,205,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26> + DB 15,31,0 ; nopl (%rax) + DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff + DB 255 ; (bad) + DB 255 ; (bad) + DB 255 ; (bad) + DB 236 ; in (%dx),%al + DB 255 ; (bad) + DB 255 ; (bad) + DB 255,228 ; jmpq *%rsp + DB 255 ; (bad) + DB 255 ; (bad) + DB 255 ; (bad) + DB 220,255 ; fdivr %st,%st(7) + DB 255 ; (bad) + DB 255,207 ; dec %edi DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -8505,15 +8695,15 @@ _sk_lerp_u8_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,111 ; jne 8df7 <_sk_lerp_u8_avx+0x88> + DB 117,111 ; jne 911f <_sk_lerp_u8_avx+0x88> DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8 - DB 197,57,219,5,154,49,2,0 ; vpand 0x2319a(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,57,219,5,82,52,2,0 ; vpand 0x23452(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,75,40,2,0 ; vbroadcastss 0x2284b(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,13,15,43,2,0 ; vbroadcastss 0x22b0f(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 @@ -8535,15 +8725,15 @@ _sk_lerp_u8_avx LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,130 ; ja 8d8e <_sk_lerp_u8_avx+0x1f> + DB 119,130 ; ja 90b6 <_sk_lerp_u8_avx+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 8e94 <_sk_lerp_u8_avx+0x125> + DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 91bc <_sk_lerp_u8_avx+0x125> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 233,96,255,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f> + DB 233,96,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -8551,7 +8741,7 @@ _sk_lerp_u8_avx LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8 - DB 233,55,255,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f> + DB 233,55,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -8562,7 +8752,7 @@ _sk_lerp_u8_avx LABEL PROC DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - DB 233,251,254,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f> + DB 233,251,254,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f> DB 144 ; nop DB 140,255 ; mov %?,%edi DB 255 ; (bad) @@ -8570,7 +8760,7 @@ _sk_lerp_u8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf008ea4 <_sk_overlay_sse2_8bit+0xffffffffdefddd83> + DB 233,255,255,255,222 ; jmpq ffffffffdf0091cc <_sk_overlay_sse2_8bit+0xffffffffdefddabf> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -8592,27 +8782,33 @@ _sk_lerp_565_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,209,0,0,0 ; jne 8fa1 <_sk_lerp_565_avx+0xf1> + DB 15,133,214,0,0,0 ; jne 92ce <_sk_lerp_565_avx+0xf6> DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - DB 196,98,125,24,13,20,39,2,0 ; vbroadcastss 0x22714(%rip),%ymm9 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,98,125,24,13,216,41,2,0 ; vbroadcastss 0x229d8(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9 DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 - DB 196,98,125,24,21,5,39,2,0 ; vbroadcastss 0x22705(%rip),%ymm10 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,98,125,24,21,201,41,2,0 ; vbroadcastss 0x229c9(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,251,38,2,0 ; vbroadcastss 0x226fb(%rip),%ymm10 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,98,125,24,21,191,41,2,0 ; vbroadcastss 0x229bf(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10 DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 - DB 196,98,125,24,29,236,38,2,0 ; vbroadcastss 0x226ec(%rip),%ymm11 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,98,125,24,29,176,41,2,0 ; vbroadcastss 0x229b0(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,29,226,38,2,0 ; vbroadcastss 0x226e2(%rip),%ymm11 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,98,125,24,29,166,41,2,0 ; vbroadcastss 0x229a6(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,29,211,38,2,0 ; vbroadcastss 0x226d3(%rip),%ymm11 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,98,125,24,29,151,41,2,0 ; vbroadcastss 0x22997(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 + DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11 + DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12 + DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12 + DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13 + DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13 + DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0 @@ -8623,14 +8819,8 @@ _sk_lerp_565_avx LABEL PROC DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2 DB 197,228,92,223 ; vsubps %ymm7,%ymm3,%ymm3 - DB 196,65,100,89,201 ; vmulps %ymm9,%ymm3,%ymm9 - DB 197,52,88,207 ; vaddps %ymm7,%ymm9,%ymm9 - DB 196,65,100,89,210 ; vmulps %ymm10,%ymm3,%ymm10 - DB 197,44,88,215 ; vaddps %ymm7,%ymm10,%ymm10 - DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 + DB 196,193,100,89,219 ; vmulps %ymm11,%ymm3,%ymm3 DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3 - DB 197,172,95,219 ; vmaxps %ymm3,%ymm10,%ymm3 - DB 197,180,95,219 ; vmaxps %ymm3,%ymm9,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -8639,42 +8829,42 @@ _sk_lerp_565_avx LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,28,255,255,255 ; ja 8ed6 <_sk_lerp_565_avx+0x26> + DB 15,135,23,255,255,255 ; ja 91fe <_sk_lerp_565_avx+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 9028 <_sk_lerp_565_avx+0x178> + DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 9358 <_sk_lerp_565_avx+0x180> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 233,250,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26> + DB 233,245,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9 DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8 - DB 233,220,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26> + DB 233,215,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8 DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9 DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - DB 233,174,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26> - DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi) + DB 233,169,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26> + DB 15,31,0 ; nopl (%rax) + DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff DB 255 ; (bad) DB 255 ; (bad) - DB 255,193 ; inc %ecx DB 255 ; (bad) + DB 236 ; in (%dx),%al DB 255 ; (bad) - DB 255,180,255,255,255,239,255 ; pushq -0x100001(%rdi,%rdi,8) DB 255 ; (bad) - DB 255,231 ; jmpq *%rdi + DB 255,228 ; jmpq *%rsp DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 223,255 ; (bad) + DB 220,255 ; fdivr %st,%st(7) DB 255 ; (bad) - DB 255,210 ; callq *%rdx + DB 255,207 ; dec %edi DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -8686,9 +8876,9 @@ _sk_load_tables_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 77,133,192 ; test %r8,%r8 - DB 15,133,7,2,0,0 ; jne 9262 <_sk_load_tables_avx+0x21e> + DB 15,133,7,2,0,0 ; jne 9592 <_sk_load_tables_avx+0x21e> DB 196,65,125,16,20,145 ; vmovupd (%r9,%rdx,4),%ymm10 - DB 197,125,40,13,247,41,2,0 ; vmovapd 0x229f7(%rip),%ymm9 # 2ba60 <_sk_overlay_sse2_8bit+0x93f> + DB 197,125,40,13,167,44,2,0 ; vmovapd 0x22ca7(%rip),%ymm9 # 2c040 <_sk_overlay_sse2_8bit+0x933> DB 196,193,45,84,201 ; vandpd %ymm9,%ymm10,%ymm1 DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0 DB 196,193,249,126,193 ; vmovq %xmm0,%r9 @@ -8780,7 +8970,7 @@ _sk_load_tables_avx LABEL PROC DB 196,193,65,114,213,24 ; vpsrld $0x18,%xmm13,%xmm7 DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,226,125,24,61,179,35,2,0 ; vbroadcastss 0x223b3(%rip),%ymm7 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,61,111,38,2,0 ; vbroadcastss 0x2266f(%rip),%ymm7 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7 @@ -8791,21 +8981,21 @@ _sk_load_tables_avx LABEL PROC DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,230,253,255,255 ; ja 9061 <_sk_load_tables_avx+0x1d> + DB 15,135,230,253,255,255 ; ja 9391 <_sk_load_tables_avx+0x1d> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 9318 <_sk_load_tables_avx+0x2d4> + DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 9648 <_sk_load_tables_avx+0x2d4> DB 79,99,20,147 ; movslq (%r11,%r10,4),%r10 DB 77,1,218 ; add %r11,%r10 DB 65,255,226 ; jmpq *%r10 DB 196,65,122,16,20,145 ; vmovss (%r9,%rdx,4),%xmm10 - DB 233,198,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d> + DB 233,198,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d> DB 196,193,121,110,68,145,8 ; vmovd 0x8(%r9,%rdx,4),%xmm0 DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 196,99,117,12,208,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm10 DB 196,193,123,16,4,145 ; vmovsd (%r9,%rdx,4),%xmm0 DB 196,99,45,13,208,1 ; vblendpd $0x1,%ymm0,%ymm10,%ymm10 - DB 233,159,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d> + DB 233,159,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d> DB 196,193,121,110,68,145,24 ; vmovd 0x18(%r9,%rdx,4),%xmm0 DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 @@ -8819,9 +9009,9 @@ _sk_load_tables_avx LABEL PROC DB 196,99,45,24,208,1 ; vinsertf128 $0x1,%xmm0,%ymm10,%ymm10 DB 196,193,121,16,4,145 ; vmovupd (%r9,%rdx,4),%xmm0 DB 196,67,125,13,210,12 ; vblendpd $0xc,%ymm10,%ymm0,%ymm10 - DB 233,74,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d> + DB 233,74,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d> DB 144 ; nop - DB 120,255 ; js 9319 <_sk_load_tables_avx+0x2d5> + DB 120,255 ; js 9649 <_sk_load_tables_avx+0x2d5> DB 255 ; (bad) DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx) DB 255 ; (bad) @@ -8850,7 +9040,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 DB 197,252,17,60,36 ; vmovups %ymm7,(%rsp) - DB 15,133,87,2,0,0 ; jne 95aa <_sk_load_tables_u16_be_avx+0x276> + DB 15,133,87,2,0,0 ; jne 98da <_sk_load_tables_u16_be_avx+0x276> DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8 DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2 DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -8865,7 +9055,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11 DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1 DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12 - DB 197,121,111,21,144,43,2,0 ; vmovdqa 0x22b90(%rip),%xmm10 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,121,111,21,64,46,2,0 ; vmovdqa 0x22e40(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2 @@ -8963,7 +9153,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3 DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,226,125,24,61,135,32,2,0 ; vbroadcastss 0x22087(%rip),%ymm7 # 2b620 <_sk_overlay_sse2_8bit+0x4ff> + DB 196,226,125,24,61,67,35,2,0 ; vbroadcastss 0x22343(%rip),%ymm7 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff> DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7 @@ -8972,29 +9162,29 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 9610 <_sk_load_tables_u16_be_avx+0x2dc> + DB 116,85 ; je 9940 <_sk_load_tables_u16_be_avx+0x2dc> DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 9610 <_sk_load_tables_u16_be_avx+0x2dc> + DB 114,72 ; jb 9940 <_sk_load_tables_u16_be_avx+0x2dc> DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 961d <_sk_load_tables_u16_be_avx+0x2e9> + DB 116,72 ; je 994d <_sk_load_tables_u16_be_avx+0x2e9> DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 961d <_sk_load_tables_u16_be_avx+0x2e9> + DB 114,59 ; jb 994d <_sk_load_tables_u16_be_avx+0x2e9> DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,123,253,255,255 ; je 936e <_sk_load_tables_u16_be_avx+0x3a> + DB 15,132,123,253,255,255 ; je 969e <_sk_load_tables_u16_be_avx+0x3a> DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,106,253,255,255 ; jb 936e <_sk_load_tables_u16_be_avx+0x3a> + DB 15,130,106,253,255,255 ; jb 969e <_sk_load_tables_u16_be_avx+0x3a> DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9 - DB 233,94,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a> + DB 233,94,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,81,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a> + DB 233,81,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,72,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a> + DB 233,72,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a> PUBLIC _sk_load_tables_rgb_u16_be_avx _sk_load_tables_rgb_u16_be_avx LABEL PROC @@ -9005,7 +9195,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 197,252,17,124,36,32 ; vmovups %ymm7,0x20(%rsp) DB 197,252,17,52,36 ; vmovups %ymm6,(%rsp) - DB 15,133,74,2,0,0 ; jne 9891 <_sk_load_tables_rgb_u16_be_avx+0x26b> + DB 15,133,74,2,0,0 ; jne 9bc1 <_sk_load_tables_rgb_u16_be_avx+0x26b> DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0 DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2 DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -9026,7 +9216,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3 DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11 DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8 - DB 197,121,111,13,127,40,2,0 ; vmovdqa 0x2287f(%rip),%xmm9 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,121,111,13,47,43,2,0 ; vmovdqa 0x22b2f(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0 DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10 DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -9116,7 +9306,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2 DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,16,29,2,0 ; vbroadcastss 0x21d10(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,204,31,2,0 ; vbroadcastss 0x21fcc(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6 DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7 DB 72,131,196,88 ; add $0x58,%rsp @@ -9124,41 +9314,41 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0 DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne 98aa <_sk_load_tables_rgb_u16_be_avx+0x284> - DB 233,209,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 117,5 ; jne 9bda <_sk_load_tables_rgb_u16_be_avx+0x284> + DB 233,209,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55> DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1 DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb 98d9 <_sk_load_tables_rgb_u16_be_avx+0x2b3> + DB 114,26 ; jb 9c09 <_sk_load_tables_rgb_u16_be_avx+0x2b3> DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1 DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne 98de <_sk_load_tables_rgb_u16_be_avx+0x2b8> - DB 233,162,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55> - DB 233,157,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 117,10 ; jne 9c0e <_sk_load_tables_rgb_u16_be_avx+0x2b8> + DB 233,162,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,157,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55> DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1 DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb 990d <_sk_load_tables_rgb_u16_be_avx+0x2e7> + DB 114,26 ; jb 9c3d <_sk_load_tables_rgb_u16_be_avx+0x2e7> DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1 DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne 9912 <_sk_load_tables_rgb_u16_be_avx+0x2ec> - DB 233,110,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55> - DB 233,105,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 117,10 ; jne 9c42 <_sk_load_tables_rgb_u16_be_avx+0x2ec> + DB 233,110,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,105,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55> DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3 DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb 993b <_sk_load_tables_rgb_u16_be_avx+0x315> + DB 114,20 ; jb 9c6b <_sk_load_tables_rgb_u16_be_avx+0x315> DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3 DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - DB 233,64,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55> - DB 233,59,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,64,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,59,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55> PUBLIC _sk_byte_tables_avx _sk_byte_tables_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,113,28,2,0 ; vbroadcastss 0x21c71(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,45,31,2,0 ; vbroadcastss 0x21f2d(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9 DB 196,65,249,126,201 ; vmovq %xmm9,%r9 @@ -9277,7 +9467,7 @@ _sk_byte_tables_avx LABEL PROC DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1 DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2 DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 - DB 196,98,125,24,13,95,26,2,0 ; vbroadcastss 0x21a5f(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,13,27,29,2,0 ; vbroadcastss 0x21d1b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1 @@ -9391,7 +9581,7 @@ _sk_byte_tables_rgb_avx LABEL PROC DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,60,24,2,0 ; vbroadcastss 0x2183c(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,13,248,26,2,0 ; vbroadcastss 0x21af8(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1 DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2 @@ -9586,36 +9776,36 @@ _sk_parametric_r_avx LABEL PROC DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11 - DB 196,98,125,24,37,5,21,2,0 ; vbroadcastss 0x21505(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,37,193,23,2,0 ; vbroadcastss 0x217c1(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,251,20,2,0 ; vbroadcastss 0x214fb(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,183,23,2,0 ; vbroadcastss 0x217b7(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,81,20,2,0 ; vbroadcastss 0x21451(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,37,13,23,2,0 ; vbroadcastss 0x2170d(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,227,20,2,0 ; vbroadcastss 0x214e3(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,37,159,23,2,0 ; vbroadcastss 0x2179f(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,217,20,2,0 ; vbroadcastss 0x214d9(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,37,149,23,2,0 ; vbroadcastss 0x21795(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,202,20,2,0 ; vbroadcastss 0x214ca(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,134,23,2,0 ; vbroadcastss 0x21786(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,192,20,2,0 ; vbroadcastss 0x214c0(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,124,23,2,0 ; vbroadcastss 0x2177c(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0 DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,164,20,2,0 ; vbroadcastss 0x214a4(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,96,23,2,0 ; vbroadcastss 0x21760(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,154,20,2,0 ; vbroadcastss 0x2149a(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,86,23,2,0 ; vbroadcastss 0x21756(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,139,20,2,0 ; vbroadcastss 0x2148b(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,98,125,24,29,71,23,2,0 ; vbroadcastss 0x21747(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,129,20,2,0 ; vbroadcastss 0x21481(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,29,61,23,2,0 ; vbroadcastss 0x2173d(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0 - DB 196,98,125,24,21,114,20,2,0 ; vbroadcastss 0x21472(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,46,23,2,0 ; vbroadcastss 0x2172e(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9623,7 +9813,7 @@ _sk_parametric_r_avx LABEL PROC DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,137,19,2,0 ; vbroadcastss 0x21389(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,69,22,2,0 ; vbroadcastss 0x21645(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9643,36 +9833,36 @@ _sk_parametric_g_avx LABEL PROC DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11 - DB 196,98,125,24,37,202,19,2,0 ; vbroadcastss 0x213ca(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,37,134,22,2,0 ; vbroadcastss 0x21686(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,192,19,2,0 ; vbroadcastss 0x213c0(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,124,22,2,0 ; vbroadcastss 0x2167c(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,22,19,2,0 ; vbroadcastss 0x21316(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,37,210,21,2,0 ; vbroadcastss 0x215d2(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,168,19,2,0 ; vbroadcastss 0x213a8(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,37,100,22,2,0 ; vbroadcastss 0x21664(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,158,19,2,0 ; vbroadcastss 0x2139e(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,37,90,22,2,0 ; vbroadcastss 0x2165a(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,143,19,2,0 ; vbroadcastss 0x2138f(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,75,22,2,0 ; vbroadcastss 0x2164b(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,133,19,2,0 ; vbroadcastss 0x21385(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,65,22,2,0 ; vbroadcastss 0x21641(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1 DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1 DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1 DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10 DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10 - DB 196,98,125,24,29,105,19,2,0 ; vbroadcastss 0x21369(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,37,22,2,0 ; vbroadcastss 0x21625(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,95,19,2,0 ; vbroadcastss 0x2135f(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,27,22,2,0 ; vbroadcastss 0x2161b(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,80,19,2,0 ; vbroadcastss 0x21350(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,98,125,24,29,12,22,2,0 ; vbroadcastss 0x2160c(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,70,19,2,0 ; vbroadcastss 0x21346(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,29,2,22,2,0 ; vbroadcastss 0x21602(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1 - DB 196,98,125,24,21,55,19,2,0 ; vbroadcastss 0x21337(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,243,21,2,0 ; vbroadcastss 0x215f3(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9680,7 +9870,7 @@ _sk_parametric_g_avx LABEL PROC DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,5,78,18,2,0 ; vbroadcastss 0x2124e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,10,21,2,0 ; vbroadcastss 0x2150a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9700,36 +9890,36 @@ _sk_parametric_b_avx LABEL PROC DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11 - DB 196,98,125,24,37,143,18,2,0 ; vbroadcastss 0x2128f(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,37,75,21,2,0 ; vbroadcastss 0x2154b(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,133,18,2,0 ; vbroadcastss 0x21285(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,65,21,2,0 ; vbroadcastss 0x21541(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,219,17,2,0 ; vbroadcastss 0x211db(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,37,151,20,2,0 ; vbroadcastss 0x21497(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,109,18,2,0 ; vbroadcastss 0x2126d(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,37,41,21,2,0 ; vbroadcastss 0x21529(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,99,18,2,0 ; vbroadcastss 0x21263(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,37,31,21,2,0 ; vbroadcastss 0x2151f(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,84,18,2,0 ; vbroadcastss 0x21254(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,16,21,2,0 ; vbroadcastss 0x21510(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,74,18,2,0 ; vbroadcastss 0x2124a(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,6,21,2,0 ; vbroadcastss 0x21506(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2 DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10 DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10 - DB 196,98,125,24,29,46,18,2,0 ; vbroadcastss 0x2122e(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,234,20,2,0 ; vbroadcastss 0x214ea(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,36,18,2,0 ; vbroadcastss 0x21224(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,224,20,2,0 ; vbroadcastss 0x214e0(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,21,18,2,0 ; vbroadcastss 0x21215(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,98,125,24,29,209,20,2,0 ; vbroadcastss 0x214d1(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,11,18,2,0 ; vbroadcastss 0x2120b(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,29,199,20,2,0 ; vbroadcastss 0x214c7(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2 - DB 196,98,125,24,21,252,17,2,0 ; vbroadcastss 0x211fc(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,184,20,2,0 ; vbroadcastss 0x214b8(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9737,7 +9927,7 @@ _sk_parametric_b_avx LABEL PROC DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,19,17,2,0 ; vbroadcastss 0x21113(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,207,19,2,0 ; vbroadcastss 0x213cf(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9757,36 +9947,36 @@ _sk_parametric_a_avx LABEL PROC DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11 - DB 196,98,125,24,37,84,17,2,0 ; vbroadcastss 0x21154(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,37,16,20,2,0 ; vbroadcastss 0x21410(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,74,17,2,0 ; vbroadcastss 0x2114a(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,37,6,20,2,0 ; vbroadcastss 0x21406(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,160,16,2,0 ; vbroadcastss 0x210a0(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,37,92,19,2,0 ; vbroadcastss 0x2135c(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,50,17,2,0 ; vbroadcastss 0x21132(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,37,238,19,2,0 ; vbroadcastss 0x213ee(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,40,17,2,0 ; vbroadcastss 0x21128(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,37,228,19,2,0 ; vbroadcastss 0x213e4(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,25,17,2,0 ; vbroadcastss 0x21119(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,213,19,2,0 ; vbroadcastss 0x213d5(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,15,17,2,0 ; vbroadcastss 0x2110f(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,37,203,19,2,0 ; vbroadcastss 0x213cb(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3 DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3 DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3 DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10 DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10 - DB 196,98,125,24,29,243,16,2,0 ; vbroadcastss 0x210f3(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,29,175,19,2,0 ; vbroadcastss 0x213af(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,233,16,2,0 ; vbroadcastss 0x210e9(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,98,125,24,29,165,19,2,0 ; vbroadcastss 0x213a5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,218,16,2,0 ; vbroadcastss 0x210da(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,98,125,24,29,150,19,2,0 ; vbroadcastss 0x21396(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,208,16,2,0 ; vbroadcastss 0x210d0(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,98,125,24,29,140,19,2,0 ; vbroadcastss 0x2138c(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3 - DB 196,98,125,24,21,193,16,2,0 ; vbroadcastss 0x210c1(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,98,125,24,21,125,19,2,0 ; vbroadcastss 0x2137d(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9794,7 +9984,7 @@ _sk_parametric_a_avx LABEL PROC DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3 - DB 196,98,125,24,5,216,15,2,0 ; vbroadcastss 0x20fd8(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,148,18,2,0 ; vbroadcastss 0x21294(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9811,34 +10001,34 @@ _sk_gamma_avx LABEL PROC DB 197,252,40,233 ; vmovaps %ymm1,%ymm5 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1 - DB 196,98,125,24,5,33,16,2,0 ; vbroadcastss 0x21021(%rip),%ymm8 # 2b624 <_sk_overlay_sse2_8bit+0x503> + DB 196,98,125,24,5,221,18,2,0 ; vbroadcastss 0x212dd(%rip),%ymm8 # 2bc10 <_sk_overlay_sse2_8bit+0x503> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,13,23,16,2,0 ; vbroadcastss 0x21017(%rip),%ymm9 # 2b628 <_sk_overlay_sse2_8bit+0x507> + DB 196,98,125,24,13,211,18,2,0 ; vbroadcastss 0x212d3(%rip),%ymm9 # 2bc14 <_sk_overlay_sse2_8bit+0x507> DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0 - DB 196,226,125,24,37,109,15,2,0 ; vbroadcastss 0x20f6d(%rip),%ymm4 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,37,41,18,2,0 ; vbroadcastss 0x21229(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0 - DB 196,98,125,24,21,0,16,2,0 ; vbroadcastss 0x21000(%rip),%ymm10 # 2b62c <_sk_overlay_sse2_8bit+0x50b> + DB 196,98,125,24,21,188,18,2,0 ; vbroadcastss 0x212bc(%rip),%ymm10 # 2bc18 <_sk_overlay_sse2_8bit+0x50b> DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1 - DB 196,98,125,24,29,246,15,2,0 ; vbroadcastss 0x20ff6(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f> + DB 196,98,125,24,29,178,18,2,0 ; vbroadcastss 0x212b2(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f> DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2 DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1 - DB 196,98,125,24,37,232,15,2,0 ; vbroadcastss 0x20fe8(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513> + DB 196,98,125,24,37,164,18,2,0 ; vbroadcastss 0x212a4(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513> DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,45,222,15,2,0 ; vbroadcastss 0x20fde(%rip),%ymm13 # 2b638 <_sk_overlay_sse2_8bit+0x517> + DB 196,98,125,24,45,154,18,2,0 ; vbroadcastss 0x2129a(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517> DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0 DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0 DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14 DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0 DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1 DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6 - DB 196,98,125,24,61,189,15,2,0 ; vbroadcastss 0x20fbd(%rip),%ymm15 # 2b63c <_sk_overlay_sse2_8bit+0x51b> + DB 196,98,125,24,61,121,18,2,0 ; vbroadcastss 0x21279(%rip),%ymm15 # 2bc28 <_sk_overlay_sse2_8bit+0x51b> DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0 - DB 196,226,125,24,29,179,15,2,0 ; vbroadcastss 0x20fb3(%rip),%ymm3 # 2b640 <_sk_overlay_sse2_8bit+0x51f> + DB 196,226,125,24,29,111,18,2,0 ; vbroadcastss 0x2126f(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f> DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1 DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1 - DB 196,226,125,24,21,166,15,2,0 ; vbroadcastss 0x20fa6(%rip),%ymm2 # 2b644 <_sk_overlay_sse2_8bit+0x523> + DB 196,226,125,24,21,98,18,2,0 ; vbroadcastss 0x21262(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523> DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0 - DB 196,226,125,24,53,157,15,2,0 ; vbroadcastss 0x20f9d(%rip),%ymm6 # 2b648 <_sk_overlay_sse2_8bit+0x527> + DB 196,226,125,24,53,89,18,2,0 ; vbroadcastss 0x21259(%rip),%ymm6 # 2bc34 <_sk_overlay_sse2_8bit+0x527> DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0 DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0 DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp) @@ -9880,7 +10070,7 @@ _sk_gamma_avx LABEL PROC DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2 DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2 DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,225,14,2,0 ; vbroadcastss 0x20ee1(%rip),%ymm2 # 2b64c <_sk_overlay_sse2_8bit+0x52b> + DB 196,226,125,24,21,157,17,2,0 ; vbroadcastss 0x2119d(%rip),%ymm2 # 2bc38 <_sk_overlay_sse2_8bit+0x52b> DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3 DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4 DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2 @@ -9898,31 +10088,31 @@ _sk_gamma_avx LABEL PROC PUBLIC _sk_lab_to_xyz_avx _sk_lab_to_xyz_avx LABEL PROC - DB 196,98,125,24,5,148,14,2,0 ; vbroadcastss 0x20e94(%rip),%ymm8 # 2b650 <_sk_overlay_sse2_8bit+0x52f> + DB 196,98,125,24,5,80,17,2,0 ; vbroadcastss 0x21150(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,242,13,2,0 ; vbroadcastss 0x20df2(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,174,16,2,0 ; vbroadcastss 0x210ae(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,13,124,14,2,0 ; vbroadcastss 0x20e7c(%rip),%ymm9 # 2b654 <_sk_overlay_sse2_8bit+0x533> + DB 196,98,125,24,13,56,17,2,0 ; vbroadcastss 0x21138(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0x533> DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2 - DB 196,98,125,24,5,104,14,2,0 ; vbroadcastss 0x20e68(%rip),%ymm8 # 2b658 <_sk_overlay_sse2_8bit+0x537> + DB 196,98,125,24,5,36,17,2,0 ; vbroadcastss 0x21124(%rip),%ymm8 # 2bc44 <_sk_overlay_sse2_8bit+0x537> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,94,14,2,0 ; vbroadcastss 0x20e5e(%rip),%ymm8 # 2b65c <_sk_overlay_sse2_8bit+0x53b> + DB 196,98,125,24,5,26,17,2,0 ; vbroadcastss 0x2111a(%rip),%ymm8 # 2bc48 <_sk_overlay_sse2_8bit+0x53b> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,84,14,2,0 ; vbroadcastss 0x20e54(%rip),%ymm8 # 2b660 <_sk_overlay_sse2_8bit+0x53f> + DB 196,98,125,24,5,16,17,2,0 ; vbroadcastss 0x21110(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1 - DB 196,98,125,24,5,70,14,2,0 ; vbroadcastss 0x20e46(%rip),%ymm8 # 2b664 <_sk_overlay_sse2_8bit+0x543> + DB 196,98,125,24,5,2,17,2,0 ; vbroadcastss 0x21102(%rip),%ymm8 # 2bc50 <_sk_overlay_sse2_8bit+0x543> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2 DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8 DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8 - DB 196,98,125,24,13,47,14,2,0 ; vbroadcastss 0x20e2f(%rip),%ymm9 # 2b668 <_sk_overlay_sse2_8bit+0x547> + DB 196,98,125,24,13,235,16,2,0 ; vbroadcastss 0x210eb(%rip),%ymm9 # 2bc54 <_sk_overlay_sse2_8bit+0x547> DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10 - DB 196,98,125,24,29,36,14,2,0 ; vbroadcastss 0x20e24(%rip),%ymm11 # 2b66c <_sk_overlay_sse2_8bit+0x54b> + DB 196,98,125,24,29,224,16,2,0 ; vbroadcastss 0x210e0(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,37,26,14,2,0 ; vbroadcastss 0x20e1a(%rip),%ymm12 # 2b670 <_sk_overlay_sse2_8bit+0x54f> + DB 196,98,125,24,37,214,16,2,0 ; vbroadcastss 0x210d6(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f> DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1 DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8 DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1 @@ -9937,9 +10127,9 @@ _sk_lab_to_xyz_avx LABEL PROC DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2 DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - DB 196,226,125,24,5,208,13,2,0 ; vbroadcastss 0x20dd0(%rip),%ymm0 # 2b674 <_sk_overlay_sse2_8bit+0x553> + DB 196,226,125,24,5,140,16,2,0 ; vbroadcastss 0x2108c(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553> DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,199,13,2,0 ; vbroadcastss 0x20dc7(%rip),%ymm8 # 2b678 <_sk_overlay_sse2_8bit+0x557> + DB 196,98,125,24,5,131,16,2,0 ; vbroadcastss 0x21083(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9954,15 +10144,15 @@ _sk_load_a8_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,67 ; jne a916 <_sk_load_a8_avx+0x5c> + DB 117,67 ; jne ac46 <_sk_load_a8_avx+0x5c> DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0 - DB 197,249,219,5,79,22,2,0 ; vpand 0x2164f(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,249,219,5,255,24,2,0 ; vpand 0x218ff(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,3,13,2,0 ; vbroadcastss 0x20d03(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,191,15,2,0 ; vbroadcastss 0x20fbf(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -9975,15 +10165,15 @@ _sk_load_a8_avx LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,175 ; ja a8d9 <_sk_load_a8_avx+0x1f> + DB 119,175 ; ja ac09 <_sk_load_a8_avx+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # a9ac <_sk_load_a8_avx+0xf2> + DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # acdc <_sk_load_a8_avx+0xf2> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,144 ; jmp a8d9 <_sk_load_a8_avx+0x1f> + DB 235,144 ; jmp ac09 <_sk_load_a8_avx+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -9991,7 +10181,7 @@ _sk_load_a8_avx LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,104,255,255,255 ; jmpq a8d9 <_sk_load_a8_avx+0x1f> + DB 233,104,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -10002,7 +10192,7 @@ _sk_load_a8_avx LABEL PROC DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,45,255,255,255 ; jmpq a8d9 <_sk_load_a8_avx+0x1f> + DB 233,45,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f> DB 146 ; xchg %eax,%edx DB 255 ; (bad) DB 255 ; (bad) @@ -10033,15 +10223,15 @@ _sk_load_a8_dst_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,67 ; jne aa24 <_sk_load_a8_dst_avx+0x5c> + DB 117,67 ; jne ad54 <_sk_load_a8_dst_avx+0x5c> DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4 - DB 197,217,219,37,65,21,2,0 ; vpand 0x21541(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,217,219,37,241,23,2,0 ; vpand 0x217f1(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5 DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,245,11,2,0 ; vbroadcastss 0x20bf5(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,45,177,14,2,0 ; vbroadcastss 0x20eb1(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 @@ -10054,15 +10244,15 @@ _sk_load_a8_dst_avx LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,175 ; ja a9e7 <_sk_load_a8_dst_avx+0x1f> + DB 119,175 ; ja ad17 <_sk_load_a8_dst_avx+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # aabc <_sk_load_a8_dst_avx+0xf4> + DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # adec <_sk_load_a8_dst_avx+0xf4> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 235,144 ; jmp a9e7 <_sk_load_a8_dst_avx+0x1f> + DB 235,144 ; jmp ad17 <_sk_load_a8_dst_avx+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -10070,7 +10260,7 @@ _sk_load_a8_dst_avx LABEL PROC DB 197,249,110,232 ; vmovd %eax,%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4 - DB 233,104,255,255,255 ; jmpq a9e7 <_sk_load_a8_dst_avx+0x1f> + DB 233,104,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -10081,7 +10271,7 @@ _sk_load_a8_dst_avx LABEL PROC DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - DB 233,45,255,255,255 ; jmpq a9e7 <_sk_load_a8_dst_avx+0x1f> + DB 233,45,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f> DB 102,144 ; xchg %ax,%ax DB 144 ; nop DB 255 ; (bad) @@ -10090,7 +10280,7 @@ _sk_load_a8_dst_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,221 ; callq ffffffffde00aacc <_sk_overlay_sse2_8bit+0xffffffffddfdf9ab> + DB 232,255,255,255,221 ; callq ffffffffde00adfc <_sk_overlay_sse2_8bit+0xffffffffddfdf6ef> DB 255 ; (bad) DB 255 ; (bad) DB 255,210 ; callq *%rdx @@ -10143,7 +10333,7 @@ _sk_gather_a8_avx LABEL PROC DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,96,10,2,0 ; vbroadcastss 0x20a60(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,28,13,2,0 ; vbroadcastss 0x20d1c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -10160,14 +10350,14 @@ _sk_store_a8_avx LABEL PROC DB 77,15,175,202 ; imul %r10,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,231,9,2,0 ; vbroadcastss 0x209e7(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,163,12,2,0 ; vbroadcastss 0x20ca3(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8 DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8 DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne abff <_sk_store_a8_avx+0x47> + DB 117,11 ; jne af2f <_sk_store_a8_avx+0x47> DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -10176,25 +10366,25 @@ _sk_store_a8_avx LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja abfa <_sk_store_a8_avx+0x42> + DB 119,235 ; ja af2a <_sk_store_a8_avx+0x42> DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8 DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # ac74 <_sk_store_a8_avx+0xbc> + DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # afa4 <_sk_store_a8_avx+0xbc> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1) - DB 235,201 ; jmp abfa <_sk_store_a8_avx+0x42> + DB 235,201 ; jmp af2a <_sk_store_a8_avx+0x42> DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1) - DB 196,98,57,0,5,254,18,2,0 ; vpshufb 0x212fe(%rip),%xmm8,%xmm8 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f> + DB 196,98,57,0,5,174,21,2,0 ; vpshufb 0x215ae(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13> DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1) - DB 235,175 ; jmp abfa <_sk_store_a8_avx+0x42> + DB 235,175 ; jmp af2a <_sk_store_a8_avx+0x42> DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1) DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1) DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1) - DB 196,98,57,0,5,228,18,2,0 ; vpshufb 0x212e4(%rip),%xmm8,%xmm8 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f> + DB 196,98,57,0,5,148,21,2,0 ; vpshufb 0x21594(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23> DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1) - DB 235,134 ; jmp abfa <_sk_store_a8_avx+0x42> + DB 235,134 ; jmp af2a <_sk_store_a8_avx+0x42> DB 180,255 ; mov $0xff,%ah DB 255 ; (bad) DB 255,197 ; inc %ebp @@ -10225,18 +10415,18 @@ _sk_load_g8_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,72 ; jne acf1 <_sk_load_g8_avx+0x61> + DB 117,72 ; jne b021 <_sk_load_g8_avx+0x61> DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0 - DB 197,249,219,5,121,18,2,0 ; vpand 0x21279(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,249,219,5,41,21,2,0 ; vpand 0x21529(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,45,9,2,0 ; vbroadcastss 0x2092d(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,233,11,2,0 ; vbroadcastss 0x20be9(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,170,8,2,0 ; vbroadcastss 0x208aa(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,102,11,2,0 ; vbroadcastss 0x20b66(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 91 ; pop %rbx @@ -10246,15 +10436,15 @@ _sk_load_g8_avx LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,170 ; ja acaf <_sk_load_g8_avx+0x1f> + DB 119,170 ; ja afdf <_sk_load_g8_avx+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # ad88 <_sk_load_g8_avx+0xf8> + DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b0b8 <_sk_load_g8_avx+0xf8> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,139 ; jmp acaf <_sk_load_g8_avx+0x1f> + DB 235,139 ; jmp afdf <_sk_load_g8_avx+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -10262,7 +10452,7 @@ _sk_load_g8_avx LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,99,255,255,255 ; jmpq acaf <_sk_load_g8_avx+0x1f> + DB 233,99,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -10273,7 +10463,7 @@ _sk_load_g8_avx LABEL PROC DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,40,255,255,255 ; jmpq acaf <_sk_load_g8_avx+0x1f> + DB 233,40,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f> DB 144 ; nop DB 145 ; xchg %eax,%ecx DB 255 ; (bad) @@ -10282,7 +10472,7 @@ _sk_load_g8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf00ad98 <_sk_overlay_sse2_8bit+0xffffffffdefdfc77> + DB 233,255,255,255,222 ; jmpq ffffffffdf00b0c8 <_sk_overlay_sse2_8bit+0xffffffffdefdf9bb> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -10303,18 +10493,18 @@ _sk_load_g8_dst_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 117,72 ; jne ae05 <_sk_load_g8_dst_avx+0x61> + DB 117,72 ; jne b135 <_sk_load_g8_dst_avx+0x61> DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4 - DB 197,217,219,37,101,17,2,0 ; vpand 0x21165(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 197,217,219,37,21,20,2,0 ; vpand 0x21415(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5 DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,25,8,2,0 ; vbroadcastss 0x20819(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,45,213,10,2,0 ; vbroadcastss 0x20ad5(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,150,7,2,0 ; vbroadcastss 0x20796(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,61,82,10,2,0 ; vbroadcastss 0x20a52(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,236 ; vmovaps %ymm4,%ymm5 DB 197,252,40,244 ; vmovaps %ymm4,%ymm6 DB 91 ; pop %rbx @@ -10324,15 +10514,15 @@ _sk_load_g8_dst_avx LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,170 ; ja adc3 <_sk_load_g8_dst_avx+0x1f> + DB 119,170 ; ja b0f3 <_sk_load_g8_dst_avx+0x1f> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # ae9c <_sk_load_g8_dst_avx+0xf8> + DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b1cc <_sk_load_g8_dst_avx+0xf8> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 235,139 ; jmp adc3 <_sk_load_g8_dst_avx+0x1f> + DB 235,139 ; jmp b0f3 <_sk_load_g8_dst_avx+0x1f> DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4 @@ -10340,7 +10530,7 @@ _sk_load_g8_dst_avx LABEL PROC DB 197,249,110,232 ; vmovd %eax,%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4 - DB 233,99,255,255,255 ; jmpq adc3 <_sk_load_g8_dst_avx+0x1f> + DB 233,99,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f> DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4 @@ -10351,7 +10541,7 @@ _sk_load_g8_dst_avx LABEL PROC DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5 DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5 DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - DB 233,40,255,255,255 ; jmpq adc3 <_sk_load_g8_dst_avx+0x1f> + DB 233,40,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f> DB 144 ; nop DB 145 ; xchg %eax,%ecx DB 255 ; (bad) @@ -10360,7 +10550,7 @@ _sk_load_g8_dst_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf00aeac <_sk_overlay_sse2_8bit+0xffffffffdefdfd8b> + DB 233,255,255,255,222 ; jmpq ffffffffdf00b1dc <_sk_overlay_sse2_8bit+0xffffffffdefdfacf> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -10413,10 +10603,10 @@ _sk_gather_g8_avx LABEL PROC DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,128,6,2,0 ; vbroadcastss 0x20680(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,226,125,24,13,60,9,2,0 ; vbroadcastss 0x2093c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,253,5,2,0 ; vbroadcastss 0x205fd(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -10432,29 +10622,29 @@ _sk_load_565_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,129,0,0,0 ; jne b03e <_sk_load_565_avx+0xa1> + DB 15,133,129,0,0,0 ; jne b36e <_sk_load_565_avx+0xa1> DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0 DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - DB 196,226,125,24,5,41,6,2,0 ; vbroadcastss 0x20629(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,226,125,24,5,229,8,2,0 ; vbroadcastss 0x208e5(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,28,6,2,0 ; vbroadcastss 0x2061c(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,226,125,24,13,216,8,2,0 ; vbroadcastss 0x208d8(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,19,6,2,0 ; vbroadcastss 0x20613(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,226,125,24,13,207,8,2,0 ; vbroadcastss 0x208cf(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,6,6,2,0 ; vbroadcastss 0x20606(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,226,125,24,29,194,8,2,0 ; vbroadcastss 0x208c2(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,24,29,253,5,2,0 ; vbroadcastss 0x205fd(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,240,5,2,0 ; vbroadcastss 0x205f0(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,226,125,24,29,172,8,2,0 ; vbroadcastss 0x208ac(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,85,5,2,0 ; vbroadcastss 0x20555(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,17,8,2,0 ; vbroadcastss 0x20811(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d @@ -10462,27 +10652,27 @@ _sk_load_565_avx LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,109,255,255,255 ; ja afc3 <_sk_load_565_avx+0x26> + DB 15,135,109,255,255,255 ; ja b2f3 <_sk_load_565_avx+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b0c4 <_sk_load_565_avx+0x127> + DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b3f4 <_sk_load_565_avx+0x127> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,75,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26> + DB 233,75,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,46,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26> + DB 233,46,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,1,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26> + DB 233,1,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26> DB 102,144 ; xchg %ax,%ax DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -10514,29 +10704,29 @@ _sk_load_565_dst_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,129,0,0,0 ; jne b181 <_sk_load_565_dst_avx+0xa1> + DB 15,133,129,0,0,0 ; jne b4b1 <_sk_load_565_dst_avx+0xa1> DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4 DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5 DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6 - DB 196,226,125,24,37,230,4,2,0 ; vbroadcastss 0x204e6(%rip),%ymm4 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,226,125,24,37,162,7,2,0 ; vbroadcastss 0x207a2(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,217,4,2,0 ; vbroadcastss 0x204d9(%rip),%ymm5 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,226,125,24,45,149,7,2,0 ; vbroadcastss 0x20795(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,24,45,208,4,2,0 ; vbroadcastss 0x204d0(%rip),%ymm5 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,226,125,24,45,140,7,2,0 ; vbroadcastss 0x2078c(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,61,195,4,2,0 ; vbroadcastss 0x204c3(%rip),%ymm7 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,226,125,24,61,127,7,2,0 ; vbroadcastss 0x2077f(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5 - DB 196,226,125,24,61,186,4,2,0 ; vbroadcastss 0x204ba(%rip),%ymm7 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,226,125,24,61,118,7,2,0 ; vbroadcastss 0x20776(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,226,125,24,61,173,4,2,0 ; vbroadcastss 0x204ad(%rip),%ymm7 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,226,125,24,61,105,7,2,0 ; vbroadcastss 0x20769(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,18,4,2,0 ; vbroadcastss 0x20412(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,61,206,6,2,0 ; vbroadcastss 0x206ce(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d @@ -10544,27 +10734,27 @@ _sk_load_565_dst_avx LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,109,255,255,255 ; ja b106 <_sk_load_565_dst_avx+0x26> + DB 15,135,109,255,255,255 ; ja b436 <_sk_load_565_dst_avx+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b208 <_sk_load_565_dst_avx+0x128> + DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b538 <_sk_load_565_dst_avx+0x128> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 233,75,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26> + DB 233,75,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5 DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4 - DB 233,46,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26> + DB 233,46,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5 DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - DB 233,1,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26> + DB 233,1,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26> DB 15,31,0 ; nopl (%rax) DB 165 ; movsl %ds:(%rsi),%es:(%rdi) DB 255 ; (bad) @@ -10634,23 +10824,23 @@ _sk_gather_565_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - DB 196,226,125,24,5,18,3,2,0 ; vbroadcastss 0x20312(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7> + DB 196,226,125,24,5,206,5,2,0 ; vbroadcastss 0x205ce(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7> DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,5,3,2,0 ; vbroadcastss 0x20305(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb> + DB 196,226,125,24,13,193,5,2,0 ; vbroadcastss 0x205c1(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,252,2,2,0 ; vbroadcastss 0x202fc(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef> + DB 196,226,125,24,13,184,5,2,0 ; vbroadcastss 0x205b8(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef> DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,239,2,2,0 ; vbroadcastss 0x202ef(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3> + DB 196,226,125,24,29,171,5,2,0 ; vbroadcastss 0x205ab(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,24,29,230,2,2,0 ; vbroadcastss 0x202e6(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7> + DB 196,226,125,24,29,162,5,2,0 ; vbroadcastss 0x205a2(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7> DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,217,2,2,0 ; vbroadcastss 0x202d9(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb> + DB 196,226,125,24,29,149,5,2,0 ; vbroadcastss 0x20595(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,62,2,2,0 ; vbroadcastss 0x2023e(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,250,4,2,0 ; vbroadcastss 0x204fa(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 255,224 ; jmpq *%rax PUBLIC _sk_store_565_avx @@ -10663,14 +10853,14 @@ _sk_store_565_avx LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,8,3,2,0 ; vbroadcastss 0x20308(%rip),%ymm8 # 2b67c <_sk_overlay_sse2_8bit+0x55b> + DB 196,98,125,24,5,196,5,2,0 ; vbroadcastss 0x205c4(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10 DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9 DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - DB 196,98,125,24,21,225,2,2,0 ; vbroadcastss 0x202e1(%rip),%ymm10 # 2b680 <_sk_overlay_sse2_8bit+0x55f> + DB 196,98,125,24,21,157,5,2,0 ; vbroadcastss 0x2059d(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f> DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10 DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10 DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11 @@ -10684,7 +10874,7 @@ _sk_store_565_avx LABEL PROC DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne b3f0 <_sk_store_565_avx+0x9c> + DB 117,11 ; jne b720 <_sk_store_565_avx+0x9c> DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -10693,22 +10883,22 @@ _sk_store_565_avx LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja b3eb <_sk_store_565_avx+0x97> + DB 119,235 ; ja b71b <_sk_store_565_avx+0x97> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # b450 <_sk_store_565_avx+0xfc> + DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # b780 <_sk_store_565_avx+0xfc> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2) - DB 235,206 ; jmp b3eb <_sk_store_565_avx+0x97> + DB 235,206 ; jmp b71b <_sk_store_565_avx+0x97> DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2) - DB 235,190 ; jmp b3eb <_sk_store_565_avx+0x97> + DB 235,190 ; jmp b71b <_sk_store_565_avx+0x97> DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2) - DB 235,158 ; jmp b3eb <_sk_store_565_avx+0x97> + DB 235,158 ; jmp b71b <_sk_store_565_avx+0x97> DB 15,31,0 ; nopl (%rax) DB 196 ; (bad) DB 255 ; (bad) @@ -10745,31 +10935,31 @@ _sk_load_4444_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,153,0,0,0 ; jne b525 <_sk_load_4444_avx+0xb9> + DB 15,133,153,0,0,0 ; jne b855 <_sk_load_4444_avx+0xb9> DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0 DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - DB 196,226,125,24,5,214,1,2,0 ; vbroadcastss 0x201d6(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563> + DB 196,226,125,24,5,146,4,2,0 ; vbroadcastss 0x20492(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563> DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,201,1,2,0 ; vbroadcastss 0x201c9(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567> + DB 196,226,125,24,13,133,4,2,0 ; vbroadcastss 0x20485(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,192,1,2,0 ; vbroadcastss 0x201c0(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b> + DB 196,226,125,24,13,124,4,2,0 ; vbroadcastss 0x2047c(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b> DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,179,1,2,0 ; vbroadcastss 0x201b3(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f> + DB 196,226,125,24,21,111,4,2,0 ; vbroadcastss 0x2046f(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,170,1,2,0 ; vbroadcastss 0x201aa(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573> + DB 196,226,125,24,21,102,4,2,0 ; vbroadcastss 0x20466(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573> DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,157,1,2,0 ; vbroadcastss 0x2019d(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577> + DB 196,98,125,24,5,89,4,2,0 ; vbroadcastss 0x20459(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,147,1,2,0 ; vbroadcastss 0x20193(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b> + DB 196,98,125,24,5,79,4,2,0 ; vbroadcastss 0x2044f(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b> DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,133,1,2,0 ; vbroadcastss 0x20185(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f> + DB 196,98,125,24,5,65,4,2,0 ; vbroadcastss 0x20441(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -10779,27 +10969,27 @@ _sk_load_4444_avx LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,85,255,255,255 ; ja b492 <_sk_load_4444_avx+0x26> + DB 15,135,85,255,255,255 ; ja b7c2 <_sk_load_4444_avx+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b5ac <_sk_load_4444_avx+0x140> + DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b8dc <_sk_load_4444_avx+0x140> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,51,255,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26> + DB 233,51,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,22,255,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26> + DB 233,22,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0 DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,233,254,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26> + DB 233,233,254,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26> DB 15,31,0 ; nopl (%rax) DB 165 ; movsl %ds:(%rsi),%es:(%rdi) DB 255 ; (bad) @@ -10834,31 +11024,31 @@ _sk_load_4444_dst_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,153,0,0,0 ; jne b681 <_sk_load_4444_dst_avx+0xb9> + DB 15,133,153,0,0,0 ; jne b9b1 <_sk_load_4444_dst_avx+0xb9> DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4 DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5 DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7 - DB 196,226,125,24,37,122,0,2,0 ; vbroadcastss 0x2007a(%rip),%ymm4 # 2b684 <_sk_overlay_sse2_8bit+0x563> + DB 196,226,125,24,37,54,3,2,0 ; vbroadcastss 0x20336(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563> DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,109,0,2,0 ; vbroadcastss 0x2006d(%rip),%ymm5 # 2b688 <_sk_overlay_sse2_8bit+0x567> + DB 196,226,125,24,45,41,3,2,0 ; vbroadcastss 0x20329(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,24,45,100,0,2,0 ; vbroadcastss 0x20064(%rip),%ymm5 # 2b68c <_sk_overlay_sse2_8bit+0x56b> + DB 196,226,125,24,45,32,3,2,0 ; vbroadcastss 0x20320(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b> DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,53,87,0,2,0 ; vbroadcastss 0x20057(%rip),%ymm6 # 2b690 <_sk_overlay_sse2_8bit+0x56f> + DB 196,226,125,24,53,19,3,2,0 ; vbroadcastss 0x20313(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f> DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5 - DB 196,226,125,24,53,78,0,2,0 ; vbroadcastss 0x2004e(%rip),%ymm6 # 2b694 <_sk_overlay_sse2_8bit+0x573> + DB 196,226,125,24,53,10,3,2,0 ; vbroadcastss 0x2030a(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573> DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,98,125,24,5,65,0,2,0 ; vbroadcastss 0x20041(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577> + DB 196,98,125,24,5,253,2,2,0 ; vbroadcastss 0x202fd(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577> DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6 - DB 196,98,125,24,5,55,0,2,0 ; vbroadcastss 0x20037(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b> + DB 196,98,125,24,5,243,2,2,0 ; vbroadcastss 0x202f3(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b> DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,41,0,2,0 ; vbroadcastss 0x20029(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f> + DB 196,98,125,24,5,229,2,2,0 ; vbroadcastss 0x202e5(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f> DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -10868,27 +11058,27 @@ _sk_load_4444_dst_avx LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,85,255,255,255 ; ja b5ee <_sk_load_4444_dst_avx+0x26> + DB 15,135,85,255,255,255 ; ja b91e <_sk_load_4444_dst_avx+0x26> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b708 <_sk_load_4444_dst_avx+0x140> + DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # ba38 <_sk_load_4444_dst_avx+0x140> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 233,51,255,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26> + DB 233,51,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5 DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4 - DB 233,22,255,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26> + DB 233,22,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4 DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5 DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4 - DB 233,233,254,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26> + DB 233,233,254,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26> DB 15,31,0 ; nopl (%rax) DB 165 ; movsl %ds:(%rsi),%es:(%rdi) DB 255 ; (bad) @@ -10958,25 +11148,25 @@ _sk_gather_4444_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - DB 196,226,125,24,5,142,254,1,0 ; vbroadcastss 0x1fe8e(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563> + DB 196,226,125,24,5,74,1,2,0 ; vbroadcastss 0x2014a(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563> DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,129,254,1,0 ; vbroadcastss 0x1fe81(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567> + DB 196,226,125,24,13,61,1,2,0 ; vbroadcastss 0x2013d(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,120,254,1,0 ; vbroadcastss 0x1fe78(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b> + DB 196,226,125,24,13,52,1,2,0 ; vbroadcastss 0x20134(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b> DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,107,254,1,0 ; vbroadcastss 0x1fe6b(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f> + DB 196,226,125,24,21,39,1,2,0 ; vbroadcastss 0x20127(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,98,254,1,0 ; vbroadcastss 0x1fe62(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573> + DB 196,226,125,24,21,30,1,2,0 ; vbroadcastss 0x2011e(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573> DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,85,254,1,0 ; vbroadcastss 0x1fe55(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577> + DB 196,98,125,24,5,17,1,2,0 ; vbroadcastss 0x20111(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,75,254,1,0 ; vbroadcastss 0x1fe4b(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b> + DB 196,98,125,24,5,7,1,2,0 ; vbroadcastss 0x20107(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b> DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,61,254,1,0 ; vbroadcastss 0x1fe3d(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f> + DB 196,98,125,24,5,249,0,2,0 ; vbroadcastss 0x200f9(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -10991,7 +11181,7 @@ _sk_store_4444_avx LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,24,254,1,0 ; vbroadcastss 0x1fe18(%rip),%ymm8 # 2b6a4 <_sk_overlay_sse2_8bit+0x583> + DB 196,98,125,24,5,212,0,2,0 ; vbroadcastss 0x200d4(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10 @@ -11018,7 +11208,7 @@ _sk_store_4444_avx LABEL PROC DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne b926 <_sk_store_4444_avx+0xba> + DB 117,11 ; jne bc56 <_sk_store_4444_avx+0xba> DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -11027,22 +11217,22 @@ _sk_store_4444_avx LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja b921 <_sk_store_4444_avx+0xb5> + DB 119,235 ; ja bc51 <_sk_store_4444_avx+0xb5> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # b984 <_sk_store_4444_avx+0x118> + DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # bcb4 <_sk_store_4444_avx+0x118> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2) - DB 235,206 ; jmp b921 <_sk_store_4444_avx+0xb5> + DB 235,206 ; jmp bc51 <_sk_store_4444_avx+0xb5> DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2) DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2) - DB 235,190 ; jmp b921 <_sk_store_4444_avx+0xb5> + DB 235,190 ; jmp bc51 <_sk_store_4444_avx+0xb5> DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2) DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2) DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2) DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2) - DB 235,158 ; jmp b921 <_sk_store_4444_avx+0xb5> + DB 235,158 ; jmp bc51 <_sk_store_4444_avx+0xb5> DB 144 ; nop DB 198 ; (bad) DB 255 ; (bad) @@ -11079,12 +11269,12 @@ _sk_load_8888_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,136,0,0,0 ; jne ba49 <_sk_load_8888_avx+0xa9> + DB 15,133,136,0,0,0 ; jne bd79 <_sk_load_8888_avx+0xa9> DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9 - DB 197,125,40,21,177,0,2,0 ; vmovapd 0x200b1(%rip),%ymm10 # 2ba80 <_sk_overlay_sse2_8bit+0x95f> + DB 197,125,40,21,97,3,2,0 ; vmovapd 0x20361(%rip),%ymm10 # 2c060 <_sk_overlay_sse2_8bit+0x953> DB 196,193,53,84,194 ; vandpd %ymm10,%ymm9,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,35,252,1,0 ; vbroadcastss 0x1fc23(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,223,254,1,0 ; vbroadcastss 0x1fedf(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1 DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3 @@ -11112,21 +11302,21 @@ _sk_load_8888_avx LABEL PROC DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,101,255,255,255 ; ja b9c7 <_sk_load_8888_avx+0x27> + DB 15,135,101,255,255,255 ; ja bcf7 <_sk_load_8888_avx+0x27> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bb00 <_sk_load_8888_avx+0x160> + DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # be30 <_sk_load_8888_avx+0x160> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9 - DB 233,70,255,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27> + DB 233,70,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27> DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0 DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9 DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0 DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9 - DB 233,31,255,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27> + DB 233,31,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27> DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0 DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 @@ -11140,9 +11330,9 @@ _sk_load_8888_avx LABEL PROC DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9 DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0 DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9 - DB 233,202,254,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27> + DB 233,202,254,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27> DB 15,31,0 ; nopl (%rax) - DB 118,255 ; jbe bb01 <_sk_load_8888_avx+0x161> + DB 118,255 ; jbe be31 <_sk_load_8888_avx+0x161> DB 255 ; (bad) DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi) DB 255 ; (bad) @@ -11173,12 +11363,12 @@ _sk_load_8888_dst_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,136,0,0,0 ; jne bbc5 <_sk_load_8888_dst_avx+0xa9> + DB 15,133,136,0,0,0 ; jne bef5 <_sk_load_8888_dst_avx+0xa9> DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9 - DB 197,125,40,21,85,255,1,0 ; vmovapd 0x1ff55(%rip),%ymm10 # 2baa0 <_sk_overlay_sse2_8bit+0x97f> + DB 197,125,40,21,5,2,2,0 ; vmovapd 0x20205(%rip),%ymm10 # 2c080 <_sk_overlay_sse2_8bit+0x973> DB 196,193,53,84,226 ; vandpd %ymm10,%ymm9,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,98,125,24,5,167,250,1,0 ; vbroadcastss 0x1faa7(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,99,253,1,0 ; vbroadcastss 0x1fd63(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4 DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5 DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7 @@ -11206,21 +11396,21 @@ _sk_load_8888_dst_avx LABEL PROC DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,101,255,255,255 ; ja bb43 <_sk_load_8888_dst_avx+0x27> + DB 15,135,101,255,255,255 ; ja be73 <_sk_load_8888_dst_avx+0x27> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bc7c <_sk_load_8888_dst_avx+0x160> + DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bfac <_sk_load_8888_dst_avx+0x160> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9 - DB 233,70,255,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27> + DB 233,70,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27> DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4 DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9 DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4 DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9 - DB 233,31,255,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27> + DB 233,31,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27> DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4 DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4 DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4 @@ -11234,9 +11424,9 @@ _sk_load_8888_dst_avx LABEL PROC DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9 DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4 DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9 - DB 233,202,254,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27> + DB 233,202,254,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27> DB 15,31,0 ; nopl (%rax) - DB 118,255 ; jbe bc7d <_sk_load_8888_dst_avx+0x161> + DB 118,255 ; jbe bfad <_sk_load_8888_dst_avx+0x161> DB 255 ; (bad) DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi) DB 255 ; (bad) @@ -11291,10 +11481,10 @@ _sk_gather_8888_avx LABEL PROC DB 73,193,234,32 ; shr $0x20,%r10 DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - DB 197,124,40,21,125,253,1,0 ; vmovaps 0x1fd7d(%rip),%ymm10 # 2bac0 <_sk_overlay_sse2_8bit+0x99f> + DB 197,124,40,21,45,0,2,0 ; vmovaps 0x2002d(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x993> DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,175,248,1,0 ; vbroadcastss 0x1f8af(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,13,107,251,1,0 ; vbroadcastss 0x1fb6b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1 DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2 @@ -11326,7 +11516,7 @@ _sk_store_8888_avx LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,229,247,1,0 ; vbroadcastss 0x1f7e5(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,161,250,1,0 ; vbroadcastss 0x1faa1(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -11351,7 +11541,7 @@ _sk_store_8888_avx LABEL PROC DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8 DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne be66 <_sk_store_8888_avx+0xb0> + DB 117,11 ; jne c196 <_sk_store_8888_avx+0xb0> DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -11360,17 +11550,17 @@ _sk_store_8888_avx LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja be61 <_sk_store_8888_avx+0xab> + DB 119,235 ; ja c191 <_sk_store_8888_avx+0xab> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # bed4 <_sk_store_8888_avx+0x11e> + DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c204 <_sk_store_8888_avx+0x11e> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4) - DB 235,207 ; jmp be61 <_sk_store_8888_avx+0xab> + DB 235,207 ; jmp c191 <_sk_store_8888_avx+0xab> DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4) - DB 235,191 ; jmp be61 <_sk_store_8888_avx+0xab> + DB 235,191 ; jmp c191 <_sk_store_8888_avx+0xab> DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 @@ -11378,7 +11568,7 @@ _sk_store_8888_avx LABEL PROC DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4) DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4) - DB 235,142 ; jmp be61 <_sk_store_8888_avx+0xab> + DB 235,142 ; jmp c191 <_sk_store_8888_avx+0xab> DB 144 ; nop DB 182,255 ; mov $0xff,%dh DB 255 ; (bad) @@ -11412,12 +11602,12 @@ _sk_load_bgra_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,136,0,0,0 ; jne bf99 <_sk_load_bgra_avx+0xa9> + DB 15,133,136,0,0,0 ; jne c2c9 <_sk_load_bgra_avx+0xa9> DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9 - DB 197,125,40,21,193,251,1,0 ; vmovapd 0x1fbc1(%rip),%ymm10 # 2bae0 <_sk_overlay_sse2_8bit+0x9bf> + DB 197,125,40,21,113,254,1,0 ; vmovapd 0x1fe71(%rip),%ymm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x9b3> DB 196,193,53,84,202 ; vandpd %ymm10,%ymm9,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,98,125,24,5,211,246,1,0 ; vbroadcastss 0x1f6d3(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,143,249,1,0 ; vbroadcastss 0x1f98f(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2 DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1 DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3 @@ -11445,21 +11635,21 @@ _sk_load_bgra_avx LABEL PROC DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,101,255,255,255 ; ja bf17 <_sk_load_bgra_avx+0x27> + DB 15,135,101,255,255,255 ; ja c247 <_sk_load_bgra_avx+0x27> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c050 <_sk_load_bgra_avx+0x160> + DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c380 <_sk_load_bgra_avx+0x160> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9 - DB 233,70,255,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27> + DB 233,70,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27> DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0 DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9 DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0 DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9 - DB 233,31,255,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27> + DB 233,31,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27> DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0 DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 @@ -11473,9 +11663,9 @@ _sk_load_bgra_avx LABEL PROC DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9 DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0 DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9 - DB 233,202,254,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27> + DB 233,202,254,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27> DB 15,31,0 ; nopl (%rax) - DB 118,255 ; jbe c051 <_sk_load_bgra_avx+0x161> + DB 118,255 ; jbe c381 <_sk_load_bgra_avx+0x161> DB 255 ; (bad) DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi) DB 255 ; (bad) @@ -11506,12 +11696,12 @@ _sk_load_bgra_dst_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx DB 77,133,192 ; test %r8,%r8 - DB 15,133,136,0,0,0 ; jne c115 <_sk_load_bgra_dst_avx+0xa9> + DB 15,133,136,0,0,0 ; jne c445 <_sk_load_bgra_dst_avx+0xa9> DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9 - DB 197,125,40,21,101,250,1,0 ; vmovapd 0x1fa65(%rip),%ymm10 # 2bb00 <_sk_overlay_sse2_8bit+0x9df> + DB 197,125,40,21,21,253,1,0 ; vmovapd 0x1fd15(%rip),%ymm10 # 2c0e0 <_sk_overlay_sse2_8bit+0x9d3> DB 196,193,53,84,234 ; vandpd %ymm10,%ymm9,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,98,125,24,5,87,245,1,0 ; vbroadcastss 0x1f557(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,5,19,248,1,0 ; vbroadcastss 0x1f813(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6 DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5 DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7 @@ -11539,21 +11729,21 @@ _sk_load_bgra_dst_avx LABEL PROC DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 15,135,101,255,255,255 ; ja c093 <_sk_load_bgra_dst_avx+0x27> + DB 15,135,101,255,255,255 ; ja c3c3 <_sk_load_bgra_dst_avx+0x27> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c1cc <_sk_load_bgra_dst_avx+0x160> + DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c4fc <_sk_load_bgra_dst_avx+0x160> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9 - DB 233,70,255,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27> + DB 233,70,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27> DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4 DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9 DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4 DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9 - DB 233,31,255,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27> + DB 233,31,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27> DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4 DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4 DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4 @@ -11567,9 +11757,9 @@ _sk_load_bgra_dst_avx LABEL PROC DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9 DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4 DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9 - DB 233,202,254,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27> + DB 233,202,254,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27> DB 15,31,0 ; nopl (%rax) - DB 118,255 ; jbe c1cd <_sk_load_bgra_dst_avx+0x161> + DB 118,255 ; jbe c4fd <_sk_load_bgra_dst_avx+0x161> DB 255 ; (bad) DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi) DB 255 ; (bad) @@ -11624,10 +11814,10 @@ _sk_gather_bgra_avx LABEL PROC DB 73,193,234,32 ; shr $0x20,%r10 DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - DB 197,124,40,13,141,248,1,0 ; vmovaps 0x1f88d(%rip),%ymm9 # 2bb20 <_sk_overlay_sse2_8bit+0x9ff> + DB 197,124,40,13,61,251,1,0 ; vmovaps 0x1fb3d(%rip),%ymm9 # 2c100 <_sk_overlay_sse2_8bit+0x9f3> DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,95,243,1,0 ; vbroadcastss 0x1f35f(%rip),%ymm10 # 2b604 <_sk_overlay_sse2_8bit+0x4e3> + DB 196,98,125,24,21,27,246,1,0 ; vbroadcastss 0x1f61b(%rip),%ymm10 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3> DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2 DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0 DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1 @@ -11659,7 +11849,7 @@ _sk_store_bgra_avx LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,218 ; movslq %edx,%rbx - DB 196,98,125,24,5,149,242,1,0 ; vbroadcastss 0x1f295(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 196,98,125,24,5,81,245,1,0 ; vbroadcastss 0x1f551(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -11684,7 +11874,7 @@ _sk_store_bgra_avx LABEL PROC DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8 DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,11 ; jne c3b6 <_sk_store_bgra_avx+0xb0> + DB 117,11 ; jne c6e6 <_sk_store_bgra_avx+0xb0> DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx @@ -11693,17 +11883,17 @@ _sk_store_bgra_avx LABEL PROC DB 65,128,226,7 ; and $0x7,%r10b DB 65,254,202 ; dec %r10b DB 65,128,250,6 ; cmp $0x6,%r10b - DB 119,235 ; ja c3b1 <_sk_store_bgra_avx+0xab> + DB 119,235 ; ja c6e1 <_sk_store_bgra_avx+0xab> DB 69,15,182,210 ; movzbl %r10b,%r10d - DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c424 <_sk_store_bgra_avx+0x11e> + DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c754 <_sk_store_bgra_avx+0x11e> DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4) - DB 235,207 ; jmp c3b1 <_sk_store_bgra_avx+0xab> + DB 235,207 ; jmp c6e1 <_sk_store_bgra_avx+0xab> DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4) DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4) - DB 235,191 ; jmp c3b1 <_sk_store_bgra_avx+0xab> + DB 235,191 ; jmp c6e1 <_sk_store_bgra_avx+0xab> DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4) DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 @@ -11711,7 +11901,7 @@ _sk_store_bgra_avx LABEL PROC DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4) DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4) - DB 235,142 ; jmp c3b1 <_sk_store_bgra_avx+0xab> + DB 235,142 ; jmp c6e1 <_sk_store_bgra_avx+0xab> DB 144 ; nop DB 182,255 ; mov $0xff,%dh DB 255 ; (bad) @@ -11749,7 +11939,7 @@ _sk_load_f16_avx LABEL PROC DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp) DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp) DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp) - DB 15,133,147,2,0,0 ; jne c711 <_sk_load_f16_avx+0x2d1> + DB 15,133,147,2,0,0 ; jne ca41 <_sk_load_f16_avx+0x2d1> DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8 DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2 DB 196,193,121,16,76,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm1 @@ -11767,13 +11957,13 @@ _sk_load_f16_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - DB 196,98,125,24,37,49,242,1,0 ; vbroadcastss 0x1f231(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb> + DB 196,98,125,24,37,237,244,1,0 ; vbroadcastss 0x1f4ed(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb> DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1 DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14 - DB 196,98,121,24,29,245,241,1,0 ; vbroadcastss 0x1f1f5(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,121,24,29,177,244,1,0 ; vbroadcastss 0x1f4b1(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3 - DB 196,98,121,24,45,15,242,1,0 ; vbroadcastss 0x1f20f(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef> + DB 196,98,121,24,45,203,244,1,0 ; vbroadcastss 0x1f4cb(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef> DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3 DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -11787,7 +11977,7 @@ _sk_load_f16_avx LABEL PROC DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0 DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1 - DB 196,226,121,24,29,197,241,1,0 ; vbroadcastss 0x1f1c5(%rip),%xmm3 # 2b714 <_sk_overlay_sse2_8bit+0x5f3> + DB 196,226,121,24,29,129,244,1,0 ; vbroadcastss 0x1f481(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3> DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1 DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -11880,29 +12070,29 @@ _sk_load_f16_avx LABEL PROC DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je c777 <_sk_load_f16_avx+0x337> + DB 116,85 ; je caa7 <_sk_load_f16_avx+0x337> DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb c777 <_sk_load_f16_avx+0x337> + DB 114,72 ; jb caa7 <_sk_load_f16_avx+0x337> DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je c784 <_sk_load_f16_avx+0x344> + DB 116,72 ; je cab4 <_sk_load_f16_avx+0x344> DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb c784 <_sk_load_f16_avx+0x344> + DB 114,59 ; jb cab4 <_sk_load_f16_avx+0x344> DB 196,193,123,16,76,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,63,253,255,255 ; je c499 <_sk_load_f16_avx+0x59> + DB 15,132,63,253,255,255 ; je c7c9 <_sk_load_f16_avx+0x59> DB 196,193,113,22,76,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,46,253,255,255 ; jb c499 <_sk_load_f16_avx+0x59> + DB 15,130,46,253,255,255 ; jb c7c9 <_sk_load_f16_avx+0x59> DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9 - DB 233,34,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59> + DB 233,34,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59> DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,21,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59> + DB 233,21,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59> DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1 - DB 233,12,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59> + DB 233,12,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59> PUBLIC _sk_load_f16_dst_avx _sk_load_f16_dst_avx LABEL PROC @@ -11919,7 +12109,7 @@ _sk_load_f16_dst_avx LABEL PROC DB 197,252,17,84,36,64 ; vmovups %ymm2,0x40(%rsp) DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp) DB 197,254,127,4,36 ; vmovdqu %ymm0,(%rsp) - DB 15,133,147,2,0,0 ; jne ca5e <_sk_load_f16_dst_avx+0x2d1> + DB 15,133,147,2,0,0 ; jne cd8e <_sk_load_f16_dst_avx+0x2d1> DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8 DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6 DB 196,193,121,16,108,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm5 @@ -11937,13 +12127,13 @@ _sk_load_f16_dst_avx LABEL PROC DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 - DB 196,98,125,24,37,228,238,1,0 ; vbroadcastss 0x1eee4(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb> + DB 196,98,125,24,37,160,241,1,0 ; vbroadcastss 0x1f1a0(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb> DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5 DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4 DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14 - DB 196,98,121,24,29,168,238,1,0 ; vbroadcastss 0x1eea8(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,121,24,29,100,241,1,0 ; vbroadcastss 0x1f164(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7 - DB 196,98,121,24,45,194,238,1,0 ; vbroadcastss 0x1eec2(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef> + DB 196,98,121,24,45,126,241,1,0 ; vbroadcastss 0x1f17e(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef> DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7 DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -11957,7 +12147,7 @@ _sk_load_f16_dst_avx LABEL PROC DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4 DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4 DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5 - DB 196,226,121,24,61,120,238,1,0 ; vbroadcastss 0x1ee78(%rip),%xmm7 # 2b714 <_sk_overlay_sse2_8bit+0x5f3> + DB 196,226,121,24,61,52,241,1,0 ; vbroadcastss 0x1f134(%rip),%xmm7 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3> DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5 DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 @@ -12050,29 +12240,29 @@ _sk_load_f16_dst_avx LABEL PROC DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je cac4 <_sk_load_f16_dst_avx+0x337> + DB 116,85 ; je cdf4 <_sk_load_f16_dst_avx+0x337> DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb cac4 <_sk_load_f16_dst_avx+0x337> + DB 114,72 ; jb cdf4 <_sk_load_f16_dst_avx+0x337> DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je cad1 <_sk_load_f16_dst_avx+0x344> + DB 116,72 ; je ce01 <_sk_load_f16_dst_avx+0x344> DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb cad1 <_sk_load_f16_dst_avx+0x344> + DB 114,59 ; jb ce01 <_sk_load_f16_dst_avx+0x344> DB 196,193,123,16,108,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm5 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,63,253,255,255 ; je c7e6 <_sk_load_f16_dst_avx+0x59> + DB 15,132,63,253,255,255 ; je cb16 <_sk_load_f16_dst_avx+0x59> DB 196,193,81,22,108,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,46,253,255,255 ; jb c7e6 <_sk_load_f16_dst_avx+0x59> + DB 15,130,46,253,255,255 ; jb cb16 <_sk_load_f16_dst_avx+0x59> DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9 - DB 233,34,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59> + DB 233,34,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59> DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5 DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6 - DB 233,21,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59> + DB 233,21,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59> DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5 - DB 233,12,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59> + DB 233,12,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59> PUBLIC _sk_gather_f16_avx _sk_gather_f16_avx LABEL PROC @@ -12131,13 +12321,13 @@ _sk_gather_f16_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - DB 196,98,125,24,37,38,235,1,0 ; vbroadcastss 0x1eb26(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb> + DB 196,98,125,24,37,226,237,1,0 ; vbroadcastss 0x1ede2(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb> DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1 DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14 - DB 196,98,121,24,29,234,234,1,0 ; vbroadcastss 0x1eaea(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,121,24,29,166,237,1,0 ; vbroadcastss 0x1eda6(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3 - DB 196,98,121,24,45,4,235,1,0 ; vbroadcastss 0x1eb04(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef> + DB 196,98,121,24,45,192,237,1,0 ; vbroadcastss 0x1edc0(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef> DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3 DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -12151,7 +12341,7 @@ _sk_gather_f16_avx LABEL PROC DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0 DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1 - DB 196,226,121,24,29,186,234,1,0 ; vbroadcastss 0x1eaba(%rip),%xmm3 # 2b714 <_sk_overlay_sse2_8bit+0x5f3> + DB 196,226,121,24,29,118,237,1,0 ; vbroadcastss 0x1ed76(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3> DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1 DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -12249,12 +12439,12 @@ _sk_store_f16_avx LABEL PROC DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp) DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp) DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp) - DB 196,98,125,24,13,158,232,1,0 ; vbroadcastss 0x1e89e(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,125,24,13,90,235,1,0 ; vbroadcastss 0x1eb5a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10 DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp) DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11 DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12 - DB 196,98,121,24,5,176,232,1,0 ; vbroadcastss 0x1e8b0(%rip),%xmm8 # 2b718 <_sk_overlay_sse2_8bit+0x5f7> + DB 196,98,121,24,5,108,235,1,0 ; vbroadcastss 0x1eb6c(%rip),%xmm8 # 2bd04 <_sk_overlay_sse2_8bit+0x5f7> DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13 DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14 DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -12264,7 +12454,7 @@ _sk_store_f16_avx LABEL PROC DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11 DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12 - DB 196,98,125,24,21,119,232,1,0 ; vbroadcastss 0x1e877(%rip),%ymm10 # 2b71c <_sk_overlay_sse2_8bit+0x5fb> + DB 196,98,125,24,21,51,235,1,0 ; vbroadcastss 0x1eb33(%rip),%ymm10 # 2bd08 <_sk_overlay_sse2_8bit+0x5fb> DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14 DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15 DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12 @@ -12351,7 +12541,7 @@ _sk_store_f16_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,79 ; jne d0a2 <_sk_store_f16_avx+0x286> + DB 117,79 ; jne d3d2 <_sk_store_f16_avx+0x286> DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8) DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8) DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8) @@ -12367,22 +12557,22 @@ _sk_store_f16_avx LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,192 ; je d06e <_sk_store_f16_avx+0x252> + DB 116,192 ; je d39e <_sk_store_f16_avx+0x252> DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,179 ; jb d06e <_sk_store_f16_avx+0x252> + DB 114,179 ; jb d39e <_sk_store_f16_avx+0x252> DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8) - DB 116,170 ; je d06e <_sk_store_f16_avx+0x252> + DB 116,170 ; je d39e <_sk_store_f16_avx+0x252> DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,157 ; jb d06e <_sk_store_f16_avx+0x252> + DB 114,157 ; jb d39e <_sk_store_f16_avx+0x252> DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8) - DB 116,148 ; je d06e <_sk_store_f16_avx+0x252> + DB 116,148 ; je d39e <_sk_store_f16_avx+0x252> DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,135 ; jb d06e <_sk_store_f16_avx+0x252> + DB 114,135 ; jb d39e <_sk_store_f16_avx+0x252> DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8) - DB 233,123,255,255,255 ; jmpq d06e <_sk_store_f16_avx+0x252> + DB 233,123,255,255,255 ; jmpq d39e <_sk_store_f16_avx+0x252> PUBLIC _sk_load_u16_be_avx _sk_load_u16_be_avx LABEL PROC @@ -12395,7 +12585,7 @@ _sk_load_u16_be_avx LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,253,0,0,0 ; jne d217 <_sk_load_u16_be_avx+0x124> + DB 15,133,253,0,0,0 ; jne d547 <_sk_load_u16_be_avx+0x124> DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8 DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2 DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -12417,7 +12607,7 @@ _sk_load_u16_be_avx LABEL PROC DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,29,149,228,1,0 ; vbroadcastss 0x1e495(%rip),%ymm11 # 2b620 <_sk_overlay_sse2_8bit+0x4ff> + DB 196,98,125,24,29,81,231,1,0 ; vbroadcastss 0x1e751(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff> DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -12451,29 +12641,29 @@ _sk_load_u16_be_avx LABEL PROC DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je d27d <_sk_load_u16_be_avx+0x18a> + DB 116,85 ; je d5ad <_sk_load_u16_be_avx+0x18a> DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb d27d <_sk_load_u16_be_avx+0x18a> + DB 114,72 ; jb d5ad <_sk_load_u16_be_avx+0x18a> DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je d28a <_sk_load_u16_be_avx+0x197> + DB 116,72 ; je d5ba <_sk_load_u16_be_avx+0x197> DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb d28a <_sk_load_u16_be_avx+0x197> + DB 114,59 ; jb d5ba <_sk_load_u16_be_avx+0x197> DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,213,254,255,255 ; je d135 <_sk_load_u16_be_avx+0x42> + DB 15,132,213,254,255,255 ; je d465 <_sk_load_u16_be_avx+0x42> DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,196,254,255,255 ; jb d135 <_sk_load_u16_be_avx+0x42> + DB 15,130,196,254,255,255 ; jb d465 <_sk_load_u16_be_avx+0x42> DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9 - DB 233,184,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42> + DB 233,184,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,171,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42> + DB 233,171,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,162,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42> + DB 233,162,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42> PUBLIC _sk_load_rgb_u16_be_avx _sk_load_rgb_u16_be_avx LABEL PROC @@ -12488,7 +12678,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 72,141,4,64 ; lea (%rax,%rax,2),%rax DB 72,193,248,32 ; sar $0x20,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,243,0,0,0 ; jne d3b1 <_sk_load_rgb_u16_be_avx+0x11e> + DB 15,133,243,0,0,0 ; jne d6e1 <_sk_load_rgb_u16_be_avx+0x11e> DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0 DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2 DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -12515,7 +12705,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,29,216,226,1,0 ; vbroadcastss 0x1e2d8(%rip),%ymm11 # 2b620 <_sk_overlay_sse2_8bit+0x4ff> + DB 196,98,125,24,29,148,229,1,0 ; vbroadcastss 0x1e594(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff> DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -12536,41 +12726,41 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,225,225,1,0 ; vbroadcastss 0x1e1e1(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,157,228,1,0 ; vbroadcastss 0x1e49d(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 255,224 ; jmpq *%rax DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0 DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne d3ca <_sk_load_rgb_u16_be_avx+0x137> - DB 233,40,255,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f> + DB 117,5 ; jne d6fa <_sk_load_rgb_u16_be_avx+0x137> + DB 233,40,255,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f> DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1 DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb d3f9 <_sk_load_rgb_u16_be_avx+0x166> + DB 114,26 ; jb d729 <_sk_load_rgb_u16_be_avx+0x166> DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1 DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne d3fe <_sk_load_rgb_u16_be_avx+0x16b> - DB 233,249,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f> - DB 233,244,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f> + DB 117,10 ; jne d72e <_sk_load_rgb_u16_be_avx+0x16b> + DB 233,249,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f> + DB 233,244,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f> DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1 DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb d42d <_sk_load_rgb_u16_be_avx+0x19a> + DB 114,26 ; jb d75d <_sk_load_rgb_u16_be_avx+0x19a> DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1 DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne d432 <_sk_load_rgb_u16_be_avx+0x19f> - DB 233,197,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f> - DB 233,192,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f> + DB 117,10 ; jne d762 <_sk_load_rgb_u16_be_avx+0x19f> + DB 233,197,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f> + DB 233,192,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f> DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3 DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb d45b <_sk_load_rgb_u16_be_avx+0x1c8> + DB 114,20 ; jb d78b <_sk_load_rgb_u16_be_avx+0x1c8> DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3 DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - DB 233,151,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f> - DB 233,146,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f> + DB 233,151,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f> + DB 233,146,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f> PUBLIC _sk_store_u16_be_avx _sk_store_u16_be_avx LABEL PROC @@ -12582,7 +12772,7 @@ _sk_store_u16_be_avx LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax - DB 196,98,125,24,5,33,226,1,0 ; vbroadcastss 0x1e221(%rip),%ymm8 # 2b6a8 <_sk_overlay_sse2_8bit+0x587> + DB 196,98,125,24,5,221,228,1,0 ; vbroadcastss 0x1e4dd(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10 @@ -12620,7 +12810,7 @@ _sk_store_u16_be_avx LABEL PROC DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9 DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,31 ; jne d56b <_sk_store_u16_be_avx+0x10b> + DB 117,31 ; jne d89b <_sk_store_u16_be_avx+0x10b> DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2) DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2) DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2) @@ -12629,28 +12819,28 @@ _sk_store_u16_be_avx LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je d567 <_sk_store_u16_be_avx+0x107> + DB 116,240 ; je d897 <_sk_store_u16_be_avx+0x107> DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb d567 <_sk_store_u16_be_avx+0x107> + DB 114,227 ; jb d897 <_sk_store_u16_be_avx+0x107> DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2) - DB 116,218 ; je d567 <_sk_store_u16_be_avx+0x107> + DB 116,218 ; je d897 <_sk_store_u16_be_avx+0x107> DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb d567 <_sk_store_u16_be_avx+0x107> + DB 114,205 ; jb d897 <_sk_store_u16_be_avx+0x107> DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2) - DB 116,196 ; je d567 <_sk_store_u16_be_avx+0x107> + DB 116,196 ; je d897 <_sk_store_u16_be_avx+0x107> DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,183 ; jb d567 <_sk_store_u16_be_avx+0x107> + DB 114,183 ; jb d897 <_sk_store_u16_be_avx+0x107> DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2) - DB 235,174 ; jmp d567 <_sk_store_u16_be_avx+0x107> + DB 235,174 ; jmp d897 <_sk_store_u16_be_avx+0x107> PUBLIC _sk_load_f32_avx _sk_load_f32_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,135,128,0,0,0 ; ja d645 <_sk_load_f32_avx+0x8c> + DB 15,135,128,0,0,0 ; ja d975 <_sk_load_f32_avx+0x8c> DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d DB 76,99,88,8 ; movslq 0x8(%rax),%r11 DB 76,99,201 ; movslq %ecx,%r9 @@ -12658,7 +12848,7 @@ _sk_load_f32_avx LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 77,99,210 ; movslq %r10d,%r10 - DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # d670 <_sk_load_f32_avx+0xb7> + DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # d9a0 <_sk_load_f32_avx+0xb7> DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax @@ -12707,7 +12897,7 @@ PUBLIC _sk_load_f32_dst_avx _sk_load_f32_dst_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,135,128,0,0,0 ; ja d71c <_sk_load_f32_dst_avx+0x8c> + DB 15,135,128,0,0,0 ; ja da4c <_sk_load_f32_dst_avx+0x8c> DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d DB 76,99,88,8 ; movslq 0x8(%rax),%r11 DB 76,99,201 ; movslq %ecx,%r9 @@ -12715,7 +12905,7 @@ _sk_load_f32_dst_avx LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 77,99,210 ; movslq %r10d,%r10 - DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # d744 <_sk_load_f32_dst_avx+0xb4> + DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # da74 <_sk_load_f32_dst_avx+0xb4> DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax @@ -12777,7 +12967,7 @@ _sk_store_f32_avx LABEL PROC DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8 DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11 DB 77,133,192 ; test %r8,%r8 - DB 117,55 ; jne d7e3 <_sk_store_f32_avx+0x7f> + DB 117,55 ; jne db13 <_sk_store_f32_avx+0x7f> DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -12790,22 +12980,22 @@ _sk_store_f32_avx LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je d7df <_sk_store_f32_avx+0x7b> + DB 116,240 ; je db0f <_sk_store_f32_avx+0x7b> DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb d7df <_sk_store_f32_avx+0x7b> + DB 114,227 ; jb db0f <_sk_store_f32_avx+0x7b> DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4) - DB 116,218 ; je d7df <_sk_store_f32_avx+0x7b> + DB 116,218 ; je db0f <_sk_store_f32_avx+0x7b> DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb d7df <_sk_store_f32_avx+0x7b> + DB 114,205 ; jb db0f <_sk_store_f32_avx+0x7b> DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - DB 116,195 ; je d7df <_sk_store_f32_avx+0x7b> + DB 116,195 ; je db0f <_sk_store_f32_avx+0x7b> DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,181 ; jb d7df <_sk_store_f32_avx+0x7b> + DB 114,181 ; jb db0f <_sk_store_f32_avx+0x7b> DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - DB 235,171 ; jmp d7df <_sk_store_f32_avx+0x7b> + DB 235,171 ; jmp db0f <_sk_store_f32_avx+0x7b> PUBLIC _sk_clamp_x_avx _sk_clamp_x_avx LABEL PROC @@ -12888,7 +13078,7 @@ _sk_mirror_x_avx LABEL PROC DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0 DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8 - DB 197,178,89,5,35,220,1,0 ; vmulss 0x1dc23(%rip),%xmm9,%xmm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 197,178,89,5,223,222,1,0 ; vmulss 0x1dedf(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0 @@ -12920,7 +13110,7 @@ _sk_mirror_y_avx LABEL PROC DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1 DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1 DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8 - DB 197,178,89,13,150,219,1,0 ; vmulss 0x1db96(%rip),%xmm9,%xmm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 197,178,89,13,82,222,1,0 ; vmulss 0x1de52(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1 DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1 @@ -12945,7 +13135,7 @@ PUBLIC _sk_clamp_x_1_avx _sk_clamp_x_1_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,48,219,1,0 ; vbroadcastss 0x1db30(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,236,221,1,0 ; vbroadcastss 0x1ddec(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -12959,9 +13149,9 @@ _sk_repeat_x_1_avx LABEL PROC PUBLIC _sk_mirror_x_1_avx _sk_mirror_x_1_avx LABEL PROC - DB 196,98,125,24,5,39,219,1,0 ; vbroadcastss 0x1db27(%rip),%ymm8 # 2b5a8 <_sk_overlay_sse2_8bit+0x487> + DB 196,98,125,24,5,227,221,1,0 ; vbroadcastss 0x1dde3(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,13,253,218,1,0 ; vbroadcastss 0x1dafd(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,13,185,221,1,0 ; vbroadcastss 0x1ddb9(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9 DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9 DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9 @@ -12975,12 +13165,12 @@ _sk_mirror_x_1_avx LABEL PROC PUBLIC _sk_luminance_to_alpha_avx _sk_luminance_to_alpha_avx LABEL PROC - DB 196,226,125,24,29,233,219,1,0 ; vbroadcastss 0x1dbe9(%rip),%ymm3 # 2b6ac <_sk_overlay_sse2_8bit+0x58b> + DB 196,226,125,24,29,165,222,1,0 ; vbroadcastss 0x1dea5(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b> DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,29,224,219,1,0 ; vbroadcastss 0x1dbe0(%rip),%ymm3 # 2b6b0 <_sk_overlay_sse2_8bit+0x58f> + DB 196,226,125,24,29,156,222,1,0 ; vbroadcastss 0x1de9c(%rip),%ymm3 # 2bc9c <_sk_overlay_sse2_8bit+0x58f> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,211,219,1,0 ; vbroadcastss 0x1dbd3(%rip),%ymm1 # 2b6b4 <_sk_overlay_sse2_8bit+0x593> + DB 196,226,125,24,13,143,222,1,0 ; vbroadcastss 0x1de8f(%rip),%ymm1 # 2bca0 <_sk_overlay_sse2_8bit+0x593> DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1 DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -13213,9 +13403,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC DB 72,139,24 ; mov (%rax),%rbx DB 72,139,104,8 ; mov 0x8(%rax),%rbp DB 72,255,203 ; dec %rbx - DB 120,7 ; js de88 <_sk_evenly_spaced_gradient_avx+0x28> + DB 120,7 ; js e1b8 <_sk_evenly_spaced_gradient_avx+0x28> DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1 - DB 235,21 ; jmp de9d <_sk_evenly_spaced_gradient_avx+0x3d> + DB 235,21 ; jmp e1cd <_sk_evenly_spaced_gradient_avx+0x3d> DB 73,137,217 ; mov %rbx,%r9 DB 73,209,233 ; shr %r9 DB 131,227,1 ; and $0x1,%ebx @@ -13372,18 +13562,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC PUBLIC _sk_gauss_a_to_rgba_avx _sk_gauss_a_to_rgba_avx LABEL PROC - DB 196,226,125,24,5,184,212,1,0 ; vbroadcastss 0x1d4b8(%rip),%ymm0 # 2b6bc <_sk_overlay_sse2_8bit+0x59b> + DB 196,226,125,24,5,116,215,1,0 ; vbroadcastss 0x1d774(%rip),%ymm0 # 2bca8 <_sk_overlay_sse2_8bit+0x59b> DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0 - DB 196,226,125,24,13,167,212,1,0 ; vbroadcastss 0x1d4a7(%rip),%ymm1 # 2b6b8 <_sk_overlay_sse2_8bit+0x597> + DB 196,226,125,24,13,99,215,1,0 ; vbroadcastss 0x1d763(%rip),%ymm1 # 2bca4 <_sk_overlay_sse2_8bit+0x597> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,158,212,1,0 ; vbroadcastss 0x1d49e(%rip),%ymm1 # 2b6c0 <_sk_overlay_sse2_8bit+0x59f> + DB 196,226,125,24,13,90,215,1,0 ; vbroadcastss 0x1d75a(%rip),%ymm1 # 2bcac <_sk_overlay_sse2_8bit+0x59f> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,145,212,1,0 ; vbroadcastss 0x1d491(%rip),%ymm1 # 2b6c4 <_sk_overlay_sse2_8bit+0x5a3> + DB 196,226,125,24,13,77,215,1,0 ; vbroadcastss 0x1d74d(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,132,212,1,0 ; vbroadcastss 0x1d484(%rip),%ymm1 # 2b6c8 <_sk_overlay_sse2_8bit+0x5a7> + DB 196,226,125,24,13,64,215,1,0 ; vbroadcastss 0x1d740(%rip),%ymm1 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 @@ -13405,12 +13595,12 @@ _sk_gradient_avx LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 73,131,249,2 ; cmp $0x2,%r9 - DB 114,80 ; jb e2ca <_sk_gradient_avx+0x72> + DB 114,80 ; jb e5fa <_sk_gradient_avx+0x72> DB 72,139,88,72 ; mov 0x48(%rax),%rbx DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 - DB 196,98,125,24,21,1,211,1,0 ; vbroadcastss 0x1d301(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,98,125,24,21,189,213,1,0 ; vbroadcastss 0x1d5bd(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8 DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8 @@ -13422,7 +13612,7 @@ _sk_gradient_avx LABEL PROC DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 DB 72,131,195,4 ; add $0x4,%rbx DB 73,255,201 ; dec %r9 - DB 117,205 ; jne e297 <_sk_gradient_avx+0x3f> + DB 117,205 ; jne e5c7 <_sk_gradient_avx+0x3f> DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9 DB 69,137,202 ; mov %r9d,%r10d DB 73,193,233,32 ; shr $0x20,%r9 @@ -13602,27 +13792,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12 DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11 DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12 - DB 196,98,125,24,45,40,208,1,0 ; vbroadcastss 0x1d028(%rip),%ymm13 # 2b6cc <_sk_overlay_sse2_8bit+0x5ab> + DB 196,98,125,24,45,228,210,1,0 ; vbroadcastss 0x1d2e4(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab> DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13 - DB 196,98,125,24,53,30,208,1,0 ; vbroadcastss 0x1d01e(%rip),%ymm14 # 2b6d0 <_sk_overlay_sse2_8bit+0x5af> + DB 196,98,125,24,53,218,210,1,0 ; vbroadcastss 0x1d2da(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af> DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13 DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13 - DB 196,98,125,24,53,15,208,1,0 ; vbroadcastss 0x1d00f(%rip),%ymm14 # 2b6d4 <_sk_overlay_sse2_8bit+0x5b3> + DB 196,98,125,24,53,203,210,1,0 ; vbroadcastss 0x1d2cb(%rip),%ymm14 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3> DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13 DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12 - DB 196,98,125,24,45,0,208,1,0 ; vbroadcastss 0x1d000(%rip),%ymm13 # 2b6d8 <_sk_overlay_sse2_8bit+0x5b7> + DB 196,98,125,24,45,188,210,1,0 ; vbroadcastss 0x1d2bc(%rip),%ymm13 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,235,207,1,0 ; vbroadcastss 0x1cfeb(%rip),%ymm10 # 2b6dc <_sk_overlay_sse2_8bit+0x5bb> + DB 196,98,125,24,21,167,210,1,0 ; vbroadcastss 0x1d2a7(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb> DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10 DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9 DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,21,129,206,1,0 ; vbroadcastss 0x1ce81(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,21,61,209,1,0 ; vbroadcastss 0x1d13d(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9 - DB 196,98,125,24,21,107,206,1,0 ; vbroadcastss 0x1ce6b(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,21,39,209,1,0 ; vbroadcastss 0x1d127(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10 DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0 DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9 @@ -13648,7 +13838,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10 DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 - DB 196,98,125,24,29,97,207,1,0 ; vbroadcastss 0x1cf61(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf> + DB 196,98,125,24,29,29,210,1,0 ; vbroadcastss 0x1d21d(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0 DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11 @@ -13657,17 +13847,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,13,53,207,1,0 ; vbroadcastss 0x1cf35(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3> + DB 196,98,125,24,13,241,209,1,0 ; vbroadcastss 0x1d1f1(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8 DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0 DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8 - DB 196,98,125,24,13,19,207,1,0 ; vbroadcastss 0x1cf13(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,125,24,13,207,209,1,0 ; vbroadcastss 0x1d1cf(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,164,205,1,0 ; vbroadcastss 0x1cda4(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,29,96,208,1,0 ; vbroadcastss 0x1d060(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10 DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0 @@ -13685,7 +13875,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10 DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 - DB 196,98,125,24,29,179,206,1,0 ; vbroadcastss 0x1ceb3(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf> + DB 196,98,125,24,29,111,209,1,0 ; vbroadcastss 0x1d16f(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0 DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11 @@ -13694,17 +13884,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,13,135,206,1,0 ; vbroadcastss 0x1ce87(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3> + DB 196,98,125,24,13,67,209,1,0 ; vbroadcastss 0x1d143(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8 DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0 DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8 - DB 196,98,125,24,13,101,206,1,0 ; vbroadcastss 0x1ce65(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,125,24,13,33,209,1,0 ; vbroadcastss 0x1d121(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,246,204,1,0 ; vbroadcastss 0x1ccf6(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,29,178,207,1,0 ; vbroadcastss 0x1cfb2(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10 DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0 @@ -13721,7 +13911,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9 DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9 - DB 196,98,125,24,21,11,206,1,0 ; vbroadcastss 0x1ce0b(%rip),%ymm10 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf> + DB 196,98,125,24,21,199,208,1,0 ; vbroadcastss 0x1d0c7(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0 DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10 @@ -13730,7 +13920,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0 - DB 196,98,125,24,5,227,205,1,0 ; vbroadcastss 0x1cde3(%rip),%ymm8 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7> + DB 196,98,125,24,5,159,208,1,0 ; vbroadcastss 0x1d09f(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7> DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0 DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -13765,7 +13955,7 @@ _sk_apply_vector_mask_avx LABEL PROC PUBLIC _sk_save_xy_avx _sk_save_xy_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,31,204,1,0 ; vbroadcastss 0x1cc1f(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,219,206,1,0 ; vbroadcastss 0x1cedb(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9 DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 @@ -13798,9 +13988,9 @@ _sk_accumulate_avx LABEL PROC PUBLIC _sk_bilinear_nx_avx _sk_bilinear_nx_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,7,205,1,0 ; vbroadcastss 0x1cd07(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,5,195,207,1,0 ; vbroadcastss 0x1cfc3(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,158,203,1,0 ; vbroadcastss 0x1cb9e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,90,206,1,0 ; vbroadcastss 0x1ce5a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -13809,7 +13999,7 @@ _sk_bilinear_nx_avx LABEL PROC PUBLIC _sk_bilinear_px_avx _sk_bilinear_px_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,126,203,1,0 ; vbroadcastss 0x1cb7e(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,5,58,206,1,0 ; vbroadcastss 0x1ce3a(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -13819,9 +14009,9 @@ _sk_bilinear_px_avx LABEL PROC PUBLIC _sk_bilinear_ny_avx _sk_bilinear_ny_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,190,204,1,0 ; vbroadcastss 0x1ccbe(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,13,122,207,1,0 ; vbroadcastss 0x1cf7a(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,84,203,1,0 ; vbroadcastss 0x1cb54(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,16,206,1,0 ; vbroadcastss 0x1ce10(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -13830,7 +14020,7 @@ _sk_bilinear_ny_avx LABEL PROC PUBLIC _sk_bilinear_py_avx _sk_bilinear_py_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,52,203,1,0 ; vbroadcastss 0x1cb34(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,226,125,24,13,240,205,1,0 ; vbroadcastss 0x1cdf0(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -13840,14 +14030,14 @@ _sk_bilinear_py_avx LABEL PROC PUBLIC _sk_bicubic_n3x_avx _sk_bicubic_n3x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,119,204,1,0 ; vbroadcastss 0x1cc77(%rip),%ymm0 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf> + DB 196,226,125,24,5,51,207,1,0 ; vbroadcastss 0x1cf33(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,10,203,1,0 ; vbroadcastss 0x1cb0a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,198,205,1,0 ; vbroadcastss 0x1cdc6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,91,204,1,0 ; vbroadcastss 0x1cc5b(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,23,207,1,0 ; vbroadcastss 0x1cf17(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,89,203,1,0 ; vbroadcastss 0x1cb59(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,21,21,206,1,0 ; vbroadcastss 0x1ce15(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -13857,19 +14047,19 @@ _sk_bicubic_n3x_avx LABEL PROC PUBLIC _sk_bicubic_n1x_avx _sk_bicubic_n1x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,36,204,1,0 ; vbroadcastss 0x1cc24(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,5,224,206,1,0 ; vbroadcastss 0x1cee0(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,187,202,1,0 ; vbroadcastss 0x1cabb(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,119,205,1,0 ; vbroadcastss 0x1cd77(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,25,204,1,0 ; vbroadcastss 0x1cc19(%rip),%ymm9 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,13,213,206,1,0 ; vbroadcastss 0x1ced5(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,7,204,1,0 ; vbroadcastss 0x1cc07(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,21,195,206,1,0 ; vbroadcastss 0x1cec3(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,136,202,1,0 ; vbroadcastss 0x1ca88(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,21,68,205,1,0 ; vbroadcastss 0x1cd44(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,13,165,206,1,0 ; vbroadcastss 0x1cea5(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -13878,17 +14068,17 @@ _sk_bicubic_n1x_avx LABEL PROC PUBLIC _sk_bicubic_p1x_avx _sk_bicubic_p1x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,89,202,1,0 ; vbroadcastss 0x1ca59(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,21,205,1,0 ; vbroadcastss 0x1cd15(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0 DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9 - DB 196,98,125,24,21,183,203,1,0 ; vbroadcastss 0x1cbb7(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,21,115,206,1,0 ; vbroadcastss 0x1ce73(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 - DB 196,98,125,24,29,165,203,1,0 ; vbroadcastss 0x1cba5(%rip),%ymm11 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,29,97,206,1,0 ; vbroadcastss 0x1ce61(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 - DB 196,98,125,24,13,144,203,1,0 ; vbroadcastss 0x1cb90(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,13,76,206,1,0 ; vbroadcastss 0x1ce4c(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -13897,13 +14087,13 @@ _sk_bicubic_p1x_avx LABEL PROC PUBLIC _sk_bicubic_p3x_avx _sk_bicubic_p3x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,108,203,1,0 ; vbroadcastss 0x1cb6c(%rip),%ymm0 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,226,125,24,5,40,206,1,0 ; vbroadcastss 0x1ce28(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,81,203,1,0 ; vbroadcastss 0x1cb51(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,13,206,1,0 ; vbroadcastss 0x1ce0d(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,79,202,1,0 ; vbroadcastss 0x1ca4f(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,21,11,205,1,0 ; vbroadcastss 0x1cd0b(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -13913,14 +14103,14 @@ _sk_bicubic_p3x_avx LABEL PROC PUBLIC _sk_bicubic_n3y_avx _sk_bicubic_n3y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,30,203,1,0 ; vbroadcastss 0x1cb1e(%rip),%ymm1 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf> + DB 196,226,125,24,13,218,205,1,0 ; vbroadcastss 0x1cdda(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,176,201,1,0 ; vbroadcastss 0x1c9b0(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,108,204,1,0 ; vbroadcastss 0x1cc6c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,1,203,1,0 ; vbroadcastss 0x1cb01(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,189,205,1,0 ; vbroadcastss 0x1cdbd(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,255,201,1,0 ; vbroadcastss 0x1c9ff(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,21,187,204,1,0 ; vbroadcastss 0x1ccbb(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -13930,19 +14120,19 @@ _sk_bicubic_n3y_avx LABEL PROC PUBLIC _sk_bicubic_n1y_avx _sk_bicubic_n1y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,202,202,1,0 ; vbroadcastss 0x1caca(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb> + DB 196,226,125,24,13,134,205,1,0 ; vbroadcastss 0x1cd86(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,96,201,1,0 ; vbroadcastss 0x1c960(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,98,125,24,5,28,204,1,0 ; vbroadcastss 0x1cc1c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,190,202,1,0 ; vbroadcastss 0x1cabe(%rip),%ymm9 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,13,122,205,1,0 ; vbroadcastss 0x1cd7a(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,172,202,1,0 ; vbroadcastss 0x1caac(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,21,104,205,1,0 ; vbroadcastss 0x1cd68(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,45,201,1,0 ; vbroadcastss 0x1c92d(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,21,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,142,202,1,0 ; vbroadcastss 0x1ca8e(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,13,74,205,1,0 ; vbroadcastss 0x1cd4a(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -13951,17 +14141,17 @@ _sk_bicubic_n1y_avx LABEL PROC PUBLIC _sk_bicubic_p1y_avx _sk_bicubic_p1y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,254,200,1,0 ; vbroadcastss 0x1c8fe(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 196,98,125,24,5,186,203,1,0 ; vbroadcastss 0x1cbba(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1 DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9 - DB 196,98,125,24,21,91,202,1,0 ; vbroadcastss 0x1ca5b(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db> + DB 196,98,125,24,21,23,205,1,0 ; vbroadcastss 0x1cd17(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db> DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 - DB 196,98,125,24,29,73,202,1,0 ; vbroadcastss 0x1ca49(%rip),%ymm11 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,98,125,24,29,5,205,1,0 ; vbroadcastss 0x1cd05(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 - DB 196,98,125,24,13,52,202,1,0 ; vbroadcastss 0x1ca34(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df> + DB 196,98,125,24,13,240,204,1,0 ; vbroadcastss 0x1ccf0(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -13970,13 +14160,13 @@ _sk_bicubic_p1y_avx LABEL PROC PUBLIC _sk_bicubic_p3y_avx _sk_bicubic_p3y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,16,202,1,0 ; vbroadcastss 0x1ca10(%rip),%ymm1 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7> + DB 196,226,125,24,13,204,204,1,0 ; vbroadcastss 0x1cccc(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,244,201,1,0 ; vbroadcastss 0x1c9f4(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3> + DB 196,98,125,24,21,176,204,1,0 ; vbroadcastss 0x1ccb0(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,242,200,1,0 ; vbroadcastss 0x1c8f2(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df> + DB 196,98,125,24,21,174,203,1,0 ; vbroadcastss 0x1cbae(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -14112,7 +14302,7 @@ _sk_clut_3D_avx LABEL PROC DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp) DB 72,139,0 ; mov (%rax),%rax DB 196,193,121,254,194 ; vpaddd %xmm10,%xmm0,%xmm0 - DB 196,98,121,24,29,155,199,1,0 ; vbroadcastss 0x1c79b(%rip),%xmm11 # 2b708 <_sk_overlay_sse2_8bit+0x5e7> + DB 196,98,121,24,29,87,202,1,0 ; vbroadcastss 0x1ca57(%rip),%xmm11 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7> DB 196,194,121,64,203 ; vpmulld %xmm11,%xmm0,%xmm1 DB 196,193,249,126,201 ; vmovq %xmm1,%r9 DB 69,137,202 ; mov %r9d,%r10d @@ -14146,7 +14336,7 @@ _sk_clut_3D_avx LABEL PROC DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7 DB 196,227,93,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm3 DB 197,252,17,156,36,192,0,0,0 ; vmovups %ymm3,0xc0(%rsp) - DB 196,98,121,24,13,100,197,1,0 ; vbroadcastss 0x1c564(%rip),%xmm9 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,98,121,24,13,32,200,1,0 ; vbroadcastss 0x1c820(%rip),%xmm9 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 196,193,105,254,249 ; vpaddd %xmm9,%xmm2,%xmm7 DB 196,195,249,22,249,1 ; vpextrq $0x1,%xmm7,%r9 DB 196,193,249,126,250 ; vmovq %xmm7,%r10 @@ -14174,7 +14364,7 @@ _sk_clut_3D_avx LABEL PROC DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7 DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5 DB 196,99,85,24,254,1 ; vinsertf128 $0x1,%xmm6,%ymm5,%ymm15 - DB 196,98,121,24,37,215,196,1,0 ; vbroadcastss 0x1c4d7(%rip),%xmm12 # 2b59c <_sk_overlay_sse2_8bit+0x47b> + DB 196,98,121,24,37,147,199,1,0 ; vbroadcastss 0x1c793(%rip),%xmm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b> DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2 DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9 DB 196,193,249,126,210 ; vmovq %xmm2,%r10 @@ -14202,7 +14392,7 @@ _sk_clut_3D_avx LABEL PROC DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5 DB 196,227,105,33,213,48 ; vinsertps $0x30,%xmm5,%xmm2,%xmm2 DB 196,227,109,24,225,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm4 - DB 196,226,125,24,13,171,197,1,0 ; vbroadcastss 0x1c5ab(%rip),%ymm1 # 2b704 <_sk_overlay_sse2_8bit+0x5e3> + DB 196,226,125,24,13,103,200,1,0 ; vbroadcastss 0x1c867(%rip),%ymm1 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3> DB 197,188,88,209 ; vaddps %ymm1,%ymm8,%ymm2 DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp) DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2 @@ -14955,7 +15145,7 @@ _sk_clut_4D_avx LABEL PROC DB 196,226,25,64,200 ; vpmulld %xmm0,%xmm12,%xmm1 DB 197,249,127,12,36 ; vmovdqa %xmm1,(%rsp) DB 197,241,254,202 ; vpaddd %xmm2,%xmm1,%xmm1 - DB 196,98,121,24,61,46,182,1,0 ; vbroadcastss 0x1b62e(%rip),%xmm15 # 2b708 <_sk_overlay_sse2_8bit+0x5e7> + DB 196,98,121,24,61,234,184,1,0 ; vbroadcastss 0x1b8ea(%rip),%xmm15 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7> DB 196,194,113,64,247 ; vpmulld %xmm15,%xmm1,%xmm6 DB 196,193,249,126,241 ; vmovq %xmm6,%r9 DB 69,137,202 ; mov %r9d,%r10d @@ -14993,7 +15183,7 @@ _sk_clut_4D_avx LABEL PROC DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7 DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7 DB 196,99,53,24,247,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm14 - DB 196,98,121,24,21,222,179,1,0 ; vbroadcastss 0x1b3de(%rip),%xmm10 # 2b594 <_sk_overlay_sse2_8bit+0x473> + DB 196,98,121,24,21,154,182,1,0 ; vbroadcastss 0x1b69a(%rip),%xmm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473> DB 196,65,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm9 DB 196,67,249,22,201,1 ; vpextrq $0x1,%xmm9,%r9 DB 196,65,249,126,202 ; vmovq %xmm9,%r10 @@ -15021,7 +15211,7 @@ _sk_clut_4D_avx LABEL PROC DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7 DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5 DB 196,99,85,24,220,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm11 - DB 196,98,121,24,13,81,179,1,0 ; vbroadcastss 0x1b351(%rip),%xmm9 # 2b59c <_sk_overlay_sse2_8bit+0x47b> + DB 196,98,121,24,13,13,182,1,0 ; vbroadcastss 0x1b60d(%rip),%xmm9 # 2bb88 <_sk_overlay_sse2_8bit+0x47b> DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3 DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9 DB 196,193,249,126,218 ; vmovq %xmm3,%r10 @@ -15049,7 +15239,7 @@ _sk_clut_4D_avx LABEL PROC DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5 DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4 DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6 - DB 196,226,125,24,37,37,180,1,0 ; vbroadcastss 0x1b425(%rip),%ymm4 # 2b704 <_sk_overlay_sse2_8bit+0x5e3> + DB 196,226,125,24,37,225,182,1,0 ; vbroadcastss 0x1b6e1(%rip),%ymm4 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3> DB 197,148,88,220 ; vaddps %ymm4,%ymm13,%ymm3 DB 197,252,40,252 ; vmovaps %ymm4,%ymm7 DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp) @@ -16479,7 +16669,7 @@ _sk_clut_4D_avx LABEL PROC DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2 DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,236,148,1,0 ; vbroadcastss 0x194ec(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f> + DB 196,226,125,24,29,168,151,1,0 ; vbroadcastss 0x197a8(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f> DB 197,252,16,164,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm4 DB 197,252,16,172,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm5 DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6 @@ -16521,13 +16711,13 @@ _sk_start_pipeline_sse41 LABEL PROC DB 73,137,246 ; mov %rsi,%r14 DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp) DB 76,57,203 ; cmp %r9,%rbx - DB 115,110 ; jae 121c1 <_sk_start_pipeline_sse41+0xeb> + DB 115,110 ; jae 124f1 <_sk_start_pipeline_sse41+0xeb> DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax DB 72,141,64,4 ; lea 0x4(%rax),%rax DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp) DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp) DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx - DB 119,43 ; ja 121a0 <_sk_start_pipeline_sse41+0xca> + DB 119,43 ; ja 124d0 <_sk_start_pipeline_sse41+0xca> DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12 DB 69,49,192 ; xor %r8d,%r8d DB 72,139,125,56 ; mov 0x38(%rbp),%rdi @@ -16539,17 +16729,17 @@ _sk_start_pipeline_sse41 LABEL PROC DB 73,131,196,8 ; add $0x8,%r12 DB 77,57,252 ; cmp %r15,%r12 DB 73,137,212 ; mov %rdx,%r12 - DB 118,220 ; jbe 1217c <_sk_start_pipeline_sse41+0xa6> + DB 118,220 ; jbe 124ac <_sk_start_pipeline_sse41+0xa6> DB 77,137,248 ; mov %r15,%r8 DB 73,41,208 ; sub %rdx,%r8 - DB 116,13 ; je 121b5 <_sk_start_pipeline_sse41+0xdf> + DB 116,13 ; je 124e5 <_sk_start_pipeline_sse41+0xdf> DB 72,139,125,56 ; mov 0x38(%rbp),%rdi DB 76,137,246 ; mov %r14,%rsi DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 72,255,195 ; inc %rbx DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx - DB 117,164 ; jne 12165 <_sk_start_pipeline_sse41+0x8f> + DB 117,164 ; jne 12495 <_sk_start_pipeline_sse41+0x8f> DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6 DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7 DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8 @@ -16580,7 +16770,7 @@ _sk_seed_shader_sse41 LABEL PROC DB 102,15,110,194 ; movd %edx,%xmm0 DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0 DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 - DB 15,40,21,53,157,1,0 ; movaps 0x19d35(%rip),%xmm2 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,40,21,229,159,1,0 ; movaps 0x19fe5(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,16,7 ; movups (%rdi),%xmm0 DB 15,88,193 ; addps %xmm1,%xmm0 @@ -16589,7 +16779,7 @@ _sk_seed_shader_sse41 LABEL PROC DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,21,36,157,1,0 ; movaps 0x19d24(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,212,159,1,0 ; movaps 0x19fd4(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,87,237 ; xorps %xmm5,%xmm5 @@ -16607,14 +16797,14 @@ _sk_dither_sse41 LABEL PROC DB 102,68,15,110,193 ; movd %ecx,%xmm8 DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8 DB 102,69,15,239,193 ; pxor %xmm9,%xmm8 - DB 102,68,15,111,21,242,156,1,0 ; movdqa 0x19cf2(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,21,162,159,1,0 ; movdqa 0x19fa2(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11 DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10 - DB 102,68,15,111,37,222,156,1,0 ; movdqa 0x19cde(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xe6f> - DB 102,68,15,111,45,229,156,1,0 ; movdqa 0x19ce5(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,37,142,159,1,0 ; movdqa 0x19f8e(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63> + DB 102,68,15,111,45,149,159,1,0 ; movdqa 0x19f95(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14 DB 102,69,15,219,245 ; pand %xmm13,%xmm14 DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14 @@ -16630,8 +16820,8 @@ _sk_dither_sse41 LABEL PROC DB 102,69,15,235,245 ; por %xmm13,%xmm14 DB 102,69,15,235,240 ; por %xmm8,%xmm14 DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8 - DB 68,15,89,5,160,156,1,0 ; mulps 0x19ca0(%rip),%xmm8 # 2bfb0 <_sk_overlay_sse2_8bit+0xe8f> - DB 68,15,88,5,168,156,1,0 ; addps 0x19ca8(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0xe9f> + DB 68,15,89,5,80,159,1,0 ; mulps 0x19f50(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83> + DB 68,15,88,5,88,159,1,0 ; addps 0x19f58(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93> DB 243,68,15,16,16 ; movss (%rax),%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -16669,7 +16859,7 @@ _sk_uniform_color_sse41 LABEL PROC PUBLIC _sk_black_color_sse41 _sk_black_color_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,222,155,1,0 ; movaps 0x19bde(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,142,158,1,0 ; movaps 0x19e8e(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,87,201 ; xorps %xmm1,%xmm1 DB 15,87,210 ; xorps %xmm2,%xmm2 @@ -16678,7 +16868,7 @@ _sk_black_color_sse41 LABEL PROC PUBLIC _sk_white_color_sse41 _sk_white_color_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,5,202,155,1,0 ; movaps 0x19bca(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,5,122,158,1,0 ; movaps 0x19e7a(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,40,216 ; movaps %xmm0,%xmm3 @@ -16716,7 +16906,7 @@ _sk_clear_sse41 LABEL PROC PUBLIC _sk_srcatop_sse41 _sk_srcatop_sse41 LABEL PROC DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 68,15,40,5,122,155,1,0 ; movaps 0x19b7a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,42,158,1,0 ; movaps 0x19e2a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -16739,7 +16929,7 @@ PUBLIC _sk_dstatop_sse41 _sk_dstatop_sse41 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 DB 68,15,89,196 ; mulps %xmm4,%xmm8 - DB 68,15,40,13,45,155,1,0 ; movaps 0x19b2d(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,221,157,1,0 ; movaps 0x19ddd(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 @@ -16780,7 +16970,7 @@ _sk_dstin_sse41 LABEL PROC PUBLIC _sk_srcout_sse41 _sk_srcout_sse41 LABEL PROC - DB 68,15,40,5,193,154,1,0 ; movaps 0x19ac1(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,113,157,1,0 ; movaps 0x19d71(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 @@ -16791,7 +16981,7 @@ _sk_srcout_sse41 LABEL PROC PUBLIC _sk_dstout_sse41 _sk_dstout_sse41 LABEL PROC - DB 68,15,40,5,161,154,1,0 ; movaps 0x19aa1(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,81,157,1,0 ; movaps 0x19d51(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 @@ -16806,7 +16996,7 @@ _sk_dstout_sse41 LABEL PROC PUBLIC _sk_srcover_sse41 _sk_srcover_sse41 LABEL PROC - DB 68,15,40,5,116,154,1,0 ; movaps 0x19a74(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,36,157,1,0 ; movaps 0x19d24(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -16824,7 +17014,7 @@ _sk_srcover_sse41 LABEL PROC PUBLIC _sk_dstover_sse41 _sk_dstover_sse41 LABEL PROC - DB 68,15,40,5,56,154,1,0 ; movaps 0x19a38(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,232,156,1,0 ; movaps 0x19ce8(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -16848,7 +17038,7 @@ _sk_modulate_sse41 LABEL PROC PUBLIC _sk_multiply_sse41 _sk_multiply_sse41 LABEL PROC - DB 68,15,40,5,252,153,1,0 ; movaps 0x199fc(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,172,156,1,0 ; movaps 0x19cac(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,209 ; movaps %xmm9,%xmm10 @@ -16884,9 +17074,14 @@ _sk_multiply_sse41 LABEL PROC PUBLIC _sk_plus__sse41 _sk_plus__sse41 LABEL PROC DB 15,88,196 ; addps %xmm4,%xmm0 + DB 68,15,40,5,45,156,1,0 ; movaps 0x19c2d(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> + DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 15,88,205 ; addps %xmm5,%xmm1 + DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 15,88,214 ; addps %xmm6,%xmm2 + DB 65,15,93,208 ; minps %xmm8,%xmm2 DB 15,88,223 ; addps %xmm7,%xmm3 + DB 65,15,93,216 ; minps %xmm8,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -16917,7 +17112,7 @@ _sk_screen_sse41 LABEL PROC PUBLIC _sk_xor__sse41 _sk_xor__sse41 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 - DB 15,40,29,33,153,1,0 ; movaps 0x19921(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,185,155,1,0 ; movaps 0x19bb9(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 @@ -16963,7 +17158,7 @@ _sk_darken_sse41 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,95,209 ; maxps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,124,152,1,0 ; movaps 0x1987c(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,20,155,1,0 ; movaps 0x19b14(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -16995,7 +17190,7 @@ _sk_lighten_sse41 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,17,152,1,0 ; movaps 0x19811(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,169,154,1,0 ; movaps 0x19aa9(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -17030,7 +17225,7 @@ _sk_difference_sse41 LABEL PROC DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,155,151,1,0 ; movaps 0x1979b(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,51,154,1,0 ; movaps 0x19a33(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -17056,7 +17251,7 @@ _sk_exclusion_sse41 LABEL PROC DB 15,89,214 ; mulps %xmm6,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,75,151,1,0 ; movaps 0x1974b(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,227,153,1,0 ; movaps 0x199e3(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -17066,7 +17261,7 @@ _sk_exclusion_sse41 LABEL PROC PUBLIC _sk_colorburn_sse41 _sk_colorburn_sse41 LABEL PROC - DB 68,15,40,29,50,151,1,0 ; movaps 0x19732(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,29,202,153,1,0 ; movaps 0x199ca(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,227 ; movaps %xmm11,%xmm12 DB 68,15,92,231 ; subps %xmm7,%xmm12 DB 69,15,40,204 ; movaps %xmm12,%xmm9 @@ -17148,7 +17343,7 @@ _sk_colorburn_sse41 LABEL PROC PUBLIC _sk_colordodge_sse41 _sk_colordodge_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,21,252,149,1,0 ; movaps 0x195fc(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,148,152,1,0 ; movaps 0x19894(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 @@ -17229,7 +17424,7 @@ _sk_hardlight_sse41 LABEL PROC DB 15,40,244 ; movaps %xmm4,%xmm6 DB 15,40,227 ; movaps %xmm3,%xmm4 DB 68,15,40,200 ; movaps %xmm0,%xmm9 - DB 68,15,40,21,196,148,1,0 ; movaps 0x194c4(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,92,151,1,0 ; movaps 0x1975c(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,40,234 ; movaps %xmm10,%xmm5 DB 15,92,239 ; subps %xmm7,%xmm5 DB 15,40,197 ; movaps %xmm5,%xmm0 @@ -17311,7 +17506,7 @@ PUBLIC _sk_overlay_sse41 _sk_overlay_sse41 LABEL PROC DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,40,240 ; movaps %xmm0,%xmm14 - DB 68,15,40,21,150,147,1,0 ; movaps 0x19396(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,46,150,1,0 ; movaps 0x1962e(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 65,15,40,195 ; movaps %xmm11,%xmm0 @@ -17395,7 +17590,7 @@ _sk_softlight_sse41 LABEL PROC DB 15,40,198 ; movaps %xmm6,%xmm0 DB 15,94,199 ; divps %xmm7,%xmm0 DB 65,15,84,193 ; andps %xmm9,%xmm0 - DB 15,40,13,89,146,1,0 ; movaps 0x19259(%rip),%xmm1 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,13,241,148,1,0 ; movaps 0x194f1(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 68,15,92,208 ; subps %xmm0,%xmm10 DB 68,15,40,240 ; movaps %xmm0,%xmm14 @@ -17408,10 +17603,10 @@ _sk_softlight_sse41 LABEL PROC DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,89,210 ; mulps %xmm2,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 - DB 68,15,40,45,135,146,1,0 ; movaps 0x19287(%rip),%xmm13 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf> + DB 68,15,40,45,31,149,1,0 ; movaps 0x1951f(%rip),%xmm13 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3> DB 69,15,88,245 ; addps %xmm13,%xmm14 DB 68,15,89,242 ; mulps %xmm2,%xmm14 - DB 68,15,40,37,135,146,1,0 ; movaps 0x19287(%rip),%xmm12 # 2bfe0 <_sk_overlay_sse2_8bit+0xebf> + DB 68,15,40,37,31,149,1,0 ; movaps 0x1951f(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3> DB 69,15,89,252 ; mulps %xmm12,%xmm15 DB 69,15,88,254 ; addps %xmm14,%xmm15 DB 15,40,198 ; movaps %xmm6,%xmm0 @@ -17597,12 +17792,12 @@ _sk_hue_sse41 LABEL PROC DB 68,15,84,208 ; andps %xmm0,%xmm10 DB 15,84,200 ; andps %xmm0,%xmm1 DB 68,15,84,232 ; andps %xmm0,%xmm13 - DB 15,40,5,237,143,1,0 ; movaps 0x18fed(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 15,40,5,133,146,1,0 ; movaps 0x19285(%rip),%xmm0 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 68,15,89,224 ; mulps %xmm0,%xmm12 - DB 15,40,21,242,143,1,0 ; movaps 0x18ff2(%rip),%xmm2 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 15,40,21,138,146,1,0 ; movaps 0x1928a(%rip),%xmm2 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 15,89,250 ; mulps %xmm2,%xmm7 DB 65,15,88,252 ; addps %xmm12,%xmm7 - DB 68,15,40,53,243,143,1,0 ; movaps 0x18ff3(%rip),%xmm14 # 2c010 <_sk_overlay_sse2_8bit+0xeef> + DB 68,15,40,53,139,146,1,0 ; movaps 0x1928b(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> DB 68,15,40,252 ; movaps %xmm4,%xmm15 DB 69,15,89,254 ; mulps %xmm14,%xmm15 DB 68,15,88,255 ; addps %xmm7,%xmm15 @@ -17685,7 +17880,7 @@ _sk_hue_sse41 LABEL PROC DB 65,15,88,214 ; addps %xmm14,%xmm2 DB 15,40,196 ; movaps %xmm4,%xmm0 DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1 - DB 68,15,40,13,8,142,1,0 ; movaps 0x18e08(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,160,144,1,0 ; movaps 0x190a0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,40,225 ; movaps %xmm9,%xmm4 DB 15,92,229 ; subps %xmm5,%xmm4 DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0 @@ -17779,14 +17974,14 @@ _sk_saturation_sse41 LABEL PROC DB 68,15,84,215 ; andps %xmm7,%xmm10 DB 68,15,84,223 ; andps %xmm7,%xmm11 DB 68,15,84,199 ; andps %xmm7,%xmm8 - DB 15,40,21,43,141,1,0 ; movaps 0x18d2b(%rip),%xmm2 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 15,40,21,195,143,1,0 ; movaps 0x18fc3(%rip),%xmm2 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 15,40,221 ; movaps %xmm5,%xmm3 DB 15,89,218 ; mulps %xmm2,%xmm3 - DB 15,40,13,46,141,1,0 ; movaps 0x18d2e(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 15,40,13,198,143,1,0 ; movaps 0x18fc6(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 15,40,254 ; movaps %xmm6,%xmm7 DB 15,89,249 ; mulps %xmm1,%xmm7 DB 15,88,251 ; addps %xmm3,%xmm7 - DB 68,15,40,45,45,141,1,0 ; movaps 0x18d2d(%rip),%xmm13 # 2c010 <_sk_overlay_sse2_8bit+0xeef> + DB 68,15,40,45,197,143,1,0 ; movaps 0x18fc5(%rip),%xmm13 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> DB 69,15,89,245 ; mulps %xmm13,%xmm14 DB 68,15,88,247 ; addps %xmm7,%xmm14 DB 65,15,40,218 ; movaps %xmm10,%xmm3 @@ -17867,7 +18062,7 @@ _sk_saturation_sse41 LABEL PROC DB 65,15,88,253 ; addps %xmm13,%xmm7 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11 - DB 68,15,40,13,67,139,1,0 ; movaps 0x18b43(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,219,141,1,0 ; movaps 0x18ddb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 68,15,92,204 ; subps %xmm4,%xmm9 DB 15,40,60,36 ; movaps (%rsp),%xmm7 @@ -17922,14 +18117,14 @@ _sk_color_sse41 LABEL PROC DB 15,40,231 ; movaps %xmm7,%xmm4 DB 68,15,89,244 ; mulps %xmm4,%xmm14 DB 15,89,204 ; mulps %xmm4,%xmm1 - DB 68,15,40,13,248,138,1,0 ; movaps 0x18af8(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,13,144,141,1,0 ; movaps 0x18d90(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 65,15,40,250 ; movaps %xmm10,%xmm7 DB 65,15,89,249 ; mulps %xmm9,%xmm7 - DB 68,15,40,21,248,138,1,0 ; movaps 0x18af8(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 68,15,40,21,144,141,1,0 ; movaps 0x18d90(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 65,15,40,219 ; movaps %xmm11,%xmm3 DB 65,15,89,218 ; mulps %xmm10,%xmm3 DB 15,88,223 ; addps %xmm7,%xmm3 - DB 68,15,40,29,245,138,1,0 ; movaps 0x18af5(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef> + DB 68,15,40,29,141,141,1,0 ; movaps 0x18d8d(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> DB 69,15,40,236 ; movaps %xmm12,%xmm13 DB 69,15,89,235 ; mulps %xmm11,%xmm13 DB 68,15,88,235 ; addps %xmm3,%xmm13 @@ -18014,7 +18209,7 @@ _sk_color_sse41 LABEL PROC DB 65,15,88,251 ; addps %xmm11,%xmm7 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1 - DB 68,15,40,13,1,137,1,0 ; movaps 0x18901(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,153,139,1,0 ; movaps 0x18b99(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,92,196 ; subps %xmm4,%xmm0 DB 68,15,89,192 ; mulps %xmm0,%xmm8 @@ -18066,13 +18261,13 @@ _sk_luminosity_sse41 LABEL PROC DB 69,15,89,216 ; mulps %xmm8,%xmm11 DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,89,205 ; mulps %xmm5,%xmm9 - DB 68,15,40,5,195,136,1,0 ; movaps 0x188c3(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,5,91,139,1,0 ; movaps 0x18b5b(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 65,15,89,192 ; mulps %xmm8,%xmm0 - DB 68,15,40,21,199,136,1,0 ; movaps 0x188c7(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 68,15,40,21,95,139,1,0 ; movaps 0x18b5f(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 15,40,233 ; movaps %xmm1,%xmm5 DB 65,15,89,234 ; mulps %xmm10,%xmm5 DB 15,88,232 ; addps %xmm0,%xmm5 - DB 68,15,40,37,197,136,1,0 ; movaps 0x188c5(%rip),%xmm12 # 2c010 <_sk_overlay_sse2_8bit+0xeef> + DB 68,15,40,37,93,139,1,0 ; movaps 0x18b5d(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> DB 68,15,40,242 ; movaps %xmm2,%xmm14 DB 69,15,89,244 ; mulps %xmm12,%xmm14 DB 68,15,88,245 ; addps %xmm5,%xmm14 @@ -18157,7 +18352,7 @@ _sk_luminosity_sse41 LABEL PROC DB 65,15,88,244 ; addps %xmm12,%xmm6 DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9 - DB 15,40,5,203,134,1,0 ; movaps 0x186cb(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,5,99,137,1,0 ; movaps 0x18963(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,92,215 ; subps %xmm7,%xmm2 DB 15,89,226 ; mulps %xmm2,%xmm4 @@ -18201,23 +18396,23 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,219,0,0,0 ; jne 13a10 <_sk_srcover_rgba_8888_sse41+0xfb> + DB 15,133,219,0,0,0 ; jne 13d58 <_sk_srcover_rgba_8888_sse41+0xfb> DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7 DB 77,133,192 ; test %r8,%r8 - DB 102,15,111,37,218,134,1,0 ; movdqa 0x186da(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,37,114,137,1,0 ; movdqa 0x18972(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 DB 102,15,111,239 ; movdqa %xmm7,%xmm5 - DB 102,15,56,0,45,214,134,1,0 ; pshufb 0x186d6(%rip),%xmm5 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,45,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 DB 102,15,111,247 ; movdqa %xmm7,%xmm6 - DB 102,15,56,0,53,214,134,1,0 ; pshufb 0x186d6(%rip),%xmm6 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,53,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 DB 102,15,114,215,24 ; psrld $0x18,%xmm7 DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 - DB 68,15,40,5,243,133,1,0 ; movaps 0x185f3(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,139,136,1,0 ; movaps 0x1888b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 - DB 68,15,40,37,199,134,1,0 ; movaps 0x186c7(%rip),%xmm12 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,37,95,137,1,0 ; movaps 0x1895f(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 65,15,89,196 ; mulps %xmm12,%xmm0 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -18243,7 +18438,7 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC DB 102,15,114,240,24 ; pslld $0x18,%xmm0 DB 102,15,235,194 ; por %xmm2,%xmm0 DB 102,15,235,193 ; por %xmm1,%xmm0 - DB 117,88 ; jne 13a4e <_sk_srcover_rgba_8888_sse41+0x139> + DB 117,88 ; jne 13d96 <_sk_srcover_rgba_8888_sse41+0x139> DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,193 ; movaps %xmm9,%xmm0 @@ -18254,32 +18449,32 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,91 ; je 13a78 <_sk_srcover_rgba_8888_sse41+0x163> + DB 116,91 ; je 13dc0 <_sk_srcover_rgba_8888_sse41+0x163> DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,22 ; je 13a3d <_sk_srcover_rgba_8888_sse41+0x128> + DB 116,22 ; je 13d85 <_sk_srcover_rgba_8888_sse41+0x128> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,10,255,255,255 ; jne 1393b <_sk_srcover_rgba_8888_sse41+0x26> + DB 15,133,10,255,255,255 ; jne 13c83 <_sk_srcover_rgba_8888_sse41+0x26> DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4 DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7 DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4 DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7 - DB 233,237,254,255,255 ; jmpq 1393b <_sk_srcover_rgba_8888_sse41+0x26> + DB 233,237,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26> DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,40 ; je 13a83 <_sk_srcover_rgba_8888_sse41+0x16e> + DB 116,40 ; je 13dcb <_sk_srcover_rgba_8888_sse41+0x16e> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,15 ; je 13a70 <_sk_srcover_rgba_8888_sse41+0x15b> + DB 116,15 ; je 13db8 <_sk_srcover_rgba_8888_sse41+0x15b> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,149 ; jne 139fc <_sk_srcover_rgba_8888_sse41+0xe7> + DB 117,149 ; jne 13d44 <_sk_srcover_rgba_8888_sse41+0xe7> DB 102,65,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm0,0x8(%r9,%rax,4) DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4) - DB 235,132 ; jmp 139fc <_sk_srcover_rgba_8888_sse41+0xe7> + DB 235,132 ; jmp 13d44 <_sk_srcover_rgba_8888_sse41+0xe7> DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7 - DB 233,184,254,255,255 ; jmpq 1393b <_sk_srcover_rgba_8888_sse41+0x26> + DB 233,184,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26> DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4) - DB 233,110,255,255,255 ; jmpq 139fc <_sk_srcover_rgba_8888_sse41+0xe7> + DB 233,110,255,255,255 ; jmpq 13d44 <_sk_srcover_rgba_8888_sse41+0xe7> PUBLIC _sk_clamp_0_sse41 _sk_clamp_0_sse41 LABEL PROC @@ -18293,7 +18488,7 @@ _sk_clamp_0_sse41 LABEL PROC PUBLIC _sk_clamp_1_sse41 _sk_clamp_1_sse41 LABEL PROC - DB 68,15,40,5,194,132,1,0 ; movaps 0x184c2(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,90,135,1,0 ; movaps 0x1875a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 65,15,93,208 ; minps %xmm8,%xmm2 @@ -18303,7 +18498,7 @@ _sk_clamp_1_sse41 LABEL PROC PUBLIC _sk_clamp_a_sse41 _sk_clamp_a_sse41 LABEL PROC - DB 15,93,29,167,132,1,0 ; minps 0x184a7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,93,29,63,135,1,0 ; minps 0x1873f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,93,195 ; minps %xmm3,%xmm0 DB 15,93,203 ; minps %xmm3,%xmm1 DB 15,93,211 ; minps %xmm3,%xmm2 @@ -18312,7 +18507,7 @@ _sk_clamp_a_sse41 LABEL PROC PUBLIC _sk_clamp_a_dst_sse41 _sk_clamp_a_dst_sse41 LABEL PROC - DB 15,93,61,147,132,1,0 ; minps 0x18493(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,93,61,43,135,1,0 ; minps 0x1872b(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,93,231 ; minps %xmm7,%xmm4 DB 15,93,239 ; minps %xmm7,%xmm5 DB 15,93,247 ; minps %xmm7,%xmm6 @@ -18341,7 +18536,7 @@ _sk_swap_rb_sse41 LABEL PROC PUBLIC _sk_invert_sse41 _sk_invert_sse41 LABEL PROC - DB 68,15,40,5,79,132,1,0 ; movaps 0x1844f(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,231,134,1,0 ; movaps 0x186e7(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,200 ; subps %xmm0,%xmm9 DB 69,15,40,208 ; movaps %xmm8,%xmm10 @@ -18393,7 +18588,7 @@ _sk_premul_dst_sse41 LABEL PROC PUBLIC _sk_unpremul_sse41 _sk_unpremul_sse41 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 - DB 68,15,40,13,217,131,1,0 ; movaps 0x183d9(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,113,134,1,0 ; movaps 0x18671(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,94,203 ; divps %xmm3,%xmm9 DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8 DB 69,15,84,193 ; andps %xmm9,%xmm8 @@ -18405,20 +18600,20 @@ _sk_unpremul_sse41 LABEL PROC PUBLIC _sk_from_srgb_sse41 _sk_from_srgb_sse41 LABEL PROC - DB 68,15,40,29,164,132,1,0 ; movaps 0x184a4(%rip),%xmm11 # 2c060 <_sk_overlay_sse2_8bit+0xf3f> + DB 68,15,40,29,60,135,1,0 ; movaps 0x1873c(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 DB 68,15,40,208 ; movaps %xmm0,%xmm10 DB 69,15,89,210 ; mulps %xmm10,%xmm10 - DB 68,15,40,37,28,132,1,0 ; movaps 0x1841c(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,37,180,134,1,0 ; movaps 0x186b4(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,196 ; mulps %xmm12,%xmm8 - DB 68,15,40,45,140,132,1,0 ; movaps 0x1848c(%rip),%xmm13 # 2c070 <_sk_overlay_sse2_8bit+0xf4f> + DB 68,15,40,45,36,135,1,0 ; movaps 0x18724(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43> DB 69,15,88,197 ; addps %xmm13,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 - DB 68,15,40,53,140,132,1,0 ; movaps 0x1848c(%rip),%xmm14 # 2c080 <_sk_overlay_sse2_8bit+0xf5f> + DB 68,15,40,53,36,135,1,0 ; movaps 0x18724(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53> DB 69,15,88,198 ; addps %xmm14,%xmm8 - DB 68,15,40,61,144,132,1,0 ; movaps 0x18490(%rip),%xmm15 # 2c090 <_sk_overlay_sse2_8bit+0xf6f> + DB 68,15,40,61,40,135,1,0 ; movaps 0x18728(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 68,15,40,209 ; movaps %xmm1,%xmm10 @@ -18453,19 +18648,19 @@ PUBLIC _sk_from_srgb_dst_sse41 _sk_from_srgb_dst_sse41 LABEL PROC DB 68,15,40,204 ; movaps %xmm4,%xmm9 DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,29,219,131,1,0 ; movaps 0x183db(%rip),%xmm11 # 2c060 <_sk_overlay_sse2_8bit+0xf3f> + DB 68,15,40,29,115,134,1,0 ; movaps 0x18673(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 69,15,89,211 ; mulps %xmm11,%xmm10 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 - DB 68,15,40,37,84,131,1,0 ; movaps 0x18354(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,37,236,133,1,0 ; movaps 0x185ec(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 65,15,89,228 ; mulps %xmm12,%xmm4 - DB 68,15,40,45,200,131,1,0 ; movaps 0x183c8(%rip),%xmm13 # 2c070 <_sk_overlay_sse2_8bit+0xf4f> + DB 68,15,40,45,96,134,1,0 ; movaps 0x18660(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43> DB 65,15,88,229 ; addps %xmm13,%xmm4 DB 15,89,224 ; mulps %xmm0,%xmm4 - DB 68,15,40,53,201,131,1,0 ; movaps 0x183c9(%rip),%xmm14 # 2c080 <_sk_overlay_sse2_8bit+0xf5f> + DB 68,15,40,53,97,134,1,0 ; movaps 0x18661(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53> DB 65,15,88,230 ; addps %xmm14,%xmm4 - DB 68,15,40,61,205,131,1,0 ; movaps 0x183cd(%rip),%xmm15 # 2c090 <_sk_overlay_sse2_8bit+0xf6f> + DB 68,15,40,61,101,134,1,0 ; movaps 0x18665(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63> DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4 @@ -18508,22 +18703,22 @@ _sk_to_srgb_sse41 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,209 ; movaps %xmm1,%xmm2 DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8 - DB 68,15,40,29,62,131,1,0 ; movaps 0x1833e(%rip),%xmm11 # 2c0a0 <_sk_overlay_sse2_8bit+0xf7f> + DB 68,15,40,29,214,133,1,0 ; movaps 0x185d6(%rip),%xmm11 # 2c680 <_sk_overlay_sse2_8bit+0xf73> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 - DB 68,15,40,37,62,131,1,0 ; movaps 0x1833e(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0xf8f> + DB 68,15,40,37,214,133,1,0 ; movaps 0x185d6(%rip),%xmm12 # 2c690 <_sk_overlay_sse2_8bit+0xf83> DB 69,15,40,248 ; movaps %xmm8,%xmm15 DB 69,15,89,252 ; mulps %xmm12,%xmm15 - DB 68,15,40,21,62,131,1,0 ; movaps 0x1833e(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0xf9f> + DB 68,15,40,21,214,133,1,0 ; movaps 0x185d6(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93> DB 69,15,88,250 ; addps %xmm10,%xmm15 DB 69,15,89,248 ; mulps %xmm8,%xmm15 - DB 68,15,40,45,62,131,1,0 ; movaps 0x1833e(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0xfaf> + DB 68,15,40,45,214,133,1,0 ; movaps 0x185d6(%rip),%xmm13 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3> DB 69,15,88,253 ; addps %xmm13,%xmm15 - DB 68,15,40,53,66,131,1,0 ; movaps 0x18342(%rip),%xmm14 # 2c0e0 <_sk_overlay_sse2_8bit+0xfbf> + DB 68,15,40,53,218,133,1,0 ; movaps 0x185da(%rip),%xmm14 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3> DB 69,15,88,198 ; addps %xmm14,%xmm8 DB 69,15,83,192 ; rcpps %xmm8,%xmm8 DB 69,15,89,199 ; mulps %xmm15,%xmm8 - DB 68,15,40,61,62,131,1,0 ; movaps 0x1833e(%rip),%xmm15 # 2c0f0 <_sk_overlay_sse2_8bit+0xfcf> + DB 68,15,40,61,214,133,1,0 ; movaps 0x185d6(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9 @@ -18567,15 +18762,17 @@ PUBLIC _sk_rgb_to_hsl_sse41 _sk_rgb_to_hsl_sse41 LABEL PROC DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,40,192 ; movaps %xmm0,%xmm8 + DB 65,15,40,193 ; movaps %xmm9,%xmm0 + DB 15,95,194 ; maxps %xmm2,%xmm0 DB 69,15,40,216 ; movaps %xmm8,%xmm11 - DB 69,15,95,217 ; maxps %xmm9,%xmm11 - DB 68,15,95,218 ; maxps %xmm2,%xmm11 + DB 68,15,95,216 ; maxps %xmm0,%xmm11 + DB 65,15,40,193 ; movaps %xmm9,%xmm0 + DB 15,93,194 ; minps %xmm2,%xmm0 DB 69,15,40,224 ; movaps %xmm8,%xmm12 - DB 69,15,93,225 ; minps %xmm9,%xmm12 - DB 68,15,93,226 ; minps %xmm2,%xmm12 + DB 68,15,93,224 ; minps %xmm0,%xmm12 DB 65,15,40,203 ; movaps %xmm11,%xmm1 DB 65,15,92,204 ; subps %xmm12,%xmm1 - DB 68,15,40,53,248,128,1,0 ; movaps 0x180f8(%rip),%xmm14 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,53,138,131,1,0 ; movaps 0x1838a(%rip),%xmm14 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,94,241 ; divps %xmm1,%xmm14 DB 69,15,40,211 ; movaps %xmm11,%xmm10 DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10 @@ -18584,27 +18781,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC DB 65,15,89,198 ; mulps %xmm14,%xmm0 DB 69,15,40,249 ; movaps %xmm9,%xmm15 DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15 - DB 68,15,84,61,95,130,1,0 ; andps 0x1825f(%rip),%xmm15 # 2c100 <_sk_overlay_sse2_8bit+0xfdf> + DB 68,15,84,61,241,132,1,0 ; andps 0x184f1(%rip),%xmm15 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3> DB 68,15,88,248 ; addps %xmm0,%xmm15 DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0 DB 65,15,92,208 ; subps %xmm8,%xmm2 DB 65,15,89,214 ; mulps %xmm14,%xmm2 - DB 68,15,40,45,82,130,1,0 ; movaps 0x18252(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0xfef> + DB 68,15,40,45,228,132,1,0 ; movaps 0x184e4(%rip),%xmm13 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3> DB 65,15,88,213 ; addps %xmm13,%xmm2 DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 69,15,89,198 ; mulps %xmm14,%xmm8 - DB 68,15,88,5,78,130,1,0 ; addps 0x1824e(%rip),%xmm8 # 2c120 <_sk_overlay_sse2_8bit+0xfff> + DB 68,15,88,5,224,132,1,0 ; addps 0x184e0(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3> DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8 - DB 68,15,89,5,70,130,1,0 ; mulps 0x18246(%rip),%xmm8 # 2c130 <_sk_overlay_sse2_8bit+0x100f> + DB 68,15,89,5,216,132,1,0 ; mulps 0x184d8(%rip),%xmm8 # 2c710 <_sk_overlay_sse2_8bit+0x1003> DB 69,15,40,203 ; movaps %xmm11,%xmm9 DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9 DB 69,15,84,193 ; andps %xmm9,%xmm8 DB 69,15,92,235 ; subps %xmm11,%xmm13 DB 69,15,88,220 ; addps %xmm12,%xmm11 - DB 15,40,5,90,128,1,0 ; movaps 0x1805a(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,40,5,236,130,1,0 ; movaps 0x182ec(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,40,211 ; movaps %xmm11,%xmm2 DB 15,89,208 ; mulps %xmm0,%xmm2 DB 15,194,194,1 ; cmpltps %xmm2,%xmm0 @@ -18625,7 +18822,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp) DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp) DB 68,15,40,208 ; movaps %xmm0,%xmm10 - DB 68,15,40,13,12,128,1,0 ; movaps 0x1800c(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,13,158,130,1,0 ; movaps 0x1829e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,194,194,2 ; cmpleps %xmm2,%xmm0 DB 15,40,217 ; movaps %xmm1,%xmm3 @@ -18638,19 +18835,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 15,41,20,36 ; movaps %xmm2,(%rsp) DB 69,15,88,192 ; addps %xmm8,%xmm8 DB 68,15,92,197 ; subps %xmm5,%xmm8 - DB 68,15,40,53,184,129,1,0 ; movaps 0x181b8(%rip),%xmm14 # 2c140 <_sk_overlay_sse2_8bit+0x101f> + DB 68,15,40,53,74,132,1,0 ; movaps 0x1844a(%rip),%xmm14 # 2c720 <_sk_overlay_sse2_8bit+0x1013> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0 DB 68,15,92,240 ; subps %xmm0,%xmm14 - DB 68,15,40,29,177,129,1,0 ; movaps 0x181b1(%rip),%xmm11 # 2c150 <_sk_overlay_sse2_8bit+0x102f> + DB 68,15,40,29,67,132,1,0 ; movaps 0x18443(%rip),%xmm11 # 2c730 <_sk_overlay_sse2_8bit+0x1023> DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 15,40,245 ; movaps %xmm5,%xmm6 DB 65,15,92,240 ; subps %xmm8,%xmm6 - DB 15,40,61,74,129,1,0 ; movaps 0x1814a(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0xfdf> + DB 15,40,61,220,131,1,0 ; movaps 0x183dc(%rip),%xmm7 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3> DB 69,15,40,238 ; movaps %xmm14,%xmm13 DB 68,15,89,239 ; mulps %xmm7,%xmm13 - DB 15,40,29,91,129,1,0 ; movaps 0x1815b(%rip),%xmm3 # 2c120 <_sk_overlay_sse2_8bit+0xfff> + DB 15,40,29,237,131,1,0 ; movaps 0x183ed(%rip),%xmm3 # 2c700 <_sk_overlay_sse2_8bit+0xff3> DB 68,15,40,227 ; movaps %xmm3,%xmm12 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 68,15,89,230 ; mulps %xmm6,%xmm12 @@ -18660,7 +18857,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 68,15,40,253 ; movaps %xmm5,%xmm15 DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15 - DB 68,15,40,37,58,129,1,0 ; movaps 0x1813a(%rip),%xmm12 # 2c130 <_sk_overlay_sse2_8bit+0x100f> + DB 68,15,40,37,204,131,1,0 ; movaps 0x183cc(%rip),%xmm12 # 2c710 <_sk_overlay_sse2_8bit+0x1003> DB 65,15,40,196 ; movaps %xmm12,%xmm0 DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 68,15,89,238 ; mulps %xmm6,%xmm13 @@ -18694,7 +18891,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 65,15,40,198 ; movaps %xmm14,%xmm0 DB 15,40,20,36 ; movaps (%rsp),%xmm2 DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1 - DB 68,15,88,21,211,128,1,0 ; addps 0x180d3(%rip),%xmm10 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,88,21,101,131,1,0 ; addps 0x18365(%rip),%xmm10 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0 DB 68,15,92,208 ; subps %xmm0,%xmm10 DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11 @@ -18746,11 +18943,11 @@ _sk_scale_u8_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,52 ; jne 14178 <_sk_scale_u8_sse41+0x4c> + DB 117,52 ; jne 144c6 <_sk_scale_u8_sse41+0x4c> DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8 - DB 102,68,15,219,5,204,126,1,0 ; pand 0x17ecc(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,68,15,219,5,94,129,1,0 ; pand 0x1815e(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,16,128,1,0 ; mulps 0x18010(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,89,5,162,130,1,0 ; mulps 0x182a2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 @@ -18761,12 +18958,12 @@ _sk_scale_u8_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,59 ; je 141c0 <_sk_scale_u8_sse41+0x94> + DB 116,59 ; je 1450e <_sk_scale_u8_sse41+0x94> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 141a7 <_sk_scale_u8_sse41+0x7b> + DB 116,23 ; je 144f5 <_sk_scale_u8_sse41+0x7b> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,181 ; jne 1414b <_sk_scale_u8_sse41+0x1f> + DB 117,181 ; jne 14499 <_sk_scale_u8_sse41+0x1f> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -18774,10 +18971,75 @@ _sk_scale_u8_sse41 LABEL PROC DB 102,68,15,110,200 ; movd %eax,%xmm9 DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9 DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8 - DB 235,139 ; jmp 1414b <_sk_scale_u8_sse41+0x1f> + DB 235,139 ; jmp 14499 <_sk_scale_u8_sse41+0x1f> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,124,255,255,255 ; jmpq 1414b <_sk_scale_u8_sse41+0x1f> + DB 233,124,255,255,255 ; jmpq 14499 <_sk_scale_u8_sse41+0x1f> + +PUBLIC _sk_scale_565_sse41 +_sk_scale_565_sse41 LABEL PROC + DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 76,99,80,8 ; movslq 0x8(%rax),%r10 + DB 76,99,201 ; movslq %ecx,%r9 + DB 77,15,175,202 ; imul %r10,%r9 + DB 77,1,201 ; add %r9,%r9 + DB 76,3,8 ; add (%rax),%r9 + DB 76,99,218 ; movslq %edx,%r11 + DB 77,133,192 ; test %r8,%r8 + DB 15,133,159,0,0,0 ; jne 145e0 <_sk_scale_565_sse41+0xc3> + DB 102,71,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm11 + DB 102,15,111,5,16,130,1,0 ; movdqa 0x18210(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053> + DB 102,65,15,219,195 ; pand %xmm11,%xmm0 + DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9 + DB 68,15,89,13,15,130,1,0 ; mulps 0x1820f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,5,23,130,1,0 ; movdqa 0x18217(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073> + DB 102,65,15,219,195 ; pand %xmm11,%xmm0 + DB 68,15,91,208 ; cvtdq2ps %xmm0,%xmm10 + DB 68,15,89,21,22,130,1,0 ; mulps 0x18216(%rip),%xmm10 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,68,15,219,29,29,130,1,0 ; pand 0x1821d(%rip),%xmm11 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> + DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11 + DB 68,15,89,29,33,130,1,0 ; mulps 0x18221(%rip),%xmm11 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> + DB 15,40,195 ; movaps %xmm3,%xmm0 + DB 15,194,199,1 ; cmpltps %xmm7,%xmm0 + DB 69,15,40,226 ; movaps %xmm10,%xmm12 + DB 69,15,93,227 ; minps %xmm11,%xmm12 + DB 69,15,40,233 ; movaps %xmm9,%xmm13 + DB 69,15,93,236 ; minps %xmm12,%xmm13 + DB 69,15,40,242 ; movaps %xmm10,%xmm14 + DB 69,15,95,243 ; maxps %xmm11,%xmm14 + DB 69,15,40,225 ; movaps %xmm9,%xmm12 + DB 69,15,95,230 ; maxps %xmm14,%xmm12 + DB 102,69,15,56,20,229 ; blendvps %xmm0,%xmm13,%xmm12 + DB 69,15,89,200 ; mulps %xmm8,%xmm9 + DB 68,15,89,209 ; mulps %xmm1,%xmm10 + DB 68,15,89,218 ; mulps %xmm2,%xmm11 + DB 68,15,89,227 ; mulps %xmm3,%xmm12 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 65,15,40,193 ; movaps %xmm9,%xmm0 + DB 65,15,40,202 ; movaps %xmm10,%xmm1 + DB 65,15,40,211 ; movaps %xmm11,%xmm2 + DB 65,15,40,220 ; movaps %xmm12,%xmm3 + DB 255,224 ; jmpq *%rax + DB 69,137,194 ; mov %r8d,%r10d + DB 65,128,226,3 ; and $0x3,%r10b + DB 65,128,250,1 ; cmp $0x1,%r10b + DB 116,60 ; je 14629 <_sk_scale_565_sse41+0x10c> + DB 102,69,15,239,219 ; pxor %xmm11,%xmm11 + DB 65,128,250,2 ; cmp $0x2,%r10b + DB 116,26 ; je 14612 <_sk_scale_565_sse41+0xf5> + DB 65,128,250,3 ; cmp $0x3,%r10b + DB 15,133,70,255,255,255 ; jne 14548 <_sk_scale_565_sse41+0x2b> + DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax + DB 102,15,110,192 ; movd %eax,%xmm0 + DB 102,68,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm11 + DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0 + DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 + DB 102,68,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm11 + DB 233,31,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b> + DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax + DB 102,68,15,110,216 ; movd %eax,%xmm11 + DB 233,16,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b> PUBLIC _sk_lerp_1_float_sse41 _sk_lerp_1_float_sse41 LABEL PROC @@ -18808,11 +19070,11 @@ _sk_lerp_u8_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,72 ; jne 14267 <_sk_lerp_u8_sse41+0x60> + DB 117,72 ; jne 146d0 <_sk_lerp_u8_sse41+0x60> DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8 - DB 102,68,15,219,5,241,125,1,0 ; pand 0x17df1(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,68,15,219,5,104,127,1,0 ; pand 0x17f68(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,53,127,1,0 ; mulps 0x17f35(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,89,5,172,128,1,0 ; mulps 0x180ac(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -18830,12 +19092,12 @@ _sk_lerp_u8_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,62 ; je 142b2 <_sk_lerp_u8_sse41+0xab> + DB 116,62 ; je 1471b <_sk_lerp_u8_sse41+0xab> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 14296 <_sk_lerp_u8_sse41+0x8f> + DB 116,23 ; je 146ff <_sk_lerp_u8_sse41+0x8f> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,161 ; jne 14226 <_sk_lerp_u8_sse41+0x1f> + DB 117,161 ; jne 1468f <_sk_lerp_u8_sse41+0x1f> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -18843,13 +19105,14 @@ _sk_lerp_u8_sse41 LABEL PROC DB 102,68,15,110,200 ; movd %eax,%xmm9 DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9 DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8 - DB 233,116,255,255,255 ; jmpq 14226 <_sk_lerp_u8_sse41+0x1f> + DB 233,116,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,101,255,255,255 ; jmpq 14226 <_sk_lerp_u8_sse41+0x1f> + DB 233,101,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f> PUBLIC _sk_lerp_565_sse41 _sk_lerp_565_sse41 LABEL PROC + DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8 DB 72,173 ; lods %ds:(%rsi),%rax DB 76,99,80,8 ; movslq 0x8(%rax),%r10 DB 76,99,201 ; movslq %ecx,%r9 @@ -18858,71 +19121,74 @@ _sk_lerp_565_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,152,0,0,0 ; jne 14378 <_sk_lerp_565_sse41+0xb7> + DB 15,133,165,0,0,0 ; jne 147f3 <_sk_lerp_565_sse41+0xc9> DB 102,71,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm10 - DB 102,68,15,111,5,144,126,1,0 ; movdqa 0x17e90(%rip),%xmm8 # 2c180 <_sk_overlay_sse2_8bit+0x105f> - DB 102,69,15,219,194 ; pand %xmm10,%xmm8 - DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,143,126,1,0 ; mulps 0x17e8f(%rip),%xmm8 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,68,15,111,13,150,126,1,0 ; movdqa 0x17e96(%rip),%xmm9 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> - DB 102,69,15,219,202 ; pand %xmm10,%xmm9 - DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9 - DB 68,15,89,13,149,126,1,0 ; mulps 0x17e95(%rip),%xmm9 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,68,15,219,21,156,126,1,0 ; pand 0x17e9c(%rip),%xmm10 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 102,15,111,5,3,128,1,0 ; movdqa 0x18003(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053> + DB 102,65,15,219,194 ; pand %xmm10,%xmm0 + DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9 + DB 68,15,89,13,2,128,1,0 ; mulps 0x18002(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,5,10,128,1,0 ; movdqa 0x1800a(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073> + DB 102,65,15,219,194 ; pand %xmm10,%xmm0 + DB 68,15,91,216 ; cvtdq2ps %xmm0,%xmm11 + DB 68,15,89,29,9,128,1,0 ; mulps 0x18009(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,68,15,219,21,16,128,1,0 ; pand 0x18010(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 - DB 68,15,89,21,160,126,1,0 ; mulps 0x17ea0(%rip),%xmm10 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> - DB 15,92,196 ; subps %xmm4,%xmm0 - DB 65,15,89,192 ; mulps %xmm8,%xmm0 - DB 15,88,196 ; addps %xmm4,%xmm0 + DB 68,15,89,21,20,128,1,0 ; mulps 0x18014(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> + DB 15,40,195 ; movaps %xmm3,%xmm0 + DB 15,194,199,1 ; cmpltps %xmm7,%xmm0 + DB 69,15,40,227 ; movaps %xmm11,%xmm12 DB 15,92,205 ; subps %xmm5,%xmm1 - DB 65,15,89,201 ; mulps %xmm9,%xmm1 + DB 65,15,89,203 ; mulps %xmm11,%xmm1 + DB 69,15,93,218 ; minps %xmm10,%xmm11 + DB 69,15,40,233 ; movaps %xmm9,%xmm13 + DB 68,15,92,196 ; subps %xmm4,%xmm8 + DB 69,15,89,193 ; mulps %xmm9,%xmm8 + DB 69,15,93,203 ; minps %xmm11,%xmm9 + DB 69,15,95,226 ; maxps %xmm10,%xmm12 + DB 69,15,95,236 ; maxps %xmm12,%xmm13 + DB 102,69,15,56,20,233 ; blendvps %xmm0,%xmm9,%xmm13 + DB 68,15,88,196 ; addps %xmm4,%xmm8 DB 15,88,205 ; addps %xmm5,%xmm1 DB 15,92,214 ; subps %xmm6,%xmm2 DB 65,15,89,210 ; mulps %xmm10,%xmm2 DB 15,88,214 ; addps %xmm6,%xmm2 DB 15,92,223 ; subps %xmm7,%xmm3 - DB 68,15,89,195 ; mulps %xmm3,%xmm8 - DB 68,15,88,199 ; addps %xmm7,%xmm8 - DB 68,15,89,203 ; mulps %xmm3,%xmm9 - DB 68,15,88,207 ; addps %xmm7,%xmm9 - DB 65,15,89,218 ; mulps %xmm10,%xmm3 + DB 65,15,89,221 ; mulps %xmm13,%xmm3 DB 15,88,223 ; addps %xmm7,%xmm3 - DB 68,15,95,203 ; maxps %xmm3,%xmm9 - DB 69,15,95,193 ; maxps %xmm9,%xmm8 DB 72,173 ; lods %ds:(%rsi),%rax - DB 65,15,40,216 ; movaps %xmm8,%xmm3 + DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,62 ; je 143c3 <_sk_lerp_565_sse41+0x102> + DB 116,60 ; je 1483c <_sk_lerp_565_sse41+0x112> DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,27 ; je 143ab <_sk_lerp_565_sse41+0xea> + DB 116,26 ; je 14825 <_sk_lerp_565_sse41+0xfb> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,77,255,255,255 ; jne 142e7 <_sk_lerp_565_sse41+0x26> + DB 15,133,64,255,255,255 ; jne 14755 <_sk_lerp_565_sse41+0x2b> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax - DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10 - DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8 - DB 102,69,15,56,51,192 ; pmovzxwd %xmm8,%xmm8 - DB 102,69,15,58,14,208,15 ; pblendw $0xf,%xmm8,%xmm10 - DB 233,36,255,255,255 ; jmpq 142e7 <_sk_lerp_565_sse41+0x26> + DB 102,15,110,192 ; movd %eax,%xmm0 + DB 102,68,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm10 + DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0 + DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 + DB 102,68,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm10 + DB 233,25,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,68,15,110,208 ; movd %eax,%xmm10 - DB 233,21,255,255,255 ; jmpq 142e7 <_sk_lerp_565_sse41+0x26> + DB 233,10,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b> PUBLIC _sk_load_tables_sse41 _sk_load_tables_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 77,133,192 ; test %r8,%r8 - DB 15,133,24,1,0,0 ; jne 144f8 <_sk_load_tables_sse41+0x126> + DB 15,133,24,1,0,0 ; jne 14971 <_sk_load_tables_sse41+0x126> DB 243,69,15,111,4,145 ; movdqu (%r9,%rdx,4),%xmm8 DB 65,87 ; push %r15 DB 65,86 ; push %r14 DB 83 ; push %rbx - DB 102,15,111,5,45,124,1,0 ; movdqa 0x17c2d(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,5,148,125,1,0 ; movdqa 0x17d94(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9 DB 102,73,15,126,194 ; movq %xmm0,%r10 @@ -18937,7 +19203,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0 DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0 DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1 - DB 102,15,56,0,13,232,123,1,0 ; pshufb 0x17be8(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,13,79,125,1,0 ; pshufb 0x17d4f(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx DB 68,15,182,211 ; movzbl %bl,%r10d @@ -18952,7 +19218,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1 DB 76,139,72,24 ; mov 0x18(%rax),%r9 DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2 - DB 102,15,56,0,21,164,123,1,0 ; pshufb 0x17ba4(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,21,11,125,1,0 ; pshufb 0x17d0b(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx DB 102,72,15,126,208 ; movq %xmm2,%rax DB 68,15,182,208 ; movzbl %al,%r10d @@ -18967,7 +19233,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2 DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8 DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3 - DB 15,89,29,129,124,1,0 ; mulps 0x17c81(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,29,232,125,1,0 ; mulps 0x17de8(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -18976,19 +19242,19 @@ _sk_load_tables_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,52 ; je 14539 <_sk_load_tables_sse41+0x167> + DB 116,52 ; je 149b2 <_sk_load_tables_sse41+0x167> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 14527 <_sk_load_tables_sse41+0x155> + DB 116,23 ; je 149a0 <_sk_load_tables_sse41+0x155> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,204,254,255,255 ; jne 143e6 <_sk_load_tables_sse41+0x14> + DB 15,133,204,254,255,255 ; jne 1485f <_sk_load_tables_sse41+0x14> DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0 DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8 DB 243,65,15,126,4,145 ; movq (%r9,%rdx,4),%xmm0 DB 102,68,15,58,14,192,15 ; pblendw $0xf,%xmm0,%xmm8 - DB 233,173,254,255,255 ; jmpq 143e6 <_sk_load_tables_sse41+0x14> + DB 233,173,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14> DB 102,69,15,110,4,145 ; movd (%r9,%rdx,4),%xmm8 - DB 233,162,254,255,255 ; jmpq 143e6 <_sk_load_tables_sse41+0x14> + DB 233,162,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14> PUBLIC _sk_load_tables_u16_be_sse41 _sk_load_tables_u16_be_sse41 LABEL PROC @@ -18996,7 +19262,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,99,1,0,0 ; jne 146bd <_sk_load_tables_u16_be_sse41+0x179> + DB 15,133,99,1,0,0 ; jne 14b36 <_sk_load_tables_u16_be_sse41+0x179> DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0 DB 243,67,15,111,76,81,16 ; movdqu 0x10(%r9,%r10,2),%xmm1 DB 65,87 ; push %r15 @@ -19008,7 +19274,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 - DB 102,68,15,111,5,79,124,1,0 ; movdqa 0x17c4f(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf> + DB 102,68,15,111,5,182,125,1,0 ; movdqa 0x17db6(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 @@ -19026,7 +19292,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0 DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2 DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0 - DB 102,15,56,0,13,254,123,1,0 ; pshufb 0x17bfe(%rip),%xmm1 # 2c1f0 <_sk_overlay_sse2_8bit+0x10cf> + DB 102,15,56,0,13,101,125,1,0 ; pshufb 0x17d65(%rip),%xmm1 # 2c7d0 <_sk_overlay_sse2_8bit+0x10c3> DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1 DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx @@ -19062,7 +19328,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,65,15,235,216 ; por %xmm8,%xmm3 DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,76,123,1,0 ; mulps 0x17b4c(%rip),%xmm3 # 2c200 <_sk_overlay_sse2_8bit+0x10df> + DB 15,89,29,179,124,1,0 ; mulps 0x17cb3(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -19070,16 +19336,16 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 146d6 <_sk_load_tables_u16_be_sse41+0x192> + DB 117,13 ; jne 14b4f <_sk_load_tables_u16_be_sse41+0x192> DB 243,15,126,192 ; movq %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,145,254,255,255 ; jmpq 14567 <_sk_load_tables_u16_be_sse41+0x23> + DB 233,145,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23> DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,124,254,255,255 ; jb 14567 <_sk_load_tables_u16_be_sse41+0x23> + DB 15,130,124,254,255,255 ; jb 149e0 <_sk_load_tables_u16_be_sse41+0x23> DB 243,67,15,126,76,81,16 ; movq 0x10(%r9,%r10,2),%xmm1 - DB 233,112,254,255,255 ; jmpq 14567 <_sk_load_tables_u16_be_sse41+0x23> + DB 233,112,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23> PUBLIC _sk_load_tables_rgb_u16_be_sse41 _sk_load_tables_rgb_u16_be_sse41 LABEL PROC @@ -19087,7 +19353,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,83,1,0,0 ; jne 1485c <_sk_load_tables_rgb_u16_be_sse41+0x165> + DB 15,133,83,1,0,0 ; jne 14cd5 <_sk_load_tables_rgb_u16_be_sse41+0x165> DB 243,67,15,111,20,81 ; movdqu (%r9,%r10,2),%xmm2 DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1 DB 102,15,115,217,4 ; psrldq $0x4,%xmm1 @@ -19102,7 +19368,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 DB 102,15,111,202 ; movdqa %xmm2,%xmm1 DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1 - DB 102,68,15,111,5,145,122,1,0 ; movdqa 0x17a91(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf> + DB 102,68,15,111,5,248,123,1,0 ; movdqa 0x17bf8(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 @@ -19120,7 +19386,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0 DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3 DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0 - DB 102,15,56,0,13,96,122,1,0 ; pshufb 0x17a60(%rip),%xmm1 # 2c210 <_sk_overlay_sse2_8bit+0x10ef> + DB 102,15,56,0,13,199,123,1,0 ; pshufb 0x17bc7(%rip),%xmm1 # 2c7f0 <_sk_overlay_sse2_8bit+0x10e3> DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1 DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx @@ -19151,7 +19417,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3 DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,27,119,1,0 ; movaps 0x1771b(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,130,120,1,0 ; movaps 0x17882(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 91 ; pop %rbx DB 65,94 ; pop %r14 DB 65,95 ; pop %r15 @@ -19160,21 +19426,21 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,67,15,196,84,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm2 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,14 ; jne 14882 <_sk_load_tables_rgb_u16_be_sse41+0x18b> + DB 117,14 ; jne 14cfb <_sk_load_tables_rgb_u16_be_sse41+0x18b> DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 - DB 233,173,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38> + DB 233,173,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38> DB 102,71,15,110,76,81,6 ; movd 0x6(%r9,%r10,2),%xmm9 DB 102,71,15,196,76,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm9 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 148b3 <_sk_load_tables_rgb_u16_be_sse41+0x1bc> + DB 114,24 ; jb 14d2c <_sk_load_tables_rgb_u16_be_sse41+0x1bc> DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1 DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,124,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38> + DB 233,124,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38> DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,115,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38> + DB 233,115,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38> PUBLIC _sk_byte_tables_sse41 _sk_byte_tables_sse41 LABEL PROC @@ -19183,7 +19449,7 @@ _sk_byte_tables_sse41 LABEL PROC DB 65,84 ; push %r12 DB 83 ; push %rbx DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,131,119,1,0 ; movaps 0x17783(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,234,120,1,0 ; movaps 0x178ea(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9 @@ -19202,7 +19468,7 @@ _sk_byte_tables_sse41 LABEL PROC DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,13,68,120,1,0 ; movaps 0x17844(%rip),%xmm9 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,13,171,121,1,0 ; movaps 0x179ab(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -19296,7 +19562,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,13,172,118,1,0 ; movaps 0x176ac(%rip),%xmm9 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,13,19,120,1,0 ; movaps 0x17813(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -19473,31 +19739,31 @@ _sk_parametric_r_sse41 LABEL PROC DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8 - DB 68,15,89,5,148,116,1,0 ; mulps 0x17494(%rip),%xmm8 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,21,156,116,1,0 ; andps 0x1749c(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,21,196,113,1,0 ; orps 0x171c4(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,5,156,116,1,0 ; addps 0x1749c(%rip),%xmm8 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 68,15,40,37,164,116,1,0 ; movaps 0x174a4(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,5,251,117,1,0 ; mulps 0x175fb(%rip),%xmm8 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,21,3,118,1,0 ; andps 0x17603(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,21,43,115,1,0 ; orps 0x1732b(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,5,3,118,1,0 ; addps 0x17603(%rip),%xmm8 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 68,15,40,37,11,118,1,0 ; movaps 0x1760b(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,196 ; subps %xmm12,%xmm8 - DB 68,15,88,21,164,116,1,0 ; addps 0x174a4(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 68,15,40,37,172,116,1,0 ; movaps 0x174ac(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,21,11,118,1,0 ; addps 0x1760b(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 68,15,40,37,19,118,1,0 ; movaps 0x17613(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,196 ; subps %xmm12,%xmm8 DB 69,15,89,195 ; mulps %xmm11,%xmm8 DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10 DB 69,15,40,216 ; movaps %xmm8,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,5,153,116,1,0 ; addps 0x17499(%rip),%xmm8 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 68,15,40,21,161,116,1,0 ; movaps 0x174a1(%rip),%xmm10 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,5,0,118,1,0 ; addps 0x17600(%rip),%xmm8 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 69,15,89,211 ; mulps %xmm11,%xmm10 DB 69,15,92,194 ; subps %xmm10,%xmm8 - DB 68,15,40,21,161,116,1,0 ; movaps 0x174a1(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 68,15,40,29,165,116,1,0 ; movaps 0x174a5(%rip),%xmm11 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 68,15,40,29,12,118,1,0 ; movaps 0x1760c(%rip),%xmm11 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 69,15,94,218 ; divps %xmm10,%xmm11 DB 69,15,88,216 ; addps %xmm8,%xmm11 - DB 68,15,89,29,165,116,1,0 ; mulps 0x174a5(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 68,15,89,29,12,118,1,0 ; mulps 0x1760c(%rip),%xmm11 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10 DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 @@ -19505,7 +19771,7 @@ _sk_parametric_r_sse41 LABEL PROC DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,44,113,1,0 ; minps 0x1712c(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,93,5,147,114,1,0 ; minps 0x17293(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -19533,31 +19799,31 @@ _sk_parametric_g_sse41 LABEL PROC DB 68,15,88,217 ; addps %xmm1,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,109,115,1,0 ; mulps 0x1736d(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,29,117,115,1,0 ; andps 0x17375(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,29,157,112,1,0 ; orps 0x1709d(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,37,117,115,1,0 ; addps 0x17375(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 15,40,13,126,115,1,0 ; movaps 0x1737e(%rip),%xmm1 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,37,212,116,1,0 ; mulps 0x174d4(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,29,220,116,1,0 ; andps 0x174dc(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,29,4,114,1,0 ; orps 0x17204(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,37,220,116,1,0 ; addps 0x174dc(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 15,40,13,229,116,1,0 ; movaps 0x174e5(%rip),%xmm1 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 - DB 68,15,88,29,126,115,1,0 ; addps 0x1737e(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 15,40,13,135,115,1,0 ; movaps 0x17387(%rip),%xmm1 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,29,229,116,1,0 ; addps 0x174e5(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 15,40,13,238,116,1,0 ; movaps 0x174ee(%rip),%xmm1 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 65,15,94,203 ; divps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,116,115,1,0 ; addps 0x17374(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 15,40,13,125,115,1,0 ; movaps 0x1737d(%rip),%xmm1 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,37,219,116,1,0 ; addps 0x174db(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 15,40,13,228,116,1,0 ; movaps 0x174e4(%rip),%xmm1 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 - DB 68,15,40,21,125,115,1,0 ; movaps 0x1737d(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,21,228,116,1,0 ; movaps 0x174e4(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,13,130,115,1,0 ; movaps 0x17382(%rip),%xmm1 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 15,40,13,233,116,1,0 ; movaps 0x174e9(%rip),%xmm1 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 65,15,94,202 ; divps %xmm10,%xmm1 DB 65,15,88,204 ; addps %xmm12,%xmm1 - DB 15,89,13,131,115,1,0 ; mulps 0x17383(%rip),%xmm1 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 15,89,13,234,116,1,0 ; mulps 0x174ea(%rip),%xmm1 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10 DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1 DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1 @@ -19565,7 +19831,7 @@ _sk_parametric_g_sse41 LABEL PROC DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,200 ; maxps %xmm0,%xmm1 - DB 15,93,13,14,112,1,0 ; minps 0x1700e(%rip),%xmm1 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,93,13,117,113,1,0 ; minps 0x17175(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -19593,31 +19859,31 @@ _sk_parametric_b_sse41 LABEL PROC DB 68,15,88,218 ; addps %xmm2,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,79,114,1,0 ; mulps 0x1724f(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,29,87,114,1,0 ; andps 0x17257(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,29,127,111,1,0 ; orps 0x16f7f(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,37,87,114,1,0 ; addps 0x17257(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 15,40,21,96,114,1,0 ; movaps 0x17260(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,37,182,115,1,0 ; mulps 0x173b6(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,29,190,115,1,0 ; andps 0x173be(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,29,230,112,1,0 ; orps 0x170e6(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,37,190,115,1,0 ; addps 0x173be(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 15,40,21,199,115,1,0 ; movaps 0x173c7(%rip),%xmm2 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 65,15,89,211 ; mulps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 - DB 68,15,88,29,96,114,1,0 ; addps 0x17260(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 15,40,21,105,114,1,0 ; movaps 0x17269(%rip),%xmm2 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,29,199,115,1,0 ; addps 0x173c7(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 15,40,21,208,115,1,0 ; movaps 0x173d0(%rip),%xmm2 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 65,15,94,211 ; divps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,86,114,1,0 ; addps 0x17256(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 15,40,21,95,114,1,0 ; movaps 0x1725f(%rip),%xmm2 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,37,189,115,1,0 ; addps 0x173bd(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm2 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 65,15,89,211 ; mulps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 - DB 68,15,40,21,95,114,1,0 ; movaps 0x1725f(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,21,100,114,1,0 ; movaps 0x17264(%rip),%xmm2 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 15,40,21,203,115,1,0 ; movaps 0x173cb(%rip),%xmm2 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 65,15,94,210 ; divps %xmm10,%xmm2 DB 65,15,88,212 ; addps %xmm12,%xmm2 - DB 15,89,21,101,114,1,0 ; mulps 0x17265(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 15,89,21,204,115,1,0 ; mulps 0x173cc(%rip),%xmm2 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10 DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2 DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2 @@ -19625,7 +19891,7 @@ _sk_parametric_b_sse41 LABEL PROC DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,208 ; maxps %xmm0,%xmm2 - DB 15,93,21,240,110,1,0 ; minps 0x16ef0(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,93,21,87,112,1,0 ; minps 0x17057(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -19653,31 +19919,31 @@ _sk_parametric_a_sse41 LABEL PROC DB 68,15,88,219 ; addps %xmm3,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,49,113,1,0 ; mulps 0x17131(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,29,57,113,1,0 ; andps 0x17139(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,29,97,110,1,0 ; orps 0x16e61(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,37,57,113,1,0 ; addps 0x17139(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 15,40,29,66,113,1,0 ; movaps 0x17142(%rip),%xmm3 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,37,152,114,1,0 ; mulps 0x17298(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,29,160,114,1,0 ; andps 0x172a0(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,29,200,111,1,0 ; orps 0x16fc8(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,37,160,114,1,0 ; addps 0x172a0(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 15,40,29,169,114,1,0 ; movaps 0x172a9(%rip),%xmm3 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 65,15,89,219 ; mulps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 - DB 68,15,88,29,66,113,1,0 ; addps 0x17142(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 15,40,29,75,113,1,0 ; movaps 0x1714b(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,29,169,114,1,0 ; addps 0x172a9(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 15,40,29,178,114,1,0 ; movaps 0x172b2(%rip),%xmm3 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 65,15,94,219 ; divps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,56,113,1,0 ; addps 0x17138(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 15,40,29,65,113,1,0 ; movaps 0x17141(%rip),%xmm3 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,37,159,114,1,0 ; addps 0x1729f(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 15,40,29,168,114,1,0 ; movaps 0x172a8(%rip),%xmm3 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 65,15,89,219 ; mulps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 - DB 68,15,40,21,65,113,1,0 ; movaps 0x17141(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,21,168,114,1,0 ; movaps 0x172a8(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,29,70,113,1,0 ; movaps 0x17146(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 15,40,29,173,114,1,0 ; movaps 0x172ad(%rip),%xmm3 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 65,15,94,218 ; divps %xmm10,%xmm3 DB 65,15,88,220 ; addps %xmm12,%xmm3 - DB 15,89,29,71,113,1,0 ; mulps 0x17147(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 15,89,29,174,114,1,0 ; mulps 0x172ae(%rip),%xmm3 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10 DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 @@ -19685,7 +19951,7 @@ _sk_parametric_a_sse41 LABEL PROC DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,216 ; maxps %xmm0,%xmm3 - DB 15,93,29,210,109,1,0 ; minps 0x16dd2(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,93,29,57,111,1,0 ; minps 0x16f39(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -19701,20 +19967,20 @@ _sk_gamma_sse41 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0 - DB 15,89,5,78,112,1,0 ; mulps 0x1704e(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,40,53,86,112,1,0 ; movaps 0x17056(%rip),%xmm14 # 2c230 <_sk_overlay_sse2_8bit+0x110f> + DB 15,89,5,181,113,1,0 ; mulps 0x171b5(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,40,53,189,113,1,0 ; movaps 0x171bd(%rip),%xmm14 # 2c810 <_sk_overlay_sse2_8bit+0x1103> DB 65,15,84,214 ; andps %xmm14,%xmm2 - DB 68,15,40,37,122,109,1,0 ; movaps 0x16d7a(%rip),%xmm12 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,37,225,110,1,0 ; movaps 0x16ee1(%rip),%xmm12 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,86,212 ; orps %xmm12,%xmm2 - DB 68,15,40,21,78,112,1,0 ; movaps 0x1704e(%rip),%xmm10 # 2c240 <_sk_overlay_sse2_8bit+0x111f> + DB 68,15,40,21,181,113,1,0 ; movaps 0x171b5(%rip),%xmm10 # 2c820 <_sk_overlay_sse2_8bit+0x1113> DB 65,15,88,194 ; addps %xmm10,%xmm0 - DB 68,15,40,29,82,112,1,0 ; movaps 0x17052(%rip),%xmm11 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,40,29,185,113,1,0 ; movaps 0x171b9(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 15,40,226 ; movaps %xmm2,%xmm4 DB 65,15,89,227 ; mulps %xmm11,%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 68,15,40,13,80,112,1,0 ; movaps 0x17050(%rip),%xmm9 # 2c260 <_sk_overlay_sse2_8bit+0x113f> + DB 68,15,40,13,183,113,1,0 ; movaps 0x171b7(%rip),%xmm9 # 2c840 <_sk_overlay_sse2_8bit+0x1133> DB 65,15,88,209 ; addps %xmm9,%xmm2 - DB 68,15,40,45,84,112,1,0 ; movaps 0x17054(%rip),%xmm13 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,40,45,187,113,1,0 ; movaps 0x171bb(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 65,15,40,229 ; movaps %xmm13,%xmm4 DB 15,94,226 ; divps %xmm2,%xmm4 DB 72,173 ; lods %ds:(%rsi),%rax @@ -19725,21 +19991,21 @@ _sk_gamma_sse41 LABEL PROC DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2 DB 15,40,224 ; movaps %xmm0,%xmm4 DB 15,92,226 ; subps %xmm2,%xmm4 - DB 15,40,53,55,112,1,0 ; movaps 0x17037(%rip),%xmm6 # 2c280 <_sk_overlay_sse2_8bit+0x115f> + DB 15,40,53,158,113,1,0 ; movaps 0x1719e(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153> DB 15,88,198 ; addps %xmm6,%xmm0 - DB 15,40,61,77,112,1,0 ; movaps 0x1704d(%rip),%xmm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 15,40,61,180,113,1,0 ; movaps 0x171b4(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 15,40,239 ; movaps %xmm7,%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 DB 15,40,212 ; movaps %xmm4,%xmm2 - DB 15,40,37,45,112,1,0 ; movaps 0x1702d(%rip),%xmm4 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 15,40,37,148,113,1,0 ; movaps 0x17194(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 15,89,212 ; mulps %xmm4,%xmm2 DB 15,92,194 ; subps %xmm2,%xmm0 - DB 68,15,40,61,63,112,1,0 ; movaps 0x1703f(%rip),%xmm15 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 68,15,40,61,166,113,1,0 ; movaps 0x171a6(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 65,15,40,215 ; movaps %xmm15,%xmm2 DB 15,94,213 ; divps %xmm5,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 15,89,5,155,111,1,0 ; mulps 0x16f9b(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> + DB 15,89,5,2,113,1,0 ; mulps 0x17102(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> DB 65,15,84,206 ; andps %xmm14,%xmm1 DB 65,15,86,204 ; orps %xmm12,%xmm1 DB 65,15,88,194 ; addps %xmm10,%xmm0 @@ -19765,8 +20031,8 @@ _sk_gamma_sse41 LABEL PROC DB 15,94,206 ; divps %xmm6,%xmm1 DB 15,88,200 ; addps %xmm0,%xmm1 DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0 - DB 15,89,5,60,111,1,0 ; mulps 0x16f3c(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 15,84,29,69,111,1,0 ; andps 0x16f45(%rip),%xmm3 # 2c230 <_sk_overlay_sse2_8bit+0x110f> + DB 15,89,5,163,112,1,0 ; mulps 0x170a3(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 15,84,29,172,112,1,0 ; andps 0x170ac(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103> DB 65,15,86,220 ; orps %xmm12,%xmm3 DB 65,15,88,194 ; addps %xmm10,%xmm0 DB 68,15,89,219 ; mulps %xmm3,%xmm11 @@ -19784,7 +20050,7 @@ _sk_gamma_sse41 LABEL PROC DB 15,92,253 ; subps %xmm5,%xmm7 DB 68,15,94,255 ; divps %xmm7,%xmm15 DB 68,15,88,248 ; addps %xmm0,%xmm15 - DB 15,40,5,141,111,1,0 ; movaps 0x16f8d(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 15,40,5,244,112,1,0 ; movaps 0x170f4(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 15,89,208 ; mulps %xmm0,%xmm2 DB 15,89,200 ; mulps %xmm0,%xmm1 DB 68,15,89,248 ; mulps %xmm0,%xmm15 @@ -19803,29 +20069,29 @@ _sk_gamma_sse41 LABEL PROC PUBLIC _sk_lab_to_xyz_sse41 _sk_lab_to_xyz_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,89,5,90,111,1,0 ; mulps 0x16f5a(%rip),%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0x11af> - DB 68,15,40,13,210,108,1,0 ; movaps 0x16cd2(%rip),%xmm9 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,89,5,193,112,1,0 ; mulps 0x170c1(%rip),%xmm8 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3> + DB 68,15,40,13,57,110,1,0 ; movaps 0x16e39(%rip),%xmm9 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 65,15,89,201 ; mulps %xmm9,%xmm1 - DB 15,40,5,87,111,1,0 ; movaps 0x16f57(%rip),%xmm0 # 2c2e0 <_sk_overlay_sse2_8bit+0x11bf> + DB 15,40,5,190,112,1,0 ; movaps 0x170be(%rip),%xmm0 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3> DB 15,88,200 ; addps %xmm0,%xmm1 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 - DB 68,15,88,5,85,111,1,0 ; addps 0x16f55(%rip),%xmm8 # 2c2f0 <_sk_overlay_sse2_8bit+0x11cf> - DB 68,15,89,5,93,111,1,0 ; mulps 0x16f5d(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0x11df> - DB 15,89,13,102,111,1,0 ; mulps 0x16f66(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0x11ef> + DB 68,15,88,5,188,112,1,0 ; addps 0x170bc(%rip),%xmm8 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3> + DB 68,15,89,5,196,112,1,0 ; mulps 0x170c4(%rip),%xmm8 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3> + DB 15,89,13,205,112,1,0 ; mulps 0x170cd(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3> DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 15,89,21,107,111,1,0 ; mulps 0x16f6b(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0x11ff> + DB 15,89,21,210,112,1,0 ; mulps 0x170d2(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3> DB 69,15,40,208 ; movaps %xmm8,%xmm10 DB 68,15,92,210 ; subps %xmm2,%xmm10 DB 68,15,40,217 ; movaps %xmm1,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 DB 68,15,89,217 ; mulps %xmm1,%xmm11 - DB 68,15,40,13,95,111,1,0 ; movaps 0x16f5f(%rip),%xmm9 # 2c330 <_sk_overlay_sse2_8bit+0x120f> + DB 68,15,40,13,198,112,1,0 ; movaps 0x170c6(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x1203> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0 - DB 15,40,21,95,111,1,0 ; movaps 0x16f5f(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0x121f> + DB 15,40,21,198,112,1,0 ; movaps 0x170c6(%rip),%xmm2 # 2c920 <_sk_overlay_sse2_8bit+0x1213> DB 15,88,202 ; addps %xmm2,%xmm1 - DB 68,15,40,37,100,111,1,0 ; movaps 0x16f64(%rip),%xmm12 # 2c350 <_sk_overlay_sse2_8bit+0x122f> + DB 68,15,40,37,203,112,1,0 ; movaps 0x170cb(%rip),%xmm12 # 2c930 <_sk_overlay_sse2_8bit+0x1223> DB 65,15,89,204 ; mulps %xmm12,%xmm1 DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1 DB 69,15,40,216 ; movaps %xmm8,%xmm11 @@ -19844,8 +20110,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC DB 65,15,89,212 ; mulps %xmm12,%xmm2 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2 - DB 15,89,13,29,111,1,0 ; mulps 0x16f1d(%rip),%xmm1 # 2c360 <_sk_overlay_sse2_8bit+0x123f> - DB 15,89,21,38,111,1,0 ; mulps 0x16f26(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0x124f> + DB 15,89,13,132,112,1,0 ; mulps 0x17084(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x1233> + DB 15,89,21,141,112,1,0 ; mulps 0x1708d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,193 ; movaps %xmm1,%xmm0 DB 65,15,40,200 ; movaps %xmm8,%xmm1 @@ -19860,11 +20126,11 @@ _sk_load_a8_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,39 ; jne 15494 <_sk_load_a8_sse41+0x3f> + DB 117,39 ; jne 1590d <_sk_load_a8_sse41+0x3f> DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0 - DB 102,15,219,5,164,107,1,0 ; pand 0x16ba4(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,5,11,109,1,0 ; pand 0x16d0b(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,234,108,1,0 ; mulps 0x16cea(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,29,81,110,1,0 ; mulps 0x16e51(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -19873,12 +20139,12 @@ _sk_load_a8_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 154d6 <_sk_load_a8_sse41+0x81> + DB 116,53 ; je 1594f <_sk_load_a8_sse41+0x81> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 154c0 <_sk_load_a8_sse41+0x6b> + DB 116,21 ; je 15939 <_sk_load_a8_sse41+0x6b> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,195 ; jne 15474 <_sk_load_a8_sse41+0x1f> + DB 117,195 ; jne 158ed <_sk_load_a8_sse41+0x1f> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -19886,10 +20152,10 @@ _sk_load_a8_sse41 LABEL PROC DB 102,15,110,200 ; movd %eax,%xmm1 DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1 DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0 - DB 235,158 ; jmp 15474 <_sk_load_a8_sse41+0x1f> + DB 235,158 ; jmp 158ed <_sk_load_a8_sse41+0x1f> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,147 ; jmp 15474 <_sk_load_a8_sse41+0x1f> + DB 235,147 ; jmp 158ed <_sk_load_a8_sse41+0x1f> PUBLIC _sk_load_a8_dst_sse41 _sk_load_a8_dst_sse41 LABEL PROC @@ -19900,11 +20166,11 @@ _sk_load_a8_dst_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,39 ; jne 15520 <_sk_load_a8_dst_sse41+0x3f> + DB 117,39 ; jne 15999 <_sk_load_a8_dst_sse41+0x3f> DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4 - DB 102,15,219,37,24,107,1,0 ; pand 0x16b18(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,37,127,108,1,0 ; pand 0x16c7f(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7 - DB 15,89,61,94,108,1,0 ; mulps 0x16c5e(%rip),%xmm7 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,61,197,109,1,0 ; mulps 0x16dc5(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,228 ; xorps %xmm4,%xmm4 DB 102,15,239,237 ; pxor %xmm5,%xmm5 @@ -19913,12 +20179,12 @@ _sk_load_a8_dst_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 15562 <_sk_load_a8_dst_sse41+0x81> + DB 116,53 ; je 159db <_sk_load_a8_dst_sse41+0x81> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1554c <_sk_load_a8_dst_sse41+0x6b> + DB 116,21 ; je 159c5 <_sk_load_a8_dst_sse41+0x6b> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,195 ; jne 15500 <_sk_load_a8_dst_sse41+0x1f> + DB 117,195 ; jne 15979 <_sk_load_a8_dst_sse41+0x1f> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -19926,10 +20192,10 @@ _sk_load_a8_dst_sse41 LABEL PROC DB 102,15,110,232 ; movd %eax,%xmm5 DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5 DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4 - DB 235,158 ; jmp 15500 <_sk_load_a8_dst_sse41+0x1f> + DB 235,158 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 - DB 235,147 ; jmp 15500 <_sk_load_a8_dst_sse41+0x1f> + DB 235,147 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f> PUBLIC _sk_gather_a8_sse41 _sk_gather_a8_sse41 LABEL PROC @@ -19956,7 +20222,7 @@ _sk_gather_a8_sse41 LABEL PROC DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,147,107,1,0 ; mulps 0x16b93(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,29,250,108,1,0 ; mulps 0x16cfa(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -19973,13 +20239,13 @@ _sk_store_a8_sse41 LABEL PROC DB 77,15,175,202 ; imul %r10,%r9 DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 - DB 68,15,40,5,68,106,1,0 ; movaps 0x16a44(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,171,107,1,0 ; movaps 0x16bab(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 68,15,89,195 ; mulps %xmm3,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 15636 <_sk_store_a8_sse41+0x49> + DB 117,17 ; jne 15aaf <_sk_store_a8_sse41+0x49> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 67,137,4,25 ; mov %eax,(%r9,%r11,1) DB 72,173 ; lods %ds:(%rsi),%rax @@ -19989,17 +20255,17 @@ _sk_store_a8_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,41 ; je 15672 <_sk_store_a8_sse41+0x85> + DB 116,41 ; je 15aeb <_sk_store_a8_sse41+0x85> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,15 ; je 1565e <_sk_store_a8_sse41+0x71> + DB 116,15 ; je 15ad7 <_sk_store_a8_sse41+0x71> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,217 ; jne 1562e <_sk_store_a8_sse41+0x41> + DB 117,217 ; jne 15aa7 <_sk_store_a8_sse41+0x41> DB 102,71,15,58,20,68,25,2,8 ; pextrb $0x8,%xmm8,0x2(%r9,%r11,1) - DB 102,68,15,56,0,5,24,109,1,0 ; pshufb 0x16d18(%rip),%xmm8 # 2c380 <_sk_overlay_sse2_8bit+0x125f> + DB 102,68,15,56,0,5,127,110,1,0 ; pshufb 0x16e7f(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x1253> DB 102,71,15,58,21,4,25,0 ; pextrw $0x0,%xmm8,(%r9,%r11,1) - DB 235,188 ; jmp 1562e <_sk_store_a8_sse41+0x41> + DB 235,188 ; jmp 15aa7 <_sk_store_a8_sse41+0x41> DB 102,71,15,58,20,4,25,0 ; pextrb $0x0,%xmm8,(%r9,%r11,1) - DB 235,178 ; jmp 1562e <_sk_store_a8_sse41+0x41> + DB 235,178 ; jmp 15aa7 <_sk_store_a8_sse41+0x41> PUBLIC _sk_load_g8_sse41 _sk_load_g8_sse41 LABEL PROC @@ -20010,25 +20276,25 @@ _sk_load_g8_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,42 ; jne 156be <_sk_load_g8_sse41+0x42> + DB 117,42 ; jne 15b37 <_sk_load_g8_sse41+0x42> DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0 - DB 102,15,219,5,125,105,1,0 ; pand 0x1697d(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,5,228,106,1,0 ; pand 0x16ae4(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,195,106,1,0 ; mulps 0x16ac3(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,5,42,108,1,0 ; mulps 0x16c2a(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,186,104,1,0 ; movaps 0x168ba(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,33,106,1,0 ; movaps 0x16a21(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 15700 <_sk_load_g8_sse41+0x84> + DB 116,53 ; je 15b79 <_sk_load_g8_sse41+0x84> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 156ea <_sk_load_g8_sse41+0x6e> + DB 116,21 ; je 15b63 <_sk_load_g8_sse41+0x6e> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,192 ; jne 1569b <_sk_load_g8_sse41+0x1f> + DB 117,192 ; jne 15b14 <_sk_load_g8_sse41+0x1f> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -20036,10 +20302,10 @@ _sk_load_g8_sse41 LABEL PROC DB 102,15,110,200 ; movd %eax,%xmm1 DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1 DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0 - DB 235,155 ; jmp 1569b <_sk_load_g8_sse41+0x1f> + DB 235,155 ; jmp 15b14 <_sk_load_g8_sse41+0x1f> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,144 ; jmp 1569b <_sk_load_g8_sse41+0x1f> + DB 235,144 ; jmp 15b14 <_sk_load_g8_sse41+0x1f> PUBLIC _sk_load_g8_dst_sse41 _sk_load_g8_dst_sse41 LABEL PROC @@ -20050,25 +20316,25 @@ _sk_load_g8_dst_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,42 ; jne 1574d <_sk_load_g8_dst_sse41+0x42> + DB 117,42 ; jne 15bc6 <_sk_load_g8_dst_sse41+0x42> DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4 - DB 102,15,219,37,238,104,1,0 ; pand 0x168ee(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,37,85,106,1,0 ; pand 0x16a55(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,52,106,1,0 ; mulps 0x16a34(%rip),%xmm4 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,37,155,107,1,0 ; mulps 0x16b9b(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,43,104,1,0 ; movaps 0x1682b(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,61,146,105,1,0 ; movaps 0x16992(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,40,244 ; movaps %xmm4,%xmm6 DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 1578f <_sk_load_g8_dst_sse41+0x84> + DB 116,53 ; je 15c08 <_sk_load_g8_dst_sse41+0x84> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 15779 <_sk_load_g8_dst_sse41+0x6e> + DB 116,21 ; je 15bf2 <_sk_load_g8_dst_sse41+0x6e> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,192 ; jne 1572a <_sk_load_g8_dst_sse41+0x1f> + DB 117,192 ; jne 15ba3 <_sk_load_g8_dst_sse41+0x1f> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -20076,10 +20342,10 @@ _sk_load_g8_dst_sse41 LABEL PROC DB 102,15,110,232 ; movd %eax,%xmm5 DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5 DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4 - DB 235,155 ; jmp 1572a <_sk_load_g8_dst_sse41+0x1f> + DB 235,155 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 - DB 235,144 ; jmp 1572a <_sk_load_g8_dst_sse41+0x1f> + DB 235,144 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f> PUBLIC _sk_gather_g8_sse41 _sk_gather_g8_sse41 LABEL PROC @@ -20106,9 +20372,9 @@ _sk_gather_g8_sse41 LABEL PROC DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,102,105,1,0 ; mulps 0x16966(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,5,205,106,1,0 ; mulps 0x16acd(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,93,103,1,0 ; movaps 0x1675d(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,196,104,1,0 ; movaps 0x168c4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 91 ; pop %rbx @@ -20124,41 +20390,41 @@ _sk_load_565_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,80 ; jne 15887 <_sk_load_565_sse41+0x6b> + DB 117,80 ; jne 15d00 <_sk_load_565_sse41+0x6b> DB 102,67,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm2 - DB 102,15,111,5,58,105,1,0 ; movdqa 0x1693a(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f> + DB 102,15,111,5,161,106,1,0 ; movdqa 0x16aa1(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,60,105,1,0 ; mulps 0x1693c(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,15,111,13,68,105,1,0 ; movdqa 0x16944(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> + DB 15,89,5,163,106,1,0 ; mulps 0x16aa3(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,13,171,106,1,0 ; movdqa 0x16aab(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,70,105,1,0 ; mulps 0x16946(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,15,219,21,78,105,1,0 ; pand 0x1694e(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 15,89,13,173,106,1,0 ; mulps 0x16aad(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,15,219,21,181,106,1,0 ; pand 0x16ab5(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,84,105,1,0 ; mulps 0x16954(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> + DB 15,89,21,187,106,1,0 ; mulps 0x16abb(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,235,102,1,0 ; movaps 0x166eb(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,82,104,1,0 ; movaps 0x16852(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 158c9 <_sk_load_565_sse41+0xad> + DB 116,53 ; je 15d42 <_sk_load_565_sse41+0xad> DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 158b3 <_sk_load_565_sse41+0x97> + DB 116,21 ; je 15d2c <_sk_load_565_sse41+0x97> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,154 ; jne 1583e <_sk_load_565_sse41+0x22> + DB 117,154 ; jne 15cb7 <_sk_load_565_sse41+0x22> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2 DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2 - DB 233,117,255,255,255 ; jmpq 1583e <_sk_load_565_sse41+0x22> + DB 233,117,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,208 ; movd %eax,%xmm2 - DB 233,103,255,255,255 ; jmpq 1583e <_sk_load_565_sse41+0x22> + DB 233,103,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22> PUBLIC _sk_load_565_dst_sse41 _sk_load_565_dst_sse41 LABEL PROC @@ -20170,41 +20436,41 @@ _sk_load_565_dst_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,80 ; jne 15942 <_sk_load_565_dst_sse41+0x6b> + DB 117,80 ; jne 15dbb <_sk_load_565_dst_sse41+0x6b> DB 102,67,15,56,51,52,89 ; pmovzxwd (%r9,%r11,2),%xmm6 - DB 102,15,111,37,127,104,1,0 ; movdqa 0x1687f(%rip),%xmm4 # 2c180 <_sk_overlay_sse2_8bit+0x105f> + DB 102,15,111,37,230,105,1,0 ; movdqa 0x169e6(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053> DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,129,104,1,0 ; mulps 0x16881(%rip),%xmm4 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,15,111,45,137,104,1,0 ; movdqa 0x16889(%rip),%xmm5 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> + DB 15,89,37,232,105,1,0 ; mulps 0x169e8(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,45,240,105,1,0 ; movdqa 0x169f0(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073> DB 102,15,219,238 ; pand %xmm6,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,139,104,1,0 ; mulps 0x1688b(%rip),%xmm5 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,15,219,53,147,104,1,0 ; pand 0x16893(%rip),%xmm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 15,89,45,242,105,1,0 ; mulps 0x169f2(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,15,219,53,250,105,1,0 ; pand 0x169fa(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,153,104,1,0 ; mulps 0x16899(%rip),%xmm6 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> + DB 15,89,53,0,106,1,0 ; mulps 0x16a00(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,48,102,1,0 ; movaps 0x16630(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,61,151,103,1,0 ; movaps 0x16797(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 15984 <_sk_load_565_dst_sse41+0xad> + DB 116,53 ; je 15dfd <_sk_load_565_dst_sse41+0xad> DB 102,15,239,246 ; pxor %xmm6,%xmm6 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1596e <_sk_load_565_dst_sse41+0x97> + DB 116,21 ; je 15de7 <_sk_load_565_dst_sse41+0x97> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,154 ; jne 158f9 <_sk_load_565_dst_sse41+0x22> + DB 117,154 ; jne 15d72 <_sk_load_565_dst_sse41+0x22> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6 DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4 DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4 DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6 - DB 233,117,255,255,255 ; jmpq 158f9 <_sk_load_565_dst_sse41+0x22> + DB 233,117,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,240 ; movd %eax,%xmm6 - DB 233,103,255,255,255 ; jmpq 158f9 <_sk_load_565_dst_sse41+0x22> + DB 233,103,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22> PUBLIC _sk_gather_565_sse41 _sk_gather_565_sse41 LABEL PROC @@ -20230,19 +20496,19 @@ _sk_gather_565_sse41 LABEL PROC DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0 DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2 - DB 102,15,111,5,132,103,1,0 ; movdqa 0x16784(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f> + DB 102,15,111,5,235,104,1,0 ; movdqa 0x168eb(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,134,103,1,0 ; mulps 0x16786(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,15,111,13,142,103,1,0 ; movdqa 0x1678e(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> + DB 15,89,5,237,104,1,0 ; mulps 0x168ed(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,13,245,104,1,0 ; movdqa 0x168f5(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,144,103,1,0 ; mulps 0x16790(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,15,219,21,152,103,1,0 ; pand 0x16798(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 15,89,13,247,104,1,0 ; mulps 0x168f7(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,15,219,21,255,104,1,0 ; pand 0x168ff(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,158,103,1,0 ; mulps 0x1679e(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> + DB 15,89,21,5,105,1,0 ; mulps 0x16905(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,53,101,1,0 ; movaps 0x16535(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,156,102,1,0 ; movaps 0x1669c(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -20255,12 +20521,12 @@ _sk_store_565_sse41 LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 68,15,40,5,52,105,1,0 ; movaps 0x16934(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0x126f> + DB 68,15,40,5,155,106,1,0 ; movaps 0x16a9b(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9 - DB 68,15,40,21,41,105,1,0 ; movaps 0x16929(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x127f> + DB 68,15,40,21,144,106,1,0 ; movaps 0x16a90(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273> DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10 DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10 @@ -20270,7 +20536,7 @@ _sk_store_565_sse41 LABEL PROC DB 102,69,15,86,194 ; orpd %xmm10,%xmm8 DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 15aae <_sk_store_565_sse41+0x70> + DB 117,10 ; jne 15f27 <_sk_store_565_sse41+0x70> DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -20278,17 +20544,17 @@ _sk_store_565_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,35 ; je 15ae4 <_sk_store_565_sse41+0xa6> + DB 116,35 ; je 15f5d <_sk_store_565_sse41+0xa6> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,15 ; je 15ad6 <_sk_store_565_sse41+0x98> + DB 116,15 ; je 15f4f <_sk_store_565_sse41+0x98> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,221 ; jne 15aaa <_sk_store_565_sse41+0x6c> + DB 117,221 ; jne 15f23 <_sk_store_565_sse41+0x6c> DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2) - DB 235,198 ; jmp 15aaa <_sk_store_565_sse41+0x6c> + DB 235,198 ; jmp 15f23 <_sk_store_565_sse41+0x6c> DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2) - DB 235,188 ; jmp 15aaa <_sk_store_565_sse41+0x6c> + DB 235,188 ; jmp 15f23 <_sk_store_565_sse41+0x6c> PUBLIC _sk_load_4444_sse41 _sk_load_4444_sse41 LABEL PROC @@ -20300,44 +20566,44 @@ _sk_load_4444_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,95 ; jne 15b68 <_sk_load_4444_sse41+0x7a> + DB 117,95 ; jne 15fe1 <_sk_load_4444_sse41+0x7a> DB 102,67,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm3 - DB 102,15,111,5,152,104,1,0 ; movdqa 0x16898(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f> + DB 102,15,111,5,255,105,1,0 ; movdqa 0x169ff(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,154,104,1,0 ; mulps 0x1689a(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f> - DB 102,15,111,13,162,104,1,0 ; movdqa 0x168a2(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af> + DB 15,89,5,1,106,1,0 ; mulps 0x16a01(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293> + DB 102,15,111,13,9,106,1,0 ; movdqa 0x16a09(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,164,104,1,0 ; mulps 0x168a4(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf> - DB 102,15,111,21,172,104,1,0 ; movdqa 0x168ac(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf> + DB 15,89,13,11,106,1,0 ; mulps 0x16a0b(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3> + DB 102,15,111,21,19,106,1,0 ; movdqa 0x16a13(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,174,104,1,0 ; mulps 0x168ae(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df> - DB 102,15,219,29,182,104,1,0 ; pand 0x168b6(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef> + DB 15,89,21,21,106,1,0 ; mulps 0x16a15(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3> + DB 102,15,219,29,29,106,1,0 ; pand 0x16a1d(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,188,104,1,0 ; mulps 0x168bc(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff> + DB 15,89,29,35,106,1,0 ; mulps 0x16a23(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 15baa <_sk_load_4444_sse41+0xbc> + DB 116,53 ; je 16023 <_sk_load_4444_sse41+0xbc> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 15b94 <_sk_load_4444_sse41+0xa6> + DB 116,21 ; je 1600d <_sk_load_4444_sse41+0xa6> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,139 ; jne 15b10 <_sk_load_4444_sse41+0x22> + DB 117,139 ; jne 15f89 <_sk_load_4444_sse41+0x22> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3 - DB 233,102,255,255,255 ; jmpq 15b10 <_sk_load_4444_sse41+0x22> + DB 233,102,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,216 ; movd %eax,%xmm3 - DB 233,88,255,255,255 ; jmpq 15b10 <_sk_load_4444_sse41+0x22> + DB 233,88,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22> PUBLIC _sk_load_4444_dst_sse41 _sk_load_4444_dst_sse41 LABEL PROC @@ -20349,44 +20615,44 @@ _sk_load_4444_dst_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,95 ; jne 15c32 <_sk_load_4444_dst_sse41+0x7a> + DB 117,95 ; jne 160ab <_sk_load_4444_dst_sse41+0x7a> DB 102,67,15,56,51,60,89 ; pmovzxwd (%r9,%r11,2),%xmm7 - DB 102,15,111,37,206,103,1,0 ; movdqa 0x167ce(%rip),%xmm4 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f> + DB 102,15,111,37,53,105,1,0 ; movdqa 0x16935(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,208,103,1,0 ; mulps 0x167d0(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f> - DB 102,15,111,45,216,103,1,0 ; movdqa 0x167d8(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af> + DB 15,89,37,55,105,1,0 ; mulps 0x16937(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293> + DB 102,15,111,45,63,105,1,0 ; movdqa 0x1693f(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3> DB 102,15,219,239 ; pand %xmm7,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,218,103,1,0 ; mulps 0x167da(%rip),%xmm5 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf> - DB 102,15,111,53,226,103,1,0 ; movdqa 0x167e2(%rip),%xmm6 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf> + DB 15,89,45,65,105,1,0 ; mulps 0x16941(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3> + DB 102,15,111,53,73,105,1,0 ; movdqa 0x16949(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3> DB 102,15,219,247 ; pand %xmm7,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,228,103,1,0 ; mulps 0x167e4(%rip),%xmm6 # 2c400 <_sk_overlay_sse2_8bit+0x12df> - DB 102,15,219,61,236,103,1,0 ; pand 0x167ec(%rip),%xmm7 # 2c410 <_sk_overlay_sse2_8bit+0x12ef> + DB 15,89,53,75,105,1,0 ; mulps 0x1694b(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3> + DB 102,15,219,61,83,105,1,0 ; pand 0x16953(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3> DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 - DB 15,89,61,242,103,1,0 ; mulps 0x167f2(%rip),%xmm7 # 2c420 <_sk_overlay_sse2_8bit+0x12ff> + DB 15,89,61,89,105,1,0 ; mulps 0x16959(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,53 ; je 15c74 <_sk_load_4444_dst_sse41+0xbc> + DB 116,53 ; je 160ed <_sk_load_4444_dst_sse41+0xbc> DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 15c5e <_sk_load_4444_dst_sse41+0xa6> + DB 116,21 ; je 160d7 <_sk_load_4444_dst_sse41+0xa6> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,139 ; jne 15bda <_sk_load_4444_dst_sse41+0x22> + DB 117,139 ; jne 16053 <_sk_load_4444_dst_sse41+0x22> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7 DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4 DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4 DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7 - DB 233,102,255,255,255 ; jmpq 15bda <_sk_load_4444_dst_sse41+0x22> + DB 233,102,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,248 ; movd %eax,%xmm7 - DB 233,88,255,255,255 ; jmpq 15bda <_sk_load_4444_dst_sse41+0x22> + DB 233,88,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22> PUBLIC _sk_gather_4444_sse41 _sk_gather_4444_sse41 LABEL PROC @@ -20412,21 +20678,21 @@ _sk_gather_4444_sse41 LABEL PROC DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0 DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3 - DB 102,15,111,5,196,102,1,0 ; movdqa 0x166c4(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f> + DB 102,15,111,5,43,104,1,0 ; movdqa 0x1682b(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,198,102,1,0 ; mulps 0x166c6(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f> - DB 102,15,111,13,206,102,1,0 ; movdqa 0x166ce(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af> + DB 15,89,5,45,104,1,0 ; mulps 0x1682d(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293> + DB 102,15,111,13,53,104,1,0 ; movdqa 0x16835(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,208,102,1,0 ; mulps 0x166d0(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf> - DB 102,15,111,21,216,102,1,0 ; movdqa 0x166d8(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf> + DB 15,89,13,55,104,1,0 ; mulps 0x16837(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3> + DB 102,15,111,21,63,104,1,0 ; movdqa 0x1683f(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,218,102,1,0 ; mulps 0x166da(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df> - DB 102,15,219,29,226,102,1,0 ; pand 0x166e2(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef> + DB 15,89,21,65,104,1,0 ; mulps 0x16841(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3> + DB 102,15,219,29,73,104,1,0 ; pand 0x16849(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,232,102,1,0 ; mulps 0x166e8(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff> + DB 15,89,29,79,104,1,0 ; mulps 0x1684f(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -20440,7 +20706,7 @@ _sk_store_4444_sse41 LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 68,15,40,5,213,102,1,0 ; movaps 0x166d5(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x130f> + DB 68,15,40,5,60,104,1,0 ; movaps 0x1683c(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -20460,7 +20726,7 @@ _sk_store_4444_sse41 LABEL PROC DB 102,69,15,86,194 ; orpd %xmm10,%xmm8 DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 15dc1 <_sk_store_4444_sse41+0x84> + DB 117,10 ; jne 1623a <_sk_store_4444_sse41+0x84> DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -20468,17 +20734,17 @@ _sk_store_4444_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,35 ; je 15df7 <_sk_store_4444_sse41+0xba> + DB 116,35 ; je 16270 <_sk_store_4444_sse41+0xba> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,15 ; je 15de9 <_sk_store_4444_sse41+0xac> + DB 116,15 ; je 16262 <_sk_store_4444_sse41+0xac> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,221 ; jne 15dbd <_sk_store_4444_sse41+0x80> + DB 117,221 ; jne 16236 <_sk_store_4444_sse41+0x80> DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2) - DB 235,198 ; jmp 15dbd <_sk_store_4444_sse41+0x80> + DB 235,198 ; jmp 16236 <_sk_store_4444_sse41+0x80> DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2) - DB 235,188 ; jmp 15dbd <_sk_store_4444_sse41+0x80> + DB 235,188 ; jmp 16236 <_sk_store_4444_sse41+0x80> PUBLIC _sk_load_8888_sse41 _sk_load_8888_sse41 LABEL PROC @@ -20490,19 +20756,19 @@ _sk_load_8888_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,89 ; jne 15e76 <_sk_load_8888_sse41+0x75> + DB 117,89 ; jne 162ef <_sk_load_8888_sse41+0x75> DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3 - DB 102,15,111,5,245,97,1,0 ; movdqa 0x161f5(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,5,92,99,1,0 ; movdqa 0x1635c(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,54,99,1,0 ; movaps 0x16336(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,157,100,1,0 ; movaps 0x1649d(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,229,97,1,0 ; pshufb 0x161e5(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,13,76,99,1,0 ; pshufb 0x1634c(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,225,97,1,0 ; pshufb 0x161e1(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,21,72,99,1,0 ; pshufb 0x16348(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -20513,19 +20779,19 @@ _sk_load_8888_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,45 ; je 15eb0 <_sk_load_8888_sse41+0xaf> + DB 116,45 ; je 16329 <_sk_load_8888_sse41+0xaf> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,18 ; je 15e9f <_sk_load_8888_sse41+0x9e> + DB 116,18 ; je 16318 <_sk_load_8888_sse41+0x9e> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,144 ; jne 15e23 <_sk_load_8888_sse41+0x22> + DB 117,144 ; jne 1629c <_sk_load_8888_sse41+0x22> DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0 DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3 - DB 233,115,255,255,255 ; jmpq 15e23 <_sk_load_8888_sse41+0x22> + DB 233,115,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22> DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3 - DB 233,104,255,255,255 ; jmpq 15e23 <_sk_load_8888_sse41+0x22> + DB 233,104,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22> PUBLIC _sk_load_8888_dst_sse41 _sk_load_8888_dst_sse41 LABEL PROC @@ -20537,19 +20803,19 @@ _sk_load_8888_dst_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,89 ; jne 15f30 <_sk_load_8888_dst_sse41+0x75> + DB 117,89 ; jne 163a9 <_sk_load_8888_dst_sse41+0x75> DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7 - DB 102,15,111,37,59,97,1,0 ; movdqa 0x1613b(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,37,162,98,1,0 ; movdqa 0x162a2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 68,15,40,5,124,98,1,0 ; movaps 0x1627c(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,227,99,1,0 ; movaps 0x163e3(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,224 ; mulps %xmm8,%xmm4 DB 102,15,111,239 ; movdqa %xmm7,%xmm5 - DB 102,15,56,0,45,43,97,1,0 ; pshufb 0x1612b(%rip),%xmm5 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,45,146,98,1,0 ; pshufb 0x16292(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 DB 65,15,89,232 ; mulps %xmm8,%xmm5 DB 102,15,111,247 ; movdqa %xmm7,%xmm6 - DB 102,15,56,0,53,39,97,1,0 ; pshufb 0x16127(%rip),%xmm6 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,53,142,98,1,0 ; pshufb 0x1628e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 DB 65,15,89,240 ; mulps %xmm8,%xmm6 DB 102,15,114,215,24 ; psrld $0x18,%xmm7 @@ -20560,19 +20826,19 @@ _sk_load_8888_dst_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,45 ; je 15f6a <_sk_load_8888_dst_sse41+0xaf> + DB 116,45 ; je 163e3 <_sk_load_8888_dst_sse41+0xaf> DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,18 ; je 15f59 <_sk_load_8888_dst_sse41+0x9e> + DB 116,18 ; je 163d2 <_sk_load_8888_dst_sse41+0x9e> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,144 ; jne 15edd <_sk_load_8888_dst_sse41+0x22> + DB 117,144 ; jne 16356 <_sk_load_8888_dst_sse41+0x22> DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4 DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7 DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4 DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7 - DB 233,115,255,255,255 ; jmpq 15edd <_sk_load_8888_dst_sse41+0x22> + DB 233,115,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22> DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7 - DB 233,104,255,255,255 ; jmpq 15edd <_sk_load_8888_dst_sse41+0x22> + DB 233,104,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22> PUBLIC _sk_gather_8888_sse41 _sk_gather_8888_sse41 LABEL PROC @@ -20595,17 +20861,17 @@ _sk_gather_8888_sse41 LABEL PROC DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3 DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3 DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3 - DB 102,15,111,5,74,96,1,0 ; movdqa 0x1604a(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,5,177,97,1,0 ; movdqa 0x161b1(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,139,97,1,0 ; movaps 0x1618b(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,242,98,1,0 ; movaps 0x162f2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,58,96,1,0 ; pshufb 0x1603a(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,13,161,97,1,0 ; pshufb 0x161a1(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,54,96,1,0 ; pshufb 0x16036(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,21,157,97,1,0 ; pshufb 0x1619d(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -20624,7 +20890,7 @@ _sk_store_8888_sse41 LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 68,15,40,5,15,96,1,0 ; movaps 0x1600f(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,118,97,1,0 ; movaps 0x16176(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -20643,23 +20909,23 @@ _sk_store_8888_sse41 LABEL PROC DB 102,69,15,235,193 ; por %xmm9,%xmm8 DB 102,69,15,235,194 ; por %xmm10,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 160a1 <_sk_store_8888_sse41+0x7f> + DB 117,10 ; jne 1651a <_sk_store_8888_sse41+0x7f> DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,29 ; je 160cb <_sk_store_8888_sse41+0xa9> + DB 116,29 ; je 16544 <_sk_store_8888_sse41+0xa9> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,15 ; je 160c3 <_sk_store_8888_sse41+0xa1> + DB 116,15 ; je 1653c <_sk_store_8888_sse41+0xa1> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,227 ; jne 1609d <_sk_store_8888_sse41+0x7b> + DB 117,227 ; jne 16516 <_sk_store_8888_sse41+0x7b> DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4) DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4) - DB 235,210 ; jmp 1609d <_sk_store_8888_sse41+0x7b> + DB 235,210 ; jmp 16516 <_sk_store_8888_sse41+0x7b> DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4) - DB 235,202 ; jmp 1609d <_sk_store_8888_sse41+0x7b> + DB 235,202 ; jmp 16516 <_sk_store_8888_sse41+0x7b> PUBLIC _sk_load_bgra_sse41 _sk_load_bgra_sse41 LABEL PROC @@ -20671,19 +20937,19 @@ _sk_load_bgra_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,89 ; jne 16148 <_sk_load_bgra_sse41+0x75> + DB 117,89 ; jne 165c1 <_sk_load_bgra_sse41+0x75> DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3 - DB 102,15,111,5,35,95,1,0 ; movdqa 0x15f23(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,5,138,96,1,0 ; movdqa 0x1608a(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2 - DB 68,15,40,5,100,96,1,0 ; movaps 0x16064(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,203,97,1,0 ; movaps 0x161cb(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,19,95,1,0 ; pshufb 0x15f13(%rip),%xmm0 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,5,122,96,1,0 ; pshufb 0x1607a(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,15,95,1,0 ; pshufb 0x15f0f(%rip),%xmm0 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,5,118,96,1,0 ; pshufb 0x16076(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -20694,19 +20960,19 @@ _sk_load_bgra_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,45 ; je 16182 <_sk_load_bgra_sse41+0xaf> + DB 116,45 ; je 165fb <_sk_load_bgra_sse41+0xaf> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,18 ; je 16171 <_sk_load_bgra_sse41+0x9e> + DB 116,18 ; je 165ea <_sk_load_bgra_sse41+0x9e> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,144 ; jne 160f5 <_sk_load_bgra_sse41+0x22> + DB 117,144 ; jne 1656e <_sk_load_bgra_sse41+0x22> DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0 DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3 - DB 233,115,255,255,255 ; jmpq 160f5 <_sk_load_bgra_sse41+0x22> + DB 233,115,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22> DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3 - DB 233,104,255,255,255 ; jmpq 160f5 <_sk_load_bgra_sse41+0x22> + DB 233,104,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22> PUBLIC _sk_load_bgra_dst_sse41 _sk_load_bgra_dst_sse41 LABEL PROC @@ -20718,19 +20984,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,89 ; jne 16202 <_sk_load_bgra_dst_sse41+0x75> + DB 117,89 ; jne 1667b <_sk_load_bgra_dst_sse41+0x75> DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7 - DB 102,15,111,37,105,94,1,0 ; movdqa 0x15e69(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,37,208,95,1,0 ; movdqa 0x15fd0(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6 - DB 68,15,40,5,170,95,1,0 ; movaps 0x15faa(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,17,97,1,0 ; movaps 0x16111(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,240 ; mulps %xmm8,%xmm6 DB 102,15,111,231 ; movdqa %xmm7,%xmm4 - DB 102,15,56,0,37,89,94,1,0 ; pshufb 0x15e59(%rip),%xmm4 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,37,192,95,1,0 ; pshufb 0x15fc0(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5 DB 65,15,89,232 ; mulps %xmm8,%xmm5 DB 102,15,111,231 ; movdqa %xmm7,%xmm4 - DB 102,15,56,0,37,85,94,1,0 ; pshufb 0x15e55(%rip),%xmm4 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,37,188,95,1,0 ; pshufb 0x15fbc(%rip),%xmm4 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 DB 65,15,89,224 ; mulps %xmm8,%xmm4 DB 102,15,114,215,24 ; psrld $0x18,%xmm7 @@ -20741,19 +21007,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,45 ; je 1623c <_sk_load_bgra_dst_sse41+0xaf> + DB 116,45 ; je 166b5 <_sk_load_bgra_dst_sse41+0xaf> DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,18 ; je 1622b <_sk_load_bgra_dst_sse41+0x9e> + DB 116,18 ; je 166a4 <_sk_load_bgra_dst_sse41+0x9e> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,144 ; jne 161af <_sk_load_bgra_dst_sse41+0x22> + DB 117,144 ; jne 16628 <_sk_load_bgra_dst_sse41+0x22> DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4 DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7 DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4 DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7 - DB 233,115,255,255,255 ; jmpq 161af <_sk_load_bgra_dst_sse41+0x22> + DB 233,115,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22> DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7 - DB 233,104,255,255,255 ; jmpq 161af <_sk_load_bgra_dst_sse41+0x22> + DB 233,104,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22> PUBLIC _sk_gather_bgra_sse41 _sk_gather_bgra_sse41 LABEL PROC @@ -20776,17 +21042,17 @@ _sk_gather_bgra_sse41 LABEL PROC DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3 DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3 DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3 - DB 102,15,111,5,120,93,1,0 ; movdqa 0x15d78(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,5,223,94,1,0 ; movdqa 0x15edf(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2 - DB 68,15,40,5,185,94,1,0 ; movaps 0x15eb9(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,32,96,1,0 ; movaps 0x16020(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,104,93,1,0 ; pshufb 0x15d68(%rip),%xmm0 # 2c030 <_sk_overlay_sse2_8bit+0xf0f> + DB 102,15,56,0,5,207,94,1,0 ; pshufb 0x15ecf(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03> DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,100,93,1,0 ; pshufb 0x15d64(%rip),%xmm0 # 2c040 <_sk_overlay_sse2_8bit+0xf1f> + DB 102,15,56,0,5,203,94,1,0 ; pshufb 0x15ecb(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -20805,7 +21071,7 @@ _sk_store_bgra_sse41 LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 68,15,40,5,61,93,1,0 ; movaps 0x15d3d(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,164,94,1,0 ; movaps 0x15ea4(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 68,15,40,202 ; movaps %xmm2,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -20824,23 +21090,23 @@ _sk_store_bgra_sse41 LABEL PROC DB 102,69,15,235,193 ; por %xmm9,%xmm8 DB 102,69,15,235,194 ; por %xmm10,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 16373 <_sk_store_bgra_sse41+0x7f> + DB 117,10 ; jne 167ec <_sk_store_bgra_sse41+0x7f> DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,29 ; je 1639d <_sk_store_bgra_sse41+0xa9> + DB 116,29 ; je 16816 <_sk_store_bgra_sse41+0xa9> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,15 ; je 16395 <_sk_store_bgra_sse41+0xa1> + DB 116,15 ; je 1680e <_sk_store_bgra_sse41+0xa1> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,227 ; jne 1636f <_sk_store_bgra_sse41+0x7b> + DB 117,227 ; jne 167e8 <_sk_store_bgra_sse41+0x7b> DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4) DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4) - DB 235,210 ; jmp 1636f <_sk_store_bgra_sse41+0x7b> + DB 235,210 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b> DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4) - DB 235,202 ; jmp 1636f <_sk_store_bgra_sse41+0x7b> + DB 235,202 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b> PUBLIC _sk_load_f16_sse41 _sk_load_f16_sse41 LABEL PROC @@ -20852,7 +21118,7 @@ _sk_load_f16_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,62,1,0,0 ; jne 16503 <_sk_load_f16_sse41+0x15e> + DB 15,133,62,1,0,0 ; jne 1697c <_sk_load_f16_sse41+0x15e> DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0 DB 243,65,15,111,76,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm1 DB 102,68,15,40,200 ; movapd %xmm0,%xmm9 @@ -20862,18 +21128,18 @@ _sk_load_f16_sse41 LABEL PROC DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1 - DB 102,68,15,111,5,66,96,1,0 ; movdqa 0x16042(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f> + DB 102,68,15,111,5,169,97,1,0 ; movdqa 0x161a9(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313> DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,65,15,219,208 ; pand %xmm8,%xmm2 DB 102,15,239,202 ; pxor %xmm2,%xmm1 - DB 102,15,111,29,61,96,1,0 ; movdqa 0x1603d(%rip),%xmm3 # 2c450 <_sk_overlay_sse2_8bit+0x132f> + DB 102,15,111,29,164,97,1,0 ; movdqa 0x161a4(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323> DB 102,15,114,242,16 ; pslld $0x10,%xmm2 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0 DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0 DB 102,15,114,241,13 ; pslld $0xd,%xmm1 DB 102,15,235,202 ; por %xmm2,%xmm1 - DB 102,68,15,111,21,41,96,1,0 ; movdqa 0x16029(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f> + DB 102,68,15,111,21,144,97,1,0 ; movdqa 0x16190(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333> DB 102,65,15,254,202 ; paddd %xmm10,%xmm1 DB 102,15,219,193 ; pand %xmm1,%xmm0 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -20916,16 +21182,16 @@ _sk_load_f16_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 1651c <_sk_load_f16_sse41+0x177> + DB 117,13 ; jne 16995 <_sk_load_f16_sse41+0x177> DB 243,15,126,192 ; movq %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,182,254,255,255 ; jmpq 163d2 <_sk_load_f16_sse41+0x2d> + DB 233,182,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d> DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,161,254,255,255 ; jb 163d2 <_sk_load_f16_sse41+0x2d> + DB 15,130,161,254,255,255 ; jb 1684b <_sk_load_f16_sse41+0x2d> DB 243,65,15,126,76,193,16 ; movq 0x10(%r9,%rax,8),%xmm1 - DB 233,149,254,255,255 ; jmpq 163d2 <_sk_load_f16_sse41+0x2d> + DB 233,149,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d> PUBLIC _sk_load_f16_dst_sse41 _sk_load_f16_dst_sse41 LABEL PROC @@ -20937,7 +21203,7 @@ _sk_load_f16_dst_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,62,1,0,0 ; jne 1669b <_sk_load_f16_dst_sse41+0x15e> + DB 15,133,62,1,0,0 ; jne 16b14 <_sk_load_f16_dst_sse41+0x15e> DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4 DB 243,65,15,111,108,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm5 DB 102,68,15,40,204 ; movapd %xmm4,%xmm9 @@ -20947,18 +21213,18 @@ _sk_load_f16_dst_sse41 LABEL PROC DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11 DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9 DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5 - DB 102,68,15,111,5,170,94,1,0 ; movdqa 0x15eaa(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f> + DB 102,68,15,111,5,17,96,1,0 ; movdqa 0x16011(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313> DB 102,15,111,245 ; movdqa %xmm5,%xmm6 DB 102,65,15,219,240 ; pand %xmm8,%xmm6 DB 102,15,239,238 ; pxor %xmm6,%xmm5 - DB 102,15,111,61,165,94,1,0 ; movdqa 0x15ea5(%rip),%xmm7 # 2c450 <_sk_overlay_sse2_8bit+0x132f> + DB 102,15,111,61,12,96,1,0 ; movdqa 0x1600c(%rip),%xmm7 # 2ca30 <_sk_overlay_sse2_8bit+0x1323> DB 102,15,114,246,16 ; pslld $0x10,%xmm6 DB 102,15,111,229 ; movdqa %xmm5,%xmm4 DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4 DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4 DB 102,15,114,245,13 ; pslld $0xd,%xmm5 DB 102,15,235,238 ; por %xmm6,%xmm5 - DB 102,68,15,111,21,145,94,1,0 ; movdqa 0x15e91(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f> + DB 102,68,15,111,21,248,95,1,0 ; movdqa 0x15ff8(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333> DB 102,65,15,254,234 ; paddd %xmm10,%xmm5 DB 102,15,219,229 ; pand %xmm5,%xmm4 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -21001,16 +21267,16 @@ _sk_load_f16_dst_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 166b4 <_sk_load_f16_dst_sse41+0x177> + DB 117,13 ; jne 16b2d <_sk_load_f16_dst_sse41+0x177> DB 243,15,126,228 ; movq %xmm4,%xmm4 DB 102,15,239,237 ; pxor %xmm5,%xmm5 - DB 233,182,254,255,255 ; jmpq 1656a <_sk_load_f16_dst_sse41+0x2d> + DB 233,182,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d> DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4 DB 102,15,239,237 ; pxor %xmm5,%xmm5 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,161,254,255,255 ; jb 1656a <_sk_load_f16_dst_sse41+0x2d> + DB 15,130,161,254,255,255 ; jb 169e3 <_sk_load_f16_dst_sse41+0x2d> DB 243,65,15,126,108,193,16 ; movq 0x10(%r9,%rax,8),%xmm5 - DB 233,149,254,255,255 ; jmpq 1656a <_sk_load_f16_dst_sse41+0x2d> + DB 233,149,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d> PUBLIC _sk_gather_f16_sse41 _sk_gather_f16_sse41 LABEL PROC @@ -21042,18 +21308,18 @@ _sk_gather_f16_sse41 LABEL PROC DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11 DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9 DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1 - DB 102,68,15,111,5,228,92,1,0 ; movdqa 0x15ce4(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f> + DB 102,68,15,111,5,75,94,1,0 ; movdqa 0x15e4b(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313> DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,65,15,219,208 ; pand %xmm8,%xmm2 DB 102,15,239,202 ; pxor %xmm2,%xmm1 - DB 102,15,111,29,223,92,1,0 ; movdqa 0x15cdf(%rip),%xmm3 # 2c450 <_sk_overlay_sse2_8bit+0x132f> + DB 102,15,111,29,70,94,1,0 ; movdqa 0x15e46(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323> DB 102,15,114,242,16 ; pslld $0x10,%xmm2 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0 DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0 DB 102,15,114,241,13 ; pslld $0xd,%xmm1 DB 102,15,235,202 ; por %xmm2,%xmm1 - DB 102,68,15,111,21,203,92,1,0 ; movdqa 0x15ccb(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f> + DB 102,68,15,111,21,50,94,1,0 ; movdqa 0x15e32(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333> DB 102,65,15,254,202 ; paddd %xmm10,%xmm1 DB 102,15,219,193 ; pand %xmm1,%xmm0 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -21105,17 +21371,17 @@ _sk_store_f16_sse41 LABEL PROC DB 73,193,225,3 ; shl $0x3,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 102,68,15,111,21,238,91,1,0 ; movdqa 0x15bee(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x134f> + DB 102,68,15,111,21,85,93,1,0 ; movdqa 0x15d55(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13 DB 102,69,15,239,235 ; pxor %xmm11,%xmm13 - DB 102,68,15,111,13,225,91,1,0 ; movdqa 0x15be1(%rip),%xmm9 # 2c480 <_sk_overlay_sse2_8bit+0x135f> + DB 102,68,15,111,13,72,93,1,0 ; movdqa 0x15d48(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353> DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11 DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8 DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8 DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13 - DB 102,68,15,111,37,210,91,1,0 ; movdqa 0x15bd2(%rip),%xmm12 # 2c490 <_sk_overlay_sse2_8bit+0x136f> + DB 102,68,15,111,37,57,93,1,0 ; movdqa 0x15d39(%rip),%xmm12 # 2ca70 <_sk_overlay_sse2_8bit+0x1363> DB 102,69,15,235,220 ; por %xmm12,%xmm11 DB 102,69,15,254,221 ; paddd %xmm13,%xmm11 DB 102,69,15,223,195 ; pandn %xmm11,%xmm8 @@ -21159,7 +21425,7 @@ _sk_store_f16_sse41 LABEL PROC DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9 DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 169b4 <_sk_store_f16_sse41+0x152> + DB 117,21 ; jne 16e2d <_sk_store_f16_sse41+0x152> DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8) DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8 DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8) @@ -21167,13 +21433,13 @@ _sk_store_f16_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 169b0 <_sk_store_f16_sse41+0x14e> + DB 116,240 ; je 16e29 <_sk_store_f16_sse41+0x14e> DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 169b0 <_sk_store_f16_sse41+0x14e> + DB 114,227 ; jb 16e29 <_sk_store_f16_sse41+0x14e> DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8 DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8) - DB 235,213 ; jmp 169b0 <_sk_store_f16_sse41+0x14e> + DB 235,213 ; jmp 16e29 <_sk_store_f16_sse41+0x14e> PUBLIC _sk_load_u16_be_sse41 _sk_load_u16_be_sse41 LABEL PROC @@ -21186,7 +21452,7 @@ _sk_load_u16_be_sse41 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,185,0,0,0 ; jne 16abb <_sk_load_u16_be_sse41+0xe0> + DB 15,133,185,0,0,0 ; jne 16f34 <_sk_load_u16_be_sse41+0xe0> DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0 DB 243,65,15,111,76,65,16 ; movdqu 0x10(%r9,%rax,2),%xmm1 DB 102,15,40,208 ; movapd %xmm0,%xmm2 @@ -21202,7 +21468,7 @@ _sk_load_u16_be_sse41 LABEL PROC DB 102,15,235,200 ; por %xmm0,%xmm1 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,178,87,1,0 ; movaps 0x157b2(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df> + DB 68,15,40,5,25,89,1,0 ; movaps 0x15919(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -21230,16 +21496,16 @@ _sk_load_u16_be_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 16ad4 <_sk_load_u16_be_sse41+0xf9> + DB 117,13 ; jne 16f4d <_sk_load_u16_be_sse41+0xf9> DB 243,15,126,192 ; movq %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,59,255,255,255 ; jmpq 16a0f <_sk_load_u16_be_sse41+0x34> + DB 233,59,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34> DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,38,255,255,255 ; jb 16a0f <_sk_load_u16_be_sse41+0x34> + DB 15,130,38,255,255,255 ; jb 16e88 <_sk_load_u16_be_sse41+0x34> DB 243,65,15,126,76,65,16 ; movq 0x10(%r9,%rax,2),%xmm1 - DB 233,26,255,255,255 ; jmpq 16a0f <_sk_load_u16_be_sse41+0x34> + DB 233,26,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34> PUBLIC _sk_load_rgb_u16_be_sse41 _sk_load_rgb_u16_be_sse41 LABEL PROC @@ -21254,7 +21520,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 72,141,4,64 ; lea (%rax,%rax,2),%rax DB 72,193,248,32 ; sar $0x20,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,170,0,0,0 ; jne 16bca <_sk_load_rgb_u16_be_sse41+0xd5> + DB 15,133,170,0,0,0 ; jne 17043 <_sk_load_rgb_u16_be_sse41+0xd5> DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2 DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3 DB 102,15,115,219,4 ; psrldq $0x4,%xmm3 @@ -21274,7 +21540,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 102,15,235,200 ; por %xmm0,%xmm1 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,129,86,1,0 ; movaps 0x15681(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df> + DB 68,15,40,5,232,87,1,0 ; movaps 0x157e8(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -21291,27 +21557,27 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,168,83,1,0 ; movaps 0x153a8(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,15,85,1,0 ; movaps 0x1550f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 255,224 ; jmpq *%rax DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2 DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 16bef <_sk_load_rgb_u16_be_sse41+0xfa> + DB 117,13 ; jne 17068 <_sk_load_rgb_u16_be_sse41+0xfa> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,85,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f> + DB 233,85,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f> DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0 DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 16c20 <_sk_load_rgb_u16_be_sse41+0x12b> + DB 114,24 ; jb 17099 <_sk_load_rgb_u16_be_sse41+0x12b> DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3 DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,36,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f> + DB 233,36,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f> DB 102,15,239,219 ; pxor %xmm3,%xmm3 - DB 233,27,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f> + DB 233,27,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f> PUBLIC _sk_store_u16_be_sse41 _sk_store_u16_be_sse41 LABEL PROC @@ -21323,7 +21589,7 @@ _sk_store_u16_be_sse41 LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax - DB 68,15,40,21,81,88,1,0 ; movaps 0x15851(%rip),%xmm10 # 2c4a0 <_sk_overlay_sse2_8bit+0x137f> + DB 68,15,40,21,184,89,1,0 ; movaps 0x159b8(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 @@ -21360,7 +21626,7 @@ _sk_store_u16_be_sse41 LABEL PROC DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10 DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 16d1d <_sk_store_u16_be_sse41+0xf4> + DB 117,21 ; jne 17196 <_sk_store_u16_be_sse41+0xf4> DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2) DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2) @@ -21368,13 +21634,13 @@ _sk_store_u16_be_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 16d19 <_sk_store_u16_be_sse41+0xf0> + DB 116,240 ; je 17192 <_sk_store_u16_be_sse41+0xf0> DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 16d19 <_sk_store_u16_be_sse41+0xf0> + DB 114,227 ; jb 17192 <_sk_store_u16_be_sse41+0xf0> DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2) - DB 235,213 ; jmp 16d19 <_sk_store_u16_be_sse41+0xf0> + DB 235,213 ; jmp 17192 <_sk_store_u16_be_sse41+0xf0> PUBLIC _sk_load_f32_sse41 _sk_load_f32_sse41 LABEL PROC @@ -21388,7 +21654,7 @@ _sk_load_f32_sse41 LABEL PROC DB 73,99,194 ; movslq %r10d,%rax DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 16daf <_sk_load_f32_sse41+0x6b> + DB 117,66 ; jne 17228 <_sk_load_f32_sse41+0x6b> DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0 DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3 DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9 @@ -21408,17 +21674,17 @@ _sk_load_f32_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 69,15,87,201 ; xorps %xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,8 ; jne 16dc1 <_sk_load_f32_sse41+0x7d> + DB 117,8 ; jne 1723a <_sk_load_f32_sse41+0x7d> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 235,190 ; jmp 16d7f <_sk_load_f32_sse41+0x3b> + DB 235,190 ; jmp 171f8 <_sk_load_f32_sse41+0x3b> DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,8 ; jb 16dd5 <_sk_load_f32_sse41+0x91> + DB 114,8 ; jb 1724e <_sk_load_f32_sse41+0x91> DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3 - DB 235,170 ; jmp 16d7f <_sk_load_f32_sse41+0x3b> + DB 235,170 ; jmp 171f8 <_sk_load_f32_sse41+0x3b> DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 235,165 ; jmp 16d7f <_sk_load_f32_sse41+0x3b> + DB 235,165 ; jmp 171f8 <_sk_load_f32_sse41+0x3b> PUBLIC _sk_load_f32_dst_sse41 _sk_load_f32_dst_sse41 LABEL PROC @@ -21432,7 +21698,7 @@ _sk_load_f32_dst_sse41 LABEL PROC DB 73,99,194 ; movslq %r10d,%rax DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 16e45 <_sk_load_f32_dst_sse41+0x6b> + DB 117,66 ; jne 172be <_sk_load_f32_dst_sse41+0x6b> DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4 DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7 DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9 @@ -21452,17 +21718,17 @@ _sk_load_f32_dst_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 69,15,87,201 ; xorps %xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,8 ; jne 16e57 <_sk_load_f32_dst_sse41+0x7d> + DB 117,8 ; jne 172d0 <_sk_load_f32_dst_sse41+0x7d> DB 15,87,255 ; xorps %xmm7,%xmm7 DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 235,190 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b> + DB 235,190 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b> DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,8 ; jb 16e6b <_sk_load_f32_dst_sse41+0x91> + DB 114,8 ; jb 172e4 <_sk_load_f32_dst_sse41+0x91> DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7 - DB 235,170 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b> + DB 235,170 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b> DB 15,87,255 ; xorps %xmm7,%xmm7 - DB 235,165 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b> + DB 235,165 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b> PUBLIC _sk_store_f32_sse41 _sk_store_f32_sse41 LABEL PROC @@ -21489,7 +21755,7 @@ _sk_store_f32_sse41 LABEL PROC DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9 DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4) DB 77,133,192 ; test %r8,%r8 - DB 117,29 ; jne 16eed <_sk_store_f32_sse41+0x7d> + DB 117,29 ; jne 17366 <_sk_store_f32_sse41+0x7d> DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10 DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4) DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4) @@ -21497,12 +21763,12 @@ _sk_store_f32_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,246 ; je 16ee9 <_sk_store_f32_sse41+0x79> + DB 116,246 ; je 17362 <_sk_store_f32_sse41+0x79> DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,234 ; jb 16ee9 <_sk_store_f32_sse41+0x79> + DB 114,234 ; jb 17362 <_sk_store_f32_sse41+0x79> DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4) - DB 235,225 ; jmp 16ee9 <_sk_store_f32_sse41+0x79> + DB 235,225 ; jmp 17362 <_sk_store_f32_sse41+0x79> PUBLIC _sk_clamp_x_sse41 _sk_clamp_x_sse41 LABEL PROC @@ -21582,7 +21848,7 @@ _sk_mirror_x_sse41 LABEL PROC DB 65,15,92,194 ; subps %xmm10,%xmm0 DB 243,69,15,88,192 ; addss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 - DB 243,68,15,89,13,119,69,1,0 ; mulss 0x14577(%rip),%xmm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 243,68,15,89,13,234,70,1,0 ; mulss 0x146ea(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 @@ -21611,7 +21877,7 @@ _sk_mirror_y_sse41 LABEL PROC DB 65,15,92,202 ; subps %xmm10,%xmm1 DB 243,69,15,88,192 ; addss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 - DB 243,68,15,89,13,5,69,1,0 ; mulss 0x14505(%rip),%xmm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 243,68,15,89,13,120,70,1,0 ; mulss 0x14678(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,89,201 ; mulps %xmm1,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 @@ -21634,7 +21900,7 @@ PUBLIC _sk_clamp_x_1_sse41 _sk_clamp_x_1_sse41 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,148,78,1,0 ; minps 0x14e94(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,93,5,251,79,1,0 ; minps 0x14ffb(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -21648,9 +21914,9 @@ _sk_repeat_x_1_sse41 LABEL PROC PUBLIC _sk_mirror_x_1_sse41 _sk_mirror_x_1_sse41 LABEL PROC - DB 68,15,40,5,213,78,1,0 ; movaps 0x14ed5(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf> + DB 68,15,40,5,60,80,1,0 ; movaps 0x1503c(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3> DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,13,89,78,1,0 ; movaps 0x14e59(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,13,192,79,1,0 ; movaps 0x14fc0(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 DB 69,15,88,201 ; addps %xmm9,%xmm9 @@ -21665,10 +21931,10 @@ _sk_mirror_x_1_sse41 LABEL PROC PUBLIC _sk_luminance_to_alpha_sse41 _sk_luminance_to_alpha_sse41 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 15,89,5,120,83,1,0 ; mulps 0x15378(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x138f> - DB 15,89,13,129,83,1,0 ; mulps 0x15381(%rip),%xmm1 # 2c4c0 <_sk_overlay_sse2_8bit+0x139f> + DB 15,89,5,223,84,1,0 ; mulps 0x154df(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383> + DB 15,89,13,232,84,1,0 ; mulps 0x154e8(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,29,135,83,1,0 ; mulps 0x15387(%rip),%xmm3 # 2c4d0 <_sk_overlay_sse2_8bit+0x13af> + DB 15,89,29,238,84,1,0 ; mulps 0x154ee(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3> DB 15,88,217 ; addps %xmm1,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -21965,9 +22231,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC DB 72,139,24 ; mov (%rax),%rbx DB 76,139,112,8 ; mov 0x8(%rax),%r14 DB 72,255,203 ; dec %rbx - DB 120,7 ; js 175eb <_sk_evenly_spaced_gradient_sse41+0x1a> + DB 120,7 ; js 17a64 <_sk_evenly_spaced_gradient_sse41+0x1a> DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1 - DB 235,21 ; jmp 17600 <_sk_evenly_spaced_gradient_sse41+0x2f> + DB 235,21 ; jmp 17a79 <_sk_evenly_spaced_gradient_sse41+0x2f> DB 73,137,217 ; mov %rbx,%r9 DB 73,209,233 ; shr %r9 DB 131,227,1 ; and $0x1,%ebx @@ -22055,15 +22321,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC PUBLIC _sk_gauss_a_to_rgba_sse41 _sk_gauss_a_to_rgba_sse41 LABEL PROC - DB 15,40,5,50,77,1,0 ; movaps 0x14d32(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x13bf> + DB 15,40,5,153,78,1,0 ; movaps 0x14e99(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,56,77,1,0 ; addps 0x14d38(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x13cf> + DB 15,88,5,159,78,1,0 ; addps 0x14e9f(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,62,77,1,0 ; addps 0x14d3e(%rip),%xmm0 # 2c500 <_sk_overlay_sse2_8bit+0x13df> + DB 15,88,5,165,78,1,0 ; addps 0x14ea5(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,68,77,1,0 ; addps 0x14d44(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x13ef> + DB 15,88,5,171,78,1,0 ; addps 0x14eab(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,74,77,1,0 ; addps 0x14d4a(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x13ff> + DB 15,88,5,177,78,1,0 ; addps 0x14eb1(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 @@ -22079,12 +22345,12 @@ _sk_gradient_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,249,2 ; cmp $0x2,%r9 - DB 114,50 ; jb 17829 <_sk_gradient_sse41+0x46> + DB 114,50 ; jb 17ca2 <_sk_gradient_sse41+0x46> DB 72,139,88,72 ; mov 0x48(%rax),%rbx DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 15,40,21,115,71,1,0 ; movaps 0x14773(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 15,40,21,218,72,1,0 ; movaps 0x148da(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 243,15,16,27 ; movss (%rbx),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 @@ -22092,7 +22358,7 @@ _sk_gradient_sse41 LABEL PROC DB 102,15,254,203 ; paddd %xmm3,%xmm1 DB 72,131,195,4 ; add $0x4,%rbx DB 73,255,201 ; dec %r9 - DB 117,228 ; jne 1780d <_sk_gradient_sse41+0x2a> + DB 117,228 ; jne 17c86 <_sk_gradient_sse41+0x2a> DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 69,137,202 ; mov %r9d,%r10d DB 73,193,233,32 ; shr $0x20,%r9 @@ -22218,26 +22484,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,40,236 ; movaps %xmm12,%xmm13 DB 69,15,89,237 ; mulps %xmm13,%xmm13 - DB 68,15,40,21,180,74,1,0 ; movaps 0x14ab4(%rip),%xmm10 # 2c530 <_sk_overlay_sse2_8bit+0x140f> + DB 68,15,40,21,27,76,1,0 ; movaps 0x14c1b(%rip),%xmm10 # 2cb10 <_sk_overlay_sse2_8bit+0x1403> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,184,74,1,0 ; addps 0x14ab8(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0x141f> + DB 68,15,88,21,31,76,1,0 ; addps 0x14c1f(%rip),%xmm10 # 2cb20 <_sk_overlay_sse2_8bit+0x1413> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,188,74,1,0 ; addps 0x14abc(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0x142f> + DB 68,15,88,21,35,76,1,0 ; addps 0x14c23(%rip),%xmm10 # 2cb30 <_sk_overlay_sse2_8bit+0x1423> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,192,74,1,0 ; addps 0x14ac0(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0x143f> + DB 68,15,88,21,39,76,1,0 ; addps 0x14c27(%rip),%xmm10 # 2cb40 <_sk_overlay_sse2_8bit+0x1433> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0 - DB 68,15,40,29,191,74,1,0 ; movaps 0x14abf(%rip),%xmm11 # 2c570 <_sk_overlay_sse2_8bit+0x144f> + DB 68,15,40,29,38,76,1,0 ; movaps 0x14c26(%rip),%xmm11 # 2cb50 <_sk_overlay_sse2_8bit+0x1443> DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10 DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9 - DB 68,15,40,29,152,68,1,0 ; movaps 0x14498(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,29,255,69,1,0 ; movaps 0x145ff(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10 DB 15,40,193 ; movaps %xmm1,%xmm0 DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0 - DB 68,15,40,13,138,68,1,0 ; movaps 0x1448a(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,241,69,1,0 ; movaps 0x145f1(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,202 ; subps %xmm10,%xmm9 DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10 DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8 @@ -22267,7 +22533,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC DB 243,69,15,89,203 ; mulss %xmm11,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,88,200 ; addps %xmm0,%xmm9 - DB 68,15,89,13,51,74,1,0 ; mulps 0x14a33(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f> + DB 68,15,89,13,154,75,1,0 ; mulps 0x14b9a(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 @@ -22275,7 +22541,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC DB 243,69,15,89,219 ; mulss %xmm11,%xmm11 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,92,227 ; subps %xmm11,%xmm12 - DB 68,15,89,21,30,74,1,0 ; mulps 0x14a1e(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f> + DB 68,15,89,21,133,75,1,0 ; mulps 0x14b85(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 @@ -22284,8 +22550,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,92,193 ; subps %xmm9,%xmm0 - DB 68,15,87,13,214,72,1,0 ; xorps 0x148d6(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f> - DB 68,15,89,5,190,67,1,0 ; mulps 0x143be(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,87,13,61,74,1,0 ; xorps 0x14a3d(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> + DB 68,15,89,5,37,69,1,0 ; mulps 0x14525(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 69,15,92,202 ; subps %xmm10,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 @@ -22304,7 +22570,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC DB 243,69,15,89,203 ; mulss %xmm11,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,88,200 ; addps %xmm0,%xmm9 - DB 68,15,89,13,149,73,1,0 ; mulps 0x14995(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f> + DB 68,15,89,13,252,74,1,0 ; mulps 0x14afc(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 @@ -22312,7 +22578,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC DB 243,69,15,89,219 ; mulss %xmm11,%xmm11 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,92,227 ; subps %xmm11,%xmm12 - DB 68,15,89,21,128,73,1,0 ; mulps 0x14980(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f> + DB 68,15,89,21,231,74,1,0 ; mulps 0x14ae7(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 @@ -22321,8 +22587,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,92,193 ; subps %xmm9,%xmm0 - DB 68,15,87,13,56,72,1,0 ; xorps 0x14838(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f> - DB 68,15,89,5,32,67,1,0 ; mulps 0x14320(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,87,13,159,73,1,0 ; xorps 0x1499f(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> + DB 68,15,89,5,135,68,1,0 ; mulps 0x14487(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 69,15,92,202 ; subps %xmm10,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 @@ -22338,7 +22604,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC DB 243,69,15,89,200 ; mulss %xmm8,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,88,200 ; addps %xmm0,%xmm9 - DB 68,15,89,13,8,73,1,0 ; mulps 0x14908(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f> + DB 68,15,89,13,111,74,1,0 ; mulps 0x14a6f(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 69,15,89,210 ; mulps %xmm10,%xmm10 @@ -22346,7 +22612,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC DB 243,69,15,89,192 ; mulss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 65,15,92,192 ; subps %xmm8,%xmm0 - DB 15,87,5,212,71,1,0 ; xorps 0x147d4(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x134f> + DB 15,87,5,59,73,1,0 ; xorps 0x1493b(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> DB 65,15,94,193 ; divps %xmm9,%xmm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22383,7 +22649,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC PUBLIC _sk_save_xy_sse41 _sk_save_xy_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,90,66,1,0 ; movaps 0x1425a(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,5,193,67,1,0 ; movaps 0x143c1(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,17,0 ; movups %xmm0,(%rax) DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,88,200 ; addps %xmm8,%xmm9 @@ -22423,8 +22689,8 @@ _sk_bilinear_nx_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,12,72,1,0 ; addps 0x1480c(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,212,65,1,0 ; movaps 0x141d4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,5,115,73,1,0 ; addps 0x14973(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,59,67,1,0 ; movaps 0x1433b(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -22435,7 +22701,7 @@ _sk_bilinear_px_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,163,65,1,0 ; addps 0x141a3(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,88,5,10,67,1,0 ; addps 0x1430a(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22445,8 +22711,8 @@ _sk_bilinear_ny_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,197,71,1,0 ; addps 0x147c5(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,141,65,1,0 ; movaps 0x1418d(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,13,44,73,1,0 ; addps 0x1492c(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,244,66,1,0 ; movaps 0x142f4(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -22457,7 +22723,7 @@ _sk_bilinear_py_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,91,65,1,0 ; addps 0x1415b(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,88,13,194,66,1,0 ; addps 0x142c2(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22467,13 +22733,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,142,71,1,0 ; addps 0x1478e(%rip),%xmm0 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f> - DB 68,15,40,13,70,65,1,0 ; movaps 0x14146(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,5,245,72,1,0 ; addps 0x148f5(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483> + DB 68,15,40,13,173,66,1,0 ; movaps 0x142ad(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,130,71,1,0 ; mulps 0x14782(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,13,26,67,1,0 ; addps 0x1431a(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,13,233,72,1,0 ; mulps 0x148e9(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,13,129,68,1,0 ; addps 0x14481(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -22484,16 +22750,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,57,71,1,0 ; addps 0x14739(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,1,65,1,0 ; movaps 0x14101(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,5,160,72,1,0 ; addps 0x148a0(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,104,66,1,0 ; movaps 0x14268(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,85,71,1,0 ; movaps 0x14755(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,5,188,72,1,0 ; movaps 0x148bc(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,89,71,1,0 ; addps 0x14759(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,5,192,72,1,0 ; addps 0x148c0(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,205,64,1,0 ; addps 0x140cd(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,88,5,52,66,1,0 ; addps 0x14234(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,81,71,1,0 ; addps 0x14751(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,5,184,72,1,0 ; addps 0x148b8(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22501,17 +22767,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC PUBLIC _sk_bicubic_p1x_sse41 _sk_bicubic_p1x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,171,64,1,0 ; movaps 0x140ab(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,5,18,66,1,0 ; movaps 0x14212(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,21,7,71,1,0 ; movaps 0x14707(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,21,110,72,1,0 ; movaps 0x1486e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,11,71,1,0 ; addps 0x1470b(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,21,114,72,1,0 ; addps 0x14872(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,7,71,1,0 ; addps 0x14707(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,21,110,72,1,0 ; addps 0x1486e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22521,11 +22787,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,218,70,1,0 ; addps 0x146da(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 15,88,5,65,72,1,0 ; addps 0x14841(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,170,70,1,0 ; mulps 0x146aa(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,5,66,66,1,0 ; addps 0x14242(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,5,17,72,1,0 ; mulps 0x14811(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,5,169,67,1,0 ; addps 0x143a9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -22536,13 +22802,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,112,70,1,0 ; addps 0x14670(%rip),%xmm1 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f> - DB 68,15,40,13,40,64,1,0 ; movaps 0x14028(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,13,215,71,1,0 ; addps 0x147d7(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483> + DB 68,15,40,13,143,65,1,0 ; movaps 0x1418f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,100,70,1,0 ; mulps 0x14664(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,13,252,65,1,0 ; addps 0x141fc(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,13,203,71,1,0 ; mulps 0x147cb(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,13,99,67,1,0 ; addps 0x14363(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -22553,16 +22819,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,26,70,1,0 ; addps 0x1461a(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,226,63,1,0 ; movaps 0x13fe2(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,13,129,71,1,0 ; addps 0x14781(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,73,65,1,0 ; movaps 0x14149(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,54,70,1,0 ; movaps 0x14636(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,5,157,71,1,0 ; movaps 0x1479d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,58,70,1,0 ; addps 0x1463a(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,5,161,71,1,0 ; addps 0x147a1(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,174,63,1,0 ; addps 0x13fae(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,88,5,21,65,1,0 ; addps 0x14115(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,50,70,1,0 ; addps 0x14632(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,5,153,71,1,0 ; addps 0x14799(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22570,17 +22836,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC PUBLIC _sk_bicubic_p1y_sse41 _sk_bicubic_p1y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,140,63,1,0 ; movaps 0x13f8c(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,5,243,64,1,0 ; movaps 0x140f3(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9 DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 68,15,40,21,231,69,1,0 ; movaps 0x145e7(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,21,78,71,1,0 ; movaps 0x1474e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,235,69,1,0 ; addps 0x145eb(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,21,82,71,1,0 ; addps 0x14752(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,231,69,1,0 ; addps 0x145e7(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,21,78,71,1,0 ; addps 0x1474e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22590,11 +22856,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,185,69,1,0 ; addps 0x145b9(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 15,88,13,32,71,1,0 ; addps 0x14720(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,137,69,1,0 ; mulps 0x14589(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,5,33,65,1,0 ; addps 0x14121(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,5,240,70,1,0 ; mulps 0x146f0(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,5,136,66,1,0 ; addps 0x14288(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -22727,10 +22993,10 @@ _sk_clut_3D_sse41 LABEL PROC DB 102,68,15,56,64,227 ; pmulld %xmm3,%xmm12 DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2 DB 102,15,254,209 ; paddd %xmm1,%xmm2 - DB 102,15,111,37,241,67,1,0 ; movdqa 0x143f1(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,37,88,69,1,0 ; movdqa 0x14558(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2 DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11 - DB 102,68,15,111,61,78,61,1,0 ; movdqa 0x13d4e(%rip),%xmm15 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,61,181,62,1,0 ; movdqa 0x13eb5(%rip),%xmm15 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,111,226 ; movdqa %xmm2,%xmm4 DB 102,65,15,254,231 ; paddd %xmm15,%xmm4 DB 102,73,15,58,22,225,1 ; pextrq $0x1,%xmm4,%r9 @@ -22750,7 +23016,7 @@ _sk_clut_3D_sse41 LABEL PROC DB 102,65,15,58,22,210,1 ; pextrd $0x1,%xmm2,%r10d DB 102,65,15,58,22,211,2 ; pextrd $0x2,%xmm2,%r11d DB 102,65,15,58,22,214,3 ; pextrd $0x3,%xmm2,%r14d - DB 102,68,15,111,13,0,61,1,0 ; movdqa 0x13d00(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,13,103,62,1,0 ; movdqa 0x13e67(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,65,15,254,209 ; paddd %xmm9,%xmm2 DB 102,73,15,58,22,215,1 ; pextrq $0x1,%xmm2,%r15 DB 102,72,15,126,211 ; movq %xmm2,%rbx @@ -22764,7 +23030,7 @@ _sk_clut_3D_sse41 LABEL PROC DB 73,193,239,32 ; shr $0x20,%r15 DB 243,66,15,16,20,184 ; movss (%rax,%r15,4),%xmm2 DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6 - DB 15,40,45,21,67,1,0 ; movaps 0x14315(%rip),%xmm5 # 2c600 <_sk_overlay_sse2_8bit+0x14df> + DB 15,40,45,124,68,1,0 ; movaps 0x1447c(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3> DB 68,15,88,197 ; addps %xmm5,%xmm8 DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp) DB 15,40,215 ; movaps %xmm7,%xmm2 @@ -22933,7 +23199,7 @@ _sk_clut_3D_sse41 LABEL PROC DB 102,68,15,254,232 ; paddd %xmm0,%xmm13 DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2 DB 102,65,15,254,213 ; paddd %xmm13,%xmm2 - DB 102,15,111,45,214,63,1,0 ; movdqa 0x13fd6(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,45,61,65,1,0 ; movdqa 0x1413d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,56,64,213 ; pmulld %xmm5,%xmm2 DB 102,15,111,202 ; movdqa %xmm2,%xmm1 DB 102,65,15,254,207 ; paddd %xmm15,%xmm1 @@ -23039,7 +23305,7 @@ _sk_clut_3D_sse41 LABEL PROC DB 102,69,15,58,22,225,1 ; pextrd $0x1,%xmm12,%r9d DB 102,69,15,58,22,226,2 ; pextrd $0x2,%xmm12,%r10d DB 102,69,15,58,22,227,3 ; pextrd $0x3,%xmm12,%r11d - DB 102,15,111,21,58,55,1,0 ; movdqa 0x1373a(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,111,21,161,56,1,0 ; movdqa 0x138a1(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,68,15,254,226 ; paddd %xmm2,%xmm12 DB 102,76,15,58,22,225,1 ; pextrq $0x1,%xmm12,%rcx DB 102,76,15,126,226 ; movq %xmm12,%rdx @@ -23216,8 +23482,8 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,111,197 ; movdqa %xmm13,%xmm0 DB 102,68,15,127,108,36,48 ; movdqa %xmm13,0x30(%rsp) DB 102,15,254,193 ; paddd %xmm1,%xmm0 - DB 102,15,56,64,5,130,58,1,0 ; pmulld 0x13a82(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> - DB 102,68,15,111,29,233,51,1,0 ; movdqa 0x133e9(%rip),%xmm11 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,56,64,5,233,59,1,0 ; pmulld 0x13be9(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> + DB 102,68,15,111,29,80,53,1,0 ; movdqa 0x13550(%rip),%xmm11 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,111,208 ; movdqa %xmm0,%xmm2 DB 102,65,15,254,211 ; paddd %xmm11,%xmm2 DB 102,73,15,58,22,209,1 ; pextrq $0x1,%xmm2,%r9 @@ -23237,7 +23503,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d DB 102,65,15,58,22,195,2 ; pextrd $0x2,%xmm0,%r11d DB 102,65,15,58,22,198,3 ; pextrd $0x3,%xmm0,%r14d - DB 102,68,15,111,5,155,51,1,0 ; movdqa 0x1339b(%rip),%xmm8 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,5,2,53,1,0 ; movdqa 0x13502(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,65,15,254,192 ; paddd %xmm8,%xmm0 DB 102,73,15,58,22,199,1 ; pextrq $0x1,%xmm0,%r15 DB 102,72,15,126,195 ; movq %xmm0,%rbx @@ -23251,7 +23517,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 73,193,239,32 ; shr $0x20,%r15 DB 243,66,15,16,4,184 ; movss (%rax,%r15,4),%xmm0 DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5 - DB 15,40,53,176,57,1,0 ; movaps 0x139b0(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0x14df> + DB 15,40,53,23,59,1,0 ; movaps 0x13b17(%rip),%xmm6 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3> DB 68,15,88,214 ; addps %xmm6,%xmm10 DB 68,15,41,148,36,176,0,0,0 ; movaps %xmm10,0xb0(%rsp) DB 15,88,254 ; addps %xmm6,%xmm7 @@ -23264,7 +23530,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,15,254,206 ; paddd %xmm6,%xmm1 DB 102,68,15,111,214 ; movdqa %xmm6,%xmm10 DB 102,68,15,127,84,36,32 ; movdqa %xmm10,0x20(%rsp) - DB 102,15,56,64,13,123,57,1,0 ; pmulld 0x1397b(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,56,64,13,226,58,1,0 ; pmulld 0x13ae2(%rip),%xmm1 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,65,15,254,227 ; paddd %xmm11,%xmm4 DB 102,73,15,58,22,231,1 ; pextrq $0x1,%xmm4,%r15 @@ -23322,11 +23588,11 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,15,254,216 ; paddd %xmm0,%xmm3 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,65,15,254,205 ; paddd %xmm13,%xmm1 - DB 102,15,111,5,79,56,1,0 ; movdqa 0x1384f(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,5,182,57,1,0 ; movdqa 0x139b6(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,56,64,200 ; pmulld %xmm0,%xmm1 DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 - DB 102,68,15,111,5,168,49,1,0 ; movdqa 0x131a8(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,5,15,51,1,0 ; movdqa 0x1330f(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,65,15,254,192 ; paddd %xmm8,%xmm0 DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx DB 102,72,15,126,194 ; movq %xmm0,%rdx @@ -23428,7 +23694,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,15,111,200 ; movdqa %xmm0,%xmm1 DB 102,68,15,111,108,36,48 ; movdqa 0x30(%rsp),%xmm13 DB 102,65,15,254,205 ; paddd %xmm13,%xmm1 - DB 102,15,111,45,28,54,1,0 ; movdqa 0x1361c(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,45,131,55,1,0 ; movdqa 0x13783(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,56,64,205 ; pmulld %xmm5,%xmm1 DB 102,15,126,201 ; movd %xmm1,%ecx DB 102,15,58,22,202,1 ; pextrd $0x1,%xmm1,%edx @@ -23440,7 +23706,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2 DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6 DB 102,15,111,209 ; movdqa %xmm1,%xmm2 - DB 102,15,111,29,71,47,1,0 ; movdqa 0x12f47(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,29,174,48,1,0 ; movdqa 0x130ae(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,211 ; paddd %xmm3,%xmm2 DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx DB 102,72,15,126,210 ; movq %xmm2,%rdx @@ -23488,7 +23754,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d DB 102,65,15,58,22,198,2 ; pextrd $0x2,%xmm0,%r14d DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d - DB 102,15,254,5,117,46,1,0 ; paddd 0x12e75(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,5,220,47,1,0 ; paddd 0x12fdc(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx DB 102,72,15,126,194 ; movq %xmm0,%rdx DB 137,211 ; mov %edx,%ebx @@ -23517,10 +23783,10 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm4 DB 102,15,111,196 ; movdqa %xmm4,%xmm0 DB 102,65,15,254,197 ; paddd %xmm13,%xmm0 - DB 102,68,15,111,45,87,52,1,0 ; movdqa 0x13457(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,68,15,111,45,190,53,1,0 ; movdqa 0x135be(%rip),%xmm13 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,65,15,56,64,197 ; pmulld %xmm13,%xmm0 DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,15,111,53,181,45,1,0 ; movdqa 0x12db5(%rip),%xmm6 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,53,28,47,1,0 ; movdqa 0x12f1c(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,206 ; paddd %xmm6,%xmm1 DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx DB 102,72,15,126,202 ; movq %xmm1,%rdx @@ -23538,7 +23804,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d - DB 102,15,111,61,117,45,1,0 ; movdqa 0x12d75(%rip),%xmm7 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,111,61,220,46,1,0 ; movdqa 0x12edc(%rip),%xmm7 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,254,199 ; paddd %xmm7,%xmm0 DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx DB 102,72,15,126,194 ; movq %xmm0,%rdx @@ -23555,7 +23821,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,254,227 ; paddd %xmm11,%xmm4 DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4 DB 102,15,111,244 ; movdqa %xmm4,%xmm6 - DB 102,68,15,111,45,255,44,1,0 ; movdqa 0x12cff(%rip),%xmm13 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,45,102,46,1,0 ; movdqa 0x12e66(%rip),%xmm13 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,65,15,254,245 ; paddd %xmm13,%xmm6 DB 102,72,15,58,22,241,1 ; pextrq $0x1,%xmm6,%rcx DB 102,72,15,126,242 ; movq %xmm6,%rdx @@ -23634,7 +23900,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,68,15,111,76,36,48 ; movdqa 0x30(%rsp),%xmm9 DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,254,194 ; paddd %xmm2,%xmm0 - DB 102,15,111,29,13,50,1,0 ; movdqa 0x1320d(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,29,116,51,1,0 ; movdqa 0x13374(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,56,64,195 ; pmulld %xmm3,%xmm0 DB 102,15,111,200 ; movdqa %xmm0,%xmm1 DB 102,69,15,111,213 ; movdqa %xmm13,%xmm10 @@ -23655,7 +23921,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d - DB 102,15,111,45,46,43,1,0 ; movdqa 0x12b2e(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,111,45,149,44,1,0 ; movdqa 0x12c95(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,254,197 ; paddd %xmm5,%xmm0 DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx DB 102,72,15,126,194 ; movq %xmm0,%rdx @@ -23743,7 +24009,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,58,22,225,1 ; pextrd $0x1,%xmm4,%r9d DB 102,65,15,58,22,226,2 ; pextrd $0x2,%xmm4,%r10d DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d - DB 102,68,15,111,13,106,41,1,0 ; movdqa 0x1296a(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,13,209,42,1,0 ; movdqa 0x12ad1(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,65,15,254,225 ; paddd %xmm9,%xmm4 DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx DB 102,72,15,126,226 ; movq %xmm4,%rdx @@ -23825,7 +24091,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,15,254,76,36,48 ; paddd 0x30(%rsp),%xmm1 DB 102,65,15,56,64,205 ; pmulld %xmm13,%xmm1 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 - DB 102,68,15,111,37,164,39,1,0 ; movdqa 0x127a4(%rip),%xmm12 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,37,11,41,1,0 ; movdqa 0x1290b(%rip),%xmm12 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,65,15,254,196 ; paddd %xmm12,%xmm0 DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx DB 102,72,15,126,194 ; movq %xmm0,%rdx @@ -23843,7 +24109,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d - DB 102,15,111,29,99,39,1,0 ; movdqa 0x12763(%rip),%xmm3 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,111,29,202,40,1,0 ; movdqa 0x128ca(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,254,203 ; paddd %xmm3,%xmm1 DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx DB 102,72,15,126,202 ; movq %xmm1,%rdx @@ -23912,9 +24178,9 @@ _sk_clut_4D_sse41 LABEL PROC DB 102,68,15,254,116,36,16 ; paddd 0x10(%rsp),%xmm14 DB 102,15,111,68,36,48 ; movdqa 0x30(%rsp),%xmm0 DB 102,65,15,254,198 ; paddd %xmm14,%xmm0 - DB 102,15,56,64,5,100,44,1,0 ; pmulld 0x12c64(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,56,64,5,203,45,1,0 ; pmulld 0x12dcb(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,15,254,5,200,37,1,0 ; paddd 0x125c8(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,254,5,47,39,1,0 ; paddd 0x1272f(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx DB 102,72,15,126,194 ; movq %xmm0,%rdx DB 137,213 ; mov %edx,%ebp @@ -23947,8 +24213,8 @@ _sk_clut_4D_sse41 LABEL PROC DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0 DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5 DB 102,68,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm14 - DB 102,68,15,56,64,53,173,43,1,0 ; pmulld 0x12bad(%rip),%xmm14 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> - DB 102,15,111,5,21,37,1,0 ; movdqa 0x12515(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,56,64,53,20,45,1,0 ; pmulld 0x12d14(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> + DB 102,15,111,5,124,38,1,0 ; movdqa 0x1267c(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,65,15,254,198 ; paddd %xmm14,%xmm0 DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx DB 102,72,15,126,194 ; movq %xmm0,%rdx @@ -24029,7 +24295,7 @@ _sk_clut_4D_sse41 LABEL PROC DB 15,89,212 ; mulps %xmm4,%xmm2 DB 15,88,215 ; addps %xmm7,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,144,35,1,0 ; movaps 0x12390(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,247,36,1,0 ; movaps 0x124f7(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 76,137,194 ; mov %r8,%rdx DB 72,139,76,36,112 ; mov 0x70(%rsp),%rcx DB 76,139,68,36,120 ; mov 0x78(%rsp),%r8 @@ -24077,13 +24343,13 @@ _sk_start_pipeline_sse2 LABEL PROC DB 73,137,246 ; mov %rsi,%r14 DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp) DB 76,57,203 ; cmp %r9,%rbx - DB 115,110 ; jae 19d0b <_sk_start_pipeline_sse2+0xeb> + DB 115,110 ; jae 1a184 <_sk_start_pipeline_sse2+0xeb> DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax DB 72,141,64,4 ; lea 0x4(%rax),%rax DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp) DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp) DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx - DB 119,43 ; ja 19cea <_sk_start_pipeline_sse2+0xca> + DB 119,43 ; ja 1a163 <_sk_start_pipeline_sse2+0xca> DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12 DB 69,49,192 ; xor %r8d,%r8d DB 72,139,125,56 ; mov 0x38(%rbp),%rdi @@ -24095,17 +24361,17 @@ _sk_start_pipeline_sse2 LABEL PROC DB 73,131,196,8 ; add $0x8,%r12 DB 77,57,252 ; cmp %r15,%r12 DB 73,137,212 ; mov %rdx,%r12 - DB 118,220 ; jbe 19cc6 <_sk_start_pipeline_sse2+0xa6> + DB 118,220 ; jbe 1a13f <_sk_start_pipeline_sse2+0xa6> DB 77,137,248 ; mov %r15,%r8 DB 73,41,208 ; sub %rdx,%r8 - DB 116,13 ; je 19cff <_sk_start_pipeline_sse2+0xdf> + DB 116,13 ; je 1a178 <_sk_start_pipeline_sse2+0xdf> DB 72,139,125,56 ; mov 0x38(%rbp),%rdi DB 76,137,246 ; mov %r14,%rsi DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 72,255,195 ; inc %rbx DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx - DB 117,164 ; jne 19caf <_sk_start_pipeline_sse2+0x8f> + DB 117,164 ; jne 1a128 <_sk_start_pipeline_sse2+0x8f> DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6 DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7 DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8 @@ -24136,7 +24402,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 102,15,110,194 ; movd %edx,%xmm0 DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0 DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 - DB 15,40,21,235,33,1,0 ; movaps 0x121eb(%rip),%xmm2 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,40,21,82,35,1,0 ; movaps 0x12352(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,16,7 ; movups (%rdi),%xmm0 DB 15,88,193 ; addps %xmm1,%xmm0 @@ -24145,7 +24411,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,21,218,33,1,0 ; movaps 0x121da(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,65,35,1,0 ; movaps 0x12341(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,87,237 ; xorps %xmm5,%xmm5 @@ -24163,14 +24429,14 @@ _sk_dither_sse2 LABEL PROC DB 102,68,15,110,193 ; movd %ecx,%xmm8 DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8 DB 102,69,15,239,193 ; pxor %xmm9,%xmm8 - DB 102,68,15,111,21,168,33,1,0 ; movdqa 0x121a8(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,21,15,35,1,0 ; movdqa 0x1230f(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11 DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10 - DB 102,68,15,111,37,148,33,1,0 ; movdqa 0x12194(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xe6f> - DB 102,68,15,111,45,155,33,1,0 ; movdqa 0x1219b(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,37,251,34,1,0 ; movdqa 0x122fb(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63> + DB 102,68,15,111,45,2,35,1,0 ; movdqa 0x12302(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14 DB 102,69,15,219,245 ; pand %xmm13,%xmm14 DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14 @@ -24186,8 +24452,8 @@ _sk_dither_sse2 LABEL PROC DB 102,69,15,235,245 ; por %xmm13,%xmm14 DB 102,69,15,235,240 ; por %xmm8,%xmm14 DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8 - DB 68,15,89,5,86,33,1,0 ; mulps 0x12156(%rip),%xmm8 # 2bfb0 <_sk_overlay_sse2_8bit+0xe8f> - DB 68,15,88,5,94,33,1,0 ; addps 0x1215e(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0xe9f> + DB 68,15,89,5,189,34,1,0 ; mulps 0x122bd(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83> + DB 68,15,88,5,197,34,1,0 ; addps 0x122c5(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93> DB 243,68,15,16,16 ; movss (%rax),%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -24225,7 +24491,7 @@ _sk_uniform_color_sse2 LABEL PROC PUBLIC _sk_black_color_sse2 _sk_black_color_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,148,32,1,0 ; movaps 0x12094(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,251,33,1,0 ; movaps 0x121fb(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,87,201 ; xorps %xmm1,%xmm1 DB 15,87,210 ; xorps %xmm2,%xmm2 @@ -24234,7 +24500,7 @@ _sk_black_color_sse2 LABEL PROC PUBLIC _sk_white_color_sse2 _sk_white_color_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,5,128,32,1,0 ; movaps 0x12080(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,5,231,33,1,0 ; movaps 0x121e7(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,40,216 ; movaps %xmm0,%xmm3 @@ -24272,7 +24538,7 @@ _sk_clear_sse2 LABEL PROC PUBLIC _sk_srcatop_sse2 _sk_srcatop_sse2 LABEL PROC DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 68,15,40,5,48,32,1,0 ; movaps 0x12030(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,151,33,1,0 ; movaps 0x12197(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -24295,7 +24561,7 @@ PUBLIC _sk_dstatop_sse2 _sk_dstatop_sse2 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 DB 68,15,89,196 ; mulps %xmm4,%xmm8 - DB 68,15,40,13,227,31,1,0 ; movaps 0x11fe3(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,74,33,1,0 ; movaps 0x1214a(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 @@ -24336,7 +24602,7 @@ _sk_dstin_sse2 LABEL PROC PUBLIC _sk_srcout_sse2 _sk_srcout_sse2 LABEL PROC - DB 68,15,40,5,119,31,1,0 ; movaps 0x11f77(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,222,32,1,0 ; movaps 0x120de(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 @@ -24347,7 +24613,7 @@ _sk_srcout_sse2 LABEL PROC PUBLIC _sk_dstout_sse2 _sk_dstout_sse2 LABEL PROC - DB 68,15,40,5,87,31,1,0 ; movaps 0x11f57(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,190,32,1,0 ; movaps 0x120be(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 @@ -24362,7 +24628,7 @@ _sk_dstout_sse2 LABEL PROC PUBLIC _sk_srcover_sse2 _sk_srcover_sse2 LABEL PROC - DB 68,15,40,5,42,31,1,0 ; movaps 0x11f2a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,145,32,1,0 ; movaps 0x12091(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -24380,7 +24646,7 @@ _sk_srcover_sse2 LABEL PROC PUBLIC _sk_dstover_sse2 _sk_dstover_sse2 LABEL PROC - DB 68,15,40,5,238,30,1,0 ; movaps 0x11eee(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,85,32,1,0 ; movaps 0x12055(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -24404,7 +24670,7 @@ _sk_modulate_sse2 LABEL PROC PUBLIC _sk_multiply_sse2 _sk_multiply_sse2 LABEL PROC - DB 68,15,40,5,178,30,1,0 ; movaps 0x11eb2(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,25,32,1,0 ; movaps 0x12019(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,209 ; movaps %xmm9,%xmm10 @@ -24440,9 +24706,14 @@ _sk_multiply_sse2 LABEL PROC PUBLIC _sk_plus__sse2 _sk_plus__sse2 LABEL PROC DB 15,88,196 ; addps %xmm4,%xmm0 + DB 68,15,40,5,154,31,1,0 ; movaps 0x11f9a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> + DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 15,88,205 ; addps %xmm5,%xmm1 + DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 15,88,214 ; addps %xmm6,%xmm2 + DB 65,15,93,208 ; minps %xmm8,%xmm2 DB 15,88,223 ; addps %xmm7,%xmm3 + DB 65,15,93,216 ; minps %xmm8,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -24473,7 +24744,7 @@ _sk_screen_sse2 LABEL PROC PUBLIC _sk_xor__sse2 _sk_xor__sse2 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 - DB 15,40,29,215,29,1,0 ; movaps 0x11dd7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,38,31,1,0 ; movaps 0x11f26(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 @@ -24519,7 +24790,7 @@ _sk_darken_sse2 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,95,209 ; maxps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,50,29,1,0 ; movaps 0x11d32(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,129,30,1,0 ; movaps 0x11e81(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -24551,7 +24822,7 @@ _sk_lighten_sse2 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,199,28,1,0 ; movaps 0x11cc7(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,22,30,1,0 ; movaps 0x11e16(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -24586,7 +24857,7 @@ _sk_difference_sse2 LABEL PROC DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,81,28,1,0 ; movaps 0x11c51(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,160,29,1,0 ; movaps 0x11da0(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -24612,7 +24883,7 @@ _sk_exclusion_sse2 LABEL PROC DB 15,89,214 ; mulps %xmm6,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,1,28,1,0 ; movaps 0x11c01(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,21,80,29,1,0 ; movaps 0x11d50(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -24623,7 +24894,7 @@ _sk_exclusion_sse2 LABEL PROC PUBLIC _sk_colorburn_sse2 _sk_colorburn_sse2 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,13,228,27,1,0 ; movaps 0x11be4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,51,29,1,0 ; movaps 0x11d33(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 68,15,92,215 ; subps %xmm7,%xmm10 DB 69,15,40,218 ; movaps %xmm10,%xmm11 @@ -24716,7 +24987,7 @@ _sk_colorburn_sse2 LABEL PROC PUBLIC _sk_colordodge_sse2 _sk_colordodge_sse2 LABEL PROC DB 68,15,40,200 ; movaps %xmm0,%xmm9 - DB 68,15,40,21,140,26,1,0 ; movaps 0x11a8c(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,219,27,1,0 ; movaps 0x11bdb(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 65,15,40,195 ; movaps %xmm11,%xmm0 @@ -24807,7 +25078,7 @@ _sk_hardlight_sse2 LABEL PROC DB 15,41,52,36 ; movaps %xmm6,(%rsp) DB 15,40,245 ; movaps %xmm5,%xmm6 DB 15,40,236 ; movaps %xmm4,%xmm5 - DB 68,15,40,29,50,25,1,0 ; movaps 0x11932(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,29,129,26,1,0 ; movaps 0x11a81(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,211 ; movaps %xmm11,%xmm10 DB 68,15,92,215 ; subps %xmm7,%xmm10 DB 69,15,40,194 ; movaps %xmm10,%xmm8 @@ -24894,7 +25165,7 @@ PUBLIC _sk_overlay_sse2 _sk_overlay_sse2 LABEL PROC DB 68,15,40,193 ; movaps %xmm1,%xmm8 DB 68,15,40,232 ; movaps %xmm0,%xmm13 - DB 68,15,40,13,237,23,1,0 ; movaps 0x117ed(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,60,25,1,0 ; movaps 0x1193c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 68,15,92,215 ; subps %xmm7,%xmm10 DB 69,15,40,218 ; movaps %xmm10,%xmm11 @@ -24984,7 +25255,7 @@ _sk_softlight_sse2 LABEL PROC DB 68,15,40,213 ; movaps %xmm5,%xmm10 DB 68,15,94,215 ; divps %xmm7,%xmm10 DB 69,15,84,212 ; andps %xmm12,%xmm10 - DB 68,15,40,13,151,22,1,0 ; movaps 0x11697(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,230,23,1,0 ; movaps 0x117e6(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,249 ; movaps %xmm9,%xmm15 DB 69,15,92,250 ; subps %xmm10,%xmm15 DB 69,15,40,218 ; movaps %xmm10,%xmm11 @@ -24997,10 +25268,10 @@ _sk_softlight_sse2 LABEL PROC DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 DB 65,15,88,194 ; addps %xmm10,%xmm0 - DB 68,15,40,53,193,22,1,0 ; movaps 0x116c1(%rip),%xmm14 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf> + DB 68,15,40,53,16,24,1,0 ; movaps 0x11810(%rip),%xmm14 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3> DB 69,15,88,222 ; addps %xmm14,%xmm11 DB 68,15,89,216 ; mulps %xmm0,%xmm11 - DB 68,15,40,21,193,22,1,0 ; movaps 0x116c1(%rip),%xmm10 # 2bfe0 <_sk_overlay_sse2_8bit+0xebf> + DB 68,15,40,21,16,24,1,0 ; movaps 0x11810(%rip),%xmm10 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3> DB 69,15,89,234 ; mulps %xmm10,%xmm13 DB 69,15,88,235 ; addps %xmm11,%xmm13 DB 15,88,228 ; addps %xmm4,%xmm4 @@ -25145,7 +25416,7 @@ _sk_hue_sse2 LABEL PROC DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 68,15,89,211 ; mulps %xmm3,%xmm10 - DB 68,15,40,5,77,20,1,0 ; movaps 0x1144d(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,156,21,1,0 ; movaps 0x1159c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,216 ; movaps %xmm8,%xmm11 DB 15,40,207 ; movaps %xmm7,%xmm1 DB 68,15,92,217 ; subps %xmm1,%xmm11 @@ -25193,12 +25464,12 @@ _sk_hue_sse2 LABEL PROC DB 69,15,84,206 ; andps %xmm14,%xmm9 DB 69,15,84,214 ; andps %xmm14,%xmm10 DB 65,15,84,214 ; andps %xmm14,%xmm2 - DB 68,15,40,61,10,20,1,0 ; movaps 0x1140a(%rip),%xmm15 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,61,89,21,1,0 ; movaps 0x11559(%rip),%xmm15 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 65,15,89,231 ; mulps %xmm15,%xmm4 - DB 15,40,5,15,20,1,0 ; movaps 0x1140f(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 15,40,5,94,21,1,0 ; movaps 0x1155e(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 15,89,240 ; mulps %xmm0,%xmm6 DB 15,88,244 ; addps %xmm4,%xmm6 - DB 68,15,40,53,17,20,1,0 ; movaps 0x11411(%rip),%xmm14 # 2c010 <_sk_overlay_sse2_8bit+0xeef> + DB 68,15,40,53,96,21,1,0 ; movaps 0x11560(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> DB 68,15,40,239 ; movaps %xmm7,%xmm13 DB 69,15,89,238 ; mulps %xmm14,%xmm13 DB 68,15,88,238 ; addps %xmm6,%xmm13 @@ -25376,14 +25647,14 @@ _sk_saturation_sse2 LABEL PROC DB 68,15,84,211 ; andps %xmm3,%xmm10 DB 68,15,84,203 ; andps %xmm3,%xmm9 DB 15,84,195 ; andps %xmm3,%xmm0 - DB 68,15,40,5,94,17,1,0 ; movaps 0x1115e(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,5,173,18,1,0 ; movaps 0x112ad(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 15,40,214 ; movaps %xmm6,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 - DB 15,40,13,96,17,1,0 ; movaps 0x11160(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 15,40,13,175,18,1,0 ; movaps 0x112af(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 15,40,221 ; movaps %xmm5,%xmm3 DB 15,89,217 ; mulps %xmm1,%xmm3 DB 15,88,218 ; addps %xmm2,%xmm3 - DB 68,15,40,37,95,17,1,0 ; movaps 0x1115f(%rip),%xmm12 # 2c010 <_sk_overlay_sse2_8bit+0xeef> + DB 68,15,40,37,174,18,1,0 ; movaps 0x112ae(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> DB 69,15,89,236 ; mulps %xmm12,%xmm13 DB 68,15,88,235 ; addps %xmm3,%xmm13 DB 65,15,40,210 ; movaps %xmm10,%xmm2 @@ -25428,7 +25699,7 @@ _sk_saturation_sse2 LABEL PROC DB 15,40,223 ; movaps %xmm7,%xmm3 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,89,221 ; mulps %xmm5,%xmm3 - DB 68,15,40,5,20,16,1,0 ; movaps 0x11014(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,99,17,1,0 ; movaps 0x11163(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,40,224 ; movaps %xmm8,%xmm4 DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 15,88,253 ; addps %xmm5,%xmm7 @@ -25529,14 +25800,14 @@ _sk_color_sse2 LABEL PROC DB 68,15,40,213 ; movaps %xmm5,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 DB 65,15,40,208 ; movaps %xmm8,%xmm2 - DB 68,15,40,45,28,15,1,0 ; movaps 0x10f1c(%rip),%xmm13 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,45,107,16,1,0 ; movaps 0x1106b(%rip),%xmm13 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 68,15,40,198 ; movaps %xmm6,%xmm8 DB 69,15,89,197 ; mulps %xmm13,%xmm8 - DB 68,15,40,53,28,15,1,0 ; movaps 0x10f1c(%rip),%xmm14 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 68,15,40,53,107,16,1,0 ; movaps 0x1106b(%rip),%xmm14 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,89,198 ; mulps %xmm14,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,29,24,15,1,0 ; movaps 0x10f18(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef> + DB 68,15,40,29,103,16,1,0 ; movaps 0x11067(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> DB 69,15,89,227 ; mulps %xmm11,%xmm12 DB 68,15,88,224 ; addps %xmm0,%xmm12 DB 65,15,40,193 ; movaps %xmm9,%xmm0 @@ -25544,7 +25815,7 @@ _sk_color_sse2 LABEL PROC DB 69,15,40,250 ; movaps %xmm10,%xmm15 DB 69,15,89,254 ; mulps %xmm14,%xmm15 DB 68,15,88,248 ; addps %xmm0,%xmm15 - DB 68,15,40,5,84,14,1,0 ; movaps 0x10e54(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,163,15,1,0 ; movaps 0x10fa3(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,40,224 ; movaps %xmm8,%xmm4 DB 15,92,226 ; subps %xmm2,%xmm4 DB 15,89,252 ; mulps %xmm4,%xmm7 @@ -25680,15 +25951,15 @@ _sk_luminosity_sse2 LABEL PROC DB 68,15,40,205 ; movaps %xmm5,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 DB 15,89,222 ; mulps %xmm6,%xmm3 - DB 68,15,40,37,214,12,1,0 ; movaps 0x10cd6(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,37,37,14,1,0 ; movaps 0x10e25(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 68,15,40,199 ; movaps %xmm7,%xmm8 DB 69,15,89,196 ; mulps %xmm12,%xmm8 - DB 68,15,40,45,214,12,1,0 ; movaps 0x10cd6(%rip),%xmm13 # 2c000 <_sk_overlay_sse2_8bit+0xedf> + DB 68,15,40,45,37,14,1,0 ; movaps 0x10e25(%rip),%xmm13 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3> DB 68,15,40,241 ; movaps %xmm1,%xmm14 DB 69,15,89,245 ; mulps %xmm13,%xmm14 DB 69,15,88,240 ; addps %xmm8,%xmm14 - DB 68,15,40,29,210,12,1,0 ; movaps 0x10cd2(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef> - DB 68,15,40,5,42,12,1,0 ; movaps 0x10c2a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,29,33,14,1,0 ; movaps 0x10e21(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3> + DB 68,15,40,5,121,13,1,0 ; movaps 0x10d79(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,248 ; movaps %xmm8,%xmm15 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 68,15,92,248 ; subps %xmm0,%xmm15 @@ -25828,10 +26099,10 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,228,0,0,0 ; jne 1b633 <_sk_srcover_rgba_8888_sse2+0x104> + DB 15,133,228,0,0,0 ; jne 1bac4 <_sk_srcover_rgba_8888_sse2+0x104> DB 243,69,15,111,4,129 ; movdqu (%r9,%rax,4),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 102,15,111,53,192,10,1,0 ; movdqa 0x10ac0(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,53,15,12,1,0 ; movdqa 0x10c0f(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4 DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 @@ -25845,9 +26116,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6 DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8 DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7 - DB 68,15,40,5,208,9,1,0 ; movaps 0x109d0(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,31,11,1,0 ; movaps 0x10b1f(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,92,195 ; subps %xmm3,%xmm8 - DB 68,15,40,37,164,10,1,0 ; movaps 0x10aa4(%rip),%xmm12 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,37,243,11,1,0 ; movaps 0x10bf3(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 65,15,89,196 ; mulps %xmm12,%xmm0 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -25873,7 +26144,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 102,15,114,240,24 ; pslld $0x18,%xmm0 DB 102,15,235,194 ; por %xmm2,%xmm0 DB 102,15,235,193 ; por %xmm1,%xmm0 - DB 117,84 ; jne 1b66d <_sk_srcover_rgba_8888_sse2+0x13e> + DB 117,84 ; jne 1bafe <_sk_srcover_rgba_8888_sse2+0x13e> DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,193 ; movaps %xmm9,%xmm0 @@ -25884,32 +26155,32 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,90 ; je 1b69a <_sk_srcover_rgba_8888_sse2+0x16b> + DB 116,90 ; je 1bb2b <_sk_srcover_rgba_8888_sse2+0x16b> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 1b662 <_sk_srcover_rgba_8888_sse2+0x133> + DB 116,23 ; je 1baf3 <_sk_srcover_rgba_8888_sse2+0x133> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,0,255,255,255 ; jne 1b555 <_sk_srcover_rgba_8888_sse2+0x26> + DB 15,133,0,255,255,255 ; jne 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26> DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4 DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8 DB 102,69,15,18,4,129 ; movlpd (%r9,%rax,4),%xmm8 - DB 233,232,254,255,255 ; jmpq 1b555 <_sk_srcover_rgba_8888_sse2+0x26> + DB 233,232,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26> DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,43 ; je 1b6a5 <_sk_srcover_rgba_8888_sse2+0x176> + DB 116,43 ; je 1bb36 <_sk_srcover_rgba_8888_sse2+0x176> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,18 ; je 1b692 <_sk_srcover_rgba_8888_sse2+0x163> + DB 116,18 ; je 1bb23 <_sk_srcover_rgba_8888_sse2+0x163> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,153 ; jne 1b61f <_sk_srcover_rgba_8888_sse2+0xf0> + DB 117,153 ; jne 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,65,15,126,76,129,8 ; movd %xmm1,0x8(%r9,%rax,4) DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4) - DB 235,133 ; jmp 1b61f <_sk_srcover_rgba_8888_sse2+0xf0> + DB 235,133 ; jmp 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0> DB 102,69,15,110,4,129 ; movd (%r9,%rax,4),%xmm8 - DB 233,176,254,255,255 ; jmpq 1b555 <_sk_srcover_rgba_8888_sse2+0x26> + DB 233,176,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26> DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4) - DB 233,111,255,255,255 ; jmpq 1b61f <_sk_srcover_rgba_8888_sse2+0xf0> + DB 233,111,255,255,255 ; jmpq 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0> PUBLIC _sk_clamp_0_sse2 _sk_clamp_0_sse2 LABEL PROC @@ -25923,7 +26194,7 @@ _sk_clamp_0_sse2 LABEL PROC PUBLIC _sk_clamp_1_sse2 _sk_clamp_1_sse2 LABEL PROC - DB 68,15,40,5,160,8,1,0 ; movaps 0x108a0(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,239,9,1,0 ; movaps 0x109ef(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 65,15,93,208 ; minps %xmm8,%xmm2 @@ -25933,7 +26204,7 @@ _sk_clamp_1_sse2 LABEL PROC PUBLIC _sk_clamp_a_sse2 _sk_clamp_a_sse2 LABEL PROC - DB 15,93,29,133,8,1,0 ; minps 0x10885(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,93,29,212,9,1,0 ; minps 0x109d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,93,195 ; minps %xmm3,%xmm0 DB 15,93,203 ; minps %xmm3,%xmm1 DB 15,93,211 ; minps %xmm3,%xmm2 @@ -25942,7 +26213,7 @@ _sk_clamp_a_sse2 LABEL PROC PUBLIC _sk_clamp_a_dst_sse2 _sk_clamp_a_dst_sse2 LABEL PROC - DB 15,93,61,113,8,1,0 ; minps 0x10871(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,93,61,192,9,1,0 ; minps 0x109c0(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,93,231 ; minps %xmm7,%xmm4 DB 15,93,239 ; minps %xmm7,%xmm5 DB 15,93,247 ; minps %xmm7,%xmm6 @@ -25971,7 +26242,7 @@ _sk_swap_rb_sse2 LABEL PROC PUBLIC _sk_invert_sse2 _sk_invert_sse2 LABEL PROC - DB 68,15,40,5,45,8,1,0 ; movaps 0x1082d(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,5,124,9,1,0 ; movaps 0x1097c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,200 ; subps %xmm0,%xmm9 DB 69,15,40,208 ; movaps %xmm8,%xmm10 @@ -26023,7 +26294,7 @@ _sk_premul_dst_sse2 LABEL PROC PUBLIC _sk_unpremul_sse2 _sk_unpremul_sse2 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 - DB 68,15,40,13,183,7,1,0 ; movaps 0x107b7(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,6,9,1,0 ; movaps 0x10906(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,94,203 ; divps %xmm3,%xmm9 DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8 DB 69,15,84,193 ; andps %xmm9,%xmm8 @@ -26035,20 +26306,20 @@ _sk_unpremul_sse2 LABEL PROC PUBLIC _sk_from_srgb_sse2 _sk_from_srgb_sse2 LABEL PROC - DB 68,15,40,5,130,8,1,0 ; movaps 0x10882(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0xf3f> + DB 68,15,40,5,209,9,1,0 ; movaps 0x109d1(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33> DB 68,15,40,232 ; movaps %xmm0,%xmm13 DB 69,15,89,232 ; mulps %xmm8,%xmm13 DB 68,15,40,216 ; movaps %xmm0,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 - DB 68,15,40,13,250,7,1,0 ; movaps 0x107fa(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,13,73,9,1,0 ; movaps 0x10949(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 68,15,40,240 ; movaps %xmm0,%xmm14 DB 69,15,89,241 ; mulps %xmm9,%xmm14 - DB 68,15,40,21,106,8,1,0 ; movaps 0x1086a(%rip),%xmm10 # 2c070 <_sk_overlay_sse2_8bit+0xf4f> + DB 68,15,40,21,185,9,1,0 ; movaps 0x109b9(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 69,15,89,243 ; mulps %xmm11,%xmm14 - DB 68,15,40,29,106,8,1,0 ; movaps 0x1086a(%rip),%xmm11 # 2c080 <_sk_overlay_sse2_8bit+0xf5f> + DB 68,15,40,29,185,9,1,0 ; movaps 0x109b9(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53> DB 69,15,88,243 ; addps %xmm11,%xmm14 - DB 68,15,40,37,110,8,1,0 ; movaps 0x1086e(%rip),%xmm12 # 2c090 <_sk_overlay_sse2_8bit+0xf6f> + DB 68,15,40,37,189,9,1,0 ; movaps 0x109bd(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63> DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0 DB 68,15,84,232 ; andps %xmm0,%xmm13 DB 65,15,85,198 ; andnps %xmm14,%xmm0 @@ -26082,20 +26353,20 @@ _sk_from_srgb_sse2 LABEL PROC PUBLIC _sk_from_srgb_dst_sse2 _sk_from_srgb_dst_sse2 LABEL PROC - DB 68,15,40,5,191,7,1,0 ; movaps 0x107bf(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0xf3f> + DB 68,15,40,5,14,9,1,0 ; movaps 0x1090e(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33> DB 68,15,40,236 ; movaps %xmm4,%xmm13 DB 69,15,89,232 ; mulps %xmm8,%xmm13 DB 68,15,40,220 ; movaps %xmm4,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 - DB 68,15,40,13,55,7,1,0 ; movaps 0x10737(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf> + DB 68,15,40,13,134,8,1,0 ; movaps 0x10886(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3> DB 68,15,40,244 ; movaps %xmm4,%xmm14 DB 69,15,89,241 ; mulps %xmm9,%xmm14 - DB 68,15,40,21,167,7,1,0 ; movaps 0x107a7(%rip),%xmm10 # 2c070 <_sk_overlay_sse2_8bit+0xf4f> + DB 68,15,40,21,246,8,1,0 ; movaps 0x108f6(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 69,15,89,243 ; mulps %xmm11,%xmm14 - DB 68,15,40,29,167,7,1,0 ; movaps 0x107a7(%rip),%xmm11 # 2c080 <_sk_overlay_sse2_8bit+0xf5f> + DB 68,15,40,29,246,8,1,0 ; movaps 0x108f6(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53> DB 69,15,88,243 ; addps %xmm11,%xmm14 - DB 68,15,40,37,171,7,1,0 ; movaps 0x107ab(%rip),%xmm12 # 2c090 <_sk_overlay_sse2_8bit+0xf6f> + DB 68,15,40,37,250,8,1,0 ; movaps 0x108fa(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63> DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4 DB 68,15,84,236 ; andps %xmm4,%xmm13 DB 65,15,85,230 ; andnps %xmm14,%xmm4 @@ -26130,22 +26401,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC PUBLIC _sk_to_srgb_sse2 _sk_to_srgb_sse2 LABEL PROC DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13 - DB 68,15,40,5,56,7,1,0 ; movaps 0x10738(%rip),%xmm8 # 2c0a0 <_sk_overlay_sse2_8bit+0xf7f> + DB 68,15,40,5,135,8,1,0 ; movaps 0x10887(%rip),%xmm8 # 2c680 <_sk_overlay_sse2_8bit+0xf73> DB 68,15,40,240 ; movaps %xmm0,%xmm14 DB 69,15,89,240 ; mulps %xmm8,%xmm14 - DB 68,15,40,13,56,7,1,0 ; movaps 0x10738(%rip),%xmm9 # 2c0b0 <_sk_overlay_sse2_8bit+0xf8f> + DB 68,15,40,13,135,8,1,0 ; movaps 0x10887(%rip),%xmm9 # 2c690 <_sk_overlay_sse2_8bit+0xf83> DB 69,15,40,253 ; movaps %xmm13,%xmm15 DB 69,15,89,249 ; mulps %xmm9,%xmm15 - DB 68,15,40,21,56,7,1,0 ; movaps 0x10738(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0xf9f> + DB 68,15,40,21,135,8,1,0 ; movaps 0x10887(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93> DB 69,15,88,250 ; addps %xmm10,%xmm15 DB 69,15,89,253 ; mulps %xmm13,%xmm15 - DB 68,15,40,29,56,7,1,0 ; movaps 0x10738(%rip),%xmm11 # 2c0d0 <_sk_overlay_sse2_8bit+0xfaf> + DB 68,15,40,29,135,8,1,0 ; movaps 0x10887(%rip),%xmm11 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3> DB 69,15,88,251 ; addps %xmm11,%xmm15 - DB 68,15,40,37,60,7,1,0 ; movaps 0x1073c(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0xfbf> + DB 68,15,40,37,139,8,1,0 ; movaps 0x1088b(%rip),%xmm12 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3> DB 69,15,88,236 ; addps %xmm12,%xmm13 DB 69,15,83,237 ; rcpps %xmm13,%xmm13 DB 69,15,89,239 ; mulps %xmm15,%xmm13 - DB 68,15,40,61,56,7,1,0 ; movaps 0x10738(%rip),%xmm15 # 2c0f0 <_sk_overlay_sse2_8bit+0xfcf> + DB 68,15,40,61,135,8,1,0 ; movaps 0x10887(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 68,15,84,240 ; andps %xmm0,%xmm14 DB 65,15,85,197 ; andnps %xmm13,%xmm0 @@ -26185,15 +26456,17 @@ PUBLIC _sk_rgb_to_hsl_sse2 _sk_rgb_to_hsl_sse2 LABEL PROC DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,40,192 ; movaps %xmm0,%xmm8 + DB 65,15,40,193 ; movaps %xmm9,%xmm0 + DB 15,95,194 ; maxps %xmm2,%xmm0 DB 69,15,40,208 ; movaps %xmm8,%xmm10 - DB 69,15,95,209 ; maxps %xmm9,%xmm10 - DB 68,15,95,210 ; maxps %xmm2,%xmm10 + DB 68,15,95,208 ; maxps %xmm0,%xmm10 + DB 65,15,40,193 ; movaps %xmm9,%xmm0 + DB 15,93,194 ; minps %xmm2,%xmm0 DB 69,15,40,216 ; movaps %xmm8,%xmm11 - DB 69,15,93,217 ; minps %xmm9,%xmm11 - DB 68,15,93,218 ; minps %xmm2,%xmm11 + DB 68,15,93,216 ; minps %xmm0,%xmm11 DB 65,15,40,202 ; movaps %xmm10,%xmm1 DB 65,15,92,203 ; subps %xmm11,%xmm1 - DB 68,15,40,45,1,5,1,0 ; movaps 0x10501(%rip),%xmm13 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,45,74,6,1,0 ; movaps 0x1064a(%rip),%xmm13 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 68,15,94,233 ; divps %xmm1,%xmm13 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0 @@ -26202,30 +26475,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,40,241 ; movaps %xmm9,%xmm14 DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14 - DB 68,15,84,53,103,6,1,0 ; andps 0x10667(%rip),%xmm14 # 2c100 <_sk_overlay_sse2_8bit+0xfdf> + DB 68,15,84,53,176,7,1,0 ; andps 0x107b0(%rip),%xmm14 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3> DB 69,15,88,244 ; addps %xmm12,%xmm14 DB 69,15,40,250 ; movaps %xmm10,%xmm15 DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15 DB 65,15,92,208 ; subps %xmm8,%xmm2 DB 65,15,89,213 ; mulps %xmm13,%xmm2 - DB 68,15,40,37,90,6,1,0 ; movaps 0x1065a(%rip),%xmm12 # 2c110 <_sk_overlay_sse2_8bit+0xfef> + DB 68,15,40,37,163,7,1,0 ; movaps 0x107a3(%rip),%xmm12 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3> DB 65,15,88,212 ; addps %xmm12,%xmm2 DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 69,15,89,197 ; mulps %xmm13,%xmm8 - DB 68,15,88,5,86,6,1,0 ; addps 0x10656(%rip),%xmm8 # 2c120 <_sk_overlay_sse2_8bit+0xfff> + DB 68,15,88,5,159,7,1,0 ; addps 0x1079f(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3> DB 65,15,84,215 ; andps %xmm15,%xmm2 DB 69,15,85,248 ; andnps %xmm8,%xmm15 DB 68,15,86,250 ; orps %xmm2,%xmm15 DB 68,15,84,240 ; andps %xmm0,%xmm14 DB 65,15,85,199 ; andnps %xmm15,%xmm0 DB 65,15,86,198 ; orps %xmm14,%xmm0 - DB 15,89,5,71,6,1,0 ; mulps 0x10647(%rip),%xmm0 # 2c130 <_sk_overlay_sse2_8bit+0x100f> + DB 15,89,5,144,7,1,0 ; mulps 0x10790(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x1003> DB 69,15,40,194 ; movaps %xmm10,%xmm8 DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8 DB 65,15,84,192 ; andps %xmm8,%xmm0 DB 69,15,92,226 ; subps %xmm10,%xmm12 DB 69,15,88,211 ; addps %xmm11,%xmm10 - DB 68,15,40,13,90,4,1,0 ; movaps 0x1045a(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,13,163,5,1,0 ; movaps 0x105a3(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,40,210 ; movaps %xmm10,%xmm2 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9 @@ -26248,7 +26521,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp) DB 68,15,40,218 ; movaps %xmm2,%xmm11 DB 15,40,240 ; movaps %xmm0,%xmm6 - DB 68,15,40,13,5,4,1,0 ; movaps 0x10405(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,13,78,5,1,0 ; movaps 0x1054e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10 DB 15,40,193 ; movaps %xmm1,%xmm0 @@ -26265,28 +26538,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 69,15,88,211 ; addps %xmm11,%xmm10 DB 69,15,88,219 ; addps %xmm11,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 15,40,5,159,5,1,0 ; movaps 0x1059f(%rip),%xmm0 # 2c140 <_sk_overlay_sse2_8bit+0x101f> + DB 15,40,5,232,6,1,0 ; movaps 0x106e8(%rip),%xmm0 # 2c720 <_sk_overlay_sse2_8bit+0x1013> DB 15,88,198 ; addps %xmm6,%xmm0 DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,40,216 ; movaps %xmm0,%xmm3 DB 15,194,217,1 ; cmpltps %xmm1,%xmm3 - DB 15,84,29,183,3,1,0 ; andps 0x103b7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,84,29,0,5,1,0 ; andps 0x10500(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,203 ; subps %xmm3,%xmm1 DB 15,92,193 ; subps %xmm1,%xmm0 - DB 68,15,40,45,137,5,1,0 ; movaps 0x10589(%rip),%xmm13 # 2c150 <_sk_overlay_sse2_8bit+0x102f> + DB 68,15,40,45,210,6,1,0 ; movaps 0x106d2(%rip),%xmm13 # 2c730 <_sk_overlay_sse2_8bit+0x1023> DB 69,15,40,197 ; movaps %xmm13,%xmm8 DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8 DB 69,15,40,242 ; movaps %xmm10,%xmm14 DB 69,15,92,243 ; subps %xmm11,%xmm14 DB 65,15,40,217 ; movaps %xmm9,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 - DB 15,40,21,73,5,1,0 ; movaps 0x10549(%rip),%xmm2 # 2c130 <_sk_overlay_sse2_8bit+0x100f> + DB 15,40,21,146,6,1,0 ; movaps 0x10692(%rip),%xmm2 # 2c710 <_sk_overlay_sse2_8bit+0x1003> DB 68,15,40,250 ; movaps %xmm2,%xmm15 DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15 - DB 15,40,13,9,5,1,0 ; movaps 0x10509(%rip),%xmm1 # 2c100 <_sk_overlay_sse2_8bit+0xfdf> + DB 15,40,13,82,6,1,0 ; movaps 0x10652(%rip),%xmm1 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3> DB 15,89,193 ; mulps %xmm1,%xmm0 - DB 15,40,45,31,5,1,0 ; movaps 0x1051f(%rip),%xmm5 # 2c120 <_sk_overlay_sse2_8bit+0xfff> + DB 15,40,45,104,6,1,0 ; movaps 0x10668(%rip),%xmm5 # 2c700 <_sk_overlay_sse2_8bit+0xff3> DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,92,224 ; subps %xmm0,%xmm4 DB 65,15,89,230 ; mulps %xmm14,%xmm4 @@ -26309,7 +26582,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,222 ; movaps %xmm6,%xmm3 DB 15,194,216,1 ; cmpltps %xmm0,%xmm3 - DB 15,84,29,20,3,1,0 ; andps 0x10314(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,84,29,93,4,1,0 ; andps 0x1045d(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,195 ; subps %xmm3,%xmm0 DB 68,15,40,230 ; movaps %xmm6,%xmm12 DB 68,15,92,224 ; subps %xmm0,%xmm12 @@ -26339,12 +26612,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,40,60,36 ; movaps (%rsp),%xmm7 DB 15,40,231 ; movaps %xmm7,%xmm4 DB 15,85,227 ; andnps %xmm3,%xmm4 - DB 15,88,53,141,4,1,0 ; addps 0x1048d(%rip),%xmm6 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 15,88,53,214,5,1,0 ; addps 0x105d6(%rip),%xmm6 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,222 ; movaps %xmm6,%xmm3 DB 15,194,216,1 ; cmpltps %xmm0,%xmm3 - DB 15,84,29,136,2,1,0 ; andps 0x10288(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,84,29,209,3,1,0 ; andps 0x103d1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,92,195 ; subps %xmm3,%xmm0 DB 15,92,240 ; subps %xmm0,%xmm6 DB 15,89,206 ; mulps %xmm6,%xmm1 @@ -26405,13 +26678,13 @@ _sk_scale_u8_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,61 ; jne 1bded <_sk_scale_u8_sse2+0x55> + DB 117,61 ; jne 1c284 <_sk_scale_u8_sse2+0x55> DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 - DB 102,68,15,219,5,87,2,1,0 ; pand 0x10257(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,68,15,219,5,160,3,1,0 ; pand 0x103a0(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,155,3,1,0 ; mulps 0x1039b(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,89,5,228,4,1,0 ; mulps 0x104e4(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 @@ -26422,12 +26695,12 @@ _sk_scale_u8_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,61 ; je 1be37 <_sk_scale_u8_sse2+0x9f> + DB 116,61 ; je 1c2ce <_sk_scale_u8_sse2+0x9f> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 1be1c <_sk_scale_u8_sse2+0x84> + DB 116,23 ; je 1c2b3 <_sk_scale_u8_sse2+0x84> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,181 ; jne 1bdc0 <_sk_scale_u8_sse2+0x28> + DB 117,181 ; jne 1c257 <_sk_scale_u8_sse2+0x28> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -26436,10 +26709,77 @@ _sk_scale_u8_sse2 LABEL PROC DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 DB 242,69,15,16,193 ; movsd %xmm9,%xmm8 - DB 235,137 ; jmp 1bdc0 <_sk_scale_u8_sse2+0x28> + DB 235,137 ; jmp 1c257 <_sk_scale_u8_sse2+0x28> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,122,255,255,255 ; jmpq 1bdc0 <_sk_scale_u8_sse2+0x28> + DB 233,122,255,255,255 ; jmpq 1c257 <_sk_scale_u8_sse2+0x28> + +PUBLIC _sk_scale_565_sse2 +_sk_scale_565_sse2 LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 76,99,80,8 ; movslq 0x8(%rax),%r10 + DB 76,99,201 ; movslq %ecx,%r9 + DB 77,15,175,202 ; imul %r10,%r9 + DB 77,1,201 ; add %r9,%r9 + DB 76,3,8 ; add (%rax),%r9 + DB 76,99,218 ; movslq %edx,%r11 + DB 77,133,192 ; test %r8,%r8 + DB 15,133,173,0,0,0 ; jne 1c3a9 <_sk_scale_565_sse2+0xcc> + DB 243,71,15,126,20,89 ; movq (%r9,%r11,2),%xmm10 + DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10 + DB 102,68,15,111,5,80,4,1,0 ; movdqa 0x10450(%rip),%xmm8 # 2c760 <_sk_overlay_sse2_8bit+0x1053> + DB 102,69,15,219,194 ; pand %xmm10,%xmm8 + DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 + DB 68,15,89,5,79,4,1,0 ; mulps 0x1044f(%rip),%xmm8 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,68,15,111,13,86,4,1,0 ; movdqa 0x10456(%rip),%xmm9 # 2c780 <_sk_overlay_sse2_8bit+0x1073> + DB 102,69,15,219,202 ; pand %xmm10,%xmm9 + DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9 + DB 68,15,89,13,85,4,1,0 ; mulps 0x10455(%rip),%xmm9 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,68,15,219,21,92,4,1,0 ; pand 0x1045c(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> + DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 + DB 68,15,89,21,96,4,1,0 ; mulps 0x10460(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> + DB 68,15,40,219 ; movaps %xmm3,%xmm11 + DB 68,15,194,223,1 ; cmpltps %xmm7,%xmm11 + DB 69,15,40,225 ; movaps %xmm9,%xmm12 + DB 69,15,93,226 ; minps %xmm10,%xmm12 + DB 69,15,40,232 ; movaps %xmm8,%xmm13 + DB 69,15,93,236 ; minps %xmm12,%xmm13 + DB 69,15,40,225 ; movaps %xmm9,%xmm12 + DB 69,15,95,226 ; maxps %xmm10,%xmm12 + DB 69,15,40,240 ; movaps %xmm8,%xmm14 + DB 69,15,95,244 ; maxps %xmm12,%xmm14 + DB 69,15,84,235 ; andps %xmm11,%xmm13 + DB 69,15,85,222 ; andnps %xmm14,%xmm11 + DB 69,15,86,221 ; orps %xmm13,%xmm11 + DB 68,15,89,192 ; mulps %xmm0,%xmm8 + DB 68,15,89,201 ; mulps %xmm1,%xmm9 + DB 68,15,89,210 ; mulps %xmm2,%xmm10 + DB 68,15,89,219 ; mulps %xmm3,%xmm11 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 65,15,40,192 ; movaps %xmm8,%xmm0 + DB 65,15,40,201 ; movaps %xmm9,%xmm1 + DB 65,15,40,210 ; movaps %xmm10,%xmm2 + DB 65,15,40,219 ; movaps %xmm11,%xmm3 + DB 255,224 ; jmpq *%rax + DB 69,137,194 ; mov %r8d,%r10d + DB 65,128,226,3 ; and $0x3,%r10b + DB 65,128,250,1 ; cmp $0x1,%r10b + DB 116,59 ; je 1c3f1 <_sk_scale_565_sse2+0x114> + DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 + DB 65,128,250,2 ; cmp $0x2,%r10b + DB 116,27 ; je 1c3dc <_sk_scale_565_sse2+0xff> + DB 65,128,250,3 ; cmp $0x3,%r10b + DB 15,133,60,255,255,255 ; jne 1c307 <_sk_scale_565_sse2+0x2a> + DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax + DB 102,68,15,110,192 ; movd %eax,%xmm8 + DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10 + DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8 + DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 + DB 242,69,15,16,208 ; movsd %xmm8,%xmm10 + DB 233,22,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a> + DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax + DB 102,68,15,110,208 ; movd %eax,%xmm10 + DB 233,7,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a> PUBLIC _sk_lerp_1_float_sse2 _sk_lerp_1_float_sse2 LABEL PROC @@ -26470,13 +26810,13 @@ _sk_lerp_u8_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,81 ; jne 1bee7 <_sk_lerp_u8_sse2+0x69> + DB 117,81 ; jne 1c4a1 <_sk_lerp_u8_sse2+0x69> DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 - DB 102,68,15,219,5,113,1,1,0 ; pand 0x10171(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,68,15,219,5,151,1,1,0 ; pand 0x10197(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,181,2,1,0 ; mulps 0x102b5(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,89,5,219,2,1,0 ; mulps 0x102db(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -26494,12 +26834,12 @@ _sk_lerp_u8_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,64 ; je 1bf34 <_sk_lerp_u8_sse2+0xb6> + DB 116,64 ; je 1c4ee <_sk_lerp_u8_sse2+0xb6> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 1bf16 <_sk_lerp_u8_sse2+0x98> + DB 116,23 ; je 1c4d0 <_sk_lerp_u8_sse2+0x98> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,161 ; jne 1bea6 <_sk_lerp_u8_sse2+0x28> + DB 117,161 ; jne 1c460 <_sk_lerp_u8_sse2+0x28> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -26508,10 +26848,10 @@ _sk_lerp_u8_sse2 LABEL PROC DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 DB 242,69,15,16,193 ; movsd %xmm9,%xmm8 - DB 233,114,255,255,255 ; jmpq 1bea6 <_sk_lerp_u8_sse2+0x28> + DB 233,114,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,99,255,255,255 ; jmpq 1bea6 <_sk_lerp_u8_sse2+0x28> + DB 233,99,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28> PUBLIC _sk_lerp_565_sse2 _sk_lerp_565_sse2 LABEL PROC @@ -26523,72 +26863,76 @@ _sk_lerp_565_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,156,0,0,0 ; jne 1bffe <_sk_lerp_565_sse2+0xbb> - DB 243,71,15,126,12,89 ; movq (%r9,%r11,2),%xmm9 - DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 - DB 102,68,15,111,5,10,2,1,0 ; movdqa 0x1020a(%rip),%xmm8 # 2c180 <_sk_overlay_sse2_8bit+0x105f> - DB 102,69,15,219,193 ; pand %xmm9,%xmm8 - DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,9,2,1,0 ; mulps 0x10209(%rip),%xmm8 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,68,15,111,21,16,2,1,0 ; movdqa 0x10210(%rip),%xmm10 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> - DB 102,69,15,219,209 ; pand %xmm9,%xmm10 - DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 - DB 68,15,89,21,15,2,1,0 ; mulps 0x1020f(%rip),%xmm10 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,68,15,219,13,22,2,1,0 ; pand 0x10216(%rip),%xmm9 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 15,133,173,0,0,0 ; jne 1c5c9 <_sk_lerp_565_sse2+0xcc> + DB 243,71,15,126,4,89 ; movq (%r9,%r11,2),%xmm8 + DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 + DB 102,68,15,111,13,48,2,1,0 ; movdqa 0x10230(%rip),%xmm9 # 2c760 <_sk_overlay_sse2_8bit+0x1053> + DB 102,69,15,219,200 ; pand %xmm8,%xmm9 DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9 - DB 68,15,89,13,26,2,1,0 ; mulps 0x1021a(%rip),%xmm9 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> + DB 68,15,89,13,47,2,1,0 ; mulps 0x1022f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,68,15,111,21,54,2,1,0 ; movdqa 0x10236(%rip),%xmm10 # 2c780 <_sk_overlay_sse2_8bit+0x1073> + DB 102,69,15,219,208 ; pand %xmm8,%xmm10 + DB 69,15,91,218 ; cvtdq2ps %xmm10,%xmm11 + DB 68,15,89,29,53,2,1,0 ; mulps 0x10235(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,68,15,219,5,60,2,1,0 ; pand 0x1023c(%rip),%xmm8 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> + DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 + DB 68,15,89,5,64,2,1,0 ; mulps 0x10240(%rip),%xmm8 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> + DB 68,15,40,211 ; movaps %xmm3,%xmm10 + DB 68,15,194,215,1 ; cmpltps %xmm7,%xmm10 + DB 69,15,40,227 ; movaps %xmm11,%xmm12 + DB 15,92,205 ; subps %xmm5,%xmm1 + DB 65,15,89,203 ; mulps %xmm11,%xmm1 + DB 69,15,93,216 ; minps %xmm8,%xmm11 + DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 65,15,89,192 ; mulps %xmm8,%xmm0 + DB 65,15,89,193 ; mulps %xmm9,%xmm0 + DB 69,15,93,203 ; minps %xmm11,%xmm9 + DB 69,15,95,224 ; maxps %xmm8,%xmm12 + DB 69,15,95,236 ; maxps %xmm12,%xmm13 + DB 69,15,84,202 ; andps %xmm10,%xmm9 + DB 69,15,85,213 ; andnps %xmm13,%xmm10 + DB 69,15,86,209 ; orps %xmm9,%xmm10 DB 15,88,196 ; addps %xmm4,%xmm0 - DB 15,92,205 ; subps %xmm5,%xmm1 - DB 65,15,89,202 ; mulps %xmm10,%xmm1 DB 15,88,205 ; addps %xmm5,%xmm1 DB 15,92,214 ; subps %xmm6,%xmm2 - DB 65,15,89,209 ; mulps %xmm9,%xmm2 + DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 15,88,214 ; addps %xmm6,%xmm2 DB 15,92,223 ; subps %xmm7,%xmm3 - DB 68,15,89,195 ; mulps %xmm3,%xmm8 - DB 68,15,88,199 ; addps %xmm7,%xmm8 - DB 68,15,89,211 ; mulps %xmm3,%xmm10 - DB 68,15,88,215 ; addps %xmm7,%xmm10 - DB 65,15,89,217 ; mulps %xmm9,%xmm3 + DB 65,15,89,218 ; mulps %xmm10,%xmm3 DB 15,88,223 ; addps %xmm7,%xmm3 - DB 68,15,95,211 ; maxps %xmm3,%xmm10 - DB 69,15,95,194 ; maxps %xmm10,%xmm8 DB 72,173 ; lods %ds:(%rsi),%rax - DB 65,15,40,216 ; movaps %xmm8,%xmm3 DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,59 ; je 1c046 <_sk_lerp_565_sse2+0x103> - DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 + DB 116,59 ; je 1c611 <_sk_lerp_565_sse2+0x114> + DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,27 ; je 1c031 <_sk_lerp_565_sse2+0xee> + DB 116,27 ; je 1c5fc <_sk_lerp_565_sse2+0xff> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,77,255,255,255 ; jne 1bf6d <_sk_lerp_565_sse2+0x2a> + DB 15,133,60,255,255,255 ; jne 1c527 <_sk_lerp_565_sse2+0x2a> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 102,69,15,112,200,69 ; pshufd $0x45,%xmm8,%xmm9 - DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8 - DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 - DB 242,69,15,16,200 ; movsd %xmm8,%xmm9 - DB 233,39,255,255,255 ; jmpq 1bf6d <_sk_lerp_565_sse2+0x2a> + DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 + DB 102,71,15,110,12,89 ; movd (%r9,%r11,2),%xmm9 + DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 + DB 242,69,15,16,193 ; movsd %xmm9,%xmm8 + DB 233,22,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax - DB 102,68,15,110,200 ; movd %eax,%xmm9 - DB 233,24,255,255,255 ; jmpq 1bf6d <_sk_lerp_565_sse2+0x2a> + DB 102,68,15,110,192 ; movd %eax,%xmm8 + DB 233,7,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a> PUBLIC _sk_load_tables_sse2 _sk_load_tables_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 77,133,192 ; test %r8,%r8 - DB 15,133,36,1,0,0 ; jne 1c187 <_sk_load_tables_sse2+0x132> + DB 15,133,36,1,0,0 ; jne 1c752 <_sk_load_tables_sse2+0x132> DB 243,69,15,111,12,145 ; movdqu (%r9,%rdx,4),%xmm9 DB 65,87 ; push %r15 DB 65,86 ; push %r14 DB 83 ; push %rbx - DB 102,68,15,111,5,169,255,0,0 ; movdqa 0xffa9(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,68,15,111,5,190,255,0,0 ; movdqa 0xffbe(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 @@ -26644,7 +26988,7 @@ _sk_load_tables_sse2 LABEL PROC DB 65,15,20,208 ; unpcklps %xmm8,%xmm2 DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9 DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3 - DB 15,89,29,242,255,0,0 ; mulps 0xfff2(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,29,7,0,1,0 ; mulps 0x10007(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -26653,18 +26997,18 @@ _sk_load_tables_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,45 ; je 1c1c1 <_sk_load_tables_sse2+0x16c> + DB 116,45 ; je 1c78c <_sk_load_tables_sse2+0x16c> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 1c1b6 <_sk_load_tables_sse2+0x161> + DB 116,23 ; je 1c781 <_sk_load_tables_sse2+0x161> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,192,254,255,255 ; jne 1c069 <_sk_load_tables_sse2+0x14> + DB 15,133,192,254,255,255 ; jne 1c634 <_sk_load_tables_sse2+0x14> DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0 DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9 DB 102,69,15,18,12,145 ; movlpd (%r9,%rdx,4),%xmm9 - DB 233,168,254,255,255 ; jmpq 1c069 <_sk_load_tables_sse2+0x14> + DB 233,168,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14> DB 102,69,15,110,12,145 ; movd (%r9,%rdx,4),%xmm9 - DB 233,157,254,255,255 ; jmpq 1c069 <_sk_load_tables_sse2+0x14> + DB 233,157,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14> PUBLIC _sk_load_tables_u16_be_sse2 _sk_load_tables_u16_be_sse2 LABEL PROC @@ -26672,7 +27016,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,101,1,0,0 ; jne 1c347 <_sk_load_tables_u16_be_sse2+0x17b> + DB 15,133,101,1,0,0 ; jne 1c912 <_sk_load_tables_u16_be_sse2+0x17b> DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0 DB 102,67,15,16,76,81,16 ; movupd 0x10(%r9,%r10,2),%xmm1 DB 65,87 ; push %r15 @@ -26684,7 +27028,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 - DB 102,68,15,111,21,199,255,0,0 ; movdqa 0xffc7(%rip),%xmm10 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf> + DB 102,68,15,111,21,220,255,0,0 ; movdqa 0xffdc(%rip),%xmm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,194 ; pand %xmm10,%xmm0 DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 @@ -26746,7 +27090,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 102,65,15,235,217 ; por %xmm9,%xmm3 DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,194,254,0,0 ; mulps 0xfec2(%rip),%xmm3 # 2c200 <_sk_overlay_sse2_8bit+0x10df> + DB 15,89,29,215,254,0,0 ; mulps 0xfed7(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -26754,17 +27098,17 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,17 ; jne 1c364 <_sk_load_tables_u16_be_sse2+0x198> + DB 117,17 ; jne 1c92f <_sk_load_tables_u16_be_sse2+0x198> DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 - DB 233,139,254,255,255 ; jmpq 1c1ef <_sk_load_tables_u16_be_sse2+0x23> + DB 233,139,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23> DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,118,254,255,255 ; jb 1c1ef <_sk_load_tables_u16_be_sse2+0x23> + DB 15,130,118,254,255,255 ; jb 1c7ba <_sk_load_tables_u16_be_sse2+0x23> DB 242,67,15,16,76,81,16 ; movsd 0x10(%r9,%r10,2),%xmm1 - DB 233,106,254,255,255 ; jmpq 1c1ef <_sk_load_tables_u16_be_sse2+0x23> + DB 233,106,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23> PUBLIC _sk_load_tables_rgb_u16_be_sse2 _sk_load_tables_rgb_u16_be_sse2 LABEL PROC @@ -26772,7 +27116,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,84,1,0,0 ; jne 1c4eb <_sk_load_tables_rgb_u16_be_sse2+0x166> + DB 15,133,84,1,0,0 ; jne 1cab6 <_sk_load_tables_rgb_u16_be_sse2+0x166> DB 243,71,15,111,28,81 ; movdqu (%r9,%r10,2),%xmm11 DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1 DB 102,15,115,217,4 ; psrldq $0x4,%xmm1 @@ -26787,7 +27131,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10 DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0 DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0 - DB 102,68,15,111,5,1,254,0,0 ; movdqa 0xfe01(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf> + DB 102,68,15,111,5,22,254,0,0 ; movdqa 0xfe16(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 @@ -26843,7 +27187,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 15,20,211 ; unpcklps %xmm3,%xmm2 DB 65,15,20,208 ; unpcklps %xmm8,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,140,250,0,0 ; movaps 0xfa8c(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,161,250,0,0 ; movaps 0xfaa1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 91 ; pop %rbx DB 65,94 ; pop %r14 DB 65,95 ; pop %r15 @@ -26852,21 +27196,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 102,71,15,196,92,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm11 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,14 ; jne 1c511 <_sk_load_tables_rgb_u16_be_sse2+0x18c> + DB 117,14 ; jne 1cadc <_sk_load_tables_rgb_u16_be_sse2+0x18c> DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 - DB 233,172,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38> + DB 233,172,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38> DB 102,71,15,110,84,81,6 ; movd 0x6(%r9,%r10,2),%xmm10 DB 102,71,15,196,84,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm10 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 1c542 <_sk_load_tables_rgb_u16_be_sse2+0x1bd> + DB 114,24 ; jb 1cb0d <_sk_load_tables_rgb_u16_be_sse2+0x1bd> DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1 DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,123,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38> + DB 233,123,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38> DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,114,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38> + DB 233,114,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38> PUBLIC _sk_byte_tables_sse2 _sk_byte_tables_sse2 LABEL PROC @@ -26875,7 +27219,7 @@ _sk_byte_tables_sse2 LABEL PROC DB 65,86 ; push %r14 DB 83 ; push %rbx DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,245,250,0,0 ; movaps 0xfaf5(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,10,251,0,0 ; movaps 0xfb0a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 102,73,15,126,193 ; movq %xmm0,%r9 @@ -26903,7 +27247,7 @@ _sk_byte_tables_sse2 LABEL PROC DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0 DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,21,159,251,0,0 ; movaps 0xfb9f(%rip),%xmm10 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,21,180,251,0,0 ; movaps 0xfbb4(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,194 ; mulps %xmm10,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -27022,7 +27366,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0 DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,21,215,249,0,0 ; movaps 0xf9d7(%rip),%xmm10 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,21,236,249,0,0 ; movaps 0xf9ec(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,194 ; mulps %xmm10,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -27219,15 +27563,15 @@ _sk_parametric_r_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,171,247,0,0 ; mulps 0xf7ab(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,21,179,247,0,0 ; andps 0xf7b3(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,21,219,244,0,0 ; orps 0xf4db(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,13,179,247,0,0 ; addps 0xf7b3(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 68,15,40,37,187,247,0,0 ; movaps 0xf7bb(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,13,192,247,0,0 ; mulps 0xf7c0(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,21,200,247,0,0 ; andps 0xf7c8(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,21,240,244,0,0 ; orps 0xf4f0(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,13,200,247,0,0 ; addps 0xf7c8(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 68,15,40,37,208,247,0,0 ; movaps 0xf7d0(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,187,247,0,0 ; addps 0xf7bb(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 68,15,40,37,195,247,0,0 ; movaps 0xf7c3(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,21,208,247,0,0 ; addps 0xf7d0(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 68,15,40,37,216,247,0,0 ; movaps 0xf7d8(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -27235,22 +27579,22 @@ _sk_parametric_r_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,157,244,0,0 ; movaps 0xf49d(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,178,244,0,0 ; movaps 0xf4b2(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,145,247,0,0 ; addps 0xf791(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 68,15,40,37,153,247,0,0 ; movaps 0xf799(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,13,166,247,0,0 ; addps 0xf7a6(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,153,247,0,0 ; movaps 0xf799(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,157,247,0,0 ; movaps 0xf79d(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 68,15,40,45,178,247,0,0 ; movaps 0xf7b2(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,157,247,0,0 ; mulps 0xf79d(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 68,15,89,45,178,247,0,0 ; mulps 0xf7b2(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -27284,15 +27628,15 @@ _sk_parametric_g_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,109,246,0,0 ; mulps 0xf66d(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,21,117,246,0,0 ; andps 0xf675(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,21,157,243,0,0 ; orps 0xf39d(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,13,117,246,0,0 ; addps 0xf675(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 68,15,40,37,125,246,0,0 ; movaps 0xf67d(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,13,130,246,0,0 ; mulps 0xf682(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,21,138,246,0,0 ; andps 0xf68a(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,21,178,243,0,0 ; orps 0xf3b2(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,13,138,246,0,0 ; addps 0xf68a(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 68,15,40,37,146,246,0,0 ; movaps 0xf692(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,125,246,0,0 ; addps 0xf67d(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 68,15,40,37,133,246,0,0 ; movaps 0xf685(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,21,146,246,0,0 ; addps 0xf692(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 68,15,40,37,154,246,0,0 ; movaps 0xf69a(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -27300,22 +27644,22 @@ _sk_parametric_g_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,95,243,0,0 ; movaps 0xf35f(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,116,243,0,0 ; movaps 0xf374(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,83,246,0,0 ; addps 0xf653(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 68,15,40,37,91,246,0,0 ; movaps 0xf65b(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,13,104,246,0,0 ; addps 0xf668(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,91,246,0,0 ; movaps 0xf65b(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,95,246,0,0 ; movaps 0xf65f(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 68,15,40,45,116,246,0,0 ; movaps 0xf674(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,95,246,0,0 ; mulps 0xf65f(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 68,15,89,45,116,246,0,0 ; mulps 0xf674(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -27349,15 +27693,15 @@ _sk_parametric_b_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,47,245,0,0 ; mulps 0xf52f(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,21,55,245,0,0 ; andps 0xf537(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,21,95,242,0,0 ; orps 0xf25f(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,13,55,245,0,0 ; addps 0xf537(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 68,15,40,37,63,245,0,0 ; movaps 0xf53f(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,13,68,245,0,0 ; mulps 0xf544(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,21,76,245,0,0 ; andps 0xf54c(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,21,116,242,0,0 ; orps 0xf274(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,13,76,245,0,0 ; addps 0xf54c(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 68,15,40,37,84,245,0,0 ; movaps 0xf554(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,63,245,0,0 ; addps 0xf53f(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 68,15,40,37,71,245,0,0 ; movaps 0xf547(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,21,84,245,0,0 ; addps 0xf554(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 68,15,40,37,92,245,0,0 ; movaps 0xf55c(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -27365,22 +27709,22 @@ _sk_parametric_b_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,33,242,0,0 ; movaps 0xf221(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,54,242,0,0 ; movaps 0xf236(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,21,245,0,0 ; addps 0xf515(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 68,15,40,37,29,245,0,0 ; movaps 0xf51d(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,13,42,245,0,0 ; addps 0xf52a(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,29,245,0,0 ; movaps 0xf51d(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,33,245,0,0 ; movaps 0xf521(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 68,15,40,45,54,245,0,0 ; movaps 0xf536(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,33,245,0,0 ; mulps 0xf521(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 68,15,89,45,54,245,0,0 ; mulps 0xf536(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -27414,15 +27758,15 @@ _sk_parametric_a_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,241,243,0,0 ; mulps 0xf3f1(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 68,15,84,21,249,243,0,0 ; andps 0xf3f9(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,86,21,33,241,0,0 ; orps 0xf121(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> - DB 68,15,88,13,249,243,0,0 ; addps 0xf3f9(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f> - DB 68,15,40,37,1,244,0,0 ; movaps 0xf401(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,89,13,6,244,0,0 ; mulps 0xf406(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 68,15,84,21,14,244,0,0 ; andps 0xf40e(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,86,21,54,241,0,0 ; orps 0xf136(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33> + DB 68,15,88,13,14,244,0,0 ; addps 0xf40e(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113> + DB 68,15,40,37,22,244,0,0 ; movaps 0xf416(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,1,244,0,0 ; addps 0xf401(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f> - DB 68,15,40,37,9,244,0,0 ; movaps 0xf409(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,88,21,22,244,0,0 ; addps 0xf416(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133> + DB 68,15,40,37,30,244,0,0 ; movaps 0xf41e(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -27430,22 +27774,22 @@ _sk_parametric_a_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,227,240,0,0 ; movaps 0xf0e3(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,248,240,0,0 ; movaps 0xf0f8(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,215,243,0,0 ; addps 0xf3d7(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f> - DB 68,15,40,37,223,243,0,0 ; movaps 0xf3df(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 68,15,88,13,236,243,0,0 ; addps 0xf3ec(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153> + DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,223,243,0,0 ; movaps 0xf3df(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,227,243,0,0 ; movaps 0xf3e3(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 68,15,40,45,248,243,0,0 ; movaps 0xf3f8(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,227,243,0,0 ; mulps 0xf3e3(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 68,15,89,45,248,243,0,0 ; mulps 0xf3f8(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -27469,19 +27813,19 @@ _sk_gamma_sse2 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0 - DB 15,89,5,235,242,0,0 ; mulps 0xf2eb(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 15,84,21,244,242,0,0 ; andps 0xf2f4(%rip),%xmm2 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 68,15,40,53,28,240,0,0 ; movaps 0xf01c(%rip),%xmm14 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,89,5,0,243,0,0 ; mulps 0xf300(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 15,84,21,9,243,0,0 ; andps 0xf309(%rip),%xmm2 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 68,15,40,53,49,240,0,0 ; movaps 0xf031(%rip),%xmm14 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,86,214 ; orps %xmm14,%xmm2 - DB 68,15,40,37,240,242,0,0 ; movaps 0xf2f0(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f> + DB 68,15,40,37,5,243,0,0 ; movaps 0xf305(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113> DB 65,15,88,196 ; addps %xmm12,%xmm0 - DB 68,15,40,29,244,242,0,0 ; movaps 0xf2f4(%rip),%xmm11 # 2c250 <_sk_overlay_sse2_8bit+0x112f> + DB 68,15,40,29,9,243,0,0 ; movaps 0xf309(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123> DB 15,40,226 ; movaps %xmm2,%xmm4 DB 65,15,89,227 ; mulps %xmm11,%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 68,15,40,21,242,242,0,0 ; movaps 0xf2f2(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f> + DB 68,15,40,21,7,243,0,0 ; movaps 0xf307(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133> DB 65,15,88,210 ; addps %xmm10,%xmm2 - DB 68,15,40,45,246,242,0,0 ; movaps 0xf2f6(%rip),%xmm13 # 2c270 <_sk_overlay_sse2_8bit+0x114f> + DB 68,15,40,45,11,243,0,0 ; movaps 0xf30b(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143> DB 65,15,40,229 ; movaps %xmm13,%xmm4 DB 15,94,226 ; divps %xmm2,%xmm4 DB 72,173 ; lods %ds:(%rsi),%rax @@ -27493,27 +27837,27 @@ _sk_gamma_sse2 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 15,40,224 ; movaps %xmm0,%xmm4 DB 15,194,226,1 ; cmpltps %xmm2,%xmm4 - DB 68,15,40,13,198,239,0,0 ; movaps 0xefc6(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,13,219,239,0,0 ; movaps 0xefdb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 65,15,84,225 ; andps %xmm9,%xmm4 DB 15,92,212 ; subps %xmm4,%xmm2 DB 15,40,224 ; movaps %xmm0,%xmm4 DB 15,92,226 ; subps %xmm2,%xmm4 - DB 15,40,53,194,242,0,0 ; movaps 0xf2c2(%rip),%xmm6 # 2c280 <_sk_overlay_sse2_8bit+0x115f> + DB 15,40,53,215,242,0,0 ; movaps 0xf2d7(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153> DB 15,88,198 ; addps %xmm6,%xmm0 - DB 15,40,61,216,242,0,0 ; movaps 0xf2d8(%rip),%xmm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f> + DB 15,40,61,237,242,0,0 ; movaps 0xf2ed(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173> DB 15,40,239 ; movaps %xmm7,%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 DB 15,40,212 ; movaps %xmm4,%xmm2 - DB 15,40,37,184,242,0,0 ; movaps 0xf2b8(%rip),%xmm4 # 2c290 <_sk_overlay_sse2_8bit+0x116f> + DB 15,40,37,205,242,0,0 ; movaps 0xf2cd(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163> DB 15,89,212 ; mulps %xmm4,%xmm2 DB 15,92,194 ; subps %xmm2,%xmm0 - DB 68,15,40,61,202,242,0,0 ; movaps 0xf2ca(%rip),%xmm15 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f> + DB 68,15,40,61,223,242,0,0 ; movaps 0xf2df(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183> DB 65,15,40,215 ; movaps %xmm15,%xmm2 DB 15,94,213 ; divps %xmm5,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 15,89,5,38,242,0,0 ; mulps 0xf226(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 15,84,13,47,242,0,0 ; andps 0xf22f(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x110f> + DB 15,89,5,59,242,0,0 ; mulps 0xf23b(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 15,84,13,68,242,0,0 ; andps 0xf244(%rip),%xmm1 # 2c810 <_sk_overlay_sse2_8bit+0x1103> DB 65,15,86,206 ; orps %xmm14,%xmm1 DB 65,15,88,196 ; addps %xmm12,%xmm0 DB 15,40,233 ; movaps %xmm1,%xmm5 @@ -27543,9 +27887,9 @@ _sk_gamma_sse2 LABEL PROC DB 15,94,206 ; divps %xmm6,%xmm1 DB 15,88,200 ; addps %xmm0,%xmm1 DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0 - DB 15,89,5,181,241,0,0 ; mulps 0xf1b5(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff> - DB 15,84,29,190,241,0,0 ; andps 0xf1be(%rip),%xmm3 # 2c230 <_sk_overlay_sse2_8bit+0x110f> - DB 15,86,29,231,238,0,0 ; orps 0xeee7(%rip),%xmm3 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,89,5,202,241,0,0 ; mulps 0xf1ca(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3> + DB 15,84,29,211,241,0,0 ; andps 0xf1d3(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103> + DB 15,86,29,252,238,0,0 ; orps 0xeefc(%rip),%xmm3 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,88,196 ; addps %xmm12,%xmm0 DB 68,15,89,219 ; mulps %xmm3,%xmm11 DB 65,15,92,195 ; subps %xmm11,%xmm0 @@ -27567,7 +27911,7 @@ _sk_gamma_sse2 LABEL PROC DB 15,92,253 ; subps %xmm5,%xmm7 DB 68,15,94,255 ; divps %xmm7,%xmm15 DB 68,15,88,248 ; addps %xmm0,%xmm15 - DB 15,40,5,244,241,0,0 ; movaps 0xf1f4(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f> + DB 15,40,5,9,242,0,0 ; movaps 0xf209(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193> DB 15,89,208 ; mulps %xmm0,%xmm2 DB 15,89,200 ; mulps %xmm0,%xmm1 DB 68,15,89,248 ; mulps %xmm0,%xmm15 @@ -27585,29 +27929,29 @@ _sk_gamma_sse2 LABEL PROC PUBLIC _sk_lab_to_xyz_sse2 _sk_lab_to_xyz_sse2 LABEL PROC - DB 15,89,5,198,241,0,0 ; mulps 0xf1c6(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x11af> - DB 68,15,40,5,62,239,0,0 ; movaps 0xef3e(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 15,89,5,219,241,0,0 ; mulps 0xf1db(%rip),%xmm0 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3> + DB 68,15,40,5,83,239,0,0 ; movaps 0xef53(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 65,15,89,200 ; mulps %xmm8,%xmm1 - DB 68,15,40,13,194,241,0,0 ; movaps 0xf1c2(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x11bf> + DB 68,15,40,13,215,241,0,0 ; movaps 0xf1d7(%rip),%xmm9 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3> DB 65,15,88,201 ; addps %xmm9,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 65,15,88,209 ; addps %xmm9,%xmm2 - DB 15,88,5,191,241,0,0 ; addps 0xf1bf(%rip),%xmm0 # 2c2f0 <_sk_overlay_sse2_8bit+0x11cf> - DB 15,89,5,200,241,0,0 ; mulps 0xf1c8(%rip),%xmm0 # 2c300 <_sk_overlay_sse2_8bit+0x11df> - DB 15,89,13,209,241,0,0 ; mulps 0xf1d1(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0x11ef> + DB 15,88,5,212,241,0,0 ; addps 0xf1d4(%rip),%xmm0 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3> + DB 15,89,5,221,241,0,0 ; mulps 0xf1dd(%rip),%xmm0 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3> + DB 15,89,13,230,241,0,0 ; mulps 0xf1e6(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,21,215,241,0,0 ; mulps 0xf1d7(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0x11ff> + DB 15,89,21,236,241,0,0 ; mulps 0xf1ec(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 68,15,92,202 ; subps %xmm2,%xmm9 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 DB 68,15,89,225 ; mulps %xmm1,%xmm12 - DB 15,40,21,204,241,0,0 ; movaps 0xf1cc(%rip),%xmm2 # 2c330 <_sk_overlay_sse2_8bit+0x120f> + DB 15,40,21,225,241,0,0 ; movaps 0xf1e1(%rip),%xmm2 # 2c910 <_sk_overlay_sse2_8bit+0x1203> DB 68,15,40,194 ; movaps %xmm2,%xmm8 DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8 - DB 68,15,40,21,203,241,0,0 ; movaps 0xf1cb(%rip),%xmm10 # 2c340 <_sk_overlay_sse2_8bit+0x121f> + DB 68,15,40,21,224,241,0,0 ; movaps 0xf1e0(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1213> DB 65,15,88,202 ; addps %xmm10,%xmm1 - DB 68,15,40,29,207,241,0,0 ; movaps 0xf1cf(%rip),%xmm11 # 2c350 <_sk_overlay_sse2_8bit+0x122f> + DB 68,15,40,29,228,241,0,0 ; movaps 0xf1e4(%rip),%xmm11 # 2c930 <_sk_overlay_sse2_8bit+0x1223> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 69,15,84,224 ; andps %xmm8,%xmm12 DB 68,15,85,193 ; andnps %xmm1,%xmm8 @@ -27631,8 +27975,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC DB 15,84,194 ; andps %xmm2,%xmm0 DB 65,15,85,209 ; andnps %xmm9,%xmm2 DB 15,86,208 ; orps %xmm0,%xmm2 - DB 68,15,89,5,127,241,0,0 ; mulps 0xf17f(%rip),%xmm8 # 2c360 <_sk_overlay_sse2_8bit+0x123f> - DB 15,89,21,136,241,0,0 ; mulps 0xf188(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0x124f> + DB 68,15,89,5,148,241,0,0 ; mulps 0xf194(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1233> + DB 15,89,21,157,241,0,0 ; mulps 0xf19d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -27646,13 +27990,13 @@ _sk_load_a8_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,46 ; jne 1d236 <_sk_load_a8_sse2+0x46> + DB 117,46 ; jne 1d801 <_sk_load_a8_sse2+0x46> DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,5,2,238,0,0 ; pand 0xee02(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,5,23,238,0,0 ; pand 0xee17(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,72,239,0,0 ; mulps 0xef48(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,29,93,239,0,0 ; mulps 0xef5d(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 @@ -27661,12 +28005,12 @@ _sk_load_a8_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,54 ; je 1d279 <_sk_load_a8_sse2+0x89> + DB 116,54 ; je 1d844 <_sk_load_a8_sse2+0x89> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1d262 <_sk_load_a8_sse2+0x72> + DB 116,21 ; je 1d82d <_sk_load_a8_sse2+0x72> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,195 ; jne 1d216 <_sk_load_a8_sse2+0x26> + DB 117,195 ; jne 1d7e1 <_sk_load_a8_sse2+0x26> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -27675,10 +28019,10 @@ _sk_load_a8_sse2 LABEL PROC DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 235,157 ; jmp 1d216 <_sk_load_a8_sse2+0x26> + DB 235,157 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,146 ; jmp 1d216 <_sk_load_a8_sse2+0x26> + DB 235,146 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26> PUBLIC _sk_load_a8_dst_sse2 _sk_load_a8_dst_sse2 LABEL PROC @@ -27689,13 +28033,13 @@ _sk_load_a8_dst_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,46 ; jne 1d2ca <_sk_load_a8_dst_sse2+0x46> + DB 117,46 ; jne 1d895 <_sk_load_a8_dst_sse2+0x46> DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,37,110,237,0,0 ; pand 0xed6e(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,37,131,237,0,0 ; pand 0xed83(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7 - DB 15,89,61,180,238,0,0 ; mulps 0xeeb4(%rip),%xmm7 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,61,201,238,0,0 ; mulps 0xeec9(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,228 ; xorps %xmm4,%xmm4 DB 102,15,87,237 ; xorpd %xmm5,%xmm5 @@ -27704,12 +28048,12 @@ _sk_load_a8_dst_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,54 ; je 1d30d <_sk_load_a8_dst_sse2+0x89> + DB 116,54 ; je 1d8d8 <_sk_load_a8_dst_sse2+0x89> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1d2f6 <_sk_load_a8_dst_sse2+0x72> + DB 116,21 ; je 1d8c1 <_sk_load_a8_dst_sse2+0x72> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,195 ; jne 1d2aa <_sk_load_a8_dst_sse2+0x26> + DB 117,195 ; jne 1d875 <_sk_load_a8_dst_sse2+0x26> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -27718,10 +28062,10 @@ _sk_load_a8_dst_sse2 LABEL PROC DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 235,157 ; jmp 1d2aa <_sk_load_a8_dst_sse2+0x26> + DB 235,157 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 - DB 235,146 ; jmp 1d2aa <_sk_load_a8_dst_sse2+0x26> + DB 235,146 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26> PUBLIC _sk_gather_a8_sse2 _sk_gather_a8_sse2 LABEL PROC @@ -27761,7 +28105,7 @@ _sk_gather_a8_sse2 LABEL PROC DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,197,237,0,0 ; mulps 0xedc5(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,29,218,237,0,0 ; mulps 0xedda(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -27779,7 +28123,7 @@ _sk_store_a8_sse2 LABEL PROC DB 77,15,175,202 ; imul %r10,%r9 DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 - DB 68,15,40,5,117,236,0,0 ; movaps 0xec75(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,138,236,0,0 ; movaps 0xec8a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 68,15,89,195 ; mulps %xmm3,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8 @@ -27787,7 +28131,7 @@ _sk_store_a8_sse2 LABEL PROC DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 1d410 <_sk_store_a8_sse2+0x54> + DB 117,17 ; jne 1d9db <_sk_store_a8_sse2+0x54> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 67,137,4,25 ; mov %eax,(%r9,%r11,1) DB 72,173 ; lods %ds:(%rsi),%rax @@ -27798,24 +28142,24 @@ _sk_store_a8_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,59 ; je 1d462 <_sk_store_a8_sse2+0xa6> + DB 116,59 ; je 1da2d <_sk_store_a8_sse2+0xa6> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,22 ; je 1d443 <_sk_store_a8_sse2+0x87> + DB 116,22 ; je 1da0e <_sk_store_a8_sse2+0x87> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,213 ; jne 1d408 <_sk_store_a8_sse2+0x4c> + DB 117,213 ; jne 1d9d3 <_sk_store_a8_sse2+0x4c> DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp) DB 138,68,36,24 ; mov 0x18(%rsp),%al DB 67,136,68,25,2 ; mov %al,0x2(%r9,%r11,1) - DB 102,68,15,219,5,212,235,0,0 ; pand 0xebd4(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,68,15,219,5,233,235,0,0 ; pand 0xebe9(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,67,137,4,25 ; mov %ax,(%r9,%r11,1) - DB 235,166 ; jmp 1d408 <_sk_store_a8_sse2+0x4c> + DB 235,166 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c> DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp) DB 138,4,36 ; mov (%rsp),%al DB 67,136,4,25 ; mov %al,(%r9,%r11,1) - DB 235,151 ; jmp 1d408 <_sk_store_a8_sse2+0x4c> + DB 235,151 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c> PUBLIC _sk_load_g8_sse2 _sk_load_g8_sse2 LABEL PROC @@ -27826,27 +28170,27 @@ _sk_load_g8_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,49 ; jne 1d4ba <_sk_load_g8_sse2+0x49> + DB 117,49 ; jne 1da85 <_sk_load_g8_sse2+0x49> DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,5,129,235,0,0 ; pand 0xeb81(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,5,150,235,0,0 ; pand 0xeb96(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,199,236,0,0 ; mulps 0xecc7(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,5,220,236,0,0 ; mulps 0xecdc(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,190,234,0,0 ; movaps 0xeabe(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,211,234,0,0 ; movaps 0xead3(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,54 ; je 1d4fd <_sk_load_g8_sse2+0x8c> + DB 116,54 ; je 1dac8 <_sk_load_g8_sse2+0x8c> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1d4e6 <_sk_load_g8_sse2+0x75> + DB 116,21 ; je 1dab1 <_sk_load_g8_sse2+0x75> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,192 ; jne 1d497 <_sk_load_g8_sse2+0x26> + DB 117,192 ; jne 1da62 <_sk_load_g8_sse2+0x26> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -27855,10 +28199,10 @@ _sk_load_g8_sse2 LABEL PROC DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 235,154 ; jmp 1d497 <_sk_load_g8_sse2+0x26> + DB 235,154 ; jmp 1da62 <_sk_load_g8_sse2+0x26> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,143 ; jmp 1d497 <_sk_load_g8_sse2+0x26> + DB 235,143 ; jmp 1da62 <_sk_load_g8_sse2+0x26> PUBLIC _sk_load_g8_dst_sse2 _sk_load_g8_dst_sse2 LABEL PROC @@ -27869,27 +28213,27 @@ _sk_load_g8_dst_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,49 ; jne 1d551 <_sk_load_g8_dst_sse2+0x49> + DB 117,49 ; jne 1db1c <_sk_load_g8_dst_sse2+0x49> DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,37,234,234,0,0 ; pand 0xeaea(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,219,37,255,234,0,0 ; pand 0xeaff(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,48,236,0,0 ; mulps 0xec30(%rip),%xmm4 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,37,69,236,0,0 ; mulps 0xec45(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,39,234,0,0 ; movaps 0xea27(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,61,60,234,0,0 ; movaps 0xea3c(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,40,244 ; movaps %xmm4,%xmm6 DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,54 ; je 1d594 <_sk_load_g8_dst_sse2+0x8c> + DB 116,54 ; je 1db5f <_sk_load_g8_dst_sse2+0x8c> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1d57d <_sk_load_g8_dst_sse2+0x75> + DB 116,21 ; je 1db48 <_sk_load_g8_dst_sse2+0x75> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,192 ; jne 1d52e <_sk_load_g8_dst_sse2+0x26> + DB 117,192 ; jne 1daf9 <_sk_load_g8_dst_sse2+0x26> DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -27898,10 +28242,10 @@ _sk_load_g8_dst_sse2 LABEL PROC DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 235,154 ; jmp 1d52e <_sk_load_g8_dst_sse2+0x26> + DB 235,154 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26> DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 - DB 235,143 ; jmp 1d52e <_sk_load_g8_dst_sse2+0x26> + DB 235,143 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26> PUBLIC _sk_gather_g8_sse2 _sk_gather_g8_sse2 LABEL PROC @@ -27941,9 +28285,9 @@ _sk_gather_g8_sse2 LABEL PROC DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,62,235,0,0 ; mulps 0xeb3e(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 15,89,5,83,235,0,0 ; mulps 0xeb53(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,53,233,0,0 ; movaps 0xe935(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,74,233,0,0 ; movaps 0xe94a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 91 ; pop %rbx @@ -27960,42 +28304,42 @@ _sk_load_565_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,83 ; jne 1d6b3 <_sk_load_565_sse2+0x6e> + DB 117,83 ; jne 1dc7e <_sk_load_565_sse2+0x6e> DB 243,67,15,126,20,89 ; movq (%r9,%r11,2),%xmm2 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,5,14,235,0,0 ; movdqa 0xeb0e(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f> + DB 102,15,111,5,35,235,0,0 ; movdqa 0xeb23(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,16,235,0,0 ; mulps 0xeb10(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,15,111,13,24,235,0,0 ; movdqa 0xeb18(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> + DB 15,89,5,37,235,0,0 ; mulps 0xeb25(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,13,45,235,0,0 ; movdqa 0xeb2d(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,26,235,0,0 ; mulps 0xeb1a(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,15,219,21,34,235,0,0 ; pand 0xeb22(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 15,89,13,47,235,0,0 ; mulps 0xeb2f(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,15,219,21,55,235,0,0 ; pand 0xeb37(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,40,235,0,0 ; mulps 0xeb28(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> + DB 15,89,21,61,235,0,0 ; mulps 0xeb3d(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,191,232,0,0 ; movaps 0xe8bf(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,212,232,0,0 ; movaps 0xe8d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,50 ; je 1d6f2 <_sk_load_565_sse2+0xad> + DB 116,50 ; je 1dcbd <_sk_load_565_sse2+0xad> DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1d6df <_sk_load_565_sse2+0x9a> + DB 116,21 ; je 1dcaa <_sk_load_565_sse2+0x9a> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,154 ; jne 1d66a <_sk_load_565_sse2+0x25> + DB 117,154 ; jne 1dc35 <_sk_load_565_sse2+0x25> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2 DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 DB 242,15,16,208 ; movsd %xmm0,%xmm2 - DB 233,120,255,255,255 ; jmpq 1d66a <_sk_load_565_sse2+0x25> + DB 233,120,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,208 ; movd %eax,%xmm2 - DB 233,106,255,255,255 ; jmpq 1d66a <_sk_load_565_sse2+0x25> + DB 233,106,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25> PUBLIC _sk_load_565_dst_sse2 _sk_load_565_dst_sse2 LABEL PROC @@ -28007,42 +28351,42 @@ _sk_load_565_dst_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,83 ; jne 1d76e <_sk_load_565_dst_sse2+0x6e> + DB 117,83 ; jne 1dd39 <_sk_load_565_dst_sse2+0x6e> DB 243,67,15,126,52,89 ; movq (%r9,%r11,2),%xmm6 DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6 - DB 102,15,111,37,83,234,0,0 ; movdqa 0xea53(%rip),%xmm4 # 2c180 <_sk_overlay_sse2_8bit+0x105f> + DB 102,15,111,37,104,234,0,0 ; movdqa 0xea68(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053> DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,85,234,0,0 ; mulps 0xea55(%rip),%xmm4 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,15,111,45,93,234,0,0 ; movdqa 0xea5d(%rip),%xmm5 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> + DB 15,89,37,106,234,0,0 ; mulps 0xea6a(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,45,114,234,0,0 ; movdqa 0xea72(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073> DB 102,15,219,238 ; pand %xmm6,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,95,234,0,0 ; mulps 0xea5f(%rip),%xmm5 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,15,219,53,103,234,0,0 ; pand 0xea67(%rip),%xmm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 15,89,45,116,234,0,0 ; mulps 0xea74(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,15,219,53,124,234,0,0 ; pand 0xea7c(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,109,234,0,0 ; mulps 0xea6d(%rip),%xmm6 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> + DB 15,89,53,130,234,0,0 ; mulps 0xea82(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,4,232,0,0 ; movaps 0xe804(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,61,25,232,0,0 ; movaps 0xe819(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,50 ; je 1d7ad <_sk_load_565_dst_sse2+0xad> + DB 116,50 ; je 1dd78 <_sk_load_565_dst_sse2+0xad> DB 102,15,239,246 ; pxor %xmm6,%xmm6 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1d79a <_sk_load_565_dst_sse2+0x9a> + DB 116,21 ; je 1dd65 <_sk_load_565_dst_sse2+0x9a> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,154 ; jne 1d725 <_sk_load_565_dst_sse2+0x25> + DB 117,154 ; jne 1dcf0 <_sk_load_565_dst_sse2+0x25> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6 DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 DB 242,15,16,244 ; movsd %xmm4,%xmm6 - DB 233,120,255,255,255 ; jmpq 1d725 <_sk_load_565_dst_sse2+0x25> + DB 233,120,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,240 ; movd %eax,%xmm6 - DB 233,106,255,255,255 ; jmpq 1d725 <_sk_load_565_dst_sse2+0x25> + DB 233,106,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25> PUBLIC _sk_gather_565_sse2 _sk_gather_565_sse2 LABEL PROC @@ -28075,19 +28419,19 @@ _sk_gather_565_sse2 LABEL PROC DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,5,63,233,0,0 ; movdqa 0xe93f(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f> + DB 102,15,111,5,84,233,0,0 ; movdqa 0xe954(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,65,233,0,0 ; mulps 0xe941(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f> - DB 102,15,111,13,73,233,0,0 ; movdqa 0xe949(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f> + DB 15,89,5,86,233,0,0 ; mulps 0xe956(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063> + DB 102,15,111,13,94,233,0,0 ; movdqa 0xe95e(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,75,233,0,0 ; mulps 0xe94b(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f> - DB 102,15,219,21,83,233,0,0 ; pand 0xe953(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f> + DB 15,89,13,96,233,0,0 ; mulps 0xe960(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083> + DB 102,15,219,21,104,233,0,0 ; pand 0xe968(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,89,233,0,0 ; mulps 0xe959(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af> + DB 15,89,21,110,233,0,0 ; mulps 0xe96e(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,240,230,0,0 ; movaps 0xe6f0(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,5,231,0,0 ; movaps 0xe705(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -28100,12 +28444,12 @@ _sk_store_565_sse2 LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 - DB 68,15,40,5,239,234,0,0 ; movaps 0xeaef(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0x126f> + DB 68,15,40,5,4,235,0,0 ; movaps 0xeb04(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9 - DB 68,15,40,21,228,234,0,0 ; movaps 0xeae4(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x127f> + DB 68,15,40,21,249,234,0,0 ; movaps 0xeaf9(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273> DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10 DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10 @@ -28117,7 +28461,7 @@ _sk_store_565_sse2 LABEL PROC DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8 DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 1d8fe <_sk_store_565_sse2+0x7b> + DB 117,10 ; jne 1dec9 <_sk_store_565_sse2+0x7b> DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -28125,19 +28469,19 @@ _sk_store_565_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,38 ; je 1d936 <_sk_store_565_sse2+0xb3> + DB 116,38 ; je 1df01 <_sk_store_565_sse2+0xb3> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,18 ; je 1d928 <_sk_store_565_sse2+0xa5> + DB 116,18 ; je 1def3 <_sk_store_565_sse2+0xa5> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,222 ; jne 1d8fa <_sk_store_565_sse2+0x77> + DB 117,222 ; jne 1dec5 <_sk_store_565_sse2+0x77> DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2) - DB 235,196 ; jmp 1d8fa <_sk_store_565_sse2+0x77> + DB 235,196 ; jmp 1dec5 <_sk_store_565_sse2+0x77> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2) - DB 235,184 ; jmp 1d8fa <_sk_store_565_sse2+0x77> + DB 235,184 ; jmp 1dec5 <_sk_store_565_sse2+0x77> PUBLIC _sk_load_4444_sse2 _sk_load_4444_sse2 LABEL PROC @@ -28149,45 +28493,45 @@ _sk_load_4444_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 1d9bf <_sk_load_4444_sse2+0x7d> + DB 117,98 ; jne 1df8a <_sk_load_4444_sse2+0x7d> DB 243,67,15,126,28,89 ; movq (%r9,%r11,2),%xmm3 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,5,65,234,0,0 ; movdqa 0xea41(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f> + DB 102,15,111,5,86,234,0,0 ; movdqa 0xea56(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,67,234,0,0 ; mulps 0xea43(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f> - DB 102,15,111,13,75,234,0,0 ; movdqa 0xea4b(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af> + DB 15,89,5,88,234,0,0 ; mulps 0xea58(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293> + DB 102,15,111,13,96,234,0,0 ; movdqa 0xea60(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,77,234,0,0 ; mulps 0xea4d(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf> - DB 102,15,111,21,85,234,0,0 ; movdqa 0xea55(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf> + DB 15,89,13,98,234,0,0 ; mulps 0xea62(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3> + DB 102,15,111,21,106,234,0,0 ; movdqa 0xea6a(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,87,234,0,0 ; mulps 0xea57(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df> - DB 102,15,219,29,95,234,0,0 ; pand 0xea5f(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef> + DB 15,89,21,108,234,0,0 ; mulps 0xea6c(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3> + DB 102,15,219,29,116,234,0,0 ; pand 0xea74(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,101,234,0,0 ; mulps 0xea65(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff> + DB 15,89,29,122,234,0,0 ; mulps 0xea7a(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,50 ; je 1d9fe <_sk_load_4444_sse2+0xbc> + DB 116,50 ; je 1dfc9 <_sk_load_4444_sse2+0xbc> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1d9eb <_sk_load_4444_sse2+0xa9> + DB 116,21 ; je 1dfb6 <_sk_load_4444_sse2+0xa9> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,139 ; jne 1d967 <_sk_load_4444_sse2+0x25> + DB 117,139 ; jne 1df32 <_sk_load_4444_sse2+0x25> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 DB 242,15,16,216 ; movsd %xmm0,%xmm3 - DB 233,105,255,255,255 ; jmpq 1d967 <_sk_load_4444_sse2+0x25> + DB 233,105,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,216 ; movd %eax,%xmm3 - DB 233,91,255,255,255 ; jmpq 1d967 <_sk_load_4444_sse2+0x25> + DB 233,91,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25> PUBLIC _sk_load_4444_dst_sse2 _sk_load_4444_dst_sse2 LABEL PROC @@ -28199,45 +28543,45 @@ _sk_load_4444_dst_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 1da89 <_sk_load_4444_dst_sse2+0x7d> + DB 117,98 ; jne 1e054 <_sk_load_4444_dst_sse2+0x7d> DB 243,67,15,126,60,89 ; movq (%r9,%r11,2),%xmm7 DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7 - DB 102,15,111,37,119,233,0,0 ; movdqa 0xe977(%rip),%xmm4 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f> + DB 102,15,111,37,140,233,0,0 ; movdqa 0xe98c(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,121,233,0,0 ; mulps 0xe979(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f> - DB 102,15,111,45,129,233,0,0 ; movdqa 0xe981(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af> + DB 15,89,37,142,233,0,0 ; mulps 0xe98e(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293> + DB 102,15,111,45,150,233,0,0 ; movdqa 0xe996(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3> DB 102,15,219,239 ; pand %xmm7,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,131,233,0,0 ; mulps 0xe983(%rip),%xmm5 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf> - DB 102,15,111,53,139,233,0,0 ; movdqa 0xe98b(%rip),%xmm6 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf> + DB 15,89,45,152,233,0,0 ; mulps 0xe998(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3> + DB 102,15,111,53,160,233,0,0 ; movdqa 0xe9a0(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3> DB 102,15,219,247 ; pand %xmm7,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,141,233,0,0 ; mulps 0xe98d(%rip),%xmm6 # 2c400 <_sk_overlay_sse2_8bit+0x12df> - DB 102,15,219,61,149,233,0,0 ; pand 0xe995(%rip),%xmm7 # 2c410 <_sk_overlay_sse2_8bit+0x12ef> + DB 15,89,53,162,233,0,0 ; mulps 0xe9a2(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3> + DB 102,15,219,61,170,233,0,0 ; pand 0xe9aa(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3> DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 - DB 15,89,61,155,233,0,0 ; mulps 0xe99b(%rip),%xmm7 # 2c420 <_sk_overlay_sse2_8bit+0x12ff> + DB 15,89,61,176,233,0,0 ; mulps 0xe9b0(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,50 ; je 1dac8 <_sk_load_4444_dst_sse2+0xbc> + DB 116,50 ; je 1e093 <_sk_load_4444_dst_sse2+0xbc> DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,21 ; je 1dab5 <_sk_load_4444_dst_sse2+0xa9> + DB 116,21 ; je 1e080 <_sk_load_4444_dst_sse2+0xa9> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,139 ; jne 1da31 <_sk_load_4444_dst_sse2+0x25> + DB 117,139 ; jne 1dffc <_sk_load_4444_dst_sse2+0x25> DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7 DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 DB 242,15,16,252 ; movsd %xmm4,%xmm7 - DB 233,105,255,255,255 ; jmpq 1da31 <_sk_load_4444_dst_sse2+0x25> + DB 233,105,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25> DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 102,15,110,248 ; movd %eax,%xmm7 - DB 233,91,255,255,255 ; jmpq 1da31 <_sk_load_4444_dst_sse2+0x25> + DB 233,91,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25> PUBLIC _sk_gather_4444_sse2 _sk_gather_4444_sse2 LABEL PROC @@ -28270,21 +28614,21 @@ _sk_gather_4444_sse2 LABEL PROC DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,5,84,232,0,0 ; movdqa 0xe854(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f> + DB 102,15,111,5,105,232,0,0 ; movdqa 0xe869(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,86,232,0,0 ; mulps 0xe856(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f> - DB 102,15,111,13,94,232,0,0 ; movdqa 0xe85e(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af> + DB 15,89,5,107,232,0,0 ; mulps 0xe86b(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293> + DB 102,15,111,13,115,232,0,0 ; movdqa 0xe873(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,96,232,0,0 ; mulps 0xe860(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf> - DB 102,15,111,21,104,232,0,0 ; movdqa 0xe868(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf> + DB 15,89,13,117,232,0,0 ; mulps 0xe875(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3> + DB 102,15,111,21,125,232,0,0 ; movdqa 0xe87d(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,106,232,0,0 ; mulps 0xe86a(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df> - DB 102,15,219,29,114,232,0,0 ; pand 0xe872(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef> + DB 15,89,21,127,232,0,0 ; mulps 0xe87f(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3> + DB 102,15,219,29,135,232,0,0 ; pand 0xe887(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,120,232,0,0 ; mulps 0xe878(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff> + DB 15,89,29,141,232,0,0 ; mulps 0xe88d(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -28298,7 +28642,7 @@ _sk_store_4444_sse2 LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 76,99,218 ; movslq %edx,%r11 - DB 68,15,40,5,101,232,0,0 ; movaps 0xe865(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x130f> + DB 68,15,40,5,122,232,0,0 ; movaps 0xe87a(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -28320,7 +28664,7 @@ _sk_store_4444_sse2 LABEL PROC DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8 DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 1dc3c <_sk_store_4444_sse2+0x8f> + DB 117,10 ; jne 1e207 <_sk_store_4444_sse2+0x8f> DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -28328,19 +28672,19 @@ _sk_store_4444_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,38 ; je 1dc74 <_sk_store_4444_sse2+0xc7> + DB 116,38 ; je 1e23f <_sk_store_4444_sse2+0xc7> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,18 ; je 1dc66 <_sk_store_4444_sse2+0xb9> + DB 116,18 ; je 1e231 <_sk_store_4444_sse2+0xb9> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,222 ; jne 1dc38 <_sk_store_4444_sse2+0x8b> + DB 117,222 ; jne 1e203 <_sk_store_4444_sse2+0x8b> DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2) - DB 235,196 ; jmp 1dc38 <_sk_store_4444_sse2+0x8b> + DB 235,196 ; jmp 1e203 <_sk_store_4444_sse2+0x8b> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2) - DB 235,184 ; jmp 1dc38 <_sk_store_4444_sse2+0x8b> + DB 235,184 ; jmp 1e203 <_sk_store_4444_sse2+0x8b> PUBLIC _sk_load_8888_sse2 _sk_load_8888_sse2 LABEL PROC @@ -28352,13 +28696,13 @@ _sk_load_8888_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 1dcfe <_sk_load_8888_sse2+0x7e> + DB 117,98 ; jne 1e2c9 <_sk_load_8888_sse2+0x7e> DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9 - DB 102,15,111,21,118,227,0,0 ; movdqa 0xe376(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,21,139,227,0,0 ; movdqa 0xe38b(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,178,228,0,0 ; movaps 0xe4b2(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,199,228,0,0 ; movaps 0xe4c7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -28378,18 +28722,18 @@ _sk_load_8888_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,41 ; je 1dd34 <_sk_load_8888_sse2+0xb4> + DB 116,41 ; je 1e2ff <_sk_load_8888_sse2+0xb4> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,19 ; je 1dd29 <_sk_load_8888_sse2+0xa9> + DB 116,19 ; je 1e2f4 <_sk_load_8888_sse2+0xa9> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,134 ; jne 1dca2 <_sk_load_8888_sse2+0x22> + DB 117,134 ; jne 1e26d <_sk_load_8888_sse2+0x22> DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0 DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9 DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9 - DB 233,110,255,255,255 ; jmpq 1dca2 <_sk_load_8888_sse2+0x22> + DB 233,110,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22> DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9 - DB 233,99,255,255,255 ; jmpq 1dca2 <_sk_load_8888_sse2+0x22> + DB 233,99,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22> PUBLIC _sk_load_8888_dst_sse2 _sk_load_8888_dst_sse2 LABEL PROC @@ -28401,13 +28745,13 @@ _sk_load_8888_dst_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 1ddbd <_sk_load_8888_dst_sse2+0x7e> + DB 117,98 ; jne 1e388 <_sk_load_8888_dst_sse2+0x7e> DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9 - DB 102,15,111,53,183,226,0,0 ; movdqa 0xe2b7(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,53,204,226,0,0 ; movdqa 0xe2cc(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4 DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 68,15,40,5,243,227,0,0 ; movaps 0xe3f3(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,8,228,0,0 ; movaps 0xe408(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,224 ; mulps %xmm8,%xmm4 DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5 DB 102,15,114,213,8 ; psrld $0x8,%xmm5 @@ -28427,18 +28771,18 @@ _sk_load_8888_dst_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,41 ; je 1ddf3 <_sk_load_8888_dst_sse2+0xb4> + DB 116,41 ; je 1e3be <_sk_load_8888_dst_sse2+0xb4> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,19 ; je 1dde8 <_sk_load_8888_dst_sse2+0xa9> + DB 116,19 ; je 1e3b3 <_sk_load_8888_dst_sse2+0xa9> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,134 ; jne 1dd61 <_sk_load_8888_dst_sse2+0x22> + DB 117,134 ; jne 1e32c <_sk_load_8888_dst_sse2+0x22> DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4 DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9 DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9 - DB 233,110,255,255,255 ; jmpq 1dd61 <_sk_load_8888_dst_sse2+0x22> + DB 233,110,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22> DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9 - DB 233,99,255,255,255 ; jmpq 1dd61 <_sk_load_8888_dst_sse2+0x22> + DB 233,99,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22> PUBLIC _sk_gather_8888_sse2 _sk_gather_8888_sse2 LABEL PROC @@ -28470,11 +28814,11 @@ _sk_gather_8888_sse2 LABEL PROC DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1 DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9 DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9 - DB 102,15,111,21,160,225,0,0 ; movdqa 0xe1a0(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,21,181,225,0,0 ; movdqa 0xe1b5(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,220,226,0,0 ; movaps 0xe2dc(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,241,226,0,0 ; movaps 0xe2f1(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -28502,7 +28846,7 @@ _sk_store_8888_sse2 LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 68,15,40,5,92,225,0,0 ; movaps 0xe15c(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,113,225,0,0 ; movaps 0xe171(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -28521,24 +28865,24 @@ _sk_store_8888_sse2 LABEL PROC DB 102,69,15,235,193 ; por %xmm9,%xmm8 DB 102,69,15,235,194 ; por %xmm10,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 1df54 <_sk_store_8888_sse2+0x7f> + DB 117,10 ; jne 1e51f <_sk_store_8888_sse2+0x7f> DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,33 ; je 1df82 <_sk_store_8888_sse2+0xad> + DB 116,33 ; je 1e54d <_sk_store_8888_sse2+0xad> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,19 ; je 1df7a <_sk_store_8888_sse2+0xa5> + DB 116,19 ; je 1e545 <_sk_store_8888_sse2+0xa5> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,227 ; jne 1df50 <_sk_store_8888_sse2+0x7b> + DB 117,227 ; jne 1e51b <_sk_store_8888_sse2+0x7b> DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9 DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4) DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4) - DB 235,206 ; jmp 1df50 <_sk_store_8888_sse2+0x7b> + DB 235,206 ; jmp 1e51b <_sk_store_8888_sse2+0x7b> DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4) - DB 235,198 ; jmp 1df50 <_sk_store_8888_sse2+0x7b> + DB 235,198 ; jmp 1e51b <_sk_store_8888_sse2+0x7b> PUBLIC _sk_load_bgra_sse2 _sk_load_bgra_sse2 LABEL PROC @@ -28550,13 +28894,13 @@ _sk_load_bgra_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 1e008 <_sk_load_bgra_sse2+0x7e> + DB 117,98 ; jne 1e5d3 <_sk_load_bgra_sse2+0x7e> DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9 - DB 102,15,111,5,108,224,0,0 ; movdqa 0xe06c(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,5,129,224,0,0 ; movdqa 0xe081(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,219,200 ; pand %xmm0,%xmm1 DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2 - DB 68,15,40,5,168,225,0,0 ; movaps 0xe1a8(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,189,225,0,0 ; movaps 0xe1bd(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -28576,18 +28920,18 @@ _sk_load_bgra_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,41 ; je 1e03e <_sk_load_bgra_sse2+0xb4> + DB 116,41 ; je 1e609 <_sk_load_bgra_sse2+0xb4> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,19 ; je 1e033 <_sk_load_bgra_sse2+0xa9> + DB 116,19 ; je 1e5fe <_sk_load_bgra_sse2+0xa9> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,134 ; jne 1dfac <_sk_load_bgra_sse2+0x22> + DB 117,134 ; jne 1e577 <_sk_load_bgra_sse2+0x22> DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0 DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9 DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9 - DB 233,110,255,255,255 ; jmpq 1dfac <_sk_load_bgra_sse2+0x22> + DB 233,110,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22> DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9 - DB 233,99,255,255,255 ; jmpq 1dfac <_sk_load_bgra_sse2+0x22> + DB 233,99,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22> PUBLIC _sk_load_bgra_dst_sse2 _sk_load_bgra_dst_sse2 LABEL PROC @@ -28599,13 +28943,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 1e0c7 <_sk_load_bgra_dst_sse2+0x7e> + DB 117,98 ; jne 1e692 <_sk_load_bgra_dst_sse2+0x7e> DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9 - DB 102,15,111,37,173,223,0,0 ; movdqa 0xdfad(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,37,194,223,0,0 ; movdqa 0xdfc2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6 - DB 68,15,40,5,233,224,0,0 ; movaps 0xe0e9(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,254,224,0,0 ; movaps 0xe0fe(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,240 ; mulps %xmm8,%xmm6 DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5 DB 102,15,114,213,8 ; psrld $0x8,%xmm5 @@ -28625,18 +28969,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,41 ; je 1e0fd <_sk_load_bgra_dst_sse2+0xb4> + DB 116,41 ; je 1e6c8 <_sk_load_bgra_dst_sse2+0xb4> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,19 ; je 1e0f2 <_sk_load_bgra_dst_sse2+0xa9> + DB 116,19 ; je 1e6bd <_sk_load_bgra_dst_sse2+0xa9> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,134 ; jne 1e06b <_sk_load_bgra_dst_sse2+0x22> + DB 117,134 ; jne 1e636 <_sk_load_bgra_dst_sse2+0x22> DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4 DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9 DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9 - DB 233,110,255,255,255 ; jmpq 1e06b <_sk_load_bgra_dst_sse2+0x22> + DB 233,110,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22> DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9 - DB 233,99,255,255,255 ; jmpq 1e06b <_sk_load_bgra_dst_sse2+0x22> + DB 233,99,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22> PUBLIC _sk_gather_bgra_sse2 _sk_gather_bgra_sse2 LABEL PROC @@ -28668,11 +29012,11 @@ _sk_gather_bgra_sse2 LABEL PROC DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1 DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9 DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9 - DB 102,15,111,5,150,222,0,0 ; movdqa 0xde96(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff> + DB 102,15,111,5,171,222,0,0 ; movdqa 0xdeab(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3> DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,219,200 ; pand %xmm0,%xmm1 DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2 - DB 68,15,40,5,210,223,0,0 ; movaps 0xdfd2(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f> + DB 68,15,40,5,231,223,0,0 ; movaps 0xdfe7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -28700,7 +29044,7 @@ _sk_store_bgra_sse2 LABEL PROC DB 73,193,225,2 ; shl $0x2,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 68,15,40,5,82,222,0,0 ; movaps 0xde52(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f> + DB 68,15,40,5,103,222,0,0 ; movaps 0xde67(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23> DB 68,15,40,202 ; movaps %xmm2,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -28719,24 +29063,24 @@ _sk_store_bgra_sse2 LABEL PROC DB 102,69,15,235,193 ; por %xmm9,%xmm8 DB 102,69,15,235,194 ; por %xmm10,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 1e25e <_sk_store_bgra_sse2+0x7f> + DB 117,10 ; jne 1e829 <_sk_store_bgra_sse2+0x7f> DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,33 ; je 1e28c <_sk_store_bgra_sse2+0xad> + DB 116,33 ; je 1e857 <_sk_store_bgra_sse2+0xad> DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,19 ; je 1e284 <_sk_store_bgra_sse2+0xa5> + DB 116,19 ; je 1e84f <_sk_store_bgra_sse2+0xa5> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 117,227 ; jne 1e25a <_sk_store_bgra_sse2+0x7b> + DB 117,227 ; jne 1e825 <_sk_store_bgra_sse2+0x7b> DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9 DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4) DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4) - DB 235,206 ; jmp 1e25a <_sk_store_bgra_sse2+0x7b> + DB 235,206 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b> DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4) - DB 235,198 ; jmp 1e25a <_sk_store_bgra_sse2+0x7b> + DB 235,198 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b> PUBLIC _sk_load_f16_sse2 _sk_load_f16_sse2 LABEL PROC @@ -28748,7 +29092,7 @@ _sk_load_f16_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,98,1,0,0 ; jne 1e416 <_sk_load_f16_sse2+0x182> + DB 15,133,98,1,0,0 ; jne 1e9e1 <_sk_load_f16_sse2+0x182> DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0 DB 102,65,15,16,76,193,16 ; movupd 0x10(%r9,%rax,8),%xmm1 DB 102,68,15,40,192 ; movapd %xmm0,%xmm8 @@ -28760,7 +29104,7 @@ _sk_load_f16_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1 DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1 - DB 102,68,15,111,13,74,225,0,0 ; movdqa 0xe14a(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f> + DB 102,68,15,111,13,95,225,0,0 ; movdqa 0xe15f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,193 ; pand %xmm9,%xmm0 DB 102,15,239,200 ; pxor %xmm0,%xmm1 @@ -28768,11 +29112,11 @@ _sk_load_f16_sse2 LABEL PROC DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,232 ; por %xmm0,%xmm13 - DB 102,68,15,111,29,63,225,0,0 ; movdqa 0xe13f(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f> + DB 102,68,15,111,29,84,225,0,0 ; movdqa 0xe154(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,65,225,0,0 ; movdqa 0xe141(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f> + DB 102,68,15,111,37,86,225,0,0 ; movdqa 0xe156(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> DB 102,65,15,239,204 ; pxor %xmm12,%xmm1 - DB 102,15,111,29,228,226,0,0 ; movdqa 0xe2e4(%rip),%xmm3 # 2c620 <_sk_overlay_sse2_8bit+0x14ff> + DB 102,15,111,29,249,226,0,0 ; movdqa 0xe2f9(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3> DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0 DB 102,65,15,223,197 ; pandn %xmm13,%xmm0 @@ -28820,17 +29164,17 @@ _sk_load_f16_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,17 ; jne 1e433 <_sk_load_f16_sse2+0x19f> + DB 117,17 ; jne 1e9fe <_sk_load_f16_sse2+0x19f> DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 - DB 233,142,254,255,255 ; jmpq 1e2c1 <_sk_load_f16_sse2+0x2d> + DB 233,142,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d> DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,121,254,255,255 ; jb 1e2c1 <_sk_load_f16_sse2+0x2d> + DB 15,130,121,254,255,255 ; jb 1e88c <_sk_load_f16_sse2+0x2d> DB 242,65,15,16,76,193,16 ; movsd 0x10(%r9,%rax,8),%xmm1 - DB 233,109,254,255,255 ; jmpq 1e2c1 <_sk_load_f16_sse2+0x2d> + DB 233,109,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d> PUBLIC _sk_load_f16_dst_sse2 _sk_load_f16_dst_sse2 LABEL PROC @@ -28842,7 +29186,7 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,98,1,0,0 ; jne 1e5d6 <_sk_load_f16_dst_sse2+0x182> + DB 15,133,98,1,0,0 ; jne 1eba1 <_sk_load_f16_dst_sse2+0x182> DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4 DB 102,65,15,16,108,193,16 ; movupd 0x10(%r9,%rax,8),%xmm5 DB 102,68,15,40,196 ; movapd %xmm4,%xmm8 @@ -28854,7 +29198,7 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5 DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5 - DB 102,68,15,111,13,138,223,0,0 ; movdqa 0xdf8a(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f> + DB 102,68,15,111,13,159,223,0,0 ; movdqa 0xdf9f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313> DB 102,15,111,229 ; movdqa %xmm5,%xmm4 DB 102,65,15,219,225 ; pand %xmm9,%xmm4 DB 102,15,239,236 ; pxor %xmm4,%xmm5 @@ -28862,11 +29206,11 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,236 ; por %xmm4,%xmm13 - DB 102,68,15,111,29,127,223,0,0 ; movdqa 0xdf7f(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f> + DB 102,68,15,111,29,148,223,0,0 ; movdqa 0xdf94(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,129,223,0,0 ; movdqa 0xdf81(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f> + DB 102,68,15,111,37,150,223,0,0 ; movdqa 0xdf96(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> DB 102,65,15,239,236 ; pxor %xmm12,%xmm5 - DB 102,15,111,61,36,225,0,0 ; movdqa 0xe124(%rip),%xmm7 # 2c620 <_sk_overlay_sse2_8bit+0x14ff> + DB 102,15,111,61,57,225,0,0 ; movdqa 0xe139(%rip),%xmm7 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3> DB 102,15,111,231 ; movdqa %xmm7,%xmm4 DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4 DB 102,65,15,223,229 ; pandn %xmm13,%xmm4 @@ -28914,17 +29258,17 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,17 ; jne 1e5f3 <_sk_load_f16_dst_sse2+0x19f> + DB 117,17 ; jne 1ebbe <_sk_load_f16_dst_sse2+0x19f> DB 102,15,87,237 ; xorpd %xmm5,%xmm5 DB 102,15,20,229 ; unpcklpd %xmm5,%xmm4 DB 102,15,87,237 ; xorpd %xmm5,%xmm5 - DB 233,142,254,255,255 ; jmpq 1e481 <_sk_load_f16_dst_sse2+0x2d> + DB 233,142,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d> DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4 DB 102,15,87,237 ; xorpd %xmm5,%xmm5 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,121,254,255,255 ; jb 1e481 <_sk_load_f16_dst_sse2+0x2d> + DB 15,130,121,254,255,255 ; jb 1ea4c <_sk_load_f16_dst_sse2+0x2d> DB 242,65,15,16,108,193,16 ; movsd 0x10(%r9,%rax,8),%xmm5 - DB 233,109,254,255,255 ; jmpq 1e481 <_sk_load_f16_dst_sse2+0x2d> + DB 233,109,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d> PUBLIC _sk_gather_f16_sse2 _sk_gather_f16_sse2 LABEL PROC @@ -28964,7 +29308,7 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1 DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1 - DB 102,68,15,111,13,131,221,0,0 ; movdqa 0xdd83(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f> + DB 102,68,15,111,13,152,221,0,0 ; movdqa 0xdd98(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,193 ; pand %xmm9,%xmm0 DB 102,15,239,200 ; pxor %xmm0,%xmm1 @@ -28972,11 +29316,11 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,232 ; por %xmm0,%xmm13 - DB 102,68,15,111,29,120,221,0,0 ; movdqa 0xdd78(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f> + DB 102,68,15,111,29,141,221,0,0 ; movdqa 0xdd8d(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,122,221,0,0 ; movdqa 0xdd7a(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f> + DB 102,68,15,111,37,143,221,0,0 ; movdqa 0xdd8f(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> DB 102,65,15,239,204 ; pxor %xmm12,%xmm1 - DB 102,15,111,29,29,223,0,0 ; movdqa 0xdf1d(%rip),%xmm3 # 2c620 <_sk_overlay_sse2_8bit+0x14ff> + DB 102,15,111,29,50,223,0,0 ; movdqa 0xdf32(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3> DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0 DB 102,65,15,223,197 ; pandn %xmm13,%xmm0 @@ -29033,17 +29377,17 @@ _sk_store_f16_sse2 LABEL PROC DB 73,193,225,3 ; shl $0x3,%r9 DB 76,3,8 ; add (%rax),%r9 DB 72,99,194 ; movslq %edx,%rax - DB 102,68,15,111,21,114,220,0,0 ; movdqa 0xdc72(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x134f> + DB 102,68,15,111,21,135,220,0,0 ; movdqa 0xdc87(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12 DB 102,69,15,219,226 ; pand %xmm10,%xmm12 DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13 DB 102,69,15,239,236 ; pxor %xmm12,%xmm13 - DB 102,68,15,111,13,101,220,0,0 ; movdqa 0xdc65(%rip),%xmm9 # 2c480 <_sk_overlay_sse2_8bit+0x135f> + DB 102,68,15,111,13,122,220,0,0 ; movdqa 0xdc7a(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353> DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12 DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8 DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8 DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13 - DB 102,68,15,111,29,86,220,0,0 ; movdqa 0xdc56(%rip),%xmm11 # 2c490 <_sk_overlay_sse2_8bit+0x136f> + DB 102,68,15,111,29,107,220,0,0 ; movdqa 0xdc6b(%rip),%xmm11 # 2ca70 <_sk_overlay_sse2_8bit+0x1363> DB 102,69,15,235,227 ; por %xmm11,%xmm12 DB 102,69,15,254,229 ; paddd %xmm13,%xmm12 DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12 @@ -29095,7 +29439,7 @@ _sk_store_f16_sse2 LABEL PROC DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9 DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 1e95c <_sk_store_f16_sse2+0x17e> + DB 117,21 ; jne 1ef27 <_sk_store_f16_sse2+0x17e> DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8) DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8 DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8) @@ -29103,13 +29447,13 @@ _sk_store_f16_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 1e958 <_sk_store_f16_sse2+0x17a> + DB 116,240 ; je 1ef23 <_sk_store_f16_sse2+0x17a> DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 1e958 <_sk_store_f16_sse2+0x17a> + DB 114,227 ; jb 1ef23 <_sk_store_f16_sse2+0x17a> DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8 DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8) - DB 235,213 ; jmp 1e958 <_sk_store_f16_sse2+0x17a> + DB 235,213 ; jmp 1ef23 <_sk_store_f16_sse2+0x17a> PUBLIC _sk_load_u16_be_sse2 _sk_load_u16_be_sse2 LABEL PROC @@ -29122,7 +29466,7 @@ _sk_load_u16_be_sse2 LABEL PROC DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,190,0,0,0 ; jne 1ea68 <_sk_load_u16_be_sse2+0xe5> + DB 15,133,190,0,0,0 ; jne 1f033 <_sk_load_u16_be_sse2+0xe5> DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0 DB 102,65,15,16,76,65,16 ; movupd 0x10(%r9,%rax,2),%xmm1 DB 102,15,40,208 ; movapd %xmm0,%xmm2 @@ -29139,7 +29483,7 @@ _sk_load_u16_be_sse2 LABEL PROC DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 68,15,40,5,5,216,0,0 ; movaps 0xd805(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df> + DB 68,15,40,5,26,216,0,0 ; movaps 0xd81a(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -29167,17 +29511,17 @@ _sk_load_u16_be_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,17 ; jne 1ea85 <_sk_load_u16_be_sse2+0x102> + DB 117,17 ; jne 1f050 <_sk_load_u16_be_sse2+0x102> DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 - DB 233,50,255,255,255 ; jmpq 1e9b7 <_sk_load_u16_be_sse2+0x34> + DB 233,50,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34> DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,29,255,255,255 ; jb 1e9b7 <_sk_load_u16_be_sse2+0x34> + DB 15,130,29,255,255,255 ; jb 1ef82 <_sk_load_u16_be_sse2+0x34> DB 242,65,15,16,76,65,16 ; movsd 0x10(%r9,%rax,2),%xmm1 - DB 233,17,255,255,255 ; jmpq 1e9b7 <_sk_load_u16_be_sse2+0x34> + DB 233,17,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34> PUBLIC _sk_load_rgb_u16_be_sse2 _sk_load_rgb_u16_be_sse2 LABEL PROC @@ -29192,7 +29536,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 72,141,4,64 ; lea (%rax,%rax,2),%rax DB 72,193,248,32 ; sar $0x20,%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,175,0,0,0 ; jne 1eb80 <_sk_load_rgb_u16_be_sse2+0xda> + DB 15,133,175,0,0,0 ; jne 1f14b <_sk_load_rgb_u16_be_sse2+0xda> DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2 DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3 DB 102,15,115,219,4 ; psrldq $0x4,%xmm3 @@ -29213,7 +29557,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 68,15,40,13,203,214,0,0 ; movaps 0xd6cb(%rip),%xmm9 # 2c200 <_sk_overlay_sse2_8bit+0x10df> + DB 68,15,40,13,224,214,0,0 ; movaps 0xd6e0(%rip),%xmm9 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -29230,27 +29574,27 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,242,211,0,0 ; movaps 0xd3f2(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,7,212,0,0 ; movaps 0xd407(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 255,224 ; jmpq *%rax DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2 DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 1eba5 <_sk_load_rgb_u16_be_sse2+0xff> + DB 117,13 ; jne 1f170 <_sk_load_rgb_u16_be_sse2+0xff> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,80,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f> + DB 233,80,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f> DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0 DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 1ebd6 <_sk_load_rgb_u16_be_sse2+0x130> + DB 114,24 ; jb 1f1a1 <_sk_load_rgb_u16_be_sse2+0x130> DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3 DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,31,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f> + DB 233,31,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f> DB 102,15,239,219 ; pxor %xmm3,%xmm3 - DB 233,22,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f> + DB 233,22,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f> PUBLIC _sk_store_u16_be_sse2 _sk_store_u16_be_sse2 LABEL PROC @@ -29262,7 +29606,7 @@ _sk_store_u16_be_sse2 LABEL PROC DB 77,1,201 ; add %r9,%r9 DB 76,3,8 ; add (%rax),%r9 DB 73,99,194 ; movslq %r10d,%rax - DB 68,15,40,21,155,216,0,0 ; movaps 0xd89b(%rip),%xmm10 # 2c4a0 <_sk_overlay_sse2_8bit+0x137f> + DB 68,15,40,21,176,216,0,0 ; movaps 0xd8b0(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 @@ -29307,7 +29651,7 @@ _sk_store_u16_be_sse2 LABEL PROC DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10 DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 1ecff <_sk_store_u16_be_sse2+0x120> + DB 117,21 ; jne 1f2ca <_sk_store_u16_be_sse2+0x120> DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2) DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2) @@ -29315,13 +29659,13 @@ _sk_store_u16_be_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 1ecfb <_sk_store_u16_be_sse2+0x11c> + DB 116,240 ; je 1f2c6 <_sk_store_u16_be_sse2+0x11c> DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 1ecfb <_sk_store_u16_be_sse2+0x11c> + DB 114,227 ; jb 1f2c6 <_sk_store_u16_be_sse2+0x11c> DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2) - DB 235,213 ; jmp 1ecfb <_sk_store_u16_be_sse2+0x11c> + DB 235,213 ; jmp 1f2c6 <_sk_store_u16_be_sse2+0x11c> PUBLIC _sk_load_f32_sse2 _sk_load_f32_sse2 LABEL PROC @@ -29335,7 +29679,7 @@ _sk_load_f32_sse2 LABEL PROC DB 73,99,194 ; movslq %r10d,%rax DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 1ed91 <_sk_load_f32_sse2+0x6b> + DB 117,66 ; jne 1f35c <_sk_load_f32_sse2+0x6b> DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0 DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3 DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9 @@ -29355,17 +29699,17 @@ _sk_load_f32_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 69,15,87,201 ; xorps %xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,8 ; jne 1eda3 <_sk_load_f32_sse2+0x7d> + DB 117,8 ; jne 1f36e <_sk_load_f32_sse2+0x7d> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 235,190 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b> + DB 235,190 ; jmp 1f32c <_sk_load_f32_sse2+0x3b> DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,8 ; jb 1edb7 <_sk_load_f32_sse2+0x91> + DB 114,8 ; jb 1f382 <_sk_load_f32_sse2+0x91> DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3 - DB 235,170 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b> + DB 235,170 ; jmp 1f32c <_sk_load_f32_sse2+0x3b> DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 235,165 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b> + DB 235,165 ; jmp 1f32c <_sk_load_f32_sse2+0x3b> PUBLIC _sk_load_f32_dst_sse2 _sk_load_f32_dst_sse2 LABEL PROC @@ -29379,7 +29723,7 @@ _sk_load_f32_dst_sse2 LABEL PROC DB 73,99,194 ; movslq %r10d,%rax DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 1ee27 <_sk_load_f32_dst_sse2+0x6b> + DB 117,66 ; jne 1f3f2 <_sk_load_f32_dst_sse2+0x6b> DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4 DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7 DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9 @@ -29399,17 +29743,17 @@ _sk_load_f32_dst_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 69,15,87,201 ; xorps %xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,8 ; jne 1ee39 <_sk_load_f32_dst_sse2+0x7d> + DB 117,8 ; jne 1f404 <_sk_load_f32_dst_sse2+0x7d> DB 15,87,255 ; xorps %xmm7,%xmm7 DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 235,190 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b> + DB 235,190 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b> DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,8 ; jb 1ee4d <_sk_load_f32_dst_sse2+0x91> + DB 114,8 ; jb 1f418 <_sk_load_f32_dst_sse2+0x91> DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7 - DB 235,170 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b> + DB 235,170 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b> DB 15,87,255 ; xorps %xmm7,%xmm7 - DB 235,165 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b> + DB 235,165 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b> PUBLIC _sk_store_f32_sse2 _sk_store_f32_sse2 LABEL PROC @@ -29436,7 +29780,7 @@ _sk_store_f32_sse2 LABEL PROC DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9 DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4) DB 77,133,192 ; test %r8,%r8 - DB 117,29 ; jne 1eecf <_sk_store_f32_sse2+0x7d> + DB 117,29 ; jne 1f49a <_sk_store_f32_sse2+0x7d> DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10 DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4) DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4) @@ -29444,12 +29788,12 @@ _sk_store_f32_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,246 ; je 1eecb <_sk_store_f32_sse2+0x79> + DB 116,246 ; je 1f496 <_sk_store_f32_sse2+0x79> DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,234 ; jb 1eecb <_sk_store_f32_sse2+0x79> + DB 114,234 ; jb 1f496 <_sk_store_f32_sse2+0x79> DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4) - DB 235,225 ; jmp 1eecb <_sk_store_f32_sse2+0x79> + DB 235,225 ; jmp 1f496 <_sk_store_f32_sse2+0x79> PUBLIC _sk_clamp_x_sse2 _sk_clamp_x_sse2 LABEL PROC @@ -29489,7 +29833,7 @@ _sk_repeat_x_sse2 LABEL PROC DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8 DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11 DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10 - DB 68,15,84,21,8,208,0,0 ; andps 0xd008(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,84,21,29,208,0,0 ; andps 0xd01d(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 @@ -29513,7 +29857,7 @@ _sk_repeat_y_sse2 LABEL PROC DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8 DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11 DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10 - DB 68,15,84,21,174,207,0,0 ; andps 0xcfae(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,84,21,195,207,0,0 ; andps 0xcfc3(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 @@ -29537,13 +29881,13 @@ _sk_mirror_x_sse2 LABEL PROC DB 65,15,92,193 ; subps %xmm9,%xmm0 DB 243,69,15,88,210 ; addss %xmm10,%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 - DB 243,68,15,89,29,111,197,0,0 ; mulss 0xc56f(%rip),%xmm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 243,68,15,89,29,144,197,0,0 ; mulss 0xc590(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 68,15,89,216 ; mulps %xmm0,%xmm11 DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8 DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12 DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11 - DB 68,15,84,29,52,207,0,0 ; andps 0xcf34(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,84,29,73,207,0,0 ; andps 0xcf49(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 69,15,92,227 ; subps %xmm11,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 @@ -29570,13 +29914,13 @@ _sk_mirror_y_sse2 LABEL PROC DB 65,15,92,201 ; subps %xmm9,%xmm1 DB 243,69,15,88,210 ; addss %xmm10,%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 - DB 243,68,15,89,29,234,196,0,0 ; mulss 0xc4ea(%rip),%xmm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b> + DB 243,68,15,89,29,11,197,0,0 ; mulss 0xc50b(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b> DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 68,15,89,217 ; mulps %xmm1,%xmm11 DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8 DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12 DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11 - DB 68,15,84,29,175,206,0,0 ; andps 0xceaf(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,84,29,196,206,0,0 ; andps 0xcec4(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 69,15,92,227 ; subps %xmm11,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 @@ -29597,7 +29941,7 @@ PUBLIC _sk_clamp_x_1_sse2 _sk_clamp_x_1_sse2 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,102,206,0,0 ; minps 0xce66(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,93,5,123,206,0,0 ; minps 0xce7b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -29608,7 +29952,7 @@ _sk_repeat_x_1_sse2 LABEL PROC DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9 - DB 68,15,84,13,68,206,0,0 ; andps 0xce44(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,84,13,89,206,0,0 ; andps 0xce59(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 65,15,92,192 ; subps %xmm8,%xmm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -29616,14 +29960,14 @@ _sk_repeat_x_1_sse2 LABEL PROC PUBLIC _sk_mirror_x_1_sse2 _sk_mirror_x_1_sse2 LABEL PROC - DB 68,15,40,5,144,206,0,0 ; movaps 0xce90(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf> + DB 68,15,40,5,165,206,0,0 ; movaps 0xcea5(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3> DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,13,20,206,0,0 ; movaps 0xce14(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,13,41,206,0,0 ; movaps 0xce29(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,84,13,10,206,0,0 ; andps 0xce0a(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,84,13,31,206,0,0 ; andps 0xce1f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,88,210 ; addps %xmm10,%xmm10 @@ -29637,10 +29981,10 @@ _sk_mirror_x_1_sse2 LABEL PROC PUBLIC _sk_luminance_to_alpha_sse2 _sk_luminance_to_alpha_sse2 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 15,89,5,32,211,0,0 ; mulps 0xd320(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x138f> - DB 15,89,13,41,211,0,0 ; mulps 0xd329(%rip),%xmm1 # 2c4c0 <_sk_overlay_sse2_8bit+0x139f> + DB 15,89,5,53,211,0,0 ; mulps 0xd335(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383> + DB 15,89,13,62,211,0,0 ; mulps 0xd33e(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,29,47,211,0,0 ; mulps 0xd32f(%rip),%xmm3 # 2c4d0 <_sk_overlay_sse2_8bit+0x13af> + DB 15,89,29,68,211,0,0 ; mulps 0xd344(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3> DB 15,88,217 ; addps %xmm1,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -29936,9 +30280,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC DB 72,139,24 ; mov (%rax),%rbx DB 76,139,112,8 ; mov 0x8(%rax),%r14 DB 72,255,203 ; dec %rbx - DB 120,7 ; js 1f641 <_sk_evenly_spaced_gradient_sse2+0x18> + DB 120,7 ; js 1fc0c <_sk_evenly_spaced_gradient_sse2+0x18> DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1 - DB 235,21 ; jmp 1f656 <_sk_evenly_spaced_gradient_sse2+0x2d> + DB 235,21 ; jmp 1fc21 <_sk_evenly_spaced_gradient_sse2+0x2d> DB 73,137,217 ; mov %rbx,%r9 DB 73,209,233 ; shr %r9 DB 131,227,1 ; and $0x1,%ebx @@ -30034,15 +30378,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC PUBLIC _sk_gauss_a_to_rgba_sse2 _sk_gauss_a_to_rgba_sse2 LABEL PROC - DB 15,40,5,254,204,0,0 ; movaps 0xccfe(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x13bf> + DB 15,40,5,19,205,0,0 ; movaps 0xcd13(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,4,205,0,0 ; addps 0xcd04(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x13cf> + DB 15,88,5,25,205,0,0 ; addps 0xcd19(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,10,205,0,0 ; addps 0xcd0a(%rip),%xmm0 # 2c500 <_sk_overlay_sse2_8bit+0x13df> + DB 15,88,5,31,205,0,0 ; addps 0xcd1f(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,16,205,0,0 ; addps 0xcd10(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x13ef> + DB 15,88,5,37,205,0,0 ; addps 0xcd25(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,22,205,0,0 ; addps 0xcd16(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x13ff> + DB 15,88,5,43,205,0,0 ; addps 0xcd2b(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 @@ -30058,12 +30402,12 @@ _sk_gradient_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,249,2 ; cmp $0x2,%r9 - DB 114,50 ; jb 1f85d <_sk_gradient_sse2+0x46> + DB 114,50 ; jb 1fe28 <_sk_gradient_sse2+0x46> DB 72,139,88,72 ; mov 0x48(%rax),%rbx DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 15,40,21,63,199,0,0 ; movaps 0xc73f(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 15,40,21,84,199,0,0 ; movaps 0xc754(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 243,15,16,27 ; movss (%rbx),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 @@ -30071,7 +30415,7 @@ _sk_gradient_sse2 LABEL PROC DB 102,15,254,203 ; paddd %xmm3,%xmm1 DB 72,131,195,4 ; add $0x4,%rbx DB 73,255,201 ; dec %r9 - DB 117,228 ; jne 1f841 <_sk_gradient_sse2+0x2a> + DB 117,228 ; jne 1fe0c <_sk_gradient_sse2+0x2a> DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2 DB 102,73,15,126,211 ; movq %xmm2,%r11 DB 69,137,217 ; mov %r11d,%r9d @@ -30206,29 +30550,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC DB 69,15,94,220 ; divps %xmm12,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 - DB 68,15,40,45,160,202,0,0 ; movaps 0xcaa0(%rip),%xmm13 # 2c530 <_sk_overlay_sse2_8bit+0x140f> + DB 68,15,40,45,181,202,0,0 ; movaps 0xcab5(%rip),%xmm13 # 2cb10 <_sk_overlay_sse2_8bit+0x1403> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,164,202,0,0 ; addps 0xcaa4(%rip),%xmm13 # 2c540 <_sk_overlay_sse2_8bit+0x141f> + DB 68,15,88,45,185,202,0,0 ; addps 0xcab9(%rip),%xmm13 # 2cb20 <_sk_overlay_sse2_8bit+0x1413> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,168,202,0,0 ; addps 0xcaa8(%rip),%xmm13 # 2c550 <_sk_overlay_sse2_8bit+0x142f> + DB 68,15,88,45,189,202,0,0 ; addps 0xcabd(%rip),%xmm13 # 2cb30 <_sk_overlay_sse2_8bit+0x1423> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,172,202,0,0 ; addps 0xcaac(%rip),%xmm13 # 2c560 <_sk_overlay_sse2_8bit+0x143f> + DB 68,15,88,45,193,202,0,0 ; addps 0xcac1(%rip),%xmm13 # 2cb40 <_sk_overlay_sse2_8bit+0x1433> DB 69,15,89,235 ; mulps %xmm11,%xmm13 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,40,21,171,202,0,0 ; movaps 0xcaab(%rip),%xmm10 # 2c570 <_sk_overlay_sse2_8bit+0x144f> + DB 68,15,40,21,192,202,0,0 ; movaps 0xcac0(%rip),%xmm10 # 2cb50 <_sk_overlay_sse2_8bit+0x1443> DB 69,15,92,213 ; subps %xmm13,%xmm10 DB 69,15,84,209 ; andps %xmm9,%xmm10 DB 69,15,85,205 ; andnps %xmm13,%xmm9 DB 69,15,86,202 ; orps %xmm10,%xmm9 DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8 - DB 68,15,40,21,126,196,0,0 ; movaps 0xc47e(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,21,147,196,0,0 ; movaps 0xc493(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,84,208 ; andps %xmm8,%xmm10 DB 69,15,85,193 ; andnps %xmm9,%xmm8 DB 69,15,86,194 ; orps %xmm10,%xmm8 DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9 - DB 68,15,40,21,109,196,0,0 ; movaps 0xc46d(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,21,130,196,0,0 ; movaps 0xc482(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,208 ; subps %xmm8,%xmm10 DB 69,15,84,209 ; andps %xmm9,%xmm10 DB 69,15,85,200 ; andnps %xmm8,%xmm9 @@ -30259,7 +30603,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC DB 243,69,15,89,203 ; mulss %xmm11,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,88,200 ; addps %xmm0,%xmm9 - DB 68,15,89,13,20,202,0,0 ; mulps 0xca14(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f> + DB 68,15,89,13,41,202,0,0 ; mulps 0xca29(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 @@ -30267,7 +30611,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC DB 243,69,15,89,219 ; mulss %xmm11,%xmm11 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,92,227 ; subps %xmm11,%xmm12 - DB 68,15,89,21,255,201,0,0 ; mulps 0xc9ff(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f> + DB 68,15,89,21,20,202,0,0 ; mulps 0xca14(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 @@ -30276,8 +30620,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,92,193 ; subps %xmm9,%xmm0 - DB 68,15,87,13,183,200,0,0 ; xorps 0xc8b7(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f> - DB 68,15,89,5,159,195,0,0 ; mulps 0xc39f(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,87,13,204,200,0,0 ; xorps 0xc8cc(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> + DB 68,15,89,5,180,195,0,0 ; mulps 0xc3b4(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 69,15,92,202 ; subps %xmm10,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 @@ -30296,7 +30640,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC DB 243,69,15,89,203 ; mulss %xmm11,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,88,200 ; addps %xmm0,%xmm9 - DB 68,15,89,13,118,201,0,0 ; mulps 0xc976(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f> + DB 68,15,89,13,139,201,0,0 ; mulps 0xc98b(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 @@ -30304,7 +30648,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC DB 243,69,15,89,219 ; mulss %xmm11,%xmm11 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,92,227 ; subps %xmm11,%xmm12 - DB 68,15,89,21,97,201,0,0 ; mulps 0xc961(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f> + DB 68,15,89,21,118,201,0,0 ; mulps 0xc976(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 @@ -30313,8 +30657,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,92,193 ; subps %xmm9,%xmm0 - DB 68,15,87,13,25,200,0,0 ; xorps 0xc819(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f> - DB 68,15,89,5,1,195,0,0 ; mulps 0xc301(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,87,13,46,200,0,0 ; xorps 0xc82e(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> + DB 68,15,89,5,22,195,0,0 ; mulps 0xc316(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 69,15,92,202 ; subps %xmm10,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 @@ -30330,7 +30674,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC DB 243,69,15,89,200 ; mulss %xmm8,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,88,200 ; addps %xmm0,%xmm9 - DB 68,15,89,13,233,200,0,0 ; mulps 0xc8e9(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f> + DB 68,15,89,13,254,200,0,0 ; mulps 0xc8fe(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 69,15,89,210 ; mulps %xmm10,%xmm10 @@ -30338,7 +30682,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC DB 243,69,15,89,192 ; mulss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 65,15,92,192 ; subps %xmm8,%xmm0 - DB 15,87,5,181,199,0,0 ; xorps 0xc7b5(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x134f> + DB 15,87,5,202,199,0,0 ; xorps 0xc7ca(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343> DB 65,15,94,193 ; divps %xmm9,%xmm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -30375,7 +30719,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC PUBLIC _sk_save_xy_sse2 _sk_save_xy_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,59,194,0,0 ; movaps 0xc23b(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,5,80,194,0,0 ; movaps 0xc250(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,17,0 ; movups %xmm0,(%rax) DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,88,200 ; addps %xmm8,%xmm9 @@ -30383,7 +30727,7 @@ _sk_save_xy_sse2 LABEL PROC DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,40,217 ; movaps %xmm9,%xmm11 DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11 - DB 68,15,40,37,38,194,0,0 ; movaps 0xc226(%rip),%xmm12 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 68,15,40,37,59,194,0,0 ; movaps 0xc23b(%rip),%xmm12 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,84,220 ; andps %xmm12,%xmm11 DB 69,15,92,211 ; subps %xmm11,%xmm10 DB 69,15,92,202 ; subps %xmm10,%xmm9 @@ -30426,8 +30770,8 @@ _sk_bilinear_nx_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,191,199,0,0 ; addps 0xc7bf(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,135,193,0,0 ; movaps 0xc187(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,5,212,199,0,0 ; addps 0xc7d4(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,156,193,0,0 ; movaps 0xc19c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -30438,7 +30782,7 @@ _sk_bilinear_px_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,86,193,0,0 ; addps 0xc156(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,88,5,107,193,0,0 ; addps 0xc16b(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -30448,8 +30792,8 @@ _sk_bilinear_ny_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,120,199,0,0 ; addps 0xc778(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,64,193,0,0 ; movaps 0xc140(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,13,141,199,0,0 ; addps 0xc78d(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,85,193,0,0 ; movaps 0xc155(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -30460,7 +30804,7 @@ _sk_bilinear_py_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,14,193,0,0 ; addps 0xc10e(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 15,88,13,35,193,0,0 ; addps 0xc123(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -30470,13 +30814,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,65,199,0,0 ; addps 0xc741(%rip),%xmm0 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f> - DB 68,15,40,13,249,192,0,0 ; movaps 0xc0f9(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,5,86,199,0,0 ; addps 0xc756(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483> + DB 68,15,40,13,14,193,0,0 ; movaps 0xc10e(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,53,199,0,0 ; mulps 0xc735(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,13,205,194,0,0 ; addps 0xc2cd(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,13,74,199,0,0 ; mulps 0xc74a(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,13,226,194,0,0 ; addps 0xc2e2(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -30487,16 +30831,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,236,198,0,0 ; addps 0xc6ec(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,180,192,0,0 ; movaps 0xc0b4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,5,1,199,0,0 ; addps 0xc701(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,201,192,0,0 ; movaps 0xc0c9(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,8,199,0,0 ; movaps 0xc708(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,5,29,199,0,0 ; movaps 0xc71d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,12,199,0,0 ; addps 0xc70c(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,5,33,199,0,0 ; addps 0xc721(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,128,192,0,0 ; addps 0xc080(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,88,5,149,192,0,0 ; addps 0xc095(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,4,199,0,0 ; addps 0xc704(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,5,25,199,0,0 ; addps 0xc719(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -30504,17 +30848,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC PUBLIC _sk_bicubic_p1x_sse2 _sk_bicubic_p1x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,94,192,0,0 ; movaps 0xc05e(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,5,115,192,0,0 ; movaps 0xc073(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,21,186,198,0,0 ; movaps 0xc6ba(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,21,207,198,0,0 ; movaps 0xc6cf(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,190,198,0,0 ; addps 0xc6be(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,21,211,198,0,0 ; addps 0xc6d3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,186,198,0,0 ; addps 0xc6ba(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,21,207,198,0,0 ; addps 0xc6cf(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -30524,11 +30868,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,141,198,0,0 ; addps 0xc68d(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 15,88,5,162,198,0,0 ; addps 0xc6a2(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,93,198,0,0 ; mulps 0xc65d(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,5,245,193,0,0 ; addps 0xc1f5(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,5,114,198,0,0 ; mulps 0xc672(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,5,10,194,0,0 ; addps 0xc20a(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -30539,13 +30883,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,35,198,0,0 ; addps 0xc623(%rip),%xmm1 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f> - DB 68,15,40,13,219,191,0,0 ; movaps 0xbfdb(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,13,56,198,0,0 ; addps 0xc638(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483> + DB 68,15,40,13,240,191,0,0 ; movaps 0xbff0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,23,198,0,0 ; mulps 0xc617(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,13,175,193,0,0 ; addps 0xc1af(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,13,44,198,0,0 ; mulps 0xc62c(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,13,196,193,0,0 ; addps 0xc1c4(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -30556,16 +30900,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,205,197,0,0 ; addps 0xc5cd(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f> - DB 68,15,40,13,149,191,0,0 ; movaps 0xbf95(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,88,13,226,197,0,0 ; addps 0xc5e2(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473> + DB 68,15,40,13,170,191,0,0 ; movaps 0xbfaa(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,233,197,0,0 ; movaps 0xc5e9(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,5,254,197,0,0 ; movaps 0xc5fe(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,237,197,0,0 ; addps 0xc5ed(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,5,2,198,0,0 ; addps 0xc602(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,97,191,0,0 ; addps 0xbf61(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,88,5,118,191,0,0 ; addps 0xbf76(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,229,197,0,0 ; addps 0xc5e5(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,5,250,197,0,0 ; addps 0xc5fa(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -30573,17 +30917,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC PUBLIC _sk_bicubic_p1y_sse2 _sk_bicubic_p1y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,63,191,0,0 ; movaps 0xbf3f(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f> + DB 68,15,40,5,84,191,0,0 ; movaps 0xbf54(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33> DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9 DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 68,15,40,21,154,197,0,0 ; movaps 0xc59a(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af> + DB 68,15,40,21,175,197,0,0 ; movaps 0xc5af(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,158,197,0,0 ; addps 0xc59e(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 68,15,88,21,179,197,0,0 ; addps 0xc5b3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,154,197,0,0 ; addps 0xc59a(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf> + DB 68,15,88,21,175,197,0,0 ; addps 0xc5af(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3> DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -30593,11 +30937,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,108,197,0,0 ; addps 0xc56c(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf> + DB 15,88,13,129,197,0,0 ; addps 0xc581(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,60,197,0,0 ; mulps 0xc53c(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f> - DB 68,15,88,5,212,192,0,0 ; addps 0xc0d4(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f> + DB 68,15,89,5,81,197,0,0 ; mulps 0xc551(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493> + DB 68,15,88,5,233,192,0,0 ; addps 0xc0e9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -30732,7 +31076,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 102,15,254,216 ; paddd %xmm0,%xmm3 DB 102,65,15,111,198 ; movdqa %xmm14,%xmm0 DB 102,15,254,195 ; paddd %xmm3,%xmm0 - DB 102,15,111,45,136,195,0,0 ; movdqa 0xc388(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,45,157,195,0,0 ; movdqa 0xc39d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1 DB 102,15,244,197 ; pmuludq %xmm5,%xmm0 DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0 @@ -30755,7 +31099,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 15,20,241 ; unpcklps %xmm1,%xmm6 DB 15,20,245 ; unpcklps %xmm5,%xmm6 DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,15,254,13,140,188,0,0 ; paddd 0xbc8c(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,254,13,161,188,0,0 ; paddd 0xbca1(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5 DB 102,73,15,126,233 ; movq %xmm5,%r9 DB 102,73,15,126,202 ; movq %xmm1,%r10 @@ -30772,7 +31116,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5 DB 15,20,253 ; unpcklps %xmm5,%xmm7 DB 15,20,249 ; unpcklps %xmm1,%xmm7 - DB 102,15,254,5,98,188,0,0 ; paddd 0xbc62(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,5,119,188,0,0 ; paddd 0xbc77(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,73,15,126,201 ; movq %xmm1,%r9 DB 102,73,15,126,194 ; movq %xmm0,%r10 @@ -30789,7 +31133,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5 DB 15,20,205 ; unpcklps %xmm5,%xmm1 DB 15,20,200 ; unpcklps %xmm0,%xmm1 - DB 15,40,45,121,194,0,0 ; movaps 0xc279(%rip),%xmm5 # 2c600 <_sk_overlay_sse2_8bit+0x14df> + DB 15,40,45,142,194,0,0 ; movaps 0xc28e(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3> DB 15,88,229 ; addps %xmm5,%xmm4 DB 15,41,100,36,64 ; movaps %xmm4,0x40(%rsp) DB 68,15,88,213 ; addps %xmm5,%xmm10 @@ -30804,7 +31148,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%rsp) DB 102,15,254,216 ; paddd %xmm0,%xmm3 DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4 - DB 102,15,111,5,66,194,0,0 ; movdqa 0xc242(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,5,87,194,0,0 ; movdqa 0xc257(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,244,216 ; pmuludq %xmm0,%xmm3 DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2 DB 102,15,244,224 ; pmuludq %xmm0,%xmm4 @@ -30826,7 +31170,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 15,20,227 ; unpcklps %xmm3,%xmm4 DB 15,20,229 ; unpcklps %xmm5,%xmm4 DB 102,15,111,218 ; movdqa %xmm2,%xmm3 - DB 102,15,254,29,75,187,0,0 ; paddd 0xbb4b(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,254,29,96,187,0,0 ; paddd 0xbb60(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5 DB 102,73,15,126,233 ; movq %xmm5,%r9 DB 102,73,15,126,218 ; movq %xmm3,%r10 @@ -30843,7 +31187,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0 DB 15,20,216 ; unpcklps %xmm0,%xmm3 DB 15,20,221 ; unpcklps %xmm5,%xmm3 - DB 102,15,254,21,33,187,0,0 ; paddd 0xbb21(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,21,54,187,0,0 ; paddd 0xbb36(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0 DB 102,73,15,126,193 ; movq %xmm0,%r9 DB 102,73,15,126,210 ; movq %xmm2,%r10 @@ -30905,7 +31249,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 68,15,20,193 ; unpcklps %xmm1,%xmm8 DB 68,15,20,199 ; unpcklps %xmm7,%xmm8 DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,68,15,111,21,236,185,0,0 ; movdqa 0xb9ec(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,21,1,186,0,0 ; movdqa 0xba01(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,65,15,254,202 ; paddd %xmm10,%xmm1 DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7 DB 102,73,15,126,249 ; movq %xmm7,%r9 @@ -30923,7 +31267,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5 DB 15,20,205 ; unpcklps %xmm5,%xmm1 DB 15,20,207 ; unpcklps %xmm7,%xmm1 - DB 102,15,111,45,189,185,0,0 ; movdqa 0xb9bd(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,111,45,210,185,0,0 ; movdqa 0xb9d2(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,254,197 ; paddd %xmm5,%xmm0 DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5 DB 102,73,15,126,233 ; movq %xmm5,%r9 @@ -30981,7 +31325,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7 DB 68,15,20,223 ; unpcklps %xmm7,%xmm11 DB 68,15,20,221 ; unpcklps %xmm5,%xmm11 - DB 102,15,111,45,184,184,0,0 ; movdqa 0xb8b8(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,111,45,205,184,0,0 ; movdqa 0xb8cd(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,254,245 ; paddd %xmm5,%xmm6 DB 102,15,111,253 ; movdqa %xmm5,%xmm7 DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5 @@ -31028,7 +31372,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1 DB 102,65,15,254,201 ; paddd %xmm9,%xmm1 DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2 - DB 102,15,111,5,91,190,0,0 ; movdqa 0xbe5b(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,5,112,190,0,0 ; movdqa 0xbe70(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,244,200 ; pmuludq %xmm0,%xmm1 DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3 DB 102,15,244,208 ; pmuludq %xmm0,%xmm2 @@ -31050,7 +31394,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 15,20,204 ; unpcklps %xmm4,%xmm1 DB 15,20,202 ; unpcklps %xmm2,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,111,5,101,183,0,0 ; movdqa 0xb765(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,5,122,183,0,0 ; movdqa 0xb77a(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,208 ; paddd %xmm0,%xmm2 DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4 DB 102,73,15,126,225 ; movq %xmm4,%r9 @@ -31126,7 +31470,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0 DB 15,20,240 ; unpcklps %xmm0,%xmm6 DB 15,20,245 ; unpcklps %xmm5,%xmm6 - DB 102,15,254,29,54,182,0,0 ; paddd 0xb636(%rip),%xmm3 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,29,75,182,0,0 ; paddd 0xb64b(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0 DB 102,73,15,126,193 ; movq %xmm0,%r9 DB 102,73,15,126,218 ; movq %xmm3,%r10 @@ -31177,7 +31521,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 68,15,20,201 ; unpcklps %xmm1,%xmm9 DB 68,15,20,202 ; unpcklps %xmm2,%xmm9 DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,15,254,13,51,181,0,0 ; paddd 0xb533(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,254,13,72,181,0,0 ; paddd 0xb548(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2 DB 102,73,15,126,209 ; movq %xmm2,%r9 DB 102,73,15,126,202 ; movq %xmm1,%r10 @@ -31194,7 +31538,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2 DB 68,15,20,242 ; unpcklps %xmm2,%xmm14 DB 68,15,20,241 ; unpcklps %xmm1,%xmm14 - DB 102,15,254,5,6,181,0,0 ; paddd 0xb506(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,5,27,181,0,0 ; paddd 0xb51b(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,73,15,126,201 ; movq %xmm1,%r9 DB 102,73,15,126,194 ; movq %xmm0,%r10 @@ -31232,7 +31576,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7 DB 15,20,199 ; unpcklps %xmm7,%xmm0 DB 15,20,193 ; unpcklps %xmm1,%xmm0 - DB 102,15,111,37,57,180,0,0 ; movdqa 0xb439(%rip),%xmm4 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,37,78,180,0,0 ; movdqa 0xb44e(%rip),%xmm4 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,226 ; paddd %xmm2,%xmm4 DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1 DB 102,73,15,126,201 ; movq %xmm1,%r9 @@ -31250,7 +31594,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4 DB 15,20,204 ; unpcklps %xmm4,%xmm1 DB 15,20,207 ; unpcklps %xmm7,%xmm1 - DB 102,15,254,21,11,180,0,0 ; paddd 0xb40b(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,21,32,180,0,0 ; paddd 0xb420(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4 DB 102,73,15,126,225 ; movq %xmm4,%r9 DB 102,73,15,126,210 ; movq %xmm2,%r10 @@ -31401,7 +31745,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,254,209 ; paddd %xmm1,%xmm2 DB 102,15,111,220 ; movdqa %xmm4,%xmm3 DB 102,15,254,218 ; paddd %xmm2,%xmm3 - DB 102,68,15,111,21,215,183,0,0 ; movdqa 0xb7d7(%rip),%xmm10 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,68,15,111,21,236,183,0,0 ; movdqa 0xb7ec(%rip),%xmm10 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,112,235,245 ; pshufd $0xf5,%xmm3,%xmm5 DB 102,65,15,244,218 ; pmuludq %xmm10,%xmm3 DB 102,15,112,227,232 ; pshufd $0xe8,%xmm3,%xmm4 @@ -31424,7 +31768,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,222 ; unpcklps %xmm6,%xmm3 DB 15,20,221 ; unpcklps %xmm5,%xmm3 DB 102,15,111,236 ; movdqa %xmm4,%xmm5 - DB 102,15,254,45,217,176,0,0 ; paddd 0xb0d9(%rip),%xmm5 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,254,45,238,176,0,0 ; paddd 0xb0ee(%rip),%xmm5 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6 DB 102,73,15,126,241 ; movq %xmm6,%r9 DB 102,73,15,126,234 ; movq %xmm5,%r10 @@ -31441,7 +31785,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7 DB 15,20,247 ; unpcklps %xmm7,%xmm6 DB 15,20,245 ; unpcklps %xmm5,%xmm6 - DB 102,15,254,37,175,176,0,0 ; paddd 0xb0af(%rip),%xmm4 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,37,196,176,0,0 ; paddd 0xb0c4(%rip),%xmm4 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5 DB 102,73,15,126,233 ; movq %xmm5,%r9 DB 102,73,15,126,226 ; movq %xmm4,%r10 @@ -31458,7 +31802,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7 DB 15,20,239 ; unpcklps %xmm7,%xmm5 DB 15,20,236 ; unpcklps %xmm4,%xmm5 - DB 15,40,61,198,182,0,0 ; movaps 0xb6c6(%rip),%xmm7 # 2c600 <_sk_overlay_sse2_8bit+0x14df> + DB 15,40,61,219,182,0,0 ; movaps 0xb6db(%rip),%xmm7 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3> DB 68,15,88,199 ; addps %xmm7,%xmm8 DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp) DB 68,15,88,207 ; addps %xmm7,%xmm9 @@ -31496,7 +31840,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 68,15,20,234 ; unpcklps %xmm2,%xmm13 DB 68,15,20,239 ; unpcklps %xmm7,%xmm13 DB 102,15,111,208 ; movdqa %xmm0,%xmm2 - DB 102,15,254,21,134,175,0,0 ; paddd 0xaf86(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,254,21,155,175,0,0 ; paddd 0xaf9b(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7 DB 102,73,15,126,249 ; movq %xmm7,%r9 DB 102,73,15,126,210 ; movq %xmm2,%r10 @@ -31513,7 +31857,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,70,15,16,12,139 ; movss (%rbx,%r9,4),%xmm9 DB 65,15,20,209 ; unpcklps %xmm9,%xmm2 DB 15,20,215 ; unpcklps %xmm7,%xmm2 - DB 102,15,254,5,91,175,0,0 ; paddd 0xaf5b(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,5,112,175,0,0 ; paddd 0xaf70(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7 DB 102,73,15,126,249 ; movq %xmm7,%r9 DB 102,73,15,126,194 ; movq %xmm0,%r10 @@ -31554,7 +31898,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,217 ; movdqa %xmm1,%xmm3 DB 102,15,254,92,36,32 ; paddd 0x20(%rsp),%xmm3 DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4 - DB 102,68,15,111,53,25,181,0,0 ; movdqa 0xb519(%rip),%xmm14 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,68,15,111,53,46,181,0,0 ; movdqa 0xb52e(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3 DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3 DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4 @@ -31575,7 +31919,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 68,15,20,228 ; unpcklps %xmm4,%xmm12 DB 68,15,20,229 ; unpcklps %xmm5,%xmm12 DB 102,15,111,227 ; movdqa %xmm3,%xmm4 - DB 102,15,111,61,34,174,0,0 ; movdqa 0xae22(%rip),%xmm7 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,61,55,174,0,0 ; movdqa 0xae37(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,231 ; paddd %xmm7,%xmm4 DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5 DB 102,73,15,126,233 ; movq %xmm5,%r9 @@ -31593,7 +31937,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5 DB 15,20,245 ; unpcklps %xmm5,%xmm6 DB 15,20,244 ; unpcklps %xmm4,%xmm6 - DB 102,68,15,111,5,243,173,0,0 ; movdqa 0xadf3(%rip),%xmm8 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,5,8,174,0,0 ; movdqa 0xae08(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,65,15,254,216 ; paddd %xmm8,%xmm3 DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4 DB 102,73,15,126,225 ; movq %xmm4,%r9 @@ -31707,7 +32051,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,68,15,111,108,36,32 ; movdqa 0x20(%rsp),%xmm13 DB 102,65,15,254,205 ; paddd %xmm13,%xmm1 DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2 - DB 102,15,111,29,86,178,0,0 ; movdqa 0xb256(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,29,107,178,0,0 ; movdqa 0xb26b(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,244,203 ; pmuludq %xmm3,%xmm1 DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1 DB 102,15,244,211 ; pmuludq %xmm3,%xmm2 @@ -31729,7 +32073,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 68,15,20,202 ; unpcklps %xmm2,%xmm9 DB 68,15,20,205 ; unpcklps %xmm5,%xmm9 DB 102,15,111,209 ; movdqa %xmm1,%xmm2 - DB 102,15,111,29,93,171,0,0 ; movdqa 0xab5d(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,29,114,171,0,0 ; movdqa 0xab72(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,211 ; paddd %xmm3,%xmm2 DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5 DB 102,73,15,126,233 ; movq %xmm5,%r9 @@ -31837,7 +32181,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2 DB 102,65,15,254,213 ; paddd %xmm13,%xmm2 DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3 - DB 102,15,111,5,27,176,0,0 ; movdqa 0xb01b(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,5,48,176,0,0 ; movdqa 0xb030(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,244,208 ; pmuludq %xmm0,%xmm2 DB 102,15,112,250,232 ; pshufd $0xe8,%xmm2,%xmm7 DB 102,15,244,216 ; pmuludq %xmm0,%xmm3 @@ -31858,7 +32202,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 68,15,20,202 ; unpcklps %xmm2,%xmm9 DB 68,15,20,203 ; unpcklps %xmm3,%xmm9 DB 102,15,111,215 ; movdqa %xmm7,%xmm2 - DB 102,15,111,5,38,169,0,0 ; movdqa 0xa926(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,5,59,169,0,0 ; movdqa 0xa93b(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,208 ; paddd %xmm0,%xmm2 DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3 DB 102,73,15,126,217 ; movq %xmm3,%r9 @@ -31876,7 +32220,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3 DB 15,20,243 ; unpcklps %xmm3,%xmm6 DB 15,20,242 ; unpcklps %xmm2,%xmm6 - DB 102,68,15,111,45,247,168,0,0 ; movdqa 0xa8f7(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,45,12,169,0,0 ; movdqa 0xa90c(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,65,15,254,253 ; paddd %xmm13,%xmm7 DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2 DB 102,73,15,126,209 ; movq %xmm2,%r9 @@ -31896,7 +32240,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,250 ; unpcklps %xmm2,%xmm7 DB 102,68,15,254,220 ; paddd %xmm4,%xmm11 DB 102,65,15,112,219,245 ; pshufd $0xf5,%xmm11,%xmm3 - DB 102,15,111,37,13,175,0,0 ; movdqa 0xaf0d(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,37,34,175,0,0 ; movdqa 0xaf22(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,68,15,244,220 ; pmuludq %xmm4,%xmm11 DB 102,65,15,112,211,232 ; pshufd $0xe8,%xmm11,%xmm2 DB 102,15,244,220 ; pmuludq %xmm4,%xmm3 @@ -31997,7 +32341,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,65,15,111,202 ; movdqa %xmm10,%xmm1 DB 102,15,254,200 ; paddd %xmm0,%xmm1 DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2 - DB 102,15,111,29,67,173,0,0 ; movdqa 0xad43(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,29,88,173,0,0 ; movdqa 0xad58(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,244,203 ; pmuludq %xmm3,%xmm1 DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1 DB 102,15,244,211 ; pmuludq %xmm3,%xmm2 @@ -32019,7 +32363,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,212 ; unpcklps %xmm4,%xmm2 DB 15,20,211 ; unpcklps %xmm3,%xmm2 DB 102,15,111,217 ; movdqa %xmm1,%xmm3 - DB 102,15,111,61,76,166,0,0 ; movdqa 0xa64c(%rip),%xmm7 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,61,97,166,0,0 ; movdqa 0xa661(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,223 ; paddd %xmm7,%xmm3 DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4 DB 102,73,15,126,225 ; movq %xmm4,%r9 @@ -32037,7 +32381,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5 DB 15,20,221 ; unpcklps %xmm5,%xmm3 DB 15,20,220 ; unpcklps %xmm4,%xmm3 - DB 102,68,15,111,13,29,166,0,0 ; movdqa 0xa61d(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,68,15,111,13,50,166,0,0 ; movdqa 0xa632(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,65,15,254,201 ; paddd %xmm9,%xmm1 DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4 DB 102,73,15,126,225 ; movq %xmm4,%r9 @@ -32149,7 +32493,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 68,15,20,246 ; unpcklps %xmm6,%xmm14 DB 68,15,20,243 ; unpcklps %xmm3,%xmm14 DB 102,15,111,220 ; movdqa %xmm4,%xmm3 - DB 102,68,15,111,21,13,164,0,0 ; movdqa 0xa40d(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,21,34,164,0,0 ; movdqa 0xa422(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,65,15,254,218 ; paddd %xmm10,%xmm3 DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6 DB 102,73,15,126,241 ; movq %xmm6,%r9 @@ -32270,7 +32614,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,116,36,32 ; movdqa 0x20(%rsp),%xmm6 DB 102,15,254,198 ; paddd %xmm6,%xmm0 DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1 - DB 102,15,111,29,132,168,0,0 ; movdqa 0xa884(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,29,153,168,0,0 ; movdqa 0xa899(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,244,195 ; pmuludq %xmm3,%xmm0 DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2 DB 102,15,244,203 ; pmuludq %xmm3,%xmm1 @@ -32292,7 +32636,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,195 ; unpcklps %xmm3,%xmm0 DB 15,20,193 ; unpcklps %xmm1,%xmm0 DB 102,15,111,202 ; movdqa %xmm2,%xmm1 - DB 102,68,15,111,5,140,161,0,0 ; movdqa 0xa18c(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,68,15,111,5,161,161,0,0 ; movdqa 0xa1a1(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,65,15,254,200 ; paddd %xmm8,%xmm1 DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3 DB 102,73,15,126,217 ; movq %xmm3,%r9 @@ -32398,7 +32742,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,254,60,36 ; paddd (%rsp),%xmm7 DB 102,15,254,247 ; paddd %xmm7,%xmm6 DB 102,15,112,206,245 ; pshufd $0xf5,%xmm6,%xmm1 - DB 102,15,111,21,79,166,0,0 ; movdqa 0xa64f(%rip),%xmm2 # 2c610 <_sk_overlay_sse2_8bit+0x14ef> + DB 102,15,111,21,100,166,0,0 ; movdqa 0xa664(%rip),%xmm2 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3> DB 102,15,244,242 ; pmuludq %xmm2,%xmm6 DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0 DB 102,15,244,202 ; pmuludq %xmm2,%xmm1 @@ -32420,7 +32764,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 68,15,20,201 ; unpcklps %xmm1,%xmm9 DB 68,15,20,202 ; unpcklps %xmm2,%xmm9 DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,15,254,13,86,159,0,0 ; paddd 0x9f56(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,254,13,107,159,0,0 ; paddd 0x9f6b(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2 DB 102,73,15,126,209 ; movq %xmm2,%r9 DB 102,73,15,126,202 ; movq %xmm1,%r10 @@ -32476,7 +32820,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7 DB 15,20,199 ; unpcklps %xmm7,%xmm0 DB 15,20,193 ; unpcklps %xmm1,%xmm0 - DB 102,15,111,53,88,158,0,0 ; movdqa 0x9e58(%rip),%xmm6 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f> + DB 102,15,111,53,109,158,0,0 ; movdqa 0x9e6d(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53> DB 102,15,254,242 ; paddd %xmm2,%xmm6 DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1 DB 102,73,15,126,201 ; movq %xmm1,%r9 @@ -32494,7 +32838,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,70,15,16,60,139 ; movss (%rbx,%r9,4),%xmm15 DB 65,15,20,207 ; unpcklps %xmm15,%xmm1 DB 15,20,207 ; unpcklps %xmm7,%xmm1 - DB 102,15,254,21,41,158,0,0 ; paddd 0x9e29(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f> + DB 102,15,254,21,62,158,0,0 ; paddd 0x9e3e(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73> DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7 DB 102,73,15,126,249 ; movq %xmm7,%r9 DB 102,73,15,126,210 ; movq %xmm2,%r10 @@ -32556,7 +32900,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,89,212 ; mulps %xmm4,%xmm2 DB 65,15,88,213 ; addps %xmm13,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,5,157,0,0 ; movaps 0x9d05(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f> + DB 15,40,29,26,157,0,0 ; movaps 0x9d1a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43> DB 15,40,164,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm4 DB 15,40,172,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm5 DB 15,40,180,36,16,1,0,0 ; movaps 0x110(%rsp),%xmm6 @@ -32564,9 +32908,6 @@ _sk_clut_4D_sse2 LABEL PROC DB 72,129,196,48,1,0,0 ; add $0x130,%rsp DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax - DB 144 ; nop - DB 144 ; nop - DB 144 ; nop PUBLIC _sk_start_pipeline_hsw_8bit _sk_start_pipeline_hsw_8bit LABEL PROC @@ -32599,7 +32940,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC DB 73,137,246 ; mov %rsi,%r14 DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp) DB 77,57,207 ; cmp %r9,%r15 - DB 15,131,138,0,0,0 ; jae 223a5 <_sk_start_pipeline_hsw_8bit+0x10d> + DB 15,131,138,0,0,0 ; jae 2296d <_sk_start_pipeline_hsw_8bit+0x10d> DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax DB 72,141,64,16 ; lea 0x10(%rax),%rax DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp) @@ -32609,7 +32950,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp) DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp) DB 72,57,157,248,254,255,255 ; cmp %rbx,-0x108(%rbp) - DB 119,36 ; ja 22381 <_sk_start_pipeline_hsw_8bit+0xe9> + DB 119,36 ; ja 22949 <_sk_start_pipeline_hsw_8bit+0xe9> DB 76,137,231 ; mov %r12,%rdi DB 76,137,246 ; mov %r14,%rsi DB 65,255,213 ; callq *%r13 @@ -32618,17 +32959,17 @@ _sk_start_pipeline_hsw_8bit LABEL PROC DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp) DB 72,131,193,32 ; add $0x20,%rcx DB 72,57,217 ; cmp %rbx,%rcx - DB 118,220 ; jbe 2235d <_sk_start_pipeline_hsw_8bit+0xc5> + DB 118,220 ; jbe 22925 <_sk_start_pipeline_hsw_8bit+0xc5> DB 72,137,217 ; mov %rbx,%rcx DB 72,41,193 ; sub %rax,%rcx - DB 116,16 ; je 22399 <_sk_start_pipeline_hsw_8bit+0x101> + DB 116,16 ; je 22961 <_sk_start_pipeline_hsw_8bit+0x101> DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp) DB 76,137,231 ; mov %r12,%rdi DB 76,137,246 ; mov %r14,%rsi DB 65,255,213 ; callq *%r13 DB 73,255,199 ; inc %r15 DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15 - DB 117,143 ; jne 22334 <_sk_start_pipeline_hsw_8bit+0x9c> + DB 117,143 ; jne 228fc <_sk_start_pipeline_hsw_8bit+0x9c> DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6 DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7 DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8 @@ -32666,7 +33007,7 @@ _sk_uniform_color_hsw_8bit LABEL PROC PUBLIC _sk_set_rgb_hsw_8bit _sk_set_rgb_hsw_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 197,250,16,37,161,145,0,0 ; vmovss 0x91a1(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 197,250,16,37,197,145,0,0 ; vmovss 0x91c5(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 197,218,89,40 ; vmulss (%rax),%xmm4,%xmm5 DB 196,225,250,44,205 ; vcvttss2si %xmm5,%rcx DB 197,218,89,104,4 ; vmulss 0x4(%rax),%xmm4,%xmm5 @@ -32679,7 +33020,7 @@ _sk_set_rgb_hsw_8bit LABEL PROC DB 9,208 ; or %edx,%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4 - DB 197,253,111,45,237,150,0,0 ; vmovdqa 0x96ed(%rip),%ymm5 # 2bb40 <_sk_overlay_sse2_8bit+0xa1f> + DB 197,253,111,45,5,151,0,0 ; vmovdqa 0x9705(%rip),%ymm5 # 2c120 <_sk_overlay_sse2_8bit+0xa13> DB 197,245,219,205 ; vpand %ymm5,%ymm1,%ymm1 DB 197,253,219,197 ; vpand %ymm5,%ymm0,%ymm0 DB 197,221,235,192 ; vpor %ymm0,%ymm4,%ymm0 @@ -32689,10 +33030,10 @@ _sk_set_rgb_hsw_8bit LABEL PROC PUBLIC _sk_premul_hsw_8bit _sk_premul_hsw_8bit LABEL PROC - DB 197,253,111,37,241,150,0,0 ; vmovdqa 0x96f1(%rip),%ymm4 # 2bb60 <_sk_overlay_sse2_8bit+0xa3f> + DB 197,253,111,37,9,151,0,0 ; vmovdqa 0x9709(%rip),%ymm4 # 2c140 <_sk_overlay_sse2_8bit+0xa33> DB 196,226,125,0,236 ; vpshufb %ymm4,%ymm0,%ymm5 DB 196,226,117,0,228 ; vpshufb %ymm4,%ymm1,%ymm4 - DB 197,253,111,53,255,150,0,0 ; vmovdqa 0x96ff(%rip),%ymm6 # 2bb80 <_sk_overlay_sse2_8bit+0xa5f> + DB 197,253,111,53,23,151,0,0 ; vmovdqa 0x9717(%rip),%ymm6 # 2c160 <_sk_overlay_sse2_8bit+0xa53> DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4 DB 197,213,235,238 ; vpor %ymm6,%ymm5,%ymm5 DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6 @@ -32730,7 +33071,7 @@ _sk_premul_hsw_8bit LABEL PROC PUBLIC _sk_swap_rb_hsw_8bit _sk_swap_rb_hsw_8bit LABEL PROC - DB 197,253,111,37,119,150,0,0 ; vmovdqa 0x9677(%rip),%ymm4 # 2bba0 <_sk_overlay_sse2_8bit+0xa7f> + DB 197,253,111,37,143,150,0,0 ; vmovdqa 0x968f(%rip),%ymm4 # 2c180 <_sk_overlay_sse2_8bit+0xa73> DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0 DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -32755,7 +33096,7 @@ _sk_load_8888_hsw_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,17 ; jne 22579 <_sk_load_8888_hsw_8bit+0x32> + DB 117,17 ; jne 22b41 <_sk_load_8888_hsw_8bit+0x32> DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1 DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -32765,14 +33106,14 @@ _sk_load_8888_hsw_8bit LABEL PROC DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,231 ; ja 22575 <_sk_load_8888_hsw_8bit+0x2e> + DB 119,231 ; ja 22b3d <_sk_load_8888_hsw_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 226b0 <_sk_load_8888_hsw_8bit+0x169> + DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 22c78 <_sk_load_8888_hsw_8bit+0x169> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0 - DB 235,203 ; jmp 22575 <_sk_load_8888_hsw_8bit+0x2e> + DB 235,203 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e> DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -32780,7 +33121,7 @@ _sk_load_8888_hsw_8bit LABEL PROC DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4 DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4 DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0 - DB 235,162 ; jmp 22575 <_sk_load_8888_hsw_8bit+0x2e> + DB 235,162 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e> DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -32793,7 +33134,7 @@ _sk_load_8888_hsw_8bit LABEL PROC DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0 DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4 DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0 - DB 233,83,255,255,255 ; jmpq 22575 <_sk_load_8888_hsw_8bit+0x2e> + DB 233,83,255,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e> DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -32802,7 +33143,7 @@ _sk_load_8888_hsw_8bit LABEL PROC DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1 DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0 DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1 - DB 233,23,255,255,255 ; jmpq 2256f <_sk_load_8888_hsw_8bit+0x28> + DB 233,23,255,255,255 ; jmpq 22b37 <_sk_load_8888_hsw_8bit+0x28> DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -32816,7 +33157,7 @@ _sk_load_8888_hsw_8bit LABEL PROC DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0 DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4 DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1 - DB 233,199,254,255,255 ; jmpq 22575 <_sk_load_8888_hsw_8bit+0x2e> + DB 233,199,254,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e> DB 102,144 ; xchg %ax,%ax DB 242,254 ; repnz (bad) DB 255 ; (bad) @@ -32867,7 +33208,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,17 ; jne 2271e <_sk_load_8888_dst_hsw_8bit+0x32> + DB 117,17 ; jne 22ce6 <_sk_load_8888_dst_hsw_8bit+0x32> DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3 DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax @@ -32877,14 +33218,14 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,231 ; ja 2271a <_sk_load_8888_dst_hsw_8bit+0x2e> + DB 119,231 ; ja 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 22854 <_sk_load_8888_dst_hsw_8bit+0x168> + DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 22e1c <_sk_load_8888_dst_hsw_8bit+0x168> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2 - DB 235,203 ; jmp 2271a <_sk_load_8888_dst_hsw_8bit+0x2e> + DB 235,203 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e> DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2 DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -32892,7 +33233,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4 DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4 DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2 - DB 235,162 ; jmp 2271a <_sk_load_8888_dst_hsw_8bit+0x2e> + DB 235,162 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e> DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2 DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -32905,7 +33246,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2 DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4 DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2 - DB 233,83,255,255,255 ; jmpq 2271a <_sk_load_8888_dst_hsw_8bit+0x2e> + DB 233,83,255,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e> DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2 DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -32914,7 +33255,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3 DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2 DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3 - DB 233,23,255,255,255 ; jmpq 22714 <_sk_load_8888_dst_hsw_8bit+0x28> + DB 233,23,255,255,255 ; jmpq 22cdc <_sk_load_8888_dst_hsw_8bit+0x28> DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2 DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -32928,7 +33269,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2 DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4 DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3 - DB 233,199,254,255,255 ; jmpq 2271a <_sk_load_8888_dst_hsw_8bit+0x2e> + DB 233,199,254,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e> DB 144 ; nop DB 243,254 ; repz (bad) DB 255 ; (bad) @@ -32979,7 +33320,7 @@ _sk_store_8888_hsw_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,17 ; jne 228c2 <_sk_store_8888_hsw_8bit+0x32> + DB 117,17 ; jne 22e8a <_sk_store_8888_hsw_8bit+0x32> DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4) DB 196,161,126,127,76,130,32 ; vmovdqu %ymm1,0x20(%rdx,%r8,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -32987,17 +33328,17 @@ _sk_store_8888_hsw_8bit LABEL PROC DB 65,128,225,15 ; and $0xf,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,239 ; ja 228be <_sk_store_8888_hsw_8bit+0x2e> + DB 119,239 ; ja 22e86 <_sk_store_8888_hsw_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 2298c <_sk_store_8888_hsw_8bit+0xfc> + DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 22f54 <_sk_store_8888_hsw_8bit+0xfc> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,161,121,126,4,130 ; vmovd %xmm0,(%rdx,%r8,4) - DB 235,211 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e> + DB 235,211 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e> DB 196,163,121,22,68,130,8,2 ; vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4) DB 196,161,121,214,4,130 ; vmovq %xmm0,(%rdx,%r8,4) - DB 235,195 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e> + DB 235,195 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e> DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4 DB 196,163,121,22,100,130,24,2 ; vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4) DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4 @@ -33005,12 +33346,12 @@ _sk_store_8888_hsw_8bit LABEL PROC DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4 DB 196,161,121,126,100,130,16 ; vmovd %xmm4,0x10(%rdx,%r8,4) DB 196,161,122,127,4,130 ; vmovdqu %xmm0,(%rdx,%r8,4) - DB 235,146 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e> + DB 235,146 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e> DB 196,163,121,22,76,130,40,2 ; vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4) DB 196,163,121,22,76,130,36,1 ; vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4) DB 196,161,121,126,76,130,32 ; vmovd %xmm1,0x20(%rdx,%r8,4) DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4) - DB 233,112,255,255,255 ; jmpq 228be <_sk_store_8888_hsw_8bit+0x2e> + DB 233,112,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e> DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4 DB 196,163,121,22,100,130,56,2 ; vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4) DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4 @@ -33019,7 +33360,7 @@ _sk_store_8888_hsw_8bit LABEL PROC DB 196,161,121,126,100,130,48 ; vmovd %xmm4,0x30(%rdx,%r8,4) DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4) DB 196,161,122,127,76,130,32 ; vmovdqu %xmm1,0x20(%rdx,%r8,4) - DB 233,53,255,255,255 ; jmpq 228be <_sk_store_8888_hsw_8bit+0x2e> + DB 233,53,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e> DB 15,31,0 ; nopl (%rax) DB 87 ; push %rdi DB 255 ; (bad) @@ -33032,7 +33373,7 @@ _sk_store_8888_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 125,255 ; jge 229a1 <_sk_store_8888_hsw_8bit+0x111> + DB 125,255 ; jge 22f69 <_sk_store_8888_hsw_8bit+0x111> DB 255 ; (bad) DB 255,111,255 ; ljmp *-0x1(%rdi) DB 255 ; (bad) @@ -33043,7 +33384,7 @@ _sk_store_8888_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 235,255 ; jmp 229b9 <_sk_store_8888_hsw_8bit+0x129> + DB 235,255 ; jmp 22f81 <_sk_store_8888_hsw_8bit+0x129> DB 255 ; (bad) DB 255 ; (bad) DB 222,255 ; fdivrp %st,%st(7) @@ -33067,10 +33408,10 @@ _sk_load_bgra_hsw_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,35 ; jne 22a0c <_sk_load_bgra_hsw_8bit+0x44> + DB 117,35 ; jne 22fd4 <_sk_load_bgra_hsw_8bit+0x44> DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1 DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0 - DB 197,253,111,37,194,145,0,0 ; vmovdqa 0x91c2(%rip),%ymm4 # 2bbc0 <_sk_overlay_sse2_8bit+0xa9f> + DB 197,253,111,37,218,145,0,0 ; vmovdqa 0x91da(%rip),%ymm4 # 2c1a0 <_sk_overlay_sse2_8bit+0xa93> DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0 DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -33080,14 +33421,14 @@ _sk_load_bgra_hsw_8bit LABEL PROC DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,213 ; ja 229f6 <_sk_load_bgra_hsw_8bit+0x2e> + DB 119,213 ; ja 22fbe <_sk_load_bgra_hsw_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 22b44 <_sk_load_bgra_hsw_8bit+0x17c> + DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 2310c <_sk_load_bgra_hsw_8bit+0x17c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0 - DB 235,185 ; jmp 229f6 <_sk_load_bgra_hsw_8bit+0x2e> + DB 235,185 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e> DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -33095,7 +33436,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4 DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4 DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0 - DB 235,144 ; jmp 229f6 <_sk_load_bgra_hsw_8bit+0x2e> + DB 235,144 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e> DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -33108,7 +33449,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0 DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4 DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0 - DB 233,65,255,255,255 ; jmpq 229f6 <_sk_load_bgra_hsw_8bit+0x2e> + DB 233,65,255,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e> DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -33117,7 +33458,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1 DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0 DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1 - DB 233,5,255,255,255 ; jmpq 229f0 <_sk_load_bgra_hsw_8bit+0x28> + DB 233,5,255,255,255 ; jmpq 22fb8 <_sk_load_bgra_hsw_8bit+0x28> DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -33131,7 +33472,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0 DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4 DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1 - DB 233,181,254,255,255 ; jmpq 229f6 <_sk_load_bgra_hsw_8bit+0x2e> + DB 233,181,254,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e> DB 15,31,0 ; nopl (%rax) DB 241 ; icebp DB 254 ; (bad) @@ -33180,10 +33521,10 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,35 ; jne 22bc4 <_sk_load_bgra_dst_hsw_8bit+0x44> + DB 117,35 ; jne 2318c <_sk_load_bgra_dst_hsw_8bit+0x44> DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3 DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2 - DB 197,253,111,37,42,144,0,0 ; vmovdqa 0x902a(%rip),%ymm4 # 2bbe0 <_sk_overlay_sse2_8bit+0xabf> + DB 197,253,111,37,66,144,0,0 ; vmovdqa 0x9042(%rip),%ymm4 # 2c1c0 <_sk_overlay_sse2_8bit+0xab3> DB 196,226,109,0,212 ; vpshufb %ymm4,%ymm2,%ymm2 DB 196,226,101,0,220 ; vpshufb %ymm4,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -33193,14 +33534,14 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,213 ; ja 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e> + DB 119,213 ; ja 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 22cfc <_sk_load_bgra_dst_hsw_8bit+0x17c> + DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 232c4 <_sk_load_bgra_dst_hsw_8bit+0x17c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2 - DB 235,185 ; jmp 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e> + DB 235,185 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e> DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2 DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -33208,7 +33549,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4 DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4 DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2 - DB 235,144 ; jmp 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e> + DB 235,144 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e> DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2 DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -33221,7 +33562,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2 DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4 DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2 - DB 233,65,255,255,255 ; jmpq 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e> + DB 233,65,255,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e> DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2 DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -33230,7 +33571,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3 DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2 DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3 - DB 233,5,255,255,255 ; jmpq 22ba8 <_sk_load_bgra_dst_hsw_8bit+0x28> + DB 233,5,255,255,255 ; jmpq 23170 <_sk_load_bgra_dst_hsw_8bit+0x28> DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2 DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -33244,7 +33585,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2 DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4 DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3 - DB 233,181,254,255,255 ; jmpq 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e> + DB 233,181,254,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e> DB 15,31,0 ; nopl (%rax) DB 241 ; icebp DB 254 ; (bad) @@ -33292,11 +33633,11 @@ _sk_store_bgra_hsw_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx - DB 197,253,111,37,164,142,0,0 ; vmovdqa 0x8ea4(%rip),%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0xadf> + DB 197,253,111,37,188,142,0,0 ; vmovdqa 0x8ebc(%rip),%ymm4 # 2c1e0 <_sk_overlay_sse2_8bit+0xad3> DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5 DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4 DB 77,133,201 ; test %r9,%r9 - DB 117,17 ; jne 22d7c <_sk_store_bgra_hsw_8bit+0x44> + DB 117,17 ; jne 23344 <_sk_store_bgra_hsw_8bit+0x44> DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4) DB 196,161,126,127,108,130,32 ; vmovdqu %ymm5,0x20(%rdx,%r8,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -33304,17 +33645,17 @@ _sk_store_bgra_hsw_8bit LABEL PROC DB 65,128,225,15 ; and $0xf,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,239 ; ja 22d78 <_sk_store_bgra_hsw_8bit+0x40> + DB 119,239 ; ja 23340 <_sk_store_bgra_hsw_8bit+0x40> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 22e44 <_sk_store_bgra_hsw_8bit+0x10c> + DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 2340c <_sk_store_bgra_hsw_8bit+0x10c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,161,121,126,36,130 ; vmovd %xmm4,(%rdx,%r8,4) - DB 235,211 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40> + DB 235,211 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40> DB 196,163,121,22,100,130,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4) DB 196,161,121,214,36,130 ; vmovq %xmm4,(%rdx,%r8,4) - DB 235,195 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40> + DB 235,195 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40> DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5 DB 196,163,121,22,108,130,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4) DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5 @@ -33322,12 +33663,12 @@ _sk_store_bgra_hsw_8bit LABEL PROC DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5 DB 196,161,121,126,108,130,16 ; vmovd %xmm5,0x10(%rdx,%r8,4) DB 196,161,122,127,36,130 ; vmovdqu %xmm4,(%rdx,%r8,4) - DB 235,146 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40> + DB 235,146 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40> DB 196,163,121,22,108,130,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4) DB 196,163,121,22,108,130,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4) DB 196,161,121,126,108,130,32 ; vmovd %xmm5,0x20(%rdx,%r8,4) DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4) - DB 233,112,255,255,255 ; jmpq 22d78 <_sk_store_bgra_hsw_8bit+0x40> + DB 233,112,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40> DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6 DB 196,163,121,22,116,130,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4) DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6 @@ -33336,7 +33677,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC DB 196,161,121,126,116,130,48 ; vmovd %xmm6,0x30(%rdx,%r8,4) DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4) DB 196,161,122,127,108,130,32 ; vmovdqu %xmm5,0x20(%rdx,%r8,4) - DB 233,53,255,255,255 ; jmpq 22d78 <_sk_store_bgra_hsw_8bit+0x40> + DB 233,53,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40> DB 144 ; nop DB 89 ; pop %rcx DB 255 ; (bad) @@ -33349,7 +33690,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 127,255 ; jg 22e59 <_sk_store_bgra_hsw_8bit+0x121> + DB 127,255 ; jg 23421 <_sk_store_bgra_hsw_8bit+0x121> DB 255 ; (bad) DB 255,113,255 ; pushq -0x1(%rcx) DB 255 ; (bad) @@ -33385,7 +33726,7 @@ _sk_load_a8_hsw_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,35 ; jne 22ec0 <_sk_load_a8_hsw_8bit+0x40> + DB 117,35 ; jne 23488 <_sk_load_a8_hsw_8bit+0x40> DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0 DB 197,249,112,200,78 ; vpshufd $0x4e,%xmm0,%xmm1 DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1 @@ -33398,35 +33739,35 @@ _sk_load_a8_hsw_8bit LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,210 ; ja 22ea3 <_sk_load_a8_hsw_8bit+0x23> + DB 119,210 ; ja 2346b <_sk_load_a8_hsw_8bit+0x23> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 22f9c <_sk_load_a8_hsw_8bit+0x11c> + DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 23564 <_sk_load_a8_hsw_8bit+0x11c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,179 ; jmp 22ea3 <_sk_load_a8_hsw_8bit+0x23> + DB 235,179 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0 DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0 - DB 235,150 ; jmp 22ea3 <_sk_load_a8_hsw_8bit+0x23> + DB 235,150 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0 DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,105,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23> + DB 233,105,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0 DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,60,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23> + DB 233,60,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0 @@ -33434,7 +33775,7 @@ _sk_load_a8_hsw_8bit LABEL PROC DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1 DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1 DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0 - DB 233,7,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23> + DB 233,7,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23> DB 73,255 ; rex.WB (bad) DB 255 ; (bad) DB 255,96,255 ; jmpq *-0x1(%rax) @@ -33444,7 +33785,7 @@ _sk_load_a8_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 125,255 ; jge 22fb1 <_sk_load_a8_hsw_8bit+0x131> + DB 125,255 ; jge 23579 <_sk_load_a8_hsw_8bit+0x131> DB 255 ; (bad) DB 255,113,255 ; pushq -0x1(%rcx) DB 255 ; (bad) @@ -33479,7 +33820,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,35 ; jne 23018 <_sk_load_a8_dst_hsw_8bit+0x40> + DB 117,35 ; jne 235e0 <_sk_load_a8_dst_hsw_8bit+0x40> DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2 DB 197,249,112,218,78 ; vpshufd $0x4e,%xmm2,%xmm3 DB 196,226,125,49,219 ; vpmovzxbd %xmm3,%ymm3 @@ -33492,35 +33833,35 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,210 ; ja 22ffb <_sk_load_a8_dst_hsw_8bit+0x23> + DB 119,210 ; ja 235c3 <_sk_load_a8_dst_hsw_8bit+0x23> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 230f4 <_sk_load_a8_dst_hsw_8bit+0x11c> + DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 236bc <_sk_load_a8_dst_hsw_8bit+0x11c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 197,249,110,208 ; vmovd %eax,%xmm2 - DB 235,179 ; jmp 22ffb <_sk_load_a8_dst_hsw_8bit+0x23> + DB 235,179 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2 DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax DB 197,249,110,216 ; vmovd %eax,%xmm3 DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2 - DB 235,150 ; jmp 22ffb <_sk_load_a8_dst_hsw_8bit+0x23> + DB 235,150 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2 DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3 DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2 - DB 233,105,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23> + DB 233,105,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2 DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3 DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2 - DB 233,60,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23> + DB 233,60,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2 @@ -33528,7 +33869,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3 DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3 DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2 - DB 233,7,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23> + DB 233,7,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23> DB 73,255 ; rex.WB (bad) DB 255 ; (bad) DB 255,96,255 ; jmpq *-0x1(%rax) @@ -33538,7 +33879,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 125,255 ; jge 23109 <_sk_load_a8_dst_hsw_8bit+0x131> + DB 125,255 ; jge 236d1 <_sk_load_a8_dst_hsw_8bit+0x131> DB 255 ; (bad) DB 255,113,255 ; pushq -0x1(%rcx) DB 255 ; (bad) @@ -33572,49 +33913,49 @@ _sk_store_a8_hsw_8bit LABEL PROC DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx - DB 197,253,111,37,208,138,0,0 ; vmovdqa 0x8ad0(%rip),%ymm4 # 2bc20 <_sk_overlay_sse2_8bit+0xaff> + DB 197,253,111,37,232,138,0,0 ; vmovdqa 0x8ae8(%rip),%ymm4 # 2c200 <_sk_overlay_sse2_8bit+0xaf3> DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5 DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5 - DB 197,249,111,53,205,148,0,0 ; vmovdqa 0x94cd(%rip),%xmm6 # 2c630 <_sk_overlay_sse2_8bit+0x150f> + DB 197,249,111,53,229,148,0,0 ; vmovdqa 0x94e5(%rip),%xmm6 # 2cc10 <_sk_overlay_sse2_8bit+0x1503> DB 196,226,81,0,238 ; vpshufb %xmm6,%xmm5,%xmm5 DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4 DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4 DB 196,226,89,0,230 ; vpshufb %xmm6,%xmm4,%xmm4 DB 197,217,108,229 ; vpunpcklqdq %xmm5,%xmm4,%xmm4 DB 77,133,201 ; test %r9,%r9 - DB 117,10 ; jne 2318b <_sk_store_a8_hsw_8bit+0x5b> + DB 117,10 ; jne 23753 <_sk_store_a8_hsw_8bit+0x5b> DB 196,161,122,127,36,2 ; vmovdqu %xmm4,(%rdx,%r8,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 65,128,225,15 ; and $0xf,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,239 ; ja 23187 <_sk_store_a8_hsw_8bit+0x57> + DB 119,239 ; ja 2374f <_sk_store_a8_hsw_8bit+0x57> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 2322c <_sk_store_a8_hsw_8bit+0xfc> + DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 237f4 <_sk_store_a8_hsw_8bit+0xfc> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,163,121,20,36,2,0 ; vpextrb $0x0,%xmm4,(%rdx,%r8,1) - DB 235,210 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57> + DB 235,210 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57> DB 196,163,121,20,100,2,2,2 ; vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1) DB 196,163,121,21,36,2,0 ; vpextrw $0x0,%xmm4,(%rdx,%r8,1) - DB 235,193 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57> + DB 235,193 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57> DB 196,163,121,20,100,2,6,6 ; vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1) DB 196,163,121,20,100,2,5,5 ; vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1) DB 196,163,121,20,100,2,4,4 ; vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1) DB 196,161,121,126,36,2 ; vmovd %xmm4,(%rdx,%r8,1) - DB 235,161 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57> + DB 235,161 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57> DB 196,163,121,20,100,2,10,10 ; vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1) DB 196,163,121,20,100,2,9,9 ; vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1) DB 196,163,121,20,100,2,8,8 ; vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1) - DB 235,32 ; jmp 23220 <_sk_store_a8_hsw_8bit+0xf0> + DB 235,32 ; jmp 237e8 <_sk_store_a8_hsw_8bit+0xf0> DB 196,163,121,20,100,2,14,14 ; vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1) DB 196,163,121,20,100,2,13,13 ; vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1) DB 196,163,121,20,100,2,12,12 ; vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1) DB 196,163,121,22,100,2,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1) DB 196,161,121,214,36,2 ; vmovq %xmm4,(%rdx,%r8,1) - DB 233,92,255,255,255 ; jmpq 23187 <_sk_store_a8_hsw_8bit+0x57> + DB 233,92,255,255,255 ; jmpq 2374f <_sk_store_a8_hsw_8bit+0x57> DB 144 ; nop DB 128,255,255 ; cmp $0xff,%bh DB 255,145,255,255,255,137 ; callq *-0x76000001(%rcx) @@ -33660,15 +34001,15 @@ _sk_load_g8_hsw_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,61 ; jne 232c2 <_sk_load_g8_hsw_8bit+0x5a> + DB 117,61 ; jne 2388a <_sk_load_g8_hsw_8bit+0x5a> DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0 DB 196,226,125,49,200 ; vpmovzxbd %xmm0,%ymm1 DB 197,249,112,192,78 ; vpshufd $0x4e,%xmm0,%xmm0 DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0 - DB 196,226,125,88,37,125,132,0,0 ; vpbroadcastd 0x847d(%rip),%ymm4 # 2b720 <_sk_overlay_sse2_8bit+0x5ff> + DB 196,226,125,88,37,161,132,0,0 ; vpbroadcastd 0x84a1(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff> DB 196,226,125,64,236 ; vpmulld %ymm4,%ymm0,%ymm5 DB 196,226,117,64,196 ; vpmulld %ymm4,%ymm1,%ymm0 - DB 196,226,125,88,13,110,132,0,0 ; vpbroadcastd 0x846e(%rip),%ymm1 # 2b724 <_sk_overlay_sse2_8bit+0x603> + DB 196,226,125,88,13,146,132,0,0 ; vpbroadcastd 0x8492(%rip),%ymm1 # 2bd10 <_sk_overlay_sse2_8bit+0x603> DB 197,253,235,193 ; vpor %ymm1,%ymm0,%ymm0 DB 197,213,235,201 ; vpor %ymm1,%ymm5,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -33677,35 +34018,35 @@ _sk_load_g8_hsw_8bit LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,184 ; ja 2328b <_sk_load_g8_hsw_8bit+0x23> + DB 119,184 ; ja 23853 <_sk_load_g8_hsw_8bit+0x23> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 233a4 <_sk_load_g8_hsw_8bit+0x13c> + DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 2396c <_sk_load_g8_hsw_8bit+0x13c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,153 ; jmp 2328b <_sk_load_g8_hsw_8bit+0x23> + DB 235,153 ; jmp 23853 <_sk_load_g8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0 DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0 - DB 233,121,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23> + DB 233,121,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0 DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,76,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23> + DB 233,76,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0 DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,31,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23> + DB 233,31,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0 DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0 @@ -33713,7 +34054,7 @@ _sk_load_g8_hsw_8bit LABEL PROC DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1 DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1 DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0 - DB 233,234,254,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23> + DB 233,234,254,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23> DB 15,31,0 ; nopl (%rax) DB 67,255 ; rex.XB (bad) DB 255 ; (bad) @@ -33725,7 +34066,7 @@ _sk_load_g8_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 122,255 ; jp 233b9 <_sk_load_g8_hsw_8bit+0x151> + DB 122,255 ; jp 23981 <_sk_load_g8_hsw_8bit+0x151> DB 255 ; (bad) DB 255,110,255 ; ljmp *-0x1(%rsi) DB 255 ; (bad) @@ -33759,15 +34100,15 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,61 ; jne 2343a <_sk_load_g8_dst_hsw_8bit+0x5a> + DB 117,61 ; jne 23a02 <_sk_load_g8_dst_hsw_8bit+0x5a> DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2 DB 196,226,125,49,218 ; vpmovzxbd %xmm2,%ymm3 DB 197,249,112,210,78 ; vpshufd $0x4e,%xmm2,%xmm2 DB 196,226,125,49,210 ; vpmovzxbd %xmm2,%ymm2 - DB 196,226,125,88,37,5,131,0,0 ; vpbroadcastd 0x8305(%rip),%ymm4 # 2b720 <_sk_overlay_sse2_8bit+0x5ff> + DB 196,226,125,88,37,41,131,0,0 ; vpbroadcastd 0x8329(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff> DB 196,226,109,64,236 ; vpmulld %ymm4,%ymm2,%ymm5 DB 196,226,101,64,212 ; vpmulld %ymm4,%ymm3,%ymm2 - DB 196,226,125,88,29,246,130,0,0 ; vpbroadcastd 0x82f6(%rip),%ymm3 # 2b724 <_sk_overlay_sse2_8bit+0x603> + DB 196,226,125,88,29,26,131,0,0 ; vpbroadcastd 0x831a(%rip),%ymm3 # 2bd10 <_sk_overlay_sse2_8bit+0x603> DB 197,237,235,211 ; vpor %ymm3,%ymm2,%ymm2 DB 197,213,235,219 ; vpor %ymm3,%ymm5,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -33776,35 +34117,35 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,184 ; ja 23403 <_sk_load_g8_dst_hsw_8bit+0x23> + DB 119,184 ; ja 239cb <_sk_load_g8_dst_hsw_8bit+0x23> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 2351c <_sk_load_g8_dst_hsw_8bit+0x13c> + DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 23ae4 <_sk_load_g8_dst_hsw_8bit+0x13c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 197,249,110,208 ; vmovd %eax,%xmm2 - DB 235,153 ; jmp 23403 <_sk_load_g8_dst_hsw_8bit+0x23> + DB 235,153 ; jmp 239cb <_sk_load_g8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2 DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax DB 197,249,110,216 ; vmovd %eax,%xmm3 DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2 - DB 233,121,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23> + DB 233,121,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2 DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3 DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2 - DB 233,76,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23> + DB 233,76,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2 DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3 DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2 - DB 233,31,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23> + DB 233,31,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23> DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2 DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2 DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2 @@ -33812,7 +34153,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3 DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3 DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2 - DB 233,234,254,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23> + DB 233,234,254,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23> DB 15,31,0 ; nopl (%rax) DB 67,255 ; rex.XB (bad) DB 255 ; (bad) @@ -33824,7 +34165,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 122,255 ; jp 23531 <_sk_load_g8_dst_hsw_8bit+0x151> + DB 122,255 ; jp 23af9 <_sk_load_g8_dst_hsw_8bit+0x151> DB 255 ; (bad) DB 255,110,255 ; ljmp *-0x1(%rsi) DB 255 ; (bad) @@ -33859,10 +34200,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,192 ; test %r8,%r8 - DB 15,133,222,0,0,0 ; jne 2365b <_sk_srcover_rgba_8888_hsw_8bit+0x103> + DB 15,133,222,0,0,0 ; jne 23c23 <_sk_srcover_rgba_8888_hsw_8bit+0x103> DB 196,33,126,111,76,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%ymm9 DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11 - DB 197,253,111,53,174,134,0,0 ; vmovdqa 0x86ae(%rip),%ymm6 # 2bc40 <_sk_overlay_sse2_8bit+0xb1f> + DB 197,253,111,53,198,134,0,0 ; vmovdqa 0x86c6(%rip),%ymm6 # 2c220 <_sk_overlay_sse2_8bit+0xb13> DB 196,226,117,0,254 ; vpshufb %ymm6,%ymm1,%ymm7 DB 196,226,125,0,246 ; vpshufb %ymm6,%ymm0,%ymm6 DB 196,66,125,48,195 ; vpmovzxbw %xmm11,%ymm8 @@ -33900,7 +34241,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 197,221,252,224 ; vpaddb %ymm0,%ymm4,%ymm4 DB 197,213,252,233 ; vpaddb %ymm1,%ymm5,%ymm5 DB 77,133,192 ; test %r8,%r8 - DB 117,72 ; jne 23692 <_sk_srcover_rgba_8888_hsw_8bit+0x13a> + DB 117,72 ; jne 23c5a <_sk_srcover_rgba_8888_hsw_8bit+0x13a> DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4) DB 196,161,126,127,108,138,32 ; vmovdqu %ymm5,0x20(%rdx,%r9,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -33911,25 +34252,25 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 196,65,37,239,219 ; vpxor %ymm11,%ymm11,%ymm11 DB 254,200 ; dec %al DB 60,14 ; cmp $0xe,%al - DB 15,135,22,255,255,255 ; ja 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32> + DB 15,135,22,255,255,255 ; ja 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32> DB 15,182,192 ; movzbl %al,%eax - DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 23868 <_sk_srcover_rgba_8888_hsw_8bit+0x310> + DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 23e30 <_sk_srcover_rgba_8888_hsw_8bit+0x310> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,33,121,110,28,138 ; vmovd (%rdx,%r9,4),%xmm11 - DB 233,248,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32> + DB 233,248,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32> DB 65,128,224,15 ; and $0xf,%r8b DB 65,254,200 ; dec %r8b DB 65,128,248,14 ; cmp $0xe,%r8b - DB 119,184 ; ja 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff> + DB 119,184 ; ja 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff> DB 65,15,182,192 ; movzbl %r8b,%eax - DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 238a4 <_sk_srcover_rgba_8888_hsw_8bit+0x34c> + DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 23e6c <_sk_srcover_rgba_8888_hsw_8bit+0x34c> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 196,161,121,126,36,138 ; vmovd %xmm4,(%rdx,%r9,4) - DB 235,156 ; jmp 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff> + DB 235,156 ; jmp 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff> DB 196,161,121,110,100,138,8 ; vmovd 0x8(%rdx,%r9,4),%xmm4 DB 196,226,121,89,236 ; vpbroadcastq %xmm4,%xmm5 DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9 @@ -33937,7 +34278,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 196,162,121,53,52,138 ; vpmovzxdq (%rdx,%r9,4),%xmm6 DB 197,249,112,246,232 ; vpshufd $0xe8,%xmm6,%xmm6 DB 196,99,37,2,222,3 ; vpblendd $0x3,%ymm6,%ymm11,%ymm11 - DB 233,162,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32> + DB 233,162,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32> DB 196,161,121,110,100,138,24 ; vmovd 0x18(%rdx,%r9,4),%xmm4 DB 196,226,125,89,236 ; vpbroadcastq %xmm4,%ymm5 DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9 @@ -33950,7 +34291,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 196,99,37,56,222,1 ; vinserti128 $0x1,%xmm6,%ymm11,%ymm11 DB 196,161,122,111,52,138 ; vmovdqu (%rdx,%r9,4),%xmm6 DB 196,67,77,2,219,240 ; vpblendd $0xf0,%ymm11,%ymm6,%ymm11 - DB 233,82,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32> + DB 233,82,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32> DB 196,161,121,110,100,138,40 ; vmovd 0x28(%rdx,%r9,4),%xmm4 DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 @@ -33959,7 +34300,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 196,99,53,2,205,15 ; vpblendd $0xf,%ymm5,%ymm9,%ymm9 DB 196,161,121,110,108,138,32 ; vmovd 0x20(%rdx,%r9,4),%xmm5 DB 196,99,53,2,205,1 ; vpblendd $0x1,%ymm5,%ymm9,%ymm9 - DB 233,22,254,255,255 ; jmpq 23584 <_sk_srcover_rgba_8888_hsw_8bit+0x2c> + DB 233,22,254,255,255 ; jmpq 23b4c <_sk_srcover_rgba_8888_hsw_8bit+0x2c> DB 196,161,121,110,100,138,56 ; vmovd 0x38(%rdx,%r9,4),%xmm4 DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 @@ -33973,10 +34314,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11 DB 196,161,122,111,116,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%xmm6 DB 196,67,77,2,201,240 ; vpblendd $0xf0,%ymm9,%ymm6,%ymm9 - DB 233,198,253,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32> + DB 233,198,253,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32> DB 196,163,121,22,100,138,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4) DB 196,161,121,214,36,138 ; vmovq %xmm4,(%rdx,%r9,4) - DB 233,128,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff> + DB 233,128,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff> DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5 DB 196,163,121,22,108,138,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4) DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5 @@ -33984,12 +34325,12 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5 DB 196,161,121,126,108,138,16 ; vmovd %xmm5,0x10(%rdx,%r9,4) DB 196,161,122,127,36,138 ; vmovdqu %xmm4,(%rdx,%r9,4) - DB 233,76,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff> + DB 233,76,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff> DB 196,163,121,22,108,138,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4) DB 196,163,121,22,108,138,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4) DB 196,161,121,126,108,138,32 ; vmovd %xmm5,0x20(%rdx,%r9,4) DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4) - DB 233,42,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff> + DB 233,42,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff> DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6 DB 196,163,121,22,116,138,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4) DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6 @@ -33998,7 +34339,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 196,161,121,126,116,138,48 ; vmovd %xmm6,0x30(%rdx,%r9,4) DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4) DB 196,161,122,127,108,138,32 ; vmovdqu %xmm5,0x20(%rdx,%r9,4) - DB 233,239,253,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff> + DB 233,239,253,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff> DB 31 ; (bad) DB 254 ; (bad) DB 255 ; (bad) @@ -34048,7 +34389,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 126,255 ; jle 238c1 <_sk_srcover_rgba_8888_hsw_8bit+0x369> + DB 126,255 ; jle 23e89 <_sk_srcover_rgba_8888_hsw_8bit+0x369> DB 255 ; (bad) DB 255,119,255 ; pushq -0x1(%rdi) DB 255 ; (bad) @@ -34068,7 +34409,7 @@ PUBLIC _sk_scale_1_float_hsw_8bit _sk_scale_1_float_hsw_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 197,250,16,32 ; vmovss (%rax),%xmm4 - DB 197,218,89,37,206,124,0,0 ; vmulss 0x7cce(%rip),%xmm4,%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 197,218,89,37,242,124,0,0 ; vmulss 0x7cf2(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 197,250,44,196 ; vcvttss2si %xmm4,%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4 @@ -34078,7 +34419,7 @@ _sk_scale_1_float_hsw_8bit LABEL PROC DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6 DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1 DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1 - DB 197,221,219,37,61,131,0,0 ; vpand 0x833d(%rip),%ymm4,%ymm4 # 2bc60 <_sk_overlay_sse2_8bit+0xb3f> + DB 197,221,219,37,85,131,0,0 ; vpand 0x8355(%rip),%ymm4,%ymm4 # 2c240 <_sk_overlay_sse2_8bit+0xb33> DB 197,221,213,249 ; vpmullw %ymm1,%ymm4,%ymm7 DB 197,93,213,198 ; vpmullw %ymm6,%ymm4,%ymm8 DB 197,93,213,200 ; vpmullw %ymm0,%ymm4,%ymm9 @@ -34110,12 +34451,12 @@ _sk_scale_u8_hsw_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 15,133,191,0,0,0 ; jne 23a5b <_sk_scale_u8_hsw_8bit+0xe0> + DB 15,133,191,0,0,0 ; jne 24023 <_sk_scale_u8_hsw_8bit+0xe0> DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4 DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5 DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4 DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4 - DB 197,253,111,53,199,130,0,0 ; vmovdqa 0x82c7(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0xb5f> + DB 197,253,111,53,223,130,0,0 ; vmovdqa 0x82df(%rip),%ymm6 # 2c260 <_sk_overlay_sse2_8bit+0xb53> DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4 DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5 DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6 @@ -34154,35 +34495,35 @@ _sk_scale_u8_hsw_8bit LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 15,135,50,255,255,255 ; ja 239a2 <_sk_scale_u8_hsw_8bit+0x27> + DB 15,135,50,255,255,255 ; ja 23f6a <_sk_scale_u8_hsw_8bit+0x27> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 23b44 <_sk_scale_u8_hsw_8bit+0x1c9> + DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 2410c <_sk_scale_u8_hsw_8bit+0x1c9> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 233,16,255,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27> + DB 233,16,255,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4 DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax DB 197,249,110,232 ; vmovd %eax,%xmm5 DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4 - DB 233,240,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27> + DB 233,240,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4 DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5 DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4 - DB 233,195,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27> + DB 233,195,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4 DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5 DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4 - DB 233,150,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27> + DB 233,150,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4 @@ -34190,7 +34531,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5 DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5 DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4 - DB 233,97,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27> + DB 233,97,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27> DB 15,31,0 ; nopl (%rax) DB 64,255 ; rex (bad) DB 255 ; (bad) @@ -34202,7 +34543,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 122,255 ; jp 23b59 <_sk_scale_u8_hsw_8bit+0x1de> + DB 122,255 ; jp 24121 <_sk_scale_u8_hsw_8bit+0x1de> DB 255 ; (bad) DB 255,110,255 ; ljmp *-0x1(%rsi) DB 255 ; (bad) @@ -34230,7 +34571,7 @@ PUBLIC _sk_lerp_1_float_hsw_8bit _sk_lerp_1_float_hsw_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 197,250,16,32 ; vmovss (%rax),%xmm4 - DB 197,218,89,37,46,122,0,0 ; vmulss 0x7a2e(%rip),%xmm4,%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 197,218,89,37,82,122,0,0 ; vmulss 0x7a52(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 197,250,44,196 ; vcvttss2si %xmm4,%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4 @@ -34240,7 +34581,7 @@ _sk_lerp_1_float_hsw_8bit LABEL PROC DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6 DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1 DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1 - DB 197,221,219,61,221,128,0,0 ; vpand 0x80dd(%rip),%ymm4,%ymm7 # 2bca0 <_sk_overlay_sse2_8bit+0xb7f> + DB 197,221,219,61,245,128,0,0 ; vpand 0x80f5(%rip),%ymm4,%ymm7 # 2c280 <_sk_overlay_sse2_8bit+0xb73> DB 197,69,213,193 ; vpmullw %ymm1,%ymm7,%ymm8 DB 197,69,213,206 ; vpmullw %ymm6,%ymm7,%ymm9 DB 197,69,213,208 ; vpmullw %ymm0,%ymm7,%ymm10 @@ -34303,12 +34644,12 @@ _sk_lerp_u8_hsw_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 15,133,106,1,0,0 ; jne 23e3b <_sk_lerp_u8_hsw_8bit+0x18b> + DB 15,133,106,1,0,0 ; jne 24403 <_sk_lerp_u8_hsw_8bit+0x18b> DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4 DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5 DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4 DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4 - DB 197,253,111,53,210,127,0,0 ; vmovdqa 0x7fd2(%rip),%ymm6 # 2bcc0 <_sk_overlay_sse2_8bit+0xb9f> + DB 197,253,111,53,234,127,0,0 ; vmovdqa 0x7fea(%rip),%ymm6 # 2c2a0 <_sk_overlay_sse2_8bit+0xb93> DB 196,98,93,0,206 ; vpshufb %ymm6,%ymm4,%ymm9 DB 196,98,85,0,222 ; vpshufb %ymm6,%ymm5,%ymm11 DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6 @@ -34382,35 +34723,35 @@ _sk_lerp_u8_hsw_8bit LABEL PROC DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 15,135,135,254,255,255 ; ja 23cd7 <_sk_lerp_u8_hsw_8bit+0x27> + DB 15,135,135,254,255,255 ; ja 2429f <_sk_lerp_u8_hsw_8bit+0x27> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 23f24 <_sk_lerp_u8_hsw_8bit+0x274> + DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 244ec <_sk_lerp_u8_hsw_8bit+0x274> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 197,249,110,224 ; vmovd %eax,%xmm4 - DB 233,101,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27> + DB 233,101,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4 DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax DB 197,249,110,232 ; vmovd %eax,%xmm5 DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4 - DB 233,69,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27> + DB 233,69,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4 DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5 DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4 - DB 233,24,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27> + DB 233,24,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4 DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5 DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4 - DB 233,235,253,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27> + DB 233,235,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27> DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4 DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4 DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4 @@ -34418,7 +34759,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5 DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5 DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4 - DB 233,182,253,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27> + DB 233,182,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27> DB 15,31,0 ; nopl (%rax) DB 64,255 ; rex (bad) DB 255 ; (bad) @@ -34430,7 +34771,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 122,255 ; jp 23f39 <_sk_lerp_u8_hsw_8bit+0x289> + DB 122,255 ; jp 24501 <_sk_lerp_u8_hsw_8bit+0x289> DB 255 ; (bad) DB 255,110,255 ; ljmp *-0x1(%rsi) DB 255 ; (bad) @@ -34471,7 +34812,7 @@ _sk_move_dst_src_hsw_8bit LABEL PROC PUBLIC _sk_black_color_hsw_8bit _sk_black_color_hsw_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,161,119,0,0 ; vbroadcastss 0x77a1(%rip),%ymm0 # 2b724 <_sk_overlay_sse2_8bit+0x603> + DB 196,226,125,24,5,197,119,0,0 ; vbroadcastss 0x77c5(%rip),%ymm0 # 2bd10 <_sk_overlay_sse2_8bit+0x603> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 255,224 ; jmpq *%rax @@ -34491,7 +34832,7 @@ _sk_clear_hsw_8bit LABEL PROC PUBLIC _sk_srcatop_hsw_8bit _sk_srcatop_hsw_8bit LABEL PROC - DB 197,125,111,5,55,125,0,0 ; vmovdqa 0x7d37(%rip),%ymm8 # 2bce0 <_sk_overlay_sse2_8bit+0xbbf> + DB 197,125,111,5,79,125,0,0 ; vmovdqa 0x7d4f(%rip),%ymm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xbb3> DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4 DB 196,194,109,0,232 ; vpshufb %ymm8,%ymm2,%ymm5 DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10 @@ -34566,7 +34907,7 @@ _sk_srcatop_hsw_8bit LABEL PROC PUBLIC _sk_dstatop_hsw_8bit _sk_dstatop_hsw_8bit LABEL PROC - DB 197,125,111,5,242,123,0,0 ; vmovdqa 0x7bf2(%rip),%ymm8 # 2bd00 <_sk_overlay_sse2_8bit+0xbdf> + DB 197,125,111,5,10,124,0,0 ; vmovdqa 0x7c0a(%rip),%ymm8 # 2c2e0 <_sk_overlay_sse2_8bit+0xbd3> DB 196,194,117,0,224 ; vpshufb %ymm8,%ymm1,%ymm4 DB 196,194,125,0,232 ; vpshufb %ymm8,%ymm0,%ymm5 DB 196,98,125,48,210 ; vpmovzxbw %xmm2,%ymm10 @@ -34641,7 +34982,7 @@ _sk_dstatop_hsw_8bit LABEL PROC PUBLIC _sk_srcin_hsw_8bit _sk_srcin_hsw_8bit LABEL PROC - DB 197,253,111,37,169,122,0,0 ; vmovdqa 0x7aa9(%rip),%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0xbff> + DB 197,253,111,37,193,122,0,0 ; vmovdqa 0x7ac1(%rip),%ymm4 # 2c300 <_sk_overlay_sse2_8bit+0xbf3> DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5 DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4 DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6 @@ -34679,7 +35020,7 @@ _sk_srcin_hsw_8bit LABEL PROC PUBLIC _sk_dstin_hsw_8bit _sk_dstin_hsw_8bit LABEL PROC - DB 197,253,111,37,31,122,0,0 ; vmovdqa 0x7a1f(%rip),%ymm4 # 2bd40 <_sk_overlay_sse2_8bit+0xc1f> + DB 197,253,111,37,55,122,0,0 ; vmovdqa 0x7a37(%rip),%ymm4 # 2c320 <_sk_overlay_sse2_8bit+0xc13> DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1 DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0 DB 196,226,125,48,226 ; vpmovzxbw %xmm2,%ymm4 @@ -34717,7 +35058,7 @@ _sk_dstin_hsw_8bit LABEL PROC PUBLIC _sk_srcout_hsw_8bit _sk_srcout_hsw_8bit LABEL PROC - DB 197,253,111,37,147,121,0,0 ; vmovdqa 0x7993(%rip),%ymm4 # 2bd60 <_sk_overlay_sse2_8bit+0xc3f> + DB 197,253,111,37,171,121,0,0 ; vmovdqa 0x79ab(%rip),%ymm4 # 2c340 <_sk_overlay_sse2_8bit+0xc33> DB 196,226,109,0,236 ; vpshufb %ymm4,%ymm2,%ymm5 DB 196,226,101,0,228 ; vpshufb %ymm4,%ymm3,%ymm4 DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6 @@ -34758,7 +35099,7 @@ _sk_srcout_hsw_8bit LABEL PROC PUBLIC _sk_dstout_hsw_8bit _sk_dstout_hsw_8bit LABEL PROC - DB 197,253,111,37,253,120,0,0 ; vmovdqa 0x78fd(%rip),%ymm4 # 2bd80 <_sk_overlay_sse2_8bit+0xc5f> + DB 197,253,111,37,21,121,0,0 ; vmovdqa 0x7915(%rip),%ymm4 # 2c360 <_sk_overlay_sse2_8bit+0xc53> DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0 DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1 DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4 @@ -34799,7 +35140,7 @@ _sk_dstout_hsw_8bit LABEL PROC PUBLIC _sk_srcover_hsw_8bit _sk_srcover_hsw_8bit LABEL PROC - DB 197,253,111,37,101,120,0,0 ; vmovdqa 0x7865(%rip),%ymm4 # 2bda0 <_sk_overlay_sse2_8bit+0xc7f> + DB 197,253,111,37,125,120,0,0 ; vmovdqa 0x787d(%rip),%ymm4 # 2c380 <_sk_overlay_sse2_8bit+0xc73> DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5 DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4 DB 196,98,125,48,202 ; vpmovzxbw %xmm2,%ymm9 @@ -34841,7 +35182,7 @@ _sk_srcover_hsw_8bit LABEL PROC PUBLIC _sk_dstover_hsw_8bit _sk_dstover_hsw_8bit LABEL PROC - DB 197,253,111,37,198,119,0,0 ; vmovdqa 0x77c6(%rip),%ymm4 # 2bdc0 <_sk_overlay_sse2_8bit+0xc9f> + DB 197,253,111,37,222,119,0,0 ; vmovdqa 0x77de(%rip),%ymm4 # 2c3a0 <_sk_overlay_sse2_8bit+0xc93> DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5 DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4 DB 196,98,125,48,200 ; vpmovzxbw %xmm0,%ymm9 @@ -34921,7 +35262,7 @@ _sk_multiply_hsw_8bit LABEL PROC DB 72,131,236,56 ; sub $0x38,%rsp DB 197,253,111,243 ; vmovdqa %ymm3,%ymm6 DB 197,253,111,218 ; vmovdqa %ymm2,%ymm3 - DB 197,125,111,13,131,118,0,0 ; vmovdqa 0x7683(%rip),%ymm9 # 2bde0 <_sk_overlay_sse2_8bit+0xcbf> + DB 197,125,111,13,155,118,0,0 ; vmovdqa 0x769b(%rip),%ymm9 # 2c3c0 <_sk_overlay_sse2_8bit+0xcb3> DB 196,194,101,0,225 ; vpshufb %ymm9,%ymm3,%ymm4 DB 196,194,77,0,233 ; vpshufb %ymm9,%ymm6,%ymm5 DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10 @@ -35062,7 +35403,7 @@ _sk_screen_hsw_8bit LABEL PROC PUBLIC _sk_xor__hsw_8bit _sk_xor__hsw_8bit LABEL PROC - DB 197,125,111,13,15,116,0,0 ; vmovdqa 0x740f(%rip),%ymm9 # 2be00 <_sk_overlay_sse2_8bit+0xcdf> + DB 197,125,111,13,39,116,0,0 ; vmovdqa 0x7427(%rip),%ymm9 # 2c3e0 <_sk_overlay_sse2_8bit+0xcd3> DB 196,194,109,0,225 ; vpshufb %ymm9,%ymm2,%ymm4 DB 196,194,101,0,249 ; vpshufb %ymm9,%ymm3,%ymm7 DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -35137,9 +35478,16 @@ _sk_xor__hsw_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax +PUBLIC _sk_plus__hsw_8bit +_sk_plus__hsw_8bit LABEL PROC + DB 197,253,220,194 ; vpaddusb %ymm2,%ymm0,%ymm0 + DB 197,245,220,203 ; vpaddusb %ymm3,%ymm1,%ymm1 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + PUBLIC _sk_darken_hsw_8bit _sk_darken_hsw_8bit LABEL PROC - DB 197,125,111,5,189,114,0,0 ; vmovdqa 0x72bd(%rip),%ymm8 # 2be20 <_sk_overlay_sse2_8bit+0xcff> + DB 197,125,111,5,201,114,0,0 ; vmovdqa 0x72c9(%rip),%ymm8 # 2c400 <_sk_overlay_sse2_8bit+0xcf3> DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4 DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6 DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10 @@ -35212,7 +35560,7 @@ _sk_darken_hsw_8bit LABEL PROC DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6 DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1 DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0 - DB 196,226,125,88,37,86,106,0,0 ; vpbroadcastd 0x6a56(%rip),%ymm4 # 2b728 <_sk_overlay_sse2_8bit+0x607> + DB 196,226,125,88,37,110,106,0,0 ; vpbroadcastd 0x6a6e(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607> DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0 DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -35220,7 +35568,7 @@ _sk_darken_hsw_8bit LABEL PROC PUBLIC _sk_lighten_hsw_8bit _sk_lighten_hsw_8bit LABEL PROC - DB 197,125,111,5,86,113,0,0 ; vmovdqa 0x7156(%rip),%ymm8 # 2be40 <_sk_overlay_sse2_8bit+0xd1f> + DB 197,125,111,5,98,113,0,0 ; vmovdqa 0x7162(%rip),%ymm8 # 2c420 <_sk_overlay_sse2_8bit+0xd13> DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4 DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6 DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10 @@ -35293,7 +35641,7 @@ _sk_lighten_hsw_8bit LABEL PROC DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6 DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1 DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0 - DB 196,226,125,88,37,207,104,0,0 ; vpbroadcastd 0x68cf(%rip),%ymm4 # 2b728 <_sk_overlay_sse2_8bit+0x607> + DB 196,226,125,88,37,231,104,0,0 ; vpbroadcastd 0x68e7(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607> DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0 DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -35331,7 +35679,7 @@ _sk_exclusion_hsw_8bit LABEL PROC DB 196,227,77,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm6,%ymm7 DB 196,227,77,70,228,49 ; vperm2i128 $0x31,%ymm4,%ymm6,%ymm4 DB 197,197,103,228 ; vpackuswb %ymm4,%ymm7,%ymm4 - DB 197,253,111,53,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm6 # 2be60 <_sk_overlay_sse2_8bit+0xd3f> + DB 197,253,111,53,100,111,0,0 ; vmovdqa 0x6f64(%rip),%ymm6 # 2c440 <_sk_overlay_sse2_8bit+0xd33> DB 197,221,219,254 ; vpand %ymm6,%ymm4,%ymm7 DB 197,213,219,246 ; vpand %ymm6,%ymm5,%ymm6 DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0 @@ -35345,7 +35693,7 @@ _sk_exclusion_hsw_8bit LABEL PROC PUBLIC _sk_difference_hsw_8bit _sk_difference_hsw_8bit LABEL PROC - DB 197,125,111,5,76,111,0,0 ; vmovdqa 0x6f4c(%rip),%ymm8 # 2be80 <_sk_overlay_sse2_8bit+0xd5f> + DB 197,125,111,5,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm8 # 2c460 <_sk_overlay_sse2_8bit+0xd53> DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4 DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6 DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10 @@ -35412,7 +35760,7 @@ _sk_difference_hsw_8bit LABEL PROC DB 197,197,103,237 ; vpackuswb %ymm5,%ymm7,%ymm5 DB 197,181,218,228 ; vpminub %ymm4,%ymm9,%ymm4 DB 197,165,218,237 ; vpminub %ymm5,%ymm11,%ymm5 - DB 197,253,111,53,22,110,0,0 ; vmovdqa 0x6e16(%rip),%ymm6 # 2bea0 <_sk_overlay_sse2_8bit+0xd7f> + DB 197,253,111,53,34,110,0,0 ; vmovdqa 0x6e22(%rip),%ymm6 # 2c480 <_sk_overlay_sse2_8bit+0xd73> DB 197,213,219,254 ; vpand %ymm6,%ymm5,%ymm7 DB 197,221,219,246 ; vpand %ymm6,%ymm4,%ymm6 DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0 @@ -35436,7 +35784,7 @@ _sk_hardlight_hsw_8bit LABEL PROC DB 196,227,125,57,203,1 ; vextracti128 $0x1,%ymm1,%xmm3 DB 196,98,125,48,195 ; vpmovzxbw %xmm3,%ymm8 DB 197,126,127,132,36,64,1,0,0 ; vmovdqu %ymm8,0x140(%rsp) - DB 197,253,111,29,204,109,0,0 ; vmovdqa 0x6dcc(%rip),%ymm3 # 2bec0 <_sk_overlay_sse2_8bit+0xd9f> + DB 197,253,111,29,216,109,0,0 ; vmovdqa 0x6dd8(%rip),%ymm3 # 2c4a0 <_sk_overlay_sse2_8bit+0xd93> DB 196,226,125,0,227 ; vpshufb %ymm3,%ymm0,%ymm4 DB 196,226,117,0,203 ; vpshufb %ymm3,%ymm1,%ymm1 DB 197,125,111,251 ; vmovdqa %ymm3,%ymm15 @@ -35465,7 +35813,7 @@ _sk_hardlight_hsw_8bit LABEL PROC DB 196,65,125,111,231 ; vmovdqa %ymm15,%ymm12 DB 196,194,93,0,220 ; vpshufb %ymm12,%ymm4,%ymm3 DB 196,226,125,48,211 ; vpmovzxbw %xmm3,%ymm2 - DB 196,226,125,121,5,78,109,0,0 ; vpbroadcastw 0x6d4e(%rip),%ymm0 # 2bee0 <_sk_overlay_sse2_8bit+0xdbf> + DB 196,226,125,121,5,90,109,0,0 ; vpbroadcastw 0x6d5a(%rip),%ymm0 # 2c4c0 <_sk_overlay_sse2_8bit+0xdb3> DB 197,109,239,248 ; vpxor %ymm0,%ymm2,%ymm15 DB 197,133,213,207 ; vpmullw %ymm7,%ymm15,%ymm1 DB 197,254,127,140,36,160,1,0,0 ; vmovdqu %ymm1,0x1a0(%rsp) @@ -35565,7 +35913,7 @@ _sk_hardlight_hsw_8bit LABEL PROC DB 197,254,111,116,36,96 ; vmovdqu 0x60(%rsp),%ymm6 DB 197,205,253,180,36,128,0,0,0 ; vpaddw 0x80(%rsp),%ymm6,%ymm6 DB 196,193,53,253,252 ; vpaddw %ymm12,%ymm9,%ymm7 - DB 196,98,125,121,5,45,107,0,0 ; vpbroadcastw 0x6b2d(%rip),%ymm8 # 2bee2 <_sk_overlay_sse2_8bit+0xdc1> + DB 196,98,125,121,5,57,107,0,0 ; vpbroadcastw 0x6b39(%rip),%ymm8 # 2c4c2 <_sk_overlay_sse2_8bit+0xdb5> DB 196,193,93,253,224 ; vpaddw %ymm8,%ymm4,%ymm4 DB 197,229,253,220 ; vpaddw %ymm4,%ymm3,%ymm3 DB 196,193,85,253,224 ; vpaddw %ymm8,%ymm5,%ymm4 @@ -35574,7 +35922,7 @@ _sk_hardlight_hsw_8bit LABEL PROC DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1 DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4 DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0 - DB 196,226,125,121,37,2,107,0,0 ; vpbroadcastw 0x6b02(%rip),%ymm4 # 2bee4 <_sk_overlay_sse2_8bit+0xdc3> + DB 196,226,125,121,37,14,107,0,0 ; vpbroadcastw 0x6b0e(%rip),%ymm4 # 2c4c4 <_sk_overlay_sse2_8bit+0xdb7> DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0 DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1 DB 197,237,228,212 ; vpmulhuw %ymm4,%ymm2,%ymm2 @@ -35599,7 +35947,7 @@ PUBLIC _sk_overlay_hsw_8bit _sk_overlay_hsw_8bit LABEL PROC DB 72,129,236,24,2,0,0 ; sub $0x218,%rsp DB 197,252,17,140,36,192,1,0,0 ; vmovups %ymm1,0x1c0(%rsp) - DB 197,253,111,45,169,106,0,0 ; vmovdqa 0x6aa9(%rip),%ymm5 # 2bf00 <_sk_overlay_sse2_8bit+0xddf> + DB 197,253,111,45,181,106,0,0 ; vmovdqa 0x6ab5(%rip),%ymm5 # 2c4e0 <_sk_overlay_sse2_8bit+0xdd3> DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4 DB 196,227,125,57,225,1 ; vextracti128 $0x1,%ymm4,%xmm1 DB 196,98,125,48,193 ; vpmovzxbw %xmm1,%ymm8 @@ -35634,7 +35982,7 @@ _sk_overlay_hsw_8bit LABEL PROC DB 197,93,117,251 ; vpcmpeqw %ymm3,%ymm4,%ymm15 DB 197,253,111,216 ; vmovdqa %ymm0,%ymm3 DB 196,226,125,48,227 ; vpmovzxbw %xmm3,%ymm4 - DB 196,226,125,121,5,3,106,0,0 ; vpbroadcastw 0x6a03(%rip),%ymm0 # 2bf20 <_sk_overlay_sse2_8bit+0xdff> + DB 196,226,125,121,5,15,106,0,0 ; vpbroadcastw 0x6a0f(%rip),%ymm0 # 2c500 <_sk_overlay_sse2_8bit+0xdf3> DB 197,117,239,232 ; vpxor %ymm0,%ymm1,%ymm13 DB 197,21,213,212 ; vpmullw %ymm4,%ymm13,%ymm10 DB 197,126,127,148,36,64,1,0,0 ; vmovdqu %ymm10,0x140(%rsp) @@ -35735,7 +36083,7 @@ _sk_overlay_hsw_8bit LABEL PROC DB 197,254,111,116,36,64 ; vmovdqu 0x40(%rsp),%ymm6 DB 197,205,253,116,36,96 ; vpaddw 0x60(%rsp),%ymm6,%ymm6 DB 196,193,29,253,253 ; vpaddw %ymm13,%ymm12,%ymm7 - DB 196,98,125,121,5,246,103,0,0 ; vpbroadcastw 0x67f6(%rip),%ymm8 # 2bf22 <_sk_overlay_sse2_8bit+0xe01> + DB 196,98,125,121,5,2,104,0,0 ; vpbroadcastw 0x6802(%rip),%ymm8 # 2c502 <_sk_overlay_sse2_8bit+0xdf5> DB 196,193,109,253,208 ; vpaddw %ymm8,%ymm2,%ymm2 DB 197,229,253,210 ; vpaddw %ymm2,%ymm3,%ymm2 DB 196,193,85,253,216 ; vpaddw %ymm8,%ymm5,%ymm3 @@ -35744,7 +36092,7 @@ _sk_overlay_hsw_8bit LABEL PROC DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1 DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4 DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0 - DB 196,226,125,121,37,203,103,0,0 ; vpbroadcastw 0x67cb(%rip),%ymm4 # 2bf24 <_sk_overlay_sse2_8bit+0xe03> + DB 196,226,125,121,37,215,103,0,0 ; vpbroadcastw 0x67d7(%rip),%ymm4 # 2c504 <_sk_overlay_sse2_8bit+0xdf7> DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0 DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1 DB 197,229,228,220 ; vpmulhuw %ymm4,%ymm3,%ymm3 @@ -35798,7 +36146,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC DB 73,137,246 ; mov %rsi,%r14 DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp) DB 77,57,207 ; cmp %r9,%r15 - DB 15,131,138,0,0,0 ; jae 258c7 <_sk_start_pipeline_sse41_8bit+0x10b> + DB 15,131,138,0,0,0 ; jae 25e9b <_sk_start_pipeline_sse41_8bit+0x10b> DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax DB 72,141,64,8 ; lea 0x8(%rax),%rax DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp) @@ -35808,7 +36156,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp) DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp) DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp) - DB 119,36 ; ja 258a3 <_sk_start_pipeline_sse41_8bit+0xe7> + DB 119,36 ; ja 25e77 <_sk_start_pipeline_sse41_8bit+0xe7> DB 76,137,231 ; mov %r12,%rdi DB 76,137,246 ; mov %r14,%rsi DB 65,255,213 ; callq *%r13 @@ -35817,17 +36165,17 @@ _sk_start_pipeline_sse41_8bit LABEL PROC DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp) DB 72,131,193,16 ; add $0x10,%rcx DB 72,57,217 ; cmp %rbx,%rcx - DB 118,220 ; jbe 2587f <_sk_start_pipeline_sse41_8bit+0xc3> + DB 118,220 ; jbe 25e53 <_sk_start_pipeline_sse41_8bit+0xc3> DB 72,137,217 ; mov %rbx,%rcx DB 72,41,193 ; sub %rax,%rcx - DB 116,16 ; je 258bb <_sk_start_pipeline_sse41_8bit+0xff> + DB 116,16 ; je 25e8f <_sk_start_pipeline_sse41_8bit+0xff> DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp) DB 76,137,231 ; mov %r12,%rdi DB 76,137,246 ; mov %r14,%rsi DB 65,255,213 ; callq *%r13 DB 73,255,199 ; inc %r15 DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15 - DB 117,143 ; jne 25856 <_sk_start_pipeline_sse41_8bit+0x9a> + DB 117,143 ; jne 25e2a <_sk_start_pipeline_sse41_8bit+0x9a> DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6 DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7 DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8 @@ -35865,7 +36213,7 @@ _sk_uniform_color_sse41_8bit LABEL PROC PUBLIC _sk_set_rgb_sse41_8bit _sk_set_rgb_sse41_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 243,15,16,37,128,92,0,0 ; movss 0x5c80(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 243,15,16,37,152,92,0,0 ; movss 0x5c98(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 243,15,16,40 ; movss (%rax),%xmm5 DB 243,15,89,236 ; mulss %xmm4,%xmm5 DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx @@ -35880,7 +36228,7 @@ _sk_set_rgb_sse41_8bit LABEL PROC DB 9,208 ; or %edx,%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4 - DB 102,15,111,45,196,108,0,0 ; movdqa 0x6cc4(%rip),%xmm5 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,45,208,108,0,0 ; movdqa 0x6cd0(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,219,205 ; pand %xmm5,%xmm1 DB 102,15,219,197 ; pand %xmm5,%xmm0 DB 102,15,235,196 ; por %xmm4,%xmm0 @@ -35892,12 +36240,12 @@ PUBLIC _sk_premul_sse41_8bit _sk_premul_sse41_8bit LABEL PROC DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,15,111,232 ; movdqa %xmm0,%xmm5 - DB 102,15,111,5,176,108,0,0 ; movdqa 0x6cb0(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,5,188,108,0,0 ; movdqa 0x6cbc(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,15,111,253 ; movdqa %xmm5,%xmm7 DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7 DB 102,15,111,244 ; movdqa %xmm4,%xmm6 DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6 - DB 102,15,111,5,134,108,0,0 ; movdqa 0x6c86(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,5,146,108,0,0 ; movdqa 0x6c92(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,235,240 ; por %xmm0,%xmm6 DB 102,15,235,248 ; por %xmm0,%xmm7 DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 @@ -35928,7 +36276,7 @@ _sk_premul_sse41_8bit LABEL PROC PUBLIC _sk_swap_rb_sse41_8bit _sk_swap_rb_sse41_8bit LABEL PROC - DB 102,15,111,37,35,108,0,0 ; movdqa 0x6c23(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f> + DB 102,15,111,37,47,108,0,0 ; movdqa 0x6c2f(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533> DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0 DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -35953,7 +36301,7 @@ _sk_load_8888_sse41_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,17 ; jne 25a8d <_sk_load_8888_sse41_8bit+0x32> + DB 117,17 ; jne 26061 <_sk_load_8888_sse41_8bit+0x32> DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1 DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -35963,24 +36311,24 @@ _sk_load_8888_sse41_8bit LABEL PROC DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,231 ; ja 25a89 <_sk_load_8888_sse41_8bit+0x2e> + DB 119,231 ; ja 2605d <_sk_load_8888_sse41_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 25af8 <_sk_load_8888_sse41_8bit+0x9d> + DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 260cc <_sk_load_8888_sse41_8bit+0x9d> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0 - DB 235,203 ; jmp 25a89 <_sk_load_8888_sse41_8bit+0x2e> + DB 235,203 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e> DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4 DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0 - DB 235,177 ; jmp 25a89 <_sk_load_8888_sse41_8bit+0x2e> + DB 235,177 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e> DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0 DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1 DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1 DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1 - DB 235,139 ; jmp 25a83 <_sk_load_8888_sse41_8bit+0x28> + DB 235,139 ; jmp 26057 <_sk_load_8888_sse41_8bit+0x28> DB 190,255,255,255,210 ; mov $0xd2ffffff,%esi DB 255 ; (bad) DB 255 ; (bad) @@ -36010,7 +36358,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,17 ; jne 25b46 <_sk_load_8888_dst_sse41_8bit+0x32> + DB 117,17 ; jne 2611a <_sk_load_8888_dst_sse41_8bit+0x32> DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3 DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax @@ -36020,24 +36368,24 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,231 ; ja 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e> + DB 119,231 ; ja 26116 <_sk_load_8888_dst_sse41_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 25bb4 <_sk_load_8888_dst_sse41_8bit+0xa0> + DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 26188 <_sk_load_8888_dst_sse41_8bit+0xa0> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2 - DB 235,203 ; jmp 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e> + DB 235,203 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e> DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2 DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2 DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4 DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2 - DB 235,177 ; jmp 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e> + DB 235,177 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e> DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2 DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3 DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3 DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3 - DB 235,139 ; jmp 25b3c <_sk_load_8888_dst_sse41_8bit+0x28> + DB 235,139 ; jmp 26110 <_sk_load_8888_dst_sse41_8bit+0x28> DB 15,31,0 ; nopl (%rax) DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx DB 255 ; (bad) @@ -36049,7 +36397,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,221 ; jmpq ffffffffde025bcc <_sk_overlay_sse2_8bit+0xffffffffddffaaab> + DB 233,255,255,255,221 ; jmpq ffffffffde0261a0 <_sk_overlay_sse2_8bit+0xffffffffddffaa93> DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -36065,7 +36413,7 @@ _sk_store_8888_sse41_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 25c02 <_sk_store_8888_sse41_8bit+0x32> + DB 117,17 ; jne 261d6 <_sk_store_8888_sse41_8bit+0x32> DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4) DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -36073,22 +36421,22 @@ _sk_store_8888_sse41_8bit LABEL PROC DB 65,128,224,7 ; and $0x7,%r8b DB 65,254,200 ; dec %r8b DB 65,128,248,6 ; cmp $0x6,%r8b - DB 119,239 ; ja 25bfe <_sk_store_8888_sse41_8bit+0x2e> + DB 119,239 ; ja 261d2 <_sk_store_8888_sse41_8bit+0x2e> DB 65,15,182,192 ; movzbl %r8b,%eax - DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 25c60 <_sk_store_8888_sse41_8bit+0x90> + DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 26234 <_sk_store_8888_sse41_8bit+0x90> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4) - DB 235,211 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e> + DB 235,211 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e> DB 102,66,15,58,22,68,138,8,2 ; pextrd $0x2,%xmm0,0x8(%rdx,%r9,4) DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4) - DB 235,194 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e> + DB 235,194 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e> DB 102,66,15,58,22,76,138,24,2 ; pextrd $0x2,%xmm1,0x18(%rdx,%r9,4) DB 102,66,15,58,22,76,138,20,1 ; pextrd $0x1,%xmm1,0x14(%rdx,%r9,4) DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4) DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4) - DB 235,161 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e> + DB 235,161 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e> DB 15,31,0 ; nopl (%rax) DB 195 ; retq DB 255 ; (bad) @@ -36125,10 +36473,10 @@ _sk_load_bgra_sse41_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,35 ; jne 25cc0 <_sk_load_bgra_sse41_8bit+0x44> + DB 117,35 ; jne 26294 <_sk_load_bgra_sse41_8bit+0x44> DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1 DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0 - DB 102,15,111,37,174,105,0,0 ; movdqa 0x69ae(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f> + DB 102,15,111,37,186,105,0,0 ; movdqa 0x69ba(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533> DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0 DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -36138,24 +36486,24 @@ _sk_load_bgra_sse41_8bit LABEL PROC DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,213 ; ja 25caa <_sk_load_bgra_sse41_8bit+0x2e> + DB 119,213 ; ja 2627e <_sk_load_bgra_sse41_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 25d30 <_sk_load_bgra_sse41_8bit+0xb4> + DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 26304 <_sk_load_bgra_sse41_8bit+0xb4> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0 - DB 235,185 ; jmp 25caa <_sk_load_bgra_sse41_8bit+0x2e> + DB 235,185 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e> DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4 DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0 - DB 235,159 ; jmp 25caa <_sk_load_bgra_sse41_8bit+0x2e> + DB 235,159 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e> DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0 DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1 DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1 DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1 - DB 233,118,255,255,255 ; jmpq 25ca4 <_sk_load_bgra_sse41_8bit+0x28> + DB 233,118,255,255,255 ; jmpq 26278 <_sk_load_bgra_sse41_8bit+0x28> DB 102,144 ; xchg %ax,%ax DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx DB 255 ; (bad) @@ -36186,10 +36534,10 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,35 ; jne 25d90 <_sk_load_bgra_dst_sse41_8bit+0x44> + DB 117,35 ; jne 26364 <_sk_load_bgra_dst_sse41_8bit+0x44> DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3 DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2 - DB 102,15,111,37,222,104,0,0 ; movdqa 0x68de(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f> + DB 102,15,111,37,234,104,0,0 ; movdqa 0x68ea(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533> DB 102,15,56,0,212 ; pshufb %xmm4,%xmm2 DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -36199,24 +36547,24 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,213 ; ja 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e> + DB 119,213 ; ja 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 25e00 <_sk_load_bgra_dst_sse41_8bit+0xb4> + DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 263d4 <_sk_load_bgra_dst_sse41_8bit+0xb4> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2 - DB 235,185 ; jmp 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e> + DB 235,185 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e> DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2 DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2 DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4 DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2 - DB 235,159 ; jmp 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e> + DB 235,159 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e> DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2 DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3 DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3 DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3 - DB 233,118,255,255,255 ; jmpq 25d74 <_sk_load_bgra_dst_sse41_8bit+0x28> + DB 233,118,255,255,255 ; jmpq 26348 <_sk_load_bgra_dst_sse41_8bit+0x28> DB 102,144 ; xchg %ax,%ax DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx DB 255 ; (bad) @@ -36246,13 +36594,13 @@ _sk_store_bgra_sse41_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx - DB 102,15,111,53,32,104,0,0 ; movdqa 0x6820(%rip),%xmm6 # 2c660 <_sk_overlay_sse2_8bit+0x153f> + DB 102,15,111,53,44,104,0,0 ; movdqa 0x682c(%rip),%xmm6 # 2cc40 <_sk_overlay_sse2_8bit+0x1533> DB 102,15,111,233 ; movdqa %xmm1,%xmm5 DB 102,15,56,0,238 ; pshufb %xmm6,%xmm5 DB 102,15,111,224 ; movdqa %xmm0,%xmm4 DB 102,15,56,0,230 ; pshufb %xmm6,%xmm4 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 25e68 <_sk_store_bgra_sse41_8bit+0x4c> + DB 117,17 ; jne 2643c <_sk_store_bgra_sse41_8bit+0x4c> DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4) DB 243,66,15,127,108,138,16 ; movdqu %xmm5,0x10(%rdx,%r9,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -36260,22 +36608,22 @@ _sk_store_bgra_sse41_8bit LABEL PROC DB 65,128,224,7 ; and $0x7,%r8b DB 65,254,200 ; dec %r8b DB 65,128,248,6 ; cmp $0x6,%r8b - DB 119,239 ; ja 25e64 <_sk_store_bgra_sse41_8bit+0x48> + DB 119,239 ; ja 26438 <_sk_store_bgra_sse41_8bit+0x48> DB 65,15,182,192 ; movzbl %r8b,%eax - DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 25ec4 <_sk_store_bgra_sse41_8bit+0xa8> + DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 26498 <_sk_store_bgra_sse41_8bit+0xa8> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,126,36,138 ; movd %xmm4,(%rdx,%r9,4) - DB 235,211 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48> + DB 235,211 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48> DB 102,66,15,58,22,100,138,8,2 ; pextrd $0x2,%xmm4,0x8(%rdx,%r9,4) DB 102,66,15,214,36,138 ; movq %xmm4,(%rdx,%r9,4) - DB 235,194 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48> + DB 235,194 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48> DB 102,66,15,58,22,108,138,24,2 ; pextrd $0x2,%xmm5,0x18(%rdx,%r9,4) DB 102,66,15,58,22,108,138,20,1 ; pextrd $0x1,%xmm5,0x14(%rdx,%r9,4) DB 102,66,15,126,108,138,16 ; movd %xmm5,0x10(%rdx,%r9,4) DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4) - DB 235,161 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48> + DB 235,161 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48> DB 144 ; nop DB 197,255,255 ; (bad) DB 255,214 ; callq *%rsi @@ -36308,9 +36656,9 @@ _sk_load_a8_sse41_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,42 ; jne 25f27 <_sk_load_a8_sse41_8bit+0x47> + DB 117,42 ; jne 264fb <_sk_load_a8_sse41_8bit+0x47> DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1 - DB 102,15,219,13,36,96,0,0 ; pand 0x6024(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,13,48,96,0,0 ; pand 0x6030(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1 @@ -36322,15 +36670,15 @@ _sk_load_a8_sse41_8bit LABEL PROC DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,204 ; ja 25f04 <_sk_load_a8_sse41_8bit+0x24> + DB 119,204 ; ja 264d8 <_sk_load_a8_sse41_8bit+0x24> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 25fb8 <_sk_load_a8_sse41_8bit+0xd8> + DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 2658c <_sk_load_a8_sse41_8bit+0xd8> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,200 ; movd %eax,%xmm1 - DB 235,173 ; jmp 25f04 <_sk_load_a8_sse41_8bit+0x24> + DB 235,173 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1 @@ -36338,7 +36686,7 @@ _sk_load_a8_sse41_8bit LABEL PROC DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0 DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1 - DB 235,136 ; jmp 25f04 <_sk_load_a8_sse41_8bit+0x24> + DB 235,136 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1 @@ -36349,7 +36697,7 @@ _sk_load_a8_sse41_8bit LABEL PROC DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0 DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0 DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1 - DB 233,77,255,255,255 ; jmpq 25f04 <_sk_load_a8_sse41_8bit+0x24> + DB 233,77,255,255,255 ; jmpq 264d8 <_sk_load_a8_sse41_8bit+0x24> DB 144 ; nop DB 148 ; xchg %eax,%esp DB 255 ; (bad) @@ -36358,7 +36706,7 @@ _sk_load_a8_sse41_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf025fc8 <_sk_overlay_sse2_8bit+0xffffffffdeffaea7> + DB 233,255,255,255,222 ; jmpq ffffffffdf02659c <_sk_overlay_sse2_8bit+0xffffffffdeffae8f> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -36379,9 +36727,9 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,42 ; jne 2601b <_sk_load_a8_dst_sse41_8bit+0x47> + DB 117,42 ; jne 265ef <_sk_load_a8_dst_sse41_8bit+0x47> DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3 - DB 102,15,219,29,48,95,0,0 ; pand 0x5f30(%rip),%xmm3 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,29,60,95,0,0 ; pand 0x5f3c(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2 DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3 @@ -36393,15 +36741,15 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,204 ; ja 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24> + DB 119,204 ; ja 265cc <_sk_load_a8_dst_sse41_8bit+0x24> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 260ac <_sk_load_a8_dst_sse41_8bit+0xd8> + DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 26680 <_sk_load_a8_dst_sse41_8bit+0xd8> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,216 ; movd %eax,%xmm3 - DB 235,173 ; jmp 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24> + DB 235,173 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3 @@ -36409,7 +36757,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC DB 102,15,110,208 ; movd %eax,%xmm2 DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2 DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3 - DB 235,136 ; jmp 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24> + DB 235,136 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3 @@ -36420,7 +36768,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2 DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2 DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3 - DB 233,77,255,255,255 ; jmpq 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24> + DB 233,77,255,255,255 ; jmpq 265cc <_sk_load_a8_dst_sse41_8bit+0x24> DB 144 ; nop DB 148 ; xchg %eax,%esp DB 255 ; (bad) @@ -36429,7 +36777,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf0260bc <_sk_overlay_sse2_8bit+0xffffffffdeffaf9b> + DB 233,255,255,255,222 ; jmpq ffffffffdf026690 <_sk_overlay_sse2_8bit+0xffffffffdeffaf83> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -36449,39 +36797,39 @@ _sk_store_a8_sse41_8bit LABEL PROC DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx - DB 102,15,111,45,136,101,0,0 ; movdqa 0x6588(%rip),%xmm5 # 2c670 <_sk_overlay_sse2_8bit+0x154f> + DB 102,15,111,45,148,101,0,0 ; movdqa 0x6594(%rip),%xmm5 # 2cc50 <_sk_overlay_sse2_8bit+0x1543> DB 102,15,111,241 ; movdqa %xmm1,%xmm6 DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6 DB 102,15,111,224 ; movdqa %xmm0,%xmm4 DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4 DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4 DB 77,133,201 ; test %r9,%r9 - DB 117,19 ; jne 26116 <_sk_store_a8_sse41_8bit+0x4e> - DB 102,15,56,0,37,36,101,0,0 ; pshufb 0x6524(%rip),%xmm4 # 2c630 <_sk_overlay_sse2_8bit+0x150f> + DB 117,19 ; jne 266ea <_sk_store_a8_sse41_8bit+0x4e> + DB 102,15,56,0,37,48,101,0,0 ; pshufb 0x6530(%rip),%xmm4 # 2cc10 <_sk_overlay_sse2_8bit+0x1503> DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,239 ; ja 26112 <_sk_store_a8_sse41_8bit+0x4a> + DB 119,239 ; ja 266e6 <_sk_store_a8_sse41_8bit+0x4a> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 2618c <_sk_store_a8_sse41_8bit+0xc4> + DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 26760 <_sk_store_a8_sse41_8bit+0xc4> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,58,20,36,2,0 ; pextrb $0x0,%xmm4,(%rdx,%r8,1) - DB 235,209 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a> + DB 235,209 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a> DB 102,66,15,58,20,100,2,2,4 ; pextrb $0x4,%xmm4,0x2(%rdx,%r8,1) - DB 102,15,56,0,37,237,93,0,0 ; pshufb 0x5ded(%rip),%xmm4 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f> + DB 102,15,56,0,37,249,93,0,0 ; pshufb 0x5df9(%rip),%xmm4 # 2c520 <_sk_overlay_sse2_8bit+0xe13> DB 102,66,15,58,21,36,2,0 ; pextrw $0x0,%xmm4,(%rdx,%r8,1) - DB 235,181 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a> + DB 235,181 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a> DB 102,66,15,58,20,100,2,6,12 ; pextrb $0xc,%xmm4,0x6(%rdx,%r8,1) DB 102,66,15,58,20,100,2,5,10 ; pextrb $0xa,%xmm4,0x5(%rdx,%r8,1) DB 102,66,15,58,20,100,2,4,8 ; pextrb $0x8,%xmm4,0x4(%rdx,%r8,1) - DB 102,15,56,0,37,207,93,0,0 ; pshufb 0x5dcf(%rip),%xmm4 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f> + DB 102,15,56,0,37,219,93,0,0 ; pshufb 0x5ddb(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0xe23> DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1) - DB 235,137 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a> + DB 235,137 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a> DB 15,31,0 ; nopl (%rax) DB 171 ; stos %eax,%es:(%rdi) DB 255 ; (bad) @@ -36515,16 +36863,16 @@ _sk_load_g8_sse41_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,66 ; jne 26207 <_sk_load_g8_sse41_8bit+0x5f> + DB 117,66 ; jne 267db <_sk_load_g8_sse41_8bit+0x5f> DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1 - DB 102,15,219,13,92,93,0,0 ; pand 0x5d5c(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,13,104,93,0,0 ; pand 0x5d68(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1 - DB 102,15,111,37,151,100,0,0 ; movdqa 0x6497(%rip),%xmm4 # 2c680 <_sk_overlay_sse2_8bit+0x155f> + DB 102,15,111,37,163,100,0,0 ; movdqa 0x64a3(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553> DB 102,15,56,64,204 ; pmulld %xmm4,%xmm1 DB 102,15,56,64,196 ; pmulld %xmm4,%xmm0 - DB 102,15,111,37,69,100,0,0 ; movdqa 0x6445(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,37,81,100,0,0 ; movdqa 0x6451(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,235,196 ; por %xmm4,%xmm0 DB 102,15,235,204 ; por %xmm4,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -36533,15 +36881,15 @@ _sk_load_g8_sse41_8bit LABEL PROC DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,180 ; ja 261cc <_sk_load_g8_sse41_8bit+0x24> + DB 119,180 ; ja 267a0 <_sk_load_g8_sse41_8bit+0x24> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 2629c <_sk_load_g8_sse41_8bit+0xf4> + DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26870 <_sk_load_g8_sse41_8bit+0xf4> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,200 ; movd %eax,%xmm1 - DB 235,149 ; jmp 261cc <_sk_load_g8_sse41_8bit+0x24> + DB 235,149 ; jmp 267a0 <_sk_load_g8_sse41_8bit+0x24> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1 @@ -36549,7 +36897,7 @@ _sk_load_g8_sse41_8bit LABEL PROC DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0 DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1 - DB 233,109,255,255,255 ; jmpq 261cc <_sk_load_g8_sse41_8bit+0x24> + DB 233,109,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1 @@ -36560,7 +36908,7 @@ _sk_load_g8_sse41_8bit LABEL PROC DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0 DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0 DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1 - DB 233,50,255,255,255 ; jmpq 261cc <_sk_load_g8_sse41_8bit+0x24> + DB 233,50,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24> DB 102,144 ; xchg %ax,%ax DB 144 ; nop DB 255 ; (bad) @@ -36569,7 +36917,7 @@ _sk_load_g8_sse41_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,221 ; callq ffffffffde0262ac <_sk_overlay_sse2_8bit+0xffffffffddffb18b> + DB 232,255,255,255,221 ; callq ffffffffde026880 <_sk_overlay_sse2_8bit+0xffffffffddffb173> DB 255 ; (bad) DB 255 ; (bad) DB 255,210 ; callq *%rdx @@ -36590,16 +36938,16 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,66 ; jne 26317 <_sk_load_g8_dst_sse41_8bit+0x5f> + DB 117,66 ; jne 268eb <_sk_load_g8_dst_sse41_8bit+0x5f> DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3 - DB 102,15,219,29,76,92,0,0 ; pand 0x5c4c(%rip),%xmm3 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,29,88,92,0,0 ; pand 0x5c58(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2 DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3 - DB 102,15,111,37,135,99,0,0 ; movdqa 0x6387(%rip),%xmm4 # 2c680 <_sk_overlay_sse2_8bit+0x155f> + DB 102,15,111,37,147,99,0,0 ; movdqa 0x6393(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553> DB 102,15,56,64,220 ; pmulld %xmm4,%xmm3 DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2 - DB 102,15,111,37,53,99,0,0 ; movdqa 0x6335(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,37,65,99,0,0 ; movdqa 0x6341(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,235,212 ; por %xmm4,%xmm2 DB 102,15,235,220 ; por %xmm4,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -36608,15 +36956,15 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,180 ; ja 262dc <_sk_load_g8_dst_sse41_8bit+0x24> + DB 119,180 ; ja 268b0 <_sk_load_g8_dst_sse41_8bit+0x24> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 263ac <_sk_load_g8_dst_sse41_8bit+0xf4> + DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26980 <_sk_load_g8_dst_sse41_8bit+0xf4> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,216 ; movd %eax,%xmm3 - DB 235,149 ; jmp 262dc <_sk_load_g8_dst_sse41_8bit+0x24> + DB 235,149 ; jmp 268b0 <_sk_load_g8_dst_sse41_8bit+0x24> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3 @@ -36624,7 +36972,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC DB 102,15,110,208 ; movd %eax,%xmm2 DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2 DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3 - DB 233,109,255,255,255 ; jmpq 262dc <_sk_load_g8_dst_sse41_8bit+0x24> + DB 233,109,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3 @@ -36635,7 +36983,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2 DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2 DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3 - DB 233,50,255,255,255 ; jmpq 262dc <_sk_load_g8_dst_sse41_8bit+0x24> + DB 233,50,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24> DB 102,144 ; xchg %ax,%ax DB 144 ; nop DB 255 ; (bad) @@ -36644,7 +36992,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,221 ; callq ffffffffde0263bc <_sk_overlay_sse2_8bit+0xffffffffddffb29b> + DB 232,255,255,255,221 ; callq ffffffffde026990 <_sk_overlay_sse2_8bit+0xffffffffddffb283> DB 255 ; (bad) DB 255 ; (bad) DB 255,210 ; callq *%rdx @@ -36666,11 +37014,11 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,192 ; test %r8,%r8 - DB 15,133,206,0,0,0 ; jne 264bb <_sk_srcover_rgba_8888_sse41_8bit+0xf3> + DB 15,133,206,0,0,0 ; jne 26a8f <_sk_srcover_rgba_8888_sse41_8bit+0xf3> DB 243,70,15,111,68,138,16 ; movdqu 0x10(%rdx,%r9,4),%xmm8 DB 243,70,15,111,12,138 ; movdqu (%rdx,%r9,4),%xmm9 DB 77,133,192 ; test %r8,%r8 - DB 102,15,111,37,75,98,0,0 ; movdqa 0x624b(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,37,87,98,0,0 ; movdqa 0x6257(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,15,111,241 ; movdqa %xmm1,%xmm6 DB 102,15,56,0,244 ; pshufb %xmm4,%xmm6 DB 102,15,111,248 ; movdqa %xmm0,%xmm7 @@ -36704,7 +37052,7 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC DB 102,68,15,248,204 ; psubb %xmm4,%xmm9 DB 102,68,15,252,200 ; paddb %xmm0,%xmm9 DB 102,68,15,252,193 ; paddb %xmm1,%xmm8 - DB 117,72 ; jne 264f2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a> + DB 117,72 ; jne 26ac6 <_sk_srcover_rgba_8888_sse41_8bit+0x12a> DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4) DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -36715,43 +37063,43 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 254,200 ; dec %al DB 60,6 ; cmp $0x6,%al - DB 15,135,38,255,255,255 ; ja 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32> + DB 15,135,38,255,255,255 ; ja 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32> DB 15,182,192 ; movzbl %al,%eax - DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 26598 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0> + DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 26b6c <_sk_srcover_rgba_8888_sse41_8bit+0x1d0> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,70,15,110,12,138 ; movd (%rdx,%r9,4),%xmm9 - DB 233,8,255,255,255 ; jmpq 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32> + DB 233,8,255,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32> DB 65,128,224,7 ; and $0x7,%r8b DB 65,254,200 ; dec %r8b DB 65,128,248,6 ; cmp $0x6,%r8b - DB 119,184 ; ja 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef> + DB 119,184 ; ja 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef> DB 65,15,182,192 ; movzbl %r8b,%eax - DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 265b4 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec> + DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 26b88 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4) - DB 235,156 ; jmp 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef> + DB 235,156 ; jmp 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef> DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4 DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9 DB 243,66,15,126,36,138 ; movq (%rdx,%r9,4),%xmm4 DB 102,68,15,58,14,204,15 ; pblendw $0xf,%xmm4,%xmm9 - DB 233,192,254,255,255 ; jmpq 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32> + DB 233,192,254,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32> DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4 DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8 DB 102,70,15,58,34,68,138,20,1 ; pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8 DB 102,70,15,58,34,68,138,16,0 ; pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8 - DB 233,150,254,255,255 ; jmpq 263f4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c> + DB 233,150,254,255,255 ; jmpq 269c8 <_sk_srcover_rgba_8888_sse41_8bit+0x2c> DB 102,70,15,58,22,76,138,8,2 ; pextrd $0x2,%xmm9,0x8(%rdx,%r9,4) DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4) - DB 233,69,255,255,255 ; jmpq 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef> + DB 233,69,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef> DB 102,70,15,58,22,68,138,24,2 ; pextrd $0x2,%xmm8,0x18(%rdx,%r9,4) DB 102,70,15,58,22,68,138,20,1 ; pextrd $0x1,%xmm8,0x14(%rdx,%r9,4) DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4) DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4) - DB 233,33,255,255,255 ; jmpq 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef> + DB 233,33,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef> DB 102,144 ; xchg %ax,%ax DB 79,255 ; rex.WRXB (bad) DB 255 ; (bad) @@ -36790,7 +37138,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC DB 102,15,111,232 ; movdqa %xmm0,%xmm5 DB 72,173 ; lods %ds:(%rsi),%rax DB 243,15,16,0 ; movss (%rax),%xmm0 - DB 243,15,89,5,214,79,0,0 ; mulss 0x4fd6(%rip),%xmm0 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 243,15,89,5,238,79,0,0 ; mulss 0x4fee(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 243,15,44,192 ; cvttss2si %xmm0,%eax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,68,15,56,48,197 ; pmovzxbw %xmm5,%xmm8 @@ -36798,7 +37146,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC DB 102,68,15,56,48,204 ; pmovzxbw %xmm4,%xmm9 DB 102,15,104,224 ; punpckhbw %xmm0,%xmm4 DB 102,15,110,240 ; movd %eax,%xmm6 - DB 102,15,56,0,53,130,96,0,0 ; pshufb 0x6082(%rip),%xmm6 # 2c690 <_sk_overlay_sse2_8bit+0x156f> + DB 102,15,56,0,53,142,96,0,0 ; pshufb 0x608e(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0x1563> DB 102,15,111,206 ; movdqa %xmm6,%xmm1 DB 102,65,15,213,201 ; pmullw %xmm9,%xmm1 DB 102,15,111,198 ; movdqa %xmm6,%xmm0 @@ -36829,13 +37177,13 @@ _sk_scale_u8_sse41_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 15,133,160,0,0,0 ; jne 2671f <_sk_scale_u8_sse41_8bit+0xc1> + DB 15,133,160,0,0,0 ; jne 26cf3 <_sk_scale_u8_sse41_8bit+0xc1> DB 102,66,15,56,48,52,2 ; pmovzxbw (%rdx,%r8,1),%xmm6 - DB 102,15,219,53,162,88,0,0 ; pand 0x58a2(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,53,174,88,0,0 ; pand 0x58ae(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,15,111,254 ; movdqa %xmm6,%xmm7 - DB 102,15,56,0,61,0,96,0,0 ; pshufb 0x6000(%rip),%xmm7 # 2c6a0 <_sk_overlay_sse2_8bit+0x157f> - DB 102,15,56,0,53,7,96,0,0 ; pshufb 0x6007(%rip),%xmm6 # 2c6b0 <_sk_overlay_sse2_8bit+0x158f> + DB 102,15,56,0,61,12,96,0,0 ; pshufb 0x600c(%rip),%xmm7 # 2cc80 <_sk_overlay_sse2_8bit+0x1573> + DB 102,15,56,0,53,19,96,0,0 ; pshufb 0x6013(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0x1583> DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9 DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0 DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10 @@ -36866,15 +37214,15 @@ _sk_scale_u8_sse41_8bit LABEL PROC DB 102,15,239,246 ; pxor %xmm6,%xmm6 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,82,255,255,255 ; ja 26686 <_sk_scale_u8_sse41_8bit+0x28> + DB 15,135,82,255,255,255 ; ja 26c5a <_sk_scale_u8_sse41_8bit+0x28> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 267bc <_sk_scale_u8_sse41_8bit+0x15e> + DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 26d90 <_sk_scale_u8_sse41_8bit+0x15e> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,240 ; movd %eax,%xmm6 - DB 233,48,255,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28> + DB 233,48,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,246 ; pxor %xmm6,%xmm6 DB 102,15,196,240,2 ; pinsrw $0x2,%eax,%xmm6 @@ -36882,7 +37230,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4 DB 102,15,58,14,244,3 ; pblendw $0x3,%xmm4,%xmm6 - DB 233,8,255,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28> + DB 233,8,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,246 ; pxor %xmm6,%xmm6 DB 102,15,196,240,6 ; pinsrw $0x6,%eax,%xmm6 @@ -36893,7 +37241,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4 DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4 DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6 - DB 233,205,254,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28> + DB 233,205,254,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28> DB 15,31,0 ; nopl (%rax) DB 140,255 ; mov %?,%edi DB 255 ; (bad) @@ -36918,7 +37266,7 @@ PUBLIC _sk_lerp_1_float_sse41_8bit _sk_lerp_1_float_sse41_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 243,15,16,32 ; movss (%rax),%xmm4 - DB 243,15,89,37,214,77,0,0 ; mulss 0x4dd6(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 243,15,89,37,238,77,0,0 ; mulss 0x4dee(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 243,15,44,196 ; cvttss2si %xmm4,%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4 @@ -36929,7 +37277,7 @@ _sk_lerp_1_float_sse41_8bit LABEL PROC DB 102,65,15,104,193 ; punpckhbw %xmm9,%xmm0 DB 102,68,15,56,48,217 ; pmovzxbw %xmm1,%xmm11 DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1 - DB 102,15,56,0,61,159,94,0,0 ; pshufb 0x5e9f(%rip),%xmm7 # 2c6c0 <_sk_overlay_sse2_8bit+0x159f> + DB 102,15,56,0,61,171,94,0,0 ; pshufb 0x5eab(%rip),%xmm7 # 2cca0 <_sk_overlay_sse2_8bit+0x1593> DB 102,68,15,111,231 ; movdqa %xmm7,%xmm12 DB 102,69,15,213,227 ; pmullw %xmm11,%xmm12 DB 102,68,15,111,239 ; movdqa %xmm7,%xmm13 @@ -36988,13 +37336,13 @@ _sk_lerp_u8_sse41_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 15,133,46,1,0,0 ; jne 26a49 <_sk_lerp_u8_sse41_8bit+0x14f> + DB 15,133,46,1,0,0 ; jne 2701d <_sk_lerp_u8_sse41_8bit+0x14f> DB 102,66,15,56,48,60,2 ; pmovzxbw (%rdx,%r8,1),%xmm7 - DB 102,15,219,61,6,86,0,0 ; pand 0x5606(%rip),%xmm7 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,61,18,86,0,0 ; pand 0x5612(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,15,111,247 ; movdqa %xmm7,%xmm6 - DB 102,15,56,0,53,100,93,0,0 ; pshufb 0x5d64(%rip),%xmm6 # 2c6a0 <_sk_overlay_sse2_8bit+0x157f> - DB 102,15,56,0,61,107,93,0,0 ; pshufb 0x5d6b(%rip),%xmm7 # 2c6b0 <_sk_overlay_sse2_8bit+0x158f> + DB 102,15,56,0,53,112,93,0,0 ; pshufb 0x5d70(%rip),%xmm6 # 2cc80 <_sk_overlay_sse2_8bit+0x1573> + DB 102,15,56,0,61,119,93,0,0 ; pshufb 0x5d77(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0x1583> DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9 DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0 DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10 @@ -37054,15 +37402,15 @@ _sk_lerp_u8_sse41_8bit LABEL PROC DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,196,254,255,255 ; ja 26922 <_sk_lerp_u8_sse41_8bit+0x28> + DB 15,135,196,254,255,255 ; ja 26ef6 <_sk_lerp_u8_sse41_8bit+0x28> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 26ae4 <_sk_lerp_u8_sse41_8bit+0x1ea> + DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 270b8 <_sk_lerp_u8_sse41_8bit+0x1ea> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,248 ; movd %eax,%xmm7 - DB 233,162,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28> + DB 233,162,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 102,15,196,248,2 ; pinsrw $0x2,%eax,%xmm7 @@ -37070,7 +37418,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC DB 102,15,110,232 ; movd %eax,%xmm5 DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5 DB 102,15,58,14,253,3 ; pblendw $0x3,%xmm5,%xmm7 - DB 233,122,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28> + DB 233,122,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 102,15,196,248,6 ; pinsrw $0x6,%eax,%xmm7 @@ -37081,7 +37429,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5 DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5 DB 102,15,58,14,253,15 ; pblendw $0xf,%xmm5,%xmm7 - DB 233,63,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28> + DB 233,63,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28> DB 144 ; nop DB 142,255 ; mov %edi,%? DB 255 ; (bad) @@ -37089,7 +37437,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf026af4 <_sk_overlay_sse2_8bit+0xffffffffdeffb9d3> + DB 233,255,255,255,222 ; jmpq ffffffffdf0270c8 <_sk_overlay_sse2_8bit+0xffffffffdeffb9bb> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -37117,7 +37465,7 @@ _sk_move_dst_src_sse41_8bit LABEL PROC PUBLIC _sk_black_color_sse41_8bit _sk_black_color_sse41_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,5,35,91,0,0 ; movaps 0x5b23(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 15,40,5,47,91,0,0 ; movaps 0x5b2f(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 255,224 ; jmpq *%rax @@ -37137,7 +37485,7 @@ _sk_clear_sse41_8bit LABEL PROC PUBLIC _sk_srcatop_sse41_8bit _sk_srcatop_sse41_8bit LABEL PROC - DB 102,68,15,111,21,15,91,0,0 ; movdqa 0x5b0f(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,68,15,111,21,27,91,0,0 ; movdqa 0x5b1b(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11 DB 102,68,15,56,48,195 ; pmovzxbw %xmm3,%xmm8 DB 102,15,111,235 ; movdqa %xmm3,%xmm5 @@ -37205,7 +37553,7 @@ _sk_srcatop_sse41_8bit LABEL PROC PUBLIC _sk_dstatop_sse41_8bit _sk_dstatop_sse41_8bit LABEL PROC - DB 102,68,15,111,29,212,89,0,0 ; movdqa 0x59d4(%rip),%xmm11 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,68,15,111,29,224,89,0,0 ; movdqa 0x59e0(%rip),%xmm11 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13 DB 102,69,15,56,0,235 ; pshufb %xmm11,%xmm13 DB 102,68,15,111,248 ; movdqa %xmm0,%xmm15 @@ -37275,7 +37623,7 @@ PUBLIC _sk_srcin_sse41_8bit _sk_srcin_sse41_8bit LABEL PROC DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,15,111,232 ; movdqa %xmm0,%xmm5 - DB 102,15,111,5,139,88,0,0 ; movdqa 0x588b(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,5,151,88,0,0 ; movdqa 0x5897(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,15,111,243 ; movdqa %xmm3,%xmm6 DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6 DB 102,15,111,250 ; movdqa %xmm2,%xmm7 @@ -37308,7 +37656,7 @@ _sk_srcin_sse41_8bit LABEL PROC PUBLIC _sk_dstin_sse41_8bit _sk_dstin_sse41_8bit LABEL PROC - DB 102,15,111,37,254,87,0,0 ; movdqa 0x57fe(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,37,10,88,0,0 ; movdqa 0x580a(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1 DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0 DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 @@ -37345,7 +37693,7 @@ PUBLIC _sk_srcout_sse41_8bit _sk_srcout_sse41_8bit LABEL PROC DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,15,111,232 ; movdqa %xmm0,%xmm5 - DB 102,15,111,5,97,87,0,0 ; movdqa 0x5761(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,5,109,87,0,0 ; movdqa 0x576d(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,15,111,250 ; movdqa %xmm2,%xmm7 DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7 DB 102,15,111,243 ; movdqa %xmm3,%xmm6 @@ -37381,7 +37729,7 @@ _sk_srcout_sse41_8bit LABEL PROC PUBLIC _sk_dstout_sse41_8bit _sk_dstout_sse41_8bit LABEL PROC - DB 102,15,111,37,200,86,0,0 ; movdqa 0x56c8(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,37,212,86,0,0 ; movdqa 0x56d4(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0 DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1 DB 102,15,118,228 ; pcmpeqd %xmm4,%xmm4 @@ -37419,7 +37767,7 @@ _sk_dstout_sse41_8bit LABEL PROC PUBLIC _sk_srcover_sse41_8bit _sk_srcover_sse41_8bit LABEL PROC - DB 102,15,111,53,39,86,0,0 ; movdqa 0x5627(%rip),%xmm6 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,53,51,86,0,0 ; movdqa 0x5633(%rip),%xmm6 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11 DB 102,68,15,56,0,222 ; pshufb %xmm6,%xmm11 DB 102,15,111,232 ; movdqa %xmm0,%xmm5 @@ -37458,7 +37806,7 @@ _sk_srcover_sse41_8bit LABEL PROC PUBLIC _sk_dstover_sse41_8bit _sk_dstover_sse41_8bit LABEL PROC - DB 102,68,15,111,5,119,85,0,0 ; movdqa 0x5577(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,68,15,111,5,131,85,0,0 ; movdqa 0x5583(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,209 ; movdqa %xmm1,%xmm10 DB 102,68,15,56,48,201 ; pmovzxbw %xmm1,%xmm9 DB 102,15,252,203 ; paddb %xmm3,%xmm1 @@ -37533,7 +37881,7 @@ _sk_multiply_sse41_8bit LABEL PROC DB 102,15,111,218 ; movdqa %xmm2,%xmm3 DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,68,15,111,53,53,84,0,0 ; movdqa 0x5435(%rip),%xmm14 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,68,15,111,53,65,84,0,0 ; movdqa 0x5441(%rip),%xmm14 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,195 ; movdqa %xmm3,%xmm8 DB 102,15,111,235 ; movdqa %xmm3,%xmm5 DB 102,65,15,56,0,238 ; pshufb %xmm14,%xmm5 @@ -37658,7 +38006,7 @@ _sk_screen_sse41_8bit LABEL PROC PUBLIC _sk_xor__sse41_8bit _sk_xor__sse41_8bit LABEL PROC - DB 102,68,15,111,21,243,81,0,0 ; movdqa 0x51f3(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,68,15,111,21,255,81,0,0 ; movdqa 0x51ff(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,226 ; movdqa %xmm2,%xmm12 DB 102,68,15,56,48,194 ; pmovzxbw %xmm2,%xmm8 DB 102,15,111,234 ; movdqa %xmm2,%xmm5 @@ -37726,10 +38074,17 @@ _sk_xor__sse41_8bit LABEL PROC DB 102,15,111,205 ; movdqa %xmm5,%xmm1 DB 255,224 ; jmpq *%rax +PUBLIC _sk_plus__sse41_8bit +_sk_plus__sse41_8bit LABEL PROC + DB 102,15,220,194 ; paddusb %xmm2,%xmm0 + DB 102,15,220,203 ; paddusb %xmm3,%xmm1 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + PUBLIC _sk_darken_sse41_8bit _sk_darken_sse41_8bit LABEL PROC DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14 - DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11 DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9 DB 102,15,111,243 ; movdqa %xmm3,%xmm6 @@ -37796,7 +38151,7 @@ _sk_darken_sse41_8bit LABEL PROC DB 102,15,248,231 ; psubb %xmm7,%xmm4 DB 102,15,248,206 ; psubb %xmm6,%xmm1 DB 102,68,15,248,245 ; psubb %xmm5,%xmm14 - DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14 DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -37806,7 +38161,7 @@ _sk_darken_sse41_8bit LABEL PROC PUBLIC _sk_lighten_sse41_8bit _sk_lighten_sse41_8bit LABEL PROC DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14 - DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11 DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9 DB 102,15,111,243 ; movdqa %xmm3,%xmm6 @@ -37873,7 +38228,7 @@ _sk_lighten_sse41_8bit LABEL PROC DB 102,15,248,231 ; psubb %xmm7,%xmm4 DB 102,15,248,206 ; psubb %xmm6,%xmm1 DB 102,68,15,248,245 ; psubb %xmm5,%xmm14 - DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14 DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -37911,7 +38266,7 @@ _sk_exclusion_sse41_8bit LABEL PROC DB 102,15,113,215,8 ; psrlw $0x8,%xmm7 DB 102,15,103,253 ; packuswb %xmm5,%xmm7 DB 102,15,103,230 ; packuswb %xmm6,%xmm4 - DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,15,248,204 ; psubb %xmm4,%xmm1 DB 102,15,219,229 ; pand %xmm5,%xmm4 DB 102,15,219,239 ; pand %xmm7,%xmm5 @@ -37924,7 +38279,7 @@ _sk_exclusion_sse41_8bit LABEL PROC PUBLIC _sk_difference_sse41_8bit _sk_difference_sse41_8bit LABEL PROC DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8 - DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11 DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9 DB 102,15,111,243 ; movdqa %xmm3,%xmm6 @@ -37962,7 +38317,7 @@ _sk_difference_sse41_8bit LABEL PROC DB 102,15,113,214,8 ; psrlw $0x8,%xmm6 DB 102,15,113,215,8 ; psrlw $0x8,%xmm7 DB 102,15,103,254 ; packuswb %xmm6,%xmm7 - DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1 DB 102,15,56,0,236 ; pshufb %xmm4,%xmm5 DB 102,69,15,104,236 ; punpckhbw %xmm12,%xmm13 @@ -37987,7 +38342,7 @@ _sk_difference_sse41_8bit LABEL PROC DB 102,15,103,241 ; packuswb %xmm1,%xmm6 DB 102,65,15,218,230 ; pminub %xmm14,%xmm4 DB 102,15,218,247 ; pminub %xmm7,%xmm6 - DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,68,15,248,198 ; psubb %xmm6,%xmm8 DB 102,15,219,241 ; pand %xmm1,%xmm6 DB 102,15,219,204 ; pand %xmm4,%xmm1 @@ -38014,7 +38369,7 @@ _sk_hardlight_sse41_8bit LABEL PROC DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp) DB 102,69,15,56,48,221 ; pmovzxbw %xmm13,%xmm11 DB 102,68,15,127,156,36,176,0,0,0 ; movdqa %xmm11,0xb0(%rsp) - DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14 DB 102,68,15,56,0,233 ; pshufb %xmm1,%xmm13 DB 102,69,15,56,48,205 ; pmovzxbw %xmm13,%xmm9 @@ -38063,7 +38418,7 @@ _sk_hardlight_sse41_8bit LABEL PROC DB 102,65,15,56,58,242 ; pminuw %xmm10,%xmm6 DB 102,15,117,240 ; pcmpeqw %xmm0,%xmm6 DB 102,15,127,180,36,192,0,0,0 ; movdqa %xmm6,0xc0(%rsp) - DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,111,199 ; movdqa %xmm7,%xmm0 DB 102,15,239,198 ; pxor %xmm6,%xmm0 DB 102,65,15,213,192 ; pmullw %xmm8,%xmm0 @@ -38170,7 +38525,7 @@ _sk_hardlight_sse41_8bit LABEL PROC DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6 DB 102,15,253,124,36,16 ; paddw 0x10(%rsp),%xmm7 DB 102,15,253,44,36 ; paddw (%rsp),%xmm5 - DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf> + DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3> DB 102,68,15,253,216 ; paddw %xmm0,%xmm11 DB 102,68,15,253,219 ; paddw %xmm3,%xmm11 DB 102,15,253,240 ; paddw %xmm0,%xmm6 @@ -38179,7 +38534,7 @@ _sk_hardlight_sse41_8bit LABEL PROC DB 102,15,253,252 ; paddw %xmm4,%xmm7 DB 102,15,253,232 ; paddw %xmm0,%xmm5 DB 102,15,253,234 ; paddw %xmm2,%xmm5 - DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf> + DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3> DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6 DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11 DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5 @@ -38212,7 +38567,7 @@ _sk_overlay_sse41_8bit LABEL PROC DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp) DB 102,65,15,56,48,206 ; pmovzxbw %xmm14,%xmm1 DB 102,15,127,140,36,16,1,0,0 ; movdqa %xmm1,0x110(%rsp) - DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f> + DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523> DB 102,68,15,56,0,249 ; pshufb %xmm1,%xmm15 DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14 DB 102,65,15,56,48,238 ; pmovzxbw %xmm14,%xmm5 @@ -38264,7 +38619,7 @@ _sk_overlay_sse41_8bit LABEL PROC DB 102,65,15,56,58,221 ; pminuw %xmm13,%xmm3 DB 102,15,117,216 ; pcmpeqw %xmm0,%xmm3 DB 102,15,127,156,36,176,0,0,0 ; movdqa %xmm3,0xb0(%rsp) - DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,239,198 ; pxor %xmm6,%xmm0 DB 102,15,213,196 ; pmullw %xmm4,%xmm0 @@ -38373,7 +38728,7 @@ _sk_overlay_sse41_8bit LABEL PROC DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6 DB 102,68,15,253,132,36,128,0,0,0 ; paddw 0x80(%rsp),%xmm8 DB 102,15,253,44,36 ; paddw (%rsp),%xmm5 - DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf> + DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3> DB 102,68,15,253,216 ; paddw %xmm0,%xmm11 DB 102,69,15,253,217 ; paddw %xmm9,%xmm11 DB 102,15,253,240 ; paddw %xmm0,%xmm6 @@ -38382,7 +38737,7 @@ _sk_overlay_sse41_8bit LABEL PROC DB 102,68,15,253,195 ; paddw %xmm3,%xmm8 DB 102,15,253,232 ; paddw %xmm0,%xmm5 DB 102,15,253,234 ; paddw %xmm2,%xmm5 - DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf> + DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3> DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6 DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11 DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5 @@ -38435,7 +38790,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC DB 73,137,246 ; mov %rsi,%r14 DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp) DB 77,57,207 ; cmp %r9,%r15 - DB 15,131,138,0,0,0 ; jae 283df <_sk_start_pipeline_sse2_8bit+0x10b> + DB 15,131,138,0,0,0 ; jae 289bf <_sk_start_pipeline_sse2_8bit+0x10b> DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax DB 72,141,64,8 ; lea 0x8(%rax),%rax DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp) @@ -38445,7 +38800,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp) DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp) DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp) - DB 119,36 ; ja 283bb <_sk_start_pipeline_sse2_8bit+0xe7> + DB 119,36 ; ja 2899b <_sk_start_pipeline_sse2_8bit+0xe7> DB 76,137,231 ; mov %r12,%rdi DB 76,137,246 ; mov %r14,%rsi DB 65,255,213 ; callq *%r13 @@ -38454,17 +38809,17 @@ _sk_start_pipeline_sse2_8bit LABEL PROC DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp) DB 72,131,193,16 ; add $0x10,%rcx DB 72,57,217 ; cmp %rbx,%rcx - DB 118,220 ; jbe 28397 <_sk_start_pipeline_sse2_8bit+0xc3> + DB 118,220 ; jbe 28977 <_sk_start_pipeline_sse2_8bit+0xc3> DB 72,137,217 ; mov %rbx,%rcx DB 72,41,193 ; sub %rax,%rcx - DB 116,16 ; je 283d3 <_sk_start_pipeline_sse2_8bit+0xff> + DB 116,16 ; je 289b3 <_sk_start_pipeline_sse2_8bit+0xff> DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp) DB 76,137,231 ; mov %r12,%rdi DB 76,137,246 ; mov %r14,%rsi DB 65,255,213 ; callq *%r13 DB 73,255,199 ; inc %r15 DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15 - DB 117,143 ; jne 2836e <_sk_start_pipeline_sse2_8bit+0x9a> + DB 117,143 ; jne 2894e <_sk_start_pipeline_sse2_8bit+0x9a> DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6 DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7 DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8 @@ -38502,7 +38857,7 @@ _sk_uniform_color_sse2_8bit LABEL PROC PUBLIC _sk_set_rgb_sse2_8bit _sk_set_rgb_sse2_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 243,15,16,37,104,49,0,0 ; movss 0x3168(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 243,15,16,37,116,49,0,0 ; movss 0x3174(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 243,15,16,40 ; movss (%rax),%xmm5 DB 243,15,89,236 ; mulss %xmm4,%xmm5 DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx @@ -38517,7 +38872,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC DB 9,208 ; or %edx,%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4 - DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,219,205 ; pand %xmm5,%xmm1 DB 102,15,219,197 ; pand %xmm5,%xmm0 DB 102,15,235,196 ; por %xmm4,%xmm0 @@ -38540,7 +38895,7 @@ _sk_premul_sse2_8bit LABEL PROC DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 242,15,112,192,95 ; pshuflw $0x5f,%xmm0,%xmm0 DB 243,15,112,248,95 ; pshufhw $0x5f,%xmm0,%xmm7 - DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,235,248 ; por %xmm0,%xmm7 DB 102,15,235,240 ; por %xmm0,%xmm6 DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 @@ -38615,7 +38970,7 @@ _sk_load_8888_sse2_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,16 ; jne 28610 <_sk_load_8888_sse2_8bit+0x31> + DB 117,16 ; jne 28bf0 <_sk_load_8888_sse2_8bit+0x31> DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1 DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -38625,18 +38980,18 @@ _sk_load_8888_sse2_8bit LABEL PROC DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,231 ; ja 2860c <_sk_load_8888_sse2_8bit+0x2d> + DB 119,231 ; ja 28bec <_sk_load_8888_sse2_8bit+0x2d> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 28680 <_sk_load_8888_sse2_8bit+0xa1> + DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 28c60 <_sk_load_8888_sse2_8bit+0xa1> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0 - DB 235,203 ; jmp 2860c <_sk_load_8888_sse2_8bit+0x2d> + DB 235,203 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d> DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0 - DB 235,183 ; jmp 2860c <_sk_load_8888_sse2_8bit+0x2d> + DB 235,183 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d> DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0 DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1 DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0 @@ -38645,7 +39000,7 @@ _sk_load_8888_sse2_8bit LABEL PROC DB 15,40,200 ; movaps %xmm0,%xmm1 DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0 DB 243,15,16,200 ; movss %xmm0,%xmm1 - DB 235,134 ; jmp 28606 <_sk_load_8888_sse2_8bit+0x27> + DB 235,134 ; jmp 28be6 <_sk_load_8888_sse2_8bit+0x27> DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx DB 255 ; (bad) DB 255 ; (bad) @@ -38674,7 +39029,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,16 ; jne 286cd <_sk_load_8888_dst_sse2_8bit+0x31> + DB 117,16 ; jne 28cad <_sk_load_8888_dst_sse2_8bit+0x31> DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3 DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax @@ -38684,18 +39039,18 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,231 ; ja 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d> + DB 119,231 ; ja 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 28740 <_sk_load_8888_dst_sse2_8bit+0xa4> + DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 28d20 <_sk_load_8888_dst_sse2_8bit+0xa4> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2 - DB 235,203 ; jmp 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d> + DB 235,203 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d> DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2 DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2 DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2 - DB 235,183 ; jmp 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d> + DB 235,183 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d> DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2 DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3 DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2 @@ -38704,7 +39059,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2 DB 243,15,16,218 ; movss %xmm2,%xmm3 - DB 235,134 ; jmp 286c3 <_sk_load_8888_dst_sse2_8bit+0x27> + DB 235,134 ; jmp 28ca3 <_sk_load_8888_dst_sse2_8bit+0x27> DB 15,31,0 ; nopl (%rax) DB 182,255 ; mov $0xff,%dh DB 255 ; (bad) @@ -38737,7 +39092,7 @@ _sk_store_8888_sse2_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 2878e <_sk_store_8888_sse2_8bit+0x32> + DB 117,17 ; jne 28d6e <_sk_store_8888_sse2_8bit+0x32> DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4) DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -38745,25 +39100,25 @@ _sk_store_8888_sse2_8bit LABEL PROC DB 65,128,224,7 ; and $0x7,%r8b DB 65,254,200 ; dec %r8b DB 65,128,248,6 ; cmp $0x6,%r8b - DB 119,239 ; ja 2878a <_sk_store_8888_sse2_8bit+0x2e> + DB 119,239 ; ja 28d6a <_sk_store_8888_sse2_8bit+0x2e> DB 65,15,182,192 ; movzbl %r8b,%eax - DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 287f4 <_sk_store_8888_sse2_8bit+0x98> + DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 28dd4 <_sk_store_8888_sse2_8bit+0x98> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4) - DB 235,211 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e> + DB 235,211 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e> DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4 DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4) DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4) - DB 235,191 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e> + DB 235,191 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e> DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4 DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4) DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4 DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4) DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4) DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4) - DB 235,152 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e> + DB 235,152 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e> DB 102,144 ; xchg %ax,%ax DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx DB 255 ; (bad) @@ -38797,7 +39152,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,92 ; jne 2888d <_sk_load_bgra_sse2_8bit+0x7d> + DB 117,92 ; jne 28e6d <_sk_load_bgra_sse2_8bit+0x7d> DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1 DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0 DB 102,15,239,228 ; pxor %xmm4,%xmm4 @@ -38824,18 +39179,18 @@ _sk_load_bgra_sse2_8bit LABEL PROC DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,155 ; ja 2883d <_sk_load_bgra_sse2_8bit+0x2d> + DB 119,155 ; ja 28e1d <_sk_load_bgra_sse2_8bit+0x2d> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28908 <_sk_load_bgra_sse2_8bit+0xf8> + DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ee8 <_sk_load_bgra_sse2_8bit+0xf8> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0 - DB 233,124,255,255,255 ; jmpq 2883d <_sk_load_bgra_sse2_8bit+0x2d> + DB 233,124,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d> DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0 - DB 233,101,255,255,255 ; jmpq 2883d <_sk_load_bgra_sse2_8bit+0x2d> + DB 233,101,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d> DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0 DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1 DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0 @@ -38844,7 +39199,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC DB 15,40,200 ; movaps %xmm0,%xmm1 DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0 DB 243,15,16,200 ; movss %xmm0,%xmm1 - DB 233,49,255,255,255 ; jmpq 28837 <_sk_load_bgra_sse2_8bit+0x27> + DB 233,49,255,255,255 ; jmpq 28e17 <_sk_load_bgra_sse2_8bit+0x27> DB 102,144 ; xchg %ax,%ax DB 174 ; scas %es:(%rdi),%al DB 255 ; (bad) @@ -38879,7 +39234,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,92 ; jne 289a1 <_sk_load_bgra_dst_sse2_8bit+0x7d> + DB 117,92 ; jne 28f81 <_sk_load_bgra_dst_sse2_8bit+0x7d> DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3 DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2 DB 102,15,239,228 ; pxor %xmm4,%xmm4 @@ -38906,18 +39261,18 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,155 ; ja 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d> + DB 119,155 ; ja 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28a1c <_sk_load_bgra_dst_sse2_8bit+0xf8> + DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ffc <_sk_load_bgra_dst_sse2_8bit+0xf8> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2 - DB 233,124,255,255,255 ; jmpq 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d> + DB 233,124,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d> DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2 DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2 DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2 - DB 233,101,255,255,255 ; jmpq 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d> + DB 233,101,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d> DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2 DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3 DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2 @@ -38926,7 +39281,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2 DB 243,15,16,218 ; movss %xmm2,%xmm3 - DB 233,49,255,255,255 ; jmpq 2894b <_sk_load_bgra_dst_sse2_8bit+0x27> + DB 233,49,255,255,255 ; jmpq 28f2b <_sk_load_bgra_dst_sse2_8bit+0x27> DB 102,144 ; xchg %ax,%ax DB 174 ; scas %es:(%rdi),%al DB 255 ; (bad) @@ -38980,7 +39335,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC DB 243,15,112,237,198 ; pshufhw $0xc6,%xmm5,%xmm5 DB 102,15,103,238 ; packuswb %xmm6,%xmm5 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 28abe <_sk_store_bgra_sse2_8bit+0x86> + DB 117,17 ; jne 2909e <_sk_store_bgra_sse2_8bit+0x86> DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4) DB 243,66,15,127,100,138,16 ; movdqu %xmm4,0x10(%rdx,%r9,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -38988,25 +39343,25 @@ _sk_store_bgra_sse2_8bit LABEL PROC DB 65,128,224,7 ; and $0x7,%r8b DB 65,254,200 ; dec %r8b DB 65,128,248,6 ; cmp $0x6,%r8b - DB 119,239 ; ja 28aba <_sk_store_bgra_sse2_8bit+0x82> + DB 119,239 ; ja 2909a <_sk_store_bgra_sse2_8bit+0x82> DB 65,15,182,192 ; movzbl %r8b,%eax - DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 28b24 <_sk_store_bgra_sse2_8bit+0xec> + DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 29104 <_sk_store_bgra_sse2_8bit+0xec> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,66,15,126,44,138 ; movd %xmm5,(%rdx,%r9,4) - DB 235,211 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82> + DB 235,211 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82> DB 102,15,112,229,78 ; pshufd $0x4e,%xmm5,%xmm4 DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4) DB 102,66,15,214,44,138 ; movq %xmm5,(%rdx,%r9,4) - DB 235,191 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82> + DB 235,191 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82> DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6 DB 102,66,15,126,116,138,24 ; movd %xmm6,0x18(%rdx,%r9,4) DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6 DB 102,66,15,126,116,138,20 ; movd %xmm6,0x14(%rdx,%r9,4) DB 102,66,15,126,100,138,16 ; movd %xmm4,0x10(%rdx,%r9,4) DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4) - DB 235,152 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82> + DB 235,152 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82> DB 102,144 ; xchg %ax,%ax DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx DB 255 ; (bad) @@ -39039,10 +39394,10 @@ _sk_load_a8_sse2_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,48 ; jne 28b8d <_sk_load_a8_sse2_8bit+0x4d> + DB 117,48 ; jne 2916d <_sk_load_a8_sse2_8bit+0x4d> DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 - DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,40,200 ; movapd %xmm0,%xmm1 DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1 @@ -39055,15 +39410,15 @@ _sk_load_a8_sse2_8bit LABEL PROC DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,201 ; ja 28b67 <_sk_load_a8_sse2_8bit+0x27> + DB 119,201 ; ja 29147 <_sk_load_a8_sse2_8bit+0x27> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 28c18 <_sk_load_a8_sse2_8bit+0xd8> + DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 291f8 <_sk_load_a8_sse2_8bit+0xd8> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,170 ; jmp 28b67 <_sk_load_a8_sse2_8bit+0x27> + DB 235,170 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0 @@ -39071,7 +39426,7 @@ _sk_load_a8_sse2_8bit LABEL PROC DB 102,15,110,200 ; movd %eax,%xmm1 DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 243,15,16,193 ; movss %xmm1,%xmm0 - DB 235,136 ; jmp 28b67 <_sk_load_a8_sse2_8bit+0x27> + DB 235,136 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0 @@ -39082,7 +39437,7 @@ _sk_load_a8_sse2_8bit LABEL PROC DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1 DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 233,80,255,255,255 ; jmpq 28b67 <_sk_load_a8_sse2_8bit+0x27> + DB 233,80,255,255,255 ; jmpq 29147 <_sk_load_a8_sse2_8bit+0x27> DB 144 ; nop DB 154 ; (bad) DB 255 ; (bad) @@ -39114,10 +39469,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,48 ; jne 28c81 <_sk_load_a8_dst_sse2_8bit+0x4d> + DB 117,48 ; jne 29261 <_sk_load_a8_dst_sse2_8bit+0x4d> DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2 DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2 - DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,40,218 ; movapd %xmm2,%xmm3 DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3 @@ -39130,15 +39485,15 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,201 ; ja 28c5b <_sk_load_a8_dst_sse2_8bit+0x27> + DB 119,201 ; ja 2923b <_sk_load_a8_dst_sse2_8bit+0x27> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 28d0c <_sk_load_a8_dst_sse2_8bit+0xd8> + DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 292ec <_sk_load_a8_dst_sse2_8bit+0xd8> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,208 ; movd %eax,%xmm2 - DB 235,170 ; jmp 28c5b <_sk_load_a8_dst_sse2_8bit+0x27> + DB 235,170 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2 @@ -39146,7 +39501,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC DB 102,15,110,216 ; movd %eax,%xmm3 DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3 DB 243,15,16,211 ; movss %xmm3,%xmm2 - DB 235,136 ; jmp 28c5b <_sk_load_a8_dst_sse2_8bit+0x27> + DB 235,136 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2 @@ -39157,7 +39512,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3 DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3 DB 242,15,16,211 ; movsd %xmm3,%xmm2 - DB 233,80,255,255,255 ; jmpq 28c5b <_sk_load_a8_dst_sse2_8bit+0x27> + DB 233,80,255,255,255 ; jmpq 2923b <_sk_load_a8_dst_sse2_8bit+0x27> DB 144 ; nop DB 154 ; (bad) DB 255 ; (bad) @@ -39199,8 +39554,8 @@ _sk_store_a8_sse2_8bit LABEL PROC DB 102,15,114,228,16 ; psrad $0x10,%xmm4 DB 102,15,107,229 ; packssdw %xmm5,%xmm4 DB 77,133,201 ; test %r9,%r9 - DB 117,26 ; jne 28d8d <_sk_store_a8_sse2_8bit+0x65> - DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 117,26 ; jne 2936d <_sk_store_a8_sse2_8bit+0x65> + DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,103,228 ; packuswb %xmm4,%xmm4 DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1) DB 72,173 ; lods %ds:(%rsi),%rax @@ -39209,24 +39564,24 @@ _sk_store_a8_sse2_8bit LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,235 ; ja 28d85 <_sk_store_a8_sse2_8bit+0x5d> + DB 119,235 ; ja 29365 <_sk_store_a8_sse2_8bit+0x5d> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 28e28 <_sk_store_a8_sse2_8bit+0x100> + DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 29408 <_sk_store_a8_sse2_8bit+0x100> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp) DB 138,4,36 ; mov (%rsp),%al DB 66,136,4,2 ; mov %al,(%rdx,%r8,1) - DB 235,201 ; jmp 28d85 <_sk_store_a8_sse2_8bit+0x5d> + DB 235,201 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d> DB 102,15,127,100,36,16 ; movdqa %xmm4,0x10(%rsp) DB 138,68,36,20 ; mov 0x14(%rsp),%al DB 66,136,68,2,2 ; mov %al,0x2(%rdx,%r8,1) - DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,103,228 ; packuswb %xmm4,%xmm4 DB 102,15,126,224 ; movd %xmm4,%eax DB 102,66,137,4,2 ; mov %ax,(%rdx,%r8,1) - DB 235,163 ; jmp 28d85 <_sk_store_a8_sse2_8bit+0x5d> + DB 235,163 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d> DB 102,15,127,100,36,64 ; movdqa %xmm4,0x40(%rsp) DB 138,68,36,76 ; mov 0x4c(%rsp),%al DB 66,136,68,2,6 ; mov %al,0x6(%rdx,%r8,1) @@ -39236,10 +39591,10 @@ _sk_store_a8_sse2_8bit LABEL PROC DB 102,15,127,100,36,32 ; movdqa %xmm4,0x20(%rsp) DB 138,68,36,40 ; mov 0x28(%rsp),%al DB 66,136,68,2,4 ; mov %al,0x4(%rdx,%r8,1) - DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,103,228 ; packuswb %xmm4,%xmm4 DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1) - DB 233,95,255,255,255 ; jmpq 28d85 <_sk_store_a8_sse2_8bit+0x5d> + DB 233,95,255,255,255 ; jmpq 29365 <_sk_store_a8_sse2_8bit+0x5d> DB 102,144 ; xchg %ax,%ax DB 134,255 ; xchg %bh,%bh DB 255 ; (bad) @@ -39271,15 +39626,15 @@ _sk_load_g8_sse2_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,116 ; jne 28ed5 <_sk_load_g8_sse2_8bit+0x91> + DB 117,116 ; jne 294b5 <_sk_load_g8_sse2_8bit+0x91> DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 - DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,40,224 ; movapd %xmm0,%xmm4 DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4 DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0 - DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2c680 <_sk_overlay_sse2_8bit+0x155f> + DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553> DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6 DB 102,15,244,197 ; pmuludq %xmm5,%xmm0 DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1 @@ -39292,7 +39647,7 @@ _sk_load_g8_sse2_8bit LABEL PROC DB 102,15,244,245 ; pmuludq %xmm5,%xmm6 DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4 DB 102,15,98,196 ; punpckldq %xmm4,%xmm0 - DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,235,196 ; por %xmm4,%xmm0 DB 102,15,235,204 ; por %xmm4,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax @@ -39301,15 +39656,15 @@ _sk_load_g8_sse2_8bit LABEL PROC DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,133 ; ja 28e6b <_sk_load_g8_sse2_8bit+0x27> + DB 119,133 ; ja 2944b <_sk_load_g8_sse2_8bit+0x27> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 28f68 <_sk_load_g8_sse2_8bit+0x124> + DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29548 <_sk_load_g8_sse2_8bit+0x124> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 233,99,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27> + DB 233,99,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0 @@ -39317,7 +39672,7 @@ _sk_load_g8_sse2_8bit LABEL PROC DB 102,15,110,200 ; movd %eax,%xmm1 DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 243,15,16,193 ; movss %xmm1,%xmm0 - DB 233,62,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27> + DB 233,62,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0 @@ -39328,7 +39683,7 @@ _sk_load_g8_sse2_8bit LABEL PROC DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1 DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 233,6,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27> + DB 233,6,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27> DB 15,31,0 ; nopl (%rax) DB 146 ; xchg %eax,%edx DB 255 ; (bad) @@ -39361,15 +39716,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 117,116 ; jne 29015 <_sk_load_g8_dst_sse2_8bit+0x91> + DB 117,116 ; jne 295f5 <_sk_load_g8_dst_sse2_8bit+0x91> DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2 DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2 - DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,40,226 ; movapd %xmm2,%xmm4 DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4 DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2 - DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2c680 <_sk_overlay_sse2_8bit+0x155f> + DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553> DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6 DB 102,15,244,213 ; pmuludq %xmm5,%xmm2 DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3 @@ -39382,7 +39737,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC DB 102,15,244,245 ; pmuludq %xmm5,%xmm6 DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4 DB 102,15,98,212 ; punpckldq %xmm4,%xmm2 - DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 102,15,235,212 ; por %xmm4,%xmm2 DB 102,15,235,220 ; por %xmm4,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -39391,15 +39746,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,133 ; ja 28fab <_sk_load_g8_dst_sse2_8bit+0x27> + DB 119,133 ; ja 2958b <_sk_load_g8_dst_sse2_8bit+0x27> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 290a8 <_sk_load_g8_dst_sse2_8bit+0x124> + DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29688 <_sk_load_g8_dst_sse2_8bit+0x124> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,208 ; movd %eax,%xmm2 - DB 233,99,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27> + DB 233,99,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2 @@ -39407,7 +39762,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC DB 102,15,110,216 ; movd %eax,%xmm3 DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3 DB 243,15,16,211 ; movss %xmm3,%xmm2 - DB 233,62,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27> + DB 233,62,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2 @@ -39418,7 +39773,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3 DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3 DB 242,15,16,211 ; movsd %xmm3,%xmm2 - DB 233,6,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27> + DB 233,6,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27> DB 15,31,0 ; nopl (%rax) DB 146 ; xchg %eax,%edx DB 255 ; (bad) @@ -39452,7 +39807,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC DB 72,193,226,2 ; shl $0x2,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,192 ; test %r8,%r8 - DB 15,133,253,0,0,0 ; jne 291e6 <_sk_srcover_rgba_8888_sse2_8bit+0x122> + DB 15,133,253,0,0,0 ; jne 297c6 <_sk_srcover_rgba_8888_sse2_8bit+0x122> DB 70,15,16,68,138,16 ; movups 0x10(%rdx,%r9,4),%xmm8 DB 102,70,15,16,12,138 ; movupd (%rdx,%r9,4),%xmm9 DB 77,133,192 ; test %r8,%r8 @@ -39501,7 +39856,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC DB 102,68,15,248,207 ; psubb %xmm7,%xmm9 DB 102,68,15,252,200 ; paddb %xmm0,%xmm9 DB 102,68,15,252,193 ; paddb %xmm1,%xmm8 - DB 117,72 ; jne 2921d <_sk_srcover_rgba_8888_sse2_8bit+0x159> + DB 117,72 ; jne 297fd <_sk_srcover_rgba_8888_sse2_8bit+0x159> DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4) DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -39512,29 +39867,29 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 254,200 ; dec %al DB 60,6 ; cmp $0x6,%al - DB 15,135,246,254,255,255 ; ja 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31> + DB 15,135,246,254,255,255 ; ja 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31> DB 15,182,192 ; movzbl %al,%eax - DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 292d8 <_sk_srcover_rgba_8888_sse2_8bit+0x214> + DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 298b8 <_sk_srcover_rgba_8888_sse2_8bit+0x214> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 243,70,15,16,12,138 ; movss (%rdx,%r9,4),%xmm9 - DB 233,216,254,255,255 ; jmpq 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31> + DB 233,216,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31> DB 65,128,224,7 ; and $0x7,%r8b DB 65,254,200 ; dec %r8b DB 65,128,248,6 ; cmp $0x6,%r8b - DB 119,184 ; ja 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + DB 119,184 ; ja 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> DB 65,15,182,192 ; movzbl %r8b,%eax - DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 292f4 <_sk_srcover_rgba_8888_sse2_8bit+0x230> + DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 298d4 <_sk_srcover_rgba_8888_sse2_8bit+0x230> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4) - DB 235,156 ; jmp 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + DB 235,156 ; jmp 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4 DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9 DB 102,70,15,18,12,138 ; movlpd (%rdx,%r9,4),%xmm9 - DB 233,151,254,255,255 ; jmpq 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31> + DB 233,151,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31> DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4 DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8 DB 243,66,15,16,100,138,20 ; movss 0x14(%rdx,%r9,4),%xmm4 @@ -39543,23 +39898,23 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC DB 68,15,40,196 ; movaps %xmm4,%xmm8 DB 243,66,15,16,100,138,16 ; movss 0x10(%rdx,%r9,4),%xmm4 DB 243,68,15,16,196 ; movss %xmm4,%xmm8 - DB 233,94,254,255,255 ; jmpq 290ef <_sk_srcover_rgba_8888_sse2_8bit+0x2b> + DB 233,94,254,255,255 ; jmpq 296cf <_sk_srcover_rgba_8888_sse2_8bit+0x2b> DB 102,65,15,112,225,78 ; pshufd $0x4e,%xmm9,%xmm4 DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4) DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4) - DB 233,57,255,255,255 ; jmpq 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + DB 233,57,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> DB 102,65,15,112,224,78 ; pshufd $0x4e,%xmm8,%xmm4 DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4) DB 102,65,15,112,224,229 ; pshufd $0xe5,%xmm8,%xmm4 DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4) DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4) DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4) - DB 233,13,255,255,255 ; jmpq 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> + DB 233,13,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e> DB 15,31,0 ; nopl (%rax) DB 58,255 ; cmp %bh,%bh DB 255 ; (bad) DB 255 ; (bad) - DB 123,255 ; jnp 292dd <_sk_srcover_rgba_8888_sse2_8bit+0x219> + DB 123,255 ; jnp 298bd <_sk_srcover_rgba_8888_sse2_8bit+0x219> DB 255 ; (bad) DB 255,110,255 ; ljmp *-0x1(%rsi) DB 255 ; (bad) @@ -39595,7 +39950,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9 DB 72,173 ; lods %ds:(%rsi),%rax DB 243,15,16,0 ; movss (%rax),%xmm0 - DB 243,15,89,5,148,34,0,0 ; mulss 0x2294(%rip),%xmm0 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 243,15,89,5,160,34,0,0 ; mulss 0x22a0(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 243,15,44,192 ; cvttss2si %xmm0,%eax DB 102,15,239,246 ; pxor %xmm6,%xmm6 DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 @@ -39607,7 +39962,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6 DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6 DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6 - DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,111,254 ; movdqa %xmm6,%xmm7 DB 102,65,15,213,248 ; pmullw %xmm8,%xmm7 DB 102,15,111,230 ; movdqa %xmm6,%xmm4 @@ -39638,10 +39993,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 15,133,239,0,0,0 ; jne 294c1 <_sk_scale_u8_sse2_8bit+0x110> + DB 15,133,239,0,0,0 ; jne 29aa1 <_sk_scale_u8_sse2_8bit+0x110> DB 243,66,15,126,36,2 ; movq (%rdx,%r8,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 - DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,15,40,236 ; movapd %xmm4,%xmm5 DB 102,65,15,105,232 ; punpckhwd %xmm8,%xmm5 @@ -39694,15 +40049,15 @@ _sk_scale_u8_sse2_8bit LABEL PROC DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,6,255,255,255 ; ja 293dc <_sk_scale_u8_sse2_8bit+0x2b> + DB 15,135,6,255,255,255 ; ja 299bc <_sk_scale_u8_sse2_8bit+0x2b> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29558 <_sk_scale_u8_sse2_8bit+0x1a7> + DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29b38 <_sk_scale_u8_sse2_8bit+0x1a7> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,224 ; movd %eax,%xmm4 - DB 233,228,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b> + DB 233,228,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,196,224,2 ; pinsrw $0x2,%eax,%xmm4 @@ -39710,7 +40065,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC DB 102,15,110,232 ; movd %eax,%xmm5 DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 243,15,16,229 ; movss %xmm5,%xmm4 - DB 233,191,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b> + DB 233,191,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 102,15,196,224,6 ; pinsrw $0x6,%eax,%xmm4 @@ -39721,7 +40076,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5 DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 233,135,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b> + DB 233,135,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b> DB 15,31,0 ; nopl (%rax) DB 146 ; xchg %eax,%edx DB 255 ; (bad) @@ -39748,7 +40103,7 @@ PUBLIC _sk_lerp_1_float_sse2_8bit _sk_lerp_1_float_sse2_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 243,15,16,32 ; movss (%rax),%xmm4 - DB 243,15,89,37,58,32,0,0 ; mulss 0x203a(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b> + DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b> DB 243,15,44,196 ; cvttss2si %xmm4,%eax DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4 @@ -39761,7 +40116,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11 DB 102,69,15,96,217 ; punpcklbw %xmm9,%xmm11 DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1 - DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,65,15,219,240 ; pand %xmm8,%xmm6 DB 102,15,111,230 ; movdqa %xmm6,%xmm4 DB 102,15,213,225 ; pmullw %xmm1,%xmm4 @@ -39824,10 +40179,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC DB 72,15,175,209 ; imul %rcx,%rdx DB 72,3,16 ; add (%rax),%rdx DB 77,133,201 ; test %r9,%r9 - DB 15,133,141,1,0,0 ; jne 29858 <_sk_lerp_u8_sse2_8bit+0x1ae> + DB 15,133,141,1,0,0 ; jne 29e38 <_sk_lerp_u8_sse2_8bit+0x1ae> DB 243,66,15,126,44,2 ; movq (%rdx,%r8,1),%xmm5 DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 - DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,15,40,229 ; movapd %xmm5,%xmm4 DB 102,65,15,105,224 ; punpckhwd %xmm8,%xmm4 @@ -39913,15 +40268,15 @@ _sk_lerp_u8_sse2_8bit LABEL PROC DB 102,15,239,237 ; pxor %xmm5,%xmm5 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,104,254,255,255 ; ja 296d5 <_sk_lerp_u8_sse2_8bit+0x2b> + DB 15,135,104,254,255,255 ; ja 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 298ec <_sk_lerp_u8_sse2_8bit+0x242> + DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 29ecc <_sk_lerp_u8_sse2_8bit+0x242> DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax DB 72,1,200 ; add %rcx,%rax DB 255,224 ; jmpq *%rax DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax DB 102,15,110,232 ; movd %eax,%xmm5 - DB 233,70,254,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b> + DB 233,70,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b> DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax DB 102,15,239,237 ; pxor %xmm5,%xmm5 DB 102,15,196,232,2 ; pinsrw $0x2,%eax,%xmm5 @@ -39929,7 +40284,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC DB 102,15,110,224 ; movd %eax,%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 243,15,16,236 ; movss %xmm4,%xmm5 - DB 233,33,254,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b> + DB 233,33,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b> DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax DB 102,15,239,237 ; pxor %xmm5,%xmm5 DB 102,15,196,232,6 ; pinsrw $0x6,%eax,%xmm5 @@ -39940,7 +40295,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 242,15,16,236 ; movsd %xmm4,%xmm5 - DB 233,233,253,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b> + DB 233,233,253,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b> DB 149 ; xchg %eax,%ebp DB 255 ; (bad) DB 255 ; (bad) @@ -39979,7 +40334,7 @@ _sk_move_dst_src_sse2_8bit LABEL PROC PUBLIC _sk_black_color_sse2_8bit _sk_black_color_sse2_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f> + DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 255,224 ; jmpq *%rax @@ -40750,6 +41105,13 @@ _sk_xor__sse2_8bit LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax +PUBLIC _sk_plus__sse2_8bit +_sk_plus__sse2_8bit LABEL PROC + DB 102,15,220,194 ; paddusb %xmm2,%xmm0 + DB 102,15,220,203 ; paddusb %xmm3,%xmm1 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + PUBLIC _sk_darken_sse2_8bit _sk_darken_sse2_8bit LABEL PROC DB 242,15,112,227,231 ; pshuflw $0xe7,%xmm3,%xmm4 @@ -40843,7 +41205,7 @@ _sk_darken_sse2_8bit LABEL PROC DB 102,65,15,248,234 ; psubb %xmm10,%xmm5 DB 102,15,248,207 ; psubb %xmm7,%xmm1 DB 102,15,248,196 ; psubb %xmm4,%xmm0 - DB 102,15,111,37,176,30,0,0 ; movdqa 0x1eb0(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 102,15,111,37,164,30,0,0 ; movdqa 0x1ea4(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 102,15,111,252 ; movdqa %xmm4,%xmm7 DB 102,15,223,248 ; pandn %xmm0,%xmm7 @@ -40949,7 +41311,7 @@ _sk_lighten_sse2_8bit LABEL PROC DB 102,65,15,248,234 ; psubb %xmm10,%xmm5 DB 102,15,248,207 ; psubb %xmm7,%xmm1 DB 102,15,248,196 ; psubb %xmm4,%xmm0 - DB 102,15,111,37,196,28,0,0 ; movdqa 0x1cc4(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 102,15,111,37,184,28,0,0 ; movdqa 0x1cb8(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 102,15,111,252 ; movdqa %xmm4,%xmm7 DB 102,15,223,248 ; pandn %xmm0,%xmm7 @@ -40997,7 +41359,7 @@ _sk_exclusion_sse2_8bit LABEL PROC DB 102,15,113,214,8 ; psrlw $0x8,%xmm6 DB 102,15,103,244 ; packuswb %xmm4,%xmm6 DB 102,15,103,239 ; packuswb %xmm7,%xmm5 - DB 102,15,111,37,247,27,0,0 ; movdqa 0x1bf7(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 102,15,111,37,235,27,0,0 ; movdqa 0x1beb(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,15,248,205 ; psubb %xmm5,%xmm1 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 102,15,219,230 ; pand %xmm6,%xmm4 @@ -41094,7 +41456,7 @@ _sk_difference_sse2_8bit LABEL PROC DB 102,65,15,103,244 ; packuswb %xmm12,%xmm6 DB 102,65,15,218,226 ; pminub %xmm10,%xmm4 DB 102,65,15,218,243 ; pminub %xmm11,%xmm6 - DB 102,15,111,45,52,26,0,0 ; movdqa 0x1a34(%rip),%xmm5 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af> + DB 102,15,111,45,40,26,0,0 ; movdqa 0x1a28(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3> DB 102,15,248,206 ; psubb %xmm6,%xmm1 DB 102,15,219,245 ; pand %xmm5,%xmm6 DB 102,15,219,236 ; pand %xmm4,%xmm5 @@ -41189,7 +41551,7 @@ _sk_hardlight_sse2_8bit LABEL PROC DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11 DB 102,69,15,217,211 ; psubusw %xmm11,%xmm10 DB 102,68,15,117,213 ; pcmpeqw %xmm5,%xmm10 - DB 102,15,111,45,199,16,0,0 ; movdqa 0x10c7(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,111,45,187,16,0,0 ; movdqa 0x10bb(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,111,198 ; movdqa %xmm6,%xmm0 DB 102,15,239,197 ; pxor %xmm5,%xmm0 DB 102,65,15,213,198 ; pmullw %xmm14,%xmm0 @@ -41293,7 +41655,7 @@ _sk_hardlight_sse2_8bit LABEL PROC DB 102,68,15,253,188,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm15 DB 102,68,15,253,76,36,16 ; paddw 0x10(%rsp),%xmm9 DB 102,15,253,44,36 ; paddw (%rsp),%xmm5 - DB 102,15,111,5,69,22,0,0 ; movdqa 0x1645(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf> + DB 102,15,111,5,57,22,0,0 ; movdqa 0x1639(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3> DB 102,15,253,208 ; paddw %xmm0,%xmm2 DB 102,68,15,253,210 ; paddw %xmm2,%xmm10 DB 102,68,15,253,248 ; paddw %xmm0,%xmm15 @@ -41302,7 +41664,7 @@ _sk_hardlight_sse2_8bit LABEL PROC DB 102,69,15,253,193 ; paddw %xmm9,%xmm8 DB 102,15,253,232 ; paddw %xmm0,%xmm5 DB 102,15,253,233 ; paddw %xmm1,%xmm5 - DB 102,15,111,5,40,22,0,0 ; movdqa 0x1628(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf> + DB 102,15,111,5,28,22,0,0 ; movdqa 0x161c(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3> DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5 DB 102,68,15,228,192 ; pmulhuw %xmm0,%xmm8 DB 102,68,15,228,248 ; pmulhuw %xmm0,%xmm15 @@ -41405,7 +41767,7 @@ _sk_overlay_sse2_8bit LABEL PROC DB 102,15,217,234 ; psubusw %xmm2,%xmm5 DB 102,15,117,236 ; pcmpeqw %xmm4,%xmm5 DB 102,15,127,172,36,160,0,0,0 ; movdqa %xmm5,0xa0(%rsp) - DB 102,15,111,53,92,12,0,0 ; movdqa 0xc5c(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f> + DB 102,15,111,53,80,12,0,0 ; movdqa 0xc50(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03> DB 102,15,111,194 ; movdqa %xmm2,%xmm0 DB 102,15,239,198 ; pxor %xmm6,%xmm0 DB 102,65,15,213,199 ; pmullw %xmm15,%xmm0 @@ -41513,7 +41875,7 @@ _sk_overlay_sse2_8bit LABEL PROC DB 102,68,15,253,92,36,112 ; paddw 0x70(%rsp),%xmm11 DB 102,15,253,44,36 ; paddw (%rsp),%xmm5 DB 102,15,253,116,36,16 ; paddw 0x10(%rsp),%xmm6 - DB 102,15,111,5,214,17,0,0 ; movdqa 0x11d6(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf> + DB 102,15,111,5,202,17,0,0 ; movdqa 0x11ca(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3> DB 102,68,15,253,224 ; paddw %xmm0,%xmm12 DB 102,68,15,253,227 ; paddw %xmm3,%xmm12 DB 102,68,15,253,216 ; paddw %xmm0,%xmm11 @@ -41522,7 +41884,7 @@ _sk_overlay_sse2_8bit LABEL PROC DB 102,15,253,234 ; paddw %xmm2,%xmm5 DB 102,15,253,240 ; paddw %xmm0,%xmm6 DB 102,15,253,241 ; paddw %xmm1,%xmm6 - DB 102,15,111,5,186,17,0,0 ; movdqa 0x11ba(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf> + DB 102,15,111,5,174,17,0,0 ; movdqa 0x11ae(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3> DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6 DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5 DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11 @@ -41556,14 +41918,14 @@ ALIGN 4 DB 252 ; cld DB 190,0,0,128,191 ; mov $0xbf800000,%esi DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 2b5f0 <.literal4+0x64> + DB 224,64 ; loopne 2bbdc <.literal4+0x64> DB 154 ; (bad) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 2b5f9 <.literal4+0x6d> + DB 71,225,61 ; rex.RXB loope 2bbe5 <.literal4+0x6d> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 2b603 <.literal4+0x77> + DB 127,67 ; jg 2bbef <.literal4+0x77> DB 145 ; xchg %eax,%ecx DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi) DB 10,215 ; or %bh,%dl @@ -41596,7 +41958,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 2b619 <.literal4+0x8d> + DB 224,7 ; loopne 2bc05 <.literal4+0x8d> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -41607,8 +41969,8 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 0,52,255 ; add %dh,(%rdi,%rdi,8) DB 255 ; (bad) - DB 127,0 ; jg 2b62c <.literal4+0xa0> - DB 119,115 ; ja 2b6a1 <.literal4+0x115> + DB 127,0 ; jg 2bc18 <.literal4+0xa0> + DB 119,115 ; ja 2bc8d <.literal4+0x115> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -41631,12 +41993,12 @@ ALIGN 4 DB 190,80,128,3,62 ; mov $0x3e038050,%esi DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 2b6b7 <.literal4+0x12b> + DB 118,63 ; jbe 2bca3 <.literal4+0x12b> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 0,0 ; add %al,(%rax) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 2b6c6 <.literal4+0x13a> + DB 124,66 ; jl 2bcb2 <.literal4+0x13a> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax) @@ -41646,9 +42008,9 @@ ALIGN 4 DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax) DB 0,0 ; add %al,(%rax) DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax) - DB 112,65 ; jo 2b6e9 <.literal4+0x15d> + DB 112,65 ; jo 2bcd5 <.literal4+0x15d> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 2b6f3 <.literal4+0x167> + DB 127,71 ; jg 2bcdf <.literal4+0x167> DB 208 ; (bad) DB 179,89 ; mov $0x59,%bl DB 62,89 ; ds pop %rcx @@ -41675,15 +42037,15 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 128,0,0 ; addb $0x0,(%rax) DB 0,191,0,0,192,191 ; add %bh,-0x40400000(%rdi) - DB 114,28 ; jb 2b712 <.literal4+0x186> + DB 114,28 ; jb 2bcfe <.literal4+0x186> DB 199 ; (bad) DB 62,0,0 ; add %al,%ds:(%rax) DB 192,63,85 ; sarb $0x55,(%rdi) DB 85 ; push %rbp DB 149 ; xchg %eax,%ebp DB 191,57,142,99,61 ; mov $0x3d638e39,%edi - DB 114,249 ; jb 2b6ff <.literal4+0x173> - DB 127,63 ; jg 2b747 <_sk_overlay_sse2_8bit+0x626> + DB 114,249 ; jb 2bceb <.literal4+0x173> + DB 127,63 ; jg 2bd33 <_sk_overlay_sse2_8bit+0x626> DB 3,0 ; add (%rax),%eax DB 0,0 ; add %al,(%rax) DB 0,128,0,0,0,4 ; add %al,0x4000000(%rax) @@ -41719,16 +42081,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b768 <_sk_overlay_sse2_8bit+0xa000647> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bd48 <_sk_overlay_sse2_8bit+0xa00063b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b770 <_sk_overlay_sse2_8bit+0x1200064f> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bd50 <_sk_overlay_sse2_8bit+0x12000643> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b778 <_sk_overlay_sse2_8bit+0x1a000657> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bd58 <_sk_overlay_sse2_8bit+0x1a00064b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b780 <_sk_overlay_sse2_8bit+0x300065f> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bd60 <_sk_overlay_sse2_8bit+0x3000653> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -41771,16 +42133,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b7c8 <_sk_overlay_sse2_8bit+0xa0006a7> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bda8 <_sk_overlay_sse2_8bit+0xa00069b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b7d0 <_sk_overlay_sse2_8bit+0x120006af> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bdb0 <_sk_overlay_sse2_8bit+0x120006a3> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b7d8 <_sk_overlay_sse2_8bit+0x1a0006b7> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bdb8 <_sk_overlay_sse2_8bit+0x1a0006ab> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b7e0 <_sk_overlay_sse2_8bit+0x30006bf> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bdc0 <_sk_overlay_sse2_8bit+0x30006b3> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -41823,16 +42185,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b828 <_sk_overlay_sse2_8bit+0xa000707> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be08 <_sk_overlay_sse2_8bit+0xa0006fb> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b830 <_sk_overlay_sse2_8bit+0x1200070f> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be10 <_sk_overlay_sse2_8bit+0x12000703> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b838 <_sk_overlay_sse2_8bit+0x1a000717> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be18 <_sk_overlay_sse2_8bit+0x1a00070b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b840 <_sk_overlay_sse2_8bit+0x300071f> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be20 <_sk_overlay_sse2_8bit+0x3000713> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -41875,16 +42237,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b888 <_sk_overlay_sse2_8bit+0xa000767> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be68 <_sk_overlay_sse2_8bit+0xa00075b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b890 <_sk_overlay_sse2_8bit+0x1200076f> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be70 <_sk_overlay_sse2_8bit+0x12000763> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b898 <_sk_overlay_sse2_8bit+0x1a000777> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be78 <_sk_overlay_sse2_8bit+0x1a00076b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b8a0 <_sk_overlay_sse2_8bit+0x300077f> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be80 <_sk_overlay_sse2_8bit+0x3000773> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -41927,16 +42289,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b8e8 <_sk_overlay_sse2_8bit+0xa0007c7> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bec8 <_sk_overlay_sse2_8bit+0xa0007bb> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b8f0 <_sk_overlay_sse2_8bit+0x120007cf> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bed0 <_sk_overlay_sse2_8bit+0x120007c3> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b8f8 <_sk_overlay_sse2_8bit+0x1a0007d7> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bed8 <_sk_overlay_sse2_8bit+0x1a0007cb> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b900 <_sk_overlay_sse2_8bit+0x30007df> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bee0 <_sk_overlay_sse2_8bit+0x30007d3> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -41979,16 +42341,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b948 <_sk_overlay_sse2_8bit+0xa000827> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf28 <_sk_overlay_sse2_8bit+0xa00081b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b950 <_sk_overlay_sse2_8bit+0x1200082f> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf30 <_sk_overlay_sse2_8bit+0x12000823> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b958 <_sk_overlay_sse2_8bit+0x1a000837> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf38 <_sk_overlay_sse2_8bit+0x1a00082b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b960 <_sk_overlay_sse2_8bit+0x300083f> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bf40 <_sk_overlay_sse2_8bit+0x3000833> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -42031,16 +42393,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b9a8 <_sk_overlay_sse2_8bit+0xa000887> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf88 <_sk_overlay_sse2_8bit+0xa00087b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b9b0 <_sk_overlay_sse2_8bit+0x1200088f> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf90 <_sk_overlay_sse2_8bit+0x12000883> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b9b8 <_sk_overlay_sse2_8bit+0x1a000897> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf98 <_sk_overlay_sse2_8bit+0x1a00088b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b9c0 <_sk_overlay_sse2_8bit+0x300089f> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bfa0 <_sk_overlay_sse2_8bit+0x3000893> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -42083,16 +42445,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ba08 <_sk_overlay_sse2_8bit+0xa0008e7> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bfe8 <_sk_overlay_sse2_8bit+0xa0008db> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ba10 <_sk_overlay_sse2_8bit+0x120008ef> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bff0 <_sk_overlay_sse2_8bit+0x120008e3> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ba18 <_sk_overlay_sse2_8bit+0x1a0008f7> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bff8 <_sk_overlay_sse2_8bit+0x1a0008eb> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ba20 <_sk_overlay_sse2_8bit+0x30008ff> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c000 <_sk_overlay_sse2_8bit+0x30008f3> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -42929,11 +43291,11 @@ ALIGN 16 DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%rax) DB 191,0,0,224,64 ; mov $0x40e00000,%edi DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 2c028 <.literal16+0xf8> + DB 224,64 ; loopne 2c608 <.literal16+0xf8> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 2c02c <.literal16+0xfc> + DB 224,64 ; loopne 2c60c <.literal16+0xfc> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 2c030 <.literal16+0x100> + DB 224,64 ; loopne 2c610 <.literal16+0x100> DB 154 ; (bad) DB 153 ; cltd DB 153 ; cltd @@ -42953,13 +43315,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 2c051 <.literal16+0x121> + DB 71,225,61 ; rex.RXB loope 2c631 <.literal16+0x121> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 2c055 <.literal16+0x125> + DB 71,225,61 ; rex.RXB loope 2c635 <.literal16+0x125> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 2c059 <.literal16+0x129> + DB 71,225,61 ; rex.RXB loope 2c639 <.literal16+0x129> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 2c05d <.literal16+0x12d> + DB 71,225,61 ; rex.RXB loope 2c63d <.literal16+0x12d> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -42970,10 +43332,10 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c038 <_sk_overlay_sse2_8bit+0xa000f17> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c618 <_sk_overlay_sse2_8bit+0xa000f0b> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302c040 <_sk_overlay_sse2_8bit+0x3000f1f> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302c620 <_sk_overlay_sse2_8bit+0x3000f13> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -42988,11 +43350,11 @@ ALIGN 16 DB 255,0 ; incl (%rax) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 2c09b <.literal16+0x16b> + DB 127,67 ; jg 2c67b <.literal16+0x16b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 2c09f <.literal16+0x16f> + DB 127,67 ; jg 2c67f <.literal16+0x16f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 2c0a3 <.literal16+0x173> + DB 127,67 ; jg 2c683 <.literal16+0x173> DB 145 ; xchg %eax,%ecx DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi) DB 145 ; xchg %eax,%ecx @@ -43143,13 +43505,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 2c1a9 <.literal16+0x279> + DB 224,7 ; loopne 2c789 <.literal16+0x279> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 2c1ad <.literal16+0x27d> + DB 224,7 ; loopne 2c78d <.literal16+0x27d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 2c1b1 <.literal16+0x281> + DB 224,7 ; loopne 2c791 <.literal16+0x281> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 2c1b5 <.literal16+0x285> + DB 224,7 ; loopne 2c795 <.literal16+0x285> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -43209,17 +43571,17 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 2c234 <.literal16+0x304> + DB 127,0 ; jg 2c814 <.literal16+0x304> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 2c238 <.literal16+0x308> + DB 127,0 ; jg 2c818 <.literal16+0x308> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 2c23c <.literal16+0x30c> + DB 127,0 ; jg 2c81c <.literal16+0x30c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 2c240 <.literal16+0x310> - DB 119,115 ; ja 2c2b5 <.literal16+0x385> + DB 127,0 ; jg 2c820 <.literal16+0x310> + DB 119,115 ; ja 2c895 <.literal16+0x385> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -43230,7 +43592,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 2c219 <.literal16+0x2e9> + DB 117,191 ; jne 2c7f9 <.literal16+0x2e9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -43242,7 +43604,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a6025a <_sk_overlay_sse2_8bit+0xffffffffe9a35139> + DB 233,220,63,163,233 ; jmpq ffffffffe9a6083a <_sk_overlay_sse2_8bit+0xffffffffe9a3512d> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -43332,16 +43694,16 @@ ALIGN 16 DB 128,3,62 ; addb $0x3e,(%rbx) DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 2c3a3 <.literal16+0x473> + DB 118,63 ; jbe 2c983 <.literal16+0x473> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 2c3a7 <.literal16+0x477> + DB 118,63 ; jbe 2c987 <.literal16+0x477> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 2c3ab <.literal16+0x47b> + DB 118,63 ; jbe 2c98b <.literal16+0x47b> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 2c3af <.literal16+0x47f> + DB 118,63 ; jbe 2c98f <.literal16+0x47f> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) @@ -43362,13 +43724,13 @@ ALIGN 16 DB 65,0,0 ; add %al,(%r8) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 2c3e6 <.literal16+0x4b6> + DB 124,66 ; jl 2c9c6 <.literal16+0x4b6> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 2c3ea <.literal16+0x4ba> + DB 124,66 ; jl 2c9ca <.literal16+0x4ba> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 2c3ee <.literal16+0x4be> + DB 124,66 ; jl 2c9ce <.literal16+0x4be> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 2c3f2 <.literal16+0x4c2> + DB 124,66 ; jl 2c9d2 <.literal16+0x4c2> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 0,240 ; add %dh,%al @@ -43414,13 +43776,13 @@ ALIGN 16 DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax) DB 61,137,136,136,61 ; cmp $0x3d888889,%eax DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 2c475 <.literal16+0x545> + DB 112,65 ; jo 2ca55 <.literal16+0x545> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 2c479 <.literal16+0x549> + DB 112,65 ; jo 2ca59 <.literal16+0x549> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 2c47d <.literal16+0x54d> + DB 112,65 ; jo 2ca5d <.literal16+0x54d> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 2c481 <.literal16+0x551> + DB 112,65 ; jo 2ca61 <.literal16+0x551> DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) DB 0,0 ; add %al,(%rax) DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) @@ -43459,13 +43821,13 @@ ALIGN 16 DB 64,254 ; rex (bad) DB 255,0 ; incl (%rax) DB 255 ; (bad) - DB 127,71 ; jg 2c4eb <.literal16+0x5bb> + DB 127,71 ; jg 2cacb <.literal16+0x5bb> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 2c4ef <.literal16+0x5bf> + DB 127,71 ; jg 2cacf <.literal16+0x5bf> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 2c4f3 <.literal16+0x5c3> + DB 127,71 ; jg 2cad3 <.literal16+0x5c3> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 2c4f7 <.literal16+0x5c7> + DB 127,71 ; jg 2cad7 <.literal16+0x5c7> DB 208 ; (bad) DB 179,89 ; mov $0x59,%bl DB 62,208 ; ds (bad) @@ -43495,10 +43857,10 @@ ALIGN 16 DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax DB 152 ; cwtl DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx) - DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2d5fa <_sk_overlay_sse2_8bit+0x2dc024d9> + DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2dbda <_sk_overlay_sse2_8bit+0x2dc024cd> DB 17,192 ; adc %eax,%eax DB 45,16,17,192,18 ; sub $0x12c01110,%eax - DB 120,57 ; js 2c52c <.literal16+0x5fc> + DB 120,57 ; js 2cb0c <.literal16+0x5fc> DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil @@ -43563,13 +43925,13 @@ ALIGN 16 DB 192,191,0,0,192,191,0 ; sarb $0x0,-0x40400000(%rdi) DB 0,192 ; add %al,%al DB 191,0,0,192,191 ; mov $0xbfc00000,%edi - DB 114,28 ; jb 2c5de <.literal16+0x6ae> + DB 114,28 ; jb 2cbbe <.literal16+0x6ae> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 2c5e2 <.literal16+0x6b2> + DB 62,114,28 ; jb,pt 2cbc2 <.literal16+0x6b2> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 2c5e6 <.literal16+0x6b6> + DB 62,114,28 ; jb,pt 2cbc6 <.literal16+0x6b6> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 2c5ea <.literal16+0x6ba> + DB 62,114,28 ; jb,pt 2cbca <.literal16+0x6ba> DB 199 ; (bad) DB 62,85 ; ds push %rbp DB 85 ; push %rbp @@ -43588,15 +43950,15 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665435 <_sk_overlay_sse2_8bit+0x3d63a314> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665a15 <_sk_overlay_sse2_8bit+0x3d63a308> DB 57,142,99,61,114,249 ; cmp %ecx,-0x68dc29d(%rsi) - DB 127,63 ; jg 2c643 <.literal16+0x713> - DB 114,249 ; jb 2c5ff <.literal16+0x6cf> - DB 127,63 ; jg 2c647 <.literal16+0x717> - DB 114,249 ; jb 2c603 <.literal16+0x6d3> - DB 127,63 ; jg 2c64b <.literal16+0x71b> - DB 114,249 ; jb 2c607 <.literal16+0x6d7> - DB 127,63 ; jg 2c64f <.literal16+0x71f> + DB 127,63 ; jg 2cc23 <.literal16+0x713> + DB 114,249 ; jb 2cbdf <.literal16+0x6cf> + DB 127,63 ; jg 2cc27 <.literal16+0x717> + DB 114,249 ; jb 2cbe3 <.literal16+0x6d3> + DB 127,63 ; jg 2cc2b <.literal16+0x71b> + DB 114,249 ; jb 2cbe7 <.literal16+0x6d7> + DB 127,63 ; jg 2cc2f <.literal16+0x71f> DB 3,0 ; add (%rax),%eax DB 0,0 ; add %al,(%rax) DB 3,0 ; add (%rax),%eax @@ -43703,14 +44065,14 @@ ALIGN 16 DB 255 ; (bad) DB 255 ; (bad) DB 255,0 ; incl (%rax) - DB 127,0 ; jg 2c6e2 <.literal16+0x7b2> - DB 127,0 ; jg 2c6e4 <.literal16+0x7b4> - DB 127,0 ; jg 2c6e6 <.literal16+0x7b6> - DB 127,0 ; jg 2c6e8 <.literal16+0x7b8> - DB 127,0 ; jg 2c6ea <.literal16+0x7ba> - DB 127,0 ; jg 2c6ec <.literal16+0x7bc> - DB 127,0 ; jg 2c6ee <.literal16+0x7be> - DB 127,0 ; jg 2c6f0 <.literal16+0x7c0> + DB 127,0 ; jg 2ccc2 <.literal16+0x7b2> + DB 127,0 ; jg 2ccc4 <.literal16+0x7b4> + DB 127,0 ; jg 2ccc6 <.literal16+0x7b6> + DB 127,0 ; jg 2ccc8 <.literal16+0x7b8> + DB 127,0 ; jg 2ccca <.literal16+0x7ba> + DB 127,0 ; jg 2cccc <.literal16+0x7bc> + DB 127,0 ; jg 2ccce <.literal16+0x7be> + DB 127,0 ; jg 2ccd0 <.literal16+0x7c0> DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax) DB 129 ; .byte 0x81 DB 128 ; .byte 0x80 @@ -43805,7 +44167,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 102,15,110,2 ; movd (%edx),%xmm0 DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0 DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 - DB 15,40,144,226,144,0,0 ; movaps 0x90e2(%eax),%xmm2 + DB 15,40,144,98,146,0,0 ; movaps 0x9262(%eax),%xmm2 DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,16,6 ; movups (%esi),%xmm0 DB 15,88,193 ; addps %xmm1,%xmm0 @@ -43820,7 +44182,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 15,41,82,32 ; movaps %xmm2,0x20(%edx) DB 15,41,82,16 ; movaps %xmm2,0x10(%edx) DB 131,236,8 ; sub $0x8,%esp - DB 15,40,144,242,144,0,0 ; movaps 0x90f2(%eax),%xmm2 + DB 15,40,144,114,146,0,0 ; movaps 0x9272(%eax),%xmm2 DB 15,87,219 ; xorps %xmm3,%xmm3 DB 86 ; push %esi DB 82 ; push %edx @@ -43851,16 +44213,16 @@ _sk_dither_sse2 LABEL PROC DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4 DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7 DB 102,15,239,253 ; pxor %xmm5,%xmm7 - DB 102,15,111,177,133,144,0,0 ; movdqa 0x9085(%ecx),%xmm6 + DB 102,15,111,177,5,146,0,0 ; movdqa 0x9205(%ecx),%xmm6 DB 102,15,111,207 ; movdqa %xmm7,%xmm1 DB 102,15,219,206 ; pand %xmm6,%xmm1 DB 102,15,219,245 ; pand %xmm5,%xmm6 - DB 102,15,111,129,165,144,0,0 ; movdqa 0x90a5(%ecx),%xmm0 + DB 102,15,111,129,37,146,0,0 ; movdqa 0x9225(%ecx),%xmm0 DB 102,15,111,231 ; movdqa %xmm7,%xmm4 DB 102,15,219,224 ; pand %xmm0,%xmm4 DB 102,15,219,197 ; pand %xmm5,%xmm0 - DB 102,15,219,185,149,144,0,0 ; pand 0x9095(%ecx),%xmm7 - DB 102,15,219,169,149,144,0,0 ; pand 0x9095(%ecx),%xmm5 + DB 102,15,219,185,21,146,0,0 ; pand 0x9215(%ecx),%xmm7 + DB 102,15,219,169,21,146,0,0 ; pand 0x9215(%ecx),%xmm5 DB 102,15,114,246,4 ; pslld $0x4,%xmm6 DB 102,15,254,192 ; paddd %xmm0,%xmm0 DB 102,15,235,198 ; por %xmm6,%xmm0 @@ -43875,8 +44237,8 @@ _sk_dither_sse2 LABEL PROC DB 102,15,114,215,1 ; psrld $0x1,%xmm7 DB 102,15,235,231 ; por %xmm7,%xmm4 DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0 - DB 15,89,129,181,144,0,0 ; mulps 0x90b5(%ecx),%xmm0 - DB 15,88,129,197,144,0,0 ; addps 0x90c5(%ecx),%xmm0 + DB 15,89,129,53,146,0,0 ; mulps 0x9235(%ecx),%xmm0 + DB 15,88,129,69,146,0,0 ; addps 0x9245(%ecx),%xmm0 DB 243,15,16,14 ; movss (%esi),%xmm1 DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1 DB 15,89,200 ; mulps %xmm0,%xmm1 @@ -43940,7 +44302,7 @@ _sk_black_color_sse2 LABEL PROC DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 141,81,4 ; lea 0x4(%ecx),%edx DB 131,236,8 ; sub $0x8,%esp - DB 15,40,152,149,143,0,0 ; movaps 0x8f95(%eax),%xmm3 + DB 15,40,152,21,145,0,0 ; movaps 0x9115(%eax),%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,87,201 ; xorps %xmm1,%xmm1 DB 15,87,210 ; xorps %xmm2,%xmm2 @@ -43961,7 +44323,7 @@ _sk_white_color_sse2 LABEL PROC DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 141,81,4 ; lea 0x4(%ecx),%edx DB 131,236,8 ; sub $0x8,%esp - DB 15,40,128,117,143,0,0 ; movaps 0x8f75(%eax),%xmm0 + DB 15,40,128,245,144,0,0 ; movaps 0x90f5(%eax),%xmm0 DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,40,216 ; movaps %xmm0,%xmm3 @@ -44043,7 +44405,7 @@ _sk_srcatop_sse2 LABEL PROC DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 - DB 15,40,170,214,142,0,0 ; movaps 0x8ed6(%edx),%xmm5 + DB 15,40,170,86,144,0,0 ; movaps 0x9056(%edx),%xmm5 DB 15,92,235 ; subps %xmm3,%xmm5 DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6 DB 15,89,245 ; mulps %xmm5,%xmm6 @@ -44080,7 +44442,7 @@ _sk_dstatop_sse2 LABEL PROC DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5 DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6 DB 15,89,243 ; mulps %xmm3,%xmm6 - DB 15,40,162,135,142,0,0 ; movaps 0x8e87(%edx),%xmm4 + DB 15,40,162,7,144,0,0 ; movaps 0x9007(%edx),%xmm4 DB 15,92,229 ; subps %xmm5,%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 15,88,198 ; addps %xmm6,%xmm0 @@ -44158,7 +44520,7 @@ _sk_srcout_sse2 LABEL PROC DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 139,85,8 ; mov 0x8(%ebp),%edx - DB 15,40,160,214,141,0,0 ; movaps 0x8dd6(%eax),%xmm4 + DB 15,40,160,86,143,0,0 ; movaps 0x8f56(%eax),%xmm4 DB 15,92,98,64 ; subps 0x40(%edx),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 15,89,204 ; mulps %xmm4,%xmm1 @@ -44182,7 +44544,7 @@ _sk_dstout_sse2 LABEL PROC DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 139,85,8 ; mov 0x8(%ebp),%edx - DB 15,40,160,174,141,0,0 ; movaps 0x8dae(%eax),%xmm4 + DB 15,40,160,46,143,0,0 ; movaps 0x8f2e(%eax),%xmm4 DB 15,92,227 ; subps %xmm3,%xmm4 DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 @@ -44210,7 +44572,7 @@ _sk_srcover_sse2 LABEL PROC DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 139,85,8 ; mov 0x8(%ebp),%edx - DB 15,40,160,119,141,0,0 ; movaps 0x8d77(%eax),%xmm4 + DB 15,40,160,247,142,0,0 ; movaps 0x8ef7(%eax),%xmm4 DB 15,92,227 ; subps %xmm3,%xmm4 DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 @@ -44242,7 +44604,7 @@ _sk_dstover_sse2 LABEL PROC DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 139,85,8 ; mov 0x8(%ebp),%edx DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5 - DB 15,40,160,55,141,0,0 ; movaps 0x8d37(%eax),%xmm4 + DB 15,40,160,183,142,0,0 ; movaps 0x8eb7(%eax),%xmm4 DB 15,92,229 ; subps %xmm5,%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 15,88,66,16 ; addps 0x10(%edx),%xmm0 @@ -44294,7 +44656,7 @@ _sk_multiply_sse2 LABEL PROC DB 139,69,8 ; mov 0x8(%ebp),%eax DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2 DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp) - DB 15,40,129,200,140,0,0 ; movaps 0x8cc8(%ecx),%xmm0 + DB 15,40,129,72,142,0,0 ; movaps 0x8e48(%ecx),%xmm0 DB 15,40,240 ; movaps %xmm0,%xmm6 DB 15,92,242 ; subps %xmm2,%xmm6 DB 15,40,254 ; movaps %xmm6,%xmm7 @@ -44347,17 +44709,24 @@ _sk_plus__sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 139,69,12 ; mov 0xc(%ebp),%eax - DB 139,77,8 ; mov 0x8(%ebp),%ecx - DB 15,88,65,16 ; addps 0x10(%ecx),%xmm0 - DB 15,88,73,32 ; addps 0x20(%ecx),%xmm1 - DB 15,88,81,48 ; addps 0x30(%ecx),%xmm2 - DB 15,88,89,64 ; addps 0x40(%ecx),%xmm3 - DB 141,80,4 ; lea 0x4(%eax),%edx + DB 232,0,0,0,0 ; call 65e <_sk_plus__sse2+0xb> + DB 88 ; pop %eax + DB 139,77,12 ; mov 0xc(%ebp),%ecx + DB 139,85,8 ; mov 0x8(%ebp),%edx + DB 15,88,66,16 ; addps 0x10(%edx),%xmm0 + DB 15,40,160,178,141,0,0 ; movaps 0x8db2(%eax),%xmm4 + DB 15,93,196 ; minps %xmm4,%xmm0 + DB 15,88,74,32 ; addps 0x20(%edx),%xmm1 + DB 15,93,204 ; minps %xmm4,%xmm1 + DB 15,88,82,48 ; addps 0x30(%edx),%xmm2 + DB 15,93,212 ; minps %xmm4,%xmm2 + DB 15,88,90,64 ; addps 0x40(%edx),%xmm3 + DB 15,93,220 ; minps %xmm4,%xmm3 + DB 141,65,4 ; lea 0x4(%ecx),%eax DB 131,236,8 ; sub $0x8,%esp + DB 80 ; push %eax DB 82 ; push %edx - DB 81 ; push %ecx - DB 255,16 ; call *(%eax) + DB 255,17 ; call *(%ecx) DB 131,196,24 ; add $0x18,%esp DB 93 ; pop %ebp DB 195 ; ret @@ -44408,12 +44777,12 @@ _sk_xor__sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp DB 15,40,227 ; movaps %xmm3,%xmm4 - DB 232,0,0,0,0 ; call 6f3 <_sk_xor__sse2+0xe> + DB 232,0,0,0,0 ; call 70c <_sk_xor__sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5 - DB 15,40,154,157,139,0,0 ; movaps 0x8b9d(%edx),%xmm3 + DB 15,40,154,20,141,0,0 ; movaps 0x8d14(%edx),%xmm3 DB 15,40,243 ; movaps %xmm3,%xmm6 DB 15,92,245 ; subps %xmm5,%xmm6 DB 15,89,198 ; mulps %xmm6,%xmm0 @@ -44447,7 +44816,7 @@ _sk_darken_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp DB 15,40,224 ; movaps %xmm0,%xmm4 - DB 232,0,0,0,0 ; call 75b <_sk_darken_sse2+0xe> + DB 232,0,0,0,0 ; call 774 <_sk_darken_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -44473,7 +44842,7 @@ _sk_darken_sse2 LABEL PROC DB 15,89,203 ; mulps %xmm3,%xmm1 DB 15,95,209 ; maxps %xmm1,%xmm2 DB 15,92,234 ; subps %xmm2,%xmm5 - DB 15,40,138,69,139,0,0 ; movaps 0x8b45(%edx),%xmm1 + DB 15,40,138,188,140,0,0 ; movaps 0x8cbc(%edx),%xmm1 DB 15,92,203 ; subps %xmm3,%xmm1 DB 15,89,206 ; mulps %xmm6,%xmm1 DB 15,88,217 ; addps %xmm1,%xmm3 @@ -44494,7 +44863,7 @@ _sk_lighten_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp DB 15,40,224 ; movaps %xmm0,%xmm4 - DB 232,0,0,0,0 ; call 7db <_sk_lighten_sse2+0xe> + DB 232,0,0,0,0 ; call 7f4 <_sk_lighten_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -44520,7 +44889,7 @@ _sk_lighten_sse2 LABEL PROC DB 15,89,203 ; mulps %xmm3,%xmm1 DB 15,93,209 ; minps %xmm1,%xmm2 DB 15,92,234 ; subps %xmm2,%xmm5 - DB 15,40,138,213,138,0,0 ; movaps 0x8ad5(%edx),%xmm1 + DB 15,40,138,76,140,0,0 ; movaps 0x8c4c(%edx),%xmm1 DB 15,92,203 ; subps %xmm3,%xmm1 DB 15,89,206 ; mulps %xmm6,%xmm1 DB 15,88,217 ; addps %xmm1,%xmm3 @@ -44542,7 +44911,7 @@ _sk_difference_sse2 LABEL PROC DB 131,236,8 ; sub $0x8,%esp DB 15,40,225 ; movaps %xmm1,%xmm4 DB 15,40,200 ; movaps %xmm0,%xmm1 - DB 232,0,0,0,0 ; call 85e <_sk_difference_sse2+0x11> + DB 232,0,0,0,0 ; call 877 <_sk_difference_sse2+0x11> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -44571,7 +44940,7 @@ _sk_difference_sse2 LABEL PROC DB 15,93,214 ; minps %xmm6,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 15,92,226 ; subps %xmm2,%xmm4 - DB 15,40,146,98,138,0,0 ; movaps 0x8a62(%edx),%xmm2 + DB 15,40,146,217,139,0,0 ; movaps 0x8bd9(%edx),%xmm2 DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,213 ; mulps %xmm5,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -44591,7 +44960,7 @@ _sk_exclusion_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp DB 15,40,224 ; movaps %xmm0,%xmm4 - DB 232,0,0,0,0 ; call 8e4 <_sk_exclusion_sse2+0xe> + DB 232,0,0,0,0 ; call 8fd <_sk_exclusion_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -44613,7 +44982,7 @@ _sk_exclusion_sse2 LABEL PROC DB 15,89,202 ; mulps %xmm2,%xmm1 DB 15,88,201 ; addps %xmm1,%xmm1 DB 15,92,233 ; subps %xmm1,%xmm5 - DB 15,40,138,236,137,0,0 ; movaps 0x89ec(%edx),%xmm1 + DB 15,40,138,99,139,0,0 ; movaps 0x8b63(%edx),%xmm1 DB 15,92,203 ; subps %xmm3,%xmm1 DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1 DB 15,88,217 ; addps %xmm1,%xmm3 @@ -44637,7 +45006,7 @@ _sk_colorburn_sse2 LABEL PROC DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp) DB 15,40,209 ; movaps %xmm1,%xmm2 DB 15,40,224 ; movaps %xmm0,%xmm4 - DB 232,0,0,0,0 ; call 963 <_sk_colorburn_sse2+0x19> + DB 232,0,0,0,0 ; call 97c <_sk_colorburn_sse2+0x19> DB 89 ; pop %ecx DB 139,69,8 ; mov 0x8(%ebp),%eax DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1 @@ -44652,7 +45021,7 @@ _sk_colorburn_sse2 LABEL PROC DB 15,93,198 ; minps %xmm6,%xmm0 DB 15,40,233 ; movaps %xmm1,%xmm5 DB 15,92,232 ; subps %xmm0,%xmm5 - DB 15,40,177,125,137,0,0 ; movaps 0x897d(%ecx),%xmm6 + DB 15,40,177,244,138,0,0 ; movaps 0x8af4(%ecx),%xmm6 DB 15,40,198 ; movaps %xmm6,%xmm0 DB 15,92,193 ; subps %xmm1,%xmm0 DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp) @@ -44763,11 +45132,11 @@ _sk_colordodge_sse2 LABEL PROC DB 15,40,243 ; movaps %xmm3,%xmm6 DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp) DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp) - DB 232,0,0,0,0 ; call aec <_sk_colordodge_sse2+0x16> + DB 232,0,0,0,0 ; call b05 <_sk_colordodge_sse2+0x16> DB 89 ; pop %ecx DB 139,69,8 ; mov 0x8(%ebp),%eax DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1 - DB 15,40,145,4,136,0,0 ; movaps 0x8804(%ecx),%xmm2 + DB 15,40,145,123,137,0,0 ; movaps 0x897b(%ecx),%xmm2 DB 15,40,226 ; movaps %xmm2,%xmm4 DB 15,92,214 ; subps %xmm6,%xmm2 DB 15,40,250 ; movaps %xmm2,%xmm7 @@ -44878,11 +45247,11 @@ _sk_hardlight_sse2 LABEL PROC DB 15,40,243 ; movaps %xmm3,%xmm6 DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp) DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp) - DB 232,0,0,0,0 ; call c4d <_sk_hardlight_sse2+0x16> + DB 232,0,0,0,0 ; call c66 <_sk_hardlight_sse2+0x16> DB 89 ; pop %ecx DB 139,69,8 ; mov 0x8(%ebp),%eax DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1 - DB 15,40,145,179,134,0,0 ; movaps 0x86b3(%ecx),%xmm2 + DB 15,40,145,42,136,0,0 ; movaps 0x882a(%ecx),%xmm2 DB 15,40,234 ; movaps %xmm2,%xmm5 DB 15,92,233 ; subps %xmm1,%xmm5 DB 15,40,225 ; movaps %xmm1,%xmm4 @@ -44986,11 +45355,11 @@ _sk_overlay_sse2 LABEL PROC DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp) DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp) DB 15,40,232 ; movaps %xmm0,%xmm5 - DB 232,0,0,0,0 ; call d98 <_sk_overlay_sse2+0x1a> + DB 232,0,0,0,0 ; call db1 <_sk_overlay_sse2+0x1a> DB 89 ; pop %ecx DB 139,69,8 ; mov 0x8(%ebp),%eax DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2 - DB 15,40,161,120,133,0,0 ; movaps 0x8578(%ecx),%xmm4 + DB 15,40,161,239,134,0,0 ; movaps 0x86ef(%ecx),%xmm4 DB 15,40,244 ; movaps %xmm4,%xmm6 DB 15,92,242 ; subps %xmm2,%xmm6 DB 15,40,206 ; movaps %xmm6,%xmm1 @@ -45113,20 +45482,20 @@ _sk_softlight_sse2 LABEL PROC DB 15,40,241 ; movaps %xmm1,%xmm6 DB 15,89,246 ; mulps %xmm6,%xmm6 DB 15,88,241 ; addps %xmm1,%xmm6 - DB 232,0,0,0,0 ; call f28 <_sk_softlight_sse2+0x52> + DB 232,0,0,0,0 ; call f41 <_sk_softlight_sse2+0x52> DB 89 ; pop %ecx DB 15,40,194 ; movaps %xmm2,%xmm0 - DB 15,40,137,8,132,0,0 ; movaps 0x8408(%ecx),%xmm1 + DB 15,40,137,127,133,0,0 ; movaps 0x857f(%ecx),%xmm1 DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp) DB 15,88,193 ; addps %xmm1,%xmm0 DB 15,89,198 ; mulps %xmm6,%xmm0 - DB 15,40,185,248,131,0,0 ; movaps 0x83f8(%ecx),%xmm7 + DB 15,40,185,111,133,0,0 ; movaps 0x856f(%ecx),%xmm7 DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp) DB 15,92,250 ; subps %xmm2,%xmm7 DB 15,82,242 ; rsqrtps %xmm2,%xmm6 DB 15,83,206 ; rcpps %xmm6,%xmm1 DB 15,92,202 ; subps %xmm2,%xmm1 - DB 15,40,161,24,132,0,0 ; movaps 0x8418(%ecx),%xmm4 + DB 15,40,161,143,133,0,0 ; movaps 0x858f(%ecx),%xmm4 DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp) DB 15,89,212 ; mulps %xmm4,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 @@ -45320,7 +45689,7 @@ _sk_hue_sse2 LABEL PROC DB 15,93,200 ; minps %xmm0,%xmm1 DB 15,92,225 ; subps %xmm1,%xmm4 DB 15,41,101,168 ; movaps %xmm4,-0x58(%ebp) - DB 232,0,0,0,0 ; call 11e9 <_sk_hue_sse2+0x4f> + DB 232,0,0,0,0 ; call 1202 <_sk_hue_sse2+0x4f> DB 89 ; pop %ecx DB 15,40,221 ; movaps %xmm5,%xmm3 DB 15,40,197 ; movaps %xmm5,%xmm0 @@ -45330,7 +45699,7 @@ _sk_hue_sse2 LABEL PROC DB 15,40,226 ; movaps %xmm2,%xmm4 DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1 DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp) - DB 15,40,169,151,129,0,0 ; movaps 0x8197(%ecx),%xmm5 + DB 15,40,169,14,131,0,0 ; movaps 0x830e(%ecx),%xmm5 DB 15,92,233 ; subps %xmm1,%xmm5 DB 15,89,197 ; mulps %xmm5,%xmm0 DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp) @@ -45363,17 +45732,17 @@ _sk_hue_sse2 LABEL PROC DB 15,89,233 ; mulps %xmm1,%xmm5 DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp) DB 15,89,193 ; mulps %xmm1,%xmm0 - DB 15,40,153,103,129,0,0 ; movaps 0x8167(%ecx),%xmm3 + DB 15,40,153,222,130,0,0 ; movaps 0x82de(%ecx),%xmm3 DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6 DB 15,40,206 ; movaps %xmm6,%xmm1 DB 15,89,203 ; mulps %xmm3,%xmm1 - DB 15,40,153,119,129,0,0 ; movaps 0x8177(%ecx),%xmm3 + DB 15,40,153,238,130,0,0 ; movaps 0x82ee(%ecx),%xmm3 DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5 DB 15,40,253 ; movaps %xmm5,%xmm7 DB 15,89,251 ; mulps %xmm3,%xmm7 DB 15,88,249 ; addps %xmm1,%xmm7 - DB 15,40,137,151,129,0,0 ; movaps 0x8197(%ecx),%xmm1 + DB 15,40,137,14,131,0,0 ; movaps 0x830e(%ecx),%xmm1 DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1 DB 15,89,241 ; mulps %xmm1,%xmm6 DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp) @@ -45383,7 +45752,7 @@ _sk_hue_sse2 LABEL PROC DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1 DB 15,89,241 ; mulps %xmm1,%xmm6 DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp) - DB 15,40,169,135,129,0,0 ; movaps 0x8187(%ecx),%xmm5 + DB 15,40,169,254,130,0,0 ; movaps 0x82fe(%ecx),%xmm5 DB 15,89,205 ; mulps %xmm5,%xmm1 DB 15,88,207 ; addps %xmm7,%xmm1 DB 15,94,212 ; divps %xmm4,%xmm2 @@ -45572,19 +45941,19 @@ _sk_saturation_sse2 LABEL PROC DB 15,89,221 ; mulps %xmm5,%xmm3 DB 15,40,211 ; movaps %xmm3,%xmm2 DB 15,89,253 ; mulps %xmm5,%xmm7 - DB 232,0,0,0,0 ; call 153d <_sk_saturation_sse2+0xb0> + DB 232,0,0,0,0 ; call 1556 <_sk_saturation_sse2+0xb0> DB 89 ; pop %ecx - DB 15,40,153,83,126,0,0 ; movaps 0x7e53(%ecx),%xmm3 + DB 15,40,153,202,127,0,0 ; movaps 0x7fca(%ecx),%xmm3 DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp) DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1 DB 15,40,193 ; movaps %xmm1,%xmm0 DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,40,153,99,126,0,0 ; movaps 0x7e63(%ecx),%xmm3 + DB 15,40,153,218,127,0,0 ; movaps 0x7fda(%ecx),%xmm3 DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) DB 15,40,238 ; movaps %xmm6,%xmm5 DB 15,89,235 ; mulps %xmm3,%xmm5 DB 15,88,232 ; addps %xmm0,%xmm5 - DB 15,40,129,131,126,0,0 ; movaps 0x7e83(%ecx),%xmm0 + DB 15,40,129,250,127,0,0 ; movaps 0x7ffa(%ecx),%xmm0 DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp) DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0 DB 15,89,200 ; mulps %xmm0,%xmm1 @@ -45596,7 +45965,7 @@ _sk_saturation_sse2 LABEL PROC DB 15,89,200 ; mulps %xmm0,%xmm1 DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp) DB 15,40,200 ; movaps %xmm0,%xmm1 - DB 15,40,129,115,126,0,0 ; movaps 0x7e73(%ecx),%xmm0 + DB 15,40,129,234,127,0,0 ; movaps 0x7fea(%ecx),%xmm0 DB 15,89,200 ; mulps %xmm0,%xmm1 DB 15,88,205 ; addps %xmm5,%xmm1 DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5 @@ -45748,21 +46117,21 @@ _sk_color_sse2 LABEL PROC DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp) DB 15,40,232 ; movaps %xmm0,%xmm5 DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp) - DB 232,0,0,0,0 ; call 1798 <_sk_color_sse2+0x2a> + DB 232,0,0,0,0 ; call 17b1 <_sk_color_sse2+0x2a> DB 89 ; pop %ecx DB 139,69,8 ; mov 0x8(%ebp),%eax DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2 DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1 - DB 15,40,177,56,124,0,0 ; movaps 0x7c38(%ecx),%xmm6 + DB 15,40,177,175,125,0,0 ; movaps 0x7daf(%ecx),%xmm6 DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp) DB 15,40,194 ; movaps %xmm2,%xmm0 DB 15,89,198 ; mulps %xmm6,%xmm0 - DB 15,40,153,72,124,0,0 ; movaps 0x7c48(%ecx),%xmm3 + DB 15,40,153,191,125,0,0 ; movaps 0x7dbf(%ecx),%xmm3 DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp) DB 15,40,241 ; movaps %xmm1,%xmm6 DB 15,89,243 ; mulps %xmm3,%xmm6 DB 15,88,240 ; addps %xmm0,%xmm6 - DB 15,40,129,104,124,0,0 ; movaps 0x7c68(%ecx),%xmm0 + DB 15,40,129,223,125,0,0 ; movaps 0x7ddf(%ecx),%xmm0 DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp) DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0 DB 15,89,208 ; mulps %xmm0,%xmm2 @@ -45772,7 +46141,7 @@ _sk_color_sse2 LABEL PROC DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2 DB 15,89,194 ; mulps %xmm2,%xmm0 DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp) - DB 15,40,137,88,124,0,0 ; movaps 0x7c58(%ecx),%xmm1 + DB 15,40,137,207,125,0,0 ; movaps 0x7dcf(%ecx),%xmm1 DB 15,89,209 ; mulps %xmm1,%xmm2 DB 15,88,214 ; addps %xmm6,%xmm2 DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3 @@ -45926,21 +46295,21 @@ _sk_luminosity_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 129,236,184,0,0,0 ; sub $0xb8,%esp DB 15,40,242 ; movaps %xmm2,%xmm6 - DB 232,0,0,0,0 ; call 19fb <_sk_luminosity_sse2+0x11> + DB 232,0,0,0,0 ; call 1a14 <_sk_luminosity_sse2+0x11> DB 89 ; pop %ecx DB 139,69,8 ; mov 0x8(%ebp),%eax - DB 15,40,161,21,122,0,0 ; movaps 0x7a15(%ecx),%xmm4 + DB 15,40,161,140,123,0,0 ; movaps 0x7b8c(%ecx),%xmm4 DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp) DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,89,212 ; mulps %xmm4,%xmm2 - DB 15,40,161,37,122,0,0 ; movaps 0x7a25(%ecx),%xmm4 + DB 15,40,161,156,123,0,0 ; movaps 0x7b9c(%ecx),%xmm4 DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp) DB 15,40,233 ; movaps %xmm1,%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 DB 15,88,234 ; addps %xmm2,%xmm5 DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2 DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp) - DB 15,40,161,69,122,0,0 ; movaps 0x7a45(%ecx),%xmm4 + DB 15,40,161,188,123,0,0 ; movaps 0x7bbc(%ecx),%xmm4 DB 15,40,252 ; movaps %xmm4,%xmm7 DB 15,92,250 ; subps %xmm2,%xmm7 DB 15,89,199 ; mulps %xmm7,%xmm0 @@ -45950,7 +46319,7 @@ _sk_luminosity_sse2 LABEL PROC DB 15,89,254 ; mulps %xmm6,%xmm7 DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp) DB 15,40,214 ; movaps %xmm6,%xmm2 - DB 15,40,137,53,122,0,0 ; movaps 0x7a35(%ecx),%xmm1 + DB 15,40,137,172,123,0,0 ; movaps 0x7bac(%ecx),%xmm1 DB 15,89,209 ; mulps %xmm1,%xmm2 DB 15,88,213 ; addps %xmm5,%xmm2 DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5 @@ -46110,7 +46479,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 131,236,44 ; sub $0x2c,%esp DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp) DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp) - DB 232,0,0,0,0 ; call 1c66 <_sk_srcover_rgba_8888_sse2+0x17> + DB 232,0,0,0,0 ; call 1c7f <_sk_srcover_rgba_8888_sse2+0x17> DB 95 ; pop %edi DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -46122,9 +46491,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,49 ; mov (%ecx),%esi - DB 15,133,224,0,0,0 ; jne 1d68 <_sk_srcover_rgba_8888_sse2+0x119> + DB 15,133,224,0,0,0 ; jne 1d81 <_sk_srcover_rgba_8888_sse2+0x119> DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2 - DB 102,15,111,167,234,119,0,0 ; movdqa 0x77ea(%edi),%xmm4 + DB 102,15,111,167,97,121,0,0 ; movdqa 0x7961(%edi),%xmm4 DB 102,15,111,234 ; movdqa %xmm2,%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 102,15,111,242 ; movdqa %xmm2,%xmm6 @@ -46135,9 +46504,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 102,15,219,252 ; pand %xmm4,%xmm7 DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4 DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx) - DB 15,40,175,250,119,0,0 ; movaps 0x77fa(%edi),%xmm5 + DB 15,40,175,113,121,0,0 ; movaps 0x7971(%edi),%xmm5 DB 15,92,235 ; subps %xmm3,%xmm5 - DB 15,40,143,10,120,0,0 ; movaps 0x780a(%edi),%xmm1 + DB 15,40,143,129,121,0,0 ; movaps 0x7981(%edi),%xmm1 DB 15,89,193 ; mulps %xmm1,%xmm0 DB 15,89,229 ; mulps %xmm5,%xmm4 DB 15,88,224 ; addps %xmm0,%xmm4 @@ -46170,7 +46539,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 102,15,235,194 ; por %xmm2,%xmm0 DB 102,15,235,193 ; por %xmm1,%xmm0 DB 133,219 ; test %ebx,%ebx - DB 117,95 ; jne 1da3 <_sk_srcover_rgba_8888_sse2+0x154> + DB 117,95 ; jne 1dbc <_sk_srcover_rgba_8888_sse2+0x154> DB 243,15,127,4,178 ; movdqu %xmm0,(%edx,%esi,4) DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp @@ -46191,33 +46560,33 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 136,69,243 ; mov %al,-0xd(%ebp) DB 128,101,243,3 ; andb $0x3,-0xd(%ebp) DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp) - DB 116,80 ; je 1dc7 <_sk_srcover_rgba_8888_sse2+0x178> + DB 116,80 ; je 1de0 <_sk_srcover_rgba_8888_sse2+0x178> DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp) DB 139,69,12 ; mov 0xc(%ebp),%eax - DB 116,21 ; je 1d99 <_sk_srcover_rgba_8888_sse2+0x14a> + DB 116,21 ; je 1db2 <_sk_srcover_rgba_8888_sse2+0x14a> DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp) - DB 15,133,255,254,255,255 ; jne 1c8d <_sk_srcover_rgba_8888_sse2+0x3e> + DB 15,133,255,254,255,255 ; jne 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e> DB 102,15,110,84,178,8 ; movd 0x8(%edx,%esi,4),%xmm2 DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2 DB 102,15,18,20,178 ; movlpd (%edx,%esi,4),%xmm2 - DB 233,234,254,255,255 ; jmp 1c8d <_sk_srcover_rgba_8888_sse2+0x3e> + DB 233,234,254,255,255 ; jmp 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e> DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,41 ; je 1dd4 <_sk_srcover_rgba_8888_sse2+0x185> + DB 116,41 ; je 1ded <_sk_srcover_rgba_8888_sse2+0x185> DB 128,251,2 ; cmp $0x2,%bl - DB 116,16 ; je 1dc0 <_sk_srcover_rgba_8888_sse2+0x171> + DB 116,16 ; je 1dd9 <_sk_srcover_rgba_8888_sse2+0x171> DB 128,251,3 ; cmp $0x3,%bl - DB 117,148 ; jne 1d49 <_sk_srcover_rgba_8888_sse2+0xfa> + DB 117,148 ; jne 1d62 <_sk_srcover_rgba_8888_sse2+0xfa> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,15,126,76,178,8 ; movd %xmm1,0x8(%edx,%esi,4) DB 102,15,214,4,178 ; movq %xmm0,(%edx,%esi,4) - DB 235,130 ; jmp 1d49 <_sk_srcover_rgba_8888_sse2+0xfa> + DB 235,130 ; jmp 1d62 <_sk_srcover_rgba_8888_sse2+0xfa> DB 102,15,110,20,178 ; movd (%edx,%esi,4),%xmm2 DB 139,69,12 ; mov 0xc(%ebp),%eax - DB 233,185,254,255,255 ; jmp 1c8d <_sk_srcover_rgba_8888_sse2+0x3e> + DB 233,185,254,255,255 ; jmp 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e> DB 102,15,126,4,178 ; movd %xmm0,(%edx,%esi,4) - DB 233,107,255,255,255 ; jmp 1d49 <_sk_srcover_rgba_8888_sse2+0xfa> + DB 233,107,255,255,255 ; jmp 1d62 <_sk_srcover_rgba_8888_sse2+0xfa> PUBLIC _sk_clamp_0_sse2 _sk_clamp_0_sse2 LABEL PROC @@ -46244,10 +46613,10 @@ _sk_clamp_1_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 1e12 <_sk_clamp_1_sse2+0xb> + DB 232,0,0,0,0 ; call 1e2b <_sk_clamp_1_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx - DB 15,40,160,110,118,0,0 ; movaps 0x766e(%eax),%xmm4 + DB 15,40,160,229,119,0,0 ; movaps 0x77e5(%eax),%xmm4 DB 15,93,196 ; minps %xmm4,%xmm0 DB 15,93,204 ; minps %xmm4,%xmm1 DB 15,93,212 ; minps %xmm4,%xmm2 @@ -46266,10 +46635,10 @@ _sk_clamp_a_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 1e45 <_sk_clamp_a_sse2+0xb> + DB 232,0,0,0,0 ; call 1e5e <_sk_clamp_a_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx - DB 15,93,152,75,118,0,0 ; minps 0x764b(%eax),%xmm3 + DB 15,93,152,194,119,0,0 ; minps 0x77c2(%eax),%xmm3 DB 15,93,195 ; minps %xmm3,%xmm0 DB 15,93,203 ; minps %xmm3,%xmm1 DB 15,93,211 ; minps %xmm3,%xmm2 @@ -46287,12 +46656,12 @@ _sk_clamp_a_dst_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 1e75 <_sk_clamp_a_dst_sse2+0xb> + DB 232,0,0,0,0 ; call 1e8e <_sk_clamp_a_dst_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 139,85,8 ; mov 0x8(%ebp),%edx DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4 - DB 15,93,160,43,118,0,0 ; minps 0x762b(%eax),%xmm4 + DB 15,93,160,162,119,0,0 ; minps 0x77a2(%eax),%xmm4 DB 15,41,98,64 ; movaps %xmm4,0x40(%edx) DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5 DB 15,93,236 ; minps %xmm4,%xmm5 @@ -46357,10 +46726,10 @@ _sk_invert_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 1f20 <_sk_invert_sse2+0xb> + DB 232,0,0,0,0 ; call 1f39 <_sk_invert_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx - DB 15,40,160,144,117,0,0 ; movaps 0x7590(%eax),%xmm4 + DB 15,40,160,7,119,0,0 ; movaps 0x7707(%eax),%xmm4 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,92,232 ; subps %xmm0,%xmm5 DB 15,40,244 ; movaps %xmm4,%xmm6 @@ -46469,11 +46838,11 @@ _sk_unpremul_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 201e <_sk_unpremul_sse2+0xb> + DB 232,0,0,0,0 ; call 2037 <_sk_unpremul_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 15,40,168,162,116,0,0 ; movaps 0x74a2(%eax),%xmm5 + DB 15,40,168,25,118,0,0 ; movaps 0x7619(%eax),%xmm5 DB 15,94,235 ; divps %xmm3,%xmm5 DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4 DB 15,84,229 ; andps %xmm5,%xmm4 @@ -46498,23 +46867,23 @@ _sk_from_srgb_sse2 LABEL PROC DB 15,40,234 ; movaps %xmm2,%xmm5 DB 15,40,217 ; movaps %xmm1,%xmm3 DB 15,40,208 ; movaps %xmm0,%xmm2 - DB 232,0,0,0,0 ; call 2068 <_sk_from_srgb_sse2+0x18> + DB 232,0,0,0,0 ; call 2081 <_sk_from_srgb_sse2+0x18> DB 88 ; pop %eax DB 15,40,202 ; movaps %xmm2,%xmm1 DB 15,89,201 ; mulps %xmm1,%xmm1 - DB 15,40,160,120,116,0,0 ; movaps 0x7478(%eax),%xmm4 + DB 15,40,160,239,117,0,0 ; movaps 0x75ef(%eax),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 - DB 15,40,176,136,116,0,0 ; movaps 0x7488(%eax),%xmm6 + DB 15,40,176,255,117,0,0 ; movaps 0x75ff(%eax),%xmm6 DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp) DB 15,88,198 ; addps %xmm6,%xmm0 DB 15,89,193 ; mulps %xmm1,%xmm0 - DB 15,40,176,104,116,0,0 ; movaps 0x7468(%eax),%xmm6 + DB 15,40,176,223,117,0,0 ; movaps 0x75df(%eax),%xmm6 DB 15,40,202 ; movaps %xmm2,%xmm1 DB 15,89,206 ; mulps %xmm6,%xmm1 - DB 15,40,184,152,116,0,0 ; movaps 0x7498(%eax),%xmm7 + DB 15,40,184,15,118,0,0 ; movaps 0x760f(%eax),%xmm7 DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp) DB 15,88,199 ; addps %xmm7,%xmm0 - DB 15,40,184,168,116,0,0 ; movaps 0x74a8(%eax),%xmm7 + DB 15,40,184,31,118,0,0 ; movaps 0x761f(%eax),%xmm7 DB 15,194,215,1 ; cmpltps %xmm7,%xmm2 DB 15,84,202 ; andps %xmm2,%xmm1 DB 15,85,208 ; andnps %xmm0,%xmm2 @@ -46566,24 +46935,24 @@ _sk_from_srgb_dst_sse2 LABEL PROC DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp) DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp) DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp) - DB 232,0,0,0,0 ; call 2143 <_sk_from_srgb_dst_sse2+0x1b> + DB 232,0,0,0,0 ; call 215c <_sk_from_srgb_dst_sse2+0x1b> DB 89 ; pop %ecx DB 139,69,8 ; mov 0x8(%ebp),%eax DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1 DB 15,40,233 ; movaps %xmm1,%xmm5 DB 15,89,237 ; mulps %xmm5,%xmm5 - DB 15,40,161,237,115,0,0 ; movaps 0x73ed(%ecx),%xmm4 + DB 15,40,161,100,117,0,0 ; movaps 0x7564(%ecx),%xmm4 DB 15,40,193 ; movaps %xmm1,%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 - DB 15,40,177,253,115,0,0 ; movaps 0x73fd(%ecx),%xmm6 + DB 15,40,177,116,117,0,0 ; movaps 0x7574(%ecx),%xmm6 DB 15,88,198 ; addps %xmm6,%xmm0 DB 15,89,197 ; mulps %xmm5,%xmm0 - DB 15,40,169,221,115,0,0 ; movaps 0x73dd(%ecx),%xmm5 + DB 15,40,169,84,117,0,0 ; movaps 0x7554(%ecx),%xmm5 DB 15,40,209 ; movaps %xmm1,%xmm2 DB 15,89,213 ; mulps %xmm5,%xmm2 - DB 15,40,185,13,116,0,0 ; movaps 0x740d(%ecx),%xmm7 + DB 15,40,185,132,117,0,0 ; movaps 0x7584(%ecx),%xmm7 DB 15,88,199 ; addps %xmm7,%xmm0 - DB 15,40,153,29,116,0,0 ; movaps 0x741d(%ecx),%xmm3 + DB 15,40,153,148,117,0,0 ; movaps 0x7594(%ecx),%xmm3 DB 15,194,203,1 ; cmpltps %xmm3,%xmm1 DB 15,84,209 ; andps %xmm1,%xmm2 DB 15,85,200 ; andnps %xmm0,%xmm1 @@ -46640,28 +47009,28 @@ _sk_to_srgb_sse2 LABEL PROC DB 15,40,250 ; movaps %xmm2,%xmm7 DB 15,40,241 ; movaps %xmm1,%xmm6 DB 15,40,208 ; movaps %xmm0,%xmm2 - DB 232,0,0,0,0 ; call 222e <_sk_to_srgb_sse2+0x18> + DB 232,0,0,0,0 ; call 2247 <_sk_to_srgb_sse2+0x18> DB 88 ; pop %eax DB 15,82,218 ; rsqrtps %xmm2,%xmm3 - DB 15,40,160,82,115,0,0 ; movaps 0x7352(%eax),%xmm4 + DB 15,40,160,201,116,0,0 ; movaps 0x74c9(%eax),%xmm4 DB 15,40,235 ; movaps %xmm3,%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 - DB 15,40,128,98,115,0,0 ; movaps 0x7362(%eax),%xmm0 + DB 15,40,128,217,116,0,0 ; movaps 0x74d9(%eax),%xmm0 DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp) DB 15,88,232 ; addps %xmm0,%xmm5 DB 15,89,235 ; mulps %xmm3,%xmm5 - DB 15,40,128,114,115,0,0 ; movaps 0x7372(%eax),%xmm0 + DB 15,40,128,233,116,0,0 ; movaps 0x74e9(%eax),%xmm0 DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp) DB 15,88,232 ; addps %xmm0,%xmm5 - DB 15,40,128,130,115,0,0 ; movaps 0x7382(%eax),%xmm0 + DB 15,40,128,249,116,0,0 ; movaps 0x74f9(%eax),%xmm0 DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp) DB 15,88,216 ; addps %xmm0,%xmm3 DB 15,83,195 ; rcpps %xmm3,%xmm0 DB 15,89,197 ; mulps %xmm5,%xmm0 - DB 15,40,168,66,115,0,0 ; movaps 0x7342(%eax),%xmm5 + DB 15,40,168,185,116,0,0 ; movaps 0x74b9(%eax),%xmm5 DB 15,40,202 ; movaps %xmm2,%xmm1 DB 15,89,205 ; mulps %xmm5,%xmm1 - DB 15,40,152,146,115,0,0 ; movaps 0x7392(%eax),%xmm3 + DB 15,40,152,9,117,0,0 ; movaps 0x7509(%eax),%xmm3 DB 15,194,211,1 ; cmpltps %xmm3,%xmm2 DB 15,84,202 ; andps %xmm2,%xmm1 DB 15,85,208 ; andnps %xmm0,%xmm2 @@ -46716,60 +47085,62 @@ _sk_rgb_to_hsl_sse2 LABEL PROC DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp) DB 15,40,249 ; movaps %xmm1,%xmm7 DB 15,40,224 ; movaps %xmm0,%xmm4 - DB 232,0,0,0,0 ; call 2325 <_sk_rgb_to_hsl_sse2+0x15> + DB 232,0,0,0,0 ; call 233e <_sk_rgb_to_hsl_sse2+0x15> DB 88 ; pop %eax - DB 15,40,204 ; movaps %xmm4,%xmm1 - DB 15,95,207 ; maxps %xmm7,%xmm1 - DB 15,95,202 ; maxps %xmm2,%xmm1 + DB 15,40,199 ; movaps %xmm7,%xmm0 + DB 15,95,194 ; maxps %xmm2,%xmm0 DB 15,40,220 ; movaps %xmm4,%xmm3 - DB 15,93,223 ; minps %xmm7,%xmm3 - DB 15,93,218 ; minps %xmm2,%xmm3 - DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) - DB 15,40,193 ; movaps %xmm1,%xmm0 - DB 15,92,195 ; subps %xmm3,%xmm0 + DB 15,95,216 ; maxps %xmm0,%xmm3 + DB 15,40,199 ; movaps %xmm7,%xmm0 + DB 15,93,194 ; minps %xmm2,%xmm0 + DB 15,40,204 ; movaps %xmm4,%xmm1 + DB 15,93,200 ; minps %xmm0,%xmm1 + DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp) + DB 15,40,195 ; movaps %xmm3,%xmm0 + DB 15,92,193 ; subps %xmm1,%xmm0 DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp) - DB 15,40,152,171,114,0,0 ; movaps 0x72ab(%eax),%xmm3 - DB 15,94,216 ; divps %xmm0,%xmm3 + DB 15,40,136,34,116,0,0 ; movaps 0x7422(%eax),%xmm1 + DB 15,94,200 ; divps %xmm0,%xmm1 DB 15,40,199 ; movaps %xmm7,%xmm0 DB 15,92,194 ; subps %xmm2,%xmm0 - DB 15,89,195 ; mulps %xmm3,%xmm0 + DB 15,89,193 ; mulps %xmm1,%xmm0 DB 15,40,239 ; movaps %xmm7,%xmm5 DB 15,194,234,1 ; cmpltps %xmm2,%xmm5 - DB 15,84,168,187,114,0,0 ; andps 0x72bb(%eax),%xmm5 + DB 15,84,168,50,116,0,0 ; andps 0x7432(%eax),%xmm5 DB 15,88,232 ; addps %xmm0,%xmm5 - DB 15,40,193 ; movaps %xmm1,%xmm0 + DB 15,40,195 ; movaps %xmm3,%xmm0 DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0 - DB 15,40,241 ; movaps %xmm1,%xmm6 + DB 15,40,243 ; movaps %xmm3,%xmm6 DB 15,194,247,0 ; cmpeqps %xmm7,%xmm6 DB 15,92,212 ; subps %xmm4,%xmm2 DB 15,92,231 ; subps %xmm7,%xmm4 - DB 15,89,211 ; mulps %xmm3,%xmm2 - DB 15,89,227 ; mulps %xmm3,%xmm4 - DB 15,40,152,203,114,0,0 ; movaps 0x72cb(%eax),%xmm3 - DB 15,88,211 ; addps %xmm3,%xmm2 - DB 15,88,160,219,114,0,0 ; addps 0x72db(%eax),%xmm4 + DB 15,89,209 ; mulps %xmm1,%xmm2 + DB 15,89,225 ; mulps %xmm1,%xmm4 + DB 15,40,136,66,116,0,0 ; movaps 0x7442(%eax),%xmm1 + DB 15,88,209 ; addps %xmm1,%xmm2 + DB 15,88,160,82,116,0,0 ; addps 0x7452(%eax),%xmm4 DB 15,84,214 ; andps %xmm6,%xmm2 DB 15,85,244 ; andnps %xmm4,%xmm6 DB 15,86,242 ; orps %xmm2,%xmm6 DB 15,84,232 ; andps %xmm0,%xmm5 DB 15,85,198 ; andnps %xmm6,%xmm0 DB 15,86,197 ; orps %xmm5,%xmm0 - DB 15,40,225 ; movaps %xmm1,%xmm4 + DB 15,40,227 ; movaps %xmm3,%xmm4 DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2 DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4 - DB 15,92,217 ; subps %xmm1,%xmm3 - DB 15,88,202 ; addps %xmm2,%xmm1 - DB 15,40,168,251,114,0,0 ; movaps 0x72fb(%eax),%xmm5 - DB 15,92,218 ; subps %xmm2,%xmm3 - DB 15,40,209 ; movaps %xmm1,%xmm2 + DB 15,92,203 ; subps %xmm3,%xmm1 + DB 15,88,218 ; addps %xmm2,%xmm3 + DB 15,40,168,114,116,0,0 ; movaps 0x7472(%eax),%xmm5 + DB 15,92,202 ; subps %xmm2,%xmm1 + DB 15,40,211 ; movaps %xmm3,%xmm2 DB 15,89,213 ; mulps %xmm5,%xmm2 DB 15,194,234,1 ; cmpltps %xmm2,%xmm5 - DB 15,84,221 ; andps %xmm5,%xmm3 - DB 15,85,233 ; andnps %xmm1,%xmm5 - DB 15,86,235 ; orps %xmm3,%xmm5 + DB 15,84,205 ; andps %xmm5,%xmm1 + DB 15,85,235 ; andnps %xmm3,%xmm5 + DB 15,86,233 ; orps %xmm1,%xmm5 DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1 DB 15,94,205 ; divps %xmm5,%xmm1 - DB 15,89,128,235,114,0,0 ; mulps 0x72eb(%eax),%xmm0 + DB 15,89,128,98,116,0,0 ; mulps 0x7462(%eax),%xmm0 DB 15,84,196 ; andps %xmm4,%xmm0 DB 15,84,204 ; andps %xmm4,%xmm1 DB 139,69,12 ; mov 0xc(%ebp),%eax @@ -46790,9 +47161,9 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 129,236,200,0,0,0 ; sub $0xc8,%esp DB 15,41,157,56,255,255,255 ; movaps %xmm3,-0xc8(%ebp) DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp) - DB 232,0,0,0,0 ; call 241a <_sk_hsl_to_rgb_sse2+0x19> + DB 232,0,0,0,0 ; call 2439 <_sk_hsl_to_rgb_sse2+0x19> DB 88 ; pop %eax - DB 15,40,160,22,114,0,0 ; movaps 0x7216(%eax),%xmm4 + DB 15,40,160,135,115,0,0 ; movaps 0x7387(%eax),%xmm4 DB 15,40,220 ; movaps %xmm4,%xmm3 DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp) DB 15,194,218,2 ; cmpleps %xmm2,%xmm3 @@ -46805,13 +47176,13 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,84,243 ; andps %xmm3,%xmm6 DB 15,85,217 ; andnps %xmm1,%xmm3 DB 15,86,222 ; orps %xmm6,%xmm3 - DB 15,40,168,38,114,0,0 ; movaps 0x7226(%eax),%xmm5 + DB 15,40,168,151,115,0,0 ; movaps 0x7397(%eax),%xmm5 DB 15,88,232 ; addps %xmm0,%xmm5 DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,194,193,1 ; cmpltps %xmm1,%xmm0 - DB 15,40,176,54,114,0,0 ; movaps 0x7236(%eax),%xmm6 + DB 15,40,176,167,115,0,0 ; movaps 0x73a7(%eax),%xmm6 DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp) DB 15,84,198 ; andps %xmm6,%xmm0 DB 15,92,200 ; subps %xmm0,%xmm1 @@ -46821,19 +47192,19 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp) DB 15,88,210 ; addps %xmm2,%xmm2 DB 15,92,211 ; subps %xmm3,%xmm2 - DB 15,40,184,70,114,0,0 ; movaps 0x7246(%eax),%xmm7 + DB 15,40,184,183,115,0,0 ; movaps 0x73b7(%eax),%xmm7 DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp) DB 15,194,253,2 ; cmpleps %xmm5,%xmm7 DB 15,92,218 ; subps %xmm2,%xmm3 DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp) DB 15,40,204 ; movaps %xmm4,%xmm1 DB 15,194,205,2 ; cmpleps %xmm5,%xmm1 - DB 15,40,160,118,114,0,0 ; movaps 0x7276(%eax),%xmm4 + DB 15,40,160,231,115,0,0 ; movaps 0x73e7(%eax),%xmm4 DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp) DB 15,194,229,2 ; cmpleps %xmm5,%xmm4 - DB 15,40,176,86,114,0,0 ; movaps 0x7256(%eax),%xmm6 + DB 15,40,176,199,115,0,0 ; movaps 0x73c7(%eax),%xmm6 DB 15,89,238 ; mulps %xmm6,%xmm5 - DB 15,40,128,102,114,0,0 ; movaps 0x7266(%eax),%xmm0 + DB 15,40,128,215,115,0,0 ; movaps 0x73d7(%eax),%xmm0 DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp) DB 15,92,197 ; subps %xmm5,%xmm0 DB 15,89,195 ; mulps %xmm3,%xmm0 @@ -46859,18 +47230,18 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,203 ; movaps %xmm3,%xmm1 DB 15,194,200,1 ; cmpltps %xmm0,%xmm1 - DB 15,84,136,54,114,0,0 ; andps 0x7236(%eax),%xmm1 + DB 15,84,136,167,115,0,0 ; andps 0x73a7(%eax),%xmm1 DB 15,92,193 ; subps %xmm1,%xmm0 DB 15,40,203 ; movaps %xmm3,%xmm1 DB 15,92,200 ; subps %xmm0,%xmm1 - DB 15,40,128,70,114,0,0 ; movaps 0x7246(%eax),%xmm0 + DB 15,40,128,183,115,0,0 ; movaps 0x73b7(%eax),%xmm0 DB 15,194,193,2 ; cmpleps %xmm1,%xmm0 - DB 15,40,152,22,114,0,0 ; movaps 0x7216(%eax),%xmm3 + DB 15,40,152,135,115,0,0 ; movaps 0x7387(%eax),%xmm3 DB 15,194,217,2 ; cmpleps %xmm1,%xmm3 - DB 15,40,160,118,114,0,0 ; movaps 0x7276(%eax),%xmm4 + DB 15,40,160,231,115,0,0 ; movaps 0x73e7(%eax),%xmm4 DB 15,194,225,2 ; cmpleps %xmm1,%xmm4 DB 15,89,206 ; mulps %xmm6,%xmm1 - DB 15,40,168,102,114,0,0 ; movaps 0x7266(%eax),%xmm5 + DB 15,40,168,215,115,0,0 ; movaps 0x73d7(%eax),%xmm5 DB 15,92,233 ; subps %xmm1,%xmm5 DB 15,89,239 ; mulps %xmm7,%xmm5 DB 15,88,234 ; addps %xmm2,%xmm5 @@ -46890,7 +47261,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7 DB 15,85,252 ; andnps %xmm4,%xmm7 DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3 - DB 15,88,152,134,114,0,0 ; addps 0x7286(%eax),%xmm3 + DB 15,88,152,247,115,0,0 ; addps 0x73f7(%eax),%xmm3 DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,203 ; movaps %xmm3,%xmm1 @@ -46973,7 +47344,7 @@ _sk_scale_u8_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 2694 <_sk_scale_u8_sse2+0xe> + DB 232,0,0,0,0 ; call 26b3 <_sk_scale_u8_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -46984,13 +47355,13 @@ _sk_scale_u8_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,65 ; jne 26f0 <_sk_scale_u8_sse2+0x6a> + DB 117,65 ; jne 270f <_sk_scale_u8_sse2+0x6a> DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,162,28,112,0,0 ; pand 0x701c(%edx),%xmm4 + DB 102,15,219,162,141,113,0,0 ; pand 0x718d(%edx),%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,162,44,112,0,0 ; mulps 0x702c(%edx),%xmm4 + DB 15,89,162,157,113,0,0 ; mulps 0x719d(%edx),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 15,89,204 ; mulps %xmm4,%xmm1 DB 15,89,212 ; mulps %xmm4,%xmm2 @@ -47009,12 +47380,12 @@ _sk_scale_u8_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,50 ; je 272a <_sk_scale_u8_sse2+0xa4> + DB 116,50 ; je 2749 <_sk_scale_u8_sse2+0xa4> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 2714 <_sk_scale_u8_sse2+0x8e> + DB 116,19 ; je 2733 <_sk_scale_u8_sse2+0x8e> DB 128,251,3 ; cmp $0x3,%bl - DB 117,182 ; jne 26bc <_sk_scale_u8_sse2+0x36> + DB 117,182 ; jne 26db <_sk_scale_u8_sse2+0x36> DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx DB 102,15,110,227 ; movd %ebx,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -47023,10 +47394,98 @@ _sk_scale_u8_sse2 LABEL PROC DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 235,146 ; jmp 26bc <_sk_scale_u8_sse2+0x36> + DB 235,146 ; jmp 26db <_sk_scale_u8_sse2+0x36> DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi DB 102,15,110,230 ; movd %esi,%xmm4 - DB 235,136 ; jmp 26bc <_sk_scale_u8_sse2+0x36> + DB 235,136 ; jmp 26db <_sk_scale_u8_sse2+0x36> + +PUBLIC _sk_scale_565_sse2 +_sk_scale_565_sse2 LABEL PROC + DB 85 ; push %ebp + DB 137,229 ; mov %esp,%ebp + DB 83 ; push %ebx + DB 87 ; push %edi + DB 86 ; push %esi + DB 131,236,44 ; sub $0x2c,%esp + DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp) + DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp) + DB 102,15,111,200 ; movdqa %xmm0,%xmm1 + DB 232,0,0,0,0 ; call 276d <_sk_scale_565_sse2+0x1a> + DB 90 ; pop %edx + DB 139,69,12 ; mov 0xc(%ebp),%eax + DB 139,77,8 ; mov 0x8(%ebp),%ecx + DB 139,56 ; mov (%eax),%edi + DB 139,119,4 ; mov 0x4(%edi),%esi + DB 15,175,113,4 ; imul 0x4(%ecx),%esi + DB 1,246 ; add %esi,%esi + DB 3,55 ; add (%edi),%esi + DB 139,89,8 ; mov 0x8(%ecx),%ebx + DB 133,219 ; test %ebx,%ebx + DB 139,57 ; mov (%ecx),%edi + DB 15,133,157,0,0,0 ; jne 282b <_sk_scale_565_sse2+0xd8> + DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6 + DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6 + DB 102,15,111,162,243,112,0,0 ; movdqa 0x70f3(%edx),%xmm4 + DB 102,15,219,230 ; pand %xmm6,%xmm4 + DB 15,91,212 ; cvtdq2ps %xmm4,%xmm2 + DB 15,89,146,3,113,0,0 ; mulps 0x7103(%edx),%xmm2 + DB 102,15,111,170,19,113,0,0 ; movdqa 0x7113(%edx),%xmm5 + DB 102,15,219,238 ; pand %xmm6,%xmm5 + DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 + DB 15,89,170,35,113,0,0 ; mulps 0x7123(%edx),%xmm5 + DB 102,15,219,178,51,113,0,0 ; pand 0x7133(%edx),%xmm6 + DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 + DB 15,89,178,67,113,0,0 ; mulps 0x7143(%edx),%xmm6 + DB 15,40,253 ; movaps %xmm5,%xmm7 + DB 15,93,254 ; minps %xmm6,%xmm7 + DB 15,40,226 ; movaps %xmm2,%xmm4 + DB 15,93,231 ; minps %xmm7,%xmm4 + DB 15,40,253 ; movaps %xmm5,%xmm7 + DB 15,95,254 ; maxps %xmm6,%xmm7 + DB 15,40,194 ; movaps %xmm2,%xmm0 + DB 15,95,199 ; maxps %xmm7,%xmm0 + DB 15,40,251 ; movaps %xmm3,%xmm7 + DB 15,194,121,64,1 ; cmpltps 0x40(%ecx),%xmm7 + DB 15,84,231 ; andps %xmm7,%xmm4 + DB 15,85,248 ; andnps %xmm0,%xmm7 + DB 15,86,252 ; orps %xmm4,%xmm7 + DB 15,89,209 ; mulps %xmm1,%xmm2 + DB 15,89,109,216 ; mulps -0x28(%ebp),%xmm5 + DB 15,89,117,200 ; mulps -0x38(%ebp),%xmm6 + DB 15,89,251 ; mulps %xmm3,%xmm7 + DB 141,80,8 ; lea 0x8(%eax),%edx + DB 131,236,8 ; sub $0x8,%esp + DB 15,40,194 ; movaps %xmm2,%xmm0 + DB 15,40,205 ; movaps %xmm5,%xmm1 + DB 15,40,214 ; movaps %xmm6,%xmm2 + DB 15,40,223 ; movaps %xmm7,%xmm3 + DB 82 ; push %edx + DB 81 ; push %ecx + DB 255,80,4 ; call *0x4(%eax) + DB 131,196,60 ; add $0x3c,%esp + DB 94 ; pop %esi + DB 95 ; pop %edi + DB 91 ; pop %ebx + DB 93 ; pop %ebp + DB 195 ; ret + DB 128,227,3 ; and $0x3,%bl + DB 128,251,1 ; cmp $0x1,%bl + DB 116,50 ; je 2865 <_sk_scale_565_sse2+0x112> + DB 102,15,239,246 ; pxor %xmm6,%xmm6 + DB 128,251,2 ; cmp $0x2,%bl + DB 116,23 ; je 2853 <_sk_scale_565_sse2+0x100> + DB 128,251,3 ; cmp $0x3,%bl + DB 15,133,82,255,255,255 ; jne 2797 <_sk_scale_565_sse2+0x44> + DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx + DB 102,15,110,227 ; movd %ebx,%xmm4 + DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6 + DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4 + DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 + DB 242,15,16,244 ; movsd %xmm4,%xmm6 + DB 233,50,255,255,255 ; jmp 2797 <_sk_scale_565_sse2+0x44> + DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi + DB 102,15,110,246 ; movd %esi,%xmm6 + DB 233,37,255,255,255 ; jmp 2797 <_sk_scale_565_sse2+0x44> PUBLIC _sk_lerp_1_float_sse2 _sk_lerp_1_float_sse2 LABEL PROC @@ -47071,7 +47530,7 @@ _sk_lerp_u8_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 279c <_sk_lerp_u8_sse2+0xe> + DB 232,0,0,0,0 ; call 28da <_sk_lerp_u8_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -47082,13 +47541,13 @@ _sk_lerp_u8_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,102 ; jne 281d <_sk_lerp_u8_sse2+0x8f> + DB 117,102 ; jne 295b <_sk_lerp_u8_sse2+0x8f> DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,162,52,111,0,0 ; pand 0x6f34(%edx),%xmm4 + DB 102,15,219,162,230,111,0,0 ; pand 0x6fe6(%edx),%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,162,68,111,0,0 ; mulps 0x6f44(%edx),%xmm4 + DB 15,89,162,246,111,0,0 ; mulps 0x6ff6(%edx),%xmm4 DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5 DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6 DB 15,92,197 ; subps %xmm5,%xmm0 @@ -47118,12 +47577,12 @@ _sk_lerp_u8_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,53 ; je 285a <_sk_lerp_u8_sse2+0xcc> + DB 116,53 ; je 2998 <_sk_lerp_u8_sse2+0xcc> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 2841 <_sk_lerp_u8_sse2+0xb3> + DB 116,19 ; je 297f <_sk_lerp_u8_sse2+0xb3> DB 128,251,3 ; cmp $0x3,%bl - DB 117,145 ; jne 27c4 <_sk_lerp_u8_sse2+0x36> + DB 117,145 ; jne 2902 <_sk_lerp_u8_sse2+0x36> DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx DB 102,15,110,227 ; movd %ebx,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -47132,10 +47591,10 @@ _sk_lerp_u8_sse2 LABEL PROC DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 233,106,255,255,255 ; jmp 27c4 <_sk_lerp_u8_sse2+0x36> + DB 233,106,255,255,255 ; jmp 2902 <_sk_lerp_u8_sse2+0x36> DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi DB 102,15,110,230 ; movd %esi,%xmm4 - DB 233,93,255,255,255 ; jmp 27c4 <_sk_lerp_u8_sse2+0x36> + DB 233,93,255,255,255 ; jmp 2902 <_sk_lerp_u8_sse2+0x36> PUBLIC _sk_lerp_565_sse2 _sk_lerp_565_sse2 LABEL PROC @@ -47144,8 +47603,12 @@ _sk_lerp_565_sse2 LABEL PROC DB 83 ; push %ebx DB 87 ; push %edi DB 86 ; push %esi - DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 2875 <_sk_lerp_565_sse2+0xe> + DB 131,236,108 ; sub $0x6c,%esp + DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp) + DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp) + DB 15,41,77,152 ; movaps %xmm1,-0x68(%ebp) + DB 102,15,127,69,184 ; movdqa %xmm0,-0x48(%ebp) + DB 232,0,0,0,0 ; call 29c4 <_sk_lerp_565_sse2+0x1f> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -47157,49 +47620,62 @@ _sk_lerp_565_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 15,133,163,0,0,0 ; jne 2939 <_sk_lerp_565_sse2+0xd2> - DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6 - DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6 - DB 102,15,111,162,123,110,0,0 ; movdqa 0x6e7b(%edx),%xmm4 - DB 102,15,219,230 ; pand %xmm6,%xmm4 - DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,162,139,110,0,0 ; mulps 0x6e8b(%edx),%xmm4 - DB 102,15,111,170,155,110,0,0 ; movdqa 0x6e9b(%edx),%xmm5 - DB 102,15,219,238 ; pand %xmm6,%xmm5 - DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,170,171,110,0,0 ; mulps 0x6eab(%edx),%xmm5 - DB 102,15,219,178,187,110,0,0 ; pand 0x6ebb(%edx),%xmm6 + DB 15,133,211,0,0,0 ; jne 2ab8 <_sk_lerp_565_sse2+0x113> + DB 243,15,126,44,126 ; movq (%esi,%edi,2),%xmm5 + DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 + DB 102,15,111,162,28,111,0,0 ; movdqa 0x6f1c(%edx),%xmm4 + DB 102,15,219,229 ; pand %xmm5,%xmm4 + DB 15,91,204 ; cvtdq2ps %xmm4,%xmm1 + DB 15,89,138,44,111,0,0 ; mulps 0x6f2c(%edx),%xmm1 + DB 102,15,111,178,60,111,0,0 ; movdqa 0x6f3c(%edx),%xmm6 + DB 102,15,219,245 ; pand %xmm5,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,178,203,110,0,0 ; mulps 0x6ecb(%edx),%xmm6 - DB 15,40,121,16 ; movaps 0x10(%ecx),%xmm7 - DB 15,92,199 ; subps %xmm7,%xmm0 - DB 15,89,196 ; mulps %xmm4,%xmm0 - DB 15,88,199 ; addps %xmm7,%xmm0 - DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7 - DB 15,92,207 ; subps %xmm7,%xmm1 - DB 15,89,205 ; mulps %xmm5,%xmm1 - DB 15,88,207 ; addps %xmm7,%xmm1 - DB 15,40,121,48 ; movaps 0x30(%ecx),%xmm7 - DB 15,92,215 ; subps %xmm7,%xmm2 - DB 15,89,214 ; mulps %xmm6,%xmm2 - DB 15,88,215 ; addps %xmm7,%xmm2 - DB 15,40,121,64 ; movaps 0x40(%ecx),%xmm7 - DB 15,92,223 ; subps %xmm7,%xmm3 - DB 15,89,227 ; mulps %xmm3,%xmm4 - DB 15,89,235 ; mulps %xmm3,%xmm5 - DB 15,89,222 ; mulps %xmm6,%xmm3 - DB 15,88,231 ; addps %xmm7,%xmm4 - DB 15,88,239 ; addps %xmm7,%xmm5 - DB 15,88,223 ; addps %xmm7,%xmm3 - DB 15,95,235 ; maxps %xmm3,%xmm5 - DB 15,95,229 ; maxps %xmm5,%xmm4 + DB 15,89,178,76,111,0,0 ; mulps 0x6f4c(%edx),%xmm6 + DB 102,15,219,170,92,111,0,0 ; pand 0x6f5c(%edx),%xmm5 + DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2 + DB 15,89,146,108,111,0,0 ; mulps 0x6f6c(%edx),%xmm2 + DB 15,40,218 ; movaps %xmm2,%xmm3 + DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp) + DB 15,40,254 ; movaps %xmm6,%xmm7 + DB 15,40,65,32 ; movaps 0x20(%ecx),%xmm0 + DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp) + DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4 + DB 15,92,224 ; subps %xmm0,%xmm4 + DB 15,89,230 ; mulps %xmm6,%xmm4 + DB 15,93,243 ; minps %xmm3,%xmm6 + DB 15,40,209 ; movaps %xmm1,%xmm2 + DB 15,40,65,16 ; movaps 0x10(%ecx),%xmm0 + DB 15,40,109,184 ; movaps -0x48(%ebp),%xmm5 + DB 15,92,232 ; subps %xmm0,%xmm5 + DB 15,89,233 ; mulps %xmm1,%xmm5 + DB 15,93,206 ; minps %xmm6,%xmm1 + DB 15,40,113,64 ; movaps 0x40(%ecx),%xmm6 + DB 15,95,251 ; maxps %xmm3,%xmm7 + DB 15,95,215 ; maxps %xmm7,%xmm2 + DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3 + DB 15,40,251 ; movaps %xmm3,%xmm7 + DB 15,194,254,1 ; cmpltps %xmm6,%xmm7 + DB 15,84,207 ; andps %xmm7,%xmm1 + DB 15,85,250 ; andnps %xmm2,%xmm7 + DB 15,86,249 ; orps %xmm1,%xmm7 + DB 15,88,232 ; addps %xmm0,%xmm5 + DB 15,88,101,216 ; addps -0x28(%ebp),%xmm4 + DB 15,40,65,48 ; movaps 0x30(%ecx),%xmm0 + DB 15,40,85,136 ; movaps -0x78(%ebp),%xmm2 + DB 15,92,208 ; subps %xmm0,%xmm2 + DB 15,89,85,200 ; mulps -0x38(%ebp),%xmm2 + DB 15,88,208 ; addps %xmm0,%xmm2 + DB 15,92,222 ; subps %xmm6,%xmm3 + DB 15,89,223 ; mulps %xmm7,%xmm3 + DB 15,88,222 ; addps %xmm6,%xmm3 DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp - DB 15,40,220 ; movaps %xmm4,%xmm3 + DB 15,40,197 ; movaps %xmm5,%xmm0 + DB 15,40,204 ; movaps %xmm4,%xmm1 DB 82 ; push %edx DB 81 ; push %ecx DB 255,80,4 ; call *0x4(%eax) - DB 131,196,28 ; add $0x1c,%esp + DB 131,196,124 ; add $0x7c,%esp DB 94 ; pop %esi DB 95 ; pop %edi DB 91 ; pop %ebx @@ -47207,22 +47683,22 @@ _sk_lerp_565_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,50 ; je 2973 <_sk_lerp_565_sse2+0x10c> - DB 102,15,239,246 ; pxor %xmm6,%xmm6 + DB 116,50 ; je 2af2 <_sk_lerp_565_sse2+0x14d> + DB 102,15,239,237 ; pxor %xmm5,%xmm5 DB 128,251,2 ; cmp $0x2,%bl - DB 116,23 ; je 2961 <_sk_lerp_565_sse2+0xfa> + DB 116,23 ; je 2ae0 <_sk_lerp_565_sse2+0x13b> DB 128,251,3 ; cmp $0x3,%bl - DB 15,133,76,255,255,255 ; jne 289f <_sk_lerp_565_sse2+0x38> + DB 15,133,28,255,255,255 ; jne 29ee <_sk_lerp_565_sse2+0x49> DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx DB 102,15,110,227 ; movd %ebx,%xmm4 - DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6 + DB 102,15,112,236,69 ; pshufd $0x45,%xmm4,%xmm5 DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 242,15,16,244 ; movsd %xmm4,%xmm6 - DB 233,44,255,255,255 ; jmp 289f <_sk_lerp_565_sse2+0x38> + DB 242,15,16,236 ; movsd %xmm4,%xmm5 + DB 233,252,254,255,255 ; jmp 29ee <_sk_lerp_565_sse2+0x49> DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi - DB 102,15,110,246 ; movd %esi,%xmm6 - DB 233,31,255,255,255 ; jmp 289f <_sk_lerp_565_sse2+0x38> + DB 102,15,110,238 ; movd %esi,%xmm5 + DB 233,239,254,255,255 ; jmp 29ee <_sk_lerp_565_sse2+0x49> PUBLIC _sk_load_tables_sse2 _sk_load_tables_sse2 LABEL PROC @@ -47232,7 +47708,7 @@ _sk_load_tables_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 298e <_sk_load_tables_sse2+0xe> + DB 232,0,0,0,0 ; call 2b0d <_sk_load_tables_sse2+0xe> DB 90 ; pop %edx DB 139,117,12 ; mov 0xc(%ebp),%esi DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -47241,9 +47717,9 @@ _sk_load_tables_sse2 LABEL PROC DB 133,192 ; test %eax,%eax DB 139,54 ; mov (%esi),%esi DB 139,30 ; mov (%esi),%ebx - DB 15,133,19,1,0,0 ; jne 2ab9 <_sk_load_tables_sse2+0x139> + DB 15,133,19,1,0,0 ; jne 2c38 <_sk_load_tables_sse2+0x139> DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3 - DB 102,15,111,146,194,109,0,0 ; movdqa 0x6dc2(%edx),%xmm2 + DB 102,15,111,146,51,110,0,0 ; movdqa 0x6e33(%edx),%xmm2 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1 @@ -47299,7 +47775,7 @@ _sk_load_tables_sse2 LABEL PROC DB 15,20,215 ; unpcklps %xmm7,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,154,210,109,0,0 ; mulps 0x6dd2(%edx),%xmm3 + DB 15,89,154,67,110,0,0 ; mulps 0x6e43(%edx),%xmm3 DB 139,69,12 ; mov 0xc(%ebp),%eax DB 137,194 ; mov %eax,%edx DB 141,66,8 ; lea 0x8(%edx),%eax @@ -47315,18 +47791,18 @@ _sk_load_tables_sse2 LABEL PROC DB 195 ; ret DB 36,3 ; and $0x3,%al DB 60,1 ; cmp $0x1,%al - DB 116,37 ; je 2ae4 <_sk_load_tables_sse2+0x164> + DB 116,37 ; je 2c63 <_sk_load_tables_sse2+0x164> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 60,2 ; cmp $0x2,%al - DB 116,19 ; je 2ada <_sk_load_tables_sse2+0x15a> + DB 116,19 ; je 2c59 <_sk_load_tables_sse2+0x15a> DB 60,3 ; cmp $0x3,%al - DB 15,133,220,254,255,255 ; jne 29ab <_sk_load_tables_sse2+0x2b> + DB 15,133,220,254,255,255 ; jne 2b2a <_sk_load_tables_sse2+0x2b> DB 102,15,110,68,187,8 ; movd 0x8(%ebx,%edi,4),%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,15,18,28,187 ; movlpd (%ebx,%edi,4),%xmm3 - DB 233,199,254,255,255 ; jmp 29ab <_sk_load_tables_sse2+0x2b> + DB 233,199,254,255,255 ; jmp 2b2a <_sk_load_tables_sse2+0x2b> DB 102,15,110,28,187 ; movd (%ebx,%edi,4),%xmm3 - DB 233,189,254,255,255 ; jmp 29ab <_sk_load_tables_sse2+0x2b> + DB 233,189,254,255,255 ; jmp 2b2a <_sk_load_tables_sse2+0x2b> PUBLIC _sk_load_tables_u16_be_sse2 _sk_load_tables_u16_be_sse2 LABEL PROC @@ -47336,7 +47812,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,44 ; sub $0x2c,%esp - DB 232,0,0,0,0 ; call 2afc <_sk_load_tables_u16_be_sse2+0xe> + DB 232,0,0,0,0 ; call 2c7b <_sk_load_tables_u16_be_sse2+0xe> DB 90 ; pop %edx DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 139,69,8 ; mov 0x8(%ebp),%eax @@ -47347,7 +47823,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 139,57 ; mov (%ecx),%edi DB 139,15 ; mov (%edi),%ecx DB 190,255,0,255,0 ; mov $0xff00ff,%esi - DB 15,133,166,1,0,0 ; jne 2cc2 <_sk_load_tables_u16_be_sse2+0x1d4> + DB 15,133,166,1,0,0 ; jne 2e41 <_sk_load_tables_u16_be_sse2+0x1d4> DB 102,15,16,4,89 ; movupd (%ecx,%ebx,2),%xmm0 DB 243,15,111,76,89,16 ; movdqu 0x10(%ecx,%ebx,2),%xmm1 DB 102,15,40,216 ; movapd %xmm0,%xmm3 @@ -47444,7 +47920,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3 DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,154,116,108,0,0 ; mulps 0x6c74(%edx),%xmm3 + DB 15,89,154,229,108,0,0 ; mulps 0x6ce5(%edx),%xmm3 DB 139,69,12 ; mov 0xc(%ebp),%eax DB 137,193 ; mov %eax,%ecx DB 141,65,8 ; lea 0x8(%ecx),%eax @@ -47461,12 +47937,12 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 242,15,16,4,89 ; movsd (%ecx,%ebx,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 131,248,1 ; cmp $0x1,%eax - DB 15,132,83,254,255,255 ; je 2b27 <_sk_load_tables_u16_be_sse2+0x39> + DB 15,132,83,254,255,255 ; je 2ca6 <_sk_load_tables_u16_be_sse2+0x39> DB 102,15,22,68,89,8 ; movhpd 0x8(%ecx,%ebx,2),%xmm0 DB 131,248,3 ; cmp $0x3,%eax - DB 15,130,68,254,255,255 ; jb 2b27 <_sk_load_tables_u16_be_sse2+0x39> + DB 15,130,68,254,255,255 ; jb 2ca6 <_sk_load_tables_u16_be_sse2+0x39> DB 243,15,126,76,89,16 ; movq 0x10(%ecx,%ebx,2),%xmm1 - DB 233,57,254,255,255 ; jmp 2b27 <_sk_load_tables_u16_be_sse2+0x39> + DB 233,57,254,255,255 ; jmp 2ca6 <_sk_load_tables_u16_be_sse2+0x39> PUBLIC _sk_load_tables_rgb_u16_be_sse2 _sk_load_tables_rgb_u16_be_sse2 LABEL PROC @@ -47476,7 +47952,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,28 ; sub $0x1c,%esp - DB 232,0,0,0,0 ; call 2cfc <_sk_load_tables_rgb_u16_be_sse2+0xe> + DB 232,0,0,0,0 ; call 2e7b <_sk_load_tables_rgb_u16_be_sse2+0xe> DB 88 ; pop %eax DB 137,69,240 ; mov %eax,-0x10(%ebp) DB 139,69,12 ; mov 0xc(%ebp),%eax @@ -47487,7 +47963,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 139,56 ; mov (%eax),%edi DB 139,7 ; mov (%edi),%eax DB 190,255,0,255,0 ; mov $0xff00ff,%esi - DB 15,133,141,1,0,0 ; jne 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x1bc> + DB 15,133,141,1,0,0 ; jne 3029 <_sk_load_tables_rgb_u16_be_sse2+0x1bc> DB 243,15,111,12,88 ; movdqu (%eax,%ebx,2),%xmm1 DB 243,15,111,92,88,8 ; movdqu 0x8(%eax,%ebx,2),%xmm3 DB 102,15,115,219,4 ; psrldq $0x4,%xmm3 @@ -47581,7 +48057,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 141,65,8 ; lea 0x8(%ecx),%eax DB 131,236,8 ; sub $0x8,%esp DB 139,85,240 ; mov -0x10(%ebp),%edx - DB 15,40,162,132,106,0,0 ; movaps 0x6a84(%edx),%xmm4 + DB 15,40,162,245,106,0,0 ; movaps 0x6af5(%edx),%xmm4 DB 15,40,195 ; movaps %xmm3,%xmm0 DB 15,40,220 ; movaps %xmm4,%xmm3 DB 80 ; push %eax @@ -47597,20 +48073,20 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 102,15,196,76,88,4,2 ; pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1 DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 131,249,1 ; cmp $0x1,%ecx - DB 117,13 ; jne 2ecc <_sk_load_tables_rgb_u16_be_sse2+0x1de> + DB 117,13 ; jne 304b <_sk_load_tables_rgb_u16_be_sse2+0x1de> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,115,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51> + DB 233,115,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51> DB 102,15,110,68,88,6 ; movd 0x6(%eax,%ebx,2),%xmm0 DB 102,15,196,68,88,10,2 ; pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0 DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 131,249,3 ; cmp $0x3,%ecx - DB 114,18 ; jb 2ef4 <_sk_load_tables_rgb_u16_be_sse2+0x206> + DB 114,18 ; jb 3073 <_sk_load_tables_rgb_u16_be_sse2+0x206> DB 102,15,110,92,88,12 ; movd 0xc(%eax,%ebx,2),%xmm3 DB 102,15,196,92,88,16,2 ; pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3 - DB 233,75,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51> + DB 233,75,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51> DB 102,15,239,219 ; pxor %xmm3,%xmm3 - DB 233,66,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51> + DB 233,66,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51> PUBLIC _sk_byte_tables_sse2 _sk_byte_tables_sse2 LABEL PROC @@ -47620,11 +48096,11 @@ _sk_byte_tables_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 2f0b <_sk_byte_tables_sse2+0xe> + DB 232,0,0,0,0 ; call 308a <_sk_byte_tables_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,8 ; mov (%eax),%ecx - DB 15,40,162,133,104,0,0 ; movaps 0x6885(%edx),%xmm4 + DB 15,40,162,246,104,0,0 ; movaps 0x68f6(%edx),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5 @@ -47646,7 +48122,7 @@ _sk_byte_tables_sse2 LABEL PROC DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0 DB 139,65,4 ; mov 0x4(%ecx),%eax DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0 - DB 15,40,170,149,104,0,0 ; movaps 0x6895(%edx),%xmm5 + DB 15,40,170,6,105,0,0 ; movaps 0x6906(%edx),%xmm5 DB 15,89,204 ; mulps %xmm4,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6 @@ -47769,12 +48245,12 @@ _sk_byte_tables_rgb_sse2 LABEL PROC DB 15,182,60,31 ; movzbl (%edi,%ebx,1),%edi DB 193,231,8 ; shl $0x8,%edi DB 9,215 ; or %edx,%edi - DB 232,0,0,0,0 ; call 310b <_sk_byte_tables_rgb_sse2+0x65> + DB 232,0,0,0,0 ; call 328a <_sk_byte_tables_rgb_sse2+0x65> DB 90 ; pop %edx DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0 DB 139,121,4 ; mov 0x4(%ecx),%edi DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0 - DB 15,40,170,165,102,0,0 ; movaps 0x66a5(%edx),%xmm5 + DB 15,40,170,22,103,0,0 ; movaps 0x6716(%edx),%xmm5 DB 15,89,204 ; mulps %xmm4,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6 @@ -48000,7 +48476,7 @@ _sk_parametric_r_sse2 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,209 ; movaps %xmm1,%xmm2 DB 15,40,200 ; movaps %xmm0,%xmm1 - DB 232,0,0,0,0 ; call 33da <_sk_parametric_r_sse2+0x18> + DB 232,0,0,0,0 ; call 3559 <_sk_parametric_r_sse2+0x18> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,8 ; mov (%eax),%ecx @@ -48020,15 +48496,15 @@ _sk_parametric_r_sse2 LABEL PROC DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 DB 15,88,245 ; addps %xmm5,%xmm6 DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5 - DB 15,89,170,230,99,0,0 ; mulps 0x63e6(%edx),%xmm5 - DB 15,84,178,246,99,0,0 ; andps 0x63f6(%edx),%xmm6 - DB 15,86,178,6,100,0,0 ; orps 0x6406(%edx),%xmm6 - DB 15,88,170,22,100,0,0 ; addps 0x6416(%edx),%xmm5 - DB 15,40,186,38,100,0,0 ; movaps 0x6426(%edx),%xmm7 + DB 15,89,170,87,100,0,0 ; mulps 0x6457(%edx),%xmm5 + DB 15,84,178,103,100,0,0 ; andps 0x6467(%edx),%xmm6 + DB 15,86,178,119,100,0,0 ; orps 0x6477(%edx),%xmm6 + DB 15,88,170,135,100,0,0 ; addps 0x6487(%edx),%xmm5 + DB 15,40,186,151,100,0,0 ; movaps 0x6497(%edx),%xmm7 DB 15,89,254 ; mulps %xmm6,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,88,178,54,100,0,0 ; addps 0x6436(%edx),%xmm6 - DB 15,40,186,70,100,0,0 ; movaps 0x6446(%edx),%xmm7 + DB 15,88,178,167,100,0,0 ; addps 0x64a7(%edx),%xmm6 + DB 15,40,186,183,100,0,0 ; movaps 0x64b7(%edx),%xmm7 DB 15,94,254 ; divps %xmm6,%xmm7 DB 243,15,16,49 ; movss (%ecx),%xmm6 DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6 @@ -48038,21 +48514,21 @@ _sk_parametric_r_sse2 LABEL PROC DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,194,199,1 ; cmpltps %xmm7,%xmm0 - DB 15,40,178,86,100,0,0 ; movaps 0x6456(%edx),%xmm6 + DB 15,40,178,199,100,0,0 ; movaps 0x64c7(%edx),%xmm6 DB 15,84,198 ; andps %xmm6,%xmm0 DB 15,92,248 ; subps %xmm0,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,92,199 ; subps %xmm7,%xmm0 - DB 15,88,170,102,100,0,0 ; addps 0x6466(%edx),%xmm5 - DB 15,40,186,118,100,0,0 ; movaps 0x6476(%edx),%xmm7 + DB 15,88,170,215,100,0,0 ; addps 0x64d7(%edx),%xmm5 + DB 15,40,186,231,100,0,0 ; movaps 0x64e7(%edx),%xmm7 DB 15,89,248 ; mulps %xmm0,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,40,186,134,100,0,0 ; movaps 0x6486(%edx),%xmm7 + DB 15,40,186,247,100,0,0 ; movaps 0x64f7(%edx),%xmm7 DB 15,92,248 ; subps %xmm0,%xmm7 - DB 15,40,130,150,100,0,0 ; movaps 0x6496(%edx),%xmm0 + DB 15,40,130,7,101,0,0 ; movaps 0x6507(%edx),%xmm0 DB 15,94,199 ; divps %xmm7,%xmm0 DB 15,88,197 ; addps %xmm5,%xmm0 - DB 15,89,130,166,100,0,0 ; mulps 0x64a6(%edx),%xmm0 + DB 15,89,130,23,101,0,0 ; mulps 0x6517(%edx),%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -48084,7 +48560,7 @@ _sk_parametric_g_sse2 LABEL PROC DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,208 ; movaps %xmm0,%xmm2 - DB 232,0,0,0,0 ; call 3511 <_sk_parametric_g_sse2+0x15> + DB 232,0,0,0,0 ; call 3690 <_sk_parametric_g_sse2+0x15> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,8 ; mov (%eax),%ecx @@ -48104,15 +48580,15 @@ _sk_parametric_g_sse2 LABEL PROC DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 DB 15,88,245 ; addps %xmm5,%xmm6 DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5 - DB 15,89,170,127,99,0,0 ; mulps 0x637f(%edx),%xmm5 - DB 15,84,178,143,99,0,0 ; andps 0x638f(%edx),%xmm6 - DB 15,86,178,159,99,0,0 ; orps 0x639f(%edx),%xmm6 - DB 15,88,170,175,99,0,0 ; addps 0x63af(%edx),%xmm5 - DB 15,40,186,191,99,0,0 ; movaps 0x63bf(%edx),%xmm7 + DB 15,89,170,240,99,0,0 ; mulps 0x63f0(%edx),%xmm5 + DB 15,84,178,0,100,0,0 ; andps 0x6400(%edx),%xmm6 + DB 15,86,178,16,100,0,0 ; orps 0x6410(%edx),%xmm6 + DB 15,88,170,32,100,0,0 ; addps 0x6420(%edx),%xmm5 + DB 15,40,186,48,100,0,0 ; movaps 0x6430(%edx),%xmm7 DB 15,89,254 ; mulps %xmm6,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,88,178,207,99,0,0 ; addps 0x63cf(%edx),%xmm6 - DB 15,40,186,223,99,0,0 ; movaps 0x63df(%edx),%xmm7 + DB 15,88,178,64,100,0,0 ; addps 0x6440(%edx),%xmm6 + DB 15,40,186,80,100,0,0 ; movaps 0x6450(%edx),%xmm7 DB 15,94,254 ; divps %xmm6,%xmm7 DB 243,15,16,49 ; movss (%ecx),%xmm6 DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6 @@ -48122,21 +48598,21 @@ _sk_parametric_g_sse2 LABEL PROC DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,194,199,1 ; cmpltps %xmm7,%xmm0 - DB 15,40,178,239,99,0,0 ; movaps 0x63ef(%edx),%xmm6 + DB 15,40,178,96,100,0,0 ; movaps 0x6460(%edx),%xmm6 DB 15,84,198 ; andps %xmm6,%xmm0 DB 15,92,248 ; subps %xmm0,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,92,199 ; subps %xmm7,%xmm0 - DB 15,88,170,255,99,0,0 ; addps 0x63ff(%edx),%xmm5 - DB 15,40,186,15,100,0,0 ; movaps 0x640f(%edx),%xmm7 + DB 15,88,170,112,100,0,0 ; addps 0x6470(%edx),%xmm5 + DB 15,40,186,128,100,0,0 ; movaps 0x6480(%edx),%xmm7 DB 15,89,248 ; mulps %xmm0,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,40,186,31,100,0,0 ; movaps 0x641f(%edx),%xmm7 + DB 15,40,186,144,100,0,0 ; movaps 0x6490(%edx),%xmm7 DB 15,92,248 ; subps %xmm0,%xmm7 - DB 15,40,130,47,100,0,0 ; movaps 0x642f(%edx),%xmm0 + DB 15,40,130,160,100,0,0 ; movaps 0x64a0(%edx),%xmm0 DB 15,94,199 ; divps %xmm7,%xmm0 DB 15,88,197 ; addps %xmm5,%xmm0 - DB 15,89,130,63,100,0,0 ; mulps 0x643f(%edx),%xmm0 + DB 15,89,130,176,100,0,0 ; mulps 0x64b0(%edx),%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -48167,7 +48643,7 @@ _sk_parametric_b_sse2 LABEL PROC DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) DB 15,40,217 ; movaps %xmm1,%xmm3 DB 15,40,200 ; movaps %xmm0,%xmm1 - DB 232,0,0,0,0 ; call 3645 <_sk_parametric_b_sse2+0x15> + DB 232,0,0,0,0 ; call 37c4 <_sk_parametric_b_sse2+0x15> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,8 ; mov (%eax),%ecx @@ -48187,15 +48663,15 @@ _sk_parametric_b_sse2 LABEL PROC DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 DB 15,88,245 ; addps %xmm5,%xmm6 DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5 - DB 15,89,170,27,99,0,0 ; mulps 0x631b(%edx),%xmm5 - DB 15,84,178,43,99,0,0 ; andps 0x632b(%edx),%xmm6 - DB 15,86,178,59,99,0,0 ; orps 0x633b(%edx),%xmm6 - DB 15,88,170,75,99,0,0 ; addps 0x634b(%edx),%xmm5 - DB 15,40,186,91,99,0,0 ; movaps 0x635b(%edx),%xmm7 + DB 15,89,170,140,99,0,0 ; mulps 0x638c(%edx),%xmm5 + DB 15,84,178,156,99,0,0 ; andps 0x639c(%edx),%xmm6 + DB 15,86,178,172,99,0,0 ; orps 0x63ac(%edx),%xmm6 + DB 15,88,170,188,99,0,0 ; addps 0x63bc(%edx),%xmm5 + DB 15,40,186,204,99,0,0 ; movaps 0x63cc(%edx),%xmm7 DB 15,89,254 ; mulps %xmm6,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,88,178,107,99,0,0 ; addps 0x636b(%edx),%xmm6 - DB 15,40,186,123,99,0,0 ; movaps 0x637b(%edx),%xmm7 + DB 15,88,178,220,99,0,0 ; addps 0x63dc(%edx),%xmm6 + DB 15,40,186,236,99,0,0 ; movaps 0x63ec(%edx),%xmm7 DB 15,94,254 ; divps %xmm6,%xmm7 DB 243,15,16,49 ; movss (%ecx),%xmm6 DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6 @@ -48205,21 +48681,21 @@ _sk_parametric_b_sse2 LABEL PROC DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,194,199,1 ; cmpltps %xmm7,%xmm0 - DB 15,40,178,139,99,0,0 ; movaps 0x638b(%edx),%xmm6 + DB 15,40,178,252,99,0,0 ; movaps 0x63fc(%edx),%xmm6 DB 15,84,198 ; andps %xmm6,%xmm0 DB 15,92,248 ; subps %xmm0,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,92,199 ; subps %xmm7,%xmm0 - DB 15,88,170,155,99,0,0 ; addps 0x639b(%edx),%xmm5 - DB 15,40,186,171,99,0,0 ; movaps 0x63ab(%edx),%xmm7 + DB 15,88,170,12,100,0,0 ; addps 0x640c(%edx),%xmm5 + DB 15,40,186,28,100,0,0 ; movaps 0x641c(%edx),%xmm7 DB 15,89,248 ; mulps %xmm0,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,40,186,187,99,0,0 ; movaps 0x63bb(%edx),%xmm7 + DB 15,40,186,44,100,0,0 ; movaps 0x642c(%edx),%xmm7 DB 15,92,248 ; subps %xmm0,%xmm7 - DB 15,40,130,203,99,0,0 ; movaps 0x63cb(%edx),%xmm0 + DB 15,40,130,60,100,0,0 ; movaps 0x643c(%edx),%xmm0 DB 15,94,199 ; divps %xmm7,%xmm0 DB 15,88,197 ; addps %xmm5,%xmm0 - DB 15,89,130,219,99,0,0 ; mulps 0x63db(%edx),%xmm0 + DB 15,89,130,76,100,0,0 ; mulps 0x644c(%edx),%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -48250,7 +48726,7 @@ _sk_parametric_a_sse2 LABEL PROC DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp) DB 15,40,209 ; movaps %xmm1,%xmm2 DB 15,40,200 ; movaps %xmm0,%xmm1 - DB 232,0,0,0,0 ; call 3779 <_sk_parametric_a_sse2+0x15> + DB 232,0,0,0,0 ; call 38f8 <_sk_parametric_a_sse2+0x15> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,8 ; mov (%eax),%ecx @@ -48270,15 +48746,15 @@ _sk_parametric_a_sse2 LABEL PROC DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 DB 15,88,245 ; addps %xmm5,%xmm6 DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5 - DB 15,89,170,183,98,0,0 ; mulps 0x62b7(%edx),%xmm5 - DB 15,84,178,199,98,0,0 ; andps 0x62c7(%edx),%xmm6 - DB 15,86,178,215,98,0,0 ; orps 0x62d7(%edx),%xmm6 - DB 15,88,170,231,98,0,0 ; addps 0x62e7(%edx),%xmm5 - DB 15,40,186,247,98,0,0 ; movaps 0x62f7(%edx),%xmm7 + DB 15,89,170,40,99,0,0 ; mulps 0x6328(%edx),%xmm5 + DB 15,84,178,56,99,0,0 ; andps 0x6338(%edx),%xmm6 + DB 15,86,178,72,99,0,0 ; orps 0x6348(%edx),%xmm6 + DB 15,88,170,88,99,0,0 ; addps 0x6358(%edx),%xmm5 + DB 15,40,186,104,99,0,0 ; movaps 0x6368(%edx),%xmm7 DB 15,89,254 ; mulps %xmm6,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,88,178,7,99,0,0 ; addps 0x6307(%edx),%xmm6 - DB 15,40,186,23,99,0,0 ; movaps 0x6317(%edx),%xmm7 + DB 15,88,178,120,99,0,0 ; addps 0x6378(%edx),%xmm6 + DB 15,40,186,136,99,0,0 ; movaps 0x6388(%edx),%xmm7 DB 15,94,254 ; divps %xmm6,%xmm7 DB 243,15,16,49 ; movss (%ecx),%xmm6 DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6 @@ -48288,21 +48764,21 @@ _sk_parametric_a_sse2 LABEL PROC DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,194,199,1 ; cmpltps %xmm7,%xmm0 - DB 15,40,178,39,99,0,0 ; movaps 0x6327(%edx),%xmm6 + DB 15,40,178,152,99,0,0 ; movaps 0x6398(%edx),%xmm6 DB 15,84,198 ; andps %xmm6,%xmm0 DB 15,92,248 ; subps %xmm0,%xmm7 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,92,199 ; subps %xmm7,%xmm0 - DB 15,88,170,55,99,0,0 ; addps 0x6337(%edx),%xmm5 - DB 15,40,186,71,99,0,0 ; movaps 0x6347(%edx),%xmm7 + DB 15,88,170,168,99,0,0 ; addps 0x63a8(%edx),%xmm5 + DB 15,40,186,184,99,0,0 ; movaps 0x63b8(%edx),%xmm7 DB 15,89,248 ; mulps %xmm0,%xmm7 DB 15,92,239 ; subps %xmm7,%xmm5 - DB 15,40,186,87,99,0,0 ; movaps 0x6357(%edx),%xmm7 + DB 15,40,186,200,99,0,0 ; movaps 0x63c8(%edx),%xmm7 DB 15,92,248 ; subps %xmm0,%xmm7 - DB 15,40,130,103,99,0,0 ; movaps 0x6367(%edx),%xmm0 + DB 15,40,130,216,99,0,0 ; movaps 0x63d8(%edx),%xmm0 DB 15,94,199 ; divps %xmm7,%xmm0 DB 15,88,197 ; addps %xmm5,%xmm0 - DB 15,89,130,119,99,0,0 ; mulps 0x6377(%edx),%xmm0 + DB 15,89,130,232,99,0,0 ; mulps 0x63e8(%edx),%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -48332,18 +48808,18 @@ _sk_gamma_sse2 LABEL PROC DB 131,236,40 ; sub $0x28,%esp DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp) DB 15,40,216 ; movaps %xmm0,%xmm3 - DB 232,0,0,0,0 ; call 38aa <_sk_gamma_sse2+0x12> + DB 232,0,0,0,0 ; call 3a29 <_sk_gamma_sse2+0x12> DB 88 ; pop %eax DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0 - DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0 - DB 15,84,152,102,98,0,0 ; andps 0x6266(%eax),%xmm3 - DB 15,86,152,118,98,0,0 ; orps 0x6276(%eax),%xmm3 - DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0 + DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0 + DB 15,84,152,215,98,0,0 ; andps 0x62d7(%eax),%xmm3 + DB 15,86,152,231,98,0,0 ; orps 0x62e7(%eax),%xmm3 + DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0 DB 15,40,227 ; movaps %xmm3,%xmm4 - DB 15,89,160,150,98,0,0 ; mulps 0x6296(%eax),%xmm4 + DB 15,89,160,7,99,0,0 ; mulps 0x6307(%eax),%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 15,88,152,166,98,0,0 ; addps 0x62a6(%eax),%xmm3 - DB 15,40,160,182,98,0,0 ; movaps 0x62b6(%eax),%xmm4 + DB 15,88,152,23,99,0,0 ; addps 0x6317(%eax),%xmm3 + DB 15,40,160,39,99,0,0 ; movaps 0x6327(%eax),%xmm4 DB 15,94,227 ; divps %xmm3,%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 DB 139,77,12 ; mov 0xc(%ebp),%ecx @@ -48356,30 +48832,30 @@ _sk_gamma_sse2 LABEL PROC DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 DB 15,40,224 ; movaps %xmm0,%xmm4 DB 15,194,227,1 ; cmpltps %xmm3,%xmm4 - DB 15,84,160,198,98,0,0 ; andps 0x62c6(%eax),%xmm4 + DB 15,84,160,55,99,0,0 ; andps 0x6337(%eax),%xmm4 DB 15,92,220 ; subps %xmm4,%xmm3 DB 15,40,224 ; movaps %xmm0,%xmm4 DB 15,92,227 ; subps %xmm3,%xmm4 - DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0 - DB 15,40,176,246,98,0,0 ; movaps 0x62f6(%eax),%xmm6 + DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0 + DB 15,40,176,103,99,0,0 ; movaps 0x6367(%eax),%xmm6 DB 15,92,244 ; subps %xmm4,%xmm6 - DB 15,40,168,230,98,0,0 ; movaps 0x62e6(%eax),%xmm5 + DB 15,40,168,87,99,0,0 ; movaps 0x6357(%eax),%xmm5 DB 15,89,229 ; mulps %xmm5,%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 15,40,152,6,99,0,0 ; movaps 0x6306(%eax),%xmm3 + DB 15,40,152,119,99,0,0 ; movaps 0x6377(%eax),%xmm3 DB 15,40,227 ; movaps %xmm3,%xmm4 DB 15,94,230 ; divps %xmm6,%xmm4 DB 15,88,224 ; addps %xmm0,%xmm4 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0 - DB 15,84,136,102,98,0,0 ; andps 0x6266(%eax),%xmm1 - DB 15,86,136,118,98,0,0 ; orps 0x6276(%eax),%xmm1 - DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0 + DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0 + DB 15,84,136,215,98,0,0 ; andps 0x62d7(%eax),%xmm1 + DB 15,86,136,231,98,0,0 ; orps 0x62e7(%eax),%xmm1 + DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0 DB 15,40,241 ; movaps %xmm1,%xmm6 - DB 15,89,176,150,98,0,0 ; mulps 0x6296(%eax),%xmm6 + DB 15,89,176,7,99,0,0 ; mulps 0x6307(%eax),%xmm6 DB 15,92,198 ; subps %xmm6,%xmm0 - DB 15,88,136,166,98,0,0 ; addps 0x62a6(%eax),%xmm1 - DB 15,40,176,182,98,0,0 ; movaps 0x62b6(%eax),%xmm6 + DB 15,88,136,23,99,0,0 ; addps 0x6317(%eax),%xmm1 + DB 15,40,176,39,99,0,0 ; movaps 0x6327(%eax),%xmm6 DB 15,94,241 ; divps %xmm1,%xmm6 DB 15,92,198 ; subps %xmm6,%xmm0 DB 15,89,199 ; mulps %xmm7,%xmm0 @@ -48387,12 +48863,12 @@ _sk_gamma_sse2 LABEL PROC DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,40,240 ; movaps %xmm0,%xmm6 DB 15,194,241,1 ; cmpltps %xmm1,%xmm6 - DB 15,84,176,198,98,0,0 ; andps 0x62c6(%eax),%xmm6 + DB 15,84,176,55,99,0,0 ; andps 0x6337(%eax),%xmm6 DB 15,92,206 ; subps %xmm6,%xmm1 DB 15,40,240 ; movaps %xmm0,%xmm6 DB 15,92,241 ; subps %xmm1,%xmm6 - DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0 - DB 15,40,184,246,98,0,0 ; movaps 0x62f6(%eax),%xmm7 + DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0 + DB 15,40,184,103,99,0,0 ; movaps 0x6367(%eax),%xmm7 DB 15,92,254 ; subps %xmm6,%xmm7 DB 15,89,245 ; mulps %xmm5,%xmm6 DB 15,92,198 ; subps %xmm6,%xmm0 @@ -48400,15 +48876,15 @@ _sk_gamma_sse2 LABEL PROC DB 15,94,207 ; divps %xmm7,%xmm1 DB 15,88,200 ; addps %xmm0,%xmm1 DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0 - DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0 - DB 15,84,144,102,98,0,0 ; andps 0x6266(%eax),%xmm2 - DB 15,86,144,118,98,0,0 ; orps 0x6276(%eax),%xmm2 - DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0 - DB 15,40,176,150,98,0,0 ; movaps 0x6296(%eax),%xmm6 + DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0 + DB 15,84,144,215,98,0,0 ; andps 0x62d7(%eax),%xmm2 + DB 15,86,144,231,98,0,0 ; orps 0x62e7(%eax),%xmm2 + DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0 + DB 15,40,176,7,99,0,0 ; movaps 0x6307(%eax),%xmm6 DB 15,89,242 ; mulps %xmm2,%xmm6 DB 15,92,198 ; subps %xmm6,%xmm0 - DB 15,88,144,166,98,0,0 ; addps 0x62a6(%eax),%xmm2 - DB 15,40,176,182,98,0,0 ; movaps 0x62b6(%eax),%xmm6 + DB 15,88,144,23,99,0,0 ; addps 0x6317(%eax),%xmm2 + DB 15,40,176,39,99,0,0 ; movaps 0x6327(%eax),%xmm6 DB 15,94,242 ; divps %xmm2,%xmm6 DB 15,92,198 ; subps %xmm6,%xmm0 DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0 @@ -48416,18 +48892,18 @@ _sk_gamma_sse2 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 15,40,240 ; movaps %xmm0,%xmm6 DB 15,194,242,1 ; cmpltps %xmm2,%xmm6 - DB 15,84,176,198,98,0,0 ; andps 0x62c6(%eax),%xmm6 + DB 15,84,176,55,99,0,0 ; andps 0x6337(%eax),%xmm6 DB 15,92,214 ; subps %xmm6,%xmm2 DB 15,40,240 ; movaps %xmm0,%xmm6 DB 15,92,242 ; subps %xmm2,%xmm6 - DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0 + DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0 DB 15,89,238 ; mulps %xmm6,%xmm5 DB 15,92,197 ; subps %xmm5,%xmm0 - DB 15,40,144,246,98,0,0 ; movaps 0x62f6(%eax),%xmm2 + DB 15,40,144,103,99,0,0 ; movaps 0x6367(%eax),%xmm2 DB 15,92,214 ; subps %xmm6,%xmm2 DB 15,94,218 ; divps %xmm2,%xmm3 DB 15,88,216 ; addps %xmm0,%xmm3 - DB 15,40,128,22,99,0,0 ; movaps 0x6316(%eax),%xmm0 + DB 15,40,128,135,99,0,0 ; movaps 0x6387(%eax),%xmm0 DB 15,89,224 ; mulps %xmm0,%xmm4 DB 15,89,200 ; mulps %xmm0,%xmm1 DB 15,89,216 ; mulps %xmm0,%xmm3 @@ -48452,31 +48928,31 @@ _sk_lab_to_xyz_sse2 LABEL PROC DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,208 ; movaps %xmm0,%xmm2 - DB 232,0,0,0,0 ; call 3a92 <_sk_lab_to_xyz_sse2+0x15> + DB 232,0,0,0,0 ; call 3c11 <_sk_lab_to_xyz_sse2+0x15> DB 88 ; pop %eax - DB 15,89,144,62,97,0,0 ; mulps 0x613e(%eax),%xmm2 - DB 15,40,160,78,97,0,0 ; movaps 0x614e(%eax),%xmm4 + DB 15,89,144,175,97,0,0 ; mulps 0x61af(%eax),%xmm2 + DB 15,40,160,191,97,0,0 ; movaps 0x61bf(%eax),%xmm4 DB 15,89,204 ; mulps %xmm4,%xmm1 - DB 15,40,168,94,97,0,0 ; movaps 0x615e(%eax),%xmm5 + DB 15,40,168,207,97,0,0 ; movaps 0x61cf(%eax),%xmm5 DB 15,88,205 ; addps %xmm5,%xmm1 DB 15,89,220 ; mulps %xmm4,%xmm3 DB 15,88,221 ; addps %xmm5,%xmm3 - DB 15,88,144,110,97,0,0 ; addps 0x616e(%eax),%xmm2 - DB 15,89,144,126,97,0,0 ; mulps 0x617e(%eax),%xmm2 - DB 15,89,136,142,97,0,0 ; mulps 0x618e(%eax),%xmm1 + DB 15,88,144,223,97,0,0 ; addps 0x61df(%eax),%xmm2 + DB 15,89,144,239,97,0,0 ; mulps 0x61ef(%eax),%xmm2 + DB 15,89,136,255,97,0,0 ; mulps 0x61ff(%eax),%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 - DB 15,89,152,158,97,0,0 ; mulps 0x619e(%eax),%xmm3 + DB 15,89,152,15,98,0,0 ; mulps 0x620f(%eax),%xmm3 DB 15,40,234 ; movaps %xmm2,%xmm5 DB 15,92,235 ; subps %xmm3,%xmm5 DB 15,40,193 ; movaps %xmm1,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 DB 15,89,193 ; mulps %xmm1,%xmm0 - DB 15,40,152,174,97,0,0 ; movaps 0x61ae(%eax),%xmm3 + DB 15,40,152,31,98,0,0 ; movaps 0x621f(%eax),%xmm3 DB 15,40,227 ; movaps %xmm3,%xmm4 DB 15,194,224,1 ; cmpltps %xmm0,%xmm4 - DB 15,40,176,190,97,0,0 ; movaps 0x61be(%eax),%xmm6 + DB 15,40,176,47,98,0,0 ; movaps 0x622f(%eax),%xmm6 DB 15,88,206 ; addps %xmm6,%xmm1 - DB 15,40,184,206,97,0,0 ; movaps 0x61ce(%eax),%xmm7 + DB 15,40,184,63,98,0,0 ; movaps 0x623f(%eax),%xmm7 DB 15,89,207 ; mulps %xmm7,%xmm1 DB 15,84,196 ; andps %xmm4,%xmm0 DB 15,85,225 ; andnps %xmm1,%xmm4 @@ -48501,8 +48977,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC DB 15,85,221 ; andnps %xmm5,%xmm3 DB 15,86,216 ; orps %xmm0,%xmm3 DB 139,77,12 ; mov 0xc(%ebp),%ecx - DB 15,89,160,222,97,0,0 ; mulps 0x61de(%eax),%xmm4 - DB 15,89,152,238,97,0,0 ; mulps 0x61ee(%eax),%xmm3 + DB 15,89,160,79,98,0,0 ; mulps 0x624f(%eax),%xmm4 + DB 15,89,152,95,98,0,0 ; mulps 0x625f(%eax),%xmm3 DB 141,65,4 ; lea 0x4(%ecx),%eax DB 131,236,8 ; sub $0x8,%esp DB 15,40,196 ; movaps %xmm4,%xmm0 @@ -48523,7 +48999,7 @@ _sk_load_a8_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 3b82 <_sk_load_a8_sse2+0xe> + DB 232,0,0,0,0 ; call 3d01 <_sk_load_a8_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -48534,13 +49010,13 @@ _sk_load_a8_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,60 ; jne 3bd9 <_sk_load_a8_sse2+0x65> + DB 117,60 ; jne 3d58 <_sk_load_a8_sse2+0x65> DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,130,14,97,0,0 ; pand 0x610e(%edx),%xmm0 + DB 102,15,219,130,127,97,0,0 ; pand 0x617f(%edx),%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,154,30,97,0,0 ; mulps 0x611e(%edx),%xmm3 + DB 15,89,154,143,97,0,0 ; mulps 0x618f(%edx),%xmm3 DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -48557,12 +49033,12 @@ _sk_load_a8_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,50 ; je 3c13 <_sk_load_a8_sse2+0x9f> + DB 116,50 ; je 3d92 <_sk_load_a8_sse2+0x9f> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 3bfd <_sk_load_a8_sse2+0x89> + DB 116,19 ; je 3d7c <_sk_load_a8_sse2+0x89> DB 128,251,3 ; cmp $0x3,%bl - DB 117,187 ; jne 3baa <_sk_load_a8_sse2+0x36> + DB 117,187 ; jne 3d29 <_sk_load_a8_sse2+0x36> DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx DB 102,15,110,195 ; movd %ebx,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -48571,10 +49047,10 @@ _sk_load_a8_sse2 LABEL PROC DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 235,151 ; jmp 3baa <_sk_load_a8_sse2+0x36> + DB 235,151 ; jmp 3d29 <_sk_load_a8_sse2+0x36> DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi DB 102,15,110,198 ; movd %esi,%xmm0 - DB 235,141 ; jmp 3baa <_sk_load_a8_sse2+0x36> + DB 235,141 ; jmp 3d29 <_sk_load_a8_sse2+0x36> PUBLIC _sk_load_a8_dst_sse2 _sk_load_a8_dst_sse2 LABEL PROC @@ -48597,15 +49073,15 @@ _sk_load_a8_dst_sse2 LABEL PROC DB 102,15,127,97,32 ; movdqa %xmm4,0x20(%ecx) DB 102,15,127,97,16 ; movdqa %xmm4,0x10(%ecx) DB 133,219 ; test %ebx,%ebx - DB 232,0,0,0,0 ; call 3c56 <_sk_load_a8_dst_sse2+0x39> + DB 232,0,0,0,0 ; call 3dd5 <_sk_load_a8_dst_sse2+0x39> DB 90 ; pop %edx - DB 117,54 ; jne 3c8f <_sk_load_a8_dst_sse2+0x72> + DB 117,54 ; jne 3e0e <_sk_load_a8_dst_sse2+0x72> DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,162,90,96,0,0 ; pand 0x605a(%edx),%xmm4 + DB 102,15,219,162,203,96,0,0 ; pand 0x60cb(%edx),%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,162,106,96,0,0 ; mulps 0x606a(%edx),%xmm4 + DB 15,89,162,219,96,0,0 ; mulps 0x60db(%edx),%xmm4 DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx) DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp @@ -48620,11 +49096,11 @@ _sk_load_a8_dst_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,46 ; je 3cc5 <_sk_load_a8_dst_sse2+0xa8> + DB 116,46 ; je 3e44 <_sk_load_a8_dst_sse2+0xa8> DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 3caf <_sk_load_a8_dst_sse2+0x92> + DB 116,19 ; je 3e2e <_sk_load_a8_dst_sse2+0x92> DB 128,251,3 ; cmp $0x3,%bl - DB 117,197 ; jne 3c66 <_sk_load_a8_dst_sse2+0x49> + DB 117,197 ; jne 3de5 <_sk_load_a8_dst_sse2+0x49> DB 15,182,92,55,2 ; movzbl 0x2(%edi,%esi,1),%ebx DB 102,15,110,227 ; movd %ebx,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -48633,10 +49109,10 @@ _sk_load_a8_dst_sse2 LABEL PROC DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 235,161 ; jmp 3c66 <_sk_load_a8_dst_sse2+0x49> + DB 235,161 ; jmp 3de5 <_sk_load_a8_dst_sse2+0x49> DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi DB 102,15,110,230 ; movd %esi,%xmm4 - DB 235,151 ; jmp 3c66 <_sk_load_a8_dst_sse2+0x49> + DB 235,151 ; jmp 3de5 <_sk_load_a8_dst_sse2+0x49> PUBLIC _sk_gather_a8_sse2 _sk_gather_a8_sse2 LABEL PROC @@ -48675,13 +49151,13 @@ _sk_gather_a8_sse2 LABEL PROC DB 9,202 ; or %ecx,%edx DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0 DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0 - DB 232,0,0,0,0 ; call 3d54 <_sk_gather_a8_sse2+0x85> + DB 232,0,0,0,0 ; call 3ed3 <_sk_gather_a8_sse2+0x85> DB 89 ; pop %ecx DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,153,124,95,0,0 ; mulps 0x5f7c(%ecx),%xmm3 + DB 15,89,153,237,95,0,0 ; mulps 0x5fed(%ecx),%xmm3 DB 141,72,8 ; lea 0x8(%eax),%ecx DB 131,236,8 ; sub $0x8,%esp DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -48704,7 +49180,7 @@ _sk_store_a8_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,60 ; sub $0x3c,%esp - DB 232,0,0,0,0 ; call 3d98 <_sk_store_a8_sse2+0xe> + DB 232,0,0,0,0 ; call 3f17 <_sk_store_a8_sse2+0xe> DB 94 ; pop %esi DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -48713,7 +49189,7 @@ _sk_store_a8_sse2 LABEL PROC DB 15,175,81,4 ; imul 0x4(%ecx),%edx DB 3,23 ; add (%edi),%edx DB 139,89,8 ; mov 0x8(%ecx),%ebx - DB 15,40,166,72,95,0,0 ; movaps 0x5f48(%esi),%xmm4 + DB 15,40,166,185,95,0,0 ; movaps 0x5fb9(%esi),%xmm4 DB 15,89,227 ; mulps %xmm3,%xmm4 DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4 DB 102,15,114,244,16 ; pslld $0x10,%xmm4 @@ -48722,7 +49198,7 @@ _sk_store_a8_sse2 LABEL PROC DB 102,15,103,228 ; packuswb %xmm4,%xmm4 DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,26 ; jne 3ded <_sk_store_a8_sse2+0x63> + DB 117,26 ; jne 3f6c <_sk_store_a8_sse2+0x63> DB 102,15,126,230 ; movd %xmm4,%esi DB 137,52,58 ; mov %esi,(%edx,%edi,1) DB 141,80,8 ; lea 0x8(%eax),%edx @@ -48740,26 +49216,26 @@ _sk_store_a8_sse2 LABEL PROC DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,57 ; je 3e36 <_sk_store_a8_sse2+0xac> + DB 116,57 ; je 3fb5 <_sk_store_a8_sse2+0xac> DB 128,251,2 ; cmp $0x2,%bl - DB 116,17 ; je 3e13 <_sk_store_a8_sse2+0x89> + DB 116,17 ; je 3f92 <_sk_store_a8_sse2+0x89> DB 128,251,3 ; cmp $0x3,%bl - DB 117,211 ; jne 3dda <_sk_store_a8_sse2+0x50> + DB 117,211 ; jne 3f59 <_sk_store_a8_sse2+0x50> DB 102,15,127,101,200 ; movdqa %xmm4,-0x38(%ebp) DB 138,93,208 ; mov -0x30(%ebp),%bl DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1) DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4 - DB 102,15,219,166,88,95,0,0 ; pand 0x5f58(%esi),%xmm4 + DB 102,15,219,166,201,95,0,0 ; pand 0x5fc9(%esi),%xmm4 DB 102,15,103,228 ; packuswb %xmm4,%xmm4 DB 102,15,103,228 ; packuswb %xmm4,%xmm4 DB 102,15,103,228 ; packuswb %xmm4,%xmm4 DB 102,15,126,230 ; movd %xmm4,%esi DB 102,137,52,58 ; mov %si,(%edx,%edi,1) - DB 235,164 ; jmp 3dda <_sk_store_a8_sse2+0x50> + DB 235,164 ; jmp 3f59 <_sk_store_a8_sse2+0x50> DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp) DB 138,93,216 ; mov -0x28(%ebp),%bl DB 136,28,58 ; mov %bl,(%edx,%edi,1) - DB 235,151 ; jmp 3dda <_sk_store_a8_sse2+0x50> + DB 235,151 ; jmp 3f59 <_sk_store_a8_sse2+0x50> PUBLIC _sk_load_g8_sse2 _sk_load_g8_sse2 LABEL PROC @@ -48769,7 +49245,7 @@ _sk_load_g8_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 3e51 <_sk_load_g8_sse2+0xe> + DB 232,0,0,0,0 ; call 3fd0 <_sk_load_g8_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -48780,16 +49256,16 @@ _sk_load_g8_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,63 ; jne 3eab <_sk_load_g8_sse2+0x68> + DB 117,63 ; jne 402a <_sk_load_g8_sse2+0x68> DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,130,175,94,0,0 ; pand 0x5eaf(%edx),%xmm0 + DB 102,15,219,130,32,95,0,0 ; pand 0x5f20(%edx),%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,130,191,94,0,0 ; mulps 0x5ebf(%edx),%xmm0 + DB 15,89,130,48,95,0,0 ; mulps 0x5f30(%edx),%xmm0 DB 141,112,8 ; lea 0x8(%eax),%esi DB 131,236,8 ; sub $0x8,%esp - DB 15,40,154,207,94,0,0 ; movaps 0x5ecf(%edx),%xmm3 + DB 15,40,154,64,95,0,0 ; movaps 0x5f40(%edx),%xmm3 DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 86 ; push %esi @@ -48803,12 +49279,12 @@ _sk_load_g8_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,50 ; je 3ee5 <_sk_load_g8_sse2+0xa2> + DB 116,50 ; je 4064 <_sk_load_g8_sse2+0xa2> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 3ecf <_sk_load_g8_sse2+0x8c> + DB 116,19 ; je 404e <_sk_load_g8_sse2+0x8c> DB 128,251,3 ; cmp $0x3,%bl - DB 117,184 ; jne 3e79 <_sk_load_g8_sse2+0x36> + DB 117,184 ; jne 3ff8 <_sk_load_g8_sse2+0x36> DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx DB 102,15,110,195 ; movd %ebx,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -48817,10 +49293,10 @@ _sk_load_g8_sse2 LABEL PROC DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 235,148 ; jmp 3e79 <_sk_load_g8_sse2+0x36> + DB 235,148 ; jmp 3ff8 <_sk_load_g8_sse2+0x36> DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi DB 102,15,110,198 ; movd %esi,%xmm0 - DB 235,138 ; jmp 3e79 <_sk_load_g8_sse2+0x36> + DB 235,138 ; jmp 3ff8 <_sk_load_g8_sse2+0x36> PUBLIC _sk_load_g8_dst_sse2 _sk_load_g8_dst_sse2 LABEL PROC @@ -48830,7 +49306,7 @@ _sk_load_g8_dst_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 3efd <_sk_load_g8_dst_sse2+0xe> + DB 232,0,0,0,0 ; call 407c <_sk_load_g8_dst_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -48841,17 +49317,17 @@ _sk_load_g8_dst_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,73 ; jne 3f61 <_sk_load_g8_dst_sse2+0x72> + DB 117,73 ; jne 40e0 <_sk_load_g8_dst_sse2+0x72> DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,162,51,94,0,0 ; pand 0x5e33(%edx),%xmm4 + DB 102,15,219,162,164,94,0,0 ; pand 0x5ea4(%edx),%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,162,67,94,0,0 ; mulps 0x5e43(%edx),%xmm4 + DB 15,89,162,180,94,0,0 ; mulps 0x5eb4(%edx),%xmm4 DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx) DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx) DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx) - DB 15,40,162,83,94,0,0 ; movaps 0x5e53(%edx),%xmm4 + DB 15,40,162,196,94,0,0 ; movaps 0x5ec4(%edx),%xmm4 DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx) DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp @@ -48866,12 +49342,12 @@ _sk_load_g8_dst_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,50 ; je 3f9b <_sk_load_g8_dst_sse2+0xac> + DB 116,50 ; je 411a <_sk_load_g8_dst_sse2+0xac> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 3f85 <_sk_load_g8_dst_sse2+0x96> + DB 116,19 ; je 4104 <_sk_load_g8_dst_sse2+0x96> DB 128,251,3 ; cmp $0x3,%bl - DB 117,174 ; jne 3f25 <_sk_load_g8_dst_sse2+0x36> + DB 117,174 ; jne 40a4 <_sk_load_g8_dst_sse2+0x36> DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx DB 102,15,110,227 ; movd %ebx,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 @@ -48880,10 +49356,10 @@ _sk_load_g8_dst_sse2 LABEL PROC DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 235,138 ; jmp 3f25 <_sk_load_g8_dst_sse2+0x36> + DB 235,138 ; jmp 40a4 <_sk_load_g8_dst_sse2+0x36> DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi DB 102,15,110,230 ; movd %esi,%xmm4 - DB 235,128 ; jmp 3f25 <_sk_load_g8_dst_sse2+0x36> + DB 235,128 ; jmp 40a4 <_sk_load_g8_dst_sse2+0x36> PUBLIC _sk_gather_g8_sse2 _sk_gather_g8_sse2 LABEL PROC @@ -48921,17 +49397,17 @@ _sk_gather_g8_sse2 LABEL PROC DB 193,226,8 ; shl $0x8,%edx DB 9,202 ; or %ecx,%edx DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0 - DB 232,0,0,0,0 ; call 4025 <_sk_gather_g8_sse2+0x80> + DB 232,0,0,0,0 ; call 41a4 <_sk_gather_g8_sse2+0x80> DB 89 ; pop %ecx DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,129,59,93,0,0 ; mulps 0x5d3b(%ecx),%xmm0 + DB 15,89,129,172,93,0,0 ; mulps 0x5dac(%ecx),%xmm0 DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp - DB 15,40,153,75,93,0,0 ; movaps 0x5d4b(%ecx),%xmm3 + DB 15,40,153,188,93,0,0 ; movaps 0x5dbc(%ecx),%xmm3 DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 82 ; push %edx @@ -48951,7 +49427,7 @@ _sk_load_565_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 4070 <_sk_load_565_sse2+0xe> + DB 232,0,0,0,0 ; call 41ef <_sk_load_565_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -48963,23 +49439,23 @@ _sk_load_565_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,97 ; jne 40ee <_sk_load_565_sse2+0x8c> + DB 117,97 ; jne 426d <_sk_load_565_sse2+0x8c> DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,130,16,93,0,0 ; movdqa 0x5d10(%edx),%xmm0 + DB 102,15,111,130,129,93,0,0 ; movdqa 0x5d81(%edx),%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,130,32,93,0,0 ; mulps 0x5d20(%edx),%xmm0 - DB 102,15,111,138,48,93,0,0 ; movdqa 0x5d30(%edx),%xmm1 + DB 15,89,130,145,93,0,0 ; mulps 0x5d91(%edx),%xmm0 + DB 102,15,111,138,161,93,0,0 ; movdqa 0x5da1(%edx),%xmm1 DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,138,64,93,0,0 ; mulps 0x5d40(%edx),%xmm1 - DB 102,15,219,146,80,93,0,0 ; pand 0x5d50(%edx),%xmm2 + DB 15,89,138,177,93,0,0 ; mulps 0x5db1(%edx),%xmm1 + DB 102,15,219,146,193,93,0,0 ; pand 0x5dc1(%edx),%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,146,96,93,0,0 ; mulps 0x5d60(%edx),%xmm2 + DB 15,89,146,209,93,0,0 ; mulps 0x5dd1(%edx),%xmm2 DB 141,112,8 ; lea 0x8(%eax),%esi DB 131,236,8 ; sub $0x8,%esp - DB 15,40,154,112,93,0,0 ; movaps 0x5d70(%edx),%xmm3 + DB 15,40,154,225,93,0,0 ; movaps 0x5de1(%edx),%xmm3 DB 86 ; push %esi DB 81 ; push %ecx DB 255,80,4 ; call *0x4(%eax) @@ -48991,22 +49467,22 @@ _sk_load_565_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,46 ; je 4124 <_sk_load_565_sse2+0xc2> + DB 116,46 ; je 42a3 <_sk_load_565_sse2+0xc2> DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 4112 <_sk_load_565_sse2+0xb0> + DB 116,19 ; je 4291 <_sk_load_565_sse2+0xb0> DB 128,251,3 ; cmp $0x3,%bl - DB 117,146 ; jne 4096 <_sk_load_565_sse2+0x34> + DB 117,146 ; jne 4215 <_sk_load_565_sse2+0x34> DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx DB 102,15,110,195 ; movd %ebx,%xmm0 DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2 DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 DB 242,15,16,208 ; movsd %xmm0,%xmm2 - DB 233,114,255,255,255 ; jmp 4096 <_sk_load_565_sse2+0x34> + DB 233,114,255,255,255 ; jmp 4215 <_sk_load_565_sse2+0x34> DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi DB 102,15,110,214 ; movd %esi,%xmm2 - DB 233,101,255,255,255 ; jmp 4096 <_sk_load_565_sse2+0x34> + DB 233,101,255,255,255 ; jmp 4215 <_sk_load_565_sse2+0x34> PUBLIC _sk_load_565_dst_sse2 _sk_load_565_dst_sse2 LABEL PROC @@ -49016,7 +49492,7 @@ _sk_load_565_dst_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 413f <_sk_load_565_dst_sse2+0xe> + DB 232,0,0,0,0 ; call 42be <_sk_load_565_dst_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49028,24 +49504,24 @@ _sk_load_565_dst_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,113 ; jne 41cd <_sk_load_565_dst_sse2+0x9c> + DB 117,113 ; jne 434c <_sk_load_565_dst_sse2+0x9c> DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,111,170,177,92,0,0 ; movdqa 0x5cb1(%edx),%xmm5 + DB 102,15,111,170,34,93,0,0 ; movdqa 0x5d22(%edx),%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,170,193,92,0,0 ; mulps 0x5cc1(%edx),%xmm5 + DB 15,89,170,50,93,0,0 ; mulps 0x5d32(%edx),%xmm5 DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx) - DB 102,15,111,170,209,92,0,0 ; movdqa 0x5cd1(%edx),%xmm5 + DB 102,15,111,170,66,93,0,0 ; movdqa 0x5d42(%edx),%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,170,225,92,0,0 ; mulps 0x5ce1(%edx),%xmm5 + DB 15,89,170,82,93,0,0 ; mulps 0x5d52(%edx),%xmm5 DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx) - DB 102,15,219,162,241,92,0,0 ; pand 0x5cf1(%edx),%xmm4 + DB 102,15,219,162,98,93,0,0 ; pand 0x5d62(%edx),%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,162,1,93,0,0 ; mulps 0x5d01(%edx),%xmm4 + DB 15,89,162,114,93,0,0 ; mulps 0x5d72(%edx),%xmm4 DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx) - DB 15,40,162,17,93,0,0 ; movaps 0x5d11(%edx),%xmm4 + DB 15,40,162,130,93,0,0 ; movaps 0x5d82(%edx),%xmm4 DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx) DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp @@ -49060,22 +49536,22 @@ _sk_load_565_dst_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,46 ; je 4203 <_sk_load_565_dst_sse2+0xd2> + DB 116,46 ; je 4382 <_sk_load_565_dst_sse2+0xd2> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 41f1 <_sk_load_565_dst_sse2+0xc0> + DB 116,19 ; je 4370 <_sk_load_565_dst_sse2+0xc0> DB 128,251,3 ; cmp $0x3,%bl - DB 117,130 ; jne 4165 <_sk_load_565_dst_sse2+0x34> + DB 117,130 ; jne 42e4 <_sk_load_565_dst_sse2+0x34> DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx DB 102,15,110,227 ; movd %ebx,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 233,98,255,255,255 ; jmp 4165 <_sk_load_565_dst_sse2+0x34> + DB 233,98,255,255,255 ; jmp 42e4 <_sk_load_565_dst_sse2+0x34> DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi DB 102,15,110,230 ; movd %esi,%xmm4 - DB 233,85,255,255,255 ; jmp 4165 <_sk_load_565_dst_sse2+0x34> + DB 233,85,255,255,255 ; jmp 42e4 <_sk_load_565_dst_sse2+0x34> PUBLIC _sk_gather_565_sse2 _sk_gather_565_sse2 LABEL PROC @@ -49108,25 +49584,25 @@ _sk_gather_565_sse2 LABEL PROC DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2 DB 102,15,126,193 ; movd %xmm0,%ecx DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx - DB 232,0,0,0,0 ; call 428b <_sk_gather_565_sse2+0x7b> + DB 232,0,0,0,0 ; call 440a <_sk_gather_565_sse2+0x7b> DB 90 ; pop %edx DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,130,213,91,0,0 ; movdqa 0x5bd5(%edx),%xmm0 + DB 102,15,111,130,70,92,0,0 ; movdqa 0x5c46(%edx),%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,130,229,91,0,0 ; mulps 0x5be5(%edx),%xmm0 - DB 102,15,111,138,245,91,0,0 ; movdqa 0x5bf5(%edx),%xmm1 + DB 15,89,130,86,92,0,0 ; mulps 0x5c56(%edx),%xmm0 + DB 102,15,111,138,102,92,0,0 ; movdqa 0x5c66(%edx),%xmm1 DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,138,5,92,0,0 ; mulps 0x5c05(%edx),%xmm1 - DB 102,15,219,146,21,92,0,0 ; pand 0x5c15(%edx),%xmm2 + DB 15,89,138,118,92,0,0 ; mulps 0x5c76(%edx),%xmm1 + DB 102,15,219,146,134,92,0,0 ; pand 0x5c86(%edx),%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,146,37,92,0,0 ; mulps 0x5c25(%edx),%xmm2 + DB 15,89,146,150,92,0,0 ; mulps 0x5c96(%edx),%xmm2 DB 141,72,8 ; lea 0x8(%eax),%ecx DB 131,236,8 ; sub $0x8,%esp - DB 15,40,154,53,92,0,0 ; movaps 0x5c35(%edx),%xmm3 + DB 15,40,154,166,92,0,0 ; movaps 0x5ca6(%edx),%xmm3 DB 81 ; push %ecx DB 255,117,8 ; pushl 0x8(%ebp) DB 255,80,4 ; call *0x4(%eax) @@ -49142,7 +49618,7 @@ _sk_store_565_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 42fe <_sk_store_565_sse2+0xe> + DB 232,0,0,0,0 ; call 447d <_sk_store_565_sse2+0xe> DB 95 ; pop %edi DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49152,8 +49628,8 @@ _sk_store_565_sse2 LABEL PROC DB 1,210 ; add %edx,%edx DB 3,22 ; add (%esi),%edx DB 139,49 ; mov (%ecx),%esi - DB 15,40,167,210,91,0,0 ; movaps 0x5bd2(%edi),%xmm4 - DB 15,40,175,226,91,0,0 ; movaps 0x5be2(%edi),%xmm5 + DB 15,40,167,67,92,0,0 ; movaps 0x5c43(%edi),%xmm4 + DB 15,40,175,83,92,0,0 ; movaps 0x5c53(%edi),%xmm5 DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 15,40,240 ; movaps %xmm0,%xmm6 DB 15,89,244 ; mulps %xmm4,%xmm6 @@ -49173,7 +49649,7 @@ _sk_store_565_sse2 LABEL PROC DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5 DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp) DB 133,219 ; test %ebx,%ebx - DB 117,34 ; jne 4392 <_sk_store_565_sse2+0xa2> + DB 117,34 ; jne 4511 <_sk_store_565_sse2+0xa2> DB 102,15,126,231 ; movd %xmm4,%edi DB 102,15,126,235 ; movd %xmm5,%ebx DB 137,60,114 ; mov %edi,(%edx,%esi,2) @@ -49193,20 +49669,20 @@ _sk_store_565_sse2 LABEL PROC DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,37 ; je 43c8 <_sk_store_565_sse2+0xd8> + DB 116,37 ; je 4547 <_sk_store_565_sse2+0xd8> DB 128,251,2 ; cmp $0x2,%bl - DB 116,15 ; je 43b7 <_sk_store_565_sse2+0xc7> + DB 116,15 ; je 4536 <_sk_store_565_sse2+0xc7> DB 128,251,3 ; cmp $0x3,%bl - DB 117,210 ; jne 437f <_sk_store_565_sse2+0x8f> + DB 117,210 ; jne 44fe <_sk_store_565_sse2+0x8f> DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2) DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4 DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4 DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2) - DB 235,183 ; jmp 437f <_sk_store_565_sse2+0x8f> + DB 235,183 ; jmp 44fe <_sk_store_565_sse2+0x8f> DB 102,15,126,231 ; movd %xmm4,%edi DB 102,137,60,114 ; mov %di,(%edx,%esi,2) - DB 235,173 ; jmp 437f <_sk_store_565_sse2+0x8f> + DB 235,173 ; jmp 44fe <_sk_store_565_sse2+0x8f> PUBLIC _sk_load_4444_sse2 _sk_load_4444_sse2 LABEL PROC @@ -49216,7 +49692,7 @@ _sk_load_4444_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 43e0 <_sk_load_4444_sse2+0xe> + DB 232,0,0,0,0 ; call 455f <_sk_load_4444_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49228,24 +49704,24 @@ _sk_load_4444_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,112 ; jne 446d <_sk_load_4444_sse2+0x9b> + DB 117,112 ; jne 45ec <_sk_load_4444_sse2+0x9b> DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,130,16,91,0,0 ; movdqa 0x5b10(%edx),%xmm0 + DB 102,15,111,130,129,91,0,0 ; movdqa 0x5b81(%edx),%xmm0 DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,130,32,91,0,0 ; mulps 0x5b20(%edx),%xmm0 - DB 102,15,111,138,48,91,0,0 ; movdqa 0x5b30(%edx),%xmm1 + DB 15,89,130,145,91,0,0 ; mulps 0x5b91(%edx),%xmm0 + DB 102,15,111,138,161,91,0,0 ; movdqa 0x5ba1(%edx),%xmm1 DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,138,64,91,0,0 ; mulps 0x5b40(%edx),%xmm1 - DB 102,15,111,146,80,91,0,0 ; movdqa 0x5b50(%edx),%xmm2 + DB 15,89,138,177,91,0,0 ; mulps 0x5bb1(%edx),%xmm1 + DB 102,15,111,146,193,91,0,0 ; movdqa 0x5bc1(%edx),%xmm2 DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,146,96,91,0,0 ; mulps 0x5b60(%edx),%xmm2 - DB 102,15,219,154,112,91,0,0 ; pand 0x5b70(%edx),%xmm3 + DB 15,89,146,209,91,0,0 ; mulps 0x5bd1(%edx),%xmm2 + DB 102,15,219,154,225,91,0,0 ; pand 0x5be1(%edx),%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,154,128,91,0,0 ; mulps 0x5b80(%edx),%xmm3 + DB 15,89,154,241,91,0,0 ; mulps 0x5bf1(%edx),%xmm3 DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp DB 82 ; push %edx @@ -49259,22 +49735,22 @@ _sk_load_4444_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,46 ; je 44a3 <_sk_load_4444_sse2+0xd1> + DB 116,46 ; je 4622 <_sk_load_4444_sse2+0xd1> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 128,251,2 ; cmp $0x2,%bl - DB 116,19 ; je 4491 <_sk_load_4444_sse2+0xbf> + DB 116,19 ; je 4610 <_sk_load_4444_sse2+0xbf> DB 128,251,3 ; cmp $0x3,%bl - DB 117,131 ; jne 4406 <_sk_load_4444_sse2+0x34> + DB 117,131 ; jne 4585 <_sk_load_4444_sse2+0x34> DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx DB 102,15,110,195 ; movd %ebx,%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 DB 242,15,16,216 ; movsd %xmm0,%xmm3 - DB 233,99,255,255,255 ; jmp 4406 <_sk_load_4444_sse2+0x34> + DB 233,99,255,255,255 ; jmp 4585 <_sk_load_4444_sse2+0x34> DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi DB 102,15,110,222 ; movd %esi,%xmm3 - DB 233,86,255,255,255 ; jmp 4406 <_sk_load_4444_sse2+0x34> + DB 233,86,255,255,255 ; jmp 4585 <_sk_load_4444_sse2+0x34> PUBLIC _sk_load_4444_dst_sse2 _sk_load_4444_dst_sse2 LABEL PROC @@ -49284,7 +49760,7 @@ _sk_load_4444_dst_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 44be <_sk_load_4444_dst_sse2+0xe> + DB 232,0,0,0,0 ; call 463d <_sk_load_4444_dst_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49296,27 +49772,27 @@ _sk_load_4444_dst_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 15,133,128,0,0,0 ; jne 455f <_sk_load_4444_dst_sse2+0xaf> + DB 15,133,128,0,0,0 ; jne 46de <_sk_load_4444_dst_sse2+0xaf> DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,111,170,178,90,0,0 ; movdqa 0x5ab2(%edx),%xmm5 + DB 102,15,111,170,35,91,0,0 ; movdqa 0x5b23(%edx),%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,170,194,90,0,0 ; mulps 0x5ac2(%edx),%xmm5 + DB 15,89,170,51,91,0,0 ; mulps 0x5b33(%edx),%xmm5 DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx) - DB 102,15,111,170,210,90,0,0 ; movdqa 0x5ad2(%edx),%xmm5 + DB 102,15,111,170,67,91,0,0 ; movdqa 0x5b43(%edx),%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,170,226,90,0,0 ; mulps 0x5ae2(%edx),%xmm5 + DB 15,89,170,83,91,0,0 ; mulps 0x5b53(%edx),%xmm5 DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx) - DB 102,15,111,170,242,90,0,0 ; movdqa 0x5af2(%edx),%xmm5 + DB 102,15,111,170,99,91,0,0 ; movdqa 0x5b63(%edx),%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,170,2,91,0,0 ; mulps 0x5b02(%edx),%xmm5 + DB 15,89,170,115,91,0,0 ; mulps 0x5b73(%edx),%xmm5 DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx) - DB 102,15,219,162,18,91,0,0 ; pand 0x5b12(%edx),%xmm4 + DB 102,15,219,162,131,91,0,0 ; pand 0x5b83(%edx),%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,162,34,91,0,0 ; mulps 0x5b22(%edx),%xmm4 + DB 15,89,162,147,91,0,0 ; mulps 0x5b93(%edx),%xmm4 DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx) DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp @@ -49331,22 +49807,22 @@ _sk_load_4444_dst_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,50 ; je 4599 <_sk_load_4444_dst_sse2+0xe9> + DB 116,50 ; je 4718 <_sk_load_4444_dst_sse2+0xe9> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 128,251,2 ; cmp $0x2,%bl - DB 116,23 ; je 4587 <_sk_load_4444_dst_sse2+0xd7> + DB 116,23 ; je 4706 <_sk_load_4444_dst_sse2+0xd7> DB 128,251,3 ; cmp $0x3,%bl - DB 15,133,111,255,255,255 ; jne 44e8 <_sk_load_4444_dst_sse2+0x38> + DB 15,133,111,255,255,255 ; jne 4667 <_sk_load_4444_dst_sse2+0x38> DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx DB 102,15,110,227 ; movd %ebx,%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5 DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5 DB 242,15,16,229 ; movsd %xmm5,%xmm4 - DB 233,79,255,255,255 ; jmp 44e8 <_sk_load_4444_dst_sse2+0x38> + DB 233,79,255,255,255 ; jmp 4667 <_sk_load_4444_dst_sse2+0x38> DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi DB 102,15,110,230 ; movd %esi,%xmm4 - DB 233,66,255,255,255 ; jmp 44e8 <_sk_load_4444_dst_sse2+0x38> + DB 233,66,255,255,255 ; jmp 4667 <_sk_load_4444_dst_sse2+0x38> PUBLIC _sk_gather_4444_sse2 _sk_gather_4444_sse2 LABEL PROC @@ -49380,25 +49856,25 @@ _sk_gather_4444_sse2 LABEL PROC DB 102,15,126,193 ; movd %xmm0,%ecx DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx DB 102,15,196,217,3 ; pinsrw $0x3,%ecx,%xmm3 - DB 232,0,0,0,0 ; call 4626 <_sk_gather_4444_sse2+0x80> + DB 232,0,0,0,0 ; call 47a5 <_sk_gather_4444_sse2+0x80> DB 89 ; pop %ecx DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,129,202,89,0,0 ; movdqa 0x59ca(%ecx),%xmm0 + DB 102,15,111,129,59,90,0,0 ; movdqa 0x5a3b(%ecx),%xmm0 DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,129,218,89,0,0 ; mulps 0x59da(%ecx),%xmm0 - DB 102,15,111,137,234,89,0,0 ; movdqa 0x59ea(%ecx),%xmm1 + DB 15,89,129,75,90,0,0 ; mulps 0x5a4b(%ecx),%xmm0 + DB 102,15,111,137,91,90,0,0 ; movdqa 0x5a5b(%ecx),%xmm1 DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,137,250,89,0,0 ; mulps 0x59fa(%ecx),%xmm1 - DB 102,15,111,145,10,90,0,0 ; movdqa 0x5a0a(%ecx),%xmm2 + DB 15,89,137,107,90,0,0 ; mulps 0x5a6b(%ecx),%xmm1 + DB 102,15,111,145,123,90,0,0 ; movdqa 0x5a7b(%ecx),%xmm2 DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,145,26,90,0,0 ; mulps 0x5a1a(%ecx),%xmm2 - DB 102,15,219,153,42,90,0,0 ; pand 0x5a2a(%ecx),%xmm3 + DB 15,89,145,139,90,0,0 ; mulps 0x5a8b(%ecx),%xmm2 + DB 102,15,219,153,155,90,0,0 ; pand 0x5a9b(%ecx),%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,153,58,90,0,0 ; mulps 0x5a3a(%ecx),%xmm3 + DB 15,89,153,171,90,0,0 ; mulps 0x5aab(%ecx),%xmm3 DB 141,72,8 ; lea 0x8(%eax),%ecx DB 131,236,8 ; sub $0x8,%esp DB 81 ; push %ecx @@ -49416,7 +49892,7 @@ _sk_store_4444_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 46a3 <_sk_store_4444_sse2+0xe> + DB 232,0,0,0,0 ; call 4822 <_sk_store_4444_sse2+0xe> DB 95 ; pop %edi DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49426,7 +49902,7 @@ _sk_store_4444_sse2 LABEL PROC DB 1,210 ; add %edx,%edx DB 3,22 ; add (%esi),%edx DB 139,49 ; mov (%ecx),%esi - DB 15,40,167,205,89,0,0 ; movaps 0x59cd(%edi),%xmm4 + DB 15,40,167,62,90,0,0 ; movaps 0x5a3e(%edi),%xmm4 DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 15,40,232 ; movaps %xmm0,%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 @@ -49452,7 +49928,7 @@ _sk_store_4444_sse2 LABEL PROC DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5 DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp) DB 133,219 ; test %ebx,%ebx - DB 117,34 ; jne 4746 <_sk_store_4444_sse2+0xb1> + DB 117,34 ; jne 48c5 <_sk_store_4444_sse2+0xb1> DB 102,15,126,231 ; movd %xmm4,%edi DB 102,15,126,235 ; movd %xmm5,%ebx DB 137,60,114 ; mov %edi,(%edx,%esi,2) @@ -49472,20 +49948,20 @@ _sk_store_4444_sse2 LABEL PROC DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,37 ; je 477c <_sk_store_4444_sse2+0xe7> + DB 116,37 ; je 48fb <_sk_store_4444_sse2+0xe7> DB 128,251,2 ; cmp $0x2,%bl - DB 116,15 ; je 476b <_sk_store_4444_sse2+0xd6> + DB 116,15 ; je 48ea <_sk_store_4444_sse2+0xd6> DB 128,251,3 ; cmp $0x3,%bl - DB 117,210 ; jne 4733 <_sk_store_4444_sse2+0x9e> + DB 117,210 ; jne 48b2 <_sk_store_4444_sse2+0x9e> DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2) DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4 DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4 DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2) - DB 235,183 ; jmp 4733 <_sk_store_4444_sse2+0x9e> + DB 235,183 ; jmp 48b2 <_sk_store_4444_sse2+0x9e> DB 102,15,126,231 ; movd %xmm4,%edi DB 102,137,60,114 ; mov %di,(%edx,%esi,2) - DB 235,173 ; jmp 4733 <_sk_store_4444_sse2+0x9e> + DB 235,173 ; jmp 48b2 <_sk_store_4444_sse2+0x9e> PUBLIC _sk_load_8888_sse2 _sk_load_8888_sse2 LABEL PROC @@ -49495,7 +49971,7 @@ _sk_load_8888_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 4794 <_sk_load_8888_sse2+0xe> + DB 232,0,0,0,0 ; call 4913 <_sk_load_8888_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49507,13 +49983,13 @@ _sk_load_8888_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,102 ; jne 4818 <_sk_load_8888_sse2+0x92> + DB 117,102 ; jne 4997 <_sk_load_8888_sse2+0x92> DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3 - DB 102,15,111,146,236,88,0,0 ; movdqa 0x58ec(%edx),%xmm2 + DB 102,15,111,146,93,89,0,0 ; movdqa 0x595d(%edx),%xmm2 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,40,162,252,88,0,0 ; movaps 0x58fc(%edx),%xmm4 + DB 15,40,162,109,89,0,0 ; movaps 0x596d(%edx),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -49541,18 +50017,18 @@ _sk_load_8888_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,35 ; je 4843 <_sk_load_8888_sse2+0xbd> + DB 116,35 ; je 49c2 <_sk_load_8888_sse2+0xbd> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 128,251,2 ; cmp $0x2,%bl - DB 116,16 ; je 4839 <_sk_load_8888_sse2+0xb3> + DB 116,16 ; je 49b8 <_sk_load_8888_sse2+0xb3> DB 128,251,3 ; cmp $0x3,%bl - DB 117,137 ; jne 47b7 <_sk_load_8888_sse2+0x31> + DB 117,137 ; jne 4936 <_sk_load_8888_sse2+0x31> DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3 - DB 233,116,255,255,255 ; jmp 47b7 <_sk_load_8888_sse2+0x31> + DB 233,116,255,255,255 ; jmp 4936 <_sk_load_8888_sse2+0x31> DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3 - DB 233,106,255,255,255 ; jmp 47b7 <_sk_load_8888_sse2+0x31> + DB 233,106,255,255,255 ; jmp 4936 <_sk_load_8888_sse2+0x31> PUBLIC _sk_load_8888_dst_sse2 _sk_load_8888_dst_sse2 LABEL PROC @@ -49562,7 +50038,7 @@ _sk_load_8888_dst_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 485b <_sk_load_8888_dst_sse2+0xe> + DB 232,0,0,0,0 ; call 49da <_sk_load_8888_dst_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49574,13 +50050,13 @@ _sk_load_8888_dst_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,118 ; jne 48ef <_sk_load_8888_dst_sse2+0xa2> + DB 117,118 ; jne 4a6e <_sk_load_8888_dst_sse2+0xa2> DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4 - DB 102,15,111,170,69,88,0,0 ; movdqa 0x5845(%edx),%xmm5 + DB 102,15,111,170,182,88,0,0 ; movdqa 0x58b6(%edx),%xmm5 DB 102,15,111,244 ; movdqa %xmm4,%xmm6 DB 102,15,219,245 ; pand %xmm5,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,40,186,85,88,0,0 ; movaps 0x5855(%edx),%xmm7 + DB 15,40,186,198,88,0,0 ; movaps 0x58c6(%edx),%xmm7 DB 15,89,247 ; mulps %xmm7,%xmm6 DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx) DB 102,15,111,244 ; movdqa %xmm4,%xmm6 @@ -49612,18 +50088,18 @@ _sk_load_8888_dst_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,39 ; je 491e <_sk_load_8888_dst_sse2+0xd1> + DB 116,39 ; je 4a9d <_sk_load_8888_dst_sse2+0xd1> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 128,251,2 ; cmp $0x2,%bl - DB 116,20 ; je 4914 <_sk_load_8888_dst_sse2+0xc7> + DB 116,20 ; je 4a93 <_sk_load_8888_dst_sse2+0xc7> DB 128,251,3 ; cmp $0x3,%bl - DB 15,133,117,255,255,255 ; jne 487e <_sk_load_8888_dst_sse2+0x31> + DB 15,133,117,255,255,255 ; jne 49fd <_sk_load_8888_dst_sse2+0x31> DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4 - DB 233,96,255,255,255 ; jmp 487e <_sk_load_8888_dst_sse2+0x31> + DB 233,96,255,255,255 ; jmp 49fd <_sk_load_8888_dst_sse2+0x31> DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4 - DB 233,86,255,255,255 ; jmp 487e <_sk_load_8888_dst_sse2+0x31> + DB 233,86,255,255,255 ; jmp 49fd <_sk_load_8888_dst_sse2+0x31> PUBLIC _sk_gather_8888_sse2 _sk_gather_8888_sse2 LABEL PROC @@ -49655,16 +50131,16 @@ _sk_gather_8888_sse2 LABEL PROC DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3 DB 102,15,126,193 ; movd %xmm0,%ecx DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0 - DB 232,0,0,0,0 ; call 499e <_sk_gather_8888_sse2+0x76> + DB 232,0,0,0,0 ; call 4b1d <_sk_gather_8888_sse2+0x76> DB 89 ; pop %ecx DB 102,15,98,202 ; punpckldq %xmm2,%xmm1 DB 102,15,98,216 ; punpckldq %xmm0,%xmm3 DB 102,15,98,217 ; punpckldq %xmm1,%xmm3 - DB 102,15,111,145,34,87,0,0 ; movdqa 0x5722(%ecx),%xmm2 + DB 102,15,111,145,147,87,0,0 ; movdqa 0x5793(%ecx),%xmm2 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,40,161,50,87,0,0 ; movaps 0x5732(%ecx),%xmm4 + DB 15,40,161,163,87,0,0 ; movaps 0x57a3(%ecx),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -49696,7 +50172,7 @@ _sk_store_8888_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 4a19 <_sk_store_8888_sse2+0xe> + DB 232,0,0,0,0 ; call 4b98 <_sk_store_8888_sse2+0xe> DB 95 ; pop %edi DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49706,7 +50182,7 @@ _sk_store_8888_sse2 LABEL PROC DB 193,226,2 ; shl $0x2,%edx DB 3,22 ; add (%esi),%edx DB 139,49 ; mov (%ecx),%esi - DB 15,40,167,199,86,0,0 ; movaps 0x56c7(%edi),%xmm4 + DB 15,40,167,56,87,0,0 ; movaps 0x5738(%edi),%xmm4 DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 15,40,232 ; movaps %xmm0,%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 @@ -49726,7 +50202,7 @@ _sk_store_8888_sse2 LABEL PROC DB 102,15,235,229 ; por %xmm5,%xmm4 DB 102,15,235,230 ; por %xmm6,%xmm4 DB 133,219 ; test %ebx,%ebx - DB 117,24 ; jne 4a96 <_sk_store_8888_sse2+0x8b> + DB 117,24 ; jne 4c15 <_sk_store_8888_sse2+0x8b> DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4) DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp @@ -49741,17 +50217,17 @@ _sk_store_8888_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,28 ; je 4aba <_sk_store_8888_sse2+0xaf> + DB 116,28 ; je 4c39 <_sk_store_8888_sse2+0xaf> DB 128,251,2 ; cmp $0x2,%bl - DB 116,16 ; je 4ab3 <_sk_store_8888_sse2+0xa8> + DB 116,16 ; je 4c32 <_sk_store_8888_sse2+0xa8> DB 128,251,3 ; cmp $0x3,%bl - DB 117,219 ; jne 4a83 <_sk_store_8888_sse2+0x78> + DB 117,219 ; jne 4c02 <_sk_store_8888_sse2+0x78> DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5 DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4) DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4) - DB 235,201 ; jmp 4a83 <_sk_store_8888_sse2+0x78> + DB 235,201 ; jmp 4c02 <_sk_store_8888_sse2+0x78> DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4) - DB 235,194 ; jmp 4a83 <_sk_store_8888_sse2+0x78> + DB 235,194 ; jmp 4c02 <_sk_store_8888_sse2+0x78> PUBLIC _sk_load_bgra_sse2 _sk_load_bgra_sse2 LABEL PROC @@ -49761,7 +50237,7 @@ _sk_load_bgra_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 4acf <_sk_load_bgra_sse2+0xe> + DB 232,0,0,0,0 ; call 4c4e <_sk_load_bgra_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49773,13 +50249,13 @@ _sk_load_bgra_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,102 ; jne 4b53 <_sk_load_bgra_sse2+0x92> + DB 117,102 ; jne 4cd2 <_sk_load_bgra_sse2+0x92> DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3 - DB 102,15,111,130,33,86,0,0 ; movdqa 0x5621(%edx),%xmm0 + DB 102,15,111,130,146,86,0,0 ; movdqa 0x5692(%edx),%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,219,200 ; pand %xmm0,%xmm1 DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2 - DB 15,40,162,49,86,0,0 ; movaps 0x5631(%edx),%xmm4 + DB 15,40,162,162,86,0,0 ; movaps 0x56a2(%edx),%xmm4 DB 15,89,212 ; mulps %xmm4,%xmm2 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -49807,18 +50283,18 @@ _sk_load_bgra_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,35 ; je 4b7e <_sk_load_bgra_sse2+0xbd> + DB 116,35 ; je 4cfd <_sk_load_bgra_sse2+0xbd> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 128,251,2 ; cmp $0x2,%bl - DB 116,16 ; je 4b74 <_sk_load_bgra_sse2+0xb3> + DB 116,16 ; je 4cf3 <_sk_load_bgra_sse2+0xb3> DB 128,251,3 ; cmp $0x3,%bl - DB 117,137 ; jne 4af2 <_sk_load_bgra_sse2+0x31> + DB 117,137 ; jne 4c71 <_sk_load_bgra_sse2+0x31> DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3 - DB 233,116,255,255,255 ; jmp 4af2 <_sk_load_bgra_sse2+0x31> + DB 233,116,255,255,255 ; jmp 4c71 <_sk_load_bgra_sse2+0x31> DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3 - DB 233,106,255,255,255 ; jmp 4af2 <_sk_load_bgra_sse2+0x31> + DB 233,106,255,255,255 ; jmp 4c71 <_sk_load_bgra_sse2+0x31> PUBLIC _sk_load_bgra_dst_sse2 _sk_load_bgra_dst_sse2 LABEL PROC @@ -49828,7 +50304,7 @@ _sk_load_bgra_dst_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 4b96 <_sk_load_bgra_dst_sse2+0xe> + DB 232,0,0,0,0 ; call 4d15 <_sk_load_bgra_dst_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49840,13 +50316,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 117,118 ; jne 4c2a <_sk_load_bgra_dst_sse2+0xa2> + DB 117,118 ; jne 4da9 <_sk_load_bgra_dst_sse2+0xa2> DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4 - DB 102,15,111,170,122,85,0,0 ; movdqa 0x557a(%edx),%xmm5 + DB 102,15,111,170,235,85,0,0 ; movdqa 0x55eb(%edx),%xmm5 DB 102,15,111,244 ; movdqa %xmm4,%xmm6 DB 102,15,219,245 ; pand %xmm5,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,40,186,138,85,0,0 ; movaps 0x558a(%edx),%xmm7 + DB 15,40,186,251,85,0,0 ; movaps 0x55fb(%edx),%xmm7 DB 15,89,247 ; mulps %xmm7,%xmm6 DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx) DB 102,15,111,244 ; movdqa %xmm4,%xmm6 @@ -49878,18 +50354,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,39 ; je 4c59 <_sk_load_bgra_dst_sse2+0xd1> + DB 116,39 ; je 4dd8 <_sk_load_bgra_dst_sse2+0xd1> DB 102,15,239,228 ; pxor %xmm4,%xmm4 DB 128,251,2 ; cmp $0x2,%bl - DB 116,20 ; je 4c4f <_sk_load_bgra_dst_sse2+0xc7> + DB 116,20 ; je 4dce <_sk_load_bgra_dst_sse2+0xc7> DB 128,251,3 ; cmp $0x3,%bl - DB 15,133,117,255,255,255 ; jne 4bb9 <_sk_load_bgra_dst_sse2+0x31> + DB 15,133,117,255,255,255 ; jne 4d38 <_sk_load_bgra_dst_sse2+0x31> DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4 DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4 DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4 - DB 233,96,255,255,255 ; jmp 4bb9 <_sk_load_bgra_dst_sse2+0x31> + DB 233,96,255,255,255 ; jmp 4d38 <_sk_load_bgra_dst_sse2+0x31> DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4 - DB 233,86,255,255,255 ; jmp 4bb9 <_sk_load_bgra_dst_sse2+0x31> + DB 233,86,255,255,255 ; jmp 4d38 <_sk_load_bgra_dst_sse2+0x31> PUBLIC _sk_gather_bgra_sse2 _sk_gather_bgra_sse2 LABEL PROC @@ -49921,16 +50397,16 @@ _sk_gather_bgra_sse2 LABEL PROC DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3 DB 102,15,126,193 ; movd %xmm0,%ecx DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0 - DB 232,0,0,0,0 ; call 4cd9 <_sk_gather_bgra_sse2+0x76> + DB 232,0,0,0,0 ; call 4e58 <_sk_gather_bgra_sse2+0x76> DB 89 ; pop %ecx DB 102,15,98,202 ; punpckldq %xmm2,%xmm1 DB 102,15,98,216 ; punpckldq %xmm0,%xmm3 DB 102,15,98,217 ; punpckldq %xmm1,%xmm3 - DB 102,15,111,129,87,84,0,0 ; movdqa 0x5457(%ecx),%xmm0 + DB 102,15,111,129,200,84,0,0 ; movdqa 0x54c8(%ecx),%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,219,200 ; pand %xmm0,%xmm1 DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2 - DB 15,40,161,103,84,0,0 ; movaps 0x5467(%ecx),%xmm4 + DB 15,40,161,216,84,0,0 ; movaps 0x54d8(%ecx),%xmm4 DB 15,89,212 ; mulps %xmm4,%xmm2 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -49962,7 +50438,7 @@ _sk_store_bgra_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,12 ; sub $0xc,%esp - DB 232,0,0,0,0 ; call 4d54 <_sk_store_bgra_sse2+0xe> + DB 232,0,0,0,0 ; call 4ed3 <_sk_store_bgra_sse2+0xe> DB 95 ; pop %edi DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -49972,7 +50448,7 @@ _sk_store_bgra_sse2 LABEL PROC DB 193,226,2 ; shl $0x2,%edx DB 3,22 ; add (%esi),%edx DB 139,49 ; mov (%ecx),%esi - DB 15,40,167,252,83,0,0 ; movaps 0x53fc(%edi),%xmm4 + DB 15,40,167,109,84,0,0 ; movaps 0x546d(%edi),%xmm4 DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 15,40,234 ; movaps %xmm2,%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 @@ -49992,7 +50468,7 @@ _sk_store_bgra_sse2 LABEL PROC DB 102,15,235,229 ; por %xmm5,%xmm4 DB 102,15,235,230 ; por %xmm6,%xmm4 DB 133,219 ; test %ebx,%ebx - DB 117,24 ; jne 4dd1 <_sk_store_bgra_sse2+0x8b> + DB 117,24 ; jne 4f50 <_sk_store_bgra_sse2+0x8b> DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4) DB 141,80,8 ; lea 0x8(%eax),%edx DB 131,236,8 ; sub $0x8,%esp @@ -50007,17 +50483,17 @@ _sk_store_bgra_sse2 LABEL PROC DB 195 ; ret DB 128,227,3 ; and $0x3,%bl DB 128,251,1 ; cmp $0x1,%bl - DB 116,28 ; je 4df5 <_sk_store_bgra_sse2+0xaf> + DB 116,28 ; je 4f74 <_sk_store_bgra_sse2+0xaf> DB 128,251,2 ; cmp $0x2,%bl - DB 116,16 ; je 4dee <_sk_store_bgra_sse2+0xa8> + DB 116,16 ; je 4f6d <_sk_store_bgra_sse2+0xa8> DB 128,251,3 ; cmp $0x3,%bl - DB 117,219 ; jne 4dbe <_sk_store_bgra_sse2+0x78> + DB 117,219 ; jne 4f3d <_sk_store_bgra_sse2+0x78> DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5 DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4) DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4) - DB 235,201 ; jmp 4dbe <_sk_store_bgra_sse2+0x78> + DB 235,201 ; jmp 4f3d <_sk_store_bgra_sse2+0x78> DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4) - DB 235,194 ; jmp 4dbe <_sk_store_bgra_sse2+0x78> + DB 235,194 ; jmp 4f3d <_sk_store_bgra_sse2+0x78> PUBLIC _sk_load_f16_sse2 _sk_load_f16_sse2 LABEL PROC @@ -50027,7 +50503,7 @@ _sk_load_f16_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,92 ; sub $0x5c,%esp - DB 232,0,0,0,0 ; call 4e0a <_sk_load_f16_sse2+0xe> + DB 232,0,0,0,0 ; call 4f89 <_sk_load_f16_sse2+0xe> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -50039,7 +50515,7 @@ _sk_load_f16_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 15,133,160,1,0,0 ; jne 4fcc <_sk_load_f16_sse2+0x1d0> + DB 15,133,160,1,0,0 ; jne 514b <_sk_load_f16_sse2+0x1d0> DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0 DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1 DB 102,15,40,216 ; movapd %xmm0,%xmm3 @@ -50067,7 +50543,7 @@ _sk_load_f16_sse2 LABEL PROC DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp) DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 - DB 102,15,111,154,86,83,0,0 ; movdqa 0x5356(%edx),%xmm3 + DB 102,15,111,154,199,83,0,0 ; movdqa 0x53c7(%edx),%xmm3 DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,15,219,227 ; pand %xmm3,%xmm4 DB 102,15,239,204 ; pxor %xmm4,%xmm1 @@ -50100,15 +50576,15 @@ _sk_load_f16_sse2 LABEL PROC DB 102,15,111,199 ; movdqa %xmm7,%xmm0 DB 102,15,114,240,13 ; pslld $0xd,%xmm0 DB 102,15,235,195 ; por %xmm3,%xmm0 - DB 102,15,111,154,102,83,0,0 ; movdqa 0x5366(%edx),%xmm3 + DB 102,15,111,154,215,83,0,0 ; movdqa 0x53d7(%edx),%xmm3 DB 102,15,254,211 ; paddd %xmm3,%xmm2 DB 102,15,254,243 ; paddd %xmm3,%xmm6 DB 102,15,254,235 ; paddd %xmm3,%xmm5 DB 102,15,254,195 ; paddd %xmm3,%xmm0 - DB 102,15,111,154,118,83,0,0 ; movdqa 0x5376(%edx),%xmm3 + DB 102,15,111,154,231,83,0,0 ; movdqa 0x53e7(%edx),%xmm3 DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp) DB 102,15,239,203 ; pxor %xmm3,%xmm1 - DB 102,15,111,154,134,83,0,0 ; movdqa 0x5386(%edx),%xmm3 + DB 102,15,111,154,247,83,0,0 ; movdqa 0x53f7(%edx),%xmm3 DB 102,15,111,227 ; movdqa %xmm3,%xmm4 DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4 DB 102,15,223,226 ; pandn %xmm2,%xmm4 @@ -50140,12 +50616,12 @@ _sk_load_f16_sse2 LABEL PROC DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 131,251,1 ; cmp $0x1,%ebx - DB 15,132,89,254,255,255 ; je 4e37 <_sk_load_f16_sse2+0x3b> + DB 15,132,89,254,255,255 ; je 4fb6 <_sk_load_f16_sse2+0x3b> DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0 DB 131,251,3 ; cmp $0x3,%ebx - DB 15,130,74,254,255,255 ; jb 4e37 <_sk_load_f16_sse2+0x3b> + DB 15,130,74,254,255,255 ; jb 4fb6 <_sk_load_f16_sse2+0x3b> DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1 - DB 233,63,254,255,255 ; jmp 4e37 <_sk_load_f16_sse2+0x3b> + DB 233,63,254,255,255 ; jmp 4fb6 <_sk_load_f16_sse2+0x3b> PUBLIC _sk_load_f16_dst_sse2 _sk_load_f16_dst_sse2 LABEL PROC @@ -50159,7 +50635,7 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 15,41,149,120,255,255,255 ; movaps %xmm2,-0x88(%ebp) DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp) DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp) - DB 232,0,0,0,0 ; call 5020 <_sk_load_f16_dst_sse2+0x28> + DB 232,0,0,0,0 ; call 519f <_sk_load_f16_dst_sse2+0x28> DB 90 ; pop %edx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,77,8 ; mov 0x8(%ebp),%ecx @@ -50171,7 +50647,7 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 133,219 ; test %ebx,%ebx DB 139,57 ; mov (%ecx),%edi - DB 15,133,206,1,0,0 ; jne 5210 <_sk_load_f16_dst_sse2+0x218> + DB 15,133,206,1,0,0 ; jne 538f <_sk_load_f16_dst_sse2+0x218> DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0 DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1 DB 102,15,40,208 ; movapd %xmm0,%xmm2 @@ -50199,7 +50675,7 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp) DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4 - DB 102,15,111,154,128,81,0,0 ; movdqa 0x5180(%edx),%xmm3 + DB 102,15,111,154,241,81,0,0 ; movdqa 0x51f1(%edx),%xmm3 DB 102,15,111,212 ; movdqa %xmm4,%xmm2 DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 102,15,239,226 ; pxor %xmm2,%xmm4 @@ -50207,13 +50683,13 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 102,15,111,204 ; movdqa %xmm4,%xmm1 DB 102,15,114,241,13 ; pslld $0xd,%xmm1 DB 102,15,235,202 ; por %xmm2,%xmm1 - DB 102,15,111,146,160,81,0,0 ; movdqa 0x51a0(%edx),%xmm2 + DB 102,15,111,146,17,82,0,0 ; movdqa 0x5211(%edx),%xmm2 DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp) DB 102,15,239,226 ; pxor %xmm2,%xmm4 - DB 102,15,111,178,176,81,0,0 ; movdqa 0x51b0(%edx),%xmm6 + DB 102,15,111,178,33,82,0,0 ; movdqa 0x5221(%edx),%xmm6 DB 102,15,111,254 ; movdqa %xmm6,%xmm7 DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7 - DB 102,15,111,146,144,81,0,0 ; movdqa 0x5190(%edx),%xmm2 + DB 102,15,111,146,1,82,0,0 ; movdqa 0x5201(%edx),%xmm2 DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp) DB 102,15,254,202 ; paddd %xmm2,%xmm1 DB 102,15,223,249 ; pandn %xmm1,%xmm7 @@ -50281,12 +50757,12 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 131,251,1 ; cmp $0x1,%ebx - DB 15,132,43,254,255,255 ; je 504d <_sk_load_f16_dst_sse2+0x55> + DB 15,132,43,254,255,255 ; je 51cc <_sk_load_f16_dst_sse2+0x55> DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0 DB 131,251,3 ; cmp $0x3,%ebx - DB 15,130,28,254,255,255 ; jb 504d <_sk_load_f16_dst_sse2+0x55> + DB 15,130,28,254,255,255 ; jb 51cc <_sk_load_f16_dst_sse2+0x55> DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1 - DB 233,17,254,255,255 ; jmp 504d <_sk_load_f16_dst_sse2+0x55> + DB 233,17,254,255,255 ; jmp 51cc <_sk_load_f16_dst_sse2+0x55> PUBLIC _sk_gather_f16_sse2 _sk_gather_f16_sse2 LABEL PROC @@ -50322,7 +50798,7 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,15,126,194 ; movd %xmm0,%edx DB 102,15,110,68,209,4 ; movd 0x4(%ecx,%edx,8),%xmm0 DB 102,15,110,60,209 ; movd (%ecx,%edx,8),%xmm7 - DB 232,0,0,0,0 ; call 52ca <_sk_gather_f16_sse2+0x8e> + DB 232,0,0,0,0 ; call 5449 <_sk_gather_f16_sse2+0x8e> DB 89 ; pop %ecx DB 102,15,98,202 ; punpckldq %xmm2,%xmm1 DB 102,15,98,227 ; punpckldq %xmm3,%xmm4 @@ -50355,7 +50831,7 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp) DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 - DB 102,15,111,153,22,79,0,0 ; movdqa 0x4f16(%ecx),%xmm3 + DB 102,15,111,153,135,79,0,0 ; movdqa 0x4f87(%ecx),%xmm3 DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,15,219,227 ; pand %xmm3,%xmm4 DB 102,15,239,204 ; pxor %xmm4,%xmm1 @@ -50388,15 +50864,15 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,15,111,199 ; movdqa %xmm7,%xmm0 DB 102,15,114,240,13 ; pslld $0xd,%xmm0 DB 102,15,235,195 ; por %xmm3,%xmm0 - DB 102,15,111,153,38,79,0,0 ; movdqa 0x4f26(%ecx),%xmm3 + DB 102,15,111,153,151,79,0,0 ; movdqa 0x4f97(%ecx),%xmm3 DB 102,15,254,211 ; paddd %xmm3,%xmm2 DB 102,15,254,243 ; paddd %xmm3,%xmm6 DB 102,15,254,235 ; paddd %xmm3,%xmm5 DB 102,15,254,195 ; paddd %xmm3,%xmm0 - DB 102,15,111,153,54,79,0,0 ; movdqa 0x4f36(%ecx),%xmm3 + DB 102,15,111,153,167,79,0,0 ; movdqa 0x4fa7(%ecx),%xmm3 DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp) DB 102,15,239,203 ; pxor %xmm3,%xmm1 - DB 102,15,111,153,70,79,0,0 ; movdqa 0x4f46(%ecx),%xmm3 + DB 102,15,111,153,183,79,0,0 ; movdqa 0x4fb7(%ecx),%xmm3 DB 102,15,111,227 ; movdqa %xmm3,%xmm4 DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4 DB 102,15,223,226 ; pandn %xmm2,%xmm4 @@ -50433,20 +50909,20 @@ _sk_store_f16_sse2 LABEL PROC DB 131,236,80 ; sub $0x50,%esp DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp) DB 102,15,111,218 ; movdqa %xmm2,%xmm3 - DB 232,0,0,0,0 ; call 548d <_sk_store_f16_sse2+0x15> + DB 232,0,0,0,0 ; call 560c <_sk_store_f16_sse2+0x15> DB 88 ; pop %eax - DB 102,15,111,176,147,77,0,0 ; movdqa 0x4d93(%eax),%xmm6 + DB 102,15,111,176,4,78,0,0 ; movdqa 0x4e04(%eax),%xmm6 DB 102,15,111,208 ; movdqa %xmm0,%xmm2 DB 102,15,219,214 ; pand %xmm6,%xmm2 DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp) DB 102,15,111,232 ; movdqa %xmm0,%xmm5 DB 102,15,239,234 ; pxor %xmm2,%xmm5 - DB 102,15,111,160,163,77,0,0 ; movdqa 0x4da3(%eax),%xmm4 + DB 102,15,111,160,20,78,0,0 ; movdqa 0x4e14(%eax),%xmm4 DB 102,15,114,210,16 ; psrld $0x10,%xmm2 DB 102,15,111,196 ; movdqa %xmm4,%xmm0 DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0 DB 102,15,114,213,13 ; psrld $0xd,%xmm5 - DB 102,15,111,184,179,77,0,0 ; movdqa 0x4db3(%eax),%xmm7 + DB 102,15,111,184,36,78,0,0 ; movdqa 0x4e24(%eax),%xmm7 DB 102,15,254,215 ; paddd %xmm7,%xmm2 DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp) DB 102,15,254,213 ; paddd %xmm5,%xmm2 @@ -50508,7 +50984,7 @@ _sk_store_f16_sse2 LABEL PROC DB 3,55 ; add (%edi),%esi DB 139,121,8 ; mov 0x8(%ecx),%edi DB 133,255 ; test %edi,%edi - DB 117,53 ; jne 55ff <_sk_store_f16_sse2+0x187> + DB 117,53 ; jne 577e <_sk_store_f16_sse2+0x187> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,15,98,197 ; punpckldq %xmm5,%xmm0 DB 243,15,127,4,214 ; movdqu %xmm0,(%esi,%edx,8) @@ -50531,13 +51007,13 @@ _sk_store_f16_sse2 LABEL PROC DB 102,15,98,213 ; punpckldq %xmm5,%xmm2 DB 102,15,214,20,214 ; movq %xmm2,(%esi,%edx,8) DB 131,255,1 ; cmp $0x1,%edi - DB 116,208 ; je 55e1 <_sk_store_f16_sse2+0x169> + DB 116,208 ; je 5760 <_sk_store_f16_sse2+0x169> DB 102,15,23,84,214,8 ; movhpd %xmm2,0x8(%esi,%edx,8) DB 131,255,3 ; cmp $0x3,%edi - DB 114,197 ; jb 55e1 <_sk_store_f16_sse2+0x169> + DB 114,197 ; jb 5760 <_sk_store_f16_sse2+0x169> DB 102,15,106,205 ; punpckhdq %xmm5,%xmm1 DB 102,15,214,76,214,16 ; movq %xmm1,0x10(%esi,%edx,8) - DB 235,185 ; jmp 55e1 <_sk_store_f16_sse2+0x169> + DB 235,185 ; jmp 5760 <_sk_store_f16_sse2+0x169> PUBLIC _sk_load_u16_be_sse2 _sk_load_u16_be_sse2 LABEL PROC @@ -50558,9 +51034,9 @@ _sk_load_u16_be_sse2 LABEL PROC DB 139,89,8 ; mov 0x8(%ecx),%ebx DB 193,230,2 ; shl $0x2,%esi DB 133,219 ; test %ebx,%ebx - DB 232,0,0,0,0 ; call 5653 <_sk_load_u16_be_sse2+0x2b> + DB 232,0,0,0,0 ; call 57d2 <_sk_load_u16_be_sse2+0x2b> DB 90 ; pop %edx - DB 15,133,11,1,0,0 ; jne 5765 <_sk_load_u16_be_sse2+0x13d> + DB 15,133,11,1,0,0 ; jne 58e4 <_sk_load_u16_be_sse2+0x13d> DB 102,15,16,4,119 ; movupd (%edi,%esi,2),%xmm0 DB 243,15,111,76,119,16 ; movdqu 0x10(%edi,%esi,2),%xmm1 DB 102,15,40,208 ; movapd %xmm0,%xmm2 @@ -50581,7 +51057,7 @@ _sk_load_u16_be_sse2 LABEL PROC DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,40,162,253,75,0,0 ; movaps 0x4bfd(%edx),%xmm4 + DB 15,40,162,110,76,0,0 ; movaps 0x4c6e(%edx),%xmm4 DB 15,89,196 ; mulps %xmm4,%xmm0 DB 102,15,111,205 ; movdqa %xmm5,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -50631,12 +51107,12 @@ _sk_load_u16_be_sse2 LABEL PROC DB 242,15,16,4,119 ; movsd (%edi,%esi,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 131,251,1 ; cmp $0x1,%ebx - DB 15,132,238,254,255,255 ; je 5665 <_sk_load_u16_be_sse2+0x3d> + DB 15,132,238,254,255,255 ; je 57e4 <_sk_load_u16_be_sse2+0x3d> DB 102,15,22,68,119,8 ; movhpd 0x8(%edi,%esi,2),%xmm0 DB 131,251,3 ; cmp $0x3,%ebx - DB 15,130,223,254,255,255 ; jb 5665 <_sk_load_u16_be_sse2+0x3d> + DB 15,130,223,254,255,255 ; jb 57e4 <_sk_load_u16_be_sse2+0x3d> DB 243,15,126,76,119,16 ; movq 0x10(%edi,%esi,2),%xmm1 - DB 233,212,254,255,255 ; jmp 5665 <_sk_load_u16_be_sse2+0x3d> + DB 233,212,254,255,255 ; jmp 57e4 <_sk_load_u16_be_sse2+0x3d> PUBLIC _sk_load_rgb_u16_be_sse2 _sk_load_rgb_u16_be_sse2 LABEL PROC @@ -50656,9 +51132,9 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 3,50 ; add (%edx),%esi DB 107,25,3 ; imul $0x3,(%ecx),%ebx DB 133,255 ; test %edi,%edi - DB 232,0,0,0,0 ; call 57ba <_sk_load_rgb_u16_be_sse2+0x29> + DB 232,0,0,0,0 ; call 5939 <_sk_load_rgb_u16_be_sse2+0x29> DB 90 ; pop %edx - DB 15,133,240,0,0,0 ; jne 58b1 <_sk_load_rgb_u16_be_sse2+0x120> + DB 15,133,240,0,0,0 ; jne 5a30 <_sk_load_rgb_u16_be_sse2+0x120> DB 243,15,111,20,94 ; movdqu (%esi,%ebx,2),%xmm2 DB 243,15,111,92,94,8 ; movdqu 0x8(%esi,%ebx,2),%xmm3 DB 102,15,115,219,4 ; psrldq $0x4,%xmm3 @@ -50683,7 +51159,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,40,170,166,74,0,0 ; movaps 0x4aa6(%edx),%xmm5 + DB 15,40,170,23,75,0,0 ; movaps 0x4b17(%edx),%xmm5 DB 15,89,197 ; mulps %xmm5,%xmm0 DB 102,15,111,204 ; movdqa %xmm4,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -50709,7 +51185,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 15,89,213 ; mulps %xmm5,%xmm2 DB 141,112,8 ; lea 0x8(%eax),%esi DB 131,236,8 ; sub $0x8,%esp - DB 15,40,154,182,74,0,0 ; movaps 0x4ab6(%edx),%xmm3 + DB 15,40,154,39,75,0,0 ; movaps 0x4b27(%edx),%xmm3 DB 86 ; push %esi DB 81 ; push %ecx DB 255,80,4 ; call *0x4(%eax) @@ -50723,20 +51199,20 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 102,15,196,84,94,4,2 ; pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 131,255,1 ; cmp $0x1,%edi - DB 117,13 ; jne 58d3 <_sk_load_rgb_u16_be_sse2+0x142> + DB 117,13 ; jne 5a52 <_sk_load_rgb_u16_be_sse2+0x142> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,16,255,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52> + DB 233,16,255,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52> DB 102,15,110,68,94,6 ; movd 0x6(%esi,%ebx,2),%xmm0 DB 102,15,196,68,94,10,2 ; pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 131,255,3 ; cmp $0x3,%edi - DB 114,18 ; jb 58fb <_sk_load_rgb_u16_be_sse2+0x16a> + DB 114,18 ; jb 5a7a <_sk_load_rgb_u16_be_sse2+0x16a> DB 102,15,110,92,94,12 ; movd 0xc(%esi,%ebx,2),%xmm3 DB 102,15,196,92,94,16,2 ; pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3 - DB 233,232,254,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52> + DB 233,232,254,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52> DB 102,15,239,219 ; pxor %xmm3,%xmm3 - DB 233,223,254,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52> + DB 233,223,254,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52> PUBLIC _sk_store_u16_be_sse2 _sk_store_u16_be_sse2 LABEL PROC @@ -50746,9 +51222,9 @@ _sk_store_u16_be_sse2 LABEL PROC DB 86 ; push %esi DB 131,236,16 ; sub $0x10,%esp DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) - DB 232,0,0,0,0 ; call 5915 <_sk_store_u16_be_sse2+0x11> + DB 232,0,0,0,0 ; call 5a94 <_sk_store_u16_be_sse2+0x11> DB 88 ; pop %eax - DB 15,40,176,107,73,0,0 ; movaps 0x496b(%eax),%xmm6 + DB 15,40,176,220,73,0,0 ; movaps 0x49dc(%eax),%xmm6 DB 15,40,224 ; movaps %xmm0,%xmm4 DB 15,89,230 ; mulps %xmm6,%xmm4 DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4 @@ -50801,7 +51277,7 @@ _sk_store_u16_be_sse2 LABEL PROC DB 139,121,8 ; mov 0x8(%ecx),%edi DB 193,226,2 ; shl $0x2,%edx DB 133,255 ; test %edi,%edi - DB 117,45 ; jne 5a17 <_sk_store_u16_be_sse2+0x113> + DB 117,45 ; jne 5b96 <_sk_store_u16_be_sse2+0x113> DB 102,15,111,220 ; movdqa %xmm4,%xmm3 DB 102,15,98,221 ; punpckldq %xmm5,%xmm3 DB 243,15,127,28,86 ; movdqu %xmm3,(%esi,%edx,2) @@ -50822,13 +51298,13 @@ _sk_store_u16_be_sse2 LABEL PROC DB 102,15,98,245 ; punpckldq %xmm5,%xmm6 DB 102,15,214,52,86 ; movq %xmm6,(%esi,%edx,2) DB 131,255,1 ; cmp $0x1,%edi - DB 116,216 ; je 5a01 <_sk_store_u16_be_sse2+0xfd> + DB 116,216 ; je 5b80 <_sk_store_u16_be_sse2+0xfd> DB 102,15,23,116,86,8 ; movhpd %xmm6,0x8(%esi,%edx,2) DB 131,255,3 ; cmp $0x3,%edi - DB 114,205 ; jb 5a01 <_sk_store_u16_be_sse2+0xfd> + DB 114,205 ; jb 5b80 <_sk_store_u16_be_sse2+0xfd> DB 102,15,106,229 ; punpckhdq %xmm5,%xmm4 DB 102,15,214,100,86,16 ; movq %xmm4,0x10(%esi,%edx,2) - DB 235,193 ; jmp 5a01 <_sk_store_u16_be_sse2+0xfd> + DB 235,193 ; jmp 5b80 <_sk_store_u16_be_sse2+0xfd> PUBLIC _sk_load_f32_sse2 _sk_load_f32_sse2 LABEL PROC @@ -50849,7 +51325,7 @@ _sk_load_f32_sse2 LABEL PROC DB 15,16,36,23 ; movups (%edi,%edx,1),%xmm4 DB 139,121,8 ; mov 0x8(%ecx),%edi DB 133,255 ; test %edi,%edi - DB 117,71 ; jne 5ab7 <_sk_load_f32_sse2+0x77> + DB 117,71 ; jne 5c36 <_sk_load_f32_sse2+0x77> DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2 DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3 DB 15,16,68,178,48 ; movups 0x30(%edx,%esi,4),%xmm0 @@ -50877,17 +51353,17 @@ _sk_load_f32_sse2 LABEL PROC DB 195 ; ret DB 15,87,192 ; xorps %xmm0,%xmm0 DB 131,255,1 ; cmp $0x1,%edi - DB 117,8 ; jne 5ac7 <_sk_load_f32_sse2+0x87> + DB 117,8 ; jne 5c46 <_sk_load_f32_sse2+0x87> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,210 ; xorps %xmm2,%xmm2 - DB 235,184 ; jmp 5a7f <_sk_load_f32_sse2+0x3f> + DB 235,184 ; jmp 5bfe <_sk_load_f32_sse2+0x3f> DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2 DB 131,255,3 ; cmp $0x3,%edi - DB 114,7 ; jb 5ad8 <_sk_load_f32_sse2+0x98> + DB 114,7 ; jb 5c57 <_sk_load_f32_sse2+0x98> DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3 - DB 235,167 ; jmp 5a7f <_sk_load_f32_sse2+0x3f> + DB 235,167 ; jmp 5bfe <_sk_load_f32_sse2+0x3f> DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 235,162 ; jmp 5a7f <_sk_load_f32_sse2+0x3f> + DB 235,162 ; jmp 5bfe <_sk_load_f32_sse2+0x3f> PUBLIC _sk_load_f32_dst_sse2 _sk_load_f32_dst_sse2 LABEL PROC @@ -50911,7 +51387,7 @@ _sk_load_f32_dst_sse2 LABEL PROC DB 15,16,52,23 ; movups (%edi,%edx,1),%xmm6 DB 139,121,8 ; mov 0x8(%ecx),%edi DB 133,255 ; test %edi,%edi - DB 117,97 ; jne 5b79 <_sk_load_f32_dst_sse2+0x9c> + DB 117,97 ; jne 5cf8 <_sk_load_f32_dst_sse2+0x9c> DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7 DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3 DB 15,16,84,178,48 ; movups 0x30(%edx,%esi,4),%xmm2 @@ -50945,17 +51421,17 @@ _sk_load_f32_dst_sse2 LABEL PROC DB 195 ; ret DB 15,87,210 ; xorps %xmm2,%xmm2 DB 131,255,1 ; cmp $0x1,%edi - DB 117,8 ; jne 5b89 <_sk_load_f32_dst_sse2+0xac> + DB 117,8 ; jne 5d08 <_sk_load_f32_dst_sse2+0xac> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,255 ; xorps %xmm7,%xmm7 - DB 235,158 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a> + DB 235,158 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a> DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7 DB 131,255,3 ; cmp $0x3,%edi - DB 114,7 ; jb 5b9a <_sk_load_f32_dst_sse2+0xbd> + DB 114,7 ; jb 5d19 <_sk_load_f32_dst_sse2+0xbd> DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3 - DB 235,141 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a> + DB 235,141 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a> DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 235,136 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a> + DB 235,136 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a> PUBLIC _sk_store_f32_sse2 _sk_store_f32_sse2 LABEL PROC @@ -50991,7 +51467,7 @@ _sk_store_f32_sse2 LABEL PROC DB 15,40,238 ; movaps %xmm6,%xmm5 DB 102,15,20,239 ; unpcklpd %xmm7,%xmm5 DB 133,255 ; test %edi,%edi - DB 117,40 ; jne 5c25 <_sk_store_f32_sse2+0x86> + DB 117,40 ; jne 5da4 <_sk_store_f32_sse2+0x86> DB 102,15,21,247 ; unpckhpd %xmm7,%xmm6 DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4) DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4) @@ -51008,12 +51484,12 @@ _sk_store_f32_sse2 LABEL PROC DB 93 ; pop %ebp DB 195 ; ret DB 131,255,1 ; cmp $0x1,%edi - DB 116,232 ; je 5c12 <_sk_store_f32_sse2+0x73> + DB 116,232 ; je 5d91 <_sk_store_f32_sse2+0x73> DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4) DB 131,255,3 ; cmp $0x3,%edi - DB 114,222 ; jb 5c12 <_sk_store_f32_sse2+0x73> + DB 114,222 ; jb 5d91 <_sk_store_f32_sse2+0x73> DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4) - DB 235,214 ; jmp 5c12 <_sk_store_f32_sse2+0x73> + DB 235,214 ; jmp 5d91 <_sk_store_f32_sse2+0x73> PUBLIC _sk_clamp_x_sse2 _sk_clamp_x_sse2 LABEL PROC @@ -51068,7 +51544,7 @@ _sk_repeat_x_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 5cb9 <_sk_repeat_x_sse2+0xb> + DB 232,0,0,0,0 ; call 5e38 <_sk_repeat_x_sse2+0xb> DB 89 ; pop %ecx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,16 ; mov (%eax),%edx @@ -51079,7 +51555,7 @@ _sk_repeat_x_sse2 LABEL PROC DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4 DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7 DB 15,194,247,1 ; cmpltps %xmm7,%xmm6 - DB 15,84,177,215,69,0,0 ; andps 0x45d7(%ecx),%xmm6 + DB 15,84,177,72,70,0,0 ; andps 0x4648(%ecx),%xmm6 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,92,254 ; subps %xmm6,%xmm7 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -51104,7 +51580,7 @@ _sk_repeat_y_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 5d1f <_sk_repeat_y_sse2+0xb> + DB 232,0,0,0,0 ; call 5e9e <_sk_repeat_y_sse2+0xb> DB 89 ; pop %ecx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,16 ; mov (%eax),%edx @@ -51115,7 +51591,7 @@ _sk_repeat_y_sse2 LABEL PROC DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4 DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7 DB 15,194,247,1 ; cmpltps %xmm7,%xmm6 - DB 15,84,177,129,69,0,0 ; andps 0x4581(%ecx),%xmm6 + DB 15,84,177,242,69,0,0 ; andps 0x45f2(%ecx),%xmm6 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,92,254 ; subps %xmm6,%xmm7 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -51140,7 +51616,7 @@ _sk_mirror_x_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 5d85 <_sk_mirror_x_sse2+0xb> + DB 232,0,0,0,0 ; call 5f04 <_sk_mirror_x_sse2+0xb> DB 89 ; pop %ecx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,16 ; mov (%eax),%edx @@ -51149,13 +51625,13 @@ _sk_mirror_x_sse2 LABEL PROC DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 243,15,89,177,171,74,0,0 ; mulss 0x4aab(%ecx),%xmm6 + DB 243,15,89,177,28,75,0,0 ; mulss 0x4b1c(%ecx),%xmm6 DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6 DB 15,89,240 ; mulps %xmm0,%xmm6 DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7 DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 DB 15,194,247,1 ; cmpltps %xmm7,%xmm6 - DB 15,84,177,43,69,0,0 ; andps 0x452b(%ecx),%xmm6 + DB 15,84,177,156,69,0,0 ; andps 0x459c(%ecx),%xmm6 DB 15,92,254 ; subps %xmm6,%xmm7 DB 243,15,88,237 ; addss %xmm5,%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -51184,7 +51660,7 @@ _sk_mirror_y_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 5e0a <_sk_mirror_y_sse2+0xb> + DB 232,0,0,0,0 ; call 5f89 <_sk_mirror_y_sse2+0xb> DB 89 ; pop %ecx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,16 ; mov (%eax),%edx @@ -51193,13 +51669,13 @@ _sk_mirror_y_sse2 LABEL PROC DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4 DB 15,92,204 ; subps %xmm4,%xmm1 - DB 243,15,89,177,42,74,0,0 ; mulss 0x4a2a(%ecx),%xmm6 + DB 243,15,89,177,155,74,0,0 ; mulss 0x4a9b(%ecx),%xmm6 DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6 DB 15,89,241 ; mulps %xmm1,%xmm6 DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7 DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 DB 15,194,247,1 ; cmpltps %xmm7,%xmm6 - DB 15,84,177,182,68,0,0 ; andps 0x44b6(%ecx),%xmm6 + DB 15,84,177,39,69,0,0 ; andps 0x4527(%ecx),%xmm6 DB 15,92,254 ; subps %xmm6,%xmm7 DB 243,15,88,237 ; addss %xmm5,%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 @@ -51228,12 +51704,12 @@ _sk_clamp_x_1_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 5e8f <_sk_clamp_x_1_sse2+0xb> + DB 232,0,0,0,0 ; call 600e <_sk_clamp_x_1_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,95,224 ; maxps %xmm0,%xmm4 - DB 15,93,160,65,68,0,0 ; minps 0x4441(%eax),%xmm4 + DB 15,93,160,178,68,0,0 ; minps 0x44b2(%eax),%xmm4 DB 141,65,4 ; lea 0x4(%ecx),%eax DB 131,236,8 ; sub $0x8,%esp DB 15,40,196 ; movaps %xmm4,%xmm0 @@ -51249,14 +51725,14 @@ _sk_repeat_x_1_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 5ebf <_sk_repeat_x_1_sse2+0xb> + DB 232,0,0,0,0 ; call 603e <_sk_repeat_x_1_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 243,15,91,224 ; cvttps2dq %xmm0,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 DB 15,40,232 ; movaps %xmm0,%xmm5 DB 15,194,236,1 ; cmpltps %xmm4,%xmm5 - DB 15,84,168,33,68,0,0 ; andps 0x4421(%eax),%xmm5 + DB 15,84,168,146,68,0,0 ; andps 0x4492(%eax),%xmm5 DB 15,92,229 ; subps %xmm5,%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 DB 141,65,4 ; lea 0x4(%ecx),%eax @@ -51273,17 +51749,17 @@ _sk_mirror_x_1_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 5efa <_sk_mirror_x_1_sse2+0xb> + DB 232,0,0,0,0 ; call 6079 <_sk_mirror_x_1_sse2+0xb> DB 89 ; pop %ecx DB 139,69,12 ; mov 0xc(%ebp),%eax - DB 15,40,161,246,67,0,0 ; movaps 0x43f6(%ecx),%xmm4 + DB 15,40,161,103,68,0,0 ; movaps 0x4467(%ecx),%xmm4 DB 15,88,196 ; addps %xmm4,%xmm0 - DB 15,40,169,6,68,0,0 ; movaps 0x4406(%ecx),%xmm5 + DB 15,40,169,119,68,0,0 ; movaps 0x4477(%ecx),%xmm5 DB 15,89,232 ; mulps %xmm0,%xmm5 DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 DB 15,194,238,1 ; cmpltps %xmm6,%xmm5 - DB 15,84,169,22,68,0,0 ; andps 0x4416(%ecx),%xmm5 + DB 15,84,169,135,68,0,0 ; andps 0x4487(%ecx),%xmm5 DB 15,87,255 ; xorps %xmm7,%xmm7 DB 15,92,245 ; subps %xmm5,%xmm6 DB 15,88,246 ; addps %xmm6,%xmm6 @@ -51306,13 +51782,13 @@ _sk_luminance_to_alpha_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 232,0,0,0,0 ; call 5f58 <_sk_luminance_to_alpha_sse2+0xe> + DB 232,0,0,0,0 ; call 60d7 <_sk_luminance_to_alpha_sse2+0xe> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx - DB 15,89,128,200,67,0,0 ; mulps 0x43c8(%eax),%xmm0 - DB 15,89,136,216,67,0,0 ; mulps 0x43d8(%eax),%xmm1 + DB 15,89,128,57,68,0,0 ; mulps 0x4439(%eax),%xmm0 + DB 15,89,136,73,68,0,0 ; mulps 0x4449(%eax),%xmm1 DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,152,232,67,0,0 ; mulps 0x43e8(%eax),%xmm3 + DB 15,89,152,89,68,0,0 ; mulps 0x4459(%eax),%xmm3 DB 15,88,217 ; addps %xmm1,%xmm3 DB 141,65,4 ; lea 0x4(%ecx),%eax DB 131,236,8 ; sub $0x8,%esp @@ -51686,7 +52162,7 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC DB 86 ; push %esi DB 131,236,60 ; sub $0x3c,%esp DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp) - DB 232,0,0,0,0 ; call 63f5 <_sk_evenly_spaced_gradient_sse2+0x12> + DB 232,0,0,0,0 ; call 6574 <_sk_evenly_spaced_gradient_sse2+0x12> DB 90 ; pop %edx DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 141,65,4 ; lea 0x4(%ecx),%eax @@ -51697,12 +52173,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC DB 78 ; dec %esi DB 102,15,110,206 ; movd %esi,%xmm1 DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1 - DB 102,15,111,146,91,63,0,0 ; movdqa 0x3f5b(%edx),%xmm2 + DB 102,15,111,146,204,63,0,0 ; movdqa 0x3fcc(%edx),%xmm2 DB 102,15,219,209 ; pand %xmm1,%xmm2 - DB 102,15,235,146,107,63,0,0 ; por 0x3f6b(%edx),%xmm2 + DB 102,15,235,146,220,63,0,0 ; por 0x3fdc(%edx),%xmm2 DB 102,15,114,209,16 ; psrld $0x10,%xmm1 - DB 102,15,235,138,123,63,0,0 ; por 0x3f7b(%edx),%xmm1 - DB 15,88,138,139,63,0,0 ; addps 0x3f8b(%edx),%xmm1 + DB 102,15,235,138,236,63,0,0 ; por 0x3fec(%edx),%xmm1 + DB 15,88,138,252,63,0,0 ; addps 0x3ffc(%edx),%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,89,200 ; mulps %xmm0,%xmm1 DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1 @@ -51807,18 +52283,18 @@ _sk_gauss_a_to_rgba_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 65ab <_sk_gauss_a_to_rgba_sse2+0xb> + DB 232,0,0,0,0 ; call 672a <_sk_gauss_a_to_rgba_sse2+0xb> DB 88 ; pop %eax DB 139,77,12 ; mov 0xc(%ebp),%ecx - DB 15,40,128,229,61,0,0 ; movaps 0x3de5(%eax),%xmm0 + DB 15,40,128,86,62,0,0 ; movaps 0x3e56(%eax),%xmm0 DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,128,245,61,0,0 ; addps 0x3df5(%eax),%xmm0 + DB 15,88,128,102,62,0,0 ; addps 0x3e66(%eax),%xmm0 DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,128,5,62,0,0 ; addps 0x3e05(%eax),%xmm0 + DB 15,88,128,118,62,0,0 ; addps 0x3e76(%eax),%xmm0 DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,128,21,62,0,0 ; addps 0x3e15(%eax),%xmm0 + DB 15,88,128,134,62,0,0 ; addps 0x3e86(%eax),%xmm0 DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,128,37,62,0,0 ; addps 0x3e25(%eax),%xmm0 + DB 15,88,128,150,62,0,0 ; addps 0x3e96(%eax),%xmm0 DB 141,65,4 ; lea 0x4(%ecx),%eax DB 131,236,8 ; sub $0x8,%esp DB 15,40,200 ; movaps %xmm0,%xmm1 @@ -51839,7 +52315,7 @@ _sk_gradient_sse2 LABEL PROC DB 87 ; push %edi DB 86 ; push %esi DB 131,236,60 ; sub $0x3c,%esp - DB 232,0,0,0,0 ; call 6606 <_sk_gradient_sse2+0xe> + DB 232,0,0,0,0 ; call 6785 <_sk_gradient_sse2+0xe> DB 95 ; pop %edi DB 139,77,12 ; mov 0xc(%ebp),%ecx DB 141,81,4 ; lea 0x4(%ecx),%edx @@ -51848,12 +52324,12 @@ _sk_gradient_sse2 LABEL PROC DB 139,17 ; mov (%ecx),%edx DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 131,250,2 ; cmp $0x2,%edx - DB 114,43 ; jb 6648 <_sk_gradient_sse2+0x50> + DB 114,43 ; jb 67c7 <_sk_gradient_sse2+0x50> DB 139,113,36 ; mov 0x24(%ecx),%esi DB 74 ; dec %edx DB 131,198,4 ; add $0x4,%esi DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 15,40,151,218,61,0,0 ; movaps 0x3dda(%edi),%xmm2 + DB 15,40,151,75,62,0,0 ; movaps 0x3e4b(%edi),%xmm2 DB 243,15,16,30 ; movss (%esi),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 @@ -51861,7 +52337,7 @@ _sk_gradient_sse2 LABEL PROC DB 102,15,254,203 ; paddd %xmm3,%xmm1 DB 131,198,4 ; add $0x4,%esi DB 74 ; dec %edx - DB 117,231 ; jne 662f <_sk_gradient_sse2+0x37> + DB 117,231 ; jne 67ae <_sk_gradient_sse2+0x37> DB 102,15,126,202 ; movd %xmm1,%edx DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2 DB 102,15,126,214 ; movd %xmm2,%esi @@ -52009,7 +52485,7 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,209 ; movaps %xmm1,%xmm2 DB 15,40,200 ; movaps %xmm0,%xmm1 - DB 232,0,0,0,0 ; call 6842 <_sk_xy_to_unit_angle_sse2+0x18> + DB 232,0,0,0,0 ; call 69c1 <_sk_xy_to_unit_angle_sse2+0x18> DB 88 ; pop %eax DB 15,87,237 ; xorps %xmm5,%xmm5 DB 15,92,233 ; subps %xmm1,%xmm5 @@ -52024,30 +52500,30 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC DB 15,94,247 ; divps %xmm7,%xmm6 DB 15,40,254 ; movaps %xmm6,%xmm7 DB 15,89,255 ; mulps %xmm7,%xmm7 - DB 15,40,128,174,59,0,0 ; movaps 0x3bae(%eax),%xmm0 + DB 15,40,128,31,60,0,0 ; movaps 0x3c1f(%eax),%xmm0 DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 15,88,128,190,59,0,0 ; addps 0x3bbe(%eax),%xmm0 + DB 15,88,128,47,60,0,0 ; addps 0x3c2f(%eax),%xmm0 DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 15,88,128,206,59,0,0 ; addps 0x3bce(%eax),%xmm0 + DB 15,88,128,63,60,0,0 ; addps 0x3c3f(%eax),%xmm0 DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 15,88,128,222,59,0,0 ; addps 0x3bde(%eax),%xmm0 + DB 15,88,128,79,60,0,0 ; addps 0x3c4f(%eax),%xmm0 DB 15,89,198 ; mulps %xmm6,%xmm0 DB 15,194,236,1 ; cmpltps %xmm4,%xmm5 - DB 15,40,176,238,59,0,0 ; movaps 0x3bee(%eax),%xmm6 + DB 15,40,176,95,60,0,0 ; movaps 0x3c5f(%eax),%xmm6 DB 15,92,240 ; subps %xmm0,%xmm6 DB 15,84,245 ; andps %xmm5,%xmm6 DB 15,85,232 ; andnps %xmm0,%xmm5 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,86,238 ; orps %xmm6,%xmm5 DB 15,194,204,1 ; cmpltps %xmm4,%xmm1 - DB 15,40,128,254,59,0,0 ; movaps 0x3bfe(%eax),%xmm0 + DB 15,40,128,111,60,0,0 ; movaps 0x3c6f(%eax),%xmm0 DB 15,92,197 ; subps %xmm5,%xmm0 DB 15,84,193 ; andps %xmm1,%xmm0 DB 15,85,205 ; andnps %xmm5,%xmm1 DB 15,86,200 ; orps %xmm0,%xmm1 DB 15,40,194 ; movaps %xmm2,%xmm0 DB 15,194,196,1 ; cmpltps %xmm4,%xmm0 - DB 15,40,168,14,60,0,0 ; movaps 0x3c0e(%eax),%xmm5 + DB 15,40,168,127,60,0,0 ; movaps 0x3c7f(%eax),%xmm5 DB 15,92,233 ; subps %xmm1,%xmm5 DB 15,84,232 ; andps %xmm0,%xmm5 DB 15,85,193 ; andnps %xmm1,%xmm0 @@ -52104,15 +52580,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC DB 15,40,241 ; movaps %xmm1,%xmm6 DB 15,89,246 ; mulps %xmm6,%xmm6 DB 15,88,240 ; addps %xmm0,%xmm6 - DB 232,0,0,0,0 ; call 695f <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31> + DB 232,0,0,0,0 ; call 6ade <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31> DB 90 ; pop %edx DB 243,15,89,237 ; mulss %xmm5,%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 DB 15,92,245 ; subps %xmm5,%xmm6 DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0 DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0 - DB 15,89,162,1,59,0,0 ; mulps 0x3b01(%edx),%xmm4 - DB 15,89,130,17,59,0,0 ; mulps 0x3b11(%edx),%xmm0 + DB 15,89,162,114,59,0,0 ; mulps 0x3b72(%edx),%xmm4 + DB 15,89,130,130,59,0,0 ; mulps 0x3b82(%edx),%xmm0 DB 15,89,198 ; mulps %xmm6,%xmm0 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,89,237 ; mulps %xmm5,%xmm5 @@ -52120,11 +52596,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC DB 15,81,237 ; sqrtps %xmm5,%xmm5 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 15,87,162,33,59,0,0 ; xorps 0x3b21(%edx),%xmm4 + DB 15,87,162,146,59,0,0 ; xorps 0x3b92(%edx),%xmm4 DB 15,92,229 ; subps %xmm5,%xmm4 DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 - DB 15,89,170,49,59,0,0 ; mulps 0x3b31(%edx),%xmm5 + DB 15,89,170,162,59,0,0 ; mulps 0x3ba2(%edx),%xmm5 DB 15,89,197 ; mulps %xmm5,%xmm0 DB 15,89,229 ; mulps %xmm5,%xmm4 DB 15,95,196 ; maxps %xmm4,%xmm0 @@ -52153,15 +52629,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC DB 15,40,241 ; movaps %xmm1,%xmm6 DB 15,89,246 ; mulps %xmm6,%xmm6 DB 15,88,240 ; addps %xmm0,%xmm6 - DB 232,0,0,0,0 ; call 69fd <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31> + DB 232,0,0,0,0 ; call 6b7c <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31> DB 90 ; pop %edx DB 243,15,89,237 ; mulss %xmm5,%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 DB 15,92,245 ; subps %xmm5,%xmm6 DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0 DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0 - DB 15,89,162,163,58,0,0 ; mulps 0x3aa3(%edx),%xmm4 - DB 15,89,130,179,58,0,0 ; mulps 0x3ab3(%edx),%xmm0 + DB 15,89,162,20,59,0,0 ; mulps 0x3b14(%edx),%xmm4 + DB 15,89,130,36,59,0,0 ; mulps 0x3b24(%edx),%xmm0 DB 15,89,198 ; mulps %xmm6,%xmm0 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,89,237 ; mulps %xmm5,%xmm5 @@ -52169,11 +52645,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC DB 15,81,237 ; sqrtps %xmm5,%xmm5 DB 15,40,197 ; movaps %xmm5,%xmm0 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 15,87,162,195,58,0,0 ; xorps 0x3ac3(%edx),%xmm4 + DB 15,87,162,52,59,0,0 ; xorps 0x3b34(%edx),%xmm4 DB 15,92,229 ; subps %xmm5,%xmm4 DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 - DB 15,89,170,211,58,0,0 ; mulps 0x3ad3(%edx),%xmm5 + DB 15,89,170,68,59,0,0 ; mulps 0x3b44(%edx),%xmm5 DB 15,89,197 ; mulps %xmm5,%xmm0 DB 15,89,229 ; mulps %xmm5,%xmm4 DB 15,93,196 ; minps %xmm4,%xmm0 @@ -52191,7 +52667,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC DB 85 ; push %ebp DB 137,229 ; mov %esp,%ebp DB 131,236,8 ; sub $0x8,%esp - DB 232,0,0,0,0 ; call 6a75 <_sk_xy_to_2pt_conical_linear_sse2+0xb> + DB 232,0,0,0,0 ; call 6bf4 <_sk_xy_to_2pt_conical_linear_sse2+0xb> DB 89 ; pop %ecx DB 139,69,12 ; mov 0xc(%ebp),%eax DB 139,16 ; mov (%eax),%edx @@ -52200,7 +52676,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC DB 243,15,89,236 ; mulss %xmm4,%xmm5 DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5 DB 15,88,232 ; addps %xmm0,%xmm5 - DB 15,89,169,107,58,0,0 ; mulps 0x3a6b(%ecx),%xmm5 + DB 15,89,169,220,58,0,0 ; mulps 0x3adc(%ecx),%xmm5 DB 15,89,192 ; mulps %xmm0,%xmm0 DB 15,40,241 ; movaps %xmm1,%xmm6 DB 15,89,246 ; mulps %xmm6,%xmm6 @@ -52208,7 +52684,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC DB 243,15,89,228 ; mulss %xmm4,%xmm4 DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4 DB 15,92,196 ; subps %xmm4,%xmm0 - DB 15,87,129,123,58,0,0 ; xorps 0x3a7b(%ecx),%xmm0 + DB 15,87,129,236,58,0,0 ; xorps 0x3aec(%ecx),%xmm0 DB 15,94,197 ; divps %xmm5,%xmm0 DB 141,72,8 ; lea 0x8(%eax),%ecx DB 131,236,8 ; sub $0x8,%esp @@ -52276,16 +52752,16 @@ _sk_save_xy_sse2 LABEL PROC DB 131,236,24 ; sub $0x18,%esp DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp) DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 232,0,0,0,0 ; call 6b52 <_sk_save_xy_sse2+0x12> + DB 232,0,0,0,0 ; call 6cd1 <_sk_save_xy_sse2+0x12> DB 88 ; pop %eax - DB 15,40,160,174,57,0,0 ; movaps 0x39ae(%eax),%xmm4 + DB 15,40,160,31,58,0,0 ; movaps 0x3a1f(%eax),%xmm4 DB 15,40,232 ; movaps %xmm0,%xmm5 DB 15,88,236 ; addps %xmm4,%xmm5 DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 DB 15,40,253 ; movaps %xmm5,%xmm7 DB 15,194,254,1 ; cmpltps %xmm6,%xmm7 - DB 15,40,144,190,57,0,0 ; movaps 0x39be(%eax),%xmm2 + DB 15,40,144,47,58,0,0 ; movaps 0x3a2f(%eax),%xmm2 DB 15,84,250 ; andps %xmm2,%xmm7 DB 15,92,247 ; subps %xmm7,%xmm6 DB 15,92,238 ; subps %xmm6,%xmm5 @@ -52356,15 +52832,15 @@ _sk_bilinear_nx_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6c34 <_sk_bilinear_nx_sse2+0xa> + DB 232,0,0,0,0 ; call 6db3 <_sk_bilinear_nx_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,6 ; movups (%esi),%xmm0 DB 15,16,102,64 ; movups 0x40(%esi),%xmm4 - DB 15,88,128,236,56,0,0 ; addps 0x38ec(%eax),%xmm0 - DB 15,40,168,252,56,0,0 ; movaps 0x38fc(%eax),%xmm5 + DB 15,88,128,93,57,0,0 ; addps 0x395d(%eax),%xmm0 + DB 15,40,168,109,57,0,0 ; movaps 0x396d(%eax),%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax @@ -52383,14 +52859,14 @@ _sk_bilinear_px_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6c77 <_sk_bilinear_px_sse2+0xa> + DB 232,0,0,0,0 ; call 6df6 <_sk_bilinear_px_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,6 ; movups (%esi),%xmm0 DB 15,16,102,64 ; movups 0x40(%esi),%xmm4 - DB 15,88,128,201,56,0,0 ; addps 0x38c9(%eax),%xmm0 + DB 15,88,128,58,57,0,0 ; addps 0x393a(%eax),%xmm0 DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax DB 131,236,8 ; sub $0x8,%esp @@ -52408,15 +52884,15 @@ _sk_bilinear_ny_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6cb0 <_sk_bilinear_ny_sse2+0xa> + DB 232,0,0,0,0 ; call 6e2f <_sk_bilinear_ny_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,78,32 ; movups 0x20(%esi),%xmm1 DB 15,16,102,96 ; movups 0x60(%esi),%xmm4 - DB 15,88,136,160,56,0,0 ; addps 0x38a0(%eax),%xmm1 - DB 15,40,168,176,56,0,0 ; movaps 0x38b0(%eax),%xmm5 + DB 15,88,136,17,57,0,0 ; addps 0x3911(%eax),%xmm1 + DB 15,40,168,33,57,0,0 ; movaps 0x3921(%eax),%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax @@ -52435,14 +52911,14 @@ _sk_bilinear_py_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6cf4 <_sk_bilinear_py_sse2+0xa> + DB 232,0,0,0,0 ; call 6e73 <_sk_bilinear_py_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,78,32 ; movups 0x20(%esi),%xmm1 DB 15,16,102,96 ; movups 0x60(%esi),%xmm4 - DB 15,88,136,124,56,0,0 ; addps 0x387c(%eax),%xmm1 + DB 15,88,136,237,56,0,0 ; addps 0x38ed(%eax),%xmm1 DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax DB 131,236,8 ; sub $0x8,%esp @@ -52460,20 +52936,20 @@ _sk_bicubic_n3x_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6d2e <_sk_bicubic_n3x_sse2+0xa> + DB 232,0,0,0,0 ; call 6ead <_sk_bicubic_n3x_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,6 ; movups (%esi),%xmm0 DB 15,16,102,64 ; movups 0x40(%esi),%xmm4 - DB 15,88,128,82,56,0,0 ; addps 0x3852(%eax),%xmm0 - DB 15,40,168,98,56,0,0 ; movaps 0x3862(%eax),%xmm5 + DB 15,88,128,195,56,0,0 ; addps 0x38c3(%eax),%xmm0 + DB 15,40,168,211,56,0,0 ; movaps 0x38d3(%eax),%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,89,228 ; mulps %xmm4,%xmm4 - DB 15,89,168,114,56,0,0 ; mulps 0x3872(%eax),%xmm5 - DB 15,88,168,130,56,0,0 ; addps 0x3882(%eax),%xmm5 + DB 15,89,168,227,56,0,0 ; mulps 0x38e3(%eax),%xmm5 + DB 15,88,168,243,56,0,0 ; addps 0x38f3(%eax),%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax @@ -52492,23 +52968,23 @@ _sk_bicubic_n1x_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6d88 <_sk_bicubic_n1x_sse2+0xa> + DB 232,0,0,0,0 ; call 6f07 <_sk_bicubic_n1x_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,6 ; movups (%esi),%xmm0 DB 15,16,102,64 ; movups 0x40(%esi),%xmm4 - DB 15,88,128,56,56,0,0 ; addps 0x3838(%eax),%xmm0 - DB 15,40,168,72,56,0,0 ; movaps 0x3848(%eax),%xmm5 + DB 15,88,128,169,56,0,0 ; addps 0x38a9(%eax),%xmm0 + DB 15,40,168,185,56,0,0 ; movaps 0x38b9(%eax),%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 - DB 15,40,160,88,56,0,0 ; movaps 0x3858(%eax),%xmm4 + DB 15,40,160,201,56,0,0 ; movaps 0x38c9(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 - DB 15,88,160,104,56,0,0 ; addps 0x3868(%eax),%xmm4 + DB 15,88,160,217,56,0,0 ; addps 0x38d9(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 - DB 15,88,160,120,56,0,0 ; addps 0x3878(%eax),%xmm4 + DB 15,88,160,233,56,0,0 ; addps 0x38e9(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 - DB 15,88,160,136,56,0,0 ; addps 0x3888(%eax),%xmm4 + DB 15,88,160,249,56,0,0 ; addps 0x38f9(%eax),%xmm4 DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax DB 131,236,8 ; sub $0x8,%esp @@ -52526,22 +53002,22 @@ _sk_bicubic_p1x_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6df0 <_sk_bicubic_p1x_sse2+0xa> + DB 232,0,0,0,0 ; call 6f6f <_sk_bicubic_p1x_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi - DB 15,40,160,48,56,0,0 ; movaps 0x3830(%eax),%xmm4 + DB 15,40,160,161,56,0,0 ; movaps 0x38a1(%eax),%xmm4 DB 15,16,6 ; movups (%esi),%xmm0 DB 15,16,110,64 ; movups 0x40(%esi),%xmm5 DB 15,88,196 ; addps %xmm4,%xmm0 - DB 15,40,176,64,56,0,0 ; movaps 0x3840(%eax),%xmm6 + DB 15,40,176,177,56,0,0 ; movaps 0x38b1(%eax),%xmm6 DB 15,89,245 ; mulps %xmm5,%xmm6 - DB 15,88,176,80,56,0,0 ; addps 0x3850(%eax),%xmm6 + DB 15,88,176,193,56,0,0 ; addps 0x38c1(%eax),%xmm6 DB 15,89,245 ; mulps %xmm5,%xmm6 DB 15,88,244 ; addps %xmm4,%xmm6 DB 15,89,245 ; mulps %xmm5,%xmm6 - DB 15,88,176,96,56,0,0 ; addps 0x3860(%eax),%xmm6 + DB 15,88,176,209,56,0,0 ; addps 0x38d1(%eax),%xmm6 DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax DB 131,236,8 ; sub $0x8,%esp @@ -52559,18 +53035,18 @@ _sk_bicubic_p3x_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6e4d <_sk_bicubic_p3x_sse2+0xa> + DB 232,0,0,0,0 ; call 6fcc <_sk_bicubic_p3x_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,6 ; movups (%esi),%xmm0 DB 15,16,102,64 ; movups 0x40(%esi),%xmm4 - DB 15,88,128,19,56,0,0 ; addps 0x3813(%eax),%xmm0 + DB 15,88,128,132,56,0,0 ; addps 0x3884(%eax),%xmm0 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,89,237 ; mulps %xmm5,%xmm5 - DB 15,89,160,35,56,0,0 ; mulps 0x3823(%eax),%xmm4 - DB 15,88,160,51,56,0,0 ; addps 0x3833(%eax),%xmm4 + DB 15,89,160,148,56,0,0 ; mulps 0x3894(%eax),%xmm4 + DB 15,88,160,164,56,0,0 ; addps 0x38a4(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax @@ -52589,20 +53065,20 @@ _sk_bicubic_n3y_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6e9d <_sk_bicubic_n3y_sse2+0xa> + DB 232,0,0,0,0 ; call 701c <_sk_bicubic_n3y_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,78,32 ; movups 0x20(%esi),%xmm1 DB 15,16,102,96 ; movups 0x60(%esi),%xmm4 - DB 15,88,136,243,55,0,0 ; addps 0x37f3(%eax),%xmm1 - DB 15,40,168,3,56,0,0 ; movaps 0x3803(%eax),%xmm5 + DB 15,88,136,100,56,0,0 ; addps 0x3864(%eax),%xmm1 + DB 15,40,168,116,56,0,0 ; movaps 0x3874(%eax),%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,89,228 ; mulps %xmm4,%xmm4 - DB 15,89,168,19,56,0,0 ; mulps 0x3813(%eax),%xmm5 - DB 15,88,168,35,56,0,0 ; addps 0x3823(%eax),%xmm5 + DB 15,89,168,132,56,0,0 ; mulps 0x3884(%eax),%xmm5 + DB 15,88,168,148,56,0,0 ; addps 0x3894(%eax),%xmm5 DB 15,89,236 ; mulps %xmm4,%xmm5 DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax @@ -52621,23 +53097,23 @@ _sk_bicubic_n1y_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6ef8 <_sk_bicubic_n1y_sse2+0xa> + DB 232,0,0,0,0 ; call 7077 <_sk_bicubic_n1y_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,78,32 ; movups 0x20(%esi),%xmm1 DB 15,16,102,96 ; movups 0x60(%esi),%xmm4 - DB 15,88,136,216,55,0,0 ; addps 0x37d8(%eax),%xmm1 - DB 15,40,168,232,55,0,0 ; movaps 0x37e8(%eax),%xmm5 + DB 15,88,136,73,56,0,0 ; addps 0x3849(%eax),%xmm1 + DB 15,40,168,89,56,0,0 ; movaps 0x3859(%eax),%xmm5 DB 15,92,236 ; subps %xmm4,%xmm5 - DB 15,40,160,248,55,0,0 ; movaps 0x37f8(%eax),%xmm4 + DB 15,40,160,105,56,0,0 ; movaps 0x3869(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 - DB 15,88,160,8,56,0,0 ; addps 0x3808(%eax),%xmm4 + DB 15,88,160,121,56,0,0 ; addps 0x3879(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 - DB 15,88,160,24,56,0,0 ; addps 0x3818(%eax),%xmm4 + DB 15,88,160,137,56,0,0 ; addps 0x3889(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 - DB 15,88,160,40,56,0,0 ; addps 0x3828(%eax),%xmm4 + DB 15,88,160,153,56,0,0 ; addps 0x3899(%eax),%xmm4 DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax DB 131,236,8 ; sub $0x8,%esp @@ -52655,22 +53131,22 @@ _sk_bicubic_p1y_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6f61 <_sk_bicubic_p1y_sse2+0xa> + DB 232,0,0,0,0 ; call 70e0 <_sk_bicubic_p1y_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi - DB 15,40,160,207,55,0,0 ; movaps 0x37cf(%eax),%xmm4 + DB 15,40,160,64,56,0,0 ; movaps 0x3840(%eax),%xmm4 DB 15,16,78,32 ; movups 0x20(%esi),%xmm1 DB 15,16,110,96 ; movups 0x60(%esi),%xmm5 DB 15,88,204 ; addps %xmm4,%xmm1 - DB 15,40,176,223,55,0,0 ; movaps 0x37df(%eax),%xmm6 + DB 15,40,176,80,56,0,0 ; movaps 0x3850(%eax),%xmm6 DB 15,89,245 ; mulps %xmm5,%xmm6 - DB 15,88,176,239,55,0,0 ; addps 0x37ef(%eax),%xmm6 + DB 15,88,176,96,56,0,0 ; addps 0x3860(%eax),%xmm6 DB 15,89,245 ; mulps %xmm5,%xmm6 DB 15,88,244 ; addps %xmm4,%xmm6 DB 15,89,245 ; mulps %xmm5,%xmm6 - DB 15,88,176,255,55,0,0 ; addps 0x37ff(%eax),%xmm6 + DB 15,88,176,112,56,0,0 ; addps 0x3870(%eax),%xmm6 DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax DB 131,236,8 ; sub $0x8,%esp @@ -52688,18 +53164,18 @@ _sk_bicubic_p3y_sse2 LABEL PROC DB 137,229 ; mov %esp,%ebp DB 86 ; push %esi DB 80 ; push %eax - DB 232,0,0,0,0 ; call 6fbf <_sk_bicubic_p3y_sse2+0xa> + DB 232,0,0,0,0 ; call 713e <_sk_bicubic_p3y_sse2+0xa> DB 88 ; pop %eax DB 139,77,8 ; mov 0x8(%ebp),%ecx DB 139,85,12 ; mov 0xc(%ebp),%edx DB 139,50 ; mov (%edx),%esi DB 15,16,78,32 ; movups 0x20(%esi),%xmm1 DB 15,16,102,96 ; movups 0x60(%esi),%xmm4 - DB 15,88,136,177,55,0,0 ; addps 0x37b1(%eax),%xmm1 + DB 15,88,136,34,56,0,0 ; addps 0x3822(%eax),%xmm1 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,89,237 ; mulps %xmm5,%xmm5 - DB 15,89,160,193,55,0,0 ; mulps 0x37c1(%eax),%xmm4 - DB 15,88,160,209,55,0,0 ; addps 0x37d1(%eax),%xmm4 + DB 15,89,160,50,56,0,0 ; mulps 0x3832(%eax),%xmm4 + DB 15,88,160,66,56,0,0 ; addps 0x3842(%eax),%xmm4 DB 15,89,229 ; mulps %xmm5,%xmm4 DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi) DB 141,66,8 ; lea 0x8(%edx),%eax @@ -52840,7 +53316,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1 DB 102,15,98,233 ; punpckldq %xmm1,%xmm5 DB 102,15,127,173,104,255,255,255 ; movdqa %xmm5,-0x98(%ebp) - DB 232,0,0,0,0 ; call 71b3 <_sk_clut_3D_sse2+0xff> + DB 232,0,0,0,0 ; call 7332 <_sk_clut_3D_sse2+0xff> DB 90 ; pop %edx DB 243,15,91,196 ; cvttps2dq %xmm4,%xmm0 DB 102,15,127,133,232,254,255,255 ; movdqa %xmm0,-0x118(%ebp) @@ -52849,7 +53325,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 102,15,254,208 ; paddd %xmm0,%xmm2 DB 102,15,111,205 ; movdqa %xmm5,%xmm1 DB 102,15,254,202 ; paddd %xmm2,%xmm1 - DB 102,15,111,130,253,53,0,0 ; movdqa 0x35fd(%edx),%xmm0 + DB 102,15,111,130,110,54,0,0 ; movdqa 0x366e(%edx),%xmm0 DB 102,15,127,133,88,255,255,255 ; movdqa %xmm0,-0xa8(%ebp) DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4 DB 102,15,244,200 ; pmuludq %xmm0,%xmm1 @@ -52873,7 +53349,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 15,20,196 ; unpcklps %xmm4,%xmm0 DB 15,20,199 ; unpcklps %xmm7,%xmm0 DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp) - DB 102,15,111,130,13,54,0,0 ; movdqa 0x360d(%edx),%xmm0 + DB 102,15,111,130,126,54,0,0 ; movdqa 0x367e(%edx),%xmm0 DB 102,15,127,133,72,255,255,255 ; movdqa %xmm0,-0xb8(%ebp) DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,15,254,224 ; paddd %xmm0,%xmm4 @@ -52891,7 +53367,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4 DB 15,20,252 ; unpcklps %xmm4,%xmm7 DB 15,20,248 ; unpcklps %xmm0,%xmm7 - DB 102,15,111,130,29,54,0,0 ; movdqa 0x361d(%edx),%xmm0 + DB 102,15,111,130,142,54,0,0 ; movdqa 0x368e(%edx),%xmm0 DB 102,15,127,69,216 ; movdqa %xmm0,-0x28(%ebp) DB 102,15,254,200 ; paddd %xmm0,%xmm1 DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0 @@ -52908,7 +53384,7 @@ _sk_clut_3D_sse2 LABEL PROC DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0 DB 15,20,232 ; unpcklps %xmm0,%xmm5 DB 15,20,236 ; unpcklps %xmm4,%xmm5 - DB 15,40,130,237,53,0,0 ; movaps 0x35ed(%edx),%xmm0 + DB 15,40,130,94,54,0,0 ; movaps 0x365e(%edx),%xmm0 DB 15,88,240 ; addps %xmm0,%xmm6 DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp) DB 15,40,141,56,255,255,255 ; movaps -0xc8(%ebp),%xmm1 @@ -53519,7 +53995,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1 DB 102,15,98,209 ; punpckldq %xmm1,%xmm2 DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp) - DB 232,0,0,0,0 ; call 7d29 <_sk_clut_4D_sse2+0x179> + DB 232,0,0,0,0 ; call 7ea8 <_sk_clut_4D_sse2+0x179> DB 89 ; pop %ecx DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,41,165,120,254,255,255 ; movaps %xmm4,-0x188(%ebp) @@ -53532,7 +54008,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,254,245 ; paddd %xmm5,%xmm6 DB 102,15,111,202 ; movdqa %xmm2,%xmm1 DB 102,15,254,206 ; paddd %xmm6,%xmm1 - DB 102,15,111,153,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm3 + DB 102,15,111,153,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm3 DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2 DB 102,15,244,203 ; pmuludq %xmm3,%xmm1 DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1 @@ -53555,7 +54031,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,218 ; unpcklps %xmm2,%xmm3 DB 15,20,221 ; unpcklps %xmm5,%xmm3 DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp) - DB 102,15,111,153,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm3 + DB 102,15,111,153,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm3 DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,15,254,211 ; paddd %xmm3,%xmm2 DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5 @@ -53573,7 +54049,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,215 ; unpcklps %xmm7,%xmm2 DB 15,20,213 ; unpcklps %xmm5,%xmm2 DB 15,41,149,136,254,255,255 ; movaps %xmm2,-0x178(%ebp) - DB 102,15,254,137,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm1 + DB 102,15,254,137,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm1 DB 102,15,112,233,229 ; pshufd $0xe5,%xmm1,%xmm5 DB 102,15,126,232 ; movd %xmm5,%eax DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5 @@ -53589,7 +54065,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,207 ; unpcklps %xmm7,%xmm1 DB 15,20,205 ; unpcklps %xmm5,%xmm1 DB 15,41,141,152,254,255,255 ; movaps %xmm1,-0x168(%ebp) - DB 15,40,185,183,42,0,0 ; movaps 0x2ab7(%ecx),%xmm7 + DB 15,40,185,40,43,0,0 ; movaps 0x2b28(%ecx),%xmm7 DB 15,88,231 ; addps %xmm7,%xmm4 DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp) DB 15,40,141,232,254,255,255 ; movaps -0x118(%ebp),%xmm1 @@ -53610,7 +54086,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp) DB 102,15,254,241 ; paddd %xmm1,%xmm6 DB 102,15,112,254,245 ; pshufd $0xf5,%xmm6,%xmm7 - DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1 + DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1 DB 102,15,244,241 ; pmuludq %xmm1,%xmm6 DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0 DB 102,15,244,249 ; pmuludq %xmm1,%xmm7 @@ -53647,7 +54123,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5 DB 15,20,221 ; unpcklps %xmm5,%xmm3 DB 15,20,217 ; unpcklps %xmm1,%xmm3 - DB 102,15,111,177,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm6 + DB 102,15,111,177,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm6 DB 102,15,254,198 ; paddd %xmm6,%xmm0 DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1 DB 102,15,126,200 ; movd %xmm1,%eax @@ -53695,7 +54171,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,234 ; movdqa %xmm2,%xmm5 DB 102,15,254,77,168 ; paddd -0x58(%ebp),%xmm1 DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2 - DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0 + DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0 DB 102,15,244,200 ; pmuludq %xmm0,%xmm1 DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1 DB 102,15,244,208 ; pmuludq %xmm0,%xmm2 @@ -53717,7 +54193,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,195 ; unpcklps %xmm3,%xmm0 DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp) DB 102,15,111,209 ; movdqa %xmm1,%xmm2 - DB 102,15,111,129,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm0 + DB 102,15,111,129,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm0 DB 102,15,254,208 ; paddd %xmm0,%xmm2 DB 102,15,111,224 ; movdqa %xmm0,%xmm4 DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3 @@ -53753,7 +54229,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,197 ; movdqa %xmm5,%xmm0 DB 102,15,254,69,184 ; paddd -0x48(%ebp),%xmm0 DB 102,15,112,216,245 ; pshufd $0xf5,%xmm0,%xmm3 - DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1 + DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1 DB 102,15,244,193 ; pmuludq %xmm1,%xmm0 DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2 DB 102,15,244,217 ; pmuludq %xmm1,%xmm3 @@ -53789,7 +54265,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0 DB 15,20,224 ; unpcklps %xmm0,%xmm4 DB 15,20,227 ; unpcklps %xmm3,%xmm4 - DB 102,15,111,153,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm3 + DB 102,15,111,153,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm3 DB 102,15,254,211 ; paddd %xmm3,%xmm2 DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0 DB 102,15,126,192 ; movd %xmm0,%eax @@ -53853,7 +54329,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,197 ; movdqa %xmm5,%xmm0 DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0 DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1 - DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2 + DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2 DB 102,15,244,194 ; pmuludq %xmm2,%xmm0 DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0 DB 102,15,244,202 ; pmuludq %xmm2,%xmm1 @@ -53875,7 +54351,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,214 ; unpcklps %xmm6,%xmm2 DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp) DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,15,111,145,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm2 + DB 102,15,111,145,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm2 DB 102,15,254,202 ; paddd %xmm2,%xmm1 DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6 DB 102,15,126,240 ; movd %xmm6,%eax @@ -53908,7 +54384,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,206 ; unpcklps %xmm6,%xmm1 DB 102,15,254,109,184 ; paddd -0x48(%ebp),%xmm5 DB 102,15,112,245,245 ; pshufd $0xf5,%xmm5,%xmm6 - DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0 + DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0 DB 102,15,244,232 ; pmuludq %xmm0,%xmm5 DB 102,15,112,253,232 ; pshufd $0xe8,%xmm5,%xmm7 DB 102,15,244,240 ; pmuludq %xmm0,%xmm6 @@ -53944,7 +54420,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2 DB 15,20,234 ; unpcklps %xmm2,%xmm5 DB 15,20,238 ; unpcklps %xmm6,%xmm5 - DB 102,15,111,153,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm3 + DB 102,15,111,153,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm3 DB 102,15,254,251 ; paddd %xmm3,%xmm7 DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2 DB 102,15,126,208 ; movd %xmm2,%eax @@ -53978,7 +54454,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,225 ; movdqa %xmm1,%xmm4 DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0 DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1 - DB 102,15,111,177,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm6 + DB 102,15,111,177,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm6 DB 102,15,244,198 ; pmuludq %xmm6,%xmm0 DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2 DB 102,15,244,206 ; pmuludq %xmm6,%xmm1 @@ -54000,7 +54476,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,193 ; unpcklps %xmm1,%xmm0 DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp) DB 102,15,111,202 ; movdqa %xmm2,%xmm1 - DB 102,15,254,137,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm1 + DB 102,15,254,137,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm1 DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6 DB 102,15,126,240 ; movd %xmm6,%eax DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6 @@ -54034,7 +54510,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,212 ; movdqa %xmm4,%xmm2 DB 102,15,254,85,184 ; paddd -0x48(%ebp),%xmm2 DB 102,15,112,194,245 ; pshufd $0xf5,%xmm2,%xmm0 - DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1 + DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1 DB 102,15,244,209 ; pmuludq %xmm1,%xmm2 DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4 DB 102,15,244,193 ; pmuludq %xmm1,%xmm0 @@ -54055,7 +54531,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,200 ; unpcklps %xmm0,%xmm1 DB 15,20,206 ; unpcklps %xmm6,%xmm1 DB 102,15,111,196 ; movdqa %xmm4,%xmm0 - DB 102,15,254,129,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm0 + DB 102,15,254,129,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm0 DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6 DB 102,15,126,240 ; movd %xmm6,%eax DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6 @@ -54070,7 +54546,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0 DB 15,20,208 ; unpcklps %xmm0,%xmm2 DB 15,20,214 ; unpcklps %xmm6,%xmm2 - DB 102,15,254,161,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm4 + DB 102,15,254,161,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm4 DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0 DB 102,15,126,192 ; movd %xmm0,%eax DB 102,15,112,196,78 ; pshufd $0x4e,%xmm4,%xmm0 @@ -54138,7 +54614,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,69,168 ; movdqa -0x58(%ebp),%xmm0 DB 102,15,254,193 ; paddd %xmm1,%xmm0 DB 102,15,112,224,245 ; pshufd $0xf5,%xmm0,%xmm4 - DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2 + DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2 DB 102,15,244,194 ; pmuludq %xmm2,%xmm0 DB 102,15,112,216,232 ; pshufd $0xe8,%xmm0,%xmm3 DB 102,15,244,226 ; pmuludq %xmm2,%xmm4 @@ -54161,7 +54637,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,196 ; unpcklps %xmm4,%xmm0 DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp) DB 102,15,111,227 ; movdqa %xmm3,%xmm4 - DB 102,15,111,145,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm2 + DB 102,15,111,145,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm2 DB 102,15,254,226 ; paddd %xmm2,%xmm4 DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5 DB 102,15,126,232 ; movd %xmm5,%eax @@ -54177,7 +54653,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4 DB 15,20,236 ; unpcklps %xmm4,%xmm5 DB 15,20,238 ; unpcklps %xmm6,%xmm5 - DB 102,15,254,153,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm3 + DB 102,15,254,153,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm3 DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4 DB 102,15,126,224 ; movd %xmm4,%eax DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4 @@ -54229,7 +54705,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2 DB 15,20,218 ; unpcklps %xmm2,%xmm3 DB 15,20,223 ; unpcklps %xmm7,%xmm3 - DB 102,15,254,161,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm4 + DB 102,15,254,161,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm4 DB 102,15,112,212,229 ; pshufd $0xe5,%xmm4,%xmm2 DB 102,15,126,208 ; movd %xmm2,%eax DB 102,15,112,212,78 ; pshufd $0x4e,%xmm4,%xmm2 @@ -54262,7 +54738,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,127,133,56,255,255,255 ; movdqa %xmm0,-0xc8(%ebp) DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0 DB 102,15,112,208,245 ; pshufd $0xf5,%xmm0,%xmm2 - DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1 + DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1 DB 102,15,244,193 ; pmuludq %xmm1,%xmm0 DB 102,15,112,240,232 ; pshufd $0xe8,%xmm0,%xmm6 DB 102,15,244,209 ; pmuludq %xmm1,%xmm2 @@ -54284,7 +54760,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,194 ; unpcklps %xmm2,%xmm0 DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp) DB 102,15,111,214 ; movdqa %xmm6,%xmm2 - DB 102,15,111,153,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm3 + DB 102,15,111,153,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm3 DB 102,15,254,211 ; paddd %xmm3,%xmm2 DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5 DB 102,15,126,232 ; movd %xmm5,%eax @@ -54300,7 +54776,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2 DB 15,20,234 ; unpcklps %xmm2,%xmm5 DB 15,20,239 ; unpcklps %xmm7,%xmm5 - DB 102,15,254,177,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm6 + DB 102,15,254,177,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm6 DB 102,15,112,214,229 ; pshufd $0xe5,%xmm6,%xmm2 DB 102,15,126,208 ; movd %xmm2,%eax DB 102,15,112,214,78 ; pshufd $0x4e,%xmm6,%xmm2 @@ -54353,7 +54829,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0 DB 15,20,216 ; unpcklps %xmm0,%xmm3 DB 15,20,218 ; unpcklps %xmm2,%xmm3 - DB 102,15,254,185,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm7 + DB 102,15,254,185,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm7 DB 102,15,112,199,229 ; pshufd $0xe5,%xmm7,%xmm0 DB 102,15,126,192 ; movd %xmm0,%eax DB 102,15,112,199,78 ; pshufd $0x4e,%xmm7,%xmm0 @@ -54403,7 +54879,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,233 ; movdqa %xmm1,%xmm5 DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0 DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1 - DB 102,15,111,153,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm3 + DB 102,15,111,153,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm3 DB 102,15,244,195 ; pmuludq %xmm3,%xmm0 DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2 DB 102,15,244,203 ; pmuludq %xmm3,%xmm1 @@ -54425,7 +54901,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,193 ; unpcklps %xmm1,%xmm0 DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp) DB 102,15,111,202 ; movdqa %xmm2,%xmm1 - DB 102,15,111,177,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm6 + DB 102,15,111,177,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm6 DB 102,15,254,206 ; paddd %xmm6,%xmm1 DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3 DB 102,15,126,216 ; movd %xmm3,%eax @@ -54441,7 +54917,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4 DB 15,20,204 ; unpcklps %xmm4,%xmm1 DB 15,20,203 ; unpcklps %xmm3,%xmm1 - DB 102,15,111,185,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm7 + DB 102,15,111,185,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm7 DB 102,15,254,215 ; paddd %xmm7,%xmm2 DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3 DB 102,15,126,216 ; movd %xmm3,%eax @@ -54460,7 +54936,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,111,221 ; movdqa %xmm5,%xmm3 DB 102,15,254,93,184 ; paddd -0x48(%ebp),%xmm3 DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4 - DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0 + DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0 DB 102,15,244,216 ; pmuludq %xmm0,%xmm3 DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3 DB 102,15,244,224 ; pmuludq %xmm0,%xmm4 @@ -54529,7 +55005,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 102,15,254,193 ; paddd %xmm1,%xmm0 DB 102,15,111,241 ; movdqa %xmm1,%xmm6 DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1 - DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2 + DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2 DB 102,15,244,194 ; pmuludq %xmm2,%xmm0 DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0 DB 102,15,244,202 ; pmuludq %xmm2,%xmm1 @@ -54552,7 +55028,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,218 ; unpcklps %xmm2,%xmm3 DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp) DB 102,15,111,200 ; movdqa %xmm0,%xmm1 - DB 102,15,254,137,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm1 + DB 102,15,254,137,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm1 DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2 DB 102,15,126,208 ; movd %xmm2,%eax DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2 @@ -54568,7 +55044,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 15,20,217 ; unpcklps %xmm1,%xmm3 DB 15,20,218 ; unpcklps %xmm2,%xmm3 DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp) - DB 102,15,254,129,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm0 + DB 102,15,254,129,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm0 DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1 DB 102,15,126,200 ; movd %xmm1,%eax DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 @@ -54605,7 +55081,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7 DB 15,20,199 ; unpcklps %xmm7,%xmm0 DB 15,20,193 ; unpcklps %xmm1,%xmm0 - DB 102,15,111,177,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm6 + DB 102,15,111,177,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm6 DB 102,15,254,242 ; paddd %xmm2,%xmm6 DB 102,15,112,206,229 ; pshufd $0xe5,%xmm6,%xmm1 DB 102,15,126,200 ; movd %xmm1,%eax @@ -54621,7 +55097,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 243,15,16,52,178 ; movss (%edx,%esi,4),%xmm6 DB 15,20,206 ; unpcklps %xmm6,%xmm1 DB 15,20,207 ; unpcklps %xmm7,%xmm1 - DB 102,15,254,145,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm2 + DB 102,15,254,145,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm2 DB 102,15,112,242,229 ; pshufd $0xe5,%xmm2,%xmm6 DB 102,15,126,240 ; movd %xmm6,%eax DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6 @@ -54691,7 +55167,7 @@ _sk_clut_4D_sse2 LABEL PROC DB 139,117,12 ; mov 0xc(%ebp),%esi DB 141,86,8 ; lea 0x8(%esi),%edx DB 131,236,8 ; sub $0x8,%esp - DB 15,40,153,247,42,0,0 ; movaps 0x2af7(%ecx),%xmm3 + DB 15,40,153,104,43,0,0 ; movaps 0x2b68(%ecx),%xmm3 DB 82 ; push %edx DB 80 ; push %eax DB 255,86,4 ; call *0x4(%esi) @@ -54852,16 +55328,22 @@ ALIGN 16 DB 63 ; aas DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) - DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%eax) + DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) + DB 63 ; aas + DB 0,0 ; add %al,(%eax) + DB 128,63,0 ; cmpb $0x0,(%edi) + DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) DB 191,0,0,128,191 ; mov $0xbf800000,%edi DB 0,0 ; add %al,(%eax) - DB 128,191,0,0,224,64,0 ; cmpb $0x0,0x40e00000(%edi) + DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%edi) DB 0,224 ; add %ah,%al DB 64 ; inc %eax DB 0,0 ; add %al,(%eax) - DB 224,64 ; loopne 938c <.literal16+0x1fc> + DB 224,64 ; loopne 9518 <.literal16+0x208> DB 0,0 ; add %al,(%eax) - DB 224,64 ; loopne 9390 <.literal16+0x200> + DB 224,64 ; loopne 951c <.literal16+0x20c> + DB 0,0 ; add %al,(%eax) + DB 224,64 ; loopne 9520 <.literal16+0x210> DB 154,153,153,62,154,153,153 ; lcall $0x9999,$0x9a3e9999 DB 62,154,153,153,62,154,153,153 ; ds lcall $0x9999,$0x9a3e9999 DB 62,61,10,23,63,61 ; ds cmp $0x3d3f170a,%eax @@ -54872,16 +55354,16 @@ ALIGN 16 DB 63 ; aas DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 93b1 <.literal16+0x221> + DB 225,61 ; loope 9541 <.literal16+0x231> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 93b5 <.literal16+0x225> + DB 225,61 ; loope 9545 <.literal16+0x235> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 93b9 <.literal16+0x229> + DB 225,61 ; loope 9549 <.literal16+0x239> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 93bd <.literal16+0x22d> + DB 225,61 ; loope 954d <.literal16+0x23d> DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -54898,16 +55380,16 @@ ALIGN 16 DB 63 ; aas DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax DB 71 ; inc %edi - DB 225,61 ; loope 93f1 <.literal16+0x261> + DB 225,61 ; loope 9581 <.literal16+0x271> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 93f5 <.literal16+0x265> + DB 225,61 ; loope 9585 <.literal16+0x275> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 93f9 <.literal16+0x269> + DB 225,61 ; loope 9589 <.literal16+0x279> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 93fd <.literal16+0x26d> + DB 225,61 ; loope 958d <.literal16+0x27d> DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -54924,16 +55406,16 @@ ALIGN 16 DB 63 ; aas DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax DB 71 ; inc %edi - DB 225,61 ; loope 9431 <.literal16+0x2a1> + DB 225,61 ; loope 95c1 <.literal16+0x2b1> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 9435 <.literal16+0x2a5> + DB 225,61 ; loope 95c5 <.literal16+0x2b5> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 9439 <.literal16+0x2a9> + DB 225,61 ; loope 95c9 <.literal16+0x2b9> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 943d <.literal16+0x2ad> + DB 225,61 ; loope 95cd <.literal16+0x2bd> DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -54950,16 +55432,16 @@ ALIGN 16 DB 63 ; aas DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax DB 71 ; inc %edi - DB 225,61 ; loope 9471 <.literal16+0x2e1> + DB 225,61 ; loope 9601 <.literal16+0x2f1> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 9475 <.literal16+0x2e5> + DB 225,61 ; loope 9605 <.literal16+0x2f5> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 9479 <.literal16+0x2e9> + DB 225,61 ; loope 9609 <.literal16+0x2f9> DB 174 ; scas %es:(%edi),%al DB 71 ; inc %edi - DB 225,61 ; loope 947d <.literal16+0x2ed> + DB 225,61 ; loope 960d <.literal16+0x2fd> DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -54981,11 +55463,11 @@ ALIGN 16 DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%eax) DB 67 ; inc %ebx DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 94bb <.literal16+0x32b> + DB 127,67 ; jg 964b <.literal16+0x33b> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 94bf <.literal16+0x32f> + DB 127,67 ; jg 964f <.literal16+0x33f> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 94c3 <.literal16+0x333> + DB 127,67 ; jg 9653 <.literal16+0x343> DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -55235,7 +55717,53 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax) DB 128,59,129 ; cmpb $0x81,(%ebx) - DB 128,128,59,255,0,0,0 ; addb $0x0,0xff3b(%eax) + DB 128,128,59,0,248,0,0 ; addb $0x0,0xf8003b(%eax) + DB 0,248 ; add %bh,%al + DB 0,0 ; add %al,(%eax) + DB 0,248 ; add %bh,%al + DB 0,0 ; add %al,(%eax) + DB 0,248 ; add %bh,%al + DB 0,0 ; add %al,(%eax) + DB 8,33 ; or %ah,(%ecx) + DB 132,55 ; test %dh,(%edi) + DB 8,33 ; or %ah,(%ecx) + DB 132,55 ; test %dh,(%edi) + DB 8,33 ; or %ah,(%ecx) + DB 132,55 ; test %dh,(%edi) + DB 8,33 ; or %ah,(%ecx) + DB 132,55 ; test %dh,(%edi) + DB 224,7 ; loopne 9889 <.literal16+0x579> + DB 0,0 ; add %al,(%eax) + DB 224,7 ; loopne 988d <.literal16+0x57d> + DB 0,0 ; add %al,(%eax) + DB 224,7 ; loopne 9891 <.literal16+0x581> + DB 0,0 ; add %al,(%eax) + DB 224,7 ; loopne 9895 <.literal16+0x585> + DB 0,0 ; add %al,(%eax) + DB 33,8 ; and %ecx,(%eax) + DB 2,58 ; add (%edx),%bh + DB 33,8 ; and %ecx,(%eax) + DB 2,58 ; add (%edx),%bh + DB 33,8 ; and %ecx,(%eax) + DB 2,58 ; add (%edx),%bh + DB 33,8 ; and %ecx,(%eax) + DB 2,58 ; add (%edx),%bh + DB 31 ; pop %ds + DB 0,0 ; add %al,(%eax) + DB 0,31 ; add %bl,(%edi) + DB 0,0 ; add %al,(%eax) + DB 0,31 ; add %bl,(%edi) + DB 0,0 ; add %al,(%eax) + DB 0,31 ; add %bl,(%edi) + DB 0,0 ; add %al,(%eax) + DB 0,8 ; add %cl,(%eax) + DB 33,4,61,8,33,4,61 ; and %eax,0x3d042108(,%edi,1) + DB 8,33 ; or %ah,(%ecx) + DB 4,61 ; add $0x3d,%al + DB 8,33 ; or %ah,(%ecx) + DB 4,61 ; add $0x3d,%al + DB 255,0 ; incl (%eax) + DB 0,0 ; add %al,(%eax) DB 255,0 ; incl (%eax) DB 0,0 ; add %al,(%eax) DB 255,0 ; incl (%eax) @@ -55259,13 +55787,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%edi) DB 8,33 ; or %ah,(%ecx) DB 132,55 ; test %dh,(%edi) - DB 224,7 ; loopne 9719 <.literal16+0x589> + DB 224,7 ; loopne 9909 <.literal16+0x5f9> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 971d <.literal16+0x58d> + DB 224,7 ; loopne 990d <.literal16+0x5fd> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9721 <.literal16+0x591> + DB 224,7 ; loopne 9911 <.literal16+0x601> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9725 <.literal16+0x595> + DB 224,7 ; loopne 9915 <.literal16+0x605> DB 0,0 ; add %al,(%eax) DB 33,8 ; and %ecx,(%eax) DB 2,58 ; add (%edx),%bh @@ -55314,11 +55842,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%edi) DB 0,127,67 ; add %bh,0x43(%edi) DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 97db <.literal16+0x64b> + DB 127,67 ; jg 99cb <.literal16+0x6bb> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 97df <.literal16+0x64f> + DB 127,67 ; jg 99cf <.literal16+0x6bf> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 97e3 <.literal16+0x653> + DB 127,67 ; jg 99d3 <.literal16+0x6c3> DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax) DB 128,59,129 ; cmpb $0x81,(%ebx) DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%eax) @@ -55333,16 +55861,16 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 97d4 <.literal16+0x644> + DB 127,0 ; jg 99c4 <.literal16+0x6b4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 97d8 <.literal16+0x648> + DB 127,0 ; jg 99c8 <.literal16+0x6b8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 97dc <.literal16+0x64c> + DB 127,0 ; jg 99cc <.literal16+0x6bc> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 97e0 <.literal16+0x650> + DB 127,0 ; jg 99d0 <.literal16+0x6c0> DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) @@ -55351,7 +55879,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) - DB 119,115 ; ja 9865 <.literal16+0x6d5> + DB 119,115 ; ja 9a55 <.literal16+0x745> DB 248 ; clc DB 194,119,115 ; ret $0x7377 DB 248 ; clc @@ -55362,7 +55890,7 @@ ALIGN 16 DB 194,117,191 ; ret $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas - DB 117,191 ; jne 97c9 <.literal16+0x639> + DB 117,191 ; jne 99b9 <.literal16+0x6a9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas DB 249 ; stc @@ -55378,7 +55906,7 @@ ALIGN 16 DB 68 ; inc %esp DB 180,62 ; mov $0x3e,%ah DB 163,233,220,63,163 ; mov %eax,0xa33fdce9 - DB 233,220,63,163,233 ; jmp e9a3d806 <_sk_clut_4D_sse2+0xe9a35c56> + DB 233,220,63,163,233 ; jmp e9a3d9f6 <_sk_clut_4D_sse2+0xe9a35cc7> DB 220,63 ; fdivrl (%edi) DB 163,233,220,63,0 ; mov %eax,0x3fdce9 DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -55433,16 +55961,16 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 98a4 <.literal16+0x714> + DB 127,0 ; jg 9a94 <.literal16+0x784> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 98a8 <.literal16+0x718> + DB 127,0 ; jg 9a98 <.literal16+0x788> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 98ac <.literal16+0x71c> + DB 127,0 ; jg 9a9c <.literal16+0x78c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 98b0 <.literal16+0x720> + DB 127,0 ; jg 9aa0 <.literal16+0x790> DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) @@ -55451,7 +55979,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) - DB 119,115 ; ja 9935 <.literal16+0x7a5> + DB 119,115 ; ja 9b25 <.literal16+0x815> DB 248 ; clc DB 194,119,115 ; ret $0x7377 DB 248 ; clc @@ -55462,7 +55990,7 @@ ALIGN 16 DB 194,117,191 ; ret $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas - DB 117,191 ; jne 9899 <.literal16+0x709> + DB 117,191 ; jne 9a89 <.literal16+0x779> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas DB 249 ; stc @@ -55478,7 +56006,7 @@ ALIGN 16 DB 68 ; inc %esp DB 180,62 ; mov $0x3e,%ah DB 163,233,220,63,163 ; mov %eax,0xa33fdce9 - DB 233,220,63,163,233 ; jmp e9a3d8d6 <_sk_clut_4D_sse2+0xe9a35d26> + DB 233,220,63,163,233 ; jmp e9a3dac6 <_sk_clut_4D_sse2+0xe9a35d97> DB 220,63 ; fdivrl (%edi) DB 163,233,220,63,0 ; mov %eax,0x3fdce9 DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -55533,16 +56061,16 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 9974 <.literal16+0x7e4> + DB 127,0 ; jg 9b64 <.literal16+0x854> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9978 <.literal16+0x7e8> + DB 127,0 ; jg 9b68 <.literal16+0x858> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 997c <.literal16+0x7ec> + DB 127,0 ; jg 9b6c <.literal16+0x85c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9980 <.literal16+0x7f0> + DB 127,0 ; jg 9b70 <.literal16+0x860> DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) @@ -55551,7 +56079,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) - DB 119,115 ; ja 9a05 <.literal16+0x875> + DB 119,115 ; ja 9bf5 <.literal16+0x8e5> DB 248 ; clc DB 194,119,115 ; ret $0x7377 DB 248 ; clc @@ -55562,7 +56090,7 @@ ALIGN 16 DB 194,117,191 ; ret $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas - DB 117,191 ; jne 9969 <.literal16+0x7d9> + DB 117,191 ; jne 9b59 <.literal16+0x849> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas DB 249 ; stc @@ -55578,7 +56106,7 @@ ALIGN 16 DB 68 ; inc %esp DB 180,62 ; mov $0x3e,%ah DB 163,233,220,63,163 ; mov %eax,0xa33fdce9 - DB 233,220,63,163,233 ; jmp e9a3d9a6 <_sk_clut_4D_sse2+0xe9a35df6> + DB 233,220,63,163,233 ; jmp e9a3db96 <_sk_clut_4D_sse2+0xe9a35e67> DB 220,63 ; fdivrl (%edi) DB 163,233,220,63,0 ; mov %eax,0x3fdce9 DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -55633,16 +56161,16 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 9a44 <.literal16+0x8b4> + DB 127,0 ; jg 9c34 <.literal16+0x924> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9a48 <.literal16+0x8b8> + DB 127,0 ; jg 9c38 <.literal16+0x928> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9a4c <.literal16+0x8bc> + DB 127,0 ; jg 9c3c <.literal16+0x92c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9a50 <.literal16+0x8c0> + DB 127,0 ; jg 9c40 <.literal16+0x930> DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) @@ -55651,7 +56179,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) - DB 119,115 ; ja 9ad5 <.literal16+0x945> + DB 119,115 ; ja 9cc5 <.literal16+0x9b5> DB 248 ; clc DB 194,119,115 ; ret $0x7377 DB 248 ; clc @@ -55662,7 +56190,7 @@ ALIGN 16 DB 194,117,191 ; ret $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas - DB 117,191 ; jne 9a39 <.literal16+0x8a9> + DB 117,191 ; jne 9c29 <.literal16+0x919> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas DB 249 ; stc @@ -55678,7 +56206,7 @@ ALIGN 16 DB 68 ; inc %esp DB 180,62 ; mov $0x3e,%ah DB 163,233,220,63,163 ; mov %eax,0xa33fdce9 - DB 233,220,63,163,233 ; jmp e9a3da76 <_sk_clut_4D_sse2+0xe9a35ec6> + DB 233,220,63,163,233 ; jmp e9a3dc66 <_sk_clut_4D_sse2+0xe9a35f37> DB 220,63 ; fdivrl (%edi) DB 163,233,220,63,0 ; mov %eax,0x3fdce9 DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -55733,16 +56261,16 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 9b14 <.literal16+0x984> + DB 127,0 ; jg 9d04 <.literal16+0x9f4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9b18 <.literal16+0x988> + DB 127,0 ; jg 9d08 <.literal16+0x9f8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9b1c <.literal16+0x98c> + DB 127,0 ; jg 9d0c <.literal16+0x9fc> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 9b20 <.literal16+0x990> + DB 127,0 ; jg 9d10 <.literal16+0xa00> DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) @@ -55751,7 +56279,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%edi) DB 0,0 ; add %al,(%eax) DB 0,63 ; add %bh,(%edi) - DB 119,115 ; ja 9ba5 <.literal16+0xa15> + DB 119,115 ; ja 9d95 <.literal16+0xa85> DB 248 ; clc DB 194,119,115 ; ret $0x7377 DB 248 ; clc @@ -55762,7 +56290,7 @@ ALIGN 16 DB 194,117,191 ; ret $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas - DB 117,191 ; jne 9b09 <.literal16+0x979> + DB 117,191 ; jne 9cf9 <.literal16+0x9e9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; aas DB 249 ; stc @@ -55778,7 +56306,7 @@ ALIGN 16 DB 68 ; inc %esp DB 180,62 ; mov $0x3e,%ah DB 163,233,220,63,163 ; mov %eax,0xa33fdce9 - DB 233,220,63,163,233 ; jmp e9a3db46 <_sk_clut_4D_sse2+0xe9a35f96> + DB 233,220,63,163,233 ; jmp e9a3dd36 <_sk_clut_4D_sse2+0xe9a36007> DB 220,63 ; fdivrl (%edi) DB 163,233,220,63,0 ; mov %eax,0x3fdce9 DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -55829,13 +56357,13 @@ ALIGN 16 DB 200,66,0,0 ; enter $0x42,$0x0 DB 200,66,0,0 ; enter $0x42,$0x0 DB 200,66,0,0 ; enter $0x42,$0x0 - DB 127,67 ; jg 9c27 <.literal16+0xa97> + DB 127,67 ; jg 9e17 <.literal16+0xb07> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 9c2b <.literal16+0xa9b> + DB 127,67 ; jg 9e1b <.literal16+0xb0b> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 9c2f <.literal16+0xa9f> + DB 127,67 ; jg 9e1f <.literal16+0xb0f> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 9c33 <.literal16+0xaa3> + DB 127,67 ; jg 9e23 <.literal16+0xb13> DB 0,0 ; add %al,(%eax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%eax) @@ -55886,16 +56414,16 @@ ALIGN 16 DB 128,3,62 ; addb $0x3e,(%ebx) DB 31 ; pop %ds DB 215 ; xlat %ds:(%ebx) - DB 118,63 ; jbe 9cb3 <.literal16+0xb23> + DB 118,63 ; jbe 9ea3 <.literal16+0xb93> DB 31 ; pop %ds DB 215 ; xlat %ds:(%ebx) - DB 118,63 ; jbe 9cb7 <.literal16+0xb27> + DB 118,63 ; jbe 9ea7 <.literal16+0xb97> DB 31 ; pop %ds DB 215 ; xlat %ds:(%ebx) - DB 118,63 ; jbe 9cbb <.literal16+0xb2b> + DB 118,63 ; jbe 9eab <.literal16+0xb9b> DB 31 ; pop %ds DB 215 ; xlat %ds:(%ebx) - DB 118,63 ; jbe 9cbf <.literal16+0xb2f> + DB 118,63 ; jbe 9eaf <.literal16+0xb9f> DB 246,64,83,63 ; testb $0x3f,0x53(%eax) DB 246,64,83,63 ; testb $0x3f,0x53(%eax) DB 246,64,83,63 ; testb $0x3f,0x53(%eax) @@ -55924,11 +56452,11 @@ ALIGN 16 DB 128,59,0 ; cmpb $0x0,(%ebx) DB 0,127,67 ; add %bh,0x43(%edi) DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 9d2b <.literal16+0xb9b> + DB 127,67 ; jg 9f1b <.literal16+0xc0b> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 9d2f <.literal16+0xb9f> + DB 127,67 ; jg 9f1f <.literal16+0xc0f> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg 9d33 <.literal16+0xba3> + DB 127,67 ; jg 9f23 <.literal16+0xc13> DB 255,0 ; incl (%eax) DB 0,0 ; add %al,(%eax) DB 0,0 ; add %al,(%eax) @@ -55990,13 +56518,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%edi) DB 8,33 ; or %ah,(%ecx) DB 132,55 ; test %dh,(%edi) - DB 224,7 ; loopne 9da9 <.literal16+0xc19> + DB 224,7 ; loopne 9f99 <.literal16+0xc89> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9dad <.literal16+0xc1d> + DB 224,7 ; loopne 9f9d <.literal16+0xc8d> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9db1 <.literal16+0xc21> + DB 224,7 ; loopne 9fa1 <.literal16+0xc91> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9db5 <.literal16+0xc25> + DB 224,7 ; loopne 9fa5 <.literal16+0xc95> DB 0,0 ; add %al,(%eax) DB 33,8 ; and %ecx,(%eax) DB 2,58 ; add (%edx),%bh @@ -56042,13 +56570,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%edi) DB 8,33 ; or %ah,(%ecx) DB 132,55 ; test %dh,(%edi) - DB 224,7 ; loopne 9e19 <.literal16+0xc89> + DB 224,7 ; loopne a009 <.literal16+0xcf9> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9e1d <.literal16+0xc8d> + DB 224,7 ; loopne a00d <.literal16+0xcfd> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9e21 <.literal16+0xc91> + DB 224,7 ; loopne a011 <.literal16+0xd01> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9e25 <.literal16+0xc95> + DB 224,7 ; loopne a015 <.literal16+0xd05> DB 0,0 ; add %al,(%eax) DB 33,8 ; and %ecx,(%eax) DB 2,58 ; add (%edx),%bh @@ -56094,13 +56622,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%edi) DB 8,33 ; or %ah,(%ecx) DB 132,55 ; test %dh,(%edi) - DB 224,7 ; loopne 9e89 <.literal16+0xcf9> + DB 224,7 ; loopne a079 <.literal16+0xd69> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9e8d <.literal16+0xcfd> + DB 224,7 ; loopne a07d <.literal16+0xd6d> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9e91 <.literal16+0xd01> + DB 224,7 ; loopne a081 <.literal16+0xd71> DB 0,0 ; add %al,(%eax) - DB 224,7 ; loopne 9e95 <.literal16+0xd05> + DB 224,7 ; loopne a085 <.literal16+0xd75> DB 0,0 ; add %al,(%eax) DB 33,8 ; and %ecx,(%eax) DB 2,58 ; add (%edx),%bh @@ -56142,13 +56670,13 @@ ALIGN 16 DB 248 ; clc DB 65 ; inc %ecx DB 0,0 ; add %al,(%eax) - DB 124,66 ; jl 9f26 <.literal16+0xd96> + DB 124,66 ; jl a116 <.literal16+0xe06> DB 0,0 ; add %al,(%eax) - DB 124,66 ; jl 9f2a <.literal16+0xd9a> + DB 124,66 ; jl a11a <.literal16+0xe0a> DB 0,0 ; add %al,(%eax) - DB 124,66 ; jl 9f2e <.literal16+0xd9e> + DB 124,66 ; jl a11e <.literal16+0xe0e> DB 0,0 ; add %al,(%eax) - DB 124,66 ; jl 9f32 <.literal16+0xda2> + DB 124,66 ; jl a122 <.literal16+0xe12> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%eax) DB 0,240 ; add %dh,%al @@ -56282,13 +56810,13 @@ ALIGN 16 DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%eax) DB 61,137,136,136,61 ; cmp $0x3d888889,%eax DB 0,0 ; add %al,(%eax) - DB 112,65 ; jo a0b5 <.literal16+0xf25> + DB 112,65 ; jo a2a5 <.literal16+0xf95> DB 0,0 ; add %al,(%eax) - DB 112,65 ; jo a0b9 <.literal16+0xf29> + DB 112,65 ; jo a2a9 <.literal16+0xf99> DB 0,0 ; add %al,(%eax) - DB 112,65 ; jo a0bd <.literal16+0xf2d> + DB 112,65 ; jo a2ad <.literal16+0xf9d> DB 0,0 ; add %al,(%eax) - DB 112,65 ; jo a0c1 <.literal16+0xf31> + DB 112,65 ; jo a2b1 <.literal16+0xfa1> DB 255,0 ; incl (%eax) DB 0,0 ; add %al,(%eax) DB 255,0 ; incl (%eax) @@ -56319,11 +56847,11 @@ ALIGN 16 DB 128,59,129 ; cmpb $0x81,(%ebx) DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax) DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg a12b <.literal16+0xf9b> + DB 127,67 ; jg a31b <.literal16+0x100b> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg a12f <.literal16+0xf9f> + DB 127,67 ; jg a31f <.literal16+0x100f> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg a133 <.literal16+0xfa3> + DB 127,67 ; jg a323 <.literal16+0x1013> DB 255,0 ; incl (%eax) DB 0,0 ; add %al,(%eax) DB 255,0 ; incl (%eax) @@ -56354,11 +56882,11 @@ ALIGN 16 DB 128,59,129 ; cmpb $0x81,(%ebx) DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax) DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg a19b <.literal16+0x100b> + DB 127,67 ; jg a38b <.literal16+0x107b> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg a19f <.literal16+0x100f> + DB 127,67 ; jg a38f <.literal16+0x107f> DB 0,0 ; add %al,(%eax) - DB 127,67 ; jg a1a3 <.literal16+0x1013> + DB 127,67 ; jg a393 <.literal16+0x1083> DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax) DB 0,0 ; add %al,(%eax) DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax) @@ -56457,13 +56985,13 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) DB 255 ; (bad) - DB 127,71 ; jg a2cb <.literal16+0x113b> + DB 127,71 ; jg a4bb <.literal16+0x11ab> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg a2cf <.literal16+0x113f> + DB 127,71 ; jg a4bf <.literal16+0x11af> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg a2d3 <.literal16+0x1143> + DB 127,71 ; jg a4c3 <.literal16+0x11b3> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg a2d7 <.literal16+0x1147> + DB 127,71 ; jg a4c7 <.literal16+0x11b7> DB 0,0 ; add %al,(%eax) DB 128,63,0 ; cmpb $0x0,(%edi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax) @@ -56571,7 +57099,7 @@ ALIGN 16 DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110 DB 17,192 ; adc %eax,%eax DB 45,16,17,192,18 ; sub $0x12c01110,%eax - DB 120,57 ; js a3dc <.literal16+0x124c> + DB 120,57 ; js a5cc <.literal16+0x12bc> DB 64 ; inc %eax DB 18,120,57 ; adc 0x39(%eax),%bh DB 64 ; inc %eax @@ -56764,11 +57292,11 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 128,63,114 ; cmpb $0x72,(%edi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt a5c2 <.literal16+0x1432> + DB 62,114,28 ; jb,pt a7b2 <.literal16+0x14a2> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a5c6 <.literal16+0x1436> + DB 62,114,28 ; jb,pt a7b6 <.literal16+0x14a6> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a5ca <.literal16+0x143a> + DB 62,114,28 ; jb,pt a7ba <.literal16+0x14aa> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%edi) DB 170 ; stos %al,%es:(%edi) @@ -56847,13 +57375,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%edi) DB 0,192 ; add %al,%al DB 63 ; aas - DB 114,28 ; jb a68e <.literal16+0x14fe> + DB 114,28 ; jb a87e <.literal16+0x156e> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a692 <.literal16+0x1502> + DB 62,114,28 ; jb,pt a882 <.literal16+0x1572> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a696 <.literal16+0x1506> + DB 62,114,28 ; jb,pt a886 <.literal16+0x1576> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a69a <.literal16+0x150a> + DB 62,114,28 ; jb,pt a88a <.literal16+0x157a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%edi) DB 170 ; stos %al,%es:(%edi) @@ -56874,11 +57402,11 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 128,63,114 ; cmpb $0x72,(%edi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt a6d2 <.literal16+0x1542> + DB 62,114,28 ; jb,pt a8c2 <.literal16+0x15b2> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a6d6 <.literal16+0x1546> + DB 62,114,28 ; jb,pt a8c6 <.literal16+0x15b6> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a6da <.literal16+0x154a> + DB 62,114,28 ; jb,pt a8ca <.literal16+0x15ba> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%edi) DB 170 ; stos %al,%es:(%edi) @@ -56957,13 +57485,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%edi) DB 0,192 ; add %al,%al DB 63 ; aas - DB 114,28 ; jb a79e <.literal16+0x160e> + DB 114,28 ; jb a98e <.literal16+0x167e> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a7a2 <.literal16+0x1612> + DB 62,114,28 ; jb,pt a992 <.literal16+0x1682> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a7a6 <.literal16+0x1616> + DB 62,114,28 ; jb,pt a996 <.literal16+0x1686> DB 199 ; (bad) - DB 62,114,28 ; jb,pt a7aa <.literal16+0x161a> + DB 62,114,28 ; jb,pt a99a <.literal16+0x168a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%edi) DB 170 ; stos %al,%es:(%edi) @@ -56973,14 +57501,14 @@ ALIGN 16 DB 170 ; stos %al,%es:(%edi) DB 170 ; stos %al,%es:(%edi) DB 190,171,170,170,190 ; mov $0xbeaaaaab,%esi - DB 114,249 ; jb a79b <.literal16+0x160b> - DB 127,63 ; jg a7e3 <.literal16+0x1653> - DB 114,249 ; jb a79f <.literal16+0x160f> - DB 127,63 ; jg a7e7 <.literal16+0x1657> - DB 114,249 ; jb a7a3 <.literal16+0x1613> - DB 127,63 ; jg a7eb <.literal16+0x165b> - DB 114,249 ; jb a7a7 <.literal16+0x1617> - DB 127,63 ; jg a7ef <.literal16+0x165f> + DB 114,249 ; jb a98b <.literal16+0x167b> + DB 127,63 ; jg a9d3 <.literal16+0x16c3> + DB 114,249 ; jb a98f <.literal16+0x167f> + DB 127,63 ; jg a9d7 <.literal16+0x16c7> + DB 114,249 ; jb a993 <.literal16+0x1683> + DB 127,63 ; jg a9db <.literal16+0x16cb> + DB 114,249 ; jb a997 <.literal16+0x1687> + DB 127,63 ; jg a9df <.literal16+0x16cf> DB 3,0 ; add (%eax),%eax DB 0,0 ; add %al,(%eax) DB 3,0 ; add (%eax),%eax @@ -57005,14 +57533,14 @@ ALIGN 16 DB 0,0 ; add %al,(%eax) DB 2,0 ; add (%eax),%al DB 0,0 ; add %al,(%eax) - DB 114,249 ; jb a7db <.literal16+0x164b> - DB 127,63 ; jg a823 <.literal16+0x1693> - DB 114,249 ; jb a7df <.literal16+0x164f> - DB 127,63 ; jg a827 <.literal16+0x1697> - DB 114,249 ; jb a7e3 <.literal16+0x1653> - DB 127,63 ; jg a82b <.literal16+0x169b> - DB 114,249 ; jb a7e7 <.literal16+0x1657> - DB 127,63 ; jg a82f <.literal16+0x169f> + DB 114,249 ; jb a9cb <.literal16+0x16bb> + DB 127,63 ; jg aa13 <.literal16+0x1703> + DB 114,249 ; jb a9cf <.literal16+0x16bf> + DB 127,63 ; jg aa17 <.literal16+0x1707> + DB 114,249 ; jb a9d3 <.literal16+0x16c3> + DB 127,63 ; jg aa1b <.literal16+0x170b> + DB 114,249 ; jb a9d7 <.literal16+0x16c7> + DB 127,63 ; jg aa1f <.literal16+0x170f> DB 3,0 ; add (%eax),%eax DB 0,0 ; add %al,(%eax) DB 3,0 ; add (%eax),%eax diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp index 23b756e9ed..29651cab7d 100644 --- a/src/jumper/SkJumper_stages.cpp +++ b/src/jumper/SkJumper_stages.cpp @@ -329,7 +329,7 @@ BLEND_MODE(dstover) { return mad(s, inv(da), d); } BLEND_MODE(modulate) { return s*d; } BLEND_MODE(multiply) { return s*inv(da) + d*inv(sa) + s*d; } -BLEND_MODE(plus_) { return s + d; } +BLEND_MODE(plus_) { return min(s + d, 1.0f); } // We can clamp to either 1 or sa. BLEND_MODE(screen) { return s + d - s*d; } BLEND_MODE(xor_) { return s*inv(da) + d*inv(sa); } #undef BLEND_MODE @@ -631,8 +631,8 @@ STAGE(to_srgb) { } STAGE(rgb_to_hsl) { - F mx = max(max(r,g), b), - mn = min(min(r,g), b), + F mx = max(r,g,b), + mn = min(r,g,b), d = mx - mn, d_rcp = 1.0f / d; @@ -673,6 +673,12 @@ STAGE(hsl_to_rgb) { b = if_then_else(s == 0, l, hue_to_rgb(h - (1/3.0f))); } +// Derive alpha's coverage from rgb coverage and the values of src and dst alpha. +SI F alpha_coverage_from_rgb_coverage(F a, F da, F cr, F cg, F cb) { + return if_then_else(a < da, min(cr,cg,cb) + , max(cr,cg,cb)); +} + STAGE(scale_1_float) { auto c = *(const float*)ctx; @@ -692,6 +698,19 @@ STAGE(scale_u8) { b = b * c; a = a * c; } +STAGE(scale_565) { + auto ptr = ptr_at_xy<const uint16_t>(ctx, x,y); + + F cr,cg,cb; + from_565(load<U16>(ptr, tail), &cr, &cg, &cb); + + F ca = alpha_coverage_from_rgb_coverage(a,da, cr,cg,cb); + + r = r * cr; + g = g * cg; + b = b * cb; + a = a * ca; +} SI F lerp(F from, F to, F t) { return mad(to-from, t, from); @@ -722,10 +741,12 @@ STAGE(lerp_565) { F cr,cg,cb; from_565(load<U16>(ptr, tail), &cr, &cg, &cb); + F ca = alpha_coverage_from_rgb_coverage(a,da, cr,cg,cb); + r = lerp(dr, r, cr); g = lerp(dg, g, cg); b = lerp(db, b, cb); - a = max(lerp(da, a, cr), lerp(da, a, cg), lerp(da, a, cb)); + a = lerp(da, a, ca); } STAGE(load_tables) { diff --git a/src/jumper/SkJumper_stages_8bit.cpp b/src/jumper/SkJumper_stages_8bit.cpp index 5ee3417ece..3e119010e4 100644 --- a/src/jumper/SkJumper_stages_8bit.cpp +++ b/src/jumper/SkJumper_stages_8bit.cpp @@ -157,6 +157,20 @@ SI V min(V a, V b) { return if_then_else(a.u8x4 > b.u8x4, b.u8x4, a.u8x4); } +SI V saturated_add(V a, V b) { + R a_lo, a_hi, + b_lo, b_hi; + split(a.u8x4, &a_lo, &a_hi); + split(b.u8x4, &b_lo, &b_hi); +#if defined(__AVX2__) + return join(_mm256_adds_epu8(a_lo, b_lo), + _mm256_adds_epu8(a_hi, b_hi)); +#else + return join(_mm_adds_epu8(a_lo, b_lo), + _mm_adds_epu8(a_hi, b_hi)); +#endif +} + struct Params { size_t x,y,tail; }; @@ -385,6 +399,7 @@ STAGE(modulate) { src = src*dst; } STAGE(multiply) { src = src*inv(alpha(dst)) + dst*inv(alpha(src)) + src*dst; } STAGE(screen) { src = src + inv(src)*dst; } STAGE(xor_) { src = src*inv(alpha(dst)) + dst*inv(alpha(src)); } +STAGE(plus_) { src = saturated_add(src, dst); } SI V srcover_alpha(V src, V dst, V rgb) { V a = src + (dst - dst*alpha(src)); @@ -443,8 +458,6 @@ STAGE(overlay) { // Missing blendmode specializations: // -// plus - tricky due to clamping vs. partial coverage (especially with LCD masks). -// // colorburn | // colordodge > these involve division, which makes them (much) slower than the float stages. // softlight | |