aboutsummaryrefslogtreecommitdiffhomepage
path: root/src
diff options
context:
space:
mode:
Diffstat (limited to 'src')
-rw-r--r--src/core/SkBlendMode.cpp18
-rw-r--r--src/core/SkBlendModePriv.h10
-rw-r--r--src/core/SkRasterPipeline.h4
-rw-r--r--src/core/SkRasterPipelineBlitter.cpp33
-rw-r--r--src/core/SkXfermode.cpp14
-rw-r--r--src/jumper/SkJumper.cpp1
-rw-r--r--src/jumper/SkJumper_generated.S9724
-rw-r--r--src/jumper/SkJumper_generated_win.S8580
-rw-r--r--src/jumper/SkJumper_stages.cpp29
-rw-r--r--src/jumper/SkJumper_stages_8bit.cpp17
10 files changed, 9859 insertions, 8571 deletions
diff --git a/src/core/SkBlendMode.cpp b/src/core/SkBlendMode.cpp
index 35d49d2499..ef96cc0376 100644
--- a/src/core/SkBlendMode.cpp
+++ b/src/core/SkBlendMode.cpp
@@ -62,7 +62,15 @@ bool SkBlendMode_AsCoeff(SkBlendMode mode, SkBlendModeCoeff* src, SkBlendModeCoe
return true;
}
-void SkBlendMode_AppendStagesNoClamp(SkBlendMode mode, SkRasterPipeline* p) {
+bool SkBlendMode_ShouldPreScaleCoverage(SkBlendMode mode, bool rgb_coverage) {
+ // The most important things we do here are:
+ // - always use pre-scaling for plus mode;
+ // - never use pre-scaling for srcover with 565 coverage.
+ return mode == SkBlendMode::kPlus ||
+ (mode == SkBlendMode::kSrcOver && !rgb_coverage);
+}
+
+void SkBlendMode_AppendStages(SkBlendMode mode, SkRasterPipeline* p) {
auto stage = SkRasterPipeline::srcover;
switch (mode) {
case SkBlendMode::kClear: stage = SkRasterPipeline::clear; break;
@@ -100,14 +108,6 @@ void SkBlendMode_AppendStagesNoClamp(SkBlendMode mode, SkRasterPipeline* p) {
p->append(stage);
}
-void SkBlendMode_AppendClampIfNeeded(SkBlendMode mode, SkRasterPipeline* p) {
- if (mode == SkBlendMode::kPlus) {
- // Both clamp_a and clamp_1 would preserve premultiplication invariants here,
- // so we pick clamp_1 for being a smidge faster.
- p->append(SkRasterPipeline::clamp_1);
- }
-}
-
SkPM4f SkBlendMode_Apply(SkBlendMode mode, const SkPM4f& src, const SkPM4f& dst) {
// special-case simple/common modes...
switch (mode) {
diff --git a/src/core/SkBlendModePriv.h b/src/core/SkBlendModePriv.h
index c2822656cb..8d04e09fd7 100644
--- a/src/core/SkBlendModePriv.h
+++ b/src/core/SkBlendModePriv.h
@@ -19,14 +19,8 @@ static inline bool SkBlendMode_CaresAboutRBOrder(SkBlendMode mode) {
return (mode > SkBlendMode::kLastSeparableMode);
}
-void SkBlendMode_AppendStagesNoClamp(SkBlendMode, SkRasterPipeline*);
-void SkBlendMode_AppendClampIfNeeded(SkBlendMode, SkRasterPipeline*);
-
-static inline void SkBlendMode_AppendStages(SkBlendMode mode, SkRasterPipeline* p) {
- // Only plus clamps, so maybe append a clamping plus here instead of a second stage?
- SkBlendMode_AppendStagesNoClamp(mode, p);
- SkBlendMode_AppendClampIfNeeded(mode, p);
-}
+bool SkBlendMode_ShouldPreScaleCoverage(SkBlendMode, bool rgb_coverage);
+void SkBlendMode_AppendStages(SkBlendMode, SkRasterPipeline*);
enum class SkBlendModeCoeff {
kZero, /** 0 */
diff --git a/src/core/SkRasterPipeline.h b/src/core/SkRasterPipeline.h
index adb0ed0187..ee24c266b0 100644
--- a/src/core/SkRasterPipeline.h
+++ b/src/core/SkRasterPipeline.h
@@ -57,8 +57,8 @@ struct SkJumper_Engine;
M(load_u16_be) M(load_rgb_u16_be) M(store_u16_be) \
M(load_tables_u16_be) M(load_tables_rgb_u16_be) \
M(load_tables) M(load_rgba) M(store_rgba) \
- M(scale_u8) M(scale_1_float) \
- M(lerp_u8) M(lerp_565) M(lerp_1_float) \
+ M(scale_u8) M(scale_565) M(scale_1_float) \
+ M( lerp_u8) M( lerp_565) M( lerp_1_float) \
M(dstatop) M(dstin) M(dstout) M(dstover) \
M(srcatop) M(srcin) M(srcout) M(srcover) \
M(clear) M(modulate) M(multiply) M(plus_) M(screen) M(xor_) \
diff --git a/src/core/SkRasterPipelineBlitter.cpp b/src/core/SkRasterPipelineBlitter.cpp
index fb15014a85..4c484a0439 100644
--- a/src/core/SkRasterPipelineBlitter.cpp
+++ b/src/core/SkRasterPipelineBlitter.cpp
@@ -52,7 +52,6 @@ public:
private:
void append_load_d(SkRasterPipeline*) const;
void append_blend (SkRasterPipeline*) const;
- void maybe_clamp (SkRasterPipeline*) const;
void append_store (SkRasterPipeline*) const;
// If we have an burst context, use it to fill our shader buffer.
@@ -273,19 +272,15 @@ void SkRasterPipelineBlitter::append_store(SkRasterPipeline* p) const {
}
void SkRasterPipelineBlitter::append_blend(SkRasterPipeline* p) const {
- if (fDst.info().alphaType() == kUnpremul_SkAlphaType) {
+ if (fDst.info().alphaType() == kUnpremul_SkAlphaType) { // TODO: move to append_load_d
p->append(SkRasterPipeline::premul_dst);
}
- SkBlendMode_AppendStagesNoClamp(fBlend, p);
- if (fDst.info().alphaType() == kUnpremul_SkAlphaType) {
+ SkBlendMode_AppendStages(fBlend, p);
+ if (fDst.info().alphaType() == kUnpremul_SkAlphaType) { // TODO: move to append_store
p->append(SkRasterPipeline::unpremul);
}
}
-void SkRasterPipelineBlitter::maybe_clamp(SkRasterPipeline* p) const {
- SkBlendMode_AppendClampIfNeeded(fBlend, p);
-}
-
void SkRasterPipelineBlitter::burst_shade(int x, int y, int w) {
SkASSERT(fBurstCtx);
if (w > SkToInt(fShaderBuffer.size())) {
@@ -328,7 +323,6 @@ void SkRasterPipelineBlitter::blitRect(int x, int y, int w, int h) {
if (fBlend != SkBlendMode::kSrc) {
this->append_load_d(&p);
this->append_blend(&p);
- this->maybe_clamp(&p);
}
this->append_store(&p);
}
@@ -351,7 +345,7 @@ void SkRasterPipelineBlitter::blitAntiH(int x, int y, const SkAlpha aa[], const
if (!fBlitAntiH) {
SkRasterPipeline p(fAlloc);
p.extend(fColorPipeline);
- if (fBlend == SkBlendMode::kSrcOver) {
+ if (SkBlendMode_ShouldPreScaleCoverage(fBlend, /*rgb_coverage=*/false)) {
p.append(SkRasterPipeline::scale_1_float, &fCurrentCoverage);
this->append_load_d(&p);
this->append_blend(&p);
@@ -360,7 +354,7 @@ void SkRasterPipelineBlitter::blitAntiH(int x, int y, const SkAlpha aa[], const
this->append_blend(&p);
p.append(SkRasterPipeline::lerp_1_float, &fCurrentCoverage);
}
- this->maybe_clamp(&p);
+
this->append_store(&p);
fBlitAntiH = p.compile();
}
@@ -405,7 +399,7 @@ void SkRasterPipelineBlitter::blitMask(const SkMask& mask, const SkIRect& clip)
if (mask.fFormat == SkMask::kA8_Format && !fBlitMaskA8) {
SkRasterPipeline p(fAlloc);
p.extend(fColorPipeline);
- if (fBlend == SkBlendMode::kSrcOver) {
+ if (SkBlendMode_ShouldPreScaleCoverage(fBlend, /*rgb_coverage=*/false)) {
p.append(SkRasterPipeline::scale_u8, &fMaskPtr);
this->append_load_d(&p);
this->append_blend(&p);
@@ -414,17 +408,22 @@ void SkRasterPipelineBlitter::blitMask(const SkMask& mask, const SkIRect& clip)
this->append_blend(&p);
p.append(SkRasterPipeline::lerp_u8, &fMaskPtr);
}
- this->maybe_clamp(&p);
this->append_store(&p);
fBlitMaskA8 = p.compile();
}
if (mask.fFormat == SkMask::kLCD16_Format && !fBlitMaskLCD16) {
SkRasterPipeline p(fAlloc);
p.extend(fColorPipeline);
- this->append_load_d(&p);
- this->append_blend(&p);
- p.append(SkRasterPipeline::lerp_565, &fMaskPtr);
- this->maybe_clamp(&p);
+ if (SkBlendMode_ShouldPreScaleCoverage(fBlend, /*rgb_coverage=*/true)) {
+ // Somewhat unusually, scale_565 needs dst loaded first.
+ this->append_load_d(&p);
+ p.append(SkRasterPipeline::scale_565, &fMaskPtr);
+ this->append_blend(&p);
+ } else {
+ this->append_load_d(&p);
+ this->append_blend(&p);
+ p.append(SkRasterPipeline::lerp_565, &fMaskPtr);
+ }
this->append_store(&p);
fBlitMaskLCD16 = p.compile();
}
diff --git a/src/core/SkXfermode.cpp b/src/core/SkXfermode.cpp
index 29296c3343..8a66363f74 100644
--- a/src/core/SkXfermode.cpp
+++ b/src/core/SkXfermode.cpp
@@ -49,11 +49,17 @@ public:
p.append(SkRasterPipeline::load_8888, &src_ctx);
}
- SkBlendMode_AppendStagesNoClamp(fMode, &p);
- if (aa) {
- p.append(SkRasterPipeline::lerp_u8, &aa_ctx);
+ if (SkBlendMode_ShouldPreScaleCoverage(fMode, /*rgb_coverage=*/false)) {
+ if (aa) {
+ p.append(SkRasterPipeline::scale_u8, &aa_ctx);
+ }
+ SkBlendMode_AppendStages(fMode, &p);
+ } else {
+ SkBlendMode_AppendStages(fMode, &p);
+ if (aa) {
+ p.append(SkRasterPipeline::lerp_u8, &aa_ctx);
+ }
}
- SkBlendMode_AppendClampIfNeeded(fMode, &p);
if (kN32_SkColorType == kBGRA_8888_SkColorType) {
p.append(SkRasterPipeline::store_bgra, &dst_ctx);
diff --git a/src/jumper/SkJumper.cpp b/src/jumper/SkJumper.cpp
index b36084ccac..afd12e073c 100644
--- a/src/jumper/SkJumper.cpp
+++ b/src/jumper/SkJumper.cpp
@@ -99,6 +99,7 @@ using StartPipelineFn = void(size_t,size_t,size_t,size_t, void**,K*);
M(multiply) \
M(screen) \
M(xor_) \
+ M(plus_) \
M(darken) \
M(lighten) \
M(difference) \
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index e072a564c9..93848bac3e 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -385,9 +385,14 @@ FUNCTION(_sk_plus__aarch64)
_sk_plus__aarch64:
.long 0xf8408425 // ldr x5, [x1], #8
.long 0x4e24d400 // fadd v0.4s, v0.4s, v4.4s
+ .long 0x4f03f610 // fmov v16.4s, #1.000000000000000000e+00
.long 0x4e25d421 // fadd v1.4s, v1.4s, v5.4s
.long 0x4e26d442 // fadd v2.4s, v2.4s, v6.4s
.long 0x4e27d463 // fadd v3.4s, v3.4s, v7.4s
+ .long 0x4eb0f400 // fmin v0.4s, v0.4s, v16.4s
+ .long 0x4eb0f421 // fmin v1.4s, v1.4s, v16.4s
+ .long 0x4eb0f442 // fmin v2.4s, v2.4s, v16.4s
+ .long 0x4eb0f463 // fmin v3.4s, v3.4s, v16.4s
.long 0xd61f00a0 // br x5
HIDDEN _sk_screen_aarch64
@@ -1307,7 +1312,7 @@ _sk_srcover_rgba_8888_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb5000504 // cbnz x4, 11c4 <_sk_srcover_rgba_8888_aarch64+0xbc>
+ .long 0xb5000504 // cbnz x4, 11d8 <_sk_srcover_rgba_8888_aarch64+0xbc>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x6f380486 // ushr v6.4s, v4.4s, #8
@@ -1342,42 +1347,42 @@ _sk_srcover_rgba_8888_aarch64:
.long 0x6e21a871 // fcvtnu v17.4s, v3.4s
.long 0x4f385631 // shl v17.4s, v17.4s, #24
.long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b
- .long 0xb5000284 // cbnz x4, 1200 <_sk_srcover_rgba_8888_aarch64+0xf8>
+ .long 0xb5000284 // cbnz x4, 1214 <_sk_srcover_rgba_8888_aarch64+0xf8>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000300 // b.eq 122c <_sk_srcover_rgba_8888_aarch64+0x124> // b.none
+ .long 0x54000300 // b.eq 1240 <_sk_srcover_rgba_8888_aarch64+0x124> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 11f0 <_sk_srcover_rgba_8888_aarch64+0xe8> // b.none
+ .long 0x540000c0 // b.eq 1204 <_sk_srcover_rgba_8888_aarch64+0xe8> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffa61 // b.ne 112c <_sk_srcover_rgba_8888_aarch64+0x24> // b.any
+ .long 0x54fffa61 // b.ne 1140 <_sk_srcover_rgba_8888_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffcc // b 112c <_sk_srcover_rgba_8888_aarch64+0x24>
+ .long 0x17ffffcc // b 1140 <_sk_srcover_rgba_8888_aarch64+0x24>
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000180 // b.eq 1238 <_sk_srcover_rgba_8888_aarch64+0x130> // b.none
+ .long 0x54000180 // b.eq 124c <_sk_srcover_rgba_8888_aarch64+0x130> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 1224 <_sk_srcover_rgba_8888_aarch64+0x11c> // b.none
+ .long 0x540000a0 // b.eq 1238 <_sk_srcover_rgba_8888_aarch64+0x11c> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd01 // b.ne 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0> // b.any
+ .long 0x54fffd01 // b.ne 11cc <_sk_srcover_rgba_8888_aarch64+0xb0> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17ffffe4 // b 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0>
+ .long 0x17ffffe4 // b 11cc <_sk_srcover_rgba_8888_aarch64+0xb0>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffbe // b 112c <_sk_srcover_rgba_8888_aarch64+0x24>
+ .long 0x17ffffbe // b 1140 <_sk_srcover_rgba_8888_aarch64+0x24>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17ffffdf // b 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0>
+ .long 0x17ffffdf // b 11cc <_sk_srcover_rgba_8888_aarch64+0xb0>
HIDDEN _sk_clamp_0_aarch64
.globl _sk_clamp_0_aarch64
@@ -1680,44 +1685,44 @@ HIDDEN _sk_rgb_to_hsl_aarch64
.globl _sk_rgb_to_hsl_aarch64
FUNCTION(_sk_rgb_to_hsl_aarch64)
_sk_rgb_to_hsl_aarch64:
- .long 0x4e21f410 // fmax v16.4s, v0.4s, v1.4s
- .long 0x4ea1f411 // fmin v17.4s, v0.4s, v1.4s
+ .long 0x4e22f430 // fmax v16.4s, v1.4s, v2.4s
+ .long 0x4ea2f431 // fmin v17.4s, v1.4s, v2.4s
.long 0x6ea1e454 // fcmgt v20.4s, v2.4s, v1.4s
.long 0x4f00f715 // fmov v21.4s, #6.000000000000000000e+00
- .long 0x4e22f610 // fmax v16.4s, v16.4s, v2.4s
- .long 0x4ea2f631 // fmin v17.4s, v17.4s, v2.4s
+ .long 0x4e30f410 // fmax v16.4s, v0.4s, v16.4s
+ .long 0x4eb1f411 // fmin v17.4s, v0.4s, v17.4s
.long 0x4f03f612 // fmov v18.4s, #1.000000000000000000e+00
.long 0x4e341eb4 // and v20.16b, v21.16b, v20.16b
.long 0x4eb1d615 // fsub v21.4s, v16.4s, v17.4s
.long 0x4ea2d433 // fsub v19.4s, v1.4s, v2.4s
- .long 0x4ea0d456 // fsub v22.4s, v2.4s, v0.4s
- .long 0x4f026417 // movi v23.4s, #0x40, lsl #24
- .long 0x6e35fe42 // fdiv v2.4s, v18.4s, v21.4s
- .long 0x4ea1d418 // fsub v24.4s, v0.4s, v1.4s
- .long 0x4f00f619 // fmov v25.4s, #4.000000000000000000e+00
- .long 0x4f0167fa // movi v26.4s, #0x3f, lsl #24
- .long 0x4eb0d6f2 // fsub v18.4s, v23.4s, v16.4s
- .long 0x4e36cc57 // fmla v23.4s, v2.4s, v22.4s
- .long 0x4e31e616 // fcmeq v22.4s, v16.4s, v17.4s
+ .long 0x4ea0d442 // fsub v2.4s, v2.4s, v0.4s
+ .long 0x4f026416 // movi v22.4s, #0x40, lsl #24
+ .long 0x4ea1d417 // fsub v23.4s, v0.4s, v1.4s
+ .long 0x4f00f618 // fmov v24.4s, #4.000000000000000000e+00
+ .long 0x6e35fe52 // fdiv v18.4s, v18.4s, v21.4s
+ .long 0x4f0167f9 // movi v25.4s, #0x3f, lsl #24
+ .long 0x4e33ce54 // fmla v20.4s, v18.4s, v19.4s
+ .long 0x4eb0d6d3 // fsub v19.4s, v22.4s, v16.4s
+ .long 0x4e22ce56 // fmla v22.4s, v18.4s, v2.4s
+ .long 0x4e37ce58 // fmla v24.4s, v18.4s, v23.4s
+ .long 0x4e31e612 // fcmeq v18.4s, v16.4s, v17.4s
.long 0x4e20e600 // fcmeq v0.4s, v16.4s, v0.4s
.long 0x4e21e601 // fcmeq v1.4s, v16.4s, v1.4s
.long 0x4e31d610 // fadd v16.4s, v16.4s, v17.4s
.long 0x52a7c548 // mov w8, #0x3e2a0000
- .long 0x4e33cc54 // fmla v20.4s, v2.4s, v19.4s
- .long 0x4e38cc59 // fmla v25.4s, v2.4s, v24.4s
- .long 0x6e3ade02 // fmul v2.4s, v16.4s, v26.4s
+ .long 0x6e39de02 // fmul v2.4s, v16.4s, v25.4s
.long 0x72955568 // movk w8, #0xaaab
.long 0xf8408425 // ldr x5, [x1], #8
- .long 0x4eb1d651 // fsub v17.4s, v18.4s, v17.4s
- .long 0x6ebae452 // fcmgt v18.4s, v2.4s, v26.4s
- .long 0x6e791ee1 // bsl v1.16b, v23.16b, v25.16b
- .long 0x4e040d13 // dup v19.4s, w8
- .long 0x6e701e32 // bsl v18.16b, v17.16b, v16.16b
+ .long 0x4eb1d671 // fsub v17.4s, v19.4s, v17.4s
+ .long 0x6eb9e453 // fcmgt v19.4s, v2.4s, v25.4s
+ .long 0x6e781ec1 // bsl v1.16b, v22.16b, v24.16b
+ .long 0x4e040d1a // dup v26.4s, w8
+ .long 0x6e701e33 // bsl v19.16b, v17.16b, v16.16b
.long 0x6e611e80 // bsl v0.16b, v20.16b, v1.16b
- .long 0x6e32fea1 // fdiv v1.4s, v21.4s, v18.4s
- .long 0x6e33dc00 // fmul v0.4s, v0.4s, v19.4s
- .long 0x4e761c00 // bic v0.16b, v0.16b, v22.16b
- .long 0x4e761c21 // bic v1.16b, v1.16b, v22.16b
+ .long 0x6e33fea1 // fdiv v1.4s, v21.4s, v19.4s
+ .long 0x6e3adc00 // fmul v0.4s, v0.4s, v26.4s
+ .long 0x4e721c00 // bic v0.16b, v0.16b, v18.16b
+ .long 0x4e721c21 // bic v1.16b, v1.16b, v18.16b
.long 0xd61f00a0 // br x5
HIDDEN _sk_hsl_to_rgb_aarch64
@@ -1823,7 +1828,7 @@ _sk_scale_u8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 1814 <_sk_scale_u8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 1828 <_sk_scale_u8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -1848,12 +1853,12 @@ _sk_scale_u8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 1860 <_sk_scale_u8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 1874 <_sk_scale_u8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e410 // movi d16, #0x0
- .long 0x540000c0 // b.eq 1840 <_sk_scale_u8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 1854 <_sk_scale_u8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 17dc <_sk_scale_u8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 17f0 <_sk_scale_u8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e0a1d30 // mov v16.h[2], w9
@@ -1864,11 +1869,83 @@ _sk_scale_u8_aarch64:
.long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
.long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
.long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
- .long 0x17ffffe0 // b 17dc <_sk_scale_u8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 17f0 <_sk_scale_u8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e021d10 // mov v16.h[0], w8
- .long 0x17ffffdc // b 17dc <_sk_scale_u8_aarch64+0x3c>
+ .long 0x17ffffdc // b 17f0 <_sk_scale_u8_aarch64+0x3c>
+
+HIDDEN _sk_scale_565_aarch64
+.globl _sk_scale_565_aarch64
+FUNCTION(_sk_scale_565_aarch64)
+_sk_scale_565_aarch64:
+ .long 0xf9400028 // ldr x8, [x1]
+ .long 0xb9400909 // ldr w9, [x8, #8]
+ .long 0xf9400108 // ldr x8, [x8]
+ .long 0x1b037d29 // mul w9, w9, w3
+ .long 0x8b29c508 // add x8, x8, w9, sxtw #1
+ .long 0xd3607c49 // lsl x9, x2, #32
+ .long 0x8b897d08 // add x8, x8, x9, asr #31
+ .long 0xb50004c4 // cbnz x4, 1938 <_sk_scale_565_aarch64+0xb4>
+ .long 0xfd400110 // ldr d16, [x8]
+ .long 0x52a6f088 // mov w8, #0x37840000
+ .long 0x72842108 // movk w8, #0x2108
+ .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x321b17e8 // orr w8, wzr, #0x7e0
+ .long 0x4e040d13 // dup v19.4s, w8
+ .long 0x52a74048 // mov w8, #0x3a020000
+ .long 0x2f10a610 // uxtl v16.4s, v16.4h
+ .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8
+ .long 0x72810428 // movk w8, #0x821
+ .long 0x4f0007f4 // movi v20.4s, #0x1f
+ .long 0x4e040d15 // dup v21.4s, w8
+ .long 0x52a7a088 // mov w8, #0x3d040000
+ .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b
+ .long 0x72842108 // movk w8, #0x2108
+ .long 0x4e341e14 // and v20.16b, v16.16b, v20.16b
+ .long 0x4e331e10 // and v16.16b, v16.16b, v19.16b
+ .long 0x4e21da31 // scvtf v17.4s, v17.4s
+ .long 0x6e32de31 // fmul v17.4s, v17.4s, v18.4s
+ .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x4e21da94 // scvtf v20.4s, v20.4s
+ .long 0x4e21da10 // scvtf v16.4s, v16.4s
+ .long 0x6e32de92 // fmul v18.4s, v20.4s, v18.4s
+ .long 0x6e35de10 // fmul v16.4s, v16.4s, v21.4s
+ .long 0xf9400425 // ldr x5, [x1, #8]
+ .long 0x6e22de42 // fmul v2.4s, v18.4s, v2.4s
+ .long 0x4eb2f614 // fmin v20.4s, v16.4s, v18.4s
+ .long 0x4e32f612 // fmax v18.4s, v16.4s, v18.4s
+ .long 0x6ea3e4f3 // fcmgt v19.4s, v7.4s, v3.4s
+ .long 0x6e20de20 // fmul v0.4s, v17.4s, v0.4s
+ .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s
+ .long 0x4eb4f630 // fmin v16.4s, v17.4s, v20.4s
+ .long 0x4e32f631 // fmax v17.4s, v17.4s, v18.4s
+ .long 0x6e711e13 // bsl v19.16b, v16.16b, v17.16b
+ .long 0x6e23de63 // fmul v3.4s, v19.4s, v3.4s
+ .long 0x91004021 // add x1, x1, #0x10
+ .long 0xd61f00a0 // br x5
+ .long 0x12000489 // and w9, w4, #0x3
+ .long 0x7100053f // cmp w9, #0x1
+ .long 0x54000220 // b.eq 1984 <_sk_scale_565_aarch64+0x100> // b.none
+ .long 0x7100093f // cmp w9, #0x2
+ .long 0x2f00e410 // movi d16, #0x0
+ .long 0x540000c0 // b.eq 1964 <_sk_scale_565_aarch64+0xe0> // b.none
+ .long 0x71000d3f // cmp w9, #0x3
+ .long 0x54fffaa1 // b.ne 18a8 <_sk_scale_565_aarch64+0x24> // b.any
+ .long 0x91001109 // add x9, x8, #0x4
+ .long 0x0e020ff0 // dup v16.4h, wzr
+ .long 0x0d405130 // ld1 {v16.h}[2], [x9]
+ .long 0x79400109 // ldrh w9, [x8]
+ .long 0x79400508 // ldrh w8, [x8, #2]
+ .long 0x4e041d31 // mov v17.s[0], w9
+ .long 0x4e0c1d11 // mov v17.s[1], w8
+ .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
+ .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
+ .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
+ .long 0x17ffffca // b 18a8 <_sk_scale_565_aarch64+0x24>
+ .long 0x0e020ff0 // dup v16.4h, wzr
+ .long 0x0d404110 // ld1 {v16.h}[0], [x8]
+ .long 0x17ffffc7 // b 18a8 <_sk_scale_565_aarch64+0x24>
HIDDEN _sk_lerp_1_float_aarch64
.globl _sk_lerp_1_float_aarch64
@@ -1900,7 +1977,7 @@ _sk_lerp_u8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50003e4 // cbnz x4, 1940 <_sk_lerp_u8_aarch64+0x94>
+ .long 0xb50003e4 // cbnz x4, 1a60 <_sk_lerp_u8_aarch64+0x94>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -1933,12 +2010,12 @@ _sk_lerp_u8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 198c <_sk_lerp_u8_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 1aac <_sk_lerp_u8_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e410 // movi d16, #0x0
- .long 0x540000c0 // b.eq 196c <_sk_lerp_u8_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 1a8c <_sk_lerp_u8_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc61 // b.ne 18e8 <_sk_lerp_u8_aarch64+0x3c> // b.any
+ .long 0x54fffc61 // b.ne 1a08 <_sk_lerp_u8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e0a1d30 // mov v16.h[2], w9
@@ -1949,11 +2026,11 @@ _sk_lerp_u8_aarch64:
.long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
.long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
.long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
- .long 0x17ffffd8 // b 18e8 <_sk_lerp_u8_aarch64+0x3c>
+ .long 0x17ffffd8 // b 1a08 <_sk_lerp_u8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e021d10 // mov v16.h[0], w8
- .long 0x17ffffd4 // b 18e8 <_sk_lerp_u8_aarch64+0x3c>
+ .long 0x17ffffd4 // b 1a08 <_sk_lerp_u8_aarch64+0x3c>
HIDDEN _sk_lerp_565_aarch64
.globl _sk_lerp_565_aarch64
@@ -1966,60 +2043,60 @@ _sk_lerp_565_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50005c4 // cbnz x4, 1a70 <_sk_lerp_565_aarch64+0xd4>
+ .long 0xb50005c4 // cbnz x4, 1b90 <_sk_lerp_565_aarch64+0xd4>
.long 0xfd400110 // ldr d16, [x8]
- .long 0x321b17e8 // orr w8, wzr, #0x7e0
- .long 0x4e040d12 // dup v18.4s, w8
.long 0x52a6f088 // mov w8, #0x37840000
- .long 0x2f10a610 // uxtl v16.4s, v16.4h
- .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8
.long 0x72842108 // movk w8, #0x2108
- .long 0x4f0007f3 // movi v19.4s, #0x1f
- .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b
- .long 0x4e331e13 // and v19.16b, v16.16b, v19.16b
- .long 0x4e321e10 // and v16.16b, v16.16b, v18.16b
.long 0x4e040d12 // dup v18.4s, w8
+ .long 0x321b17e8 // orr w8, wzr, #0x7e0
+ .long 0x2f10a610 // uxtl v16.4s, v16.4h
+ .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8
+ .long 0x4e040d13 // dup v19.4s, w8
.long 0x52a7a088 // mov w8, #0x3d040000
.long 0x72842108 // movk w8, #0x2108
- .long 0x4e21da31 // scvtf v17.4s, v17.4s
- .long 0x6e32de31 // fmul v17.4s, v17.4s, v18.4s
- .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x4f0007f5 // movi v21.4s, #0x1f
+ .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b
+ .long 0x4e040d14 // dup v20.4s, w8
.long 0x52a74048 // mov w8, #0x3a020000
+ .long 0x4e351e15 // and v21.16b, v16.16b, v21.16b
+ .long 0x4ea4d416 // fsub v22.4s, v0.4s, v4.4s
+ .long 0x4e21da20 // scvtf v0.4s, v17.4s
.long 0x72810428 // movk w8, #0x821
- .long 0x4ea4d414 // fsub v20.4s, v0.4s, v4.4s
- .long 0x4e21da60 // scvtf v0.4s, v19.4s
- .long 0x6e32dc12 // fmul v18.4s, v0.4s, v18.4s
- .long 0x4e040d00 // dup v0.4s, w8
+ .long 0x4e331e10 // and v16.16b, v16.16b, v19.16b
+ .long 0x6e32dc11 // fmul v17.4s, v0.4s, v18.4s
+ .long 0x4ea5d432 // fsub v18.4s, v1.4s, v5.4s
+ .long 0x4e21daa1 // scvtf v1.4s, v21.4s
+ .long 0x6e34dc34 // fmul v20.4s, v1.4s, v20.4s
+ .long 0x4e040d01 // dup v1.4s, w8
.long 0x4e21da10 // scvtf v16.4s, v16.4s
- .long 0x6e20de10 // fmul v16.4s, v16.4s, v0.4s
+ .long 0x6e21de10 // fmul v16.4s, v16.4s, v1.4s
+ .long 0x4ea51ca1 // mov v1.16b, v5.16b
+ .long 0xf9400425 // ldr x5, [x1, #8]
+ .long 0x4e32ce01 // fmla v1.4s, v16.4s, v18.4s
+ .long 0x4eb4f612 // fmin v18.4s, v16.4s, v20.4s
+ .long 0x4e34f610 // fmax v16.4s, v16.4s, v20.4s
+ .long 0x6ea3e4f3 // fcmgt v19.4s, v7.4s, v3.4s
.long 0x4ea41c80 // mov v0.16b, v4.16b
- .long 0x4e34ce20 // fmla v0.4s, v17.4s, v20.4s
- .long 0x4ea7d463 // fsub v3.4s, v3.4s, v7.4s
- .long 0x4ea71cf4 // mov v20.16b, v7.16b
- .long 0x4ea5d433 // fsub v19.4s, v1.4s, v5.4s
- .long 0x4ea6d441 // fsub v1.4s, v2.4s, v6.4s
+ .long 0x4eb2f632 // fmin v18.4s, v17.4s, v18.4s
+ .long 0x4e30f630 // fmax v16.4s, v17.4s, v16.4s
+ .long 0x4ea6d455 // fsub v21.4s, v2.4s, v6.4s
+ .long 0x4e36ce20 // fmla v0.4s, v17.4s, v22.4s
.long 0x4ea61cc2 // mov v2.16b, v6.16b
- .long 0x4e23ce34 // fmla v20.4s, v17.4s, v3.4s
- .long 0x4ea71cf1 // mov v17.16b, v7.16b
- .long 0x4e21ce42 // fmla v2.4s, v18.4s, v1.4s
- .long 0x4e23ce51 // fmla v17.4s, v18.4s, v3.4s
- .long 0x4ea71cf2 // mov v18.16b, v7.16b
- .long 0xf9400425 // ldr x5, [x1, #8]
- .long 0x4e23ce12 // fmla v18.4s, v16.4s, v3.4s
- .long 0x4ea51ca1 // mov v1.16b, v5.16b
- .long 0x4e31f643 // fmax v3.4s, v18.4s, v17.4s
- .long 0x4e33ce01 // fmla v1.4s, v16.4s, v19.4s
- .long 0x4e23f683 // fmax v3.4s, v20.4s, v3.4s
+ .long 0x4ea7d476 // fsub v22.4s, v3.4s, v7.4s
+ .long 0x4ea71ce3 // mov v3.16b, v7.16b
+ .long 0x6e701e53 // bsl v19.16b, v18.16b, v16.16b
+ .long 0x4e35ce82 // fmla v2.4s, v20.4s, v21.4s
+ .long 0x4e36ce63 // fmla v3.4s, v19.4s, v22.4s
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 1abc <_sk_lerp_565_aarch64+0x120> // b.none
+ .long 0x54000220 // b.eq 1bdc <_sk_lerp_565_aarch64+0x120> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e410 // movi d16, #0x0
- .long 0x540000c0 // b.eq 1a9c <_sk_lerp_565_aarch64+0x100> // b.none
+ .long 0x540000c0 // b.eq 1bbc <_sk_lerp_565_aarch64+0x100> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fff9a1 // b.ne 19c0 <_sk_lerp_565_aarch64+0x24> // b.any
+ .long 0x54fff9a1 // b.ne 1ae0 <_sk_lerp_565_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x0d405130 // ld1 {v16.h}[2], [x9]
@@ -2030,10 +2107,10 @@ _sk_lerp_565_aarch64:
.long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
.long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
.long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
- .long 0x17ffffc2 // b 19c0 <_sk_lerp_565_aarch64+0x24>
+ .long 0x17ffffc2 // b 1ae0 <_sk_lerp_565_aarch64+0x24>
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x0d404110 // ld1 {v16.h}[0], [x8]
- .long 0x17ffffbf // b 19c0 <_sk_lerp_565_aarch64+0x24>
+ .long 0x17ffffbf // b 1ae0 <_sk_lerp_565_aarch64+0x24>
HIDDEN _sk_load_tables_aarch64
.globl _sk_load_tables_aarch64
@@ -2042,7 +2119,7 @@ _sk_load_tables_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400109 // ldr x9, [x8]
.long 0x8b020929 // add x9, x9, x2, lsl #2
- .long 0xb50006e4 // cbnz x4, 1bb0 <_sk_load_tables_aarch64+0xe8>
+ .long 0xb50006e4 // cbnz x4, 1cd0 <_sk_load_tables_aarch64+0xe8>
.long 0x3dc00122 // ldr q2, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x6f00e620 // movi v0.2d, #0xff000000ff
@@ -2099,22 +2176,22 @@ _sk_load_tables_aarch64:
.long 0xd61f00a0 // br x5
.long 0x1200048a // and w10, w4, #0x3
.long 0x7100055f // cmp w10, #0x1
- .long 0x540001a0 // b.eq 1bec <_sk_load_tables_aarch64+0x124> // b.none
+ .long 0x540001a0 // b.eq 1d0c <_sk_load_tables_aarch64+0x124> // b.none
.long 0x7100095f // cmp w10, #0x2
.long 0x6f00e402 // movi v2.2d, #0x0
- .long 0x540000c0 // b.eq 1bdc <_sk_load_tables_aarch64+0x114> // b.none
+ .long 0x540000c0 // b.eq 1cfc <_sk_load_tables_aarch64+0x114> // b.none
.long 0x71000d5f // cmp w10, #0x3
- .long 0x54fff881 // b.ne 1adc <_sk_load_tables_aarch64+0x14> // b.any
+ .long 0x54fff881 // b.ne 1bfc <_sk_load_tables_aarch64+0x14> // b.any
.long 0x9100212a // add x10, x9, #0x8
.long 0x4e040fe2 // dup v2.4s, wzr
.long 0x4d408142 // ld1 {v2.s}[2], [x10]
.long 0xfd400120 // ldr d0, [x9]
.long 0x6e004040 // ext v0.16b, v2.16b, v0.16b, #8
.long 0x6e004002 // ext v2.16b, v0.16b, v0.16b, #8
- .long 0x17ffffbd // b 1adc <_sk_load_tables_aarch64+0x14>
+ .long 0x17ffffbd // b 1bfc <_sk_load_tables_aarch64+0x14>
.long 0x4e040fe2 // dup v2.4s, wzr
.long 0x0d408122 // ld1 {v2.s}[0], [x9]
- .long 0x17ffffba // b 1adc <_sk_load_tables_aarch64+0x14>
+ .long 0x17ffffba // b 1bfc <_sk_load_tables_aarch64+0x14>
HIDDEN _sk_load_tables_u16_be_aarch64
.globl _sk_load_tables_u16_be_aarch64
@@ -2123,7 +2200,7 @@ _sk_load_tables_u16_be_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400109 // ldr x9, [x8]
.long 0x8b020d29 // add x9, x9, x2, lsl #3
- .long 0xb5000744 // cbnz x4, 1cec <_sk_load_tables_u16_be_aarch64+0xf4>
+ .long 0xb5000744 // cbnz x4, 1e0c <_sk_load_tables_u16_be_aarch64+0xf4>
.long 0x0c400520 // ld4 {v0.4h-v3.4h}, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8
@@ -2183,14 +2260,14 @@ _sk_load_tables_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606120 // ld4 {v0.h-v3.h}[0], [x9]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fff8c0 // b.eq 1c0c <_sk_load_tables_u16_be_aarch64+0x14> // b.none
+ .long 0x54fff8c0 // b.eq 1d2c <_sk_load_tables_u16_be_aarch64+0x14> // b.none
.long 0x9100212a // add x10, x9, #0x8
.long 0x0d606940 // ld4 {v0.h-v3.h}[1], [x10]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fff843 // b.cc 1c0c <_sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
+ .long 0x54fff843 // b.cc 1d2c <_sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
.long 0x91004129 // add x9, x9, #0x10
.long 0x0d607120 // ld4 {v0.h-v3.h}[2], [x9]
- .long 0x17ffffbf // b 1c0c <_sk_load_tables_u16_be_aarch64+0x14>
+ .long 0x17ffffbf // b 1d2c <_sk_load_tables_u16_be_aarch64+0x14>
HIDDEN _sk_load_tables_rgb_u16_be_aarch64
.globl _sk_load_tables_rgb_u16_be_aarch64
@@ -2200,7 +2277,7 @@ _sk_load_tables_rgb_u16_be_aarch64:
.long 0x321f07ea // orr w10, wzr, #0x6
.long 0xf9400109 // ldr x9, [x8]
.long 0x9b0a2449 // madd x9, x2, x10, x9
- .long 0xb5000664 // cbnz x4, 1df0 <_sk_load_tables_rgb_u16_be_aarch64+0xdc>
+ .long 0xb5000664 // cbnz x4, 1f10 <_sk_load_tables_rgb_u16_be_aarch64+0xdc>
.long 0x0c404520 // ld3 {v0.4h-v2.4h}, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8
@@ -2253,14 +2330,14 @@ _sk_load_tables_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406120 // ld3 {v0.h-v2.h}[0], [x9]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fff9a0 // b.eq 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none
+ .long 0x54fff9a0 // b.eq 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none
.long 0x9100192a // add x10, x9, #0x6
.long 0x0d406940 // ld3 {v0.h-v2.h}[1], [x10]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fff923 // b.cc 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
+ .long 0x54fff923 // b.cc 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
.long 0x91003129 // add x9, x9, #0xc
.long 0x0d407120 // ld3 {v0.h-v2.h}[2], [x9]
- .long 0x17ffffc6 // b 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18>
+ .long 0x17ffffc6 // b 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18>
HIDDEN _sk_byte_tables_aarch64
.globl _sk_byte_tables_aarch64
@@ -3003,7 +3080,7 @@ _sk_load_a8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2908 <_sk_load_a8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2a28 <_sk_load_a8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3028,12 +3105,12 @@ _sk_load_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2954 <_sk_load_a8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2a74 <_sk_load_a8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e402 // movi d2, #0x0
- .long 0x540000c0 // b.eq 2934 <_sk_load_a8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2a54 <_sk_load_a8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 28d0 <_sk_load_a8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 29f0 <_sk_load_a8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e0a1d22 // mov v2.h[2], w9
@@ -3044,11 +3121,11 @@ _sk_load_a8_aarch64:
.long 0x0e401800 // uzp1 v0.4h, v0.4h, v0.4h
.long 0x2e002040 // ext v0.8b, v2.8b, v0.8b, #4
.long 0x2e002002 // ext v2.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 28d0 <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 29f0 <_sk_load_a8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e021d02 // mov v2.h[0], w8
- .long 0x17ffffdc // b 28d0 <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffdc // b 29f0 <_sk_load_a8_aarch64+0x3c>
HIDDEN _sk_load_a8_dst_aarch64
.globl _sk_load_a8_dst_aarch64
@@ -3060,7 +3137,7 @@ _sk_load_a8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 29d8 <_sk_load_a8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2af8 <_sk_load_a8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3085,12 +3162,12 @@ _sk_load_a8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2a24 <_sk_load_a8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2b44 <_sk_load_a8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e406 // movi d6, #0x0
- .long 0x540000c0 // b.eq 2a04 <_sk_load_a8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2b24 <_sk_load_a8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 29a0 <_sk_load_a8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2ac0 <_sk_load_a8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e0a1d26 // mov v6.h[2], w9
@@ -3101,11 +3178,11 @@ _sk_load_a8_dst_aarch64:
.long 0x0e401884 // uzp1 v4.4h, v4.4h, v0.4h
.long 0x2e0420c4 // ext v4.8b, v6.8b, v4.8b, #4
.long 0x2e042086 // ext v6.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 29a0 <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2ac0 <_sk_load_a8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e021d06 // mov v6.h[0], w8
- .long 0x17ffffdc // b 29a0 <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2ac0 <_sk_load_a8_dst_aarch64+0x3c>
HIDDEN _sk_gather_a8_aarch64
.globl _sk_gather_a8_aarch64
@@ -3157,7 +3234,7 @@ _sk_store_a8_aarch64:
.long 0x0e612a10 // xtn v16.4h, v16.4s
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb5000184 // cbnz x4, 2b08 <_sk_store_a8_aarch64+0x5c>
+ .long 0xb5000184 // cbnz x4, 2c28 <_sk_store_a8_aarch64+0x5c>
.long 0x0e0e3e09 // umov w9, v16.h[3]
.long 0x0e0a3e0a // umov w10, v16.h[2]
.long 0x0e063e0b // umov w11, v16.h[1]
@@ -3171,21 +3248,21 @@ _sk_store_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000180 // b.eq 2b40 <_sk_store_a8_aarch64+0x94> // b.none
+ .long 0x54000180 // b.eq 2c60 <_sk_store_a8_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2b2c <_sk_store_a8_aarch64+0x80> // b.none
+ .long 0x540000a0 // b.eq 2c4c <_sk_store_a8_aarch64+0x80> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2afc <_sk_store_a8_aarch64+0x50> // b.any
+ .long 0x54fffee1 // b.ne 2c1c <_sk_store_a8_aarch64+0x50> // b.any
.long 0x0e0a3e09 // umov w9, v16.h[2]
.long 0x39000909 // strb w9, [x8, #2]
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x0e063e0a // umov w10, v16.h[1]
.long 0x3900050a // strb w10, [x8, #1]
.long 0x39000109 // strb w9, [x8]
- .long 0x17fffff0 // b 2afc <_sk_store_a8_aarch64+0x50>
+ .long 0x17fffff0 // b 2c1c <_sk_store_a8_aarch64+0x50>
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x39000109 // strb w9, [x8]
- .long 0x17ffffed // b 2afc <_sk_store_a8_aarch64+0x50>
+ .long 0x17ffffed // b 2c1c <_sk_store_a8_aarch64+0x50>
HIDDEN _sk_load_g8_aarch64
.globl _sk_load_g8_aarch64
@@ -3197,7 +3274,7 @@ _sk_load_g8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2bc0 <_sk_load_g8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2ce0 <_sk_load_g8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3222,12 +3299,12 @@ _sk_load_g8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2c0c <_sk_load_g8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2d2c <_sk_load_g8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2bec <_sk_load_g8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2d0c <_sk_load_g8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 2b88 <_sk_load_g8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2ca8 <_sk_load_g8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e0a1d20 // mov v0.h[2], w9
@@ -3238,11 +3315,11 @@ _sk_load_g8_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 2b88 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2ca8 <_sk_load_g8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e021d00 // mov v0.h[0], w8
- .long 0x17ffffdc // b 2b88 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffdc // b 2ca8 <_sk_load_g8_aarch64+0x3c>
HIDDEN _sk_load_g8_dst_aarch64
.globl _sk_load_g8_dst_aarch64
@@ -3254,7 +3331,7 @@ _sk_load_g8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2c90 <_sk_load_g8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2db0 <_sk_load_g8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3279,12 +3356,12 @@ _sk_load_g8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2cdc <_sk_load_g8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2dfc <_sk_load_g8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2cbc <_sk_load_g8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2ddc <_sk_load_g8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 2c58 <_sk_load_g8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2d78 <_sk_load_g8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e0a1d24 // mov v4.h[2], w9
@@ -3295,11 +3372,11 @@ _sk_load_g8_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 2c58 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2d78 <_sk_load_g8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e021d04 // mov v4.h[0], w8
- .long 0x17ffffdc // b 2c58 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2d78 <_sk_load_g8_dst_aarch64+0x3c>
HIDDEN _sk_gather_g8_aarch64
.globl _sk_gather_g8_aarch64
@@ -3347,7 +3424,7 @@ _sk_load_565_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2df8 <_sk_load_565_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 2f18 <_sk_load_565_aarch64+0x94>
.long 0xfd400100 // ldr d0, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d02 // dup v2.4s, w8
@@ -3379,12 +3456,12 @@ _sk_load_565_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2e44 <_sk_load_565_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 2f64 <_sk_load_565_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2e24 <_sk_load_565_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 2f44 <_sk_load_565_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2d88 <_sk_load_565_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2ea8 <_sk_load_565_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3395,10 +3472,10 @@ _sk_load_565_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffd2 // b 2d88 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffd2 // b 2ea8 <_sk_load_565_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcf // b 2d88 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffcf // b 2ea8 <_sk_load_565_aarch64+0x24>
HIDDEN _sk_load_565_dst_aarch64
.globl _sk_load_565_dst_aarch64
@@ -3411,7 +3488,7 @@ _sk_load_565_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2ee4 <_sk_load_565_dst_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 3004 <_sk_load_565_dst_aarch64+0x94>
.long 0xfd400104 // ldr d4, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d06 // dup v6.4s, w8
@@ -3443,12 +3520,12 @@ _sk_load_565_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2f30 <_sk_load_565_dst_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 3050 <_sk_load_565_dst_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2f10 <_sk_load_565_dst_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 3030 <_sk_load_565_dst_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2e74 <_sk_load_565_dst_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2f94 <_sk_load_565_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3459,10 +3536,10 @@ _sk_load_565_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffd2 // b 2e74 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffd2 // b 2f94 <_sk_load_565_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcf // b 2e74 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffcf // b 2f94 <_sk_load_565_dst_aarch64+0x24>
HIDDEN _sk_gather_565_aarch64
.globl _sk_gather_565_aarch64
@@ -3538,24 +3615,24 @@ _sk_store_565_aarch64:
.long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 3054 <_sk_store_565_aarch64+0x68>
+ .long 0xb50000a4 // cbnz x4, 3174 <_sk_store_565_aarch64+0x68>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 3080 <_sk_store_565_aarch64+0x94> // b.none
+ .long 0x54000120 // b.eq 31a0 <_sk_store_565_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3078 <_sk_store_565_aarch64+0x8c> // b.none
+ .long 0x540000a0 // b.eq 3198 <_sk_store_565_aarch64+0x8c> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 3048 <_sk_store_565_aarch64+0x5c> // b.any
+ .long 0x54fffee1 // b.ne 3168 <_sk_store_565_aarch64+0x5c> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 3048 <_sk_store_565_aarch64+0x5c>
+ .long 0x17fffff1 // b 3168 <_sk_store_565_aarch64+0x5c>
HIDDEN _sk_load_4444_aarch64
.globl _sk_load_4444_aarch64
@@ -3568,7 +3645,7 @@ _sk_load_4444_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 312c <_sk_load_4444_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 324c <_sk_load_4444_aarch64+0xa4>
.long 0xfd400100 // ldr d0, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a400 // uxtl v0.4s, v0.4h
@@ -3604,12 +3681,12 @@ _sk_load_4444_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 3178 <_sk_load_4444_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 3298 <_sk_load_4444_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 3158 <_sk_load_4444_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 3278 <_sk_load_4444_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 30ac <_sk_load_4444_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 31cc <_sk_load_4444_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3620,10 +3697,10 @@ _sk_load_4444_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffce // b 30ac <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffce // b 31cc <_sk_load_4444_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcb // b 30ac <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffcb // b 31cc <_sk_load_4444_aarch64+0x24>
HIDDEN _sk_load_4444_dst_aarch64
.globl _sk_load_4444_dst_aarch64
@@ -3636,7 +3713,7 @@ _sk_load_4444_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 3228 <_sk_load_4444_dst_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 3348 <_sk_load_4444_dst_aarch64+0xa4>
.long 0xfd400104 // ldr d4, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a484 // uxtl v4.4s, v4.4h
@@ -3672,12 +3749,12 @@ _sk_load_4444_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 3274 <_sk_load_4444_dst_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 3394 <_sk_load_4444_dst_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 3254 <_sk_load_4444_dst_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 3374 <_sk_load_4444_dst_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 31a8 <_sk_load_4444_dst_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 32c8 <_sk_load_4444_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3688,10 +3765,10 @@ _sk_load_4444_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffce // b 31a8 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffce // b 32c8 <_sk_load_4444_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcb // b 31a8 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffcb // b 32c8 <_sk_load_4444_dst_aarch64+0x24>
HIDDEN _sk_gather_4444_aarch64
.globl _sk_gather_4444_aarch64
@@ -3774,24 +3851,24 @@ _sk_store_4444_aarch64:
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 33b4 <_sk_store_4444_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 34d4 <_sk_store_4444_aarch64+0x70>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 33e0 <_sk_store_4444_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3500 <_sk_store_4444_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 33d8 <_sk_store_4444_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 34f8 <_sk_store_4444_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 33a8 <_sk_store_4444_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 34c8 <_sk_store_4444_aarch64+0x64> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 33a8 <_sk_store_4444_aarch64+0x64>
+ .long 0x17fffff1 // b 34c8 <_sk_store_4444_aarch64+0x64>
HIDDEN _sk_load_8888_aarch64
.globl _sk_load_8888_aarch64
@@ -3804,7 +3881,7 @@ _sk_load_8888_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3460 <_sk_load_8888_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3580 <_sk_load_8888_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3829,22 +3906,22 @@ _sk_load_8888_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 349c <_sk_load_8888_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 35bc <_sk_load_8888_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 348c <_sk_load_8888_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 35ac <_sk_load_8888_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 340c <_sk_load_8888_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 352c <_sk_load_8888_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 340c <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffdd // b 352c <_sk_load_8888_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 340c <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffda // b 352c <_sk_load_8888_aarch64+0x24>
HIDDEN _sk_load_8888_dst_aarch64
.globl _sk_load_8888_dst_aarch64
@@ -3857,7 +3934,7 @@ _sk_load_8888_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3520 <_sk_load_8888_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3640 <_sk_load_8888_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3882,22 +3959,22 @@ _sk_load_8888_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 355c <_sk_load_8888_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 367c <_sk_load_8888_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 354c <_sk_load_8888_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 366c <_sk_load_8888_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 34cc <_sk_load_8888_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 35ec <_sk_load_8888_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 34cc <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 35ec <_sk_load_8888_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 34cc <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffda // b 35ec <_sk_load_8888_dst_aarch64+0x24>
HIDDEN _sk_gather_8888_aarch64
.globl _sk_gather_8888_aarch64
@@ -3969,24 +4046,24 @@ _sk_store_8888_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 3670 <_sk_store_8888_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3790 <_sk_store_8888_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 369c <_sk_store_8888_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 37bc <_sk_store_8888_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3694 <_sk_store_8888_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 37b4 <_sk_store_8888_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 3664 <_sk_store_8888_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 3784 <_sk_store_8888_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 3664 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff3 // b 3784 <_sk_store_8888_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 3664 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff1 // b 3784 <_sk_store_8888_aarch64+0x64>
HIDDEN _sk_load_bgra_aarch64
.globl _sk_load_bgra_aarch64
@@ -3999,7 +4076,7 @@ _sk_load_bgra_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 371c <_sk_load_bgra_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 383c <_sk_load_bgra_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -4024,22 +4101,22 @@ _sk_load_bgra_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 3758 <_sk_load_bgra_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3878 <_sk_load_bgra_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 3748 <_sk_load_bgra_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 3868 <_sk_load_bgra_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 36c8 <_sk_load_bgra_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 37e8 <_sk_load_bgra_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 36c8 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffdd // b 37e8 <_sk_load_bgra_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 36c8 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffda // b 37e8 <_sk_load_bgra_aarch64+0x24>
HIDDEN _sk_load_bgra_dst_aarch64
.globl _sk_load_bgra_dst_aarch64
@@ -4052,7 +4129,7 @@ _sk_load_bgra_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 37dc <_sk_load_bgra_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 38fc <_sk_load_bgra_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -4077,22 +4154,22 @@ _sk_load_bgra_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 3818 <_sk_load_bgra_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3938 <_sk_load_bgra_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 3808 <_sk_load_bgra_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 3928 <_sk_load_bgra_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3788 <_sk_load_bgra_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 38a8 <_sk_load_bgra_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 3788 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 38a8 <_sk_load_bgra_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 3788 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffda // b 38a8 <_sk_load_bgra_dst_aarch64+0x24>
HIDDEN _sk_gather_bgra_aarch64
.globl _sk_gather_bgra_aarch64
@@ -4164,24 +4241,24 @@ _sk_store_bgra_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 392c <_sk_store_bgra_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3a4c <_sk_store_bgra_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 3958 <_sk_store_bgra_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3a78 <_sk_store_bgra_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3950 <_sk_store_bgra_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 3a70 <_sk_store_bgra_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 3920 <_sk_store_bgra_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 3a40 <_sk_store_bgra_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 3920 <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff3 // b 3a40 <_sk_store_bgra_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 3920 <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff1 // b 3a40 <_sk_store_bgra_aarch64+0x64>
HIDDEN _sk_load_f16_aarch64
.globl _sk_load_f16_aarch64
@@ -4194,7 +4271,7 @@ _sk_load_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 39a0 <_sk_load_f16_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 3ac0 <_sk_load_f16_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a00 // fcvtl v0.4s, v16.4h
@@ -4205,14 +4282,14 @@ _sk_load_f16_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 3984 <_sk_load_f16_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3aa4 <_sk_load_f16_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 3984 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3aa4 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 3984 <_sk_load_f16_aarch64+0x24>
+ .long 0x17fffff0 // b 3aa4 <_sk_load_f16_aarch64+0x24>
HIDDEN _sk_load_f16_dst_aarch64
.globl _sk_load_f16_dst_aarch64
@@ -4225,7 +4302,7 @@ _sk_load_f16_dst_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 3a08 <_sk_load_f16_dst_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 3b28 <_sk_load_f16_dst_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a04 // fcvtl v4.4s, v16.4h
@@ -4236,14 +4313,14 @@ _sk_load_f16_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 39ec <_sk_load_f16_dst_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3b0c <_sk_load_f16_dst_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 39ec <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3b0c <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 39ec <_sk_load_f16_dst_aarch64+0x24>
+ .long 0x17fffff0 // b 3b0c <_sk_load_f16_dst_aarch64+0x24>
HIDDEN _sk_gather_f16_aarch64
.globl _sk_gather_f16_aarch64
@@ -4301,21 +4378,21 @@ _sk_store_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb50000a4 // cbnz x4, 3b00 <_sk_store_f16_aarch64+0x40>
+ .long 0xb50000a4 // cbnz x4, 3c20 <_sk_store_f16_aarch64+0x40>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3af4 <_sk_store_f16_aarch64+0x34> // b.none
+ .long 0x54ffff60 // b.eq 3c14 <_sk_store_f16_aarch64+0x34> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3af4 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3c14 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3af4 <_sk_store_f16_aarch64+0x34>
+ .long 0x17fffff4 // b 3c14 <_sk_store_f16_aarch64+0x34>
HIDDEN _sk_load_u16_be_aarch64
.globl _sk_load_u16_be_aarch64
@@ -4328,7 +4405,7 @@ _sk_load_u16_be_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x8b2ac508 // add x8, x8, w10, sxtw #1
- .long 0xb5000404 // cbnz x4, 3bc4 <_sk_load_u16_be_aarch64+0x9c>
+ .long 0xb5000404 // cbnz x4, 3ce4 <_sk_load_u16_be_aarch64+0x9c>
.long 0x0c400500 // ld4 {v0.4h-v3.4h}, [x8]
.long 0x0f185410 // shl v16.4h, v0.4h, #8
.long 0x2f180411 // ushr v17.4h, v0.4h, #8
@@ -4362,14 +4439,14 @@ _sk_load_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606100 // ld4 {v0.h-v3.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc00 // b.eq 3b4c <_sk_load_u16_be_aarch64+0x24> // b.none
+ .long 0x54fffc00 // b.eq 3c6c <_sk_load_u16_be_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606920 // ld4 {v0.h-v3.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffb83 // b.cc 3b4c <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffb83 // b.cc 3c6c <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607100 // ld4 {v0.h-v3.h}[2], [x8]
- .long 0x17ffffd9 // b 3b4c <_sk_load_u16_be_aarch64+0x24>
+ .long 0x17ffffd9 // b 3c6c <_sk_load_u16_be_aarch64+0x24>
HIDDEN _sk_load_rgb_u16_be_aarch64
.globl _sk_load_rgb_u16_be_aarch64
@@ -4383,7 +4460,7 @@ _sk_load_rgb_u16_be_aarch64:
.long 0x0b020449 // add w9, w2, w2, lsl #1
.long 0xd3607d29 // lsl x9, x9, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000384 // cbnz x4, 3c7c <_sk_load_rgb_u16_be_aarch64+0x90>
+ .long 0xb5000384 // cbnz x4, 3d9c <_sk_load_rgb_u16_be_aarch64+0x90>
.long 0x0c404500 // ld3 {v0.4h-v2.4h}, [x8]
.long 0x0f185403 // shl v3.4h, v0.4h, #8
.long 0x2f180410 // ushr v16.4h, v0.4h, #8
@@ -4413,14 +4490,14 @@ _sk_load_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406100 // ld3 {v0.h-v2.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc80 // b.eq 3c14 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
+ .long 0x54fffc80 // b.eq 3d34 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
.long 0x91001909 // add x9, x8, #0x6
.long 0x0d406920 // ld3 {v0.h-v2.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffc03 // b.cc 3c14 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
+ .long 0x54fffc03 // b.cc 3d34 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
.long 0x91003108 // add x8, x8, #0xc
.long 0x0d407100 // ld3 {v0.h-v2.h}[2], [x8]
- .long 0x17ffffdd // b 3c14 <_sk_load_rgb_u16_be_aarch64+0x28>
+ .long 0x17ffffdd // b 3d34 <_sk_load_rgb_u16_be_aarch64+0x28>
HIDDEN _sk_store_u16_be_aarch64
.globl _sk_store_u16_be_aarch64
@@ -4460,21 +4537,21 @@ _sk_store_u16_be_aarch64:
.long 0x8b28c548 // add x8, x10, w8, sxtw #1
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x0eb41eb3 // orr v19.8b, v21.8b, v20.8b
- .long 0xb50000a4 // cbnz x4, 3d40 <_sk_store_u16_be_aarch64+0x9c>
+ .long 0xb50000a4 // cbnz x4, 3e60 <_sk_store_u16_be_aarch64+0x9c>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3d34 <_sk_store_u16_be_aarch64+0x90> // b.none
+ .long 0x54ffff60 // b.eq 3e54 <_sk_store_u16_be_aarch64+0x90> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3d34 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3e54 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3d34 <_sk_store_u16_be_aarch64+0x90>
+ .long 0x17fffff4 // b 3e54 <_sk_store_u16_be_aarch64+0x90>
HIDDEN _sk_load_f32_aarch64
.globl _sk_load_f32_aarch64
@@ -4487,21 +4564,21 @@ _sk_load_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3d98 <_sk_load_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3eb8 <_sk_load_f32_aarch64+0x30>
.long 0x4c400900 // ld4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a100 // ld4 {v0.s-v3.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3d8c <_sk_load_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3eac <_sk_load_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b120 // ld4 {v0.s-v3.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3d8c <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3eac <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a100 // ld4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3d8c <_sk_load_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3eac <_sk_load_f32_aarch64+0x24>
HIDDEN _sk_load_f32_dst_aarch64
.globl _sk_load_f32_dst_aarch64
@@ -4514,21 +4591,21 @@ _sk_load_f32_dst_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3df0 <_sk_load_f32_dst_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3f10 <_sk_load_f32_dst_aarch64+0x30>
.long 0x4c400904 // ld4 {v4.4s-v7.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a104 // ld4 {v4.s-v7.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3de4 <_sk_load_f32_dst_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3f04 <_sk_load_f32_dst_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b124 // ld4 {v4.s-v7.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3de4 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3f04 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a104 // ld4 {v4.s-v7.s}[2], [x8]
- .long 0x17fffff4 // b 3de4 <_sk_load_f32_dst_aarch64+0x24>
+ .long 0x17fffff4 // b 3f04 <_sk_load_f32_dst_aarch64+0x24>
HIDDEN _sk_store_f32_aarch64
.globl _sk_store_f32_aarch64
@@ -4541,21 +4618,21 @@ _sk_store_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3e48 <_sk_store_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3f68 <_sk_store_f32_aarch64+0x30>
.long 0x4c000900 // st4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d20a100 // st4 {v0.s-v3.s}[0], [x8]
- .long 0x54ffff60 // b.eq 3e3c <_sk_store_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3f5c <_sk_store_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d20b120 // st4 {v0.s-v3.s}[1], [x9]
- .long 0x54fffee3 // b.cc 3e3c <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3f5c <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d20a100 // st4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3e3c <_sk_store_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3f5c <_sk_store_f32_aarch64+0x24>
HIDDEN _sk_clamp_x_aarch64
.globl _sk_clamp_x_aarch64
@@ -5048,7 +5125,7 @@ _sk_gradient_aarch64:
.long 0x6f00e411 // movi v17.2d, #0x0
.long 0xf9400109 // ldr x9, [x8]
.long 0xf100093f // cmp x9, #0x2
- .long 0x540001c3 // b.cc 44c8 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
+ .long 0x540001c3 // b.cc 45e8 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
.long 0xf940250a // ldr x10, [x8, #72]
.long 0xd1000529 // sub x9, x9, #0x1
.long 0x6f00e401 // movi v1.2d, #0x0
@@ -5059,7 +5136,7 @@ _sk_gradient_aarch64:
.long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s
.long 0x4e221c63 // and v3.16b, v3.16b, v2.16b
.long 0x4ea18461 // add v1.4s, v3.4s, v1.4s
- .long 0xb5ffff69 // cbnz x9, 44a8 <_sk_gradient_aarch64+0x38>
+ .long 0xb5ffff69 // cbnz x9, 45c8 <_sk_gradient_aarch64+0x38>
.long 0x6f20a431 // uxtl2 v17.2d, v1.4s
.long 0x2f20a421 // uxtl v1.2d, v1.2s
.long 0xa940b10a // ldp x10, x12, [x8, #8]
@@ -7865,19 +7942,24 @@ HIDDEN _sk_plus__vfp4
.globl _sk_plus__vfp4
FUNCTION(_sk_plus__vfp4)
_sk_plus__vfp4:
- .long 0xe2802010 // add r2, r0, #16
- .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
.long 0xe2802020 // add r2, r0, #32
- .long 0xf2000dc0 // vadd.f32 q0, q8, q0
+ .long 0xf2c76f50 // vmov.f32 q11, #1
+ .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
+ .long 0xe2802010 // add r2, r0, #16
+ .long 0xf2400dc2 // vadd.f32 q8, q8, q1
.long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128]
.long 0xe2802030 // add r2, r0, #48
- .long 0xf2022dc2 // vadd.f32 q1, q9, q1
- .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
+ .long 0xf2422dc0 // vadd.f32 q9, q9, q0
+ .long 0xf4624aef // vld1.64 {d20-d21}, [r2 :128]
.long 0xe2802040 // add r2, r0, #64
- .long 0xf2004dc4 // vadd.f32 q2, q8, q2
- .long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128]
- .long 0xf2026dc6 // vadd.f32 q3, q9, q3
+ .long 0xf2444dc4 // vadd.f32 q10, q10, q2
+ .long 0xf4628aef // vld1.64 {d24-d25}, [r2 :128]
+ .long 0xf2488dc6 // vadd.f32 q12, q12, q3
.long 0xe4912004 // ldr r2, [r1], #4
+ .long 0xf2220fe6 // vmin.f32 q0, q9, q11
+ .long 0xf2202fe6 // vmin.f32 q1, q8, q11
+ .long 0xf2244fe6 // vmin.f32 q2, q10, q11
+ .long 0xf2286fe6 // vmin.f32 q3, q12, q11
.long 0xe12fff12 // bx r2
HIDDEN _sk_screen_vfp4
@@ -8506,7 +8588,6 @@ _sk_softlight_vfp4:
.long 0xecbd8b10 // vpop {d8-d15}
.long 0xe8bd0030 // pop {r4, r5}
.long 0xe12fff12 // bx r2
- .long 0xe320f000 // nop {0}
HIDDEN _sk_hue_vfp4
.globl _sk_hue_vfp4
@@ -9280,7 +9361,7 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe2804020 // add r4, r0, #32
.long 0xe0822106 // add r2, r2, r6, lsl #2
- .long 0x1a000032 // bne 1b88 <sk_srcover_rgba_8888_vfp4+0x110>
+ .long 0x1a000032 // bne 1b98 <sk_srcover_rgba_8888_vfp4+0x110>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7405f // vmov.i32 q10, #255
.long 0xe28f6f51 // add r6, pc, #324
@@ -9325,7 +9406,7 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xf2f0c57c // vshl.s32 q14, q14, #16
.long 0xf26e01f4 // vorr q8, q15, q10
.long 0xf26001fc // vorr q8, q8, q14
- .long 0x1a000015 // bne 1bc8 <sk_srcover_rgba_8888_vfp4+0x150>
+ .long 0x1a000015 // bne 1bd8 <sk_srcover_rgba_8888_vfp4+0x150>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -9334,12 +9415,12 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe2036003 // and r6, r3, #3
.long 0xe3560001 // cmp r6, #1
- .long 0x0a000017 // beq 1bf4 <sk_srcover_rgba_8888_vfp4+0x17c>
+ .long 0x0a000017 // beq 1c04 <sk_srcover_rgba_8888_vfp4+0x17c>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3560002 // cmp r6, #2
- .long 0x0a000005 // beq 1bb8 <sk_srcover_rgba_8888_vfp4+0x140>
+ .long 0x0a000005 // beq 1bc8 <sk_srcover_rgba_8888_vfp4+0x140>
.long 0xe3560003 // cmp r6, #3
- .long 0x1affffc5 // bne 1ac0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0x1affffc5 // bne 1ad0 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xe3a06000 // mov r6, #0
.long 0xeea06b90 // vdup.32 q8, r6
.long 0xe2826008 // add r6, r2, #8
@@ -9347,24 +9428,24 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffbd // b 1ac0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0xeaffffbd // b 1ad0 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xe2033003 // and r3, r3, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000b // beq 1c04 <sk_srcover_rgba_8888_vfp4+0x18c>
+ .long 0x0a00000b // beq 1c14 <sk_srcover_rgba_8888_vfp4+0x18c>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 1bec <sk_srcover_rgba_8888_vfp4+0x174>
+ .long 0x0a000003 // beq 1bfc <sk_srcover_rgba_8888_vfp4+0x174>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe3 // bne 1b74 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0x1affffe3 // bne 1b84 <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeaffffdf // b 1b74 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0xeaffffdf // b 1b84 <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe3a06000 // mov r6, #0
.long 0xeea06b90 // vdup.32 q8, r6
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffae // b 1ac0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0xeaffffae // b 1ad0 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd9 // b 1b74 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0xeaffffd9 // b 1b84 <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -9785,14 +9866,14 @@ HIDDEN _sk_rgb_to_hsl_vfp4
FUNCTION(_sk_rgb_to_hsl_vfp4)
_sk_rgb_to_hsl_vfp4:
.long 0xed2d8b0c // vpush {d8-d13}
- .long 0xf2600f42 // vmin.f32 q8, q0, q1
+ .long 0xf2620f44 // vmin.f32 q8, q1, q2
.long 0xe28f20c8 // add r2, pc, #200
.long 0xf462aacf // vld1.64 {d26-d27}, [r2]
.long 0xe28f20d0 // add r2, pc, #208
- .long 0xf2402f42 // vmax.f32 q9, q0, q1
+ .long 0xf2422f44 // vmax.f32 q9, q1, q2
.long 0xeeb7ca00 // vmov.f32 s24, #112
- .long 0xf2600fc4 // vmin.f32 q8, q8, q2
- .long 0xf2422fc4 // vmax.f32 q9, q9, q2
+ .long 0xf2600f60 // vmin.f32 q8, q0, q8
+ .long 0xf2402f62 // vmax.f32 q9, q0, q9
.long 0xf2624d44 // vsub.f32 q10, q1, q2
.long 0xf3648e42 // vcgt.f32 q12, q2, q1
.long 0xf2228de0 // vsub.f32 q4, q9, q8
@@ -10009,7 +10090,7 @@ _sk_scale_u8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 24f4 <sk_scale_u8_vfp4+0x7c>
+ .long 0x1a000013 // bne 2504 <sk_scale_u8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -10032,12 +10113,12 @@ _sk_scale_u8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 254c <sk_scale_u8_vfp4+0xd4>
+ .long 0x0a000012 // beq 255c <sk_scale_u8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 2524 <sk_scale_u8_vfp4+0xac>
+ .long 0x0a000005 // beq 2534 <sk_scale_u8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 24b8 <sk_scale_u8_vfp4+0x40>
+ .long 0x1affffe8 // bne 24c8 <sk_scale_u8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -10051,17 +10132,110 @@ _sk_scale_u8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 24b8 <sk_scale_u8_vfp4+0x40>
+ .long 0xeaffffda // b 24c8 <sk_scale_u8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 24b8 <sk_scale_u8_vfp4+0x40>
+ .long 0xeaffffd5 // b 24c8 <sk_scale_u8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
+HIDDEN _sk_scale_565_vfp4
+.globl _sk_scale_565_vfp4
+FUNCTION(_sk_scale_565_vfp4)
+_sk_scale_565_vfp4:
+ .long 0xe92d4010 // push {r4, lr}
+ .long 0xe24dd004 // sub sp, sp, #4
+ .long 0xe5913000 // ldr r3, [r1]
+ .long 0xe590c000 // ldr ip, [r0]
+ .long 0xe9904004 // ldmib r0, {r2, lr}
+ .long 0xe5934000 // ldr r4, [r3]
+ .long 0xe35e0000 // cmp lr, #0
+ .long 0xe5933004 // ldr r3, [r3, #4]
+ .long 0xe0020293 // mul r2, r3, r2
+ .long 0xe0842082 // add r2, r4, r2, lsl #1
+ .long 0xe082308c // add r3, r2, ip, lsl #1
+ .long 0xe280c040 // add ip, r0, #64
+ .long 0x1a000024 // bne 2648 <sk_scale_565_vfp4+0xc8>
+ .long 0xf463074f // vld1.16 {d16}, [r3]
+ .long 0xf3d00a30 // vmovl.u16 q8, d16
+ .long 0xe3a02e7e // mov r2, #2016
+ .long 0xf2c1205f // vmov.i32 q9, #31
+ .long 0xeea42b90 // vdup.32 q10, r2
+ .long 0xe28f20e0 // add r2, pc, #224
+ .long 0xf3c76258 // vmov.i32 q11, #63488
+ .long 0xf24021f2 // vand q9, q8, q9
+ .long 0xf4628acf // vld1.64 {d24-d25}, [r2]
+ .long 0xf24041f4 // vand q10, q8, q10
+ .long 0xe28f20dc // add r2, pc, #220
+ .long 0xf3fb2662 // vcvt.f32.s32 q9, q9
+ .long 0xf462aacf // vld1.64 {d26-d27}, [r2]
+ .long 0xe28f20e0 // add r2, pc, #224
+ .long 0xf3fb4664 // vcvt.f32.s32 q10, q10
+ .long 0xf24001f6 // vand q8, q8, q11
+ .long 0xf4626acf // vld1.64 {d22-d23}, [r2]
+ .long 0xf3422df8 // vmul.f32 q9, q9, q12
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xe5912004 // ldr r2, [r1, #4]
+ .long 0xe2811008 // add r1, r1, #8
+ .long 0xf3444dfa // vmul.f32 q10, q10, q13
+ .long 0xf3024dd4 // vmul.f32 q2, q9, q2
+ .long 0xf3400df6 // vmul.f32 q8, q8, q11
+ .long 0xf46c6aef // vld1.64 {d22-d23}, [ip :128]
+ .long 0xf3666ec6 // vcgt.f32 q11, q11, q3
+ .long 0xf2648fe2 // vmin.f32 q12, q10, q9
+ .long 0xf244afe2 // vmax.f32 q13, q10, q9
+ .long 0xf3000dd0 // vmul.f32 q0, q8, q0
+ .long 0xf2608fe8 // vmin.f32 q12, q8, q12
+ .long 0xf240afea // vmax.f32 q13, q8, q13
+ .long 0xf3042dd2 // vmul.f32 q1, q10, q1
+ .long 0xf35861fa // vbsl q11, q12, q13
+ .long 0xf3066dd6 // vmul.f32 q3, q11, q3
+ .long 0xe28dd004 // add sp, sp, #4
+ .long 0xe8bd4010 // pop {r4, lr}
+ .long 0xe12fff12 // bx r2
+ .long 0xe20e2003 // and r2, lr, #3
+ .long 0xe3520001 // cmp r2, #1
+ .long 0x0a000011 // beq 269c <sk_scale_565_vfp4+0x11c>
+ .long 0xf2c00010 // vmov.i32 d16, #0
+ .long 0xe3520002 // cmp r2, #2
+ .long 0x0a000005 // beq 2678 <sk_scale_565_vfp4+0xf8>
+ .long 0xe3520003 // cmp r2, #3
+ .long 0x1affffd3 // bne 25b8 <sk_scale_565_vfp4+0x38>
+ .long 0xe3a02000 // mov r2, #0
+ .long 0xee802bb0 // vdup.16 d16, r2
+ .long 0xe2832004 // add r2, r3, #4
+ .long 0xf4e2049f // vld1.16 {d16[2]}, [r2 :16]
+ .long 0xe5932000 // ldr r2, [r3]
+ .long 0xe58d2000 // str r2, [sp]
+ .long 0xe1a0200d // mov r2, sp
+ .long 0xf4e2183f // vld1.32 {d17[0]}, [r2 :32]
+ .long 0xf3d02a31 // vmovl.u16 q9, d17
+ .long 0xf3f62121 // vuzp.16 d18, d17
+ .long 0xf2f004a2 // vext.8 d16, d16, d18, #4
+ .long 0xf2f004a0 // vext.8 d16, d16, d16, #4
+ .long 0xeaffffc6 // b 25b8 <sk_scale_565_vfp4+0x38>
+ .long 0xe3a02000 // mov r2, #0
+ .long 0xee802bb0 // vdup.16 d16, r2
+ .long 0xf4e3041f // vld1.16 {d16[0]}, [r3 :16]
+ .long 0xeaffffc2 // b 25b8 <sk_scale_565_vfp4+0x38>
+ .long 0xe320f000 // nop {0}
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x37842108 // .word 0x37842108
+ .long 0x37842108 // .word 0x37842108
+ .long 0x37842108 // .word 0x37842108
+ .long 0x37842108 // .word 0x37842108
+
HIDDEN _sk_lerp_1_float_vfp4
.globl _sk_lerp_1_float_vfp4
FUNCTION(_sk_lerp_1_float_vfp4)
@@ -10108,7 +10282,7 @@ _sk_lerp_u8_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2803020 // add r3, r0, #32
.long 0xe2802010 // add r2, r0, #16
- .long 0x1a00001f // bne 2688 <sk_lerp_u8_vfp4+0xb8>
+ .long 0x1a00001f // bne 27f8 <sk_lerp_u8_vfp4+0xb8>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -10143,12 +10317,12 @@ _sk_lerp_u8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 26e0 <sk_lerp_u8_vfp4+0x110>
+ .long 0x0a000012 // beq 2850 <sk_lerp_u8_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 26b8 <sk_lerp_u8_vfp4+0xe8>
+ .long 0x0a000005 // beq 2828 <sk_lerp_u8_vfp4+0xe8>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdc // bne 261c <sk_lerp_u8_vfp4+0x4c>
+ .long 0x1affffdc // bne 278c <sk_lerp_u8_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -10162,12 +10336,12 @@ _sk_lerp_u8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffce // b 261c <sk_lerp_u8_vfp4+0x4c>
+ .long 0xeaffffce // b 278c <sk_lerp_u8_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffc9 // b 261c <sk_lerp_u8_vfp4+0x4c>
+ .long 0xeaffffc9 // b 278c <sk_lerp_u8_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10181,73 +10355,74 @@ _sk_lerp_565_vfp4:
.long 0xe92d4070 // push {r4, r5, r6, lr}
.long 0xe24dd004 // sub sp, sp, #4
.long 0xe5912000 // ldr r2, [r1]
- .long 0xe280e020 // add lr, r0, #32
+ .long 0xe280e040 // add lr, r0, #64
.long 0xe8900058 // ldm r0, {r3, r4, r6}
- .long 0xe280c010 // add ip, r0, #16
+ .long 0xe280c020 // add ip, r0, #32
.long 0xe5925000 // ldr r5, [r2]
.long 0xe3560000 // cmp r6, #0
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0020492 // mul r2, r2, r4
.long 0xe0852082 // add r2, r5, r2, lsl #1
.long 0xe0824083 // add r4, r2, r3, lsl #1
- .long 0xe2803040 // add r3, r0, #64
.long 0xe2802030 // add r2, r0, #48
- .long 0x1a00002e // bne 2800 <sk_lerp_565_vfp4+0xf8>
+ .long 0xe2803010 // add r3, r0, #16
+ .long 0x1a00002f // bne 2974 <sk_lerp_565_vfp4+0xfc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
.long 0xf2c1205f // vmov.i32 q9, #31
- .long 0xeea64b90 // vdup.32 q11, r4
- .long 0xf3c74258 // vmov.i32 q10, #63488
+ .long 0xeea44b90 // vdup.32 q10, r4
+ .long 0xe28f4f42 // add r4, pc, #264
+ .long 0xf3c76258 // vmov.i32 q11, #63488
.long 0xf24021f2 // vand q9, q8, q9
- .long 0xf24061f6 // vand q11, q8, q11
- .long 0xf24001f4 // vand q8, q8, q10
- .long 0xf3fb4666 // vcvt.f32.s32 q10, q11
- .long 0xf4636aef // vld1.64 {d22-d23}, [r3 :128]
- .long 0xe28f30f0 // add r3, pc, #240
+ .long 0xf4648acf // vld1.64 {d24-d25}, [r4]
+ .long 0xf24041f4 // vand q10, q8, q10
+ .long 0xe28f4f41 // add r4, pc, #260
.long 0xf3fb2662 // vcvt.f32.s32 q9, q9
- .long 0xf4638acf // vld1.64 {d24-d25}, [r3]
- .long 0xe28f30f4 // add r3, pc, #244
- .long 0xf463cacf // vld1.64 {d28-d29}, [r3]
- .long 0xf266ad66 // vsub.f32 q13, q3, q11
- .long 0xe28f30f8 // add r3, pc, #248
- .long 0xf344cdfc // vmul.f32 q14, q10, q14
+ .long 0xf464aacf // vld1.64 {d26-d27}, [r4]
+ .long 0xe28f4f42 // add r4, pc, #264
+ .long 0xf3fb4664 // vcvt.f32.s32 q10, q10
+ .long 0xf24001f6 // vand q8, q8, q11
.long 0xf3428df8 // vmul.f32 q12, q9, q12
- .long 0xf4632acf // vld1.64 {d18-d19}, [r3]
- .long 0xf26641f6 // vorr q10, q11, q11
- .long 0xf22661f6 // vorr q3, q11, q11
+ .long 0xf4642acf // vld1.64 {d18-d19}, [r4]
.long 0xf3fb0660 // vcvt.f32.s32 q8, q8
- .long 0xf24a4cf8 // vfma.f32 q10, q13, q12
- .long 0xf20a6cfc // vfma.f32 q3, q13, q14
- .long 0xf340edf2 // vmul.f32 q15, q8, q9
- .long 0xf46e2aef // vld1.64 {d18-d19}, [lr :128]
- .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
- .long 0xf2244d60 // vsub.f32 q2, q2, q8
+ .long 0xf344adfa // vmul.f32 q13, q10, q13
+ .long 0xf3406df2 // vmul.f32 q11, q8, q9
+ .long 0xf4630aef // vld1.64 {d16-d17}, [r3 :128]
+ .long 0xf260ed60 // vsub.f32 q15, q0, q8
+ .long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128]
+ .long 0xf26a4fe8 // vmin.f32 q10, q13, q12
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
- .long 0xf24a6cfe // vfma.f32 q11, q13, q15
- .long 0xf262ad62 // vsub.f32 q13, q1, q9
- .long 0xf2062f64 // vmax.f32 q1, q3, q10
- .long 0xf46c4aef // vld1.64 {d20-d21}, [ip :128]
- .long 0xf2200d64 // vsub.f32 q0, q0, q10
- .long 0xf2440c78 // vfma.f32 q8, q2, q12
- .long 0xf24a2cfc // vfma.f32 q9, q13, q14
- .long 0xf2404c7e // vfma.f32 q10, q0, q15
- .long 0xf2066fc2 // vmax.f32 q3, q11, q1
- .long 0xf22041f0 // vorr q2, q8, q8
- .long 0xf22221f2 // vorr q1, q9, q9
- .long 0xf22401f4 // vorr q0, q10, q10
+ .long 0xf24acfe8 // vmax.f32 q14, q13, q12
+ .long 0xf24e0cf6 // vfma.f32 q8, q15, q11
+ .long 0xf2260fe4 // vmin.f32 q0, q11, q10
+ .long 0xf46e4aef // vld1.64 {d20-d21}, [lr :128]
+ .long 0xf266ed64 // vsub.f32 q15, q3, q10
+ .long 0xf3246ec6 // vcgt.f32 q3, q10, q3
+ .long 0xf246cfec // vmax.f32 q14, q11, q14
+ .long 0xf46c6aef // vld1.64 {d22-d23}, [ip :128]
+ .long 0xf2244d62 // vsub.f32 q2, q2, q9
+ .long 0xf310617c // vbsl q3, q0, q14
+ .long 0xf262cd66 // vsub.f32 q14, q1, q11
+ .long 0xf2442c78 // vfma.f32 q9, q2, q12
+ .long 0xf24e4cd6 // vfma.f32 q10, q15, q3
+ .long 0xf24c6cfa // vfma.f32 q11, q14, q13
+ .long 0xf22001f0 // vorr q0, q8, q8
+ .long 0xf22241f2 // vorr q2, q9, q9
+ .long 0xf22461f4 // vorr q3, q10, q10
+ .long 0xf22621f6 // vorr q1, q11, q11
.long 0xe28dd004 // add sp, sp, #4
.long 0xe8bd4070 // pop {r4, r5, r6, lr}
.long 0xe12fff12 // bx r2
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 2854 <sk_lerp_565_vfp4+0x14c>
+ .long 0x0a000011 // beq 29c8 <sk_lerp_565_vfp4+0x150>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 2830 <sk_lerp_565_vfp4+0x128>
+ .long 0x0a000005 // beq 29a4 <sk_lerp_565_vfp4+0x12c>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffc9 // bne 2748 <sk_lerp_565_vfp4+0x40>
+ .long 0x1affffc8 // bne 28b8 <sk_lerp_565_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -10260,12 +10435,11 @@ _sk_lerp_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffbc // b 2748 <sk_lerp_565_vfp4+0x40>
+ .long 0xeaffffbb // b 28b8 <sk_lerp_565_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffb8 // b 2748 <sk_lerp_565_vfp4+0x40>
- .long 0xe320f000 // nop {0}
+ .long 0xeaffffb7 // b 28b8 <sk_lerp_565_vfp4+0x40>
.long 0x3d042108 // .word 0x3d042108
.long 0x3d042108 // .word 0x3d042108
.long 0x3d042108 // .word 0x3d042108
@@ -10290,7 +10464,7 @@ _sk_load_tables_vfp4:
.long 0xe5964000 // ldr r4, [r6]
.long 0xe3530000 // cmp r3, #0
.long 0xe084e102 // add lr, r4, r2, lsl #2
- .long 0x1a000036 // bne 2994 <sk_load_tables_vfp4+0xfc>
+ .long 0x1a000036 // bne 2b04 <sk_load_tables_vfp4+0xfc>
.long 0xf46e0a8f // vld1.32 {d16-d17}, [lr]
.long 0xf3c7405f // vmov.i32 q10, #255
.long 0xe5967004 // ldr r7, [r6, #4]
@@ -10348,12 +10522,12 @@ _sk_load_tables_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe203c003 // and ip, r3, #3
.long 0xe35c0001 // cmp ip, #1
- .long 0x0a00000c // beq 29d4 <sk_load_tables_vfp4+0x13c>
+ .long 0x0a00000c // beq 2b44 <sk_load_tables_vfp4+0x13c>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe35c0002 // cmp ip, #2
- .long 0x0a000005 // beq 29c4 <sk_load_tables_vfp4+0x12c>
+ .long 0x0a000005 // beq 2b34 <sk_load_tables_vfp4+0x12c>
.long 0xe35c0003 // cmp ip, #3
- .long 0x1affffc1 // bne 28bc <sk_load_tables_vfp4+0x24>
+ .long 0x1affffc1 // bne 2a2c <sk_load_tables_vfp4+0x24>
.long 0xe3a02000 // mov r2, #0
.long 0xeea02b90 // vdup.32 q8, r2
.long 0xe28e2008 // add r2, lr, #8
@@ -10361,11 +10535,11 @@ _sk_load_tables_vfp4:
.long 0xedde2b00 // vldr d18, [lr]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffb9 // b 28bc <sk_load_tables_vfp4+0x24>
+ .long 0xeaffffb9 // b 2a2c <sk_load_tables_vfp4+0x24>
.long 0xe3a02000 // mov r2, #0
.long 0xeea02b90 // vdup.32 q8, r2
.long 0xf4ee083f // vld1.32 {d16[0]}, [lr :32]
- .long 0xeaffffb5 // b 28bc <sk_load_tables_vfp4+0x24>
+ .long 0xeaffffb5 // b 2a2c <sk_load_tables_vfp4+0x24>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10383,7 +10557,7 @@ _sk_load_tables_u16_be_vfp4:
.long 0xe5982000 // ldr r2, [r8]
.long 0xe35e0000 // cmp lr, #0
.long 0xe082c183 // add ip, r2, r3, lsl #3
- .long 0x1a000039 // bne 2b00 <sk_load_tables_u16_be_vfp4+0x108>
+ .long 0x1a000039 // bne 2c70 <sk_load_tables_u16_be_vfp4+0x108>
.long 0xf46c004f // vld4.16 {d16-d19}, [ip]
.long 0xf3c72b3f // vbic.i16 d18, #65280
.long 0xe5986004 // ldr r6, [r8, #4]
@@ -10444,14 +10618,14 @@ _sk_load_tables_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4ec070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [ip]
.long 0xe35e0001 // cmp lr, #1
- .long 0x0affffc3 // beq 2a1c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0x0affffc3 // beq 2b8c <sk_load_tables_u16_be_vfp4+0x24>
.long 0xe28c2008 // add r2, ip, #8
.long 0xe35e0003 // cmp lr, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffbf // bcc 2a1c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0x3affffbf // bcc 2b8c <sk_load_tables_u16_be_vfp4+0x24>
.long 0xe28c2010 // add r2, ip, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffbc // b 2a1c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0xeaffffbc // b 2b8c <sk_load_tables_u16_be_vfp4+0x24>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -10469,7 +10643,7 @@ _sk_load_tables_rgb_u16_be_vfp4:
.long 0xe5982000 // ldr r2, [r8]
.long 0xe35e0000 // cmp lr, #0
.long 0xe082c083 // add ip, r2, r3, lsl #1
- .long 0x1a000033 // bne 2c2c <sk_load_tables_rgb_u16_be_vfp4+0xf4>
+ .long 0x1a000033 // bne 2d9c <sk_load_tables_rgb_u16_be_vfp4+0xf4>
.long 0xf46c044f // vld3.16 {d16-d18}, [ip]
.long 0xf3c72b3f // vbic.i16 d18, #65280
.long 0xe5987004 // ldr r7, [r8, #4]
@@ -10524,14 +10698,14 @@ _sk_load_tables_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4ec060f // vld3.16 {d16[0],d17[0],d18[0]}, [ip]
.long 0xe35e0001 // cmp lr, #1
- .long 0x0affffc9 // beq 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0x0affffc9 // beq 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe28c2006 // add r2, ip, #6
.long 0xe35e0003 // cmp lr, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffc5 // bcc 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0x3affffc5 // bcc 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe28c200c // add r2, ip, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffc2 // b 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0xeaffffc2 // b 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe320f000 // nop {0}
.long 0x3f800000 // .word 0x3f800000
.long 0x3f800000 // .word 0x3f800000
@@ -11584,7 +11758,7 @@ _sk_load_a8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000012 // bne 3c10 <sk_load_a8_vfp4+0x78>
+ .long 0x1a000012 // bne 3d80 <sk_load_a8_vfp4+0x78>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -11606,12 +11780,12 @@ _sk_load_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 3c68 <sk_load_a8_vfp4+0xd0>
+ .long 0x0a000012 // beq 3dd8 <sk_load_a8_vfp4+0xd0>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3c40 <sk_load_a8_vfp4+0xa8>
+ .long 0x0a000005 // beq 3db0 <sk_load_a8_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe9 // bne 3bd8 <sk_load_a8_vfp4+0x40>
+ .long 0x1affffe9 // bne 3d48 <sk_load_a8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -11625,12 +11799,12 @@ _sk_load_a8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdb // b 3bd8 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffdb // b 3d48 <sk_load_a8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd6 // b 3bd8 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffd6 // b 3d48 <sk_load_a8_vfp4+0x40>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11659,7 +11833,7 @@ _sk_load_a8_dst_vfp4:
.long 0xf4430aef // vst1.64 {d16-d17}, [r3 :128]
.long 0xe082300c // add r3, r2, ip
.long 0xe280c040 // add ip, r0, #64
- .long 0x1a000011 // bne 3d24 <sk_load_a8_dst_vfp4+0x94>
+ .long 0x1a000011 // bne 3e94 <sk_load_a8_dst_vfp4+0x94>
.long 0xe5932000 // ldr r2, [r3]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -11680,12 +11854,12 @@ _sk_load_a8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe20e2003 // and r2, lr, #3
.long 0xe3520001 // cmp r2, #1
- .long 0x0a000012 // beq 3d7c <sk_load_a8_dst_vfp4+0xec>
+ .long 0x0a000012 // beq 3eec <sk_load_a8_dst_vfp4+0xec>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3520002 // cmp r2, #2
- .long 0x0a000005 // beq 3d54 <sk_load_a8_dst_vfp4+0xc4>
+ .long 0x0a000005 // beq 3ec4 <sk_load_a8_dst_vfp4+0xc4>
.long 0xe3520003 // cmp r2, #3
- .long 0x1affffea // bne 3cf0 <sk_load_a8_dst_vfp4+0x60>
+ .long 0x1affffea // bne 3e60 <sk_load_a8_dst_vfp4+0x60>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d32002 // ldrb r2, [r3, #2]
.long 0xee805bb0 // vdup.16 d16, r5
@@ -11699,12 +11873,12 @@ _sk_load_a8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdc // b 3cf0 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffdc // b 3e60 <sk_load_a8_dst_vfp4+0x60>
.long 0xe5d32000 // ldrb r2, [r3]
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd7 // b 3cf0 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffd7 // b 3e60 <sk_load_a8_dst_vfp4+0x60>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11770,7 +11944,7 @@ _sk_store_a8_vfp4:
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000005 // bne 3e88 <sk_store_a8_vfp4+0x58>
+ .long 0x1a000005 // bne 3ff8 <sk_store_a8_vfp4+0x58>
.long 0xf3f20121 // vuzp.8 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -11779,21 +11953,21 @@ _sk_store_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000a // beq 3ec0 <sk_store_a8_vfp4+0x90>
+ .long 0x0a00000a // beq 4030 <sk_store_a8_vfp4+0x90>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 3eac <sk_store_a8_vfp4+0x7c>
+ .long 0x0a000003 // beq 401c <sk_store_a8_vfp4+0x7c>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 3e78 <sk_store_a8_vfp4+0x48>
+ .long 0x1afffff4 // bne 3fe8 <sk_store_a8_vfp4+0x48>
.long 0xeeb03bb0 // vmov.u16 r3, d16[2]
.long 0xe5c23002 // strb r3, [r2, #2]
.long 0xee903bf0 // vmov.u16 r3, d16[1]
.long 0xee904bb0 // vmov.u16 r4, d16[0]
.long 0xe5c23001 // strb r3, [r2, #1]
.long 0xe5c24000 // strb r4, [r2]
- .long 0xeaffffed // b 3e78 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffed // b 3fe8 <sk_store_a8_vfp4+0x48>
.long 0xee903bb0 // vmov.u16 r3, d16[0]
.long 0xe5c23000 // strb r3, [r2]
- .long 0xeaffffea // b 3e78 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffea // b 3fe8 <sk_store_a8_vfp4+0x48>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -11814,7 +11988,7 @@ _sk_load_g8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 3f5c <sk_load_g8_vfp4+0x7c>
+ .long 0x1a000013 // bne 40cc <sk_load_g8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -11837,12 +12011,12 @@ _sk_load_g8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 3fb4 <sk_load_g8_vfp4+0xd4>
+ .long 0x0a000012 // beq 4124 <sk_load_g8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3f8c <sk_load_g8_vfp4+0xac>
+ .long 0x0a000005 // beq 40fc <sk_load_g8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 3f20 <sk_load_g8_vfp4+0x40>
+ .long 0x1affffe8 // bne 4090 <sk_load_g8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -11856,12 +12030,12 @@ _sk_load_g8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 3f20 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffda // b 4090 <sk_load_g8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 3f20 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffd5 // b 4090 <sk_load_g8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11888,7 +12062,7 @@ _sk_load_g8_dst_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000015 // bne 4078 <sk_load_g8_dst_vfp4+0x90>
+ .long 0x1a000015 // bne 41e8 <sk_load_g8_dst_vfp4+0x90>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -11913,12 +12087,12 @@ _sk_load_g8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 40d0 <sk_load_g8_dst_vfp4+0xe8>
+ .long 0x0a000012 // beq 4240 <sk_load_g8_dst_vfp4+0xe8>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 40a8 <sk_load_g8_dst_vfp4+0xc0>
+ .long 0x0a000005 // beq 4218 <sk_load_g8_dst_vfp4+0xc0>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffe6 // bne 4034 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0x1affffe6 // bne 41a4 <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -11932,12 +12106,12 @@ _sk_load_g8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffd8 // b 4034 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd8 // b 41a4 <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffd3 // b 4034 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd3 // b 41a4 <sk_load_g8_dst_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12004,7 +12178,7 @@ _sk_load_565_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001b // bne 4238 <sk_load_565_vfp4+0xa0>
+ .long 0x1a00001b // bne 43a8 <sk_load_565_vfp4+0xa0>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a02e7e // mov r2, #2016
@@ -12035,12 +12209,12 @@ _sk_load_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 428c <sk_load_565_vfp4+0xf4>
+ .long 0x0a000011 // beq 43fc <sk_load_565_vfp4+0xf4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4268 <sk_load_565_vfp4+0xd0>
+ .long 0x0a000005 // beq 43d8 <sk_load_565_vfp4+0xd0>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffdc // bne 41cc <sk_load_565_vfp4+0x34>
+ .long 0x1affffdc // bne 433c <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -12053,11 +12227,11 @@ _sk_load_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcf // b 41cc <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcf // b 433c <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffcb // b 41cc <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcb // b 433c <sk_load_565_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -12094,7 +12268,7 @@ _sk_load_565_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001f // bne 439c <sk_load_565_dst_vfp4+0xbc>
+ .long 0x1a00001f // bne 450c <sk_load_565_dst_vfp4+0xbc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
@@ -12129,12 +12303,12 @@ _sk_load_565_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 43f0 <sk_load_565_dst_vfp4+0x110>
+ .long 0x0a000011 // beq 4560 <sk_load_565_dst_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 43cc <sk_load_565_dst_vfp4+0xec>
+ .long 0x0a000005 // beq 453c <sk_load_565_dst_vfp4+0xec>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd8 // bne 4320 <sk_load_565_dst_vfp4+0x40>
+ .long 0x1affffd8 // bne 4490 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -12147,11 +12321,11 @@ _sk_load_565_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcb // b 4320 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffcb // b 4490 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc7 // b 4320 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4490 <sk_load_565_dst_vfp4+0x40>
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -12263,7 +12437,7 @@ _sk_store_565_vfp4:
.long 0xf26401f0 // vorr q8, q10, q8
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 45ac <sk_store_565_vfp4+0x84>
+ .long 0x1a000004 // bne 471c <sk_store_565_vfp4+0x84>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -12271,11 +12445,11 @@ _sk_store_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 45ec <sk_store_565_vfp4+0xc4>
+ .long 0x0a00000c // beq 475c <sk_store_565_vfp4+0xc4>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 45d0 <sk_store_565_vfp4+0xa8>
+ .long 0x0a000003 // beq 4740 <sk_store_565_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 459c <sk_store_565_vfp4+0x74>
+ .long 0x1afffff4 // bne 470c <sk_store_565_vfp4+0x74>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -12284,9 +12458,9 @@ _sk_store_565_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 459c <sk_store_565_vfp4+0x74>
+ .long 0xeaffffeb // b 470c <sk_store_565_vfp4+0x74>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 459c <sk_store_565_vfp4+0x74>
+ .long 0xeaffffe9 // b 470c <sk_store_565_vfp4+0x74>
.long 0xe320f000 // nop {0}
.long 0x427c0000 // .word 0x427c0000
.long 0x427c0000 // .word 0x427c0000
@@ -12308,7 +12482,7 @@ _sk_load_4444_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001e // bne 46b4 <sk_load_4444_vfp4+0xac>
+ .long 0x1a00001e // bne 4824 <sk_load_4444_vfp4+0xac>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f20d0 // add r2, pc, #208
@@ -12342,12 +12516,12 @@ _sk_load_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 4708 <sk_load_4444_vfp4+0x100>
+ .long 0x0a000011 // beq 4878 <sk_load_4444_vfp4+0x100>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 46e4 <sk_load_4444_vfp4+0xdc>
+ .long 0x0a000005 // beq 4854 <sk_load_4444_vfp4+0xdc>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffd9 // bne 463c <sk_load_4444_vfp4+0x34>
+ .long 0x1affffd9 // bne 47ac <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -12360,11 +12534,11 @@ _sk_load_4444_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcc // b 463c <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffcc // b 47ac <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffc8 // b 463c <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffc8 // b 47ac <sk_load_4444_vfp4+0x34>
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
@@ -12400,7 +12574,7 @@ _sk_load_4444_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000023 // bne 4824 <sk_load_4444_dst_vfp4+0xcc>
+ .long 0x1a000023 // bne 4994 <sk_load_4444_dst_vfp4+0xcc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f40e4 // add r4, pc, #228
@@ -12439,12 +12613,12 @@ _sk_load_4444_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 4878 <sk_load_4444_dst_vfp4+0x120>
+ .long 0x0a000011 // beq 49e8 <sk_load_4444_dst_vfp4+0x120>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4854 <sk_load_4444_dst_vfp4+0xfc>
+ .long 0x0a000005 // beq 49c4 <sk_load_4444_dst_vfp4+0xfc>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd4 // bne 4798 <sk_load_4444_dst_vfp4+0x40>
+ .long 0x1affffd4 // bne 4908 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -12457,11 +12631,11 @@ _sk_load_4444_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffc7 // b 4798 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4908 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc3 // b 4798 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc3 // b 4908 <sk_load_4444_dst_vfp4+0x40>
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
@@ -12584,7 +12758,7 @@ _sk_store_4444_vfp4:
.long 0xf26001f6 // vorr q8, q8, q11
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 4a60 <sk_store_4444_vfp4+0x90>
+ .long 0x1a000004 // bne 4bd0 <sk_store_4444_vfp4+0x90>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -12592,11 +12766,11 @@ _sk_store_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4aa0 <sk_store_4444_vfp4+0xd0>
+ .long 0x0a00000c // beq 4c10 <sk_store_4444_vfp4+0xd0>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4a84 <sk_store_4444_vfp4+0xb4>
+ .long 0x0a000003 // beq 4bf4 <sk_store_4444_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4a50 <sk_store_4444_vfp4+0x80>
+ .long 0x1afffff4 // bne 4bc0 <sk_store_4444_vfp4+0x80>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -12605,9 +12779,9 @@ _sk_store_4444_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 4a50 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffeb // b 4bc0 <sk_store_4444_vfp4+0x80>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 4a50 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffe9 // b 4bc0 <sk_store_4444_vfp4+0x80>
HIDDEN _sk_load_8888_vfp4
.globl _sk_load_8888_vfp4
@@ -12623,7 +12797,7 @@ _sk_load_8888_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4b2c <sk_load_8888_vfp4+0x84>
+ .long 0x1a000015 // bne 4c9c <sk_load_8888_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -12648,12 +12822,12 @@ _sk_load_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4b6c <sk_load_8888_vfp4+0xc4>
+ .long 0x0a00000c // beq 4cdc <sk_load_8888_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4b5c <sk_load_8888_vfp4+0xb4>
+ .long 0x0a000005 // beq 4ccc <sk_load_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4ad8 <sk_load_8888_vfp4+0x30>
+ .long 0x1affffe2 // bne 4c48 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -12661,11 +12835,11 @@ _sk_load_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4ad8 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffda // b 4c48 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4ad8 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffd6 // b 4c48 <sk_load_8888_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12689,7 +12863,7 @@ _sk_load_8888_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 4c34 <sk_load_8888_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 4da4 <sk_load_8888_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -12719,12 +12893,12 @@ _sk_load_8888_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 4c74 <sk_load_8888_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 4de4 <sk_load_8888_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4c64 <sk_load_8888_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 4dd4 <sk_load_8888_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4bcc <sk_load_8888_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 4d3c <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -12732,11 +12906,11 @@ _sk_load_8888_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4bcc <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 4d3c <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4bcc <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 4d3c <sk_load_8888_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12826,7 +13000,7 @@ _sk_store_8888_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 4dd8 <sk_store_8888_vfp4+0x90>
+ .long 0x1a000004 // bne 4f48 <sk_store_8888_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -12834,17 +13008,17 @@ _sk_store_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 4e04 <sk_store_8888_vfp4+0xbc>
+ .long 0x0a000007 // beq 4f74 <sk_store_8888_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4dfc <sk_store_8888_vfp4+0xb4>
+ .long 0x0a000003 // beq 4f6c <sk_store_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4dc8 <sk_store_8888_vfp4+0x80>
+ .long 0x1afffff4 // bne 4f38 <sk_store_8888_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 4dc8 <sk_store_8888_vfp4+0x80>
+ .long 0xeafffff0 // b 4f38 <sk_store_8888_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 4dc8 <sk_store_8888_vfp4+0x80>
+ .long 0xeaffffee // b 4f38 <sk_store_8888_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -12865,7 +13039,7 @@ _sk_load_bgra_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4ea4 <sk_load_bgra_vfp4+0x84>
+ .long 0x1a000015 // bne 5014 <sk_load_bgra_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -12890,12 +13064,12 @@ _sk_load_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4ee4 <sk_load_bgra_vfp4+0xc4>
+ .long 0x0a00000c // beq 5054 <sk_load_bgra_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4ed4 <sk_load_bgra_vfp4+0xb4>
+ .long 0x0a000005 // beq 5044 <sk_load_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4e50 <sk_load_bgra_vfp4+0x30>
+ .long 0x1affffe2 // bne 4fc0 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -12903,11 +13077,11 @@ _sk_load_bgra_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4e50 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffda // b 4fc0 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4e50 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffd6 // b 4fc0 <sk_load_bgra_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12931,7 +13105,7 @@ _sk_load_bgra_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 4fac <sk_load_bgra_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 511c <sk_load_bgra_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -12961,12 +13135,12 @@ _sk_load_bgra_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 4fec <sk_load_bgra_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 515c <sk_load_bgra_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4fdc <sk_load_bgra_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 514c <sk_load_bgra_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4f44 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 50b4 <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -12974,11 +13148,11 @@ _sk_load_bgra_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4f44 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 50b4 <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4f44 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 50b4 <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -13068,7 +13242,7 @@ _sk_store_bgra_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 5150 <sk_store_bgra_vfp4+0x90>
+ .long 0x1a000004 // bne 52c0 <sk_store_bgra_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -13076,17 +13250,17 @@ _sk_store_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 517c <sk_store_bgra_vfp4+0xbc>
+ .long 0x0a000007 // beq 52ec <sk_store_bgra_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 5174 <sk_store_bgra_vfp4+0xb4>
+ .long 0x0a000003 // beq 52e4 <sk_store_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 5140 <sk_store_bgra_vfp4+0x80>
+ .long 0x1afffff4 // bne 52b0 <sk_store_bgra_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 5140 <sk_store_bgra_vfp4+0x80>
+ .long 0xeafffff0 // b 52b0 <sk_store_bgra_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 5140 <sk_store_bgra_vfp4+0x80>
+ .long 0xeaffffee // b 52b0 <sk_store_bgra_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -13107,7 +13281,7 @@ _sk_load_f16_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a000008 // bne 51e8 <sk_load_f16_vfp4+0x50>
+ .long 0x1a000008 // bne 5358 <sk_load_f16_vfp4+0x50>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xf3b60720 // vcvt.f32.f16 q0, d16
@@ -13119,14 +13293,14 @@ _sk_load_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff4 // beq 51c8 <sk_load_f16_vfp4+0x30>
+ .long 0x0afffff4 // beq 5338 <sk_load_f16_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff0 // bcc 51c8 <sk_load_f16_vfp4+0x30>
+ .long 0x3afffff0 // bcc 5338 <sk_load_f16_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffed // b 51c8 <sk_load_f16_vfp4+0x30>
+ .long 0xeaffffed // b 5338 <sk_load_f16_vfp4+0x30>
HIDDEN _sk_load_f16_dst_vfp4
.globl _sk_load_f16_dst_vfp4
@@ -13145,7 +13319,7 @@ _sk_load_f16_dst_vfp4:
.long 0xe0825183 // add r5, r2, r3, lsl #3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000d // bne 5280 <sk_load_f16_dst_vfp4+0x70>
+ .long 0x1a00000d // bne 53f0 <sk_load_f16_dst_vfp4+0x70>
.long 0xf465004f // vld4.16 {d16-d19}, [r5]
.long 0xf3f64720 // vcvt.f32.f16 q10, d16
.long 0xf3f66721 // vcvt.f32.f16 q11, d17
@@ -13162,14 +13336,14 @@ _sk_load_f16_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e5070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r5]
.long 0xe3560001 // cmp r6, #1
- .long 0x0affffef // beq 524c <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x0affffef // beq 53bc <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854008 // add r4, r5, #8
.long 0xe3560003 // cmp r6, #3
.long 0xf4e4074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r4]
- .long 0x3affffeb // bcc 524c <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x3affffeb // bcc 53bc <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854010 // add r4, r5, #16
.long 0xf4e4078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r4]
- .long 0xeaffffe8 // b 524c <sk_load_f16_dst_vfp4+0x3c>
+ .long 0xeaffffe8 // b 53bc <sk_load_f16_dst_vfp4+0x3c>
HIDDEN _sk_gather_f16_vfp4
.globl _sk_gather_f16_vfp4
@@ -13230,7 +13404,7 @@ _sk_store_f16_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082218e // add r2, r2, lr, lsl #3
- .long 0x1a000004 // bne 5388 <sk_store_f16_vfp4+0x50>
+ .long 0x1a000004 // bne 54f8 <sk_store_f16_vfp4+0x50>
.long 0xf442004f // vst4.16 {d16-d19}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -13238,14 +13412,14 @@ _sk_store_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c2070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r2]
- .long 0x0afffff8 // beq 5378 <sk_store_f16_vfp4+0x40>
+ .long 0x0afffff8 // beq 54e8 <sk_store_f16_vfp4+0x40>
.long 0xe2823008 // add r3, r2, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c3074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r3]
- .long 0x3afffff4 // bcc 5378 <sk_store_f16_vfp4+0x40>
+ .long 0x3afffff4 // bcc 54e8 <sk_store_f16_vfp4+0x40>
.long 0xe2822010 // add r2, r2, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 5378 <sk_store_f16_vfp4+0x40>
+ .long 0xeafffff1 // b 54e8 <sk_store_f16_vfp4+0x40>
HIDDEN _sk_load_u16_be_vfp4
.globl _sk_load_u16_be_vfp4
@@ -13261,7 +13435,7 @@ _sk_load_u16_be_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a00001e // bne 5458 <sk_load_u16_be_vfp4+0xa8>
+ .long 0x1a00001e // bne 55c8 <sk_load_u16_be_vfp4+0xa8>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2094 // add r2, pc, #148
@@ -13295,14 +13469,14 @@ _sk_load_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffde // beq 53e0 <sk_load_u16_be_vfp4+0x30>
+ .long 0x0affffde // beq 5550 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffda // bcc 53e0 <sk_load_u16_be_vfp4+0x30>
+ .long 0x3affffda // bcc 5550 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffd7 // b 53e0 <sk_load_u16_be_vfp4+0x30>
+ .long 0xeaffffd7 // b 5550 <sk_load_u16_be_vfp4+0x30>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -13323,7 +13497,7 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe08e308e // add r3, lr, lr, lsl #1
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe0823083 // add r3, r2, r3, lsl #1
- .long 0x1a00001a // bne 552c <sk_load_rgb_u16_be_vfp4+0x9c>
+ .long 0x1a00001a // bne 569c <sk_load_rgb_u16_be_vfp4+0x9c>
.long 0xf463044f // vld3.16 {d16-d18}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2088 // add r2, pc, #136
@@ -13353,14 +13527,14 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3060f // vld3.16 {d16[0],d17[0],d18[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffe2 // beq 54c4 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x0affffe2 // beq 5634 <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe2832006 // add r2, r3, #6
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffde // bcc 54c4 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x3affffde // bcc 5634 <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe283200c // add r2, r3, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffdb // b 54c4 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0xeaffffdb // b 5634 <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -13415,7 +13589,7 @@ _sk_store_u16_be_vfp4:
.long 0xf2d84534 // vshl.s16 d20, d20, #8
.long 0xf26811b7 // vorr d17, d24, d23
.long 0xf26401b9 // vorr d16, d20, d25
- .long 0x1a000004 // bne 5630 <sk_store_u16_be_vfp4+0xb8>
+ .long 0x1a000004 // bne 57a0 <sk_store_u16_be_vfp4+0xb8>
.long 0xf443004f // vst4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -13423,14 +13597,14 @@ _sk_store_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c3070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
- .long 0x0afffff8 // beq 5620 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x0afffff8 // beq 5790 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c2074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff4 // bcc 5620 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x3afffff4 // bcc 5790 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 5620 <sk_store_u16_be_vfp4+0xa8>
+ .long 0xeafffff1 // b 5790 <sk_store_u16_be_vfp4+0xa8>
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
@@ -13450,7 +13624,7 @@ _sk_load_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000009 // bne 56bc <sk_load_f32_vfp4+0x54>
+ .long 0x1a000009 // bne 582c <sk_load_f32_vfp4+0x54>
.long 0xf462018d // vld4.32 {d16,d18,d20,d22}, [r2]!
.long 0xf462118f // vld4.32 {d17,d19,d21,d23}, [r2]
.long 0xf22001f0 // vorr q0, q8, q8
@@ -13463,14 +13637,14 @@ _sk_load_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4a20b4f // vld4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff8 // beq 56ac <sk_load_f32_vfp4+0x44>
+ .long 0x0afffff8 // beq 581c <sk_load_f32_vfp4+0x44>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4a30bcf // vld4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 56ac <sk_load_f32_vfp4+0x44>
+ .long 0x3afffff4 // bcc 581c <sk_load_f32_vfp4+0x44>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4a21b4f // vld4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 56ac <sk_load_f32_vfp4+0x44>
+ .long 0xeafffff1 // b 581c <sk_load_f32_vfp4+0x44>
HIDDEN _sk_load_f32_dst_vfp4
.globl _sk_load_f32_dst_vfp4
@@ -13489,7 +13663,7 @@ _sk_load_f32_dst_vfp4:
.long 0xe0824203 // add r4, r2, r3, lsl #4
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000e // bne 5758 <sk_load_f32_dst_vfp4+0x74>
+ .long 0x1a00000e // bne 58c8 <sk_load_f32_dst_vfp4+0x74>
.long 0xf464818d // vld4.32 {d24,d26,d28,d30}, [r4]!
.long 0xf464918f // vld4.32 {d25,d27,d29,d31}, [r4]
.long 0xf26801f8 // vorr q8, q12, q12
@@ -13507,14 +13681,14 @@ _sk_load_f32_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e40b4f // vld4.32 {d16[0],d18[0],d20[0],d22[0]}, [r4]
.long 0xe3560001 // cmp r6, #1
- .long 0x0afffff3 // beq 5734 <sk_load_f32_dst_vfp4+0x50>
+ .long 0x0afffff3 // beq 58a4 <sk_load_f32_dst_vfp4+0x50>
.long 0xe2845010 // add r5, r4, #16
.long 0xe3560003 // cmp r6, #3
.long 0xf4e50bcf // vld4.32 {d16[1],d18[1],d20[1],d22[1]}, [r5]
- .long 0x3affffef // bcc 5734 <sk_load_f32_dst_vfp4+0x50>
+ .long 0x3affffef // bcc 58a4 <sk_load_f32_dst_vfp4+0x50>
.long 0xe2844020 // add r4, r4, #32
.long 0xf4e41b4f // vld4.32 {d17[0],d19[0],d21[0],d23[0]}, [r4]
- .long 0xeaffffec // b 5734 <sk_load_f32_dst_vfp4+0x50>
+ .long 0xeaffffec // b 58a4 <sk_load_f32_dst_vfp4+0x50>
HIDDEN _sk_store_f32_vfp4
.globl _sk_store_f32_vfp4
@@ -13530,7 +13704,7 @@ _sk_store_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000005 // bne 57c4 <sk_store_f32_vfp4+0x44>
+ .long 0x1a000005 // bne 5934 <sk_store_f32_vfp4+0x44>
.long 0xf402018d // vst4.32 {d0,d2,d4,d6}, [r2]!
.long 0xf402118f // vst4.32 {d1,d3,d5,d7}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -13539,14 +13713,14 @@ _sk_store_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4820b4f // vst4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
- .long 0x0afffff8 // beq 57b4 <sk_store_f32_vfp4+0x34>
+ .long 0x0afffff8 // beq 5924 <sk_store_f32_vfp4+0x34>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4830bcf // vst4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 57b4 <sk_store_f32_vfp4+0x34>
+ .long 0x3afffff4 // bcc 5924 <sk_store_f32_vfp4+0x34>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4821b4f // vst4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 57b4 <sk_store_f32_vfp4+0x34>
+ .long 0xeafffff1 // b 5924 <sk_store_f32_vfp4+0x34>
HIDDEN _sk_clamp_x_vfp4
.globl _sk_clamp_x_vfp4
@@ -14227,7 +14401,7 @@ _sk_gradient_vfp4:
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe5931000 // ldr r1, [r3]
.long 0xe3510002 // cmp r1, #2
- .long 0x3a00000a // bcc 612c <sk_gradient_vfp4+0x5c>
+ .long 0x3a00000a // bcc 629c <sk_gradient_vfp4+0x5c>
.long 0xe5932024 // ldr r2, [r3, #36]
.long 0xf2c04051 // vmov.i32 q10, #1
.long 0xf2c00050 // vmov.i32 q8, #0
@@ -14238,7 +14412,7 @@ _sk_gradient_vfp4:
.long 0xf3468ee8 // vcge.f32 q12, q11, q12
.long 0xf35481f2 // vbsl q12, q10, q9
.long 0xf26808e0 // vadd.i32 q8, q12, q8
- .long 0x1afffff9 // bne 6114 <sk_gradient_vfp4+0x44>
+ .long 0x1afffff9 // bne 6284 <sk_gradient_vfp4+0x44>
.long 0xee315b90 // vmov.32 r5, d17[1]
.long 0xe5937010 // ldr r7, [r3, #16]
.long 0xee112b90 // vmov.32 r2, d17[0]
@@ -15379,7 +15553,7 @@ _sk_clut_3D_vfp4:
.long 0xee1e2b10 // vmov.32 r2, d14[0]
.long 0xf2660d40 // vsub.f32 q8, q3, q0
.long 0xf2000cf4 // vfma.f32 q0, q8, q10
- .long 0xea000003 // b 7130 <sk_clut_3D_vfp4+0x500>
+ .long 0xea000003 // b 72a0 <sk_clut_3D_vfp4+0x500>
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
@@ -15884,7 +16058,7 @@ _sk_clut_4D_vfp4:
.long 0xf20c0cdc // vfma.f32 q0, q14, q6
.long 0xf260cd4e // vsub.f32 q14, q0, q7
.long 0xf20cecfe // vfma.f32 q7, q14, q15
- .long 0xea000003 // b 7900 <sk_clut_4D_vfp4+0x548>
+ .long 0xea000003 // b 7a70 <sk_clut_4D_vfp4+0x548>
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
@@ -16616,7 +16790,7 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,54,173,2,0 // vbroadcastss 0x2ad36(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,42,179,2,0 // vbroadcastss 0x2b32a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -16624,7 +16798,7 @@ _sk_seed_shader_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,22,173,2,0 // vbroadcastss 0x2ad16(%rip),%ymm2 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,21,10,179,2,0 // vbroadcastss 0x2b30a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -16643,13 +16817,13 @@ _sk_dither_hsw:
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,221,172,2,0 // vpbroadcastd 0x2acdd(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,21,209,178,2,0 // vpbroadcastd 0x2b2d1(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,194,172,2,0 // vpbroadcastd 0x2acc2(%rip),%ymm12 # 2ae0c <_sk_overlay_sse2_8bit+0x44b>
- .byte 196,98,125,88,45,189,172,2,0 // vpbroadcastd 0x2acbd(%rip),%ymm13 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,37,182,178,2,0 // vpbroadcastd 0x2b2b6(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b>
+ .byte 196,98,125,88,45,177,178,2,0 // vpbroadcastd 0x2b2b1(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -16664,8 +16838,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,111,172,2,0 // vbroadcastss 0x2ac6f(%rip),%ymm9 # 2ae14 <_sk_overlay_sse2_8bit+0x453>
- .byte 196,98,125,24,21,106,172,2,0 // vbroadcastss 0x2ac6a(%rip),%ymm10 # 2ae18 <_sk_overlay_sse2_8bit+0x457>
+ .byte 196,98,125,24,13,99,178,2,0 // vbroadcastss 0x2b263(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453>
+ .byte 196,98,125,24,21,94,178,2,0 // vbroadcastss 0x2b25e(%rip),%ymm10 # 2b40c <_sk_overlay_sse2_8bit+0x457>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -16699,7 +16873,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,242,171,2,0 // vbroadcastss 0x2abf2(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,230,177,2,0 // vbroadcastss 0x2b1e6(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -16710,7 +16884,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,217,171,2,0 // vbroadcastss 0x2abd9(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,205,177,2,0 // vbroadcastss 0x2b1cd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -16756,7 +16930,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,120,171,2,0 // vbroadcastss 0x2ab78(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,108,177,2,0 // vbroadcastss 0x2b16c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -16772,7 +16946,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,71,171,2,0 // vbroadcastss 0x2ab47(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,59,177,2,0 // vbroadcastss 0x2b13b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -16811,7 +16985,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,234,170,2,0 // vbroadcastss 0x2aaea(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,222,176,2,0 // vbroadcastss 0x2b0de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -16824,7 +16998,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,201,170,2,0 // vbroadcastss 0x2aac9(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,189,176,2,0 // vbroadcastss 0x2b0bd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -16837,7 +17011,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,168,170,2,0 // vbroadcastss 0x2aaa8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,156,176,2,0 // vbroadcastss 0x2b09c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -16850,7 +17024,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,119,176,2,0 // vbroadcastss 0x2b077(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -16874,7 +17048,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,74,170,2,0 // vbroadcastss 0x2aa4a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,62,176,2,0 // vbroadcastss 0x2b03e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16897,9 +17071,14 @@ HIDDEN _sk_plus__hsw
FUNCTION(_sk_plus__hsw)
_sk_plus__hsw:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
+ .byte 196,98,125,24,5,237,175,2,0 // vbroadcastss 0x2afed(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
+ .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2
+ .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16922,7 +17101,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,193,169,2,0 // vbroadcastss 0x2a9c1(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,152,175,2,0 // vbroadcastss 0x2af98(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16956,7 +17135,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,69,169,2,0 // vbroadcastss 0x2a945(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,28,175,2,0 // vbroadcastss 0x2af1c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -16981,7 +17160,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,240,168,2,0 // vbroadcastss 0x2a8f0(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,199,174,2,0 // vbroadcastss 0x2aec7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -17009,7 +17188,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,143,168,2,0 // vbroadcastss 0x2a88f(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,102,174,2,0 // vbroadcastss 0x2ae66(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -17031,7 +17210,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,73,168,2,0 // vbroadcastss 0x2a849(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,32,174,2,0 // vbroadcastss 0x2ae20(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -17041,7 +17220,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,51,168,2,0 // vbroadcastss 0x2a833(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,10,174,2,0 // vbroadcastss 0x2ae0a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -17099,7 +17278,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,67,167,2,0 // vbroadcastss 0x2a743(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,26,173,2,0 // vbroadcastss 0x2ad1a(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -17152,7 +17331,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,93,166,2,0 // vbroadcastss 0x2a65d(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,52,172,2,0 // vbroadcastss 0x2ac34(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17203,7 +17382,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,145,165,2,0 // vbroadcastss 0x2a591(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,104,171,2,0 // vbroadcastss 0x2ab68(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17264,10 +17443,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,172,164,2,0 // vbroadcastss 0x2a4ac(%rip),%ymm11 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,29,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,157,164,2,0 // vbroadcastss 0x2a49d(%rip),%ymm12 # 2ae20 <_sk_overlay_sse2_8bit+0x45f>
+ .byte 196,98,125,24,37,116,170,2,0 // vbroadcastss 0x2aa74(%rip),%ymm12 # 2b414 <_sk_overlay_sse2_8bit+0x45f>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -17277,7 +17456,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,76,164,2,0 // vbroadcastss 0x2a44c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,35,170,2,0 // vbroadcastss 0x2aa23(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -17390,11 +17569,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,100,162,2,0 // vbroadcastss 0x2a264(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,61,95,162,2,0 // vbroadcastss 0x2a25f(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,59,168,2,0 // vbroadcastss 0x2a83b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,61,54,168,2,0 // vbroadcastss 0x2a836(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,80,162,2,0 // vbroadcastss 0x2a250(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,39,168,2,0 // vbroadcastss 0x2a827(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -17449,7 +17628,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,17,161,2,0 // vbroadcastss 0x2a111(%rip),%ymm1 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,13,232,166,2,0 // vbroadcastss 0x2a6e8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -17503,11 +17682,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,68,160,2,0 // vbroadcastss 0x2a044(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,61,63,160,2,0 // vbroadcastss 0x2a03f(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,27,166,2,0 // vbroadcastss 0x2a61b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,61,22,166,2,0 // vbroadcastss 0x2a616(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,48,160,2,0 // vbroadcastss 0x2a030(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,7,166,2,0 // vbroadcastss 0x2a607(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -17562,7 +17741,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,241,158,2,0 // vbroadcastss 0x29ef1(%rip),%ymm1 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,13,200,164,2,0 // vbroadcastss 0x2a4c8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -17590,11 +17769,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,166,158,2,0 // vbroadcastss 0x29ea6(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,53,161,158,2,0 // vbroadcastss 0x29ea1(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,45,125,164,2,0 // vbroadcastss 0x2a47d(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,120,164,2,0 // vbroadcastss 0x2a478(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,146,158,2,0 // vbroadcastss 0x29e92(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,105,164,2,0 // vbroadcastss 0x2a469(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -17650,7 +17829,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,72,157,2,0 // vbroadcastss 0x29d48(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,31,163,2,0 // vbroadcastss 0x2a31f(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17678,11 +17857,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,253,156,2,0 // vbroadcastss 0x29cfd(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,53,248,156,2,0 // vbroadcastss 0x29cf8(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,45,212,162,2,0 // vbroadcastss 0x2a2d4(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,207,162,2,0 // vbroadcastss 0x2a2cf(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,233,156,2,0 // vbroadcastss 0x29ce9(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,192,162,2,0 // vbroadcastss 0x2a2c0(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -17738,7 +17917,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,159,155,2,0 // vbroadcastss 0x29b9f(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,118,161,2,0 // vbroadcastss 0x2a176(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17768,19 +17947,19 @@ _sk_srcover_rgba_8888_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,180,0,0,0 // jne 137c <_sk_srcover_rgba_8888_hsw+0xd5>
+ .byte 15,133,180,0,0,0 // jne 1399 <_sk_srcover_rgba_8888_hsw+0xd5>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,202,156,2,0 // vpand 0x29cca(%rip),%ymm7,%ymm4 # 2afa0 <_sk_overlay_sse2_8bit+0x5df>
+ .byte 197,197,219,37,173,162,2,0 // vpand 0x2a2ad(%rip),%ymm7,%ymm4 # 2b5a0 <_sk_overlay_sse2_8bit+0x5eb>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,221,156,2,0 // vpshufb 0x29cdd(%rip),%ymm7,%ymm5 # 2afc0 <_sk_overlay_sse2_8bit+0x5ff>
+ .byte 196,226,69,0,45,192,162,2,0 // vpshufb 0x2a2c0(%rip),%ymm7,%ymm5 # 2b5c0 <_sk_overlay_sse2_8bit+0x60b>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,240,156,2,0 // vpshufb 0x29cf0(%rip),%ymm7,%ymm6 # 2afe0 <_sk_overlay_sse2_8bit+0x61f>
+ .byte 196,226,69,0,53,211,162,2,0 // vpshufb 0x2a2d3(%rip),%ymm7,%ymm6 # 2b5e0 <_sk_overlay_sse2_8bit+0x62b>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,254,154,2,0 // vbroadcastss 0x29afe(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,213,160,2,0 // vbroadcastss 0x2a0d5(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,29,155,2,0 // vbroadcastss 0x29b1d(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,13,244,160,2,0 // vbroadcastss 0x2a0f4(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -17800,7 +17979,7 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,65,53,235,202 // vpor %ymm10,%ymm9,%ymm9
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 13b3 <_sk_srcover_rgba_8888_hsw+0x10c>
+ .byte 117,66 // jne 13d0 <_sk_srcover_rgba_8888_hsw+0x10c>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -17810,33 +17989,33 @@ _sk_srcover_rgba_8888_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,58,255,255,255 // ja 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 15,135,58,255,255,255 // ja 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,253,0,0,0 // lea 0xfd(%rip),%r11 # 149c <_sk_srcover_rgba_8888_hsw+0x1f5>
+ .byte 76,141,29,0,1,0,0 // lea 0x100(%rip),%r11 # 14bc <_sk_srcover_rgba_8888_hsw+0x1f8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,27,255,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 233,27,255,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,180 // ja 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 119,180 // ja 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
.byte 65,15,182,194 // movzbl %r10b,%eax
- .byte 76,141,21,234,0,0,0 // lea 0xea(%rip),%r10 # 14b8 <_sk_srcover_rgba_8888_hsw+0x211>
+ .byte 76,141,21,237,0,0,0 // lea 0xed(%rip),%r10 # 14d8 <_sk_srcover_rgba_8888_hsw+0x214>
.byte 73,99,4,130 // movslq (%r10,%rax,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,152 // jmp 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 235,152 // jmp 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,200,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 233,200,254,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -17849,10 +18028,10 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,121,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 233,121,254,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 233,15,255,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 233,15,255,255,255 // jmpq 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -17860,33 +18039,35 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 233,219,254,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
- .byte 12,255 // or $0xff,%al
+ .byte 233,219,254,255,255 // jmpq 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 9,255 // or %edi,%edi
.byte 255 // (bad)
- .byte 255,89,255 // lcall *-0x1(%rcx)
+ .byte 255,86,255 // callq *-0x1(%rsi)
.byte 255 // (bad)
- .byte 255,67,255 // incl -0x1(%rbx)
+ .byte 255,64,255 // incl -0x1(%rax)
.byte 255 // (bad)
- .byte 255,168,255,255,255,148 // ljmp *-0x6b000001(%rax)
+ .byte 255,165,255,255,255,145 // jmpq *-0x6e000001(%rbp)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,128,255,255,255,106 // incl 0x6affffff(%rax)
.byte 255 // (bad)
+ .byte 125,255 // jge 14d1 <_sk_srcover_rgba_8888_hsw+0x20d>
.byte 255 // (bad)
- .byte 255,31 // lcall *(%rdi)
+ .byte 255,103,255 // jmpq *-0x1(%rdi)
.byte 255 // (bad)
+ .byte 255,28,255 // lcall *(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp)
+ .byte 255,162,255,255,255,154 // jmpq *-0x65000001(%rdx)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,214 // callq *%rsi
.byte 255 // (bad)
- .byte 217,255 // fcos
.byte 255 // (bad)
- .byte 255,204 // dec %esp
+ .byte 255,201 // dec %ecx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 190,255,255,255,176 // mov $0xb0ffffff,%esi
+ .byte 187,255,255,255,173 // mov $0xadffffff,%ebx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -17907,7 +18088,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,10,153,2,0 // vbroadcastss 0x2990a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,222,158,2,0 // vbroadcastss 0x29ede(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -17919,7 +18100,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,233,152,2,0 // vbroadcastss 0x298e9(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,189,158,2,0 // vbroadcastss 0x29ebd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -17931,7 +18112,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,203,152,2,0 // vbroadcastss 0x298cb(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,159,158,2,0 // vbroadcastss 0x29e9f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -17964,7 +18145,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,134,152,2,0 // vbroadcastss 0x29886(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,90,158,2,0 // vbroadcastss 0x29e5a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -18020,7 +18201,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,22,152,2,0 // vbroadcastss 0x29816(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,234,157,2,0 // vbroadcastss 0x29dea(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -18033,16 +18214,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,35,152,2,0 // vbroadcastss 0x29823(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,247,157,2,0 // vbroadcastss 0x29df7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,21,152,2,0 // vbroadcastss 0x29815(%rip),%ymm11 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
- .byte 196,98,125,24,37,248,151,2,0 // vbroadcastss 0x297f8(%rip),%ymm12 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,233,157,2,0 // vbroadcastss 0x29de9(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,37,204,157,2,0 // vbroadcastss 0x29dcc(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,253,151,2,0 // vbroadcastss 0x297fd(%rip),%ymm14 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,53,209,157,2,0 // vbroadcastss 0x29dd1(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,243,151,2,0 // vbroadcastss 0x297f3(%rip),%ymm10 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,21,199,157,2,0 // vbroadcastss 0x29dc7(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -18065,16 +18246,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,139,151,2,0 // vbroadcastss 0x2978b(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,95,157,2,0 // vbroadcastss 0x29d5f(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,125,151,2,0 // vbroadcastss 0x2977d(%rip),%ymm11 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
- .byte 196,98,125,24,37,96,151,2,0 // vbroadcastss 0x29760(%rip),%ymm12 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,81,157,2,0 // vbroadcastss 0x29d51(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,37,52,157,2,0 // vbroadcastss 0x29d34(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,101,151,2,0 // vbroadcastss 0x29765(%rip),%ymm14 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,53,57,157,2,0 // vbroadcastss 0x29d39(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,91,151,2,0 // vbroadcastss 0x2975b(%rip),%ymm10 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,21,47,157,2,0 // vbroadcastss 0x29d2f(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -18098,19 +18279,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,255,150,2,0 // vbroadcastss 0x296ff(%rip),%ymm8 # 2ae44 <_sk_overlay_sse2_8bit+0x483>
+ .byte 196,98,125,24,5,211,156,2,0 // vbroadcastss 0x29cd3(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,245,150,2,0 // vbroadcastss 0x296f5(%rip),%ymm11 # 2ae48 <_sk_overlay_sse2_8bit+0x487>
- .byte 196,98,125,24,37,240,150,2,0 // vbroadcastss 0x296f0(%rip),%ymm12 # 2ae4c <_sk_overlay_sse2_8bit+0x48b>
+ .byte 196,98,125,24,29,201,156,2,0 // vbroadcastss 0x29cc9(%rip),%ymm11 # 2b43c <_sk_overlay_sse2_8bit+0x487>
+ .byte 196,98,125,24,37,196,156,2,0 // vbroadcastss 0x29cc4(%rip),%ymm12 # 2b440 <_sk_overlay_sse2_8bit+0x48b>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,225,150,2,0 // vbroadcastss 0x296e1(%rip),%ymm14 # 2ae50 <_sk_overlay_sse2_8bit+0x48f>
+ .byte 196,98,125,24,53,181,156,2,0 // vbroadcastss 0x29cb5(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,215,150,2,0 // vbroadcastss 0x296d7(%rip),%ymm15 # 2ae54 <_sk_overlay_sse2_8bit+0x493>
+ .byte 196,98,125,24,61,171,156,2,0 // vbroadcastss 0x29cab(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,195,150,2,0 // vbroadcastss 0x296c3(%rip),%ymm13 # 2ae58 <_sk_overlay_sse2_8bit+0x497>
+ .byte 196,98,125,24,45,151,156,2,0 // vbroadcastss 0x29c97(%rip),%ymm13 # 2b44c <_sk_overlay_sse2_8bit+0x497>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -18139,31 +18320,31 @@ HIDDEN _sk_rgb_to_hsl_hsw
.globl _sk_rgb_to_hsl_hsw
FUNCTION(_sk_rgb_to_hsl_hsw)
_sk_rgb_to_hsl_hsw:
- .byte 197,124,95,193 // vmaxps %ymm1,%ymm0,%ymm8
- .byte 197,60,95,194 // vmaxps %ymm2,%ymm8,%ymm8
- .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
- .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
+ .byte 197,116,95,194 // vmaxps %ymm2,%ymm1,%ymm8
+ .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8
+ .byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
+ .byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,224,149,2,0 // vbroadcastss 0x295e0(%rip),%ymm11 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,29,178,155,2,0 // vbroadcastss 0x29bb2(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,33,150,2,0 // vbroadcastss 0x29621(%rip),%ymm14 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,53,243,155,2,0 // vbroadcastss 0x29bf3(%rip),%ymm14 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,8,150,2,0 // vbroadcastss 0x29608(%rip),%ymm14 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,53,218,155,2,0 // vbroadcastss 0x29bda(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,246,149,2,0 // vbroadcastss 0x295f6(%rip),%ymm14 # 2ae60 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,53,200,155,2,0 // vbroadcastss 0x29bc8(%rip),%ymm14 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,109,149,2,0 // vbroadcastss 0x2956d(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,63,155,2,0 // vbroadcastss 0x29b3f(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -18173,7 +18354,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,156,149,2,0 // vbroadcastss 0x2959c(%rip),%ymm8 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,5,110,155,2,0 // vbroadcastss 0x29b6e(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18190,30 +18371,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,249,148,2,0 // vbroadcastss 0x294f9(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,203,154,2,0 // vbroadcastss 0x29acb(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,56,149,2,0 // vbroadcastss 0x29538(%rip),%ymm9 # 2ae60 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,13,10,155,2,0 // vbroadcastss 0x29b0a(%rip),%ymm9 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,54,149,2,0 // vbroadcastss 0x29536(%rip),%ymm11 # 2ae6c <_sk_overlay_sse2_8bit+0x4ab>
+ .byte 196,98,125,24,29,8,155,2,0 // vbroadcastss 0x29b08(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,8,149,2,0 // vbroadcastss 0x29508(%rip),%ymm13 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,45,218,154,2,0 // vbroadcastss 0x29ada(%rip),%ymm13 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,2,149,2,0 // vbroadcastss 0x29502(%rip),%ymm14 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,53,212,154,2,0 // vbroadcastss 0x29ad4(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,252,148,2,0 // vbroadcastss 0x294fc(%rip),%ymm3 # 2ae70 <_sk_overlay_sse2_8bit+0x4af>
+ .byte 196,226,125,24,29,206,154,2,0 // vbroadcastss 0x29ace(%rip),%ymm3 # 2b464 <_sk_overlay_sse2_8bit+0x4af>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,211,148,2,0 // vbroadcastss 0x294d3(%rip),%ymm12 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,37,165,154,2,0 // vbroadcastss 0x29aa5(%rip),%ymm12 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -18229,7 +18410,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,135,148,2,0 // vbroadcastss 0x29487(%rip),%ymm0 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,226,125,24,5,89,154,2,0 // vbroadcastss 0x29a59(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -18282,12 +18463,12 @@ _sk_scale_u8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,59 // jne 1ade <_sk_scale_u8_hsw+0x54>
+ .byte 117,59 // jne 1b00 <_sk_scale_u8_hsw+0x54>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,223,156,2,0 // vpand 0x29cdf(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,189,162,2,0 // vpand 0x2a2bd(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,180,147,2,0 // vbroadcastss 0x293b4(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,134,153,2,0 // vbroadcastss 0x29986(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -18301,15 +18482,15 @@ _sk_scale_u8_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,182 // ja 1aa9 <_sk_scale_u8_hsw+0x1f>
+ .byte 119,182 // ja 1acb <_sk_scale_u8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 1b78 <_sk_scale_u8_hsw+0xee>
+ .byte 76,141,29,124,0,0,0 // lea 0x7c(%rip),%r11 # 1b9c <_sk_scale_u8_hsw+0xf0>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,151 // jmp 1aa9 <_sk_scale_u8_hsw+0x1f>
+ .byte 235,151 // jmp 1acb <_sk_scale_u8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18317,7 +18498,7 @@ _sk_scale_u8_hsw:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,110,255,255,255 // jmpq 1aa9 <_sk_scale_u8_hsw+0x1f>
+ .byte 233,110,255,255,255 // jmpq 1acb <_sk_scale_u8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18328,22 +18509,113 @@ _sk_scale_u8_hsw:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,50,255,255,255 // jmpq 1aa9 <_sk_scale_u8_hsw+0x1f>
- .byte 144 // nop
- .byte 143 // (bad)
+ .byte 233,50,255,255,255 // jmpq 1acb <_sk_scale_u8_hsw+0x1f>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 141 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,170,255,255,255,154 // ljmp *-0x65000001(%rdx)
+ .byte 255,168,255,255,255,152 // ljmp *-0x67000001(%rax)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,231 // jmpq *%rdi
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf001b88 <_sk_overlay_sse2_8bit+0xffffffffdefd71c7>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,211 // callq *%rbx
+ .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
+ .byte 255,209 // callq *%rcx
.byte 255 // (bad)
- .byte 255,195 // inc %ebx
+ .byte 255 // (bad)
+ .byte 255,193 // inc %ecx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
+HIDDEN _sk_scale_565_hsw
+.globl _sk_scale_565_hsw
+FUNCTION(_sk_scale_565_hsw)
+_sk_scale_565_hsw:
+ .byte 83 // push %rbx
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 72,99,218 // movslq %edx,%rbx
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,162,0,0,0 // jne 1c7a <_sk_scale_565_hsw+0xc2>
+ .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
+ .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
+ .byte 196,98,125,88,13,132,152,2,0 // vpbroadcastd 0x29884(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
+ .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
+ .byte 196,98,125,24,21,117,152,2,0 // vbroadcastss 0x29875(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
+ .byte 196,98,125,88,21,107,152,2,0 // vpbroadcastd 0x2986b(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
+ .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
+ .byte 196,98,125,24,29,92,152,2,0 // vbroadcastss 0x2985c(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
+ .byte 196,98,125,88,29,82,152,2,0 // vpbroadcastd 0x29852(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
+ .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
+ .byte 196,98,125,24,29,67,152,2,0 // vbroadcastss 0x29843(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
+ .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2
+ .byte 197,164,89,219 // vmulps %ymm3,%ymm11,%ymm3
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 91 // pop %rbx
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,7 // and $0x7,%r10b
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 65,254,202 // dec %r10b
+ .byte 65,128,250,6 // cmp $0x6,%r10b
+ .byte 15,135,75,255,255,255 // ja 1bde <_sk_scale_565_hsw+0x26>
+ .byte 69,15,182,210 // movzbl %r10b,%r10d
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1d04 <_sk_scale_565_hsw+0x14c>
+ .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
+ .byte 76,1,216 // add %r11,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 233,41,255,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
+ .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ .byte 233,11,255,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
+ .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ .byte 233,221,254,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 236 // in (%dx),%al
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,228 // jmpq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 220,255 // fdivr %st,%st(7)
+ .byte 255 // (bad)
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -18377,12 +18649,12 @@ _sk_lerp_u8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,79 // jne 1c2b <_sk_lerp_u8_hsw+0x68>
+ .byte 117,79 // jne 1db7 <_sk_lerp_u8_hsw+0x68>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,166,155,2,0 // vpand 0x29ba6(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,26,160,2,0 // vpand 0x2a01a(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,123,146,2,0 // vbroadcastss 0x2927b(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,227,150,2,0 // vbroadcastss 0x296e3(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -18400,15 +18672,15 @@ _sk_lerp_u8_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,162 // ja 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 119,162 // ja 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 1cc4 <_sk_lerp_u8_hsw+0x101>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 1e50 <_sk_lerp_u8_hsw+0x101>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,131 // jmp 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 235,131 // jmp 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18416,7 +18688,7 @@ _sk_lerp_u8_hsw:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,90,255,255,255 // jmpq 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 233,90,255,255,255 // jmpq 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18427,7 +18699,7 @@ _sk_lerp_u8_hsw:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,30,255,255,255 // jmpq 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 233,30,255,255,255 // jmpq 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 144 // nop
.byte 255 // (bad)
.byte 255 // (bad)
@@ -18462,24 +18734,30 @@ _sk_lerp_565_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 1daa <_sk_lerp_565_hsw+0xca>
+ .byte 15,133,182,0,0,0 // jne 1f42 <_sk_lerp_565_hsw+0xd6>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,104,145,2,0 // vpbroadcastd 0x29168(%rip),%ymm9 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,88,13,208,149,2,0 // vpbroadcastd 0x295d0(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,89,145,2,0 // vbroadcastss 0x29159(%rip),%ymm10 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,193,149,2,0 // vbroadcastss 0x295c1(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,79,145,2,0 // vpbroadcastd 0x2914f(%rip),%ymm10 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,88,21,183,149,2,0 // vpbroadcastd 0x295b7(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,64,145,2,0 // vbroadcastss 0x29140(%rip),%ymm11 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,168,149,2,0 // vbroadcastss 0x295a8(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,54,145,2,0 // vpbroadcastd 0x29136(%rip),%ymm11 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,88,29,158,149,2,0 // vpbroadcastd 0x2959e(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,39,145,2,0 // vbroadcastss 0x29127(%rip),%ymm11 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,143,149,2,0 // vbroadcastss 0x2958f(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
@@ -18487,11 +18765,7 @@ _sk_lerp_565_hsw:
.byte 197,236,92,214 // vsubps %ymm6,%ymm2,%ymm2
.byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
.byte 197,228,92,223 // vsubps %ymm7,%ymm3,%ymm3
- .byte 196,98,101,168,207 // vfmadd213ps %ymm7,%ymm3,%ymm9
- .byte 196,98,101,168,215 // vfmadd213ps %ymm7,%ymm3,%ymm10
- .byte 196,98,101,168,199 // vfmadd213ps %ymm7,%ymm3,%ymm8
- .byte 196,193,44,95,216 // vmaxps %ymm8,%ymm10,%ymm3
- .byte 197,180,95,219 // vmaxps %ymm3,%ymm9,%ymm3
+ .byte 196,226,37,168,223 // vfmadd213ps %ymm7,%ymm11,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -18500,27 +18774,27 @@ _sk_lerp_565_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,67,255,255,255 // ja 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 15,135,55,255,255,255 // ja 1e92 <_sk_lerp_565_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1e34 <_sk_lerp_565_hsw+0x154>
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1fcc <_sk_lerp_565_hsw+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,33,255,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 233,21,255,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,3,255,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,213,254,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 233,201,254,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
.byte 255 // (bad)
@@ -18547,23 +18821,23 @@ _sk_load_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 117,103 // jne 1ec1 <_sk_load_tables_hsw+0x71>
+ .byte 117,103 // jne 2059 <_sk_load_tables_hsw+0x71>
.byte 196,193,126,111,28,145 // vmovdqu (%r9,%rdx,4),%ymm3
- .byte 197,229,219,13,152,145,2,0 // vpand 0x29198(%rip),%ymm3,%ymm1 # 2b000 <_sk_overlay_sse2_8bit+0x63f>
+ .byte 197,229,219,13,0,150,2,0 // vpand 0x29600(%rip),%ymm3,%ymm1 # 2b600 <_sk_overlay_sse2_8bit+0x64b>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 76,139,80,16 // mov 0x10(%rax),%r10
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,194,109,146,4,137 // vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,152,145,2,0 // vpshufb 0x29198(%rip),%ymm3,%ymm2 # 2b020 <_sk_overlay_sse2_8bit+0x65f>
+ .byte 196,226,101,0,21,0,150,2,0 // vpshufb 0x29600(%rip),%ymm3,%ymm2 # 2b620 <_sk_overlay_sse2_8bit+0x66b>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,160,145,2,0 // vpshufb 0x291a0(%rip),%ymm3,%ymm9 # 2b040 <_sk_overlay_sse2_8bit+0x67f>
+ .byte 196,98,101,0,13,8,150,2,0 // vpshufb 0x29608(%rip),%ymm3,%ymm9 # 2b640 <_sk_overlay_sse2_8bit+0x68b>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,192,143,2,0 // vbroadcastss 0x28fc0(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,28,148,2,0 // vbroadcastss 0x2941c(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18572,21 +18846,21 @@ _sk_load_tables_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,139 // ja 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 119,139 // ja 1ff8 <_sk_load_tables_hsw+0x10>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,140,0,0,0 // lea 0x8c(%rip),%r11 # 1f6c <_sk_load_tables_hsw+0x11c>
+ .byte 76,141,29,140,0,0,0 // lea 0x8c(%rip),%r11 # 2104 <_sk_load_tables_hsw+0x11c>
.byte 79,99,20,147 // movslq (%r11,%r10,4),%r10
.byte 77,1,218 // add %r11,%r10
.byte 65,255,226 // jmpq *%r10
.byte 196,193,121,110,28,145 // vmovd (%r9,%rdx,4),%xmm3
- .byte 233,107,255,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 233,107,255,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10>
.byte 196,193,121,110,68,145,8 // vmovd 0x8(%r9,%rdx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,145 // vmovq (%r9,%rdx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,68,255,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 233,68,255,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10>
.byte 196,193,121,110,68,145,24 // vmovd 0x18(%r9,%rdx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -18599,9 +18873,9 @@ _sk_load_tables_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,145 // vmovdqu (%r9,%rdx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,245,254,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 233,245,254,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10>
.byte 144 // nop
- .byte 126,255 // jle 1f6d <_sk_load_tables_hsw+0x11d>
+ .byte 126,255 // jle 2105 <_sk_load_tables_hsw+0x11d>
.byte 255 // (bad)
.byte 255,159,255,255,255,137 // lcall *-0x76000001(%rdi)
.byte 255 // (bad)
@@ -18629,7 +18903,7 @@ _sk_load_tables_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,201,0,0,0 // jne 2067 <_sk_load_tables_u16_be_hsw+0xdf>
+ .byte 15,133,201,0,0,0 // jne 21ff <_sk_load_tables_u16_be_hsw+0xdf>
.byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8
.byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2
.byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -18645,7 +18919,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,161,151,2,0 // vmovdqa 0x297a1(%rip),%xmm10 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,21,9,156,2,0 // vmovdqa 0x29c09(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -18667,36 +18941,36 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,54,142,2,0 // vbroadcastss 0x28e36(%rip),%ymm8 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,5,146,146,2,0 // vbroadcastss 0x29292(%rip),%ymm8 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 20cd <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 116,85 // je 2265 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 20cd <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 114,72 // jb 2265 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 20da <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 116,72 // je 2272 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 20da <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 114,59 // jb 2272 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,9,255,255,255 // je 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,132,9,255,255,255 // je 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,248,254,255,255 // jb 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,130,248,254,255,255 // jb 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9
- .byte 233,236,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,236,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,223,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,223,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,214,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,214,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31>
HIDDEN _sk_load_tables_rgb_u16_be_hsw
.globl _sk_load_tables_rgb_u16_be_hsw
@@ -18706,7 +18980,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,193,0,0,0 // jne 21b6 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ .byte 15,133,193,0,0,0 // jne 234e <_sk_load_tables_rgb_u16_be_hsw+0xd3>
.byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
.byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
.byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -18727,7 +19001,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,49,150,2,0 // vmovdqa 0x29631(%rip),%xmm9 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,13,153,154,2,0 // vmovdqa 0x29a99(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -18744,48 +19018,48 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
.byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,80,140,2,0 // vbroadcastss 0x28c50(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,172,144,2,0 // vbroadcastss 0x290ac(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 21cf <_sk_load_tables_rgb_u16_be_hsw+0xec>
- .byte 233,90,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,5 // jne 2367 <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ .byte 233,90,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
.byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 21fe <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ .byte 114,26 // jb 2396 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
.byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
.byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 2203 <_sk_load_tables_rgb_u16_be_hsw+0x120>
- .byte 233,43,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,38,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 239b <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ .byte 233,43,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,38,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
.byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 2232 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ .byte 114,26 // jb 23ca <_sk_load_tables_rgb_u16_be_hsw+0x14f>
.byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
.byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 2237 <_sk_load_tables_rgb_u16_be_hsw+0x154>
- .byte 233,247,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,242,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 23cf <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ .byte 233,247,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,242,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
.byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 2260 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ .byte 114,20 // jb 23f8 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
.byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
.byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,201,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,196,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,201,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,196,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
HIDDEN _sk_byte_tables_hsw
.globl _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,192,139,2,0 // vbroadcastss 0x28bc0(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,28,144,2,0 // vbroadcastss 0x2901c(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -18907,7 +19181,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,169,137,2,0 // vbroadcastss 0x289a9(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,5,142,2,0 // vbroadcastss 0x28e05(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -19023,7 +19297,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,145,135,2,0 // vbroadcastss 0x28791(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,237,139,2,0 // vbroadcastss 0x28bed(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -19122,33 +19396,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,135,134,2,0 // vbroadcastss 0x28687(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,130,134,2,0 // vbroadcastss 0x28682(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,227,138,2,0 // vbroadcastss 0x28ae3(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,222,138,2,0 // vbroadcastss 0x28ade(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,216,133,2,0 // vbroadcastss 0x285d8(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,52,138,2,0 // vbroadcastss 0x28a34(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,106,134,2,0 // vbroadcastss 0x2866a(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,198,138,2,0 // vbroadcastss 0x28ac6(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,96,134,2,0 // vbroadcastss 0x28660(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,188,138,2,0 // vbroadcastss 0x28abc(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,86,134,2,0 // vbroadcastss 0x28656(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,178,138,2,0 // vbroadcastss 0x28ab2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,76,134,2,0 // vbroadcastss 0x2864c(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,168,138,2,0 // vbroadcastss 0x28aa8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,45,134,2,0 // vbroadcastss 0x2862d(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,137,138,2,0 // vbroadcastss 0x28a89(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,35,134,2,0 // vbroadcastss 0x28623(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,127,138,2,0 // vbroadcastss 0x28a7f(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,25,134,2,0 // vbroadcastss 0x28619(%rip),%ymm0 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,5,117,138,2,0 // vbroadcastss 0x28a75(%rip),%ymm0 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,15,134,2,0 // vbroadcastss 0x2860f(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,107,138,2,0 // vbroadcastss 0x28a6b(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,2,134,2,0 // vbroadcastss 0x28602(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,94,138,2,0 // vbroadcastss 0x28a5e(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19156,7 +19430,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,25,133,2,0 // vbroadcastss 0x28519(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,117,137,2,0 // vbroadcastss 0x28975(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19176,33 +19450,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,97,133,2,0 // vbroadcastss 0x28561(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,92,133,2,0 // vbroadcastss 0x2855c(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,189,137,2,0 // vbroadcastss 0x289bd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,184,137,2,0 // vbroadcastss 0x289b8(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,178,132,2,0 // vbroadcastss 0x284b2(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,14,137,2,0 // vbroadcastss 0x2890e(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,68,133,2,0 // vbroadcastss 0x28544(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,160,137,2,0 // vbroadcastss 0x289a0(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,58,133,2,0 // vbroadcastss 0x2853a(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,150,137,2,0 // vbroadcastss 0x28996(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,48,133,2,0 // vbroadcastss 0x28530(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,140,137,2,0 // vbroadcastss 0x2898c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,38,133,2,0 // vbroadcastss 0x28526(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,130,137,2,0 // vbroadcastss 0x28982(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,7,133,2,0 // vbroadcastss 0x28507(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,99,137,2,0 // vbroadcastss 0x28963(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,253,132,2,0 // vbroadcastss 0x284fd(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,89,137,2,0 // vbroadcastss 0x28959(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,243,132,2,0 // vbroadcastss 0x284f3(%rip),%ymm1 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,13,79,137,2,0 // vbroadcastss 0x2894f(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,233,132,2,0 // vbroadcastss 0x284e9(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,69,137,2,0 // vbroadcastss 0x28945(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,220,132,2,0 // vbroadcastss 0x284dc(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,56,137,2,0 // vbroadcastss 0x28938(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19210,7 +19484,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,243,131,2,0 // vbroadcastss 0x283f3(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,79,136,2,0 // vbroadcastss 0x2884f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19230,33 +19504,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,59,132,2,0 // vbroadcastss 0x2843b(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,54,132,2,0 // vbroadcastss 0x28436(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,151,136,2,0 // vbroadcastss 0x28897(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,146,136,2,0 // vbroadcastss 0x28892(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,140,131,2,0 // vbroadcastss 0x2838c(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,232,135,2,0 // vbroadcastss 0x287e8(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,30,132,2,0 // vbroadcastss 0x2841e(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,122,136,2,0 // vbroadcastss 0x2887a(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,20,132,2,0 // vbroadcastss 0x28414(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,112,136,2,0 // vbroadcastss 0x28870(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,10,132,2,0 // vbroadcastss 0x2840a(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,102,136,2,0 // vbroadcastss 0x28866(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,0,132,2,0 // vbroadcastss 0x28400(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,92,136,2,0 // vbroadcastss 0x2885c(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,225,131,2,0 // vbroadcastss 0x283e1(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,61,136,2,0 // vbroadcastss 0x2883d(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,215,131,2,0 // vbroadcastss 0x283d7(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,51,136,2,0 // vbroadcastss 0x28833(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,205,131,2,0 // vbroadcastss 0x283cd(%rip),%ymm2 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,21,41,136,2,0 // vbroadcastss 0x28829(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,195,131,2,0 // vbroadcastss 0x283c3(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,31,136,2,0 // vbroadcastss 0x2881f(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,182,131,2,0 // vbroadcastss 0x283b6(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,18,136,2,0 // vbroadcastss 0x28812(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19264,7 +19538,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,205,130,2,0 // vbroadcastss 0x282cd(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,41,135,2,0 // vbroadcastss 0x28729(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19284,33 +19558,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,21,131,2,0 // vbroadcastss 0x28315(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,16,131,2,0 // vbroadcastss 0x28310(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,113,135,2,0 // vbroadcastss 0x28771(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,108,135,2,0 // vbroadcastss 0x2876c(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,102,130,2,0 // vbroadcastss 0x28266(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,194,134,2,0 // vbroadcastss 0x286c2(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,248,130,2,0 // vbroadcastss 0x282f8(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,84,135,2,0 // vbroadcastss 0x28754(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,238,130,2,0 // vbroadcastss 0x282ee(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,74,135,2,0 // vbroadcastss 0x2874a(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,228,130,2,0 // vbroadcastss 0x282e4(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,64,135,2,0 // vbroadcastss 0x28740(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,218,130,2,0 // vbroadcastss 0x282da(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,54,135,2,0 // vbroadcastss 0x28736(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,187,130,2,0 // vbroadcastss 0x282bb(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,23,135,2,0 // vbroadcastss 0x28717(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,177,130,2,0 // vbroadcastss 0x282b1(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,13,135,2,0 // vbroadcastss 0x2870d(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,167,130,2,0 // vbroadcastss 0x282a7(%rip),%ymm3 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,29,3,135,2,0 // vbroadcastss 0x28703(%rip),%ymm3 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,157,130,2,0 // vbroadcastss 0x2829d(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,249,134,2,0 // vbroadcastss 0x286f9(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,144,130,2,0 // vbroadcastss 0x28290(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,236,134,2,0 // vbroadcastss 0x286ec(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19318,7 +19592,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,167,129,2,0 // vbroadcastss 0x281a7(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,3,134,2,0 // vbroadcastss 0x28603(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19337,35 +19611,35 @@ _sk_gamma_hsw:
.byte 197,252,40,241 // vmovaps %ymm1,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
- .byte 196,98,125,24,29,250,129,2,0 // vbroadcastss 0x281fa(%rip),%ymm11 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,226,125,24,45,245,129,2,0 // vbroadcastss 0x281f5(%rip),%ymm5 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,29,86,134,2,0 // vbroadcastss 0x28656(%rip),%ymm11 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,226,125,24,45,81,134,2,0 // vbroadcastss 0x28651(%rip),%ymm5 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
- .byte 196,226,125,24,37,76,129,2,0 // vbroadcastss 0x2814c(%rip),%ymm4 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,37,168,133,2,0 // vbroadcastss 0x285a8(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
- .byte 196,98,125,24,45,223,129,2,0 // vbroadcastss 0x281df(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,59,134,2,0 // vbroadcastss 0x2863b(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
- .byte 196,98,125,24,13,213,129,2,0 // vbroadcastss 0x281d5(%rip),%ymm9 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,13,49,134,2,0 // vbroadcastss 0x28631(%rip),%ymm9 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
.byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
.byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
.byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
.byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
- .byte 196,98,125,24,29,185,129,2,0 // vbroadcastss 0x281b9(%rip),%ymm11 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,29,21,134,2,0 // vbroadcastss 0x28615(%rip),%ymm11 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
- .byte 196,98,125,24,45,175,129,2,0 // vbroadcastss 0x281af(%rip),%ymm13 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,45,11,134,2,0 // vbroadcastss 0x2860b(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
.byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
.byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
.byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
.byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
- .byte 196,226,125,24,21,139,129,2,0 // vbroadcastss 0x2818b(%rip),%ymm2 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,226,125,24,21,231,133,2,0 // vbroadcastss 0x285e7(%rip),%ymm2 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
- .byte 196,226,125,24,29,130,129,2,0 // vbroadcastss 0x28182(%rip),%ymm3 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,226,125,24,29,222,133,2,0 // vbroadcastss 0x285de(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
- .byte 196,226,125,24,13,120,129,2,0 // vbroadcastss 0x28178(%rip),%ymm1 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,13,212,133,2,0 // vbroadcastss 0x285d4(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,5,110,129,2,0 // vbroadcastss 0x2816e(%rip),%ymm0 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,226,125,24,5,202,133,2,0 // vbroadcastss 0x285ca(%rip),%ymm0 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
@@ -19396,7 +19670,7 @@ _sk_gamma_hsw:
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
.byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
.byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
- .byte 196,226,125,24,13,223,128,2,0 // vbroadcastss 0x280df(%rip),%ymm1 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,226,125,24,13,59,133,2,0 // vbroadcastss 0x2853b(%rip),%ymm1 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
.byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
.byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
@@ -19416,26 +19690,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,157,128,2,0 // vbroadcastss 0x2809d(%rip),%ymm8 # 2aec4 <_sk_overlay_sse2_8bit+0x503>
- .byte 196,98,125,24,13,0,128,2,0 // vbroadcastss 0x28000(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
- .byte 196,98,125,24,21,143,128,2,0 // vbroadcastss 0x2808f(%rip),%ymm10 # 2aec8 <_sk_overlay_sse2_8bit+0x507>
+ .byte 196,98,125,24,5,249,132,2,0 // vbroadcastss 0x284f9(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503>
+ .byte 196,98,125,24,13,92,132,2,0 // vbroadcastss 0x2845c(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,21,235,132,2,0 // vbroadcastss 0x284eb(%rip),%ymm10 # 2b4bc <_sk_overlay_sse2_8bit+0x507>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,128,128,2,0 // vbroadcastss 0x28080(%rip),%ymm9 # 2aecc <_sk_overlay_sse2_8bit+0x50b>
+ .byte 196,98,125,24,13,220,132,2,0 // vbroadcastss 0x284dc(%rip),%ymm9 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,118,128,2,0 // vbroadcastss 0x28076(%rip),%ymm0 # 2aed0 <_sk_overlay_sse2_8bit+0x50f>
+ .byte 196,226,125,24,5,210,132,2,0 // vbroadcastss 0x284d2(%rip),%ymm0 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,109,128,2,0 // vbroadcastss 0x2806d(%rip),%ymm8 # 2aed4 <_sk_overlay_sse2_8bit+0x513>
+ .byte 196,98,125,24,5,201,132,2,0 // vbroadcastss 0x284c9(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,99,128,2,0 // vbroadcastss 0x28063(%rip),%ymm9 # 2aed8 <_sk_overlay_sse2_8bit+0x517>
+ .byte 196,98,125,24,13,191,132,2,0 // vbroadcastss 0x284bf(%rip),%ymm9 # 2b4cc <_sk_overlay_sse2_8bit+0x517>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,80,128,2,0 // vbroadcastss 0x28050(%rip),%ymm2 # 2aedc <_sk_overlay_sse2_8bit+0x51b>
+ .byte 196,226,125,24,21,172,132,2,0 // vbroadcastss 0x284ac(%rip),%ymm2 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,70,128,2,0 // vbroadcastss 0x28046(%rip),%ymm11 # 2aee0 <_sk_overlay_sse2_8bit+0x51f>
+ .byte 196,98,125,24,29,162,132,2,0 // vbroadcastss 0x284a2(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,60,128,2,0 // vbroadcastss 0x2803c(%rip),%ymm12 # 2aee4 <_sk_overlay_sse2_8bit+0x523>
+ .byte 196,98,125,24,37,152,132,2,0 // vbroadcastss 0x28498(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -19450,9 +19724,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,241,127,2,0 // vbroadcastss 0x27ff1(%rip),%ymm0 # 2aee8 <_sk_overlay_sse2_8bit+0x527>
+ .byte 196,226,125,24,5,77,132,2,0 // vbroadcastss 0x2844d(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,232,127,2,0 // vbroadcastss 0x27fe8(%rip),%ymm8 # 2aeec <_sk_overlay_sse2_8bit+0x52b>
+ .byte 196,98,125,24,5,68,132,2,0 // vbroadcastss 0x28444(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19469,12 +19743,12 @@ _sk_load_a8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 2f5b <_sk_load_a8_hsw+0x4e>
+ .byte 117,53 // jne 30f3 <_sk_load_a8_hsw+0x4e>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,92,136,2,0 // vpand 0x2885c(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,196,140,2,0 // vpand 0x28cc4(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,50,127,2,0 // vbroadcastss 0x27f32(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,142,131,2,0 // vbroadcastss 0x2838e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -19487,15 +19761,15 @@ _sk_load_a8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 119,189 // ja 30c4 <_sk_load_a8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 2ff4 <_sk_load_a8_hsw+0xe7>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 318c <_sk_load_a8_hsw+0xe7>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,158 // jmp 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 235,158 // jmp 30c4 <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -19503,7 +19777,7 @@ _sk_load_a8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,118,255,255,255 // jmpq 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -19514,7 +19788,7 @@ _sk_load_a8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,59,255,255,255 // jmpq 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -19548,12 +19822,12 @@ _sk_load_a8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 305e <_sk_load_a8_dst_hsw+0x4e>
+ .byte 117,53 // jne 31f6 <_sk_load_a8_dst_hsw+0x4e>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,89,135,2,0 // vpand 0x28759(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,193,139,2,0 // vpand 0x28bc1(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,47,126,2,0 // vbroadcastss 0x27e2f(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,139,130,2,0 // vbroadcastss 0x2828b(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -19566,15 +19840,15 @@ _sk_load_a8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 119,189 // ja 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 30f4 <_sk_load_a8_dst_hsw+0xe4>
+ .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 328c <_sk_load_a8_dst_hsw+0xe4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,158 // jmp 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 235,158 // jmp 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -19582,7 +19856,7 @@ _sk_load_a8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,118,255,255,255 // jmpq 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -19593,7 +19867,7 @@ _sk_load_a8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,59,255,255,255 // jmpq 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -19654,7 +19928,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,178,124,2,0 // vbroadcastss 0x27cb2(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,14,129,2,0 // vbroadcastss 0x2810e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -19673,14 +19947,14 @@ _sk_store_a8_hsw:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,57,124,2,0 // vbroadcastss 0x27c39(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,149,128,2,0 // vbroadcastss 0x28095(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3221 <_sk_store_a8_hsw+0x47>
+ .byte 117,11 // jne 33b9 <_sk_store_a8_hsw+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -19689,25 +19963,25 @@ _sk_store_a8_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 321c <_sk_store_a8_hsw+0x42>
+ .byte 119,235 // ja 33b4 <_sk_store_a8_hsw+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3298 <_sk_store_a8_hsw+0xbe>
+ .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3430 <_sk_store_a8_hsw+0xbe>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp 321c <_sk_store_a8_hsw+0x42>
+ .byte 235,201 // jmp 33b4 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,60,133,2,0 // vpshufb 0x2853c(%rip),%xmm8,%xmm8 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf>
+ .byte 196,98,57,0,5,164,137,2,0 // vpshufb 0x289a4(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp 321c <_sk_store_a8_hsw+0x42>
+ .byte 235,175 // jmp 33b4 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,34,133,2,0 // vpshufb 0x28522(%rip),%xmm8,%xmm8 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef>
+ .byte 196,98,57,0,5,138,137,2,0 // vpshufb 0x2898a(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp 321c <_sk_store_a8_hsw+0x42>
+ .byte 235,134 // jmp 33b4 <_sk_store_a8_hsw+0x42>
.byte 102,144 // xchg %ax,%ax
.byte 178,255 // mov $0xff,%dl
.byte 255 // (bad)
@@ -19741,15 +20015,15 @@ _sk_load_g8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 3307 <_sk_load_g8_hsw+0x53>
+ .byte 117,58 // jne 349f <_sk_load_g8_hsw+0x53>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,181,132,2,0 // vpand 0x284b5(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,29,137,2,0 // vpand 0x2891d(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,139,123,2,0 // vbroadcastss 0x27b8b(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,231,127,2,0 // vbroadcastss 0x27fe7(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,8,123,2,0 // vbroadcastss 0x27b08(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,100,127,2,0 // vbroadcastss 0x27f64(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -19759,15 +20033,15 @@ _sk_load_g8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 119,184 // ja 346b <_sk_load_g8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 33a0 <_sk_load_g8_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3538 <_sk_load_g8_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 235,153 // jmp 346b <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -19775,7 +20049,7 @@ _sk_load_g8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,113,255,255,255 // jmpq 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -19786,7 +20060,7 @@ _sk_load_g8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,54,255,255,255 // jmpq 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -19820,15 +20094,15 @@ _sk_load_g8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 340f <_sk_load_g8_dst_hsw+0x53>
+ .byte 117,58 // jne 35a7 <_sk_load_g8_dst_hsw+0x53>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,173,131,2,0 // vpand 0x283ad(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,21,136,2,0 // vpand 0x28815(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,131,122,2,0 // vbroadcastss 0x27a83(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,223,126,2,0 // vbroadcastss 0x27edf(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,0,122,2,0 // vbroadcastss 0x27a00(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,92,126,2,0 // vbroadcastss 0x27e5c(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -19838,15 +20112,15 @@ _sk_load_g8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 119,184 // ja 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 34a8 <_sk_load_g8_dst_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3640 <_sk_load_g8_dst_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,153 // jmp 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 235,153 // jmp 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -19854,7 +20128,7 @@ _sk_load_g8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,113,255,255,255 // jmpq 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -19865,7 +20139,7 @@ _sk_load_g8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,54,255,255,255 // jmpq 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -19927,10 +20201,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,254,120,2,0 // vbroadcastss 0x278fe(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,90,125,2,0 // vbroadcastss 0x27d5a(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,123,120,2,0 // vbroadcastss 0x2787b(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,215,124,2,0 // vbroadcastss 0x27cd7(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -19948,26 +20222,26 @@ _sk_load_565_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 3622 <_sk_load_565_hsw+0x8f>
+ .byte 117,115 // jne 37ba <_sk_load_565_hsw+0x8f>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,185,120,2,0 // vpbroadcastd 0x278b9(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,5,21,125,2,0 // vpbroadcastd 0x27d15(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,172,120,2,0 // vbroadcastss 0x278ac(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,8,125,2,0 // vbroadcastss 0x27d08(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,163,120,2,0 // vpbroadcastd 0x278a3(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,13,255,124,2,0 // vpbroadcastd 0x27cff(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,150,120,2,0 // vbroadcastss 0x27896(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,242,124,2,0 // vbroadcastss 0x27cf2(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,141,120,2,0 // vpbroadcastd 0x2788d(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,29,233,124,2,0 // vpbroadcastd 0x27ce9(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,128,120,2,0 // vbroadcastss 0x27880(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,220,124,2,0 // vbroadcastss 0x27cdc(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,229,119,2,0 // vbroadcastss 0x277e5(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,65,124,2,0 // vbroadcastss 0x27c41(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -19975,27 +20249,27 @@ _sk_load_565_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 35b5 <_sk_load_565_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 374d <_sk_load_565_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 36a8 <_sk_load_565_hsw+0x115>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3840 <_sk_load_565_hsw+0x115>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,89,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,60,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,15,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20029,26 +20303,26 @@ _sk_load_565_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 3753 <_sk_load_565_dst_hsw+0x8f>
+ .byte 117,115 // jne 38eb <_sk_load_565_dst_hsw+0x8f>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,136,119,2,0 // vpbroadcastd 0x27788(%rip),%ymm4 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,37,228,123,2,0 // vpbroadcastd 0x27be4(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,123,119,2,0 // vbroadcastss 0x2777b(%rip),%ymm5 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,45,215,123,2,0 // vbroadcastss 0x27bd7(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,114,119,2,0 // vpbroadcastd 0x27772(%rip),%ymm5 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,45,206,123,2,0 // vpbroadcastd 0x27bce(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,101,119,2,0 // vbroadcastss 0x27765(%rip),%ymm7 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,61,193,123,2,0 // vbroadcastss 0x27bc1(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,92,119,2,0 // vpbroadcastd 0x2775c(%rip),%ymm7 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,61,184,123,2,0 // vpbroadcastd 0x27bb8(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,79,119,2,0 // vbroadcastss 0x2774f(%rip),%ymm7 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,61,171,123,2,0 // vbroadcastss 0x27bab(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,180,118,2,0 // vbroadcastss 0x276b4(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,16,123,2,0 // vbroadcastss 0x27b10(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -20056,27 +20330,27 @@ _sk_load_565_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 387e <_sk_load_565_dst_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 37d8 <_sk_load_565_dst_hsw+0x114>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3970 <_sk_load_565_dst_hsw+0x114>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,89,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,60,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,15,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20139,23 +20413,23 @@ _sk_gather_565_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,215,117,2,0 // vpbroadcastd 0x275d7(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,5,51,122,2,0 // vpbroadcastd 0x27a33(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,202,117,2,0 // vbroadcastss 0x275ca(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,38,122,2,0 // vbroadcastss 0x27a26(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,193,117,2,0 // vpbroadcastd 0x275c1(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,13,29,122,2,0 // vpbroadcastd 0x27a1d(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,180,117,2,0 // vbroadcastss 0x275b4(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,16,122,2,0 // vbroadcastss 0x27a10(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,171,117,2,0 // vpbroadcastd 0x275ab(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,29,7,122,2,0 // vpbroadcastd 0x27a07(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,158,117,2,0 // vbroadcastss 0x2759e(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,250,121,2,0 // vbroadcastss 0x279fa(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,3,117,2,0 // vbroadcastss 0x27503(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,95,121,2,0 // vbroadcastss 0x2795f(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_hsw
@@ -20170,11 +20444,11 @@ _sk_store_565_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,205,117,2,0 // vbroadcastss 0x275cd(%rip),%ymm8 # 2aef0 <_sk_overlay_sse2_8bit+0x52f>
+ .byte 196,98,125,24,5,41,122,2,0 // vbroadcastss 0x27a29(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,184,117,2,0 // vbroadcastss 0x275b8(%rip),%ymm10 # 2aef4 <_sk_overlay_sse2_8bit+0x533>
+ .byte 196,98,125,24,21,20,122,2,0 // vbroadcastss 0x27a14(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -20185,7 +20459,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 397b <_sk_store_565_hsw+0x78>
+ .byte 117,11 // jne 3b13 <_sk_store_565_hsw+0x78>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20194,22 +20468,22 @@ _sk_store_565_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3976 <_sk_store_565_hsw+0x73>
+ .byte 119,235 // ja 3b0e <_sk_store_565_hsw+0x73>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 39d8 <_sk_store_565_hsw+0xd5>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3b70 <_sk_store_565_hsw+0xd5>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3976 <_sk_store_565_hsw+0x73>
+ .byte 235,206 // jmp 3b0e <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3976 <_sk_store_565_hsw+0x73>
+ .byte 235,190 // jmp 3b0e <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3976 <_sk_store_565_hsw+0x73>
+ .byte 235,158 // jmp 3b0e <_sk_store_565_hsw+0x73>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -20227,7 +20501,7 @@ _sk_store_565_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe10039f0 <_sk_overlay_sse2_8bit+0xffffffffe0fd902f>
+ .byte 232,255,255,255,224 // callq ffffffffe1003b88 <_sk_overlay_sse2_8bit+0xffffffffe0fd8bd3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -20245,28 +20519,28 @@ _sk_load_4444_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3a9f <_sk_load_4444_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3c37 <_sk_load_4444_hsw+0xab>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,208,116,2,0 // vpbroadcastd 0x274d0(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,5,44,121,2,0 // vpbroadcastd 0x2792c(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,195,116,2,0 // vbroadcastss 0x274c3(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,31,121,2,0 // vbroadcastss 0x2791f(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,186,116,2,0 // vpbroadcastd 0x274ba(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,13,22,121,2,0 // vpbroadcastd 0x27916(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,173,116,2,0 // vbroadcastss 0x274ad(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,9,121,2,0 // vbroadcastss 0x27909(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,164,116,2,0 // vpbroadcastd 0x274a4(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,21,0,121,2,0 // vpbroadcastd 0x27900(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,151,116,2,0 // vbroadcastss 0x27497(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,243,120,2,0 // vbroadcastss 0x278f3(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,141,116,2,0 // vpbroadcastd 0x2748d(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,233,120,2,0 // vpbroadcastd 0x278e9(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,127,116,2,0 // vbroadcastss 0x2747f(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,219,120,2,0 // vbroadcastss 0x278db(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20276,27 +20550,27 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3bb2 <_sk_load_4444_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3b24 <_sk_load_4444_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3cbc <_sk_load_4444_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,65,255,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,36,255,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,247,254,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20331,28 +20605,28 @@ _sk_load_4444_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3beb <_sk_load_4444_dst_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3d83 <_sk_load_4444_dst_hsw+0xab>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,132,115,2,0 // vpbroadcastd 0x27384(%rip),%ymm4 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,37,224,119,2,0 // vpbroadcastd 0x277e0(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,119,115,2,0 // vbroadcastss 0x27377(%rip),%ymm5 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,45,211,119,2,0 // vbroadcastss 0x277d3(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,110,115,2,0 // vpbroadcastd 0x2736e(%rip),%ymm5 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,45,202,119,2,0 // vpbroadcastd 0x277ca(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,97,115,2,0 // vbroadcastss 0x27361(%rip),%ymm6 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,53,189,119,2,0 // vbroadcastss 0x277bd(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,88,115,2,0 // vpbroadcastd 0x27358(%rip),%ymm6 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,53,180,119,2,0 // vpbroadcastd 0x277b4(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,75,115,2,0 // vbroadcastss 0x2734b(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,167,119,2,0 // vbroadcastss 0x277a7(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,65,115,2,0 // vpbroadcastd 0x27341(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,157,119,2,0 // vpbroadcastd 0x2779d(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,51,115,2,0 // vbroadcastss 0x27333(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,143,119,2,0 // vbroadcastss 0x2778f(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20362,27 +20636,27 @@ _sk_load_4444_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3c70 <_sk_load_4444_dst_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3e08 <_sk_load_4444_dst_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,65,255,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,36,255,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,247,254,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20445,25 +20719,25 @@ _sk_gather_4444_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,187,113,2,0 // vpbroadcastd 0x271bb(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,5,23,118,2,0 // vpbroadcastd 0x27617(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,174,113,2,0 // vbroadcastss 0x271ae(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,10,118,2,0 // vbroadcastss 0x2760a(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,165,113,2,0 // vpbroadcastd 0x271a5(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,13,1,118,2,0 // vpbroadcastd 0x27601(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,152,113,2,0 // vbroadcastss 0x27198(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,244,117,2,0 // vbroadcastss 0x275f4(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,143,113,2,0 // vpbroadcastd 0x2718f(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,21,235,117,2,0 // vpbroadcastd 0x275eb(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,130,113,2,0 // vbroadcastss 0x27182(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,222,117,2,0 // vbroadcastss 0x275de(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,120,113,2,0 // vpbroadcastd 0x27178(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,212,117,2,0 // vpbroadcastd 0x275d4(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,106,113,2,0 // vbroadcastss 0x2716a(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,198,117,2,0 // vbroadcastss 0x275c6(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20480,7 +20754,7 @@ _sk_store_4444_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,69,113,2,0 // vbroadcastss 0x27145(%rip),%ymm8 # 2af18 <_sk_overlay_sse2_8bit+0x557>
+ .byte 196,98,125,24,5,161,117,2,0 // vbroadcastss 0x275a1(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -20498,7 +20772,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3e37 <_sk_store_4444_hsw+0x84>
+ .byte 117,11 // jne 3fcf <_sk_store_4444_hsw+0x84>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20507,22 +20781,22 @@ _sk_store_4444_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 119,235 // ja 3fca <_sk_store_4444_hsw+0x7f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3e94 <_sk_store_4444_hsw+0xe1>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 402c <_sk_store_4444_hsw+0xe1>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 235,206 // jmp 3fca <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 235,190 // jmp 3fca <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 235,158 // jmp 3fca <_sk_store_4444_hsw+0x7f>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -20540,7 +20814,7 @@ _sk_store_4444_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe1003eac <_sk_overlay_sse2_8bit+0xffffffffe0fd94eb>
+ .byte 232,255,255,255,224 // callq ffffffffe1004044 <_sk_overlay_sse2_8bit+0xffffffffe0fd908f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -20558,16 +20832,16 @@ _sk_load_8888_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3f24 <_sk_load_8888_hsw+0x74>
+ .byte 117,87 // jne 40bc <_sk_load_8888_hsw+0x74>
.byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3
- .byte 197,229,219,5,133,113,2,0 // vpand 0x27185(%rip),%ymm3,%ymm0 # 2b060 <_sk_overlay_sse2_8bit+0x69f>
+ .byte 197,229,219,5,237,117,2,0 // vpand 0x275ed(%rip),%ymm3,%ymm0 # 2b660 <_sk_overlay_sse2_8bit+0x6ab>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,144,111,2,0 // vbroadcastss 0x26f90(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,236,115,2,0 // vbroadcastss 0x273ec(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,138,113,2,0 // vpshufb 0x2718a(%rip),%ymm3,%ymm1 # 2b080 <_sk_overlay_sse2_8bit+0x6bf>
+ .byte 196,226,101,0,13,242,117,2,0 // vpshufb 0x275f2(%rip),%ymm3,%ymm1 # 2b680 <_sk_overlay_sse2_8bit+0x6cb>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,152,113,2,0 // vpshufb 0x27198(%rip),%ymm3,%ymm2 # 2b0a0 <_sk_overlay_sse2_8bit+0x6df>
+ .byte 196,226,101,0,21,0,118,2,0 // vpshufb 0x27600(%rip),%ymm3,%ymm2 # 2b6a0 <_sk_overlay_sse2_8bit+0x6eb>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -20581,21 +20855,21 @@ _sk_load_8888_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 119,155 // ja 406b <_sk_load_8888_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 3fd0 <_sk_load_8888_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4168 <_sk_load_8888_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3
- .byte 233,124,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,85,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -20608,9 +20882,9 @@ _sk_load_8888_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,6,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 3fd1 <_sk_load_8888_hsw+0x121>
+ .byte 124,255 // jl 4169 <_sk_load_8888_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -20644,16 +20918,16 @@ _sk_load_8888_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 4060 <_sk_load_8888_dst_hsw+0x74>
+ .byte 117,87 // jne 41f8 <_sk_load_8888_dst_hsw+0x74>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,169,112,2,0 // vpand 0x270a9(%rip),%ymm7,%ymm4 # 2b0c0 <_sk_overlay_sse2_8bit+0x6ff>
+ .byte 197,197,219,37,17,117,2,0 // vpand 0x27511(%rip),%ymm7,%ymm4 # 2b6c0 <_sk_overlay_sse2_8bit+0x70b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,84,110,2,0 // vbroadcastss 0x26e54(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,176,114,2,0 // vbroadcastss 0x272b0(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,174,112,2,0 // vpshufb 0x270ae(%rip),%ymm7,%ymm5 # 2b0e0 <_sk_overlay_sse2_8bit+0x71f>
+ .byte 196,226,69,0,45,22,117,2,0 // vpshufb 0x27516(%rip),%ymm7,%ymm5 # 2b6e0 <_sk_overlay_sse2_8bit+0x72b>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,188,112,2,0 // vpshufb 0x270bc(%rip),%ymm7,%ymm6 # 2b100 <_sk_overlay_sse2_8bit+0x73f>
+ .byte 196,226,69,0,53,36,117,2,0 // vpshufb 0x27524(%rip),%ymm7,%ymm6 # 2b700 <_sk_overlay_sse2_8bit+0x74b>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -20667,21 +20941,21 @@ _sk_load_8888_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 119,155 // ja 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 410c <_sk_load_8888_dst_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 42a4 <_sk_load_8888_dst_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,124,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,85,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -20694,9 +20968,9 @@ _sk_load_8888_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,6,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 410d <_sk_load_8888_dst_hsw+0x121>
+ .byte 124,255 // jl 42a5 <_sk_load_8888_dst_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -20730,14 +21004,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,202,111,2,0 // vpand 0x26fca(%rip),%ymm3,%ymm0 # 2b120 <_sk_overlay_sse2_8bit+0x75f>
+ .byte 197,229,219,5,50,116,2,0 // vpand 0x27432(%rip),%ymm3,%ymm0 # 2b720 <_sk_overlay_sse2_8bit+0x76b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,21,109,2,0 // vbroadcastss 0x26d15(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,113,113,2,0 // vbroadcastss 0x27171(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,207,111,2,0 // vpshufb 0x26fcf(%rip),%ymm3,%ymm1 # 2b140 <_sk_overlay_sse2_8bit+0x77f>
+ .byte 196,226,101,0,13,55,116,2,0 // vpshufb 0x27437(%rip),%ymm3,%ymm1 # 2b740 <_sk_overlay_sse2_8bit+0x78b>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,221,111,2,0 // vpshufb 0x26fdd(%rip),%ymm3,%ymm2 # 2b160 <_sk_overlay_sse2_8bit+0x79f>
+ .byte 196,226,101,0,21,69,116,2,0 // vpshufb 0x27445(%rip),%ymm3,%ymm2 # 2b760 <_sk_overlay_sse2_8bit+0x7ab>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -20758,7 +21032,7 @@ _sk_store_8888_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,113,108,2,0 // vbroadcastss 0x26c71(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,205,112,2,0 // vbroadcastss 0x270cd(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -20774,7 +21048,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4218 <_sk_store_8888_hsw+0x7a>
+ .byte 117,11 // jne 43b0 <_sk_store_8888_hsw+0x7a>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20783,17 +21057,17 @@ _sk_store_8888_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 4213 <_sk_store_8888_hsw+0x75>
+ .byte 119,235 // ja 43ab <_sk_store_8888_hsw+0x75>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4288 <_sk_store_8888_hsw+0xea>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4420 <_sk_store_8888_hsw+0xea>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp 4213 <_sk_store_8888_hsw+0x75>
+ .byte 235,207 // jmp 43ab <_sk_store_8888_hsw+0x75>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp 4213 <_sk_store_8888_hsw+0x75>
+ .byte 235,191 // jmp 43ab <_sk_store_8888_hsw+0x75>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -20801,7 +21075,7 @@ _sk_store_8888_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp 4213 <_sk_store_8888_hsw+0x75>
+ .byte 235,142 // jmp 43ab <_sk_store_8888_hsw+0x75>
.byte 15,31,0 // nopl (%rax)
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
@@ -20813,7 +21087,7 @@ _sk_store_8888_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,218 // callq ffffffffdb00429c <_sk_overlay_sse2_8bit+0xffffffffdafd98db>
+ .byte 232,255,255,255,218 // callq ffffffffdb004434 <_sk_overlay_sse2_8bit+0xffffffffdafd947f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,204 // dec %esp
@@ -20834,16 +21108,16 @@ _sk_load_bgra_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 4318 <_sk_load_bgra_hsw+0x74>
+ .byte 117,87 // jne 44b0 <_sk_load_bgra_hsw+0x74>
.byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3
- .byte 197,229,219,5,177,110,2,0 // vpand 0x26eb1(%rip),%ymm3,%ymm0 # 2b180 <_sk_overlay_sse2_8bit+0x7bf>
+ .byte 197,229,219,5,25,115,2,0 // vpand 0x27319(%rip),%ymm3,%ymm0 # 2b780 <_sk_overlay_sse2_8bit+0x7cb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,156,107,2,0 // vbroadcastss 0x26b9c(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,248,111,2,0 // vbroadcastss 0x26ff8(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,182,110,2,0 // vpshufb 0x26eb6(%rip),%ymm3,%ymm0 # 2b1a0 <_sk_overlay_sse2_8bit+0x7df>
+ .byte 196,226,101,0,5,30,115,2,0 // vpshufb 0x2731e(%rip),%ymm3,%ymm0 # 2b7a0 <_sk_overlay_sse2_8bit+0x7eb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,196,110,2,0 // vpshufb 0x26ec4(%rip),%ymm3,%ymm0 # 2b1c0 <_sk_overlay_sse2_8bit+0x7ff>
+ .byte 196,226,101,0,5,44,115,2,0 // vpshufb 0x2732c(%rip),%ymm3,%ymm0 # 2b7c0 <_sk_overlay_sse2_8bit+0x80b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -20857,21 +21131,21 @@ _sk_load_bgra_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 119,155 // ja 445f <_sk_load_bgra_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 43c4 <_sk_load_bgra_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 455c <_sk_load_bgra_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3
- .byte 233,124,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,85,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -20884,9 +21158,9 @@ _sk_load_bgra_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,6,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 43c5 <_sk_load_bgra_hsw+0x121>
+ .byte 124,255 // jl 455d <_sk_load_bgra_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -20920,16 +21194,16 @@ _sk_load_bgra_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 4454 <_sk_load_bgra_dst_hsw+0x74>
+ .byte 117,87 // jne 45ec <_sk_load_bgra_dst_hsw+0x74>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,213,109,2,0 // vpand 0x26dd5(%rip),%ymm7,%ymm4 # 2b1e0 <_sk_overlay_sse2_8bit+0x81f>
+ .byte 197,197,219,37,61,114,2,0 // vpand 0x2723d(%rip),%ymm7,%ymm4 # 2b7e0 <_sk_overlay_sse2_8bit+0x82b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,96,106,2,0 // vbroadcastss 0x26a60(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,188,110,2,0 // vbroadcastss 0x26ebc(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,218,109,2,0 // vpshufb 0x26dda(%rip),%ymm7,%ymm4 # 2b200 <_sk_overlay_sse2_8bit+0x83f>
+ .byte 196,226,69,0,37,66,114,2,0 // vpshufb 0x27242(%rip),%ymm7,%ymm4 # 2b800 <_sk_overlay_sse2_8bit+0x84b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,232,109,2,0 // vpshufb 0x26de8(%rip),%ymm7,%ymm4 # 2b220 <_sk_overlay_sse2_8bit+0x85f>
+ .byte 196,226,69,0,37,80,114,2,0 // vpshufb 0x27250(%rip),%ymm7,%ymm4 # 2b820 <_sk_overlay_sse2_8bit+0x86b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -20943,21 +21217,21 @@ _sk_load_bgra_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 119,155 // ja 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4500 <_sk_load_bgra_dst_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4698 <_sk_load_bgra_dst_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,124,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,85,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -20970,9 +21244,9 @@ _sk_load_bgra_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,6,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 4501 <_sk_load_bgra_dst_hsw+0x121>
+ .byte 124,255 // jl 4699 <_sk_load_bgra_dst_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -21006,14 +21280,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,246,108,2,0 // vpand 0x26cf6(%rip),%ymm3,%ymm0 # 2b240 <_sk_overlay_sse2_8bit+0x87f>
+ .byte 197,229,219,5,94,113,2,0 // vpand 0x2715e(%rip),%ymm3,%ymm0 # 2b840 <_sk_overlay_sse2_8bit+0x88b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,33,105,2,0 // vbroadcastss 0x26921(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,125,109,2,0 // vbroadcastss 0x26d7d(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,251,108,2,0 // vpshufb 0x26cfb(%rip),%ymm3,%ymm0 # 2b260 <_sk_overlay_sse2_8bit+0x89f>
+ .byte 196,226,101,0,5,99,113,2,0 // vpshufb 0x27163(%rip),%ymm3,%ymm0 # 2b860 <_sk_overlay_sse2_8bit+0x8ab>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,9,109,2,0 // vpshufb 0x26d09(%rip),%ymm3,%ymm0 # 2b280 <_sk_overlay_sse2_8bit+0x8bf>
+ .byte 196,226,101,0,5,113,113,2,0 // vpshufb 0x27171(%rip),%ymm3,%ymm0 # 2b880 <_sk_overlay_sse2_8bit+0x8cb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -21034,7 +21308,7 @@ _sk_store_bgra_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,125,104,2,0 // vbroadcastss 0x2687d(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,217,108,2,0 // vbroadcastss 0x26cd9(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21050,7 +21324,7 @@ _sk_store_bgra_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 460c <_sk_store_bgra_hsw+0x7a>
+ .byte 117,11 // jne 47a4 <_sk_store_bgra_hsw+0x7a>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -21059,17 +21333,17 @@ _sk_store_bgra_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 119,235 // ja 479f <_sk_store_bgra_hsw+0x75>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 467c <_sk_store_bgra_hsw+0xea>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4814 <_sk_store_bgra_hsw+0xea>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 235,207 // jmp 479f <_sk_store_bgra_hsw+0x75>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 235,191 // jmp 479f <_sk_store_bgra_hsw+0x75>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -21077,7 +21351,7 @@ _sk_store_bgra_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 235,142 // jmp 479f <_sk_store_bgra_hsw+0x75>
.byte 15,31,0 // nopl (%rax)
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
@@ -21089,7 +21363,7 @@ _sk_store_bgra_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,218 // callq ffffffffdb004690 <_sk_overlay_sse2_8bit+0xffffffffdafd9ccf>
+ .byte 232,255,255,255,218 // callq ffffffffdb004828 <_sk_overlay_sse2_8bit+0xffffffffdafd9873>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,204 // dec %esp
@@ -21109,7 +21383,7 @@ _sk_load_f16_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 4719 <_sk_load_f16_hsw+0x81>
+ .byte 117,101 // jne 48b1 <_sk_load_f16_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,92,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -21135,29 +21409,29 @@ _sk_load_f16_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 477f <_sk_load_f16_hsw+0xe7>
+ .byte 116,85 // je 4917 <_sk_load_f16_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 477f <_sk_load_f16_hsw+0xe7>
+ .byte 114,72 // jb 4917 <_sk_load_f16_hsw+0xe7>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 478c <_sk_load_f16_hsw+0xf4>
+ .byte 116,72 // je 4924 <_sk_load_f16_hsw+0xf4>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 478c <_sk_load_f16_hsw+0xf4>
+ .byte 114,59 // jb 4924 <_sk_load_f16_hsw+0xf4>
.byte 196,193,123,16,92,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 46cf <_sk_load_f16_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 4867 <_sk_load_f16_hsw+0x37>
.byte 196,193,97,22,92,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 46cf <_sk_load_f16_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 4867 <_sk_load_f16_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,67,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,58,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
HIDDEN _sk_load_f16_dst_hsw
.globl _sk_load_f16_dst_hsw
@@ -21171,7 +21445,7 @@ _sk_load_f16_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 4816 <_sk_load_f16_dst_hsw+0x81>
+ .byte 117,101 // jne 49ae <_sk_load_f16_dst_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,124,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -21197,29 +21471,29 @@ _sk_load_f16_dst_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 487c <_sk_load_f16_dst_hsw+0xe7>
+ .byte 116,85 // je 4a14 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 487c <_sk_load_f16_dst_hsw+0xe7>
+ .byte 114,72 // jb 4a14 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4889 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 116,72 // je 4a21 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4889 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 114,59 // jb 4a21 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,123,16,124,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm7
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 196,193,65,22,124,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,67,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
- .byte 233,58,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -21282,7 +21556,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4997 <_sk_store_f16_hsw+0x7b>
+ .byte 117,31 // jne 4b2f <_sk_store_f16_hsw+0x7b>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -21291,22 +21565,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4993 <_sk_store_f16_hsw+0x77>
+ .byte 116,240 // je 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4993 <_sk_store_f16_hsw+0x77>
+ .byte 114,227 // jb 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,218 // je 4993 <_sk_store_f16_hsw+0x77>
+ .byte 116,218 // je 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4993 <_sk_store_f16_hsw+0x77>
+ .byte 114,205 // jb 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,196 // je 4993 <_sk_store_f16_hsw+0x77>
+ .byte 116,196 // je 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4993 <_sk_store_f16_hsw+0x77>
+ .byte 114,183 // jb 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,174 // jmp 4993 <_sk_store_f16_hsw+0x77>
+ .byte 235,174 // jmp 4b2b <_sk_store_f16_hsw+0x77>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -21321,7 +21595,7 @@ _sk_load_u16_be_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 4ad8 <_sk_load_u16_be_hsw+0xf3>
+ .byte 15,133,204,0,0,0 // jne 4c70 <_sk_load_u16_be_hsw+0xf3>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -21340,7 +21614,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,39,100,2,0 // vbroadcastss 0x26427(%rip),%ymm10 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,21,131,104,2,0 // vbroadcastss 0x26883(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -21368,29 +21642,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4b3e <_sk_load_u16_be_hsw+0x159>
+ .byte 116,85 // je 4cd6 <_sk_load_u16_be_hsw+0x159>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4b3e <_sk_load_u16_be_hsw+0x159>
+ .byte 114,72 // jb 4cd6 <_sk_load_u16_be_hsw+0x159>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4b4b <_sk_load_u16_be_hsw+0x166>
+ .byte 116,72 // je 4ce3 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4b4b <_sk_load_u16_be_hsw+0x166>
+ .byte 114,59 // jb 4ce3 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,6,255,255,255 // je 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 15,132,6,255,255,255 // je 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,245,254,255,255 // jb 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 15,130,245,254,255,255 // jb 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,233,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,220,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,211,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -21407,7 +21681,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 4c4b <_sk_load_rgb_u16_be_hsw+0xf7>
+ .byte 15,133,204,0,0,0 // jne 4de3 <_sk_load_rgb_u16_be_hsw+0xf7>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -21431,7 +21705,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,155,98,2,0 // vbroadcastss 0x2629b(%rip),%ymm10 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,21,247,102,2,0 // vbroadcastss 0x266f7(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -21448,41 +21722,41 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,187,97,2,0 // vbroadcastss 0x261bb(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,23,102,2,0 // vbroadcastss 0x26617(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 4c64 <_sk_load_rgb_u16_be_hsw+0x110>
- .byte 233,79,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,5 // jne 4dfc <_sk_load_rgb_u16_be_hsw+0x110>
+ .byte 233,79,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 4c93 <_sk_load_rgb_u16_be_hsw+0x13f>
+ .byte 114,26 // jb 4e2b <_sk_load_rgb_u16_be_hsw+0x13f>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 4c98 <_sk_load_rgb_u16_be_hsw+0x144>
- .byte 233,32,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,27,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 4e30 <_sk_load_rgb_u16_be_hsw+0x144>
+ .byte 233,32,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,27,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 4cc7 <_sk_load_rgb_u16_be_hsw+0x173>
+ .byte 114,26 // jb 4e5f <_sk_load_rgb_u16_be_hsw+0x173>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 4ccc <_sk_load_rgb_u16_be_hsw+0x178>
- .byte 233,236,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,231,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 4e64 <_sk_load_rgb_u16_be_hsw+0x178>
+ .byte 233,236,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,231,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 4cf5 <_sk_load_rgb_u16_be_hsw+0x1a1>
+ .byte 114,20 // jb 4e8d <_sk_load_rgb_u16_be_hsw+0x1a1>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,190,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,185,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,190,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,185,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -21496,7 +21770,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,251,97,2,0 // vbroadcastss 0x261fb(%rip),%ymm8 # 2af1c <_sk_overlay_sse2_8bit+0x55b>
+ .byte 196,98,125,24,5,87,102,2,0 // vbroadcastss 0x26657(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -21534,7 +21808,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4e05 <_sk_store_u16_be_hsw+0x10b>
+ .byte 117,31 // jne 4f9d <_sk_store_u16_be_hsw+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -21543,22 +21817,22 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,240 // je 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,227 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,218 // je 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,205 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,196 // je 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,183 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 235,174 // jmp 4f99 <_sk_store_u16_be_hsw+0x107>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
@@ -21566,7 +21840,7 @@ FUNCTION(_sk_load_f32_hsw)
_sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4edf <_sk_load_f32_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 5077 <_sk_load_f32_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -21574,7 +21848,7 @@ _sk_load_f32_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 4f08 <_sk_load_f32_hsw+0xb5>
+ .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 50a0 <_sk_load_f32_hsw+0xb5>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -21622,7 +21896,7 @@ FUNCTION(_sk_load_f32_dst_hsw)
_sk_load_f32_dst_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4fb4 <_sk_load_f32_dst_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 514c <_sk_load_f32_dst_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -21630,7 +21904,7 @@ _sk_load_f32_dst_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 4fdc <_sk_load_f32_dst_hsw+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 5174 <_sk_load_f32_dst_hsw+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -21694,7 +21968,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 507b <_sk_store_f32_hsw+0x7f>
+ .byte 117,55 // jne 5213 <_sk_store_f32_hsw+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -21707,22 +21981,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 116,240 // je 520f <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 114,227 // jb 520f <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 116,218 // je 520f <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 114,205 // jb 520f <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 116,195 // je 520f <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 114,181 // jb 520f <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 235,171 // jmp 520f <_sk_store_f32_hsw+0x7b>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -21799,7 +22073,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,87,92,2,0 // vmulss 0x25c57(%rip),%xmm9,%xmm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,5,179,96,2,0 // vmulss 0x260b3(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -21826,7 +22100,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,243,91,2,0 // vmulss 0x25bf3(%rip),%xmm9,%xmm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,13,79,96,2,0 // vmulss 0x2604f(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -21848,7 +22122,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,168,91,2,0 // vbroadcastss 0x25ba8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,4,96,2,0 // vbroadcastss 0x26004(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21866,9 +22140,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,159,91,2,0 // vbroadcastss 0x25b9f(%rip),%ymm8 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,5,251,95,2,0 // vbroadcastss 0x25ffb(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,117,91,2,0 // vbroadcastss 0x25b75(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,209,95,2,0 // vbroadcastss 0x25fd1(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -21884,11 +22158,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,97,92,2,0 // vbroadcastss 0x25c61(%rip),%ymm3 # 2af20 <_sk_overlay_sse2_8bit+0x55f>
- .byte 196,98,125,24,5,92,92,2,0 // vbroadcastss 0x25c5c(%rip),%ymm8 # 2af24 <_sk_overlay_sse2_8bit+0x563>
+ .byte 196,226,125,24,29,189,96,2,0 // vbroadcastss 0x260bd(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f>
+ .byte 196,98,125,24,5,184,96,2,0 // vbroadcastss 0x260b8(%rip),%ymm8 # 2b518 <_sk_overlay_sse2_8bit+0x563>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,77,92,2,0 // vbroadcastss 0x25c4d(%rip),%ymm3 # 2af28 <_sk_overlay_sse2_8bit+0x567>
+ .byte 196,226,125,24,29,169,96,2,0 // vbroadcastss 0x260a9(%rip),%ymm3 # 2b51c <_sk_overlay_sse2_8bit+0x567>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -22088,9 +22362,9 @@ _sk_evenly_spaced_gradient_hsw:
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 77,137,211 // mov %r10,%r11
.byte 73,255,203 // dec %r11
- .byte 120,7 // js 55d4 <_sk_evenly_spaced_gradient_hsw+0x19>
+ .byte 120,7 // js 576c <_sk_evenly_spaced_gradient_hsw+0x19>
.byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1
- .byte 235,22 // jmp 55ea <_sk_evenly_spaced_gradient_hsw+0x2f>
+ .byte 235,22 // jmp 5782 <_sk_evenly_spaced_gradient_hsw+0x2f>
.byte 76,137,219 // mov %r11,%rbx
.byte 72,209,235 // shr %rbx
.byte 65,131,227,1 // and $0x1,%r11d
@@ -22101,7 +22375,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1
.byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11
.byte 73,131,250,8 // cmp $0x8,%r10
- .byte 119,70 // ja 5643 <_sk_evenly_spaced_gradient_hsw+0x88>
+ .byte 119,70 // ja 57db <_sk_evenly_spaced_gradient_hsw+0x88>
.byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8
.byte 72,139,88,40 // mov 0x28(%rax),%rbx
.byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9
@@ -22117,7 +22391,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13
- .byte 235,110 // jmp 56b1 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ .byte 235,110 // jmp 5849 <_sk_evenly_spaced_gradient_hsw+0xf6>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -22154,14 +22428,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,85,88,2,0 // vbroadcastss 0x25855(%rip),%ymm0 # 2af2c <_sk_overlay_sse2_8bit+0x56b>
- .byte 196,226,125,24,13,80,88,2,0 // vbroadcastss 0x25850(%rip),%ymm1 # 2af30 <_sk_overlay_sse2_8bit+0x56f>
+ .byte 196,226,125,24,5,177,92,2,0 // vbroadcastss 0x25cb1(%rip),%ymm0 # 2b520 <_sk_overlay_sse2_8bit+0x56b>
+ .byte 196,226,125,24,13,172,92,2,0 // vbroadcastss 0x25cac(%rip),%ymm1 # 2b524 <_sk_overlay_sse2_8bit+0x56f>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,70,88,2,0 // vbroadcastss 0x25846(%rip),%ymm0 # 2af34 <_sk_overlay_sse2_8bit+0x573>
+ .byte 196,226,125,24,5,162,92,2,0 // vbroadcastss 0x25ca2(%rip),%ymm0 # 2b528 <_sk_overlay_sse2_8bit+0x573>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,60,88,2,0 // vbroadcastss 0x2583c(%rip),%ymm1 # 2af38 <_sk_overlay_sse2_8bit+0x577>
+ .byte 196,226,125,24,13,152,92,2,0 // vbroadcastss 0x25c98(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,50,88,2,0 // vbroadcastss 0x25832(%rip),%ymm0 # 2af3c <_sk_overlay_sse2_8bit+0x57b>
+ .byte 196,226,125,24,5,142,92,2,0 // vbroadcastss 0x25c8e(%rip),%ymm0 # 2b530 <_sk_overlay_sse2_8bit+0x57b>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -22176,11 +22450,11 @@ _sk_gradient_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 73,131,249,1 // cmp $0x1,%r9
- .byte 15,134,180,0,0,0 // jbe 57e2 <_sk_gradient_hsw+0xc3>
+ .byte 15,134,180,0,0,0 // jbe 597a <_sk_gradient_hsw+0xc3>
.byte 76,139,80,72 // mov 0x48(%rax),%r10
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,187,1,0,0,0 // mov $0x1,%r11d
- .byte 196,226,125,24,21,195,86,2,0 // vbroadcastss 0x256c3(%rip),%ymm2 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,226,125,24,21,31,91,2,0 // vbroadcastss 0x25b1f(%rip),%ymm2 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -22188,10 +22462,10 @@ _sk_gradient_hsw:
.byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9
.byte 73,255,195 // inc %r11
.byte 77,57,217 // cmp %r11,%r9
- .byte 117,226 // jne 574a <_sk_gradient_hsw+0x2b>
+ .byte 117,226 // jne 58e2 <_sk_gradient_hsw+0x2b>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 73,131,249,8 // cmp $0x8,%r9
- .byte 118,121 // jbe 57eb <_sk_gradient_hsw+0xcc>
+ .byte 118,121 // jbe 5983 <_sk_gradient_hsw+0xcc>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -22215,7 +22489,7 @@ _sk_gradient_hsw:
.byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- .byte 235,77 // jmp 582f <_sk_gradient_hsw+0x110>
+ .byte 235,77 // jmp 59c7 <_sk_gradient_hsw+0x110>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8
@@ -22275,24 +22549,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,118,86,2,0 // vbroadcastss 0x25676(%rip),%ymm13 # 2af40 <_sk_overlay_sse2_8bit+0x57f>
- .byte 196,98,125,24,53,113,86,2,0 // vbroadcastss 0x25671(%rip),%ymm14 # 2af44 <_sk_overlay_sse2_8bit+0x583>
+ .byte 196,98,125,24,45,210,90,2,0 // vbroadcastss 0x25ad2(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f>
+ .byte 196,98,125,24,53,205,90,2,0 // vbroadcastss 0x25acd(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,103,86,2,0 // vbroadcastss 0x25667(%rip),%ymm13 # 2af48 <_sk_overlay_sse2_8bit+0x587>
+ .byte 196,98,125,24,45,195,90,2,0 // vbroadcastss 0x25ac3(%rip),%ymm13 # 2b53c <_sk_overlay_sse2_8bit+0x587>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,93,86,2,0 // vbroadcastss 0x2565d(%rip),%ymm14 # 2af4c <_sk_overlay_sse2_8bit+0x58b>
+ .byte 196,98,125,24,53,185,90,2,0 // vbroadcastss 0x25ab9(%rip),%ymm14 # 2b540 <_sk_overlay_sse2_8bit+0x58b>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,72,86,2,0 // vbroadcastss 0x25648(%rip),%ymm10 # 2af50 <_sk_overlay_sse2_8bit+0x58f>
+ .byte 196,98,125,24,21,164,90,2,0 // vbroadcastss 0x25aa4(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,222,84,2,0 // vbroadcastss 0x254de(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,58,89,2,0 // vbroadcastss 0x2593a(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,200,84,2,0 // vbroadcastss 0x254c8(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,36,89,2,0 // vbroadcastss 0x25924(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -22320,23 +22594,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,200,85,2,0 // vbroadcastss 0x255c8(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,36,90,2,0 // vbroadcastss 0x25a24(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,167,85,2,0 // vbroadcastss 0x255a7(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,3,90,2,0 // vbroadcastss 0x25a03(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,138,85,2,0 // vbroadcastss 0x2558a(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,230,89,2,0 // vbroadcastss 0x259e6(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,27,84,2,0 // vbroadcastss 0x2541b(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,119,88,2,0 // vbroadcastss 0x25877(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -22355,23 +22629,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,48,85,2,0 // vbroadcastss 0x25530(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,140,89,2,0 // vbroadcastss 0x2598c(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,15,85,2,0 // vbroadcastss 0x2550f(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,107,89,2,0 // vbroadcastss 0x2596b(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,242,84,2,0 // vbroadcastss 0x254f2(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,78,89,2,0 // vbroadcastss 0x2594e(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,131,83,2,0 // vbroadcastss 0x25383(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,223,87,2,0 // vbroadcastss 0x257df(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -22389,14 +22663,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,158,84,2,0 // vbroadcastss 0x2549e(%rip),%ymm10 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,21,250,88,2,0 // vbroadcastss 0x258fa(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,129,84,2,0 // vbroadcastss 0x25481(%rip),%ymm8 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,5,221,88,2,0 // vbroadcastss 0x258dd(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22436,7 +22710,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,193,82,2,0 // vbroadcastss 0x252c1(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,29,87,2,0 // vbroadcastss 0x2571d(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -22470,9 +22744,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,177,83,2,0 // vbroadcastss 0x253b1(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,13,88,2,0 // vbroadcastss 0x2580d(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,72,82,2,0 // vbroadcastss 0x25248(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,164,86,2,0 // vbroadcastss 0x256a4(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22483,7 +22757,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,40,82,2,0 // vbroadcastss 0x25228(%rip),%ymm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,5,132,86,2,0 // vbroadcastss 0x25684(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -22495,9 +22769,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,104,83,2,0 // vbroadcastss 0x25368(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,196,87,2,0 // vbroadcastss 0x257c4(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,254,81,2,0 // vbroadcastss 0x251fe(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,90,86,2,0 // vbroadcastss 0x2565a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22508,7 +22782,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,222,81,2,0 // vbroadcastss 0x251de(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,58,86,2,0 // vbroadcastss 0x2563a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -22520,13 +22794,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,33,83,2,0 // vbroadcastss 0x25321(%rip),%ymm0 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,5,125,87,2,0 // vbroadcastss 0x2577d(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,180,81,2,0 // vbroadcastss 0x251b4(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,16,86,2,0 // vbroadcastss 0x25610(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,17,82,2,0 // vbroadcastss 0x25211(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,252,82,2,0 // vbroadcastss 0x252fc(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,109,86,2,0 // vbroadcastss 0x2566d(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,88,87,2,0 // vbroadcastss 0x25758(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -22538,16 +22812,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,211,82,2,0 // vbroadcastss 0x252d3(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,47,87,2,0 // vbroadcastss 0x2572f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,106,81,2,0 // vbroadcastss 0x2516a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,198,85,2,0 // vbroadcastss 0x255c6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,196,82,2,0 // vbroadcastss 0x252c4(%rip),%ymm9 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,21,191,82,2,0 // vbroadcastss 0x252bf(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,32,87,2,0 // vbroadcastss 0x25720(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,27,87,2,0 // vbroadcastss 0x2571b(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,65,81,2,0 // vbroadcastss 0x25141(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,157,85,2,0 // vbroadcastss 0x2559d(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,167,82,2,0 // vbroadcastss 0x252a7(%rip),%ymm10 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,21,3,87,2,0 // vbroadcastss 0x25703(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22558,14 +22832,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,23,81,2,0 // vbroadcastss 0x25117(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,115,85,2,0 // vbroadcastss 0x25573(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,113,82,2,0 // vbroadcastss 0x25271(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,29,108,82,2,0 // vbroadcastss 0x2526c(%rip),%ymm11 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,205,86,2,0 // vbroadcastss 0x256cd(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,200,86,2,0 // vbroadcastss 0x256c8(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,93,82,2,0 // vbroadcastss 0x2525d(%rip),%ymm8 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,5,185,86,2,0 // vbroadcastss 0x256b9(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22576,12 +22850,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,57,82,2,0 // vbroadcastss 0x25239(%rip),%ymm0 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,5,149,86,2,0 // vbroadcastss 0x25695(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,42,81,2,0 // vbroadcastss 0x2512a(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,21,82,2,0 // vbroadcastss 0x25215(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,134,85,2,0 // vbroadcastss 0x25586(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,113,86,2,0 // vbroadcastss 0x25671(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -22593,13 +22867,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,240,81,2,0 // vbroadcastss 0x251f0(%rip),%ymm1 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,13,76,86,2,0 // vbroadcastss 0x2564c(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,130,80,2,0 // vbroadcastss 0x25082(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,222,84,2,0 // vbroadcastss 0x254de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,223,80,2,0 // vbroadcastss 0x250df(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,202,81,2,0 // vbroadcastss 0x251ca(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,59,85,2,0 // vbroadcastss 0x2553b(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,38,86,2,0 // vbroadcastss 0x25626(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -22611,16 +22885,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,161,81,2,0 // vbroadcastss 0x251a1(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,253,85,2,0 // vbroadcastss 0x255fd(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,55,80,2,0 // vbroadcastss 0x25037(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,147,84,2,0 // vbroadcastss 0x25493(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,145,81,2,0 // vbroadcastss 0x25191(%rip),%ymm9 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,21,140,81,2,0 // vbroadcastss 0x2518c(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,237,85,2,0 // vbroadcastss 0x255ed(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,232,85,2,0 // vbroadcastss 0x255e8(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,14,80,2,0 // vbroadcastss 0x2500e(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,106,84,2,0 // vbroadcastss 0x2546a(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,116,81,2,0 // vbroadcastss 0x25174(%rip),%ymm10 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,21,208,85,2,0 // vbroadcastss 0x255d0(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22631,14 +22905,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,228,79,2,0 // vbroadcastss 0x24fe4(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,64,84,2,0 // vbroadcastss 0x25440(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,61,81,2,0 // vbroadcastss 0x2513d(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,29,56,81,2,0 // vbroadcastss 0x25138(%rip),%ymm11 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,153,85,2,0 // vbroadcastss 0x25599(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,148,85,2,0 // vbroadcastss 0x25594(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,41,81,2,0 // vbroadcastss 0x25129(%rip),%ymm8 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,5,133,85,2,0 // vbroadcastss 0x25585(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22649,12 +22923,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,5,81,2,0 // vbroadcastss 0x25105(%rip),%ymm1 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,13,97,85,2,0 // vbroadcastss 0x25561(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,245,79,2,0 // vbroadcastss 0x24ff5(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,224,80,2,0 // vbroadcastss 0x250e0(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,81,84,2,0 // vbroadcastss 0x25451(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,60,85,2,0 // vbroadcastss 0x2553c(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -22794,19 +23068,19 @@ _sk_clut_3D_hsw:
.byte 197,254,127,76,36,160 // vmovdqu %ymm1,-0x60(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
- .byte 196,226,125,88,61,157,78,2,0 // vpbroadcastd 0x24e9d(%rip),%ymm7 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,226,125,88,61,249,82,2,0 // vpbroadcastd 0x252f9(%rip),%ymm7 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- .byte 196,98,125,88,21,17,77,2,0 // vpbroadcastd 0x24d11(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,21,109,81,2,0 // vpbroadcastd 0x2516d(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,193,117,254,242 // vpaddd %ymm10,%ymm1,%ymm6
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
.byte 196,226,37,146,28,176 // vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- .byte 196,98,125,88,29,0,77,2,0 // vpbroadcastd 0x24d00(%rip),%ymm11 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,29,92,81,2,0 // vpbroadcastd 0x2515c(%rip),%ymm11 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,226,77,146,36,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- .byte 196,98,125,24,45,80,78,2,0 // vbroadcastss 0x24e50(%rip),%ymm13 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,98,125,24,45,172,82,2,0 // vbroadcastss 0x252ac(%rip),%ymm13 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 196,193,124,88,245 // vaddps %ymm13,%ymm0,%ymm6
.byte 197,254,91,246 // vcvttps2dq %ymm6,%ymm6
.byte 196,226,77,64,205 // vpmulld %ymm5,%ymm6,%ymm1
@@ -23026,19 +23300,19 @@ _sk_clut_4D_hsw:
.byte 197,126,91,245 // vcvttps2dq %ymm5,%ymm14
.byte 196,98,13,64,233 // vpmulld %ymm1,%ymm14,%ymm13
.byte 197,149,254,198 // vpaddd %ymm6,%ymm13,%ymm0
- .byte 196,98,125,88,21,230,73,2,0 // vpbroadcastd 0x249e6(%rip),%ymm10 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,125,88,21,66,78,2,0 // vpbroadcastd 0x24e42(%rip),%ymm10 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,98,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- .byte 196,98,125,88,29,89,72,2,0 // vpbroadcastd 0x24859(%rip),%ymm11 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,29,181,76,2,0 // vpbroadcastd 0x24cb5(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,125,254,195 // vpaddd %ymm11,%ymm0,%ymm8
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,162,53,146,20,128 // vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- .byte 196,98,125,88,37,72,72,2,0 // vpbroadcastd 0x24848(%rip),%ymm12 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,37,164,76,2,0 // vpbroadcastd 0x24ca4(%rip),%ymm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,226,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- .byte 196,98,125,24,13,151,73,2,0 // vbroadcastss 0x24997(%rip),%ymm9 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,98,125,24,13,243,77,2,0 // vbroadcastss 0x24df3(%rip),%ymm9 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 196,65,84,88,193 // vaddps %ymm9,%ymm5,%ymm8
.byte 196,65,126,91,192 // vcvttps2dq %ymm8,%ymm8
.byte 196,226,61,64,193 // vpmulld %ymm1,%ymm8,%ymm0
@@ -23363,7 +23637,7 @@ _sk_clut_4D_hsw:
.byte 197,196,92,214 // vsubps %ymm6,%ymm7,%ymm2
.byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,69,65,2,0 // vbroadcastss 0x24145(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,161,69,2,0 // vbroadcastss 0x245a1(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,164,36,32,3,0,0 // vmovups 0x320(%rsp),%ymm4
.byte 197,252,16,172,36,64,3,0,0 // vmovups 0x340(%rsp),%ymm5
.byte 197,252,16,180,36,96,3,0,0 // vmovups 0x360(%rsp),%ymm6
@@ -23391,7 +23665,7 @@ _sk_start_pipeline_avx:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 6d8d <_sk_start_pipeline_avx+0xa1>
+ .byte 115,117 // jae 6f25 <_sk_start_pipeline_avx+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -23401,7 +23675,7 @@ _sk_start_pipeline_avx:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
- .byte 119,45 // ja 6d69 <_sk_start_pipeline_avx+0x7d>
+ .byte 119,45 // ja 6f01 <_sk_start_pipeline_avx+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -23415,10 +23689,10 @@ _sk_start_pipeline_avx:
.byte 73,131,199,16 // add $0x10,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 6d40 <_sk_start_pipeline_avx+0x54>
+ .byte 118,215 // jbe 6ed8 <_sk_start_pipeline_avx+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 6d84 <_sk_start_pipeline_avx+0x98>
+ .byte 116,19 // je 6f1c <_sk_start_pipeline_avx+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -23427,7 +23701,7 @@ _sk_start_pipeline_avx:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 6d32 <_sk_start_pipeline_avx+0x46>
+ .byte 117,165 // jne 6eca <_sk_start_pipeline_avx+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -23452,7 +23726,7 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,68,64,2,0 // vbroadcastss 0x24044(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,160,68,2,0 // vbroadcastss 0x244a0(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -23461,7 +23735,7 @@ _sk_seed_shader_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,30,64,2,0 // vbroadcastss 0x2401e(%rip),%ymm2 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,21,122,68,2,0 // vbroadcastss 0x2447a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -23485,7 +23759,7 @@ _sk_dither_avx:
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,199,63,2,0 // vbroadcastss 0x23fc7(%rip),%ymm11 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,24,29,35,68,2,0 // vbroadcastss 0x24423(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -23496,8 +23770,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,136,63,2,0 // vbroadcastss 0x23f88(%rip),%ymm12 # 2ae0c <_sk_overlay_sse2_8bit+0x44b>
- .byte 196,98,125,24,45,131,63,2,0 // vbroadcastss 0x23f83(%rip),%ymm13 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,24,37,228,67,2,0 // vbroadcastss 0x243e4(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b>
+ .byte 196,98,125,24,45,223,67,2,0 // vbroadcastss 0x243df(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -23524,9 +23798,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,238,62,2,0 // vbroadcastss 0x23eee(%rip),%ymm9 # 2ae14 <_sk_overlay_sse2_8bit+0x453>
+ .byte 196,98,125,24,13,74,67,2,0 // vbroadcastss 0x2434a(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,228,62,2,0 // vbroadcastss 0x23ee4(%rip),%ymm9 # 2ae18 <_sk_overlay_sse2_8bit+0x457>
+ .byte 196,98,125,24,13,64,67,2,0 // vbroadcastss 0x24340(%rip),%ymm9 # 2b40c <_sk_overlay_sse2_8bit+0x457>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -23560,7 +23834,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,108,62,2,0 // vbroadcastss 0x23e6c(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,200,66,2,0 // vbroadcastss 0x242c8(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -23571,7 +23845,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,83,62,2,0 // vbroadcastss 0x23e53(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,175,66,2,0 // vbroadcastss 0x242af(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -23617,7 +23891,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,242,61,2,0 // vbroadcastss 0x23df2(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,78,66,2,0 // vbroadcastss 0x2424e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -23638,7 +23912,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,176,61,2,0 // vbroadcastss 0x23db0(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,12,66,2,0 // vbroadcastss 0x2420c(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -23680,7 +23954,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,75,61,2,0 // vbroadcastss 0x23d4b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,167,65,2,0 // vbroadcastss 0x241a7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -23693,7 +23967,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,42,61,2,0 // vbroadcastss 0x23d2a(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,134,65,2,0 // vbroadcastss 0x24186(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -23706,7 +23980,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,9,61,2,0 // vbroadcastss 0x23d09(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,101,65,2,0 // vbroadcastss 0x24165(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -23723,7 +23997,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,216,60,2,0 // vbroadcastss 0x23cd8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,52,65,2,0 // vbroadcastss 0x24134(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -23751,7 +24025,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,147,60,2,0 // vbroadcastss 0x23c93(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,239,64,2,0 // vbroadcastss 0x240ef(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -23782,9 +24056,14 @@ HIDDEN _sk_plus__avx
FUNCTION(_sk_plus__avx)
_sk_plus__avx:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
+ .byte 196,98,125,24,5,126,64,2,0 // vbroadcastss 0x2407e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
+ .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2
+ .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23811,7 +24090,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,222,59,2,0 // vbroadcastss 0x23bde(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,29,64,2,0 // vbroadcastss 0x2401d(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -23848,7 +24127,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,90,59,2,0 // vbroadcastss 0x23b5a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,153,63,2,0 // vbroadcastss 0x23f99(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23874,7 +24153,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,2,59,2,0 // vbroadcastss 0x23b02(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,65,63,2,0 // vbroadcastss 0x23f41(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23903,7 +24182,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,158,58,2,0 // vbroadcastss 0x23a9e(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,221,62,2,0 // vbroadcastss 0x23edd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23926,7 +24205,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,85,58,2,0 // vbroadcastss 0x23a55(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,148,62,2,0 // vbroadcastss 0x23e94(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23937,7 +24216,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,60,58,2,0 // vbroadcastss 0x23a3c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,123,62,2,0 // vbroadcastss 0x23e7b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -23999,7 +24278,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,64,57,2,0 // vbroadcastss 0x23940(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,127,61,2,0 // vbroadcastss 0x23d7f(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -24056,7 +24335,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,75,56,2,0 // vbroadcastss 0x2384b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,138,60,2,0 // vbroadcastss 0x23c8a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24111,7 +24390,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,112,55,2,0 // vbroadcastss 0x23770(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,175,59,2,0 // vbroadcastss 0x23baf(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24177,10 +24456,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,119,54,2,0 // vbroadcastss 0x23677(%rip),%ymm11 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,29,182,58,2,0 // vbroadcastss 0x23ab6(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,104,54,2,0 // vbroadcastss 0x23668(%rip),%ymm13 # 2ae20 <_sk_overlay_sse2_8bit+0x45f>
+ .byte 196,98,125,24,45,167,58,2,0 // vbroadcastss 0x23aa7(%rip),%ymm13 # 2b414 <_sk_overlay_sse2_8bit+0x45f>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -24191,7 +24470,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,18,54,2,0 // vbroadcastss 0x23612(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,81,58,2,0 // vbroadcastss 0x23a51(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -24318,12 +24597,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,245,51,2,0 // vbroadcastss 0x233f5(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,52,56,2,0 // vbroadcastss 0x23834(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,235,51,2,0 // vbroadcastss 0x233eb(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,61,42,56,2,0 // vbroadcastss 0x2382a(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,220,51,2,0 // vbroadcastss 0x233dc(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,27,56,2,0 // vbroadcastss 0x2381b(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -24384,7 +24663,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,137,50,2,0 // vbroadcastss 0x23289(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,200,54,2,0 // vbroadcastss 0x236c8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24441,12 +24720,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,179,49,2,0 // vbroadcastss 0x231b3(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,242,53,2,0 // vbroadcastss 0x235f2(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,169,49,2,0 // vbroadcastss 0x231a9(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,61,232,53,2,0 // vbroadcastss 0x235e8(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,154,49,2,0 // vbroadcastss 0x2319a(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,217,53,2,0 // vbroadcastss 0x235d9(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -24507,7 +24786,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,71,48,2,0 // vbroadcastss 0x23047(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,134,52,2,0 // vbroadcastss 0x23486(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24536,12 +24815,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,249,47,2,0 // vbroadcastss 0x22ff9(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,45,56,52,2,0 // vbroadcastss 0x23438(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,239,47,2,0 // vbroadcastss 0x22fef(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,46,52,2,0 // vbroadcastss 0x2342e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,224,47,2,0 // vbroadcastss 0x22fe0(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,31,52,2,0 // vbroadcastss 0x2341f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -24604,7 +24883,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,123,46,2,0 // vbroadcastss 0x22e7b(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,186,50,2,0 // vbroadcastss 0x232ba(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -24634,12 +24913,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,41,46,2,0 // vbroadcastss 0x22e29(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,45,104,50,2,0 // vbroadcastss 0x23268(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,31,46,2,0 // vbroadcastss 0x22e1f(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,94,50,2,0 // vbroadcastss 0x2325e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,16,46,2,0 // vbroadcastss 0x22e10(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,79,50,2,0 // vbroadcastss 0x2324f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -24702,7 +24981,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,171,44,2,0 // vbroadcastss 0x22cab(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,234,48,2,0 // vbroadcastss 0x230ea(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -24735,9 +25014,9 @@ _sk_srcover_rgba_8888_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,43,1,0,0 // jne 82f0 <_sk_srcover_rgba_8888_avx+0x14c>
+ .byte 15,133,43,1,0,0 // jne 84a5 <_sk_srcover_rgba_8888_avx+0x14c>
.byte 196,65,125,16,4,153 // vmovupd (%r9,%rbx,4),%ymm8
- .byte 197,125,40,13,205,48,2,0 // vmovapd 0x230cd(%rip),%ymm9 # 2b2a0 <_sk_overlay_sse2_8bit+0x8df>
+ .byte 197,125,40,13,24,53,2,0 // vmovapd 0x23518(%rip),%ymm9 # 2b8a0 <_sk_overlay_sse2_8bit+0x8eb>
.byte 196,193,61,84,225 // vandpd %ymm9,%ymm8,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,81,114,208,8 // vpsrld $0x8,%xmm8,%xmm5
@@ -24755,9 +25034,9 @@ _sk_srcover_rgba_8888_avx:
.byte 197,193,114,215,24 // vpsrld $0x18,%xmm7,%xmm7
.byte 196,227,61,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,208,43,2,0 // vbroadcastss 0x22bd0(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,15,48,2,0 // vbroadcastss 0x2300f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,239,43,2,0 // vbroadcastss 0x22bef(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,13,46,48,2,0 // vbroadcastss 0x2302e(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -24790,7 +25069,7 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,53,86,202 // vorpd %ymm10,%ymm9,%ymm9
.byte 196,65,61,86,193 // vorpd %ymm9,%ymm8,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 8328 <_sk_srcover_rgba_8888_avx+0x184>
+ .byte 117,67 // jne 84dd <_sk_srcover_rgba_8888_avx+0x184>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24800,33 +25079,33 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,194,254,255,255 // ja 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 15,135,194,254,255,255 // ja 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,4,1,0,0 // lea 0x104(%rip),%r11 # 8418 <_sk_srcover_rgba_8888_avx+0x274>
+ .byte 76,141,29,3,1,0,0 // lea 0x103(%rip),%r11 # 85cc <_sk_srcover_rgba_8888_avx+0x273>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,4,153 // vmovss (%r9,%rbx,4),%xmm8
- .byte 233,163,254,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,163,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,179 // ja 82eb <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 119,179 // ja 84a0 <_sk_srcover_rgba_8888_avx+0x147>
.byte 65,15,182,194 // movzbl %r10b,%eax
- .byte 76,141,21,241,0,0,0 // lea 0xf1(%rip),%r10 # 8434 <_sk_srcover_rgba_8888_avx+0x290>
+ .byte 76,141,21,240,0,0,0 // lea 0xf0(%rip),%r10 # 85e8 <_sk_srcover_rgba_8888_avx+0x28f>
.byte 73,99,4,130 // movslq (%r10,%rax,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,151 // jmp 82eb <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 235,151 // jmp 84a0 <_sk_srcover_rgba_8888_avx+0x147>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,196,4 // vblendps $0x4,%ymm4,%ymm5,%ymm8
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,61,13,196,1 // vblendpd $0x1,%ymm4,%ymm8,%ymm8
- .byte 233,80,254,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,80,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -24840,10 +25119,10 @@ _sk_srcover_rgba_8888_avx:
.byte 196,99,61,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,192,12 // vblendpd $0xc,%ymm8,%ymm4,%ymm8
- .byte 233,251,253,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,251,253,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 233,8,255,255,255 // jmpq 82eb <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 233,8,255,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -24851,35 +25130,33 @@ _sk_srcover_rgba_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 233,212,254,255,255 // jmpq 82eb <_sk_srcover_rgba_8888_avx+0x147>
- .byte 144 // nop
- .byte 5,255,255,255,82 // add $0x52ffffff,%eax
+ .byte 233,212,254,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 6 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,83,255 // callq *-0x1(%rbx)
.byte 255 // (bad)
- .byte 60,255 // cmp $0xff,%al
.byte 255 // (bad)
- .byte 255,167,255,255,255,147 // jmpq *-0x6c000001(%rdi)
+ .byte 61,255,255,255,168 // cmp $0xa8ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,148,255,255,255,128,255 // callq *-0x7f0001(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,255 // jg 842d <_sk_srcover_rgba_8888_avx+0x289>
+ .byte 255,100,255,255 // jmpq *-0x1(%rdi,%rdi,8)
+ .byte 255,25 // lcall *(%rcx)
.byte 255 // (bad)
- .byte 255,99,255 // jmpq *-0x1(%rbx)
.byte 255 // (bad)
- .byte 255,24 // lcall *(%rax)
+ .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,164,255,255,255,156,255 // jmpq *-0x630001(%rdi,%rdi,8)
.byte 255 // (bad)
+ .byte 217,255 // fcos
.byte 255 // (bad)
- .byte 216,255 // fdivr %st(7),%st
- .byte 255 // (bad)
- .byte 255,203 // dec %ebx
+ .byte 255,204 // dec %esp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 189,255,255,255,175 // mov $0xafffffff,%ebp
+ .byte 190,255,255,255,176 // mov $0xb0ffffff,%esi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -24900,7 +25177,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,142,41,2,0 // vbroadcastss 0x2298e(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,206,45,2,0 // vbroadcastss 0x22dce(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -24912,7 +25189,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,109,41,2,0 // vbroadcastss 0x2296d(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,173,45,2,0 // vbroadcastss 0x22dad(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -24924,7 +25201,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,79,41,2,0 // vbroadcastss 0x2294f(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,143,45,2,0 // vbroadcastss 0x22d8f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -24957,7 +25234,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,10,41,2,0 // vbroadcastss 0x2290a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,74,45,2,0 // vbroadcastss 0x22d4a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -25013,7 +25290,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,154,40,2,0 // vbroadcastss 0x2289a(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,218,44,2,0 // vbroadcastss 0x22cda(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -25026,17 +25303,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,167,40,2,0 // vbroadcastss 0x228a7(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,231,44,2,0 // vbroadcastss 0x22ce7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,133,40,2,0 // vbroadcastss 0x22885(%rip),%ymm11 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,197,44,2,0 // vbroadcastss 0x22cc5(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,139,40,2,0 // vbroadcastss 0x2288b(%rip),%ymm13 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,45,203,44,2,0 // vbroadcastss 0x22ccb(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,124,40,2,0 // vbroadcastss 0x2287c(%rip),%ymm12 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,37,188,44,2,0 // vbroadcastss 0x22cbc(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,114,40,2,0 // vbroadcastss 0x22872(%rip),%ymm14 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,53,178,44,2,0 // vbroadcastss 0x22cb2(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -25062,17 +25339,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,251,39,2,0 // vbroadcastss 0x227fb(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,59,44,2,0 // vbroadcastss 0x22c3b(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,217,39,2,0 // vbroadcastss 0x227d9(%rip),%ymm11 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,25,44,2,0 // vbroadcastss 0x22c19(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,223,39,2,0 // vbroadcastss 0x227df(%rip),%ymm13 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,45,31,44,2,0 // vbroadcastss 0x22c1f(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,208,39,2,0 // vbroadcastss 0x227d0(%rip),%ymm12 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,37,16,44,2,0 // vbroadcastss 0x22c10(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,198,39,2,0 // vbroadcastss 0x227c6(%rip),%ymm14 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,53,6,44,2,0 // vbroadcastss 0x22c06(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -25099,20 +25376,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,91,39,2,0 // vbroadcastss 0x2275b(%rip),%ymm8 # 2ae44 <_sk_overlay_sse2_8bit+0x483>
+ .byte 196,98,125,24,5,155,43,2,0 // vbroadcastss 0x22b9b(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,85,39,2,0 // vbroadcastss 0x22755(%rip),%ymm11 # 2ae4c <_sk_overlay_sse2_8bit+0x48b>
+ .byte 196,98,125,24,29,149,43,2,0 // vbroadcastss 0x22b95(%rip),%ymm11 # 2b440 <_sk_overlay_sse2_8bit+0x48b>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,67,39,2,0 // vbroadcastss 0x22743(%rip),%ymm13 # 2ae48 <_sk_overlay_sse2_8bit+0x487>
+ .byte 196,98,125,24,45,131,43,2,0 // vbroadcastss 0x22b83(%rip),%ymm13 # 2b43c <_sk_overlay_sse2_8bit+0x487>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,56,39,2,0 // vbroadcastss 0x22738(%rip),%ymm14 # 2ae50 <_sk_overlay_sse2_8bit+0x48f>
+ .byte 196,98,125,24,53,120,43,2,0 // vbroadcastss 0x22b78(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,46,39,2,0 // vbroadcastss 0x2272e(%rip),%ymm15 # 2ae54 <_sk_overlay_sse2_8bit+0x493>
+ .byte 196,98,125,24,61,110,43,2,0 // vbroadcastss 0x22b6e(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,26,39,2,0 // vbroadcastss 0x2271a(%rip),%ymm12 # 2ae58 <_sk_overlay_sse2_8bit+0x497>
+ .byte 196,98,125,24,37,90,43,2,0 // vbroadcastss 0x22b5a(%rip),%ymm12 # 2b44c <_sk_overlay_sse2_8bit+0x497>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -25144,12 +25421,12 @@ HIDDEN _sk_rgb_to_hsl_avx
.globl _sk_rgb_to_hsl_avx
FUNCTION(_sk_rgb_to_hsl_avx)
_sk_rgb_to_hsl_avx:
- .byte 197,124,95,193 // vmaxps %ymm1,%ymm0,%ymm8
- .byte 197,60,95,194 // vmaxps %ymm2,%ymm8,%ymm8
- .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
- .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
+ .byte 197,116,95,194 // vmaxps %ymm2,%ymm1,%ymm8
+ .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8
+ .byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
+ .byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,40,38,2,0 // vbroadcastss 0x22628(%rip),%ymm11 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,29,102,42,2,0 // vbroadcastss 0x22a66(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -25159,19 +25436,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,85,38,2,0 // vbroadcastss 0x22655(%rip),%ymm11 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,29,147,42,2,0 // vbroadcastss 0x22a93(%rip),%ymm11 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,67,38,2,0 // vbroadcastss 0x22643(%rip),%ymm11 # 2ae60 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,29,129,42,2,0 // vbroadcastss 0x22a81(%rip),%ymm11 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,43,38,2,0 // vbroadcastss 0x2262b(%rip),%ymm2 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,226,125,24,21,105,42,2,0 // vbroadcastss 0x22a69(%rip),%ymm2 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,166,37,2,0 // vbroadcastss 0x225a6(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,228,41,2,0 // vbroadcastss 0x229e4(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -25181,7 +25458,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,213,37,2,0 // vbroadcastss 0x225d5(%rip),%ymm8 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,5,19,42,2,0 // vbroadcastss 0x22a13(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -25198,7 +25475,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,50,37,2,0 // vbroadcastss 0x22532(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,112,41,2,0 // vbroadcastss 0x22970(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -25206,23 +25483,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,116,37,2,0 // vbroadcastss 0x22574(%rip),%ymm11 # 2ae6c <_sk_overlay_sse2_8bit+0x4ab>
+ .byte 196,98,125,24,29,178,41,2,0 // vbroadcastss 0x229b2(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,70,37,2,0 // vbroadcastss 0x22546(%rip),%ymm12 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,37,132,41,2,0 // vbroadcastss 0x22984(%rip),%ymm12 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,64,37,2,0 // vbroadcastss 0x22540(%rip),%ymm13 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,45,126,41,2,0 // vbroadcastss 0x2297e(%rip),%ymm13 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,53,37,2,0 // vbroadcastss 0x22535(%rip),%ymm1 # 2ae70 <_sk_overlay_sse2_8bit+0x4af>
+ .byte 196,226,125,24,13,115,41,2,0 // vbroadcastss 0x22973(%rip),%ymm1 # 2b464 <_sk_overlay_sse2_8bit+0x4af>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,12,37,2,0 // vbroadcastss 0x2250c(%rip),%ymm14 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,53,74,41,2,0 // vbroadcastss 0x2294a(%rip),%ymm14 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -25241,7 +25518,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,182,36,2,0 // vbroadcastss 0x224b6(%rip),%ymm0 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,226,125,24,5,244,40,2,0 // vbroadcastss 0x228f4(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -25296,15 +25573,15 @@ _sk_scale_u8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,75 // jne 8ac5 <_sk_scale_u8_avx+0x64>
+ .byte 117,75 // jne 8c7b <_sk_scale_u8_avx+0x64>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,8,45,2,0 // vpand 0x22d08(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,82,49,2,0 // vpand 0x23152(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,205,35,2,0 // vbroadcastss 0x223cd(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,11,40,2,0 // vbroadcastss 0x2280b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -25318,15 +25595,15 @@ _sk_scale_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,166 // ja 8a80 <_sk_scale_u8_avx+0x1f>
+ .byte 119,166 // ja 8c36 <_sk_scale_u8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,123,0,0,0 // lea 0x7b(%rip),%r11 # 8b60 <_sk_scale_u8_avx+0xff>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 8d14 <_sk_scale_u8_avx+0xfd>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,135 // jmp 8a80 <_sk_scale_u8_avx+0x1f>
+ .byte 235,135 // jmp 8c36 <_sk_scale_u8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -25334,7 +25611,7 @@ _sk_scale_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,94,255,255,255 // jmpq 8a80 <_sk_scale_u8_avx+0x1f>
+ .byte 233,94,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -25345,21 +25622,116 @@ _sk_scale_u8_avx:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,34,255,255,255 // jmpq 8a80 <_sk_scale_u8_avx+0x1f>
- .byte 102,144 // xchg %ax,%ax
- .byte 142,255 // mov %edi,%?
+ .byte 233,34,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f>
+ .byte 144 // nop
.byte 255 // (bad)
- .byte 255,169,255,255,255,153 // ljmp *-0x66000001(%rcx)
.byte 255 // (bad)
+ .byte 255,171,255,255,255,155 // ljmp *-0x64000001(%rbx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde008b70 <_sk_overlay_sse2_8bit+0xffffffffddfde1af>
.byte 255 // (bad)
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,194 // inc %edx
+ .byte 223,255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,212 // callq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,196 // inc %esp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
+HIDDEN _sk_scale_565_avx
+.globl _sk_scale_565_avx
+FUNCTION(_sk_scale_565_avx)
+_sk_scale_565_avx:
+ .byte 83 // push %rbx
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 72,99,218 // movslq %edx,%rbx
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,178,0,0,0 // jne 8e02 <_sk_scale_565_avx+0xd2>
+ .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
+ .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
+ .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
+ .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
+ .byte 196,98,125,24,13,252,38,2,0 // vbroadcastss 0x226fc(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
+ .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
+ .byte 196,98,125,24,21,237,38,2,0 // vbroadcastss 0x226ed(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
+ .byte 196,98,125,24,21,227,38,2,0 // vbroadcastss 0x226e3(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
+ .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
+ .byte 196,98,125,24,29,212,38,2,0 // vbroadcastss 0x226d4(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
+ .byte 196,98,125,24,29,202,38,2,0 // vbroadcastss 0x226ca(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
+ .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
+ .byte 196,98,125,24,29,187,38,2,0 // vbroadcastss 0x226bb(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
+ .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2
+ .byte 197,164,89,219 // vmulps %ymm3,%ymm11,%ymm3
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 91 // pop %rbx
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,7 // and $0x7,%r10b
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 65,254,202 // dec %r10b
+ .byte 65,128,250,6 // cmp $0x6,%r10b
+ .byte 15,135,59,255,255,255 // ja 8d56 <_sk_scale_565_avx+0x26>
+ .byte 69,15,182,210 // movzbl %r10b,%r10d
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 8e8c <_sk_scale_565_avx+0x15c>
+ .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
+ .byte 76,1,216 // add %r11,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 233,25,255,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
+ .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ .byte 233,251,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
+ .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ .byte 233,205,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 236 // in (%dx),%al
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,228 // jmpq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 220,255 // fdivr %st,%st(7)
+ .byte 255 // (bad)
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -25397,15 +25769,15 @@ _sk_lerp_u8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,111 // jne 8c43 <_sk_lerp_u8_avx+0x88>
+ .byte 117,111 // jne 8f6f <_sk_lerp_u8_avx+0x88>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,174,43,2,0 // vpand 0x22bae(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,130,46,2,0 // vpand 0x22e82(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,115,34,2,0 // vbroadcastss 0x22273(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,59,37,2,0 // vbroadcastss 0x2253b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -25427,15 +25799,15 @@ _sk_lerp_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,130 // ja 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 119,130 // ja 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 8ce0 <_sk_lerp_u8_avx+0x125>
+ .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 900c <_sk_lerp_u8_avx+0x125>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,96,255,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 233,96,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -25443,7 +25815,7 @@ _sk_lerp_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,55,255,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 233,55,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -25454,7 +25826,7 @@ _sk_lerp_u8_avx:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,251,254,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 233,251,254,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 144 // nop
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -25462,7 +25834,7 @@ _sk_lerp_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf008cf0 <_sk_overlay_sse2_8bit+0xffffffffdefde32f>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00901c <_sk_overlay_sse2_8bit+0xffffffffdefde067>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -25486,27 +25858,33 @@ _sk_lerp_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,209,0,0,0 // jne 8ded <_sk_lerp_565_avx+0xf1>
+ .byte 15,133,214,0,0,0 // jne 911e <_sk_lerp_565_avx+0xf6>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,60,33,2,0 // vbroadcastss 0x2213c(%rip),%ymm9 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,24,13,4,36,2,0 // vbroadcastss 0x22404(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,45,33,2,0 // vbroadcastss 0x2212d(%rip),%ymm10 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,245,35,2,0 // vbroadcastss 0x223f5(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,35,33,2,0 // vbroadcastss 0x22123(%rip),%ymm10 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,24,21,235,35,2,0 // vbroadcastss 0x223eb(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,20,33,2,0 // vbroadcastss 0x22114(%rip),%ymm11 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,220,35,2,0 // vbroadcastss 0x223dc(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,10,33,2,0 // vbroadcastss 0x2210a(%rip),%ymm11 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,24,29,210,35,2,0 // vbroadcastss 0x223d2(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,251,32,2,0 // vbroadcastss 0x220fb(%rip),%ymm11 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,195,35,2,0 // vbroadcastss 0x223c3(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -25517,14 +25895,8 @@ _sk_lerp_565_avx:
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2
.byte 197,228,92,223 // vsubps %ymm7,%ymm3,%ymm3
- .byte 196,65,100,89,201 // vmulps %ymm9,%ymm3,%ymm9
- .byte 197,52,88,207 // vaddps %ymm7,%ymm9,%ymm9
- .byte 196,65,100,89,210 // vmulps %ymm10,%ymm3,%ymm10
- .byte 197,44,88,215 // vaddps %ymm7,%ymm10,%ymm10
- .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
+ .byte 196,193,100,89,219 // vmulps %ymm11,%ymm3,%ymm3
.byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
- .byte 197,172,95,219 // vmaxps %ymm3,%ymm10,%ymm3
- .byte 197,180,95,219 // vmaxps %ymm3,%ymm9,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -25533,42 +25905,42 @@ _sk_lerp_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,28,255,255,255 // ja 8d22 <_sk_lerp_565_avx+0x26>
+ .byte 15,135,23,255,255,255 // ja 904e <_sk_lerp_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 8e74 <_sk_lerp_565_avx+0x178>
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 91a8 <_sk_lerp_565_avx+0x180>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,250,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26>
+ .byte 233,245,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,220,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26>
+ .byte 233,215,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,174,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26>
- .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
+ .byte 233,169,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,193 // inc %ecx
.byte 255 // (bad)
+ .byte 236 // in (%dx),%al
.byte 255 // (bad)
- .byte 255,180,255,255,255,239,255 // pushq -0x100001(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 255,231 // jmpq *%rdi
+ .byte 255,228 // jmpq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 223,255 // (bad)
+ .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -25581,9 +25953,9 @@ _sk_load_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,4,2,0,0 // jne 90a8 <_sk_load_tables_avx+0x218>
+ .byte 15,133,4,2,0,0 // jne 93dc <_sk_load_tables_avx+0x218>
.byte 196,65,125,16,20,145 // vmovupd (%r9,%rdx,4),%ymm10
- .byte 197,125,40,13,14,36,2,0 // vmovapd 0x2240e(%rip),%ymm9 # 2b2c0 <_sk_overlay_sse2_8bit+0x8ff>
+ .byte 197,125,40,13,218,38,2,0 // vmovapd 0x226da(%rip),%ymm9 # 2b8c0 <_sk_overlay_sse2_8bit+0x90b>
.byte 196,193,45,84,201 // vandpd %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,193 // vmovq %xmm0,%r9
@@ -25675,7 +26047,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,213,24 // vpsrld $0x18,%xmm13,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,222,29,2,0 // vbroadcastss 0x21dde(%rip),%ymm7 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,61,158,32,2,0 // vbroadcastss 0x2209e(%rip),%ymm7 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -25685,21 +26057,21 @@ _sk_load_tables_avx:
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,233,253,255,255 // ja 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 15,135,233,253,255,255 // ja 91de <_sk_load_tables_avx+0x1a>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 9160 <_sk_load_tables_avx+0x2d0>
+ .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 9494 <_sk_load_tables_avx+0x2d0>
.byte 79,99,20,147 // movslq (%r11,%r10,4),%r10
.byte 77,1,218 // add %r11,%r10
.byte 65,255,226 // jmpq *%r10
.byte 196,65,122,16,20,145 // vmovss (%r9,%rdx,4),%xmm10
- .byte 233,201,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 233,201,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,145,8 // vmovd 0x8(%r9,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,208,4 // vblendps $0x4,%ymm0,%ymm1,%ymm10
.byte 196,193,123,16,4,145 // vmovsd (%r9,%rdx,4),%xmm0
.byte 196,99,45,13,208,1 // vblendpd $0x1,%ymm0,%ymm10,%ymm10
- .byte 233,162,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 233,162,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,145,24 // vmovd 0x18(%r9,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -25713,9 +26085,9 @@ _sk_load_tables_avx:
.byte 196,99,45,24,208,1 // vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
.byte 196,193,121,16,4,145 // vmovupd (%r9,%rdx,4),%xmm0
.byte 196,67,125,13,210,12 // vblendpd $0xc,%ymm10,%ymm0,%ymm10
- .byte 233,77,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 233,77,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe 9161 <_sk_load_tables_avx+0x2d1>
+ .byte 118,255 // jbe 9495 <_sk_load_tables_avx+0x2d1>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -25744,7 +26116,7 @@ _sk_load_tables_u16_be_avx:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
- .byte 15,133,84,2,0,0 // jne 93ec <_sk_load_tables_u16_be_avx+0x270>
+ .byte 15,133,84,2,0,0 // jne 9720 <_sk_load_tables_u16_be_avx+0x270>
.byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8
.byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2
.byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -25759,7 +26131,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,171,37,2,0 // vmovdqa 0x225ab(%rip),%xmm10 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,21,119,40,2,0 // vmovdqa 0x22877(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -25857,7 +26229,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,182,26,2,0 // vbroadcastss 0x21ab6(%rip),%ymm7 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,226,125,24,61,118,29,2,0 // vbroadcastss 0x21d76(%rip),%ymm7 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -25865,29 +26237,29 @@ _sk_load_tables_u16_be_avx:
.byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 9452 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 116,85 // je 9786 <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 9452 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 114,72 // jb 9786 <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 945f <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 116,72 // je 9793 <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 945f <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 114,59 // jb 9793 <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,126,253,255,255 // je 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,132,126,253,255,255 // je 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,109,253,255,255 // jb 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,130,109,253,255,255 // jb 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9
- .byte 233,97,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,97,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,84,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,84,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,75,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,75,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
HIDDEN _sk_load_tables_rgb_u16_be_avx
.globl _sk_load_tables_rgb_u16_be_avx
@@ -25899,7 +26271,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
.byte 197,252,17,116,36,168 // vmovups %ymm6,-0x58(%rsp)
- .byte 15,133,71,2,0,0 // jne 96cd <_sk_load_tables_rgb_u16_be_avx+0x265>
+ .byte 15,133,71,2,0,0 // jne 9a01 <_sk_load_tables_rgb_u16_be_avx+0x265>
.byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
.byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
.byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -25920,7 +26292,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,160,34,2,0 // vmovdqa 0x222a0(%rip),%xmm9 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,13,108,37,2,0 // vmovdqa 0x2256c(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -26010,50 +26382,50 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,69,23,2,0 // vbroadcastss 0x21745(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,5,26,2,0 // vbroadcastss 0x21a05(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 96e6 <_sk_load_tables_rgb_u16_be_avx+0x27e>
- .byte 233,212,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,5 // jne 9a1a <_sk_load_tables_rgb_u16_be_avx+0x27e>
+ .byte 233,212,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
.byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 9715 <_sk_load_tables_rgb_u16_be_avx+0x2ad>
+ .byte 114,26 // jb 9a49 <_sk_load_tables_rgb_u16_be_avx+0x2ad>
.byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
.byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 971a <_sk_load_tables_rgb_u16_be_avx+0x2b2>
- .byte 233,165,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,160,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,10 // jne 9a4e <_sk_load_tables_rgb_u16_be_avx+0x2b2>
+ .byte 233,165,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,160,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
.byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 9749 <_sk_load_tables_rgb_u16_be_avx+0x2e1>
+ .byte 114,26 // jb 9a7d <_sk_load_tables_rgb_u16_be_avx+0x2e1>
.byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
.byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 974e <_sk_load_tables_rgb_u16_be_avx+0x2e6>
- .byte 233,113,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,108,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,10 // jne 9a82 <_sk_load_tables_rgb_u16_be_avx+0x2e6>
+ .byte 233,113,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,108,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
.byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 9777 <_sk_load_tables_rgb_u16_be_avx+0x30f>
+ .byte 114,20 // jb 9aab <_sk_load_tables_rgb_u16_be_avx+0x30f>
.byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
.byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,67,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,62,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,67,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,62,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
HIDDEN _sk_byte_tables_avx
.globl _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,169,22,2,0 // vbroadcastss 0x216a9(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,105,25,2,0 // vbroadcastss 0x21969(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -26172,7 +26544,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,151,20,2,0 // vbroadcastss 0x21497(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,87,23,2,0 // vbroadcastss 0x21757(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -26288,7 +26660,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,116,18,2,0 // vbroadcastss 0x21274(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,52,21,2,0 // vbroadcastss 0x21534(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -26493,36 +26865,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,61,15,2,0 // vbroadcastss 0x20f3d(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,253,17,2,0 // vbroadcastss 0x211fd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,51,15,2,0 // vbroadcastss 0x20f33(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,243,17,2,0 // vbroadcastss 0x211f3(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,137,14,2,0 // vbroadcastss 0x20e89(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,73,17,2,0 // vbroadcastss 0x21149(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,27,15,2,0 // vbroadcastss 0x20f1b(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,219,17,2,0 // vbroadcastss 0x211db(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,17,15,2,0 // vbroadcastss 0x20f11(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,209,17,2,0 // vbroadcastss 0x211d1(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,2,15,2,0 // vbroadcastss 0x20f02(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,194,17,2,0 // vbroadcastss 0x211c2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,248,14,2,0 // vbroadcastss 0x20ef8(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,184,17,2,0 // vbroadcastss 0x211b8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,220,14,2,0 // vbroadcastss 0x20edc(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,156,17,2,0 // vbroadcastss 0x2119c(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,210,14,2,0 // vbroadcastss 0x20ed2(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,146,17,2,0 // vbroadcastss 0x21192(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,195,14,2,0 // vbroadcastss 0x20ec3(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,131,17,2,0 // vbroadcastss 0x21183(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,185,14,2,0 // vbroadcastss 0x20eb9(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,121,17,2,0 // vbroadcastss 0x21179(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,170,14,2,0 // vbroadcastss 0x20eaa(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,106,17,2,0 // vbroadcastss 0x2116a(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26530,7 +26902,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,193,13,2,0 // vbroadcastss 0x20dc1(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,129,16,2,0 // vbroadcastss 0x21081(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26552,36 +26924,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,2,14,2,0 // vbroadcastss 0x20e02(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,194,16,2,0 // vbroadcastss 0x210c2(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,248,13,2,0 // vbroadcastss 0x20df8(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,184,16,2,0 // vbroadcastss 0x210b8(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,78,13,2,0 // vbroadcastss 0x20d4e(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,14,16,2,0 // vbroadcastss 0x2100e(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,224,13,2,0 // vbroadcastss 0x20de0(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,160,16,2,0 // vbroadcastss 0x210a0(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,214,13,2,0 // vbroadcastss 0x20dd6(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,150,16,2,0 // vbroadcastss 0x21096(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,199,13,2,0 // vbroadcastss 0x20dc7(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,135,16,2,0 // vbroadcastss 0x21087(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,189,13,2,0 // vbroadcastss 0x20dbd(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,125,16,2,0 // vbroadcastss 0x2107d(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,161,13,2,0 // vbroadcastss 0x20da1(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,97,16,2,0 // vbroadcastss 0x21061(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,151,13,2,0 // vbroadcastss 0x20d97(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,87,16,2,0 // vbroadcastss 0x21057(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,136,13,2,0 // vbroadcastss 0x20d88(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,72,16,2,0 // vbroadcastss 0x21048(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,126,13,2,0 // vbroadcastss 0x20d7e(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,62,16,2,0 // vbroadcastss 0x2103e(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,111,13,2,0 // vbroadcastss 0x20d6f(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,47,16,2,0 // vbroadcastss 0x2102f(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26589,7 +26961,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,134,12,2,0 // vbroadcastss 0x20c86(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,70,15,2,0 // vbroadcastss 0x20f46(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26611,36 +26983,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,199,12,2,0 // vbroadcastss 0x20cc7(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,135,15,2,0 // vbroadcastss 0x20f87(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,189,12,2,0 // vbroadcastss 0x20cbd(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,125,15,2,0 // vbroadcastss 0x20f7d(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,19,12,2,0 // vbroadcastss 0x20c13(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,211,14,2,0 // vbroadcastss 0x20ed3(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,165,12,2,0 // vbroadcastss 0x20ca5(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,101,15,2,0 // vbroadcastss 0x20f65(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,155,12,2,0 // vbroadcastss 0x20c9b(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,91,15,2,0 // vbroadcastss 0x20f5b(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,140,12,2,0 // vbroadcastss 0x20c8c(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,76,15,2,0 // vbroadcastss 0x20f4c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,130,12,2,0 // vbroadcastss 0x20c82(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,66,15,2,0 // vbroadcastss 0x20f42(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,102,12,2,0 // vbroadcastss 0x20c66(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,38,15,2,0 // vbroadcastss 0x20f26(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,92,12,2,0 // vbroadcastss 0x20c5c(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,28,15,2,0 // vbroadcastss 0x20f1c(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,77,12,2,0 // vbroadcastss 0x20c4d(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,13,15,2,0 // vbroadcastss 0x20f0d(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,67,12,2,0 // vbroadcastss 0x20c43(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,3,15,2,0 // vbroadcastss 0x20f03(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,52,12,2,0 // vbroadcastss 0x20c34(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,244,14,2,0 // vbroadcastss 0x20ef4(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26648,7 +27020,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,75,11,2,0 // vbroadcastss 0x20b4b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,11,14,2,0 // vbroadcastss 0x20e0b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26670,36 +27042,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,140,11,2,0 // vbroadcastss 0x20b8c(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,76,14,2,0 // vbroadcastss 0x20e4c(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,130,11,2,0 // vbroadcastss 0x20b82(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,66,14,2,0 // vbroadcastss 0x20e42(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,216,10,2,0 // vbroadcastss 0x20ad8(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,152,13,2,0 // vbroadcastss 0x20d98(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,106,11,2,0 // vbroadcastss 0x20b6a(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,42,14,2,0 // vbroadcastss 0x20e2a(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,96,11,2,0 // vbroadcastss 0x20b60(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,32,14,2,0 // vbroadcastss 0x20e20(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,81,11,2,0 // vbroadcastss 0x20b51(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,17,14,2,0 // vbroadcastss 0x20e11(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,71,11,2,0 // vbroadcastss 0x20b47(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,7,14,2,0 // vbroadcastss 0x20e07(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,43,11,2,0 // vbroadcastss 0x20b2b(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,235,13,2,0 // vbroadcastss 0x20deb(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,33,11,2,0 // vbroadcastss 0x20b21(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,225,13,2,0 // vbroadcastss 0x20de1(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,18,11,2,0 // vbroadcastss 0x20b12(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,210,13,2,0 // vbroadcastss 0x20dd2(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,8,11,2,0 // vbroadcastss 0x20b08(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,200,13,2,0 // vbroadcastss 0x20dc8(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,249,10,2,0 // vbroadcastss 0x20af9(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,185,13,2,0 // vbroadcastss 0x20db9(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26707,7 +27079,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,16,10,2,0 // vbroadcastss 0x20a10(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,208,12,2,0 // vbroadcastss 0x20cd0(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26726,34 +27098,34 @@ _sk_gamma_avx:
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
- .byte 196,98,125,24,5,99,10,2,0 // vbroadcastss 0x20a63(%rip),%ymm8 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,5,35,13,2,0 // vbroadcastss 0x20d23(%rip),%ymm8 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,89,10,2,0 // vbroadcastss 0x20a59(%rip),%ymm9 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,13,25,13,2,0 // vbroadcastss 0x20d19(%rip),%ymm9 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
- .byte 196,226,125,24,37,175,9,2,0 // vbroadcastss 0x209af(%rip),%ymm4 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,37,111,12,2,0 // vbroadcastss 0x20c6f(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,21,66,10,2,0 // vbroadcastss 0x20a42(%rip),%ymm10 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,21,2,13,2,0 // vbroadcastss 0x20d02(%rip),%ymm10 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,29,56,10,2,0 // vbroadcastss 0x20a38(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,248,12,2,0 // vbroadcastss 0x20cf8(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
.byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
- .byte 196,98,125,24,37,42,10,2,0 // vbroadcastss 0x20a2a(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,234,12,2,0 // vbroadcastss 0x20cea(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,45,32,10,2,0 // vbroadcastss 0x20a20(%rip),%ymm13 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,45,224,12,2,0 // vbroadcastss 0x20ce0(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
.byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
.byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
.byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
.byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
.byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
- .byte 196,98,125,24,61,255,9,2,0 // vbroadcastss 0x209ff(%rip),%ymm15 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,61,191,12,2,0 // vbroadcastss 0x20cbf(%rip),%ymm15 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
- .byte 196,226,125,24,29,245,9,2,0 // vbroadcastss 0x209f5(%rip),%ymm3 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,226,125,24,29,181,12,2,0 // vbroadcastss 0x20cb5(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
- .byte 196,226,125,24,21,232,9,2,0 // vbroadcastss 0x209e8(%rip),%ymm2 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,21,168,12,2,0 // vbroadcastss 0x20ca8(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
- .byte 196,226,125,24,53,223,9,2,0 // vbroadcastss 0x209df(%rip),%ymm6 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,226,125,24,53,159,12,2,0 // vbroadcastss 0x20c9f(%rip),%ymm6 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
.byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
@@ -26795,7 +27167,7 @@ _sk_gamma_avx:
.byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
.byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
.byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,34,9,2,0 // vbroadcastss 0x20922(%rip),%ymm2 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,226,125,24,21,226,11,2,0 // vbroadcastss 0x20be2(%rip),%ymm2 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
.byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
.byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
@@ -26815,31 +27187,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,222,8,2,0 // vbroadcastss 0x208de(%rip),%ymm8 # 2aec4 <_sk_overlay_sse2_8bit+0x503>
+ .byte 196,98,125,24,5,158,11,2,0 // vbroadcastss 0x20b9e(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,60,8,2,0 // vbroadcastss 0x2083c(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,252,10,2,0 // vbroadcastss 0x20afc(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,198,8,2,0 // vbroadcastss 0x208c6(%rip),%ymm9 # 2aec8 <_sk_overlay_sse2_8bit+0x507>
+ .byte 196,98,125,24,13,134,11,2,0 // vbroadcastss 0x20b86(%rip),%ymm9 # 2b4bc <_sk_overlay_sse2_8bit+0x507>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,178,8,2,0 // vbroadcastss 0x208b2(%rip),%ymm8 # 2aecc <_sk_overlay_sse2_8bit+0x50b>
+ .byte 196,98,125,24,5,114,11,2,0 // vbroadcastss 0x20b72(%rip),%ymm8 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,168,8,2,0 // vbroadcastss 0x208a8(%rip),%ymm8 # 2aed0 <_sk_overlay_sse2_8bit+0x50f>
+ .byte 196,98,125,24,5,104,11,2,0 // vbroadcastss 0x20b68(%rip),%ymm8 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,158,8,2,0 // vbroadcastss 0x2089e(%rip),%ymm8 # 2aed4 <_sk_overlay_sse2_8bit+0x513>
+ .byte 196,98,125,24,5,94,11,2,0 // vbroadcastss 0x20b5e(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,144,8,2,0 // vbroadcastss 0x20890(%rip),%ymm8 # 2aed8 <_sk_overlay_sse2_8bit+0x517>
+ .byte 196,98,125,24,5,80,11,2,0 // vbroadcastss 0x20b50(%rip),%ymm8 # 2b4cc <_sk_overlay_sse2_8bit+0x517>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,121,8,2,0 // vbroadcastss 0x20879(%rip),%ymm9 # 2aedc <_sk_overlay_sse2_8bit+0x51b>
+ .byte 196,98,125,24,13,57,11,2,0 // vbroadcastss 0x20b39(%rip),%ymm9 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,110,8,2,0 // vbroadcastss 0x2086e(%rip),%ymm11 # 2aee0 <_sk_overlay_sse2_8bit+0x51f>
+ .byte 196,98,125,24,29,46,11,2,0 // vbroadcastss 0x20b2e(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,100,8,2,0 // vbroadcastss 0x20864(%rip),%ymm12 # 2aee4 <_sk_overlay_sse2_8bit+0x523>
+ .byte 196,98,125,24,37,36,11,2,0 // vbroadcastss 0x20b24(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -26854,9 +27226,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,26,8,2,0 // vbroadcastss 0x2081a(%rip),%ymm0 # 2aee8 <_sk_overlay_sse2_8bit+0x527>
+ .byte 196,226,125,24,5,218,10,2,0 // vbroadcastss 0x20ada(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,17,8,2,0 // vbroadcastss 0x20811(%rip),%ymm8 # 2aeec <_sk_overlay_sse2_8bit+0x52b>
+ .byte 196,98,125,24,5,209,10,2,0 // vbroadcastss 0x20ad1(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26873,15 +27245,15 @@ _sk_load_a8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne a740 <_sk_load_a8_avx+0x5c>
+ .byte 117,67 // jne aa74 <_sk_load_a8_avx+0x5c>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,133,16,2,0 // vpand 0x21085(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,81,19,2,0 // vpand 0x21351(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,77,7,2,0 // vbroadcastss 0x2074d(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,13,10,2,0 // vbroadcastss 0x20a0d(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -26894,15 +27266,15 @@ _sk_load_a8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja a703 <_sk_load_a8_avx+0x1f>
+ .byte 119,175 // ja aa37 <_sk_load_a8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # a7d8 <_sk_load_a8_avx+0xf4>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ab0c <_sk_load_a8_avx+0xf4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,144 // jmp a703 <_sk_load_a8_avx+0x1f>
+ .byte 235,144 // jmp aa37 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -26910,7 +27282,7 @@ _sk_load_a8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,104,255,255,255 // jmpq a703 <_sk_load_a8_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -26921,7 +27293,7 @@ _sk_load_a8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,45,255,255,255 // jmpq a703 <_sk_load_a8_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -26930,7 +27302,7 @@ _sk_load_a8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde00a7e8 <_sk_overlay_sse2_8bit+0xffffffffddfdfe27>
+ .byte 232,255,255,255,221 // callq ffffffffde00ab1c <_sk_overlay_sse2_8bit+0xffffffffddfdfb67>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -26953,15 +27325,15 @@ _sk_load_a8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne a850 <_sk_load_a8_dst_avx+0x5c>
+ .byte 117,67 // jne ab84 <_sk_load_a8_dst_avx+0x5c>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,117,15,2,0 // vpand 0x20f75(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,65,18,2,0 // vpand 0x21241(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,61,6,2,0 // vbroadcastss 0x2063d(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,253,8,2,0 // vbroadcastss 0x208fd(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -26974,15 +27346,15 @@ _sk_load_a8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 119,175 // ja ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # a8e8 <_sk_load_a8_dst_avx+0xf4>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ac1c <_sk_load_a8_dst_avx+0xf4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,144 // jmp a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 235,144 // jmp ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -26990,7 +27362,7 @@ _sk_load_a8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,104,255,255,255 // jmpq a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -27001,7 +27373,7 @@ _sk_load_a8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,45,255,255,255 // jmpq a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -27010,7 +27382,7 @@ _sk_load_a8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde00a8f8 <_sk_overlay_sse2_8bit+0xffffffffddfdff37>
+ .byte 232,255,255,255,221 // callq ffffffffde00ac2c <_sk_overlay_sse2_8bit+0xffffffffddfdfc77>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -27065,7 +27437,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,168,4,2,0 // vbroadcastss 0x204a8(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,104,7,2,0 // vbroadcastss 0x20768(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -27084,14 +27456,14 @@ _sk_store_a8_avx:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,47,4,2,0 // vbroadcastss 0x2042f(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,239,6,2,0 // vbroadcastss 0x206ef(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne aa2b <_sk_store_a8_avx+0x47>
+ .byte 117,11 // jne ad5f <_sk_store_a8_avx+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27100,25 +27472,25 @@ _sk_store_a8_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja aa26 <_sk_store_a8_avx+0x42>
+ .byte 119,235 // ja ad5a <_sk_store_a8_avx+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # aaa0 <_sk_store_a8_avx+0xbc>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # add4 <_sk_store_a8_avx+0xbc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp aa26 <_sk_store_a8_avx+0x42>
+ .byte 235,201 // jmp ad5a <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,50,13,2,0 // vpshufb 0x20d32(%rip),%xmm8,%xmm8 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf>
+ .byte 196,98,57,0,5,254,15,2,0 // vpshufb 0x20ffe(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp aa26 <_sk_store_a8_avx+0x42>
+ .byte 235,175 // jmp ad5a <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,24,13,2,0 // vpshufb 0x20d18(%rip),%xmm8,%xmm8 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef>
+ .byte 196,98,57,0,5,228,15,2,0 // vpshufb 0x20fe4(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp aa26 <_sk_store_a8_avx+0x42>
+ .byte 235,134 // jmp ad5a <_sk_store_a8_avx+0x42>
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
.byte 255,197 // inc %ebp
@@ -27151,18 +27523,18 @@ _sk_load_g8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne ab1d <_sk_load_g8_avx+0x61>
+ .byte 117,72 // jne ae51 <_sk_load_g8_avx+0x61>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,173,12,2,0 // vpand 0x20cad(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,121,15,2,0 // vpand 0x20f79(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,117,3,2,0 // vbroadcastss 0x20375(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,53,6,2,0 // vbroadcastss 0x20635(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,242,2,2,0 // vbroadcastss 0x202f2(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,178,5,2,0 // vbroadcastss 0x205b2(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -27172,15 +27544,15 @@ _sk_load_g8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja aadb <_sk_load_g8_avx+0x1f>
+ .byte 119,170 // ja ae0f <_sk_load_g8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # abb4 <_sk_load_g8_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # aee8 <_sk_load_g8_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,139 // jmp aadb <_sk_load_g8_avx+0x1f>
+ .byte 235,139 // jmp ae0f <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -27188,7 +27560,7 @@ _sk_load_g8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,99,255,255,255 // jmpq aadb <_sk_load_g8_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -27199,7 +27571,7 @@ _sk_load_g8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,40,255,255,255 // jmpq aadb <_sk_load_g8_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -27208,7 +27580,7 @@ _sk_load_g8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf00abc4 <_sk_overlay_sse2_8bit+0xffffffffdefe0203>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00aef8 <_sk_overlay_sse2_8bit+0xffffffffdefdff43>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -27231,18 +27603,18 @@ _sk_load_g8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne ac31 <_sk_load_g8_dst_avx+0x61>
+ .byte 117,72 // jne af65 <_sk_load_g8_dst_avx+0x61>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,153,11,2,0 // vpand 0x20b99(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,101,14,2,0 // vpand 0x20e65(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,97,2,2,0 // vbroadcastss 0x20261(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,33,5,2,0 // vbroadcastss 0x20521(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,222,1,2,0 // vbroadcastss 0x201de(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,158,4,2,0 // vbroadcastss 0x2049e(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -27252,15 +27624,15 @@ _sk_load_g8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 119,170 // ja af23 <_sk_load_g8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # acc8 <_sk_load_g8_dst_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # affc <_sk_load_g8_dst_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,139 // jmp abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 235,139 // jmp af23 <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -27268,7 +27640,7 @@ _sk_load_g8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,99,255,255,255 // jmpq abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -27279,7 +27651,7 @@ _sk_load_g8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,40,255,255,255 // jmpq abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -27288,7 +27660,7 @@ _sk_load_g8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf00acd8 <_sk_overlay_sse2_8bit+0xffffffffdefe0317>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00b00c <_sk_overlay_sse2_8bit+0xffffffffdefe0057>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -27343,10 +27715,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,200,0,2,0 // vbroadcastss 0x200c8(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,136,3,2,0 // vbroadcastss 0x20388(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,69,0,2,0 // vbroadcastss 0x20045(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -27364,29 +27736,29 @@ _sk_load_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne ae6a <_sk_load_565_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne b19e <_sk_load_565_avx+0xa1>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,113,0,2,0 // vbroadcastss 0x20071(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,5,49,3,2,0 // vbroadcastss 0x20331(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,100,0,2,0 // vbroadcastss 0x20064(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,36,3,2,0 // vbroadcastss 0x20324(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,91,0,2,0 // vbroadcastss 0x2005b(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,13,27,3,2,0 // vbroadcastss 0x2031b(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,78,0,2,0 // vbroadcastss 0x2004e(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,14,3,2,0 // vbroadcastss 0x2030e(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,69,0,2,0 // vbroadcastss 0x20045(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,56,0,2,0 // vbroadcastss 0x20038(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,248,2,2,0 // vbroadcastss 0x202f8(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,157,255,1,0 // vbroadcastss 0x1ff9d(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,93,2,2,0 // vbroadcastss 0x2025d(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -27394,27 +27766,27 @@ _sk_load_565_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja adef <_sk_load_565_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja b123 <_sk_load_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # aef0 <_sk_load_565_avx+0x127>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # b224 <_sk_load_565_avx+0x127>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,75,255,255,255 // jmpq adef <_sk_load_565_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,46,255,255,255 // jmpq adef <_sk_load_565_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,1,255,255,255 // jmpq adef <_sk_load_565_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -27448,29 +27820,29 @@ _sk_load_565_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne afad <_sk_load_565_dst_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne b2e1 <_sk_load_565_dst_avx+0xa1>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,46,255,1,0 // vbroadcastss 0x1ff2e(%rip),%ymm4 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,37,238,1,2,0 // vbroadcastss 0x201ee(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,33,255,1,0 // vbroadcastss 0x1ff21(%rip),%ymm5 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,45,225,1,2,0 // vbroadcastss 0x201e1(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,24,255,1,0 // vbroadcastss 0x1ff18(%rip),%ymm5 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,45,216,1,2,0 // vbroadcastss 0x201d8(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,11,255,1,0 // vbroadcastss 0x1ff0b(%rip),%ymm7 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,61,203,1,2,0 // vbroadcastss 0x201cb(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,2,255,1,0 // vbroadcastss 0x1ff02(%rip),%ymm7 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,61,194,1,2,0 // vbroadcastss 0x201c2(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,245,254,1,0 // vbroadcastss 0x1fef5(%rip),%ymm7 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,61,181,1,2,0 // vbroadcastss 0x201b5(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,90,254,1,0 // vbroadcastss 0x1fe5a(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,26,1,2,0 // vbroadcastss 0x2011a(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -27478,27 +27850,27 @@ _sk_load_565_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja af32 <_sk_load_565_dst_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja b266 <_sk_load_565_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b034 <_sk_load_565_dst_avx+0x128>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b368 <_sk_load_565_dst_avx+0x128>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,75,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,46,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,1,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -27570,23 +27942,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,90,253,1,0 // vbroadcastss 0x1fd5a(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,5,26,0,2,0 // vbroadcastss 0x2001a(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,77,253,1,0 // vbroadcastss 0x1fd4d(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,13,0,2,0 // vbroadcastss 0x2000d(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,68,253,1,0 // vbroadcastss 0x1fd44(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,13,4,0,2,0 // vbroadcastss 0x20004(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,55,253,1,0 // vbroadcastss 0x1fd37(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,247,255,1,0 // vbroadcastss 0x1fff7(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,46,253,1,0 // vbroadcastss 0x1fd2e(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,29,238,255,1,0 // vbroadcastss 0x1ffee(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,33,253,1,0 // vbroadcastss 0x1fd21(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,225,255,1,0 // vbroadcastss 0x1ffe1(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,134,252,1,0 // vbroadcastss 0x1fc86(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,70,255,1,0 // vbroadcastss 0x1ff46(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_avx
@@ -27601,14 +27973,14 @@ _sk_store_565_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,80,253,1,0 // vbroadcastss 0x1fd50(%rip),%ymm8 # 2aef0 <_sk_overlay_sse2_8bit+0x52f>
+ .byte 196,98,125,24,5,16,0,2,0 // vbroadcastss 0x20010(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,41,253,1,0 // vbroadcastss 0x1fd29(%rip),%ymm10 # 2aef4 <_sk_overlay_sse2_8bit+0x533>
+ .byte 196,98,125,24,21,233,255,1,0 // vbroadcastss 0x1ffe9(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -27622,7 +27994,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne b21c <_sk_store_565_avx+0x9c>
+ .byte 117,11 // jne b550 <_sk_store_565_avx+0x9c>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27631,22 +28003,22 @@ _sk_store_565_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja b217 <_sk_store_565_avx+0x97>
+ .byte 119,235 // ja b54b <_sk_store_565_avx+0x97>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b27c <_sk_store_565_avx+0xfc>
+ .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b5b0 <_sk_store_565_avx+0xfc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp b217 <_sk_store_565_avx+0x97>
+ .byte 235,206 // jmp b54b <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp b217 <_sk_store_565_avx+0x97>
+ .byte 235,190 // jmp b54b <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp b217 <_sk_store_565_avx+0x97>
+ .byte 235,158 // jmp b54b <_sk_store_565_avx+0x97>
.byte 15,31,0 // nopl (%rax)
.byte 196 // (bad)
.byte 255 // (bad)
@@ -27685,31 +28057,31 @@ _sk_load_4444_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne b351 <_sk_load_4444_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne b685 <_sk_load_4444_avx+0xb9>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,30,252,1,0 // vbroadcastss 0x1fc1e(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,5,222,254,1,0 // vbroadcastss 0x1fede(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,17,252,1,0 // vbroadcastss 0x1fc11(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,209,254,1,0 // vbroadcastss 0x1fed1(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,8,252,1,0 // vbroadcastss 0x1fc08(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,13,200,254,1,0 // vbroadcastss 0x1fec8(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,251,251,1,0 // vbroadcastss 0x1fbfb(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,187,254,1,0 // vbroadcastss 0x1febb(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,242,251,1,0 // vbroadcastss 0x1fbf2(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,21,178,254,1,0 // vbroadcastss 0x1feb2(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,229,251,1,0 // vbroadcastss 0x1fbe5(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,165,254,1,0 // vbroadcastss 0x1fea5(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,219,251,1,0 // vbroadcastss 0x1fbdb(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,155,254,1,0 // vbroadcastss 0x1fe9b(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,205,251,1,0 // vbroadcastss 0x1fbcd(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,141,254,1,0 // vbroadcastss 0x1fe8d(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27719,27 +28091,27 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja b2be <_sk_load_4444_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja b5f2 <_sk_load_4444_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b3d8 <_sk_load_4444_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b70c <_sk_load_4444_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,51,255,255,255 // jmpq b2be <_sk_load_4444_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,22,255,255,255 // jmpq b2be <_sk_load_4444_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,233,254,255,255 // jmpq b2be <_sk_load_4444_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -27776,31 +28148,31 @@ _sk_load_4444_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne b4ad <_sk_load_4444_dst_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne b7e1 <_sk_load_4444_dst_avx+0xb9>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,194,250,1,0 // vbroadcastss 0x1fac2(%rip),%ymm4 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,37,130,253,1,0 // vbroadcastss 0x1fd82(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,181,250,1,0 // vbroadcastss 0x1fab5(%rip),%ymm5 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,45,117,253,1,0 // vbroadcastss 0x1fd75(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,172,250,1,0 // vbroadcastss 0x1faac(%rip),%ymm5 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,45,108,253,1,0 // vbroadcastss 0x1fd6c(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,159,250,1,0 // vbroadcastss 0x1fa9f(%rip),%ymm6 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,53,95,253,1,0 // vbroadcastss 0x1fd5f(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,150,250,1,0 // vbroadcastss 0x1fa96(%rip),%ymm6 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,53,86,253,1,0 // vbroadcastss 0x1fd56(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,137,250,1,0 // vbroadcastss 0x1fa89(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,73,253,1,0 // vbroadcastss 0x1fd49(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,127,250,1,0 // vbroadcastss 0x1fa7f(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,63,253,1,0 // vbroadcastss 0x1fd3f(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,113,250,1,0 // vbroadcastss 0x1fa71(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,49,253,1,0 // vbroadcastss 0x1fd31(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27810,27 +28182,27 @@ _sk_load_4444_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja b74e <_sk_load_4444_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b534 <_sk_load_4444_dst_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b868 <_sk_load_4444_dst_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,51,255,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,22,255,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,233,254,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -27902,25 +28274,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,214,248,1,0 // vbroadcastss 0x1f8d6(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,5,150,251,1,0 // vbroadcastss 0x1fb96(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,201,248,1,0 // vbroadcastss 0x1f8c9(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,137,251,1,0 // vbroadcastss 0x1fb89(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,192,248,1,0 // vbroadcastss 0x1f8c0(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,13,128,251,1,0 // vbroadcastss 0x1fb80(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,179,248,1,0 // vbroadcastss 0x1f8b3(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,115,251,1,0 // vbroadcastss 0x1fb73(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,170,248,1,0 // vbroadcastss 0x1f8aa(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,21,106,251,1,0 // vbroadcastss 0x1fb6a(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,157,248,1,0 // vbroadcastss 0x1f89d(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,93,251,1,0 // vbroadcastss 0x1fb5d(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,147,248,1,0 // vbroadcastss 0x1f893(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,83,251,1,0 // vbroadcastss 0x1fb53(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,133,248,1,0 // vbroadcastss 0x1f885(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,69,251,1,0 // vbroadcastss 0x1fb45(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27937,7 +28309,7 @@ _sk_store_4444_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,96,248,1,0 // vbroadcastss 0x1f860(%rip),%ymm8 # 2af18 <_sk_overlay_sse2_8bit+0x557>
+ .byte 196,98,125,24,5,32,251,1,0 // vbroadcastss 0x1fb20(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -27964,7 +28336,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne b752 <_sk_store_4444_avx+0xba>
+ .byte 117,11 // jne ba86 <_sk_store_4444_avx+0xba>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27973,22 +28345,22 @@ _sk_store_4444_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja b74d <_sk_store_4444_avx+0xb5>
+ .byte 119,235 // ja ba81 <_sk_store_4444_avx+0xb5>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # b7b0 <_sk_store_4444_avx+0x118>
+ .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # bae4 <_sk_store_4444_avx+0x118>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp b74d <_sk_store_4444_avx+0xb5>
+ .byte 235,206 // jmp ba81 <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp b74d <_sk_store_4444_avx+0xb5>
+ .byte 235,190 // jmp ba81 <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp b74d <_sk_store_4444_avx+0xb5>
+ .byte 235,158 // jmp ba81 <_sk_store_4444_avx+0xb5>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -28027,12 +28399,12 @@ _sk_load_8888_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne b875 <_sk_load_8888_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne bba9 <_sk_load_8888_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,229,250,1,0 // vmovapd 0x1fae5(%rip),%ymm10 # 2b2e0 <_sk_overlay_sse2_8bit+0x91f>
+ .byte 197,125,40,21,177,253,1,0 // vmovapd 0x1fdb1(%rip),%ymm10 # 2b8e0 <_sk_overlay_sse2_8bit+0x92b>
.byte 196,193,53,84,194 // vandpd %ymm10,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,107,246,1,0 // vbroadcastss 0x1f66b(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,43,249,1,0 // vbroadcastss 0x1f92b(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -28060,21 +28432,21 @@ _sk_load_8888_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja b7f3 <_sk_load_8888_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja bb27 <_sk_load_8888_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # b92c <_sk_load_8888_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bc60 <_sk_load_8888_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -28088,9 +28460,9 @@ _sk_load_8888_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,202,254,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe b92d <_sk_load_8888_avx+0x161>
+ .byte 118,255 // jbe bc61 <_sk_load_8888_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28123,12 +28495,12 @@ _sk_load_8888_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne b9f1 <_sk_load_8888_dst_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne bd25 <_sk_load_8888_dst_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,137,249,1,0 // vmovapd 0x1f989(%rip),%ymm10 # 2b300 <_sk_overlay_sse2_8bit+0x93f>
+ .byte 197,125,40,21,85,252,1,0 // vmovapd 0x1fc55(%rip),%ymm10 # 2b900 <_sk_overlay_sse2_8bit+0x94b>
.byte 196,193,53,84,226 // vandpd %ymm10,%ymm9,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,239,244,1,0 // vbroadcastss 0x1f4ef(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,175,247,1,0 // vbroadcastss 0x1f7af(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -28156,21 +28528,21 @@ _sk_load_8888_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja bca3 <_sk_load_8888_dst_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # baa8 <_sk_load_8888_dst_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bddc <_sk_load_8888_dst_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -28184,9 +28556,9 @@ _sk_load_8888_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,202,254,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe baa9 <_sk_load_8888_dst_avx+0x161>
+ .byte 118,255 // jbe bddd <_sk_load_8888_dst_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28243,10 +28615,10 @@ _sk_gather_8888_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,177,247,1,0 // vmovaps 0x1f7b1(%rip),%ymm10 # 2b320 <_sk_overlay_sse2_8bit+0x95f>
+ .byte 197,124,40,21,125,250,1,0 // vmovaps 0x1fa7d(%rip),%ymm10 # 2b920 <_sk_overlay_sse2_8bit+0x96b>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,247,242,1,0 // vbroadcastss 0x1f2f7(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,183,245,1,0 // vbroadcastss 0x1f5b7(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -28280,7 +28652,7 @@ _sk_store_8888_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,45,242,1,0 // vbroadcastss 0x1f22d(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,237,244,1,0 // vbroadcastss 0x1f4ed(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -28305,7 +28677,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne bc92 <_sk_store_8888_avx+0xb0>
+ .byte 117,11 // jne bfc6 <_sk_store_8888_avx+0xb0>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -28314,17 +28686,17 @@ _sk_store_8888_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja bc8d <_sk_store_8888_avx+0xab>
+ .byte 119,235 // ja bfc1 <_sk_store_8888_avx+0xab>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # bd00 <_sk_store_8888_avx+0x11e>
+ .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c034 <_sk_store_8888_avx+0x11e>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp bc8d <_sk_store_8888_avx+0xab>
+ .byte 235,207 // jmp bfc1 <_sk_store_8888_avx+0xab>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp bc8d <_sk_store_8888_avx+0xab>
+ .byte 235,191 // jmp bfc1 <_sk_store_8888_avx+0xab>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -28332,7 +28704,7 @@ _sk_store_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp bc8d <_sk_store_8888_avx+0xab>
+ .byte 235,142 // jmp bfc1 <_sk_store_8888_avx+0xab>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -28368,12 +28740,12 @@ _sk_load_bgra_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne bdc5 <_sk_load_bgra_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne c0f9 <_sk_load_bgra_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,245,245,1,0 // vmovapd 0x1f5f5(%rip),%ymm10 # 2b340 <_sk_overlay_sse2_8bit+0x97f>
+ .byte 197,125,40,21,193,248,1,0 // vmovapd 0x1f8c1(%rip),%ymm10 # 2b940 <_sk_overlay_sse2_8bit+0x98b>
.byte 196,193,53,84,202 // vandpd %ymm10,%ymm9,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,27,241,1,0 // vbroadcastss 0x1f11b(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,219,243,1,0 // vbroadcastss 0x1f3db(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -28401,21 +28773,21 @@ _sk_load_bgra_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja bd43 <_sk_load_bgra_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja c077 <_sk_load_bgra_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # be7c <_sk_load_bgra_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c1b0 <_sk_load_bgra_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -28429,9 +28801,9 @@ _sk_load_bgra_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,202,254,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe be7d <_sk_load_bgra_avx+0x161>
+ .byte 118,255 // jbe c1b1 <_sk_load_bgra_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28464,12 +28836,12 @@ _sk_load_bgra_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne bf41 <_sk_load_bgra_dst_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne c275 <_sk_load_bgra_dst_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,153,244,1,0 // vmovapd 0x1f499(%rip),%ymm10 # 2b360 <_sk_overlay_sse2_8bit+0x99f>
+ .byte 197,125,40,21,101,247,1,0 // vmovapd 0x1f765(%rip),%ymm10 # 2b960 <_sk_overlay_sse2_8bit+0x9ab>
.byte 196,193,53,84,234 // vandpd %ymm10,%ymm9,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,159,239,1,0 // vbroadcastss 0x1ef9f(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,95,242,1,0 // vbroadcastss 0x1f25f(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -28497,21 +28869,21 @@ _sk_load_bgra_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bff8 <_sk_load_bgra_dst_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c32c <_sk_load_bgra_dst_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -28525,9 +28897,9 @@ _sk_load_bgra_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,202,254,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe bff9 <_sk_load_bgra_dst_avx+0x161>
+ .byte 118,255 // jbe c32d <_sk_load_bgra_dst_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28584,10 +28956,10 @@ _sk_gather_bgra_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,193,242,1,0 // vmovaps 0x1f2c1(%rip),%ymm9 # 2b380 <_sk_overlay_sse2_8bit+0x9bf>
+ .byte 197,124,40,13,141,245,1,0 // vmovaps 0x1f58d(%rip),%ymm9 # 2b980 <_sk_overlay_sse2_8bit+0x9cb>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,167,237,1,0 // vbroadcastss 0x1eda7(%rip),%ymm10 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,21,103,240,1,0 // vbroadcastss 0x1f067(%rip),%ymm10 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -28621,7 +28993,7 @@ _sk_store_bgra_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,221,236,1,0 // vbroadcastss 0x1ecdd(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,157,239,1,0 // vbroadcastss 0x1ef9d(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -28646,7 +29018,7 @@ _sk_store_bgra_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne c1e2 <_sk_store_bgra_avx+0xb0>
+ .byte 117,11 // jne c516 <_sk_store_bgra_avx+0xb0>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -28655,17 +29027,17 @@ _sk_store_bgra_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja c1dd <_sk_store_bgra_avx+0xab>
+ .byte 119,235 // ja c511 <_sk_store_bgra_avx+0xab>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c250 <_sk_store_bgra_avx+0x11e>
+ .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c584 <_sk_store_bgra_avx+0x11e>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp c1dd <_sk_store_bgra_avx+0xab>
+ .byte 235,207 // jmp c511 <_sk_store_bgra_avx+0xab>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp c1dd <_sk_store_bgra_avx+0xab>
+ .byte 235,191 // jmp c511 <_sk_store_bgra_avx+0xab>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -28673,7 +29045,7 @@ _sk_store_bgra_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp c1dd <_sk_store_bgra_avx+0xab>
+ .byte 235,142 // jmp c511 <_sk_store_bgra_avx+0xab>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -28713,7 +29085,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne c539 <_sk_load_f16_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne c86d <_sk_load_f16_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,76,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -28731,13 +29103,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,123,236,1,0 // vbroadcastss 0x1ec7b(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,59,239,1,0 // vbroadcastss 0x1ef3b(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,63,236,1,0 // vbroadcastss 0x1ec3f(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,255,238,1,0 // vbroadcastss 0x1eeff(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,89,236,1,0 // vbroadcastss 0x1ec59(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,25,239,1,0 // vbroadcastss 0x1ef19(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -28751,7 +29123,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,15,236,1,0 // vbroadcastss 0x1ec0f(%rip),%xmm3 # 2af88 <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,29,207,238,1,0 // vbroadcastss 0x1eecf(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -28844,29 +29216,29 @@ _sk_load_f16_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je c59f <_sk_load_f16_avx+0x333>
+ .byte 116,85 // je c8d3 <_sk_load_f16_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb c59f <_sk_load_f16_avx+0x333>
+ .byte 114,72 // jb c8d3 <_sk_load_f16_avx+0x333>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je c5ac <_sk_load_f16_avx+0x340>
+ .byte 116,72 // je c8e0 <_sk_load_f16_avx+0x340>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb c5ac <_sk_load_f16_avx+0x340>
+ .byte 114,59 // jb c8e0 <_sk_load_f16_avx+0x340>
.byte 196,193,123,16,76,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je c2c3 <_sk_load_f16_avx+0x57>
+ .byte 15,132,65,253,255,255 // je c5f7 <_sk_load_f16_avx+0x57>
.byte 196,193,113,22,76,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb c2c3 <_sk_load_f16_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb c5f7 <_sk_load_f16_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,23,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,14,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
HIDDEN _sk_load_f16_dst_avx
.globl _sk_load_f16_dst_avx
@@ -28885,7 +29257,7 @@ _sk_load_f16_dst_avx:
.byte 197,252,17,84,36,192 // vmovups %ymm2,-0x40(%rsp)
.byte 197,252,17,76,36,160 // vmovups %ymm1,-0x60(%rsp)
.byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne c882 <_sk_load_f16_dst_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne cbb6 <_sk_load_f16_dst_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,108,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -28903,13 +29275,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,50,233,1,0 // vbroadcastss 0x1e932(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,242,235,1,0 // vbroadcastss 0x1ebf2(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,246,232,1,0 // vbroadcastss 0x1e8f6(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,182,235,1,0 // vbroadcastss 0x1ebb6(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,16,233,1,0 // vbroadcastss 0x1e910(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,208,235,1,0 // vbroadcastss 0x1ebd0(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -28923,7 +29295,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,198,232,1,0 // vbroadcastss 0x1e8c6(%rip),%xmm7 # 2af88 <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,61,134,235,1,0 // vbroadcastss 0x1eb86(%rip),%xmm7 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -29016,29 +29388,29 @@ _sk_load_f16_dst_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je c8e8 <_sk_load_f16_dst_avx+0x333>
+ .byte 116,85 // je cc1c <_sk_load_f16_dst_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb c8e8 <_sk_load_f16_dst_avx+0x333>
+ .byte 114,72 // jb cc1c <_sk_load_f16_dst_avx+0x333>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je c8f5 <_sk_load_f16_dst_avx+0x340>
+ .byte 116,72 // je cc29 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb c8f5 <_sk_load_f16_dst_avx+0x340>
+ .byte 114,59 // jb cc29 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,123,16,108,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm5
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,132,65,253,255,255 // je c940 <_sk_load_f16_dst_avx+0x57>
.byte 196,193,81,22,108,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb c940 <_sk_load_f16_dst_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,23,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
- .byte 233,14,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -29099,13 +29471,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,120,229,1,0 // vbroadcastss 0x1e578(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,56,232,1,0 // vbroadcastss 0x1e838(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,60,229,1,0 // vbroadcastss 0x1e53c(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,252,231,1,0 // vbroadcastss 0x1e7fc(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,86,229,1,0 // vbroadcastss 0x1e556(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,22,232,1,0 // vbroadcastss 0x1e816(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -29119,7 +29491,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,12,229,1,0 // vbroadcastss 0x1e50c(%rip),%xmm3 # 2af88 <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,29,204,231,1,0 // vbroadcastss 0x1e7cc(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -29219,12 +29591,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,252,226,1,0 // vbroadcastss 0x1e2fc(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,188,229,1,0 // vbroadcastss 0x1e5bc(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,13,227,1,0 // vbroadcastss 0x1e30d(%rip),%xmm8 # 2af8c <_sk_overlay_sse2_8bit+0x5cb>
+ .byte 196,98,121,24,5,205,229,1,0 // vbroadcastss 0x1e5cd(%rip),%xmm8 # 2b580 <_sk_overlay_sse2_8bit+0x5cb>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -29234,7 +29606,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,212,226,1,0 // vbroadcastss 0x1e2d4(%rip),%ymm10 # 2af90 <_sk_overlay_sse2_8bit+0x5cf>
+ .byte 196,98,125,24,21,148,229,1,0 // vbroadcastss 0x1e594(%rip),%ymm10 # 2b584 <_sk_overlay_sse2_8bit+0x5cf>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -29321,7 +29693,7 @@ _sk_store_f16_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,70 // jne ceb0 <_sk_store_f16_avx+0x274>
+ .byte 117,70 // jne d1e4 <_sk_store_f16_avx+0x274>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -29337,22 +29709,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,201 // je ce85 <_sk_store_f16_avx+0x249>
+ .byte 116,201 // je d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,188 // jb ce85 <_sk_store_f16_avx+0x249>
+ .byte 114,188 // jb d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,179 // je ce85 <_sk_store_f16_avx+0x249>
+ .byte 116,179 // je d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,166 // jb ce85 <_sk_store_f16_avx+0x249>
+ .byte 114,166 // jb d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,157 // je ce85 <_sk_store_f16_avx+0x249>
+ .byte 116,157 // je d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,144 // jb ce85 <_sk_store_f16_avx+0x249>
+ .byte 114,144 // jb d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,135 // jmp ce85 <_sk_store_f16_avx+0x249>
+ .byte 235,135 // jmp d1b9 <_sk_store_f16_avx+0x249>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -29367,7 +29739,7 @@ _sk_load_u16_be_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne d022 <_sk_load_u16_be_avx+0x124>
+ .byte 15,133,253,0,0,0 // jne d356 <_sk_load_u16_be_avx+0x124>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -29389,7 +29761,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,254,222,1,0 // vbroadcastss 0x1defe(%rip),%ymm11 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,29,190,225,1,0 // vbroadcastss 0x1e1be(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -29423,29 +29795,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je d088 <_sk_load_u16_be_avx+0x18a>
+ .byte 116,85 // je d3bc <_sk_load_u16_be_avx+0x18a>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb d088 <_sk_load_u16_be_avx+0x18a>
+ .byte 114,72 // jb d3bc <_sk_load_u16_be_avx+0x18a>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je d095 <_sk_load_u16_be_avx+0x197>
+ .byte 116,72 // je d3c9 <_sk_load_u16_be_avx+0x197>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb d095 <_sk_load_u16_be_avx+0x197>
+ .byte 114,59 // jb d3c9 <_sk_load_u16_be_avx+0x197>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,213,254,255,255 // je cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 15,132,213,254,255,255 // je d274 <_sk_load_u16_be_avx+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,196,254,255,255 // jb cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 15,130,196,254,255,255 // jb d274 <_sk_load_u16_be_avx+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 233,184,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 233,171,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 233,162,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -29462,7 +29834,7 @@ _sk_load_rgb_u16_be_avx:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,243,0,0,0 // jne d1bc <_sk_load_rgb_u16_be_avx+0x11e>
+ .byte 15,133,243,0,0,0 // jne d4f0 <_sk_load_rgb_u16_be_avx+0x11e>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -29489,7 +29861,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,65,221,1,0 // vbroadcastss 0x1dd41(%rip),%ymm11 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,29,1,224,1,0 // vbroadcastss 0x1e001(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -29510,41 +29882,41 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,74,220,1,0 // vbroadcastss 0x1dc4a(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,10,223,1,0 // vbroadcastss 0x1df0a(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne d1d5 <_sk_load_rgb_u16_be_avx+0x137>
- .byte 233,40,255,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,5 // jne d509 <_sk_load_rgb_u16_be_avx+0x137>
+ .byte 233,40,255,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb d204 <_sk_load_rgb_u16_be_avx+0x166>
+ .byte 114,26 // jb d538 <_sk_load_rgb_u16_be_avx+0x166>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne d209 <_sk_load_rgb_u16_be_avx+0x16b>
- .byte 233,249,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,244,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne d53d <_sk_load_rgb_u16_be_avx+0x16b>
+ .byte 233,249,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,244,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb d238 <_sk_load_rgb_u16_be_avx+0x19a>
+ .byte 114,26 // jb d56c <_sk_load_rgb_u16_be_avx+0x19a>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne d23d <_sk_load_rgb_u16_be_avx+0x19f>
- .byte 233,197,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,192,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne d571 <_sk_load_rgb_u16_be_avx+0x19f>
+ .byte 233,197,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,192,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb d266 <_sk_load_rgb_u16_be_avx+0x1c8>
+ .byte 114,20 // jb d59a <_sk_load_rgb_u16_be_avx+0x1c8>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,151,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,146,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,151,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,146,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -29558,7 +29930,7 @@ _sk_store_u16_be_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,138,220,1,0 // vbroadcastss 0x1dc8a(%rip),%ymm8 # 2af1c <_sk_overlay_sse2_8bit+0x55b>
+ .byte 196,98,125,24,5,74,223,1,0 // vbroadcastss 0x1df4a(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -29596,7 +29968,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne d376 <_sk_store_u16_be_avx+0x10b>
+ .byte 117,31 // jne d6aa <_sk_store_u16_be_avx+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -29605,22 +29977,22 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je d372 <_sk_store_u16_be_avx+0x107>
+ .byte 116,240 // je d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb d372 <_sk_store_u16_be_avx+0x107>
+ .byte 114,227 // jb d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je d372 <_sk_store_u16_be_avx+0x107>
+ .byte 116,218 // je d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb d372 <_sk_store_u16_be_avx+0x107>
+ .byte 114,205 // jb d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je d372 <_sk_store_u16_be_avx+0x107>
+ .byte 116,196 // je d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb d372 <_sk_store_u16_be_avx+0x107>
+ .byte 114,183 // jb d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp d372 <_sk_store_u16_be_avx+0x107>
+ .byte 235,174 // jmp d6a6 <_sk_store_u16_be_avx+0x107>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
@@ -29628,7 +30000,7 @@ FUNCTION(_sk_load_f32_avx)
_sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja d450 <_sk_load_f32_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja d784 <_sk_load_f32_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -29636,7 +30008,7 @@ _sk_load_f32_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d478 <_sk_load_f32_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d7ac <_sk_load_f32_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -29685,7 +30057,7 @@ FUNCTION(_sk_load_f32_dst_avx)
_sk_load_f32_dst_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja d524 <_sk_load_f32_dst_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja d858 <_sk_load_f32_dst_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -29693,7 +30065,7 @@ _sk_load_f32_dst_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d54c <_sk_load_f32_dst_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d880 <_sk_load_f32_dst_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -29757,7 +30129,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne d5eb <_sk_store_f32_avx+0x7f>
+ .byte 117,55 // jne d91f <_sk_store_f32_avx+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -29770,22 +30142,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 116,240 // je d91b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 114,227 // jb d91b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 116,218 // je d91b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 114,205 // jb d91b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 116,195 // je d91b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 114,181 // jb d91b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 235,171 // jmp d91b <_sk_store_f32_avx+0x7b>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -29878,7 +30250,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,143,214,1,0 // vmulss 0x1d68f(%rip),%xmm9,%xmm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,5,79,217,1,0 // vmulss 0x1d94f(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -29912,7 +30284,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,2,214,1,0 // vmulss 0x1d602(%rip),%xmm9,%xmm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,13,194,216,1,0 // vmulss 0x1d8c2(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -29939,7 +30311,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,156,213,1,0 // vbroadcastss 0x1d59c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,92,216,1,0 // vbroadcastss 0x1d85c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -29957,9 +30329,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,147,213,1,0 // vbroadcastss 0x1d593(%rip),%ymm8 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,5,83,216,1,0 // vbroadcastss 0x1d853(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,105,213,1,0 // vbroadcastss 0x1d569(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,41,216,1,0 // vbroadcastss 0x1d829(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -29975,12 +30347,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,85,214,1,0 // vbroadcastss 0x1d655(%rip),%ymm3 # 2af20 <_sk_overlay_sse2_8bit+0x55f>
+ .byte 196,226,125,24,29,21,217,1,0 // vbroadcastss 0x1d915(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,76,214,1,0 // vbroadcastss 0x1d64c(%rip),%ymm3 # 2af24 <_sk_overlay_sse2_8bit+0x563>
+ .byte 196,226,125,24,29,12,217,1,0 // vbroadcastss 0x1d90c(%rip),%ymm3 # 2b518 <_sk_overlay_sse2_8bit+0x563>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,63,214,1,0 // vbroadcastss 0x1d63f(%rip),%ymm1 # 2af28 <_sk_overlay_sse2_8bit+0x567>
+ .byte 196,226,125,24,13,255,216,1,0 // vbroadcastss 0x1d8ff(%rip),%ymm1 # 2b51c <_sk_overlay_sse2_8bit+0x567>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30228,9 +30600,9 @@ _sk_evenly_spaced_gradient_avx:
.byte 72,139,24 // mov (%rax),%rbx
.byte 72,139,104,8 // mov 0x8(%rax),%rbp
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js dc8d <_sk_evenly_spaced_gradient_avx+0x25>
+ .byte 120,7 // js dfc1 <_sk_evenly_spaced_gradient_avx+0x25>
.byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1
- .byte 235,21 // jmp dca2 <_sk_evenly_spaced_gradient_avx+0x3a>
+ .byte 235,21 // jmp dfd6 <_sk_evenly_spaced_gradient_avx+0x3a>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -30388,18 +30760,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,42,207,1,0 // vbroadcastss 0x1cf2a(%rip),%ymm0 # 2af30 <_sk_overlay_sse2_8bit+0x56f>
+ .byte 196,226,125,24,5,234,209,1,0 // vbroadcastss 0x1d1ea(%rip),%ymm0 # 2b524 <_sk_overlay_sse2_8bit+0x56f>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,25,207,1,0 // vbroadcastss 0x1cf19(%rip),%ymm1 # 2af2c <_sk_overlay_sse2_8bit+0x56b>
+ .byte 196,226,125,24,13,217,209,1,0 // vbroadcastss 0x1d1d9(%rip),%ymm1 # 2b520 <_sk_overlay_sse2_8bit+0x56b>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,16,207,1,0 // vbroadcastss 0x1cf10(%rip),%ymm1 # 2af34 <_sk_overlay_sse2_8bit+0x573>
+ .byte 196,226,125,24,13,208,209,1,0 // vbroadcastss 0x1d1d0(%rip),%ymm1 # 2b528 <_sk_overlay_sse2_8bit+0x573>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,3,207,1,0 // vbroadcastss 0x1cf03(%rip),%ymm1 # 2af38 <_sk_overlay_sse2_8bit+0x577>
+ .byte 196,226,125,24,13,195,209,1,0 // vbroadcastss 0x1d1c3(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,246,206,1,0 // vbroadcastss 0x1cef6(%rip),%ymm1 # 2af3c <_sk_overlay_sse2_8bit+0x57b>
+ .byte 196,226,125,24,13,182,209,1,0 // vbroadcastss 0x1d1b6(%rip),%ymm1 # 2b530 <_sk_overlay_sse2_8bit+0x57b>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -30422,12 +30794,12 @@ _sk_gradient_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,80 // jb e0c9 <_sk_gradient_avx+0x6f>
+ .byte 114,80 // jb e3fd <_sk_gradient_avx+0x6f>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,118,205,1,0 // vbroadcastss 0x1cd76(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,24,21,54,208,1,0 // vbroadcastss 0x1d036(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -30439,7 +30811,7 @@ _sk_gradient_avx:
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,205 // jne e096 <_sk_gradient_avx+0x3c>
+ .byte 117,205 // jne e3ca <_sk_gradient_avx+0x3c>
.byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -30622,27 +30994,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,160,202,1,0 // vbroadcastss 0x1caa0(%rip),%ymm13 # 2af40 <_sk_overlay_sse2_8bit+0x57f>
+ .byte 196,98,125,24,45,96,205,1,0 // vbroadcastss 0x1cd60(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,150,202,1,0 // vbroadcastss 0x1ca96(%rip),%ymm14 # 2af44 <_sk_overlay_sse2_8bit+0x583>
+ .byte 196,98,125,24,53,86,205,1,0 // vbroadcastss 0x1cd56(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,135,202,1,0 // vbroadcastss 0x1ca87(%rip),%ymm14 # 2af48 <_sk_overlay_sse2_8bit+0x587>
+ .byte 196,98,125,24,53,71,205,1,0 // vbroadcastss 0x1cd47(%rip),%ymm14 # 2b53c <_sk_overlay_sse2_8bit+0x587>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,120,202,1,0 // vbroadcastss 0x1ca78(%rip),%ymm13 # 2af4c <_sk_overlay_sse2_8bit+0x58b>
+ .byte 196,98,125,24,45,56,205,1,0 // vbroadcastss 0x1cd38(%rip),%ymm13 # 2b540 <_sk_overlay_sse2_8bit+0x58b>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,99,202,1,0 // vbroadcastss 0x1ca63(%rip),%ymm10 # 2af50 <_sk_overlay_sse2_8bit+0x58f>
+ .byte 196,98,125,24,21,35,205,1,0 // vbroadcastss 0x1cd23(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,249,200,1,0 // vbroadcastss 0x1c8f9(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,185,203,1,0 // vbroadcastss 0x1cbb9(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,227,200,1,0 // vbroadcastss 0x1c8e3(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,163,203,1,0 // vbroadcastss 0x1cba3(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -30672,7 +31044,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,217,201,1,0 // vbroadcastss 0x1c9d9(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,153,204,1,0 // vbroadcastss 0x1cc99(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -30681,17 +31053,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,173,201,1,0 // vbroadcastss 0x1c9ad(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,109,204,1,0 // vbroadcastss 0x1cc6d(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,139,201,1,0 // vbroadcastss 0x1c98b(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,75,204,1,0 // vbroadcastss 0x1cc4b(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,28,200,1,0 // vbroadcastss 0x1c81c(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,220,202,1,0 // vbroadcastss 0x1cadc(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -30711,7 +31083,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,43,201,1,0 // vbroadcastss 0x1c92b(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,235,203,1,0 // vbroadcastss 0x1cbeb(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -30720,17 +31092,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,255,200,1,0 // vbroadcastss 0x1c8ff(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,191,203,1,0 // vbroadcastss 0x1cbbf(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,157,203,1,0 // vbroadcastss 0x1cb9d(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,110,199,1,0 // vbroadcastss 0x1c76e(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,46,202,1,0 // vbroadcastss 0x1ca2e(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -30749,7 +31121,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,131,200,1,0 // vbroadcastss 0x1c883(%rip),%ymm10 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,21,67,203,1,0 // vbroadcastss 0x1cb43(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -30758,7 +31130,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,91,200,1,0 // vbroadcastss 0x1c85b(%rip),%ymm8 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,5,27,203,1,0 // vbroadcastss 0x1cb1b(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30799,7 +31171,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,151,198,1,0 // vbroadcastss 0x1c697(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,87,201,1,0 // vbroadcastss 0x1c957(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -30836,9 +31208,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,127,199,1,0 // vbroadcastss 0x1c77f(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,63,202,1,0 // vbroadcastss 0x1ca3f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,22,198,1,0 // vbroadcastss 0x1c616(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,214,200,1,0 // vbroadcastss 0x1c8d6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30849,7 +31221,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,246,197,1,0 // vbroadcastss 0x1c5f6(%rip),%ymm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,5,182,200,1,0 // vbroadcastss 0x1c8b6(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -30861,9 +31233,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,54,199,1,0 // vbroadcastss 0x1c736(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,246,201,1,0 // vbroadcastss 0x1c9f6(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,204,197,1,0 // vbroadcastss 0x1c5cc(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,140,200,1,0 // vbroadcastss 0x1c88c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30874,7 +31246,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,172,197,1,0 // vbroadcastss 0x1c5ac(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,108,200,1,0 // vbroadcastss 0x1c86c(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -30886,14 +31258,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,239,198,1,0 // vbroadcastss 0x1c6ef(%rip),%ymm0 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,5,175,201,1,0 // vbroadcastss 0x1c9af(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,130,197,1,0 // vbroadcastss 0x1c582(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,66,200,1,0 // vbroadcastss 0x1c842(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,211,198,1,0 // vbroadcastss 0x1c6d3(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,147,201,1,0 // vbroadcastss 0x1c993(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,209,197,1,0 // vbroadcastss 0x1c5d1(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,145,200,1,0 // vbroadcastss 0x1c891(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -30905,19 +31277,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,156,198,1,0 // vbroadcastss 0x1c69c(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,92,201,1,0 // vbroadcastss 0x1c95c(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,51,197,1,0 // vbroadcastss 0x1c533(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,243,199,1,0 // vbroadcastss 0x1c7f3(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,145,198,1,0 // vbroadcastss 0x1c691(%rip),%ymm9 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,81,201,1,0 // vbroadcastss 0x1c951(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,127,198,1,0 // vbroadcastss 0x1c67f(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,63,201,1,0 // vbroadcastss 0x1c93f(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,0,197,1,0 // vbroadcastss 0x1c500(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,192,199,1,0 // vbroadcastss 0x1c7c0(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,97,198,1,0 // vbroadcastss 0x1c661(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,33,201,1,0 // vbroadcastss 0x1c921(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30928,17 +31300,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,209,196,1,0 // vbroadcastss 0x1c4d1(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,145,199,1,0 // vbroadcastss 0x1c791(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,47,198,1,0 // vbroadcastss 0x1c62f(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,239,200,1,0 // vbroadcastss 0x1c8ef(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,29,198,1,0 // vbroadcastss 0x1c61d(%rip),%ymm11 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,8,198,1,0 // vbroadcastss 0x1c608(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,200,200,1,0 // vbroadcastss 0x1c8c8(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30949,13 +31321,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,228,197,1,0 // vbroadcastss 0x1c5e4(%rip),%ymm0 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,5,164,200,1,0 // vbroadcastss 0x1c8a4(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,201,197,1,0 // vbroadcastss 0x1c5c9(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,137,200,1,0 // vbroadcastss 0x1c889(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,199,196,1,0 // vbroadcastss 0x1c4c7(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,135,199,1,0 // vbroadcastss 0x1c787(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -30967,14 +31339,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,150,197,1,0 // vbroadcastss 0x1c596(%rip),%ymm1 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,13,86,200,1,0 // vbroadcastss 0x1c856(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,40,196,1,0 // vbroadcastss 0x1c428(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,232,198,1,0 // vbroadcastss 0x1c6e8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,121,197,1,0 // vbroadcastss 0x1c579(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,57,200,1,0 // vbroadcastss 0x1c839(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,119,196,1,0 // vbroadcastss 0x1c477(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,55,199,1,0 // vbroadcastss 0x1c737(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -30986,19 +31358,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,66,197,1,0 // vbroadcastss 0x1c542(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,2,200,1,0 // vbroadcastss 0x1c802(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,216,195,1,0 // vbroadcastss 0x1c3d8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,152,198,1,0 // vbroadcastss 0x1c698(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,54,197,1,0 // vbroadcastss 0x1c536(%rip),%ymm9 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,246,199,1,0 // vbroadcastss 0x1c7f6(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,36,197,1,0 // vbroadcastss 0x1c524(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,228,199,1,0 // vbroadcastss 0x1c7e4(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,165,195,1,0 // vbroadcastss 0x1c3a5(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,101,198,1,0 // vbroadcastss 0x1c665(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,6,197,1,0 // vbroadcastss 0x1c506(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,198,199,1,0 // vbroadcastss 0x1c7c6(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -31009,17 +31381,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,118,195,1,0 // vbroadcastss 0x1c376(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,54,198,1,0 // vbroadcastss 0x1c636(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,211,196,1,0 // vbroadcastss 0x1c4d3(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,147,199,1,0 // vbroadcastss 0x1c793(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,193,196,1,0 // vbroadcastss 0x1c4c1(%rip),%ymm11 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,129,199,1,0 // vbroadcastss 0x1c781(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,172,196,1,0 // vbroadcastss 0x1c4ac(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,108,199,1,0 // vbroadcastss 0x1c76c(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -31030,13 +31402,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,136,196,1,0 // vbroadcastss 0x1c488(%rip),%ymm1 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,13,72,199,1,0 // vbroadcastss 0x1c748(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,108,196,1,0 // vbroadcastss 0x1c46c(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,44,199,1,0 // vbroadcastss 0x1c72c(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,106,195,1,0 // vbroadcastss 0x1c36a(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,42,198,1,0 // vbroadcastss 0x1c62a(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -31182,7 +31554,7 @@ _sk_clut_3D_avx:
.byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,121,254,194 // vpaddd %xmm10,%xmm0,%xmm0
- .byte 196,98,121,24,29,2,194,1,0 // vbroadcastss 0x1c202(%rip),%xmm11 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,121,24,29,194,196,1,0 // vbroadcastss 0x1c4c2(%rip),%xmm11 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,121,64,203 // vpmulld %xmm11,%xmm0,%xmm1
.byte 196,193,249,126,201 // vmovq %xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
@@ -31216,7 +31588,7 @@ _sk_clut_3D_avx:
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,227,93,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
.byte 197,252,17,92,36,64 // vmovups %ymm3,0x40(%rsp)
- .byte 196,98,121,24,13,205,191,1,0 // vbroadcastss 0x1bfcd(%rip),%xmm9 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,121,24,13,141,194,1,0 // vbroadcastss 0x1c28d(%rip),%xmm9 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,193,105,254,249 // vpaddd %xmm9,%xmm2,%xmm7
.byte 196,195,249,22,249,1 // vpextrq $0x1,%xmm7,%r9
.byte 196,193,249,126,250 // vmovq %xmm7,%r10
@@ -31244,7 +31616,7 @@ _sk_clut_3D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,254,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- .byte 196,98,121,24,37,64,191,1,0 // vbroadcastss 0x1bf40(%rip),%xmm12 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,121,24,37,0,194,1,0 // vbroadcastss 0x1c200(%rip),%xmm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2
.byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
.byte 196,193,249,126,210 // vmovq %xmm2,%r10
@@ -31272,7 +31644,7 @@ _sk_clut_3D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,105,33,213,48 // vinsertps $0x30,%xmm5,%xmm2,%xmm2
.byte 196,227,109,24,225,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- .byte 196,226,125,24,13,20,192,1,0 // vbroadcastss 0x1c014(%rip),%ymm1 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,226,125,24,13,212,194,1,0 // vbroadcastss 0x1c2d4(%rip),%ymm1 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 197,188,88,209 // vaddps %ymm1,%ymm8,%ymm2
.byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp)
.byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2
@@ -32027,7 +32399,7 @@ _sk_clut_4D_avx:
.byte 196,226,25,64,200 // vpmulld %xmm0,%xmm12,%xmm1
.byte 197,249,127,76,36,128 // vmovdqa %xmm1,-0x80(%rsp)
.byte 197,241,254,202 // vpaddd %xmm2,%xmm1,%xmm1
- .byte 196,98,121,24,61,194,176,1,0 // vbroadcastss 0x1b0c2(%rip),%xmm15 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,121,24,61,130,179,1,0 // vbroadcastss 0x1b382(%rip),%xmm15 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,113,64,247 // vpmulld %xmm15,%xmm1,%xmm6
.byte 196,193,249,126,241 // vmovq %xmm6,%r9
.byte 69,137,202 // mov %r9d,%r10d
@@ -32065,7 +32437,7 @@ _sk_clut_4D_avx:
.byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,99,53,24,247,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- .byte 196,98,121,24,21,117,174,1,0 // vbroadcastss 0x1ae75(%rip),%xmm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,121,24,21,53,177,1,0 // vbroadcastss 0x1b135(%rip),%xmm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,97,254,202 // vpaddd %xmm10,%xmm3,%xmm9
.byte 196,67,249,22,201,1 // vpextrq $0x1,%xmm9,%r9
.byte 196,65,249,126,202 // vmovq %xmm9,%r10
@@ -32093,7 +32465,7 @@ _sk_clut_4D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,220,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- .byte 196,98,121,24,13,232,173,1,0 // vbroadcastss 0x1ade8(%rip),%xmm9 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,121,24,13,168,176,1,0 // vbroadcastss 0x1b0a8(%rip),%xmm9 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
.byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
.byte 196,193,249,126,218 // vmovq %xmm3,%r10
@@ -32121,7 +32493,7 @@ _sk_clut_4D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4
.byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- .byte 196,226,125,24,37,188,174,1,0 // vbroadcastss 0x1aebc(%rip),%ymm4 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,226,125,24,37,124,177,1,0 // vbroadcastss 0x1b17c(%rip),%ymm4 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 197,148,88,220 // vaddps %ymm4,%ymm13,%ymm3
.byte 197,252,40,252 // vmovaps %ymm4,%ymm7
.byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
@@ -33551,7 +33923,7 @@ _sk_clut_4D_avx:
.byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2
.byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,204,143,1,0 // vbroadcastss 0x18fcc(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,140,146,1,0 // vbroadcastss 0x1928c(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,164,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm4
.byte 197,252,16,172,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm5
.byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6
@@ -33582,7 +33954,7 @@ _sk_start_pipeline_sse41:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 11f0b <_sk_start_pipeline_sse41+0xa1>
+ .byte 115,117 // jae 1223f <_sk_start_pipeline_sse41+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -33592,7 +33964,7 @@ _sk_start_pipeline_sse41:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,45 // ja 11ee7 <_sk_start_pipeline_sse41+0x7d>
+ .byte 119,45 // ja 1221b <_sk_start_pipeline_sse41+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -33606,10 +33978,10 @@ _sk_start_pipeline_sse41:
.byte 73,131,199,8 // add $0x8,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 11ebe <_sk_start_pipeline_sse41+0x54>
+ .byte 118,215 // jbe 121f2 <_sk_start_pipeline_sse41+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 11f02 <_sk_start_pipeline_sse41+0x98>
+ .byte 116,19 // je 12236 <_sk_start_pipeline_sse41+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -33618,7 +33990,7 @@ _sk_start_pipeline_sse41:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 11eb0 <_sk_start_pipeline_sse41+0x46>
+ .byte 117,165 // jne 121e4 <_sk_start_pipeline_sse41+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -33641,7 +34013,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,146,152,1,0 // movaps 0x19892(%rip),%xmm2 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,40,21,94,155,1,0 // movaps 0x19b5e(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -33650,7 +34022,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,129,152,1,0 // movaps 0x19881(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,77,155,1,0 // movaps 0x19b4d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -33670,14 +34042,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,79,152,1,0 // movdqa 0x1984f(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,27,155,1,0 // movdqa 0x19b1b(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,59,152,1,0 // movdqa 0x1983b(%rip),%xmm12 # 2b7f0 <_sk_overlay_sse2_8bit+0xe2f>
- .byte 102,68,15,111,45,66,152,1,0 // movdqa 0x19842(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,37,7,155,1,0 // movdqa 0x19b07(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b>
+ .byte 102,68,15,111,45,14,155,1,0 // movdqa 0x19b0e(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -33693,8 +34065,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,253,151,1,0 // mulps 0x197fd(%rip),%xmm8 # 2b810 <_sk_overlay_sse2_8bit+0xe4f>
- .byte 68,15,88,5,5,152,1,0 // addps 0x19805(%rip),%xmm8 # 2b820 <_sk_overlay_sse2_8bit+0xe5f>
+ .byte 68,15,89,5,201,154,1,0 // mulps 0x19ac9(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b>
+ .byte 68,15,88,5,209,154,1,0 // addps 0x19ad1(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -33736,7 +34108,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,59,151,1,0 // movaps 0x1973b(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,7,154,1,0 // movaps 0x19a07(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -33747,7 +34119,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,39,151,1,0 // movaps 0x19727(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,5,243,153,1,0 // movaps 0x199f3(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -33793,7 +34165,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,215,150,1,0 // movaps 0x196d7(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,163,153,1,0 // movaps 0x199a3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -33818,7 +34190,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,138,150,1,0 // movaps 0x1968a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,86,153,1,0 // movaps 0x19956(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -33865,7 +34237,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,30,150,1,0 // movaps 0x1961e(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,234,152,1,0 // movaps 0x198ea(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -33878,7 +34250,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,254,149,1,0 // movaps 0x195fe(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,202,152,1,0 // movaps 0x198ca(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -33895,7 +34267,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,209,149,1,0 // movaps 0x195d1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,157,152,1,0 // movaps 0x1989d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -33915,7 +34287,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,149,149,1,0 // movaps 0x19595(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,97,152,1,0 // movaps 0x19861(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -33943,7 +34315,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,89,149,1,0 // movaps 0x19559(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,37,152,1,0 // movaps 0x19825(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -33981,9 +34353,14 @@ HIDDEN _sk_plus__sse41
FUNCTION(_sk_plus__sse41)
_sk_plus__sse41:
.byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 68,15,40,5,166,151,1,0 // movaps 0x197a6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 65,15,93,208 // minps %xmm8,%xmm2
.byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 65,15,93,216 // minps %xmm8,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34018,7 +34395,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,126,148,1,0 // movaps 0x1947e(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,50,151,1,0 // movaps 0x19732(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -34066,7 +34443,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,217,147,1,0 // movaps 0x193d9(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,141,150,1,0 // movaps 0x1968d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34100,7 +34477,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,110,147,1,0 // movaps 0x1936e(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,34,150,1,0 // movaps 0x19622(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34137,7 +34514,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,248,146,1,0 // movaps 0x192f8(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,172,149,1,0 // movaps 0x195ac(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34165,7 +34542,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,168,146,1,0 // movaps 0x192a8(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,92,149,1,0 // movaps 0x1955c(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34177,7 +34554,7 @@ HIDDEN _sk_colorburn_sse41
.globl _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
- .byte 68,15,40,29,143,146,1,0 // movaps 0x1928f(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,29,67,149,1,0 // movaps 0x19543(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 68,15,92,231 // subps %xmm7,%xmm12
.byte 69,15,40,204 // movaps %xmm12,%xmm9
@@ -34261,7 +34638,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,89,145,1,0 // movaps 0x19159(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,13,148,1,0 // movaps 0x1940d(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -34343,7 +34720,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,36,144,1,0 // movaps 0x19024(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,216,146,1,0 // movaps 0x192d8(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -34426,7 +34803,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,249,142,1,0 // movaps 0x18ef9(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,173,145,1,0 // movaps 0x191ad(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -34511,7 +34888,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,192,141,1,0 // movaps 0x18dc0(%rip),%xmm1 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,13,116,144,1,0 // movaps 0x19074(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -34524,10 +34901,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,238,141,1,0 // movaps 0x18dee(%rip),%xmm13 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,45,162,144,1,0 // movaps 0x190a2(%rip),%xmm13 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,238,141,1,0 // movaps 0x18dee(%rip),%xmm12 # 2b840 <_sk_overlay_sse2_8bit+0xe7f>
+ .byte 68,15,40,37,162,144,1,0 // movaps 0x190a2(%rip),%xmm12 # 2be40 <_sk_overlay_sse2_8bit+0xe8b>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -34713,12 +35090,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,89,139,1,0 // movaps 0x18b59(%rip),%xmm0 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 15,40,5,13,142,1,0 // movaps 0x18e0d(%rip),%xmm0 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,94,139,1,0 // movaps 0x18b5e(%rip),%xmm2 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,21,18,142,1,0 // movaps 0x18e12(%rip),%xmm2 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,95,139,1,0 // movaps 0x18b5f(%rip),%xmm14 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,53,19,142,1,0 // movaps 0x18e13(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -34801,7 +35178,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,115,137,1,0 // movaps 0x18973(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,39,140,1,0 // movaps 0x18c27(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -34895,14 +35272,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,157,136,1,0 // movaps 0x1889d(%rip),%xmm2 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 15,40,21,81,139,1,0 // movaps 0x18b51(%rip),%xmm2 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,160,136,1,0 // movaps 0x188a0(%rip),%xmm1 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,13,84,139,1,0 // movaps 0x18b54(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,159,136,1,0 // movaps 0x1889f(%rip),%xmm13 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,45,83,139,1,0 // movaps 0x18b53(%rip),%xmm13 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -34983,7 +35360,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,181,134,1,0 // movaps 0x186b5(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,105,137,1,0 // movaps 0x18969(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -35038,14 +35415,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,112,134,1,0 // movaps 0x18670(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,13,36,137,1,0 // movaps 0x18924(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,112,134,1,0 // movaps 0x18670(%rip),%xmm10 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,21,36,137,1,0 // movaps 0x18924(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,109,134,1,0 // movaps 0x1866d(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,29,33,137,1,0 // movaps 0x18921(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -35130,7 +35507,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,121,132,1,0 // movaps 0x18479(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,45,135,1,0 // movaps 0x1872d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -35182,13 +35559,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,65,132,1,0 // movaps 0x18441(%rip),%xmm8 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,5,245,134,1,0 // movaps 0x186f5(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,69,132,1,0 // movaps 0x18445(%rip),%xmm10 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,21,249,134,1,0 // movaps 0x186f9(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,67,132,1,0 // movaps 0x18443(%rip),%xmm12 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,37,247,134,1,0 // movaps 0x186f7(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -35273,7 +35650,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,73,130,1,0 // movaps 0x18249(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,5,253,132,1,0 // movaps 0x184fd(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -35318,23 +35695,23 @@ _sk_srcover_rgba_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,219,0,0,0 // jne 136ef <_sk_srcover_rgba_8888_sse41+0xfb>
+ .byte 15,133,219,0,0,0 // jne 13a3b <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,91,130,1,0 // movdqa 0x1825b(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,15,133,1,0 // movdqa 0x1850f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,87,130,1,0 // pshufb 0x18257(%rip),%xmm5 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,45,11,133,1,0 // pshufb 0x1850b(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,87,130,1,0 // pshufb 0x18257(%rip),%xmm6 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,53,11,133,1,0 // pshufb 0x1850b(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,116,129,1,0 // movaps 0x18174(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,40,132,1,0 // movaps 0x18428(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,72,130,1,0 // movaps 0x18248(%rip),%xmm12 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,37,252,132,1,0 // movaps 0x184fc(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -35360,7 +35737,7 @@ _sk_srcover_rgba_8888_sse41:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,88 // jne 1372d <_sk_srcover_rgba_8888_sse41+0x139>
+ .byte 117,88 // jne 13a79 <_sk_srcover_rgba_8888_sse41+0x139>
.byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -35371,32 +35748,32 @@ _sk_srcover_rgba_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,91 // je 13757 <_sk_srcover_rgba_8888_sse41+0x163>
+ .byte 116,91 // je 13aa3 <_sk_srcover_rgba_8888_sse41+0x163>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 1371c <_sk_srcover_rgba_8888_sse41+0x128>
+ .byte 116,22 // je 13a68 <_sk_srcover_rgba_8888_sse41+0x128>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,10,255,255,255 // jne 1361a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 15,133,10,255,255,255 // jne 13966 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,237,254,255,255 // jmpq 1361a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,237,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,40 // je 13762 <_sk_srcover_rgba_8888_sse41+0x16e>
+ .byte 116,40 // je 13aae <_sk_srcover_rgba_8888_sse41+0x16e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 1374f <_sk_srcover_rgba_8888_sse41+0x15b>
+ .byte 116,15 // je 13a9b <_sk_srcover_rgba_8888_sse41+0x15b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,149 // jne 136db <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 117,149 // jne 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,58,22,68,129,8,2 // pextrd $0x2,%xmm0,0x8(%r9,%rax,4)
.byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4)
- .byte 235,132 // jmp 136db <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 235,132 // jmp 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,184,254,255,255 // jmpq 1361a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,184,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4)
- .byte 233,110,255,255,255 // jmpq 136db <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 233,110,255,255,255 // jmpq 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
HIDDEN _sk_clamp_0_sse41
.globl _sk_clamp_0_sse41
@@ -35414,7 +35791,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,67,128,1,0 // movaps 0x18043(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,247,130,1,0 // movaps 0x182f7(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -35426,7 +35803,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,40,128,1,0 // minps 0x18028(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,29,220,130,1,0 // minps 0x182dc(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -35437,7 +35814,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,20,128,1,0 // minps 0x18014(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,61,200,130,1,0 // minps 0x182c8(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -35472,7 +35849,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,208,127,1,0 // movaps 0x17fd0(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,132,130,1,0 // movaps 0x18284(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -35534,7 +35911,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,90,127,1,0 // movaps 0x17f5a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,14,130,1,0 // movaps 0x1820e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -35548,20 +35925,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,37,128,1,0 // movaps 0x18025(%rip),%xmm11 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,29,217,130,1,0 // movaps 0x182d9(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,157,127,1,0 // movaps 0x17f9d(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,37,81,130,1,0 // movaps 0x18251(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,13,128,1,0 // movaps 0x1800d(%rip),%xmm13 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,45,193,130,1,0 // movaps 0x182c1(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,13,128,1,0 // movaps 0x1800d(%rip),%xmm14 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,53,193,130,1,0 // movaps 0x182c1(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,17,128,1,0 // movaps 0x18011(%rip),%xmm15 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,61,197,130,1,0 // movaps 0x182c5(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -35598,19 +35975,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,92,127,1,0 // movaps 0x17f5c(%rip),%xmm11 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,29,16,130,1,0 // movaps 0x18210(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,213,126,1,0 // movaps 0x17ed5(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,37,137,129,1,0 // movaps 0x18189(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,73,127,1,0 // movaps 0x17f49(%rip),%xmm13 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,45,253,129,1,0 // movaps 0x181fd(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,74,127,1,0 // movaps 0x17f4a(%rip),%xmm14 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,53,254,129,1,0 // movaps 0x181fe(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,78,127,1,0 // movaps 0x17f4e(%rip),%xmm15 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,61,2,130,1,0 // movaps 0x18202(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -35654,22 +36031,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,194,126,1,0 // movaps 0x17ec2(%rip),%xmm11 # 2b900 <_sk_overlay_sse2_8bit+0xf3f>
+ .byte 68,15,40,29,118,129,1,0 // movaps 0x18176(%rip),%xmm11 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,194,126,1,0 // movaps 0x17ec2(%rip),%xmm12 # 2b910 <_sk_overlay_sse2_8bit+0xf4f>
+ .byte 68,15,40,37,118,129,1,0 // movaps 0x18176(%rip),%xmm12 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,194,126,1,0 // movaps 0x17ec2(%rip),%xmm10 # 2b920 <_sk_overlay_sse2_8bit+0xf5f>
+ .byte 68,15,40,21,118,129,1,0 // movaps 0x18176(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,194,126,1,0 // movaps 0x17ec2(%rip),%xmm13 # 2b930 <_sk_overlay_sse2_8bit+0xf6f>
+ .byte 68,15,40,45,118,129,1,0 // movaps 0x18176(%rip),%xmm13 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,198,126,1,0 // movaps 0x17ec6(%rip),%xmm14 # 2b940 <_sk_overlay_sse2_8bit+0xf7f>
+ .byte 68,15,40,53,122,129,1,0 // movaps 0x1817a(%rip),%xmm14 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,194,126,1,0 // movaps 0x17ec2(%rip),%xmm15 # 2b950 <_sk_overlay_sse2_8bit+0xf8f>
+ .byte 68,15,40,61,118,129,1,0 // movaps 0x18176(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -35714,15 +36091,17 @@ FUNCTION(_sk_rgb_to_hsl_sse41)
_sk_rgb_to_hsl_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,95,194 // maxps %xmm2,%xmm0
.byte 69,15,40,216 // movaps %xmm8,%xmm11
- .byte 69,15,95,217 // maxps %xmm9,%xmm11
- .byte 68,15,95,218 // maxps %xmm2,%xmm11
+ .byte 68,15,95,216 // maxps %xmm0,%xmm11
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,93,194 // minps %xmm2,%xmm0
.byte 69,15,40,224 // movaps %xmm8,%xmm12
- .byte 69,15,93,225 // minps %xmm9,%xmm12
- .byte 68,15,93,226 // minps %xmm2,%xmm12
+ .byte 68,15,93,224 // minps %xmm0,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,127,124,1,0 // movaps 0x17c7f(%rip),%xmm14 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,53,45,127,1,0 // movaps 0x17f2d(%rip),%xmm14 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -35731,27 +36110,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,230,125,1,0 // andps 0x17de6(%rip),%xmm15 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 68,15,84,61,148,128,1,0 // andps 0x18094(%rip),%xmm15 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,217,125,1,0 // movaps 0x17dd9(%rip),%xmm13 # 2b970 <_sk_overlay_sse2_8bit+0xfaf>
+ .byte 68,15,40,45,135,128,1,0 // movaps 0x18087(%rip),%xmm13 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,213,125,1,0 // addps 0x17dd5(%rip),%xmm8 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 68,15,88,5,131,128,1,0 // addps 0x18083(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,205,125,1,0 // mulps 0x17dcd(%rip),%xmm8 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 68,15,89,5,123,128,1,0 // mulps 0x1807b(%rip),%xmm8 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,225,123,1,0 // movaps 0x17be1(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,40,5,143,126,1,0 // movaps 0x17e8f(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -35773,7 +36152,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,151,123,1,0 // movaps 0x17b97(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,69,126,1,0 // movaps 0x17e45(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -35786,19 +36165,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,66,125,1,0 // movaps 0x17d42(%rip),%xmm14 # 2b9a0 <_sk_overlay_sse2_8bit+0xfdf>
+ .byte 68,15,40,53,240,127,1,0 // movaps 0x17ff0(%rip),%xmm14 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,59,125,1,0 // movaps 0x17d3b(%rip),%xmm11 # 2b9b0 <_sk_overlay_sse2_8bit+0xfef>
+ .byte 68,15,40,29,233,127,1,0 // movaps 0x17fe9(%rip),%xmm11 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,212,124,1,0 // movaps 0x17cd4(%rip),%xmm7 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 15,40,61,130,127,1,0 // movaps 0x17f82(%rip),%xmm7 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,229,124,1,0 // movaps 0x17ce5(%rip),%xmm3 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 15,40,29,147,127,1,0 // movaps 0x17f93(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -35808,7 +36187,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,196,124,1,0 // movaps 0x17cc4(%rip),%xmm12 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 68,15,40,37,114,127,1,0 // movaps 0x17f72(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -35842,7 +36221,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,92,124,1,0 // addps 0x17c5c(%rip),%xmm10 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,88,21,10,127,1,0 // addps 0x17f0a(%rip),%xmm10 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -35897,11 +36276,11 @@ _sk_scale_u8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,52 // jne 13e4b <_sk_scale_u8_sse41+0x4c>
+ .byte 117,52 // jne 1419d <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,89,122,1,0 // pand 0x17a59(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,7,125,1,0 // pand 0x17d07(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,157,123,1,0 // mulps 0x17b9d(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,75,126,1,0 // mulps 0x17e4b(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -35912,12 +36291,12 @@ _sk_scale_u8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 13e93 <_sk_scale_u8_sse41+0x94>
+ .byte 116,59 // je 141e5 <_sk_scale_u8_sse41+0x94>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 13e7a <_sk_scale_u8_sse41+0x7b>
+ .byte 116,23 // je 141cc <_sk_scale_u8_sse41+0x7b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,181 // jne 13e1e <_sk_scale_u8_sse41+0x1f>
+ .byte 117,181 // jne 14170 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -35925,10 +36304,77 @@ _sk_scale_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 235,139 // jmp 13e1e <_sk_scale_u8_sse41+0x1f>
+ .byte 235,139 // jmp 14170 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,124,255,255,255 // jmpq 13e1e <_sk_scale_u8_sse41+0x1f>
+ .byte 233,124,255,255,255 // jmpq 14170 <_sk_scale_u8_sse41+0x1f>
+
+HIDDEN _sk_scale_565_sse41
+.globl _sk_scale_565_sse41
+FUNCTION(_sk_scale_565_sse41)
+_sk_scale_565_sse41:
+ .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,159,0,0,0 // jne 142b7 <_sk_scale_565_sse41+0xc3>
+ .byte 102,71,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm11
+ .byte 102,15,111,5,185,125,1,0 // movdqa 0x17db9(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,65,15,219,195 // pand %xmm11,%xmm0
+ .byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
+ .byte 68,15,89,13,184,125,1,0 // mulps 0x17db8(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,5,192,125,1,0 // movdqa 0x17dc0(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,65,15,219,195 // pand %xmm11,%xmm0
+ .byte 68,15,91,208 // cvtdq2ps %xmm0,%xmm10
+ .byte 68,15,89,21,191,125,1,0 // mulps 0x17dbf(%rip),%xmm10 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,29,198,125,1,0 // pand 0x17dc6(%rip),%xmm11 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
+ .byte 68,15,89,29,202,125,1,0 // mulps 0x17dca(%rip),%xmm11 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 69,15,40,226 // movaps %xmm10,%xmm12
+ .byte 69,15,93,227 // minps %xmm11,%xmm12
+ .byte 69,15,40,233 // movaps %xmm9,%xmm13
+ .byte 69,15,93,236 // minps %xmm12,%xmm13
+ .byte 69,15,40,242 // movaps %xmm10,%xmm14
+ .byte 69,15,95,243 // maxps %xmm11,%xmm14
+ .byte 69,15,40,225 // movaps %xmm9,%xmm12
+ .byte 69,15,95,230 // maxps %xmm14,%xmm12
+ .byte 102,69,15,56,20,229 // blendvps %xmm0,%xmm13,%xmm12
+ .byte 69,15,89,200 // mulps %xmm8,%xmm9
+ .byte 68,15,89,209 // mulps %xmm1,%xmm10
+ .byte 68,15,89,218 // mulps %xmm2,%xmm11
+ .byte 68,15,89,227 // mulps %xmm3,%xmm12
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,40,202 // movaps %xmm10,%xmm1
+ .byte 65,15,40,211 // movaps %xmm11,%xmm2
+ .byte 65,15,40,220 // movaps %xmm12,%xmm3
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,3 // and $0x3,%r10b
+ .byte 65,128,250,1 // cmp $0x1,%r10b
+ .byte 116,60 // je 14300 <_sk_scale_565_sse41+0x10c>
+ .byte 102,69,15,239,219 // pxor %xmm11,%xmm11
+ .byte 65,128,250,2 // cmp $0x2,%r10b
+ .byte 116,26 // je 142e9 <_sk_scale_565_sse41+0xf5>
+ .byte 65,128,250,3 // cmp $0x3,%r10b
+ .byte 15,133,70,255,255,255 // jne 1421f <_sk_scale_565_sse41+0x2b>
+ .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 102,68,15,112,216,69 // pshufd $0x45,%xmm0,%xmm11
+ .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
+ .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
+ .byte 102,68,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm11
+ .byte 233,31,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b>
+ .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
+ .byte 102,68,15,110,216 // movd %eax,%xmm11
+ .byte 233,16,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b>
HIDDEN _sk_lerp_1_float_sse41
.globl _sk_lerp_1_float_sse41
@@ -35963,11 +36409,11 @@ _sk_lerp_u8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 13f3a <_sk_lerp_u8_sse41+0x60>
+ .byte 117,72 // jne 143a7 <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,126,121,1,0 // pand 0x1797e(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,17,123,1,0 // pand 0x17b11(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,194,122,1,0 // mulps 0x17ac2(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,85,124,1,0 // mulps 0x17c55(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -35985,12 +36431,12 @@ _sk_lerp_u8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,62 // je 13f85 <_sk_lerp_u8_sse41+0xab>
+ .byte 116,62 // je 143f2 <_sk_lerp_u8_sse41+0xab>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 13f69 <_sk_lerp_u8_sse41+0x8f>
+ .byte 116,23 // je 143d6 <_sk_lerp_u8_sse41+0x8f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,161 // jne 13ef9 <_sk_lerp_u8_sse41+0x1f>
+ .byte 117,161 // jne 14366 <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -35998,15 +36444,16 @@ _sk_lerp_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 233,116,255,255,255 // jmpq 13ef9 <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,116,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,101,255,255,255 // jmpq 13ef9 <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,101,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f>
HIDDEN _sk_lerp_565_sse41
.globl _sk_lerp_565_sse41
FUNCTION(_sk_lerp_565_sse41)
_sk_lerp_565_sse41:
+ .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,99,80,8 // movslq 0x8(%rax),%r10
.byte 76,99,201 // movslq %ecx,%r9
@@ -36015,59 +36462,62 @@ _sk_lerp_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,152,0,0,0 // jne 1404b <_sk_lerp_565_sse41+0xb7>
+ .byte 15,133,165,0,0,0 // jne 144ca <_sk_lerp_565_sse41+0xc9>
.byte 102,71,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm10
- .byte 102,68,15,111,5,29,122,1,0 // movdqa 0x17a1d(%rip),%xmm8 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
- .byte 102,69,15,219,194 // pand %xmm10,%xmm8
- .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,28,122,1,0 // mulps 0x17a1c(%rip),%xmm8 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,68,15,111,13,35,122,1,0 // movdqa 0x17a23(%rip),%xmm9 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
- .byte 102,69,15,219,202 // pand %xmm10,%xmm9
- .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,34,122,1,0 // mulps 0x17a22(%rip),%xmm9 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,68,15,219,21,41,122,1,0 // pand 0x17a29(%rip),%xmm10 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 102,15,111,5,172,123,1,0 // movdqa 0x17bac(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,65,15,219,194 // pand %xmm10,%xmm0
+ .byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
+ .byte 68,15,89,13,171,123,1,0 // mulps 0x17bab(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,5,179,123,1,0 // movdqa 0x17bb3(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,65,15,219,194 // pand %xmm10,%xmm0
+ .byte 68,15,91,216 // cvtdq2ps %xmm0,%xmm11
+ .byte 68,15,89,29,178,123,1,0 // mulps 0x17bb2(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,21,185,123,1,0 // pand 0x17bb9(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,45,122,1,0 // mulps 0x17a2d(%rip),%xmm10 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
- .byte 15,92,196 // subps %xmm4,%xmm0
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 68,15,89,21,189,123,1,0 // mulps 0x17bbd(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 15,92,205 // subps %xmm5,%xmm1
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 69,15,93,218 // minps %xmm10,%xmm11
+ .byte 69,15,40,233 // movaps %xmm9,%xmm13
+ .byte 68,15,92,196 // subps %xmm4,%xmm8
+ .byte 69,15,89,193 // mulps %xmm9,%xmm8
+ .byte 69,15,93,203 // minps %xmm11,%xmm9
+ .byte 69,15,95,226 // maxps %xmm10,%xmm12
+ .byte 69,15,95,236 // maxps %xmm12,%xmm13
+ .byte 102,69,15,56,20,233 // blendvps %xmm0,%xmm9,%xmm13
+ .byte 68,15,88,196 // addps %xmm4,%xmm8
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 65,15,89,210 // mulps %xmm10,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,92,223 // subps %xmm7,%xmm3
- .byte 68,15,89,195 // mulps %xmm3,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 68,15,89,203 // mulps %xmm3,%xmm9
- .byte 68,15,88,207 // addps %xmm7,%xmm9
- .byte 65,15,89,218 // mulps %xmm10,%xmm3
+ .byte 65,15,89,221 // mulps %xmm13,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,95,203 // maxps %xmm3,%xmm9
- .byte 69,15,95,193 // maxps %xmm9,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,62 // je 14096 <_sk_lerp_565_sse41+0x102>
+ .byte 116,60 // je 14513 <_sk_lerp_565_sse41+0x112>
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,27 // je 1407e <_sk_lerp_565_sse41+0xea>
+ .byte 116,26 // je 144fc <_sk_lerp_565_sse41+0xfb>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,77,255,255,255 // jne 13fba <_sk_lerp_565_sse41+0x26>
+ .byte 15,133,64,255,255,255 // jne 1442c <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
- .byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10
- .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8
- .byte 102,69,15,56,51,192 // pmovzxwd %xmm8,%xmm8
- .byte 102,69,15,58,14,208,15 // pblendw $0xf,%xmm8,%xmm10
- .byte 233,36,255,255,255 // jmpq 13fba <_sk_lerp_565_sse41+0x26>
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 102,68,15,112,208,69 // pshufd $0x45,%xmm0,%xmm10
+ .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
+ .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
+ .byte 102,68,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm10
+ .byte 233,25,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,68,15,110,208 // movd %eax,%xmm10
- .byte 233,21,255,255,255 // jmpq 13fba <_sk_lerp_565_sse41+0x26>
+ .byte 233,10,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b>
HIDDEN _sk_load_tables_sse41
.globl _sk_load_tables_sse41
@@ -36076,12 +36526,12 @@ _sk_load_tables_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,24,1,0,0 // jne 141cb <_sk_load_tables_sse41+0x126>
+ .byte 15,133,24,1,0,0 // jne 14648 <_sk_load_tables_sse41+0x126>
.byte 243,69,15,111,4,145 // movdqu (%r9,%rdx,4),%xmm8
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,186,119,1,0 // movdqa 0x177ba(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,61,121,1,0 // movdqa 0x1793d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -36096,7 +36546,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0
.byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,117,119,1,0 // pshufb 0x17775(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,13,248,120,1,0 // pshufb 0x178f8(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,211 // movzbl %bl,%r10d
@@ -36111,7 +36561,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,72,24 // mov 0x18(%rax),%r9
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,49,119,1,0 // pshufb 0x17731(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,21,180,120,1,0 // pshufb 0x178b4(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,208 // movzbl %al,%r10d
@@ -36126,7 +36576,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,14,120,1,0 // mulps 0x1780e(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,145,121,1,0 // mulps 0x17991(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -36135,19 +36585,19 @@ _sk_load_tables_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,52 // je 1420c <_sk_load_tables_sse41+0x167>
+ .byte 116,52 // je 14689 <_sk_load_tables_sse41+0x167>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 141fa <_sk_load_tables_sse41+0x155>
+ .byte 116,23 // je 14677 <_sk_load_tables_sse41+0x155>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,204,254,255,255 // jne 140b9 <_sk_load_tables_sse41+0x14>
+ .byte 15,133,204,254,255,255 // jne 14536 <_sk_load_tables_sse41+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8
.byte 243,65,15,126,4,145 // movq (%r9,%rdx,4),%xmm0
.byte 102,68,15,58,14,192,15 // pblendw $0xf,%xmm0,%xmm8
- .byte 233,173,254,255,255 // jmpq 140b9 <_sk_load_tables_sse41+0x14>
+ .byte 233,173,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14>
.byte 102,69,15,110,4,145 // movd (%r9,%rdx,4),%xmm8
- .byte 233,162,254,255,255 // jmpq 140b9 <_sk_load_tables_sse41+0x14>
+ .byte 233,162,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14>
HIDDEN _sk_load_tables_u16_be_sse41
.globl _sk_load_tables_u16_be_sse41
@@ -36157,7 +36607,7 @@ _sk_load_tables_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,99,1,0,0 // jne 14390 <_sk_load_tables_u16_be_sse41+0x179>
+ .byte 15,133,99,1,0,0 // jne 1480d <_sk_load_tables_u16_be_sse41+0x179>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 243,67,15,111,76,81,16 // movdqu 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -36169,7 +36619,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,220,119,1,0 // movdqa 0x177dc(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,5,95,121,1,0 // movdqa 0x1795f(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -36187,7 +36637,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,139,119,1,0 // pshufb 0x1778b(%rip),%xmm1 # 2ba50 <_sk_overlay_sse2_8bit+0x108f>
+ .byte 102,15,56,0,13,14,121,1,0 // pshufb 0x1790e(%rip),%xmm1 # 2c050 <_sk_overlay_sse2_8bit+0x109b>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -36223,7 +36673,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,217,118,1,0 // mulps 0x176d9(%rip),%xmm3 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 15,89,29,92,120,1,0 // mulps 0x1785c(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -36231,16 +36681,16 @@ _sk_load_tables_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 143a9 <_sk_load_tables_u16_be_sse41+0x192>
+ .byte 117,13 // jne 14826 <_sk_load_tables_u16_be_sse41+0x192>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,145,254,255,255 // jmpq 1423a <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,145,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,124,254,255,255 // jb 1423a <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 15,130,124,254,255,255 // jb 146b7 <_sk_load_tables_u16_be_sse41+0x23>
.byte 243,67,15,126,76,81,16 // movq 0x10(%r9,%r10,2),%xmm1
- .byte 233,112,254,255,255 // jmpq 1423a <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,112,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse41
.globl _sk_load_tables_rgb_u16_be_sse41
@@ -36250,7 +36700,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,83,1,0,0 // jne 1452f <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ .byte 15,133,83,1,0,0 // jne 149ac <_sk_load_tables_rgb_u16_be_sse41+0x165>
.byte 243,67,15,111,20,81 // movdqu (%r9,%r10,2),%xmm2
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -36265,7 +36715,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,30,118,1,0 // movdqa 0x1761e(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,5,161,119,1,0 // movdqa 0x177a1(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -36283,7 +36733,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,237,117,1,0 // pshufb 0x175ed(%rip),%xmm1 # 2ba70 <_sk_overlay_sse2_8bit+0x10af>
+ .byte 102,15,56,0,13,112,119,1,0 // pshufb 0x17770(%rip),%xmm1 # 2c070 <_sk_overlay_sse2_8bit+0x10bb>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -36314,7 +36764,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,168,114,1,0 // movaps 0x172a8(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,43,116,1,0 // movaps 0x1742b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -36323,21 +36773,21 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,67,15,196,84,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 14555 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ .byte 117,14 // jne 149d2 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
- .byte 233,173,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,173,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,71,15,110,76,81,6 // movd 0x6(%r9,%r10,2),%xmm9
.byte 102,71,15,196,76,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 14586 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ .byte 114,24 // jb 14a03 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,124,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,124,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,115,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,115,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
HIDDEN _sk_byte_tables_sse41
.globl _sk_byte_tables_sse41
@@ -36348,7 +36798,7 @@ _sk_byte_tables_sse41:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,16,115,1,0 // movaps 0x17310(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,147,116,1,0 // movaps 0x17493(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
@@ -36367,7 +36817,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,209,115,1,0 // movaps 0x173d1(%rip),%xmm9 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,13,84,117,1,0 // movaps 0x17554(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -36463,7 +36913,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,57,114,1,0 // movaps 0x17239(%rip),%xmm9 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,13,188,115,1,0 // movaps 0x173bc(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -36650,31 +37100,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,33,112,1,0 // mulps 0x17021(%rip),%xmm8 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,41,112,1,0 // andps 0x17029(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,81,109,1,0 // orps 0x16d51(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,5,41,112,1,0 // addps 0x17029(%rip),%xmm8 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,49,112,1,0 // movaps 0x17031(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,5,164,113,1,0 // mulps 0x171a4(%rip),%xmm8 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,172,113,1,0 // andps 0x171ac(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,212,110,1,0 // orps 0x16ed4(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,5,172,113,1,0 // addps 0x171ac(%rip),%xmm8 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,180,113,1,0 // movaps 0x171b4(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,49,112,1,0 // addps 0x17031(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,57,112,1,0 // movaps 0x17039(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,180,113,1,0 // addps 0x171b4(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,188,113,1,0 // movaps 0x171bc(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,38,112,1,0 // addps 0x17026(%rip),%xmm8 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,21,46,112,1,0 // movaps 0x1702e(%rip),%xmm10 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,5,169,113,1,0 // addps 0x171a9(%rip),%xmm8 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,46,112,1,0 // movaps 0x1702e(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,50,112,1,0 // movaps 0x17032(%rip),%xmm11 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,29,181,113,1,0 // movaps 0x171b5(%rip),%xmm11 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,50,112,1,0 // mulps 0x17032(%rip),%xmm11 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,29,181,113,1,0 // mulps 0x171b5(%rip),%xmm11 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -36682,7 +37132,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,185,108,1,0 // minps 0x16cb9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,93,5,60,110,1,0 // minps 0x16e3c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36712,31 +37162,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,250,110,1,0 // mulps 0x16efa(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,29,2,111,1,0 // andps 0x16f02(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,29,42,108,1,0 // orps 0x16c2a(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,37,2,111,1,0 // addps 0x16f02(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 15,40,13,11,111,1,0 // movaps 0x16f0b(%rip),%xmm1 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,37,125,112,1,0 // mulps 0x1707d(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,29,133,112,1,0 // andps 0x17085(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,29,173,109,1,0 // orps 0x16dad(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,37,133,112,1,0 // addps 0x17085(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 15,40,13,142,112,1,0 // movaps 0x1708e(%rip),%xmm1 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,11,111,1,0 // addps 0x16f0b(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 15,40,13,20,111,1,0 // movaps 0x16f14(%rip),%xmm1 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,29,142,112,1,0 // addps 0x1708e(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 15,40,13,151,112,1,0 // movaps 0x17097(%rip),%xmm1 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,1,111,1,0 // addps 0x16f01(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 15,40,13,10,111,1,0 // movaps 0x16f0a(%rip),%xmm1 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,37,132,112,1,0 // addps 0x17084(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,13,141,112,1,0 // movaps 0x1708d(%rip),%xmm1 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,10,111,1,0 // movaps 0x16f0a(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,141,112,1,0 // movaps 0x1708d(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,15,111,1,0 // movaps 0x16f0f(%rip),%xmm1 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 15,40,13,146,112,1,0 // movaps 0x17092(%rip),%xmm1 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,16,111,1,0 // mulps 0x16f10(%rip),%xmm1 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,89,13,147,112,1,0 // mulps 0x17093(%rip),%xmm1 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -36744,7 +37194,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,155,107,1,0 // minps 0x16b9b(%rip),%xmm1 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,13,30,109,1,0 // minps 0x16d1e(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36774,31 +37224,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,220,109,1,0 // mulps 0x16ddc(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,29,228,109,1,0 // andps 0x16de4(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,29,12,107,1,0 // orps 0x16b0c(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,37,228,109,1,0 // addps 0x16de4(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 15,40,21,237,109,1,0 // movaps 0x16ded(%rip),%xmm2 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,37,95,111,1,0 // mulps 0x16f5f(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,29,103,111,1,0 // andps 0x16f67(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,29,143,108,1,0 // orps 0x16c8f(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,37,103,111,1,0 // addps 0x16f67(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 15,40,21,112,111,1,0 // movaps 0x16f70(%rip),%xmm2 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,237,109,1,0 // addps 0x16ded(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 15,40,21,246,109,1,0 // movaps 0x16df6(%rip),%xmm2 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,29,112,111,1,0 // addps 0x16f70(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 15,40,21,121,111,1,0 // movaps 0x16f79(%rip),%xmm2 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,227,109,1,0 // addps 0x16de3(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 15,40,21,236,109,1,0 // movaps 0x16dec(%rip),%xmm2 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,37,102,111,1,0 // addps 0x16f66(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm2 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,236,109,1,0 // movaps 0x16dec(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,241,109,1,0 // movaps 0x16df1(%rip),%xmm2 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 15,40,21,116,111,1,0 // movaps 0x16f74(%rip),%xmm2 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,242,109,1,0 // mulps 0x16df2(%rip),%xmm2 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,89,21,117,111,1,0 // mulps 0x16f75(%rip),%xmm2 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -36806,7 +37256,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,125,106,1,0 // minps 0x16a7d(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,21,0,108,1,0 // minps 0x16c00(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36836,31 +37286,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,190,108,1,0 // mulps 0x16cbe(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,29,198,108,1,0 // andps 0x16cc6(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,29,238,105,1,0 // orps 0x169ee(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,37,198,108,1,0 // addps 0x16cc6(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 15,40,29,207,108,1,0 // movaps 0x16ccf(%rip),%xmm3 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,37,65,110,1,0 // mulps 0x16e41(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,29,73,110,1,0 // andps 0x16e49(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,29,113,107,1,0 // orps 0x16b71(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,37,73,110,1,0 // addps 0x16e49(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 15,40,29,82,110,1,0 // movaps 0x16e52(%rip),%xmm3 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,207,108,1,0 // addps 0x16ccf(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 15,40,29,216,108,1,0 // movaps 0x16cd8(%rip),%xmm3 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,29,82,110,1,0 // addps 0x16e52(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 15,40,29,91,110,1,0 // movaps 0x16e5b(%rip),%xmm3 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,197,108,1,0 // addps 0x16cc5(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 15,40,29,206,108,1,0 // movaps 0x16cce(%rip),%xmm3 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,37,72,110,1,0 // addps 0x16e48(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,29,81,110,1,0 // movaps 0x16e51(%rip),%xmm3 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,206,108,1,0 // movaps 0x16cce(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,81,110,1,0 // movaps 0x16e51(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,211,108,1,0 // movaps 0x16cd3(%rip),%xmm3 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 15,40,29,86,110,1,0 // movaps 0x16e56(%rip),%xmm3 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,212,108,1,0 // mulps 0x16cd4(%rip),%xmm3 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,89,29,87,110,1,0 // mulps 0x16e57(%rip),%xmm3 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -36868,7 +37318,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,95,105,1,0 // minps 0x1695f(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,29,226,106,1,0 // minps 0x16ae2(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36885,20 +37335,20 @@ _sk_gamma_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,222,107,1,0 // mulps 0x16bde(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,40,53,230,107,1,0 // movaps 0x16be6(%rip),%xmm14 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
+ .byte 15,89,5,97,109,1,0 // mulps 0x16d61(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,40,53,105,109,1,0 // movaps 0x16d69(%rip),%xmm14 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,37,10,105,1,0 // movaps 0x1690a(%rip),%xmm12 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,37,141,106,1,0 // movaps 0x16a8d(%rip),%xmm12 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,86,212 // orps %xmm12,%xmm2
- .byte 68,15,40,21,222,107,1,0 // movaps 0x16bde(%rip),%xmm10 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
+ .byte 68,15,40,21,97,109,1,0 // movaps 0x16d61(%rip),%xmm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,29,226,107,1,0 // movaps 0x16be2(%rip),%xmm11 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,40,29,101,109,1,0 // movaps 0x16d65(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,13,224,107,1,0 // movaps 0x16be0(%rip),%xmm9 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
+ .byte 68,15,40,13,99,109,1,0 // movaps 0x16d63(%rip),%xmm9 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 68,15,40,45,228,107,1,0 // movaps 0x16be4(%rip),%xmm13 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,40,45,103,109,1,0 // movaps 0x16d67(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -36909,21 +37359,21 @@ _sk_gamma_sse41:
.byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,199,107,1,0 // movaps 0x16bc7(%rip),%xmm6 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
+ .byte 15,40,53,74,109,1,0 // movaps 0x16d4a(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,221,107,1,0 // movaps 0x16bdd(%rip),%xmm7 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 15,40,61,96,109,1,0 // movaps 0x16d60(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,189,107,1,0 // movaps 0x16bbd(%rip),%xmm4 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 15,40,37,64,109,1,0 // movaps 0x16d40(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,207,107,1,0 // movaps 0x16bcf(%rip),%xmm15 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,61,82,109,1,0 // movaps 0x16d52(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,43,107,1,0 // mulps 0x16b2b(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
+ .byte 15,89,5,174,108,1,0 // mulps 0x16cae(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
.byte 65,15,84,206 // andps %xmm14,%xmm1
.byte 65,15,86,204 // orps %xmm12,%xmm1
.byte 65,15,88,194 // addps %xmm10,%xmm0
@@ -36949,8 +37399,8 @@ _sk_gamma_sse41:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,204,106,1,0 // mulps 0x16acc(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,29,213,106,1,0 // andps 0x16ad5(%rip),%xmm3 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
+ .byte 15,89,5,79,108,1,0 // mulps 0x16c4f(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,29,88,108,1,0 // andps 0x16c58(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
.byte 65,15,86,220 // orps %xmm12,%xmm3
.byte 65,15,88,194 // addps %xmm10,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
@@ -36968,7 +37418,7 @@ _sk_gamma_sse41:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,29,107,1,0 // movaps 0x16b1d(%rip),%xmm0 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,40,5,160,108,1,0 // movaps 0x16ca0(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -36988,29 +37438,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,237,106,1,0 // mulps 0x16aed(%rip),%xmm8 # 2bb30 <_sk_overlay_sse2_8bit+0x116f>
- .byte 68,15,40,13,101,104,1,0 // movaps 0x16865(%rip),%xmm9 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,89,5,112,108,1,0 // mulps 0x16c70(%rip),%xmm8 # 2c130 <_sk_overlay_sse2_8bit+0x117b>
+ .byte 68,15,40,13,232,105,1,0 // movaps 0x169e8(%rip),%xmm9 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,234,106,1,0 // movaps 0x16aea(%rip),%xmm0 # 2bb40 <_sk_overlay_sse2_8bit+0x117f>
+ .byte 15,40,5,109,108,1,0 // movaps 0x16c6d(%rip),%xmm0 # 2c140 <_sk_overlay_sse2_8bit+0x118b>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,232,106,1,0 // addps 0x16ae8(%rip),%xmm8 # 2bb50 <_sk_overlay_sse2_8bit+0x118f>
- .byte 68,15,89,5,240,106,1,0 // mulps 0x16af0(%rip),%xmm8 # 2bb60 <_sk_overlay_sse2_8bit+0x119f>
- .byte 15,89,13,249,106,1,0 // mulps 0x16af9(%rip),%xmm1 # 2bb70 <_sk_overlay_sse2_8bit+0x11af>
+ .byte 68,15,88,5,107,108,1,0 // addps 0x16c6b(%rip),%xmm8 # 2c150 <_sk_overlay_sse2_8bit+0x119b>
+ .byte 68,15,89,5,115,108,1,0 // mulps 0x16c73(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x11ab>
+ .byte 15,89,13,124,108,1,0 // mulps 0x16c7c(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,254,106,1,0 // mulps 0x16afe(%rip),%xmm2 # 2bb80 <_sk_overlay_sse2_8bit+0x11bf>
+ .byte 15,89,21,129,108,1,0 // mulps 0x16c81(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,242,106,1,0 // movaps 0x16af2(%rip),%xmm9 # 2bb90 <_sk_overlay_sse2_8bit+0x11cf>
+ .byte 68,15,40,13,117,108,1,0 // movaps 0x16c75(%rip),%xmm9 # 2c190 <_sk_overlay_sse2_8bit+0x11db>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,242,106,1,0 // movaps 0x16af2(%rip),%xmm2 # 2bba0 <_sk_overlay_sse2_8bit+0x11df>
+ .byte 15,40,21,117,108,1,0 // movaps 0x16c75(%rip),%xmm2 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,247,106,1,0 // movaps 0x16af7(%rip),%xmm12 # 2bbb0 <_sk_overlay_sse2_8bit+0x11ef>
+ .byte 68,15,40,37,122,108,1,0 // movaps 0x16c7a(%rip),%xmm12 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -37029,8 +37479,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,176,106,1,0 // mulps 0x16ab0(%rip),%xmm1 # 2bbc0 <_sk_overlay_sse2_8bit+0x11ff>
- .byte 15,89,21,185,106,1,0 // mulps 0x16ab9(%rip),%xmm2 # 2bbd0 <_sk_overlay_sse2_8bit+0x120f>
+ .byte 15,89,13,51,108,1,0 // mulps 0x16c33(%rip),%xmm1 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b>
+ .byte 15,89,21,60,108,1,0 // mulps 0x16c3c(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -37047,11 +37497,11 @@ _sk_load_a8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 15161 <_sk_load_a8_sse41+0x3f>
+ .byte 117,39 // jne 155de <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,55,103,1,0 // pand 0x16737(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,186,104,1,0 // pand 0x168ba(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,125,104,1,0 // mulps 0x1687d(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,0,106,1,0 // mulps 0x16a00(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -37060,12 +37510,12 @@ _sk_load_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 151a3 <_sk_load_a8_sse41+0x81>
+ .byte 116,53 // je 15620 <_sk_load_a8_sse41+0x81>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1518d <_sk_load_a8_sse41+0x6b>
+ .byte 116,21 // je 1560a <_sk_load_a8_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 15141 <_sk_load_a8_sse41+0x1f>
+ .byte 117,195 // jne 155be <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -37073,10 +37523,10 @@ _sk_load_a8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,158 // jmp 15141 <_sk_load_a8_sse41+0x1f>
+ .byte 235,158 // jmp 155be <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,147 // jmp 15141 <_sk_load_a8_sse41+0x1f>
+ .byte 235,147 // jmp 155be <_sk_load_a8_sse41+0x1f>
HIDDEN _sk_load_a8_dst_sse41
.globl _sk_load_a8_dst_sse41
@@ -37089,11 +37539,11 @@ _sk_load_a8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 151ed <_sk_load_a8_dst_sse41+0x3f>
+ .byte 117,39 // jne 1566a <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,171,102,1,0 // pand 0x166ab(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,46,104,1,0 // pand 0x1682e(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,241,103,1,0 // mulps 0x167f1(%rip),%xmm7 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,61,116,105,1,0 // mulps 0x16974(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -37102,12 +37552,12 @@ _sk_load_a8_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 1522f <_sk_load_a8_dst_sse41+0x81>
+ .byte 116,53 // je 156ac <_sk_load_a8_dst_sse41+0x81>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15219 <_sk_load_a8_dst_sse41+0x6b>
+ .byte 116,21 // je 15696 <_sk_load_a8_dst_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 151cd <_sk_load_a8_dst_sse41+0x1f>
+ .byte 117,195 // jne 1564a <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -37115,10 +37565,10 @@ _sk_load_a8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,158 // jmp 151cd <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,158 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,147 // jmp 151cd <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,147 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f>
HIDDEN _sk_gather_a8_sse41
.globl _sk_gather_a8_sse41
@@ -37147,7 +37597,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,38,103,1,0 // mulps 0x16726(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,169,104,1,0 // mulps 0x168a9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -37165,13 +37615,13 @@ _sk_store_a8_sse41:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,219,101,1,0 // movaps 0x165db(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,94,103,1,0 // movaps 0x1675e(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 152fb <_sk_store_a8_sse41+0x41>
+ .byte 117,13 // jne 15778 <_sk_store_a8_sse41+0x41>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -37180,17 +37630,17 @@ _sk_store_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 15337 <_sk_store_a8_sse41+0x7d>
+ .byte 116,41 // je 157b4 <_sk_store_a8_sse41+0x7d>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15323 <_sk_store_a8_sse41+0x69>
+ .byte 116,15 // je 157a0 <_sk_store_a8_sse41+0x69>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 152f7 <_sk_store_a8_sse41+0x3d>
+ .byte 117,221 // jne 15774 <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,25,2,8 // pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- .byte 102,68,15,56,0,5,179,104,1,0 // pshufb 0x168b3(%rip),%xmm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x121f>
+ .byte 102,68,15,56,0,5,54,106,1,0 // pshufb 0x16a36(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x122b>
.byte 102,71,15,58,21,4,25,0 // pextrw $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,192 // jmp 152f7 <_sk_store_a8_sse41+0x3d>
+ .byte 235,192 // jmp 15774 <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,25,0 // pextrb $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,182 // jmp 152f7 <_sk_store_a8_sse41+0x3d>
+ .byte 235,182 // jmp 15774 <_sk_store_a8_sse41+0x3d>
HIDDEN _sk_load_g8_sse41
.globl _sk_load_g8_sse41
@@ -37203,25 +37653,25 @@ _sk_load_g8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 15383 <_sk_load_g8_sse41+0x42>
+ .byte 117,42 // jne 15800 <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,24,101,1,0 // pand 0x16518(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,155,102,1,0 // pand 0x1669b(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,94,102,1,0 // mulps 0x1665e(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,225,103,1,0 // mulps 0x167e1(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,85,100,1,0 // movaps 0x16455(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,216,101,1,0 // movaps 0x165d8(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 153c5 <_sk_load_g8_sse41+0x84>
+ .byte 116,53 // je 15842 <_sk_load_g8_sse41+0x84>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 153af <_sk_load_g8_sse41+0x6e>
+ .byte 116,21 // je 1582c <_sk_load_g8_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 15360 <_sk_load_g8_sse41+0x1f>
+ .byte 117,192 // jne 157dd <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -37229,10 +37679,10 @@ _sk_load_g8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,155 // jmp 15360 <_sk_load_g8_sse41+0x1f>
+ .byte 235,155 // jmp 157dd <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,144 // jmp 15360 <_sk_load_g8_sse41+0x1f>
+ .byte 235,144 // jmp 157dd <_sk_load_g8_sse41+0x1f>
HIDDEN _sk_load_g8_dst_sse41
.globl _sk_load_g8_dst_sse41
@@ -37245,25 +37695,25 @@ _sk_load_g8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 15412 <_sk_load_g8_dst_sse41+0x42>
+ .byte 117,42 // jne 1588f <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,137,100,1,0 // pand 0x16489(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,12,102,1,0 // pand 0x1660c(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,207,101,1,0 // mulps 0x165cf(%rip),%xmm4 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,37,82,103,1,0 // mulps 0x16752(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,198,99,1,0 // movaps 0x163c6(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,73,101,1,0 // movaps 0x16549(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15454 <_sk_load_g8_dst_sse41+0x84>
+ .byte 116,53 // je 158d1 <_sk_load_g8_dst_sse41+0x84>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1543e <_sk_load_g8_dst_sse41+0x6e>
+ .byte 116,21 // je 158bb <_sk_load_g8_dst_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 153ef <_sk_load_g8_dst_sse41+0x1f>
+ .byte 117,192 // jne 1586c <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -37271,10 +37721,10 @@ _sk_load_g8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,155 // jmp 153ef <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,155 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,144 // jmp 153ef <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,144 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f>
HIDDEN _sk_gather_g8_sse41
.globl _sk_gather_g8_sse41
@@ -37303,9 +37753,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,1,101,1,0 // mulps 0x16501(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,132,102,1,0 // mulps 0x16684(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,248,98,1,0 // movaps 0x162f8(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,123,100,1,0 // movaps 0x1647b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -37323,41 +37773,41 @@ _sk_load_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 1554c <_sk_load_565_sse41+0x6b>
+ .byte 117,80 // jne 159c9 <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm2
- .byte 102,15,111,5,213,100,1,0 // movdqa 0x164d5(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,88,102,1,0 // movdqa 0x16658(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,215,100,1,0 // mulps 0x164d7(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,223,100,1,0 // movdqa 0x164df(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,90,102,1,0 // mulps 0x1665a(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,98,102,1,0 // movdqa 0x16662(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,225,100,1,0 // mulps 0x164e1(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,233,100,1,0 // pand 0x164e9(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,100,102,1,0 // mulps 0x16664(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,108,102,1,0 // pand 0x1666c(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,239,100,1,0 // mulps 0x164ef(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,114,102,1,0 // mulps 0x16672(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,134,98,1,0 // movaps 0x16286(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,9,100,1,0 // movaps 0x16409(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 1558e <_sk_load_565_sse41+0xad>
+ .byte 116,53 // je 15a0b <_sk_load_565_sse41+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15578 <_sk_load_565_sse41+0x97>
+ .byte 116,21 // je 159f5 <_sk_load_565_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 15503 <_sk_load_565_sse41+0x22>
+ .byte 117,154 // jne 15980 <_sk_load_565_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2
- .byte 233,117,255,255,255 // jmpq 15503 <_sk_load_565_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,103,255,255,255 // jmpq 15503 <_sk_load_565_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22>
HIDDEN _sk_load_565_dst_sse41
.globl _sk_load_565_dst_sse41
@@ -37371,41 +37821,41 @@ _sk_load_565_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 15607 <_sk_load_565_dst_sse41+0x6b>
+ .byte 117,80 // jne 15a84 <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,89 // pmovzxwd (%r9,%r11,2),%xmm6
- .byte 102,15,111,37,26,100,1,0 // movdqa 0x1641a(%rip),%xmm4 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,37,157,101,1,0 // movdqa 0x1659d(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,28,100,1,0 // mulps 0x1641c(%rip),%xmm4 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,45,36,100,1,0 // movdqa 0x16424(%rip),%xmm5 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,37,159,101,1,0 // mulps 0x1659f(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,45,167,101,1,0 // movdqa 0x165a7(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,38,100,1,0 // mulps 0x16426(%rip),%xmm5 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,53,46,100,1,0 // pand 0x1642e(%rip),%xmm6 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,45,169,101,1,0 // mulps 0x165a9(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,53,177,101,1,0 // pand 0x165b1(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,52,100,1,0 // mulps 0x16434(%rip),%xmm6 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,53,183,101,1,0 // mulps 0x165b7(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,203,97,1,0 // movaps 0x161cb(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,78,99,1,0 // movaps 0x1634e(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15649 <_sk_load_565_dst_sse41+0xad>
+ .byte 116,53 // je 15ac6 <_sk_load_565_dst_sse41+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15633 <_sk_load_565_dst_sse41+0x97>
+ .byte 116,21 // je 15ab0 <_sk_load_565_dst_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 155be <_sk_load_565_dst_sse41+0x22>
+ .byte 117,154 // jne 15a3b <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,117,255,255,255 // jmpq 155be <_sk_load_565_dst_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,103,255,255,255 // jmpq 155be <_sk_load_565_dst_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22>
HIDDEN _sk_gather_565_sse41
.globl _sk_gather_565_sse41
@@ -37433,19 +37883,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,31,99,1,0 // movdqa 0x1631f(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,162,100,1,0 // movdqa 0x164a2(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,33,99,1,0 // mulps 0x16321(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,41,99,1,0 // movdqa 0x16329(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,164,100,1,0 // mulps 0x164a4(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,172,100,1,0 // movdqa 0x164ac(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,43,99,1,0 // mulps 0x1632b(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,51,99,1,0 // pand 0x16333(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,174,100,1,0 // mulps 0x164ae(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,182,100,1,0 // pand 0x164b6(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,57,99,1,0 // mulps 0x16339(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,188,100,1,0 // mulps 0x164bc(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,208,96,1,0 // movaps 0x160d0(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,83,98,1,0 // movaps 0x16253(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -37460,12 +37910,12 @@ _sk_store_565_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,207,100,1,0 // movaps 0x164cf(%rip),%xmm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x122f>
+ .byte 68,15,40,5,82,102,1,0 // movaps 0x16652(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,196,100,1,0 // movaps 0x164c4(%rip),%xmm10 # 2bc00 <_sk_overlay_sse2_8bit+0x123f>
+ .byte 68,15,40,21,71,102,1,0 // movaps 0x16647(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -37475,7 +37925,7 @@ _sk_store_565_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15773 <_sk_store_565_sse41+0x70>
+ .byte 117,10 // jne 15bf0 <_sk_store_565_sse41+0x70>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -37483,17 +37933,17 @@ _sk_store_565_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 157a9 <_sk_store_565_sse41+0xa6>
+ .byte 116,35 // je 15c26 <_sk_store_565_sse41+0xa6>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 1579b <_sk_store_565_sse41+0x98>
+ .byte 116,15 // je 15c18 <_sk_store_565_sse41+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 1576f <_sk_store_565_sse41+0x6c>
+ .byte 117,221 // jne 15bec <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 1576f <_sk_store_565_sse41+0x6c>
+ .byte 235,198 // jmp 15bec <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 1576f <_sk_store_565_sse41+0x6c>
+ .byte 235,188 // jmp 15bec <_sk_store_565_sse41+0x6c>
HIDDEN _sk_load_4444_sse41
.globl _sk_load_4444_sse41
@@ -37507,44 +37957,44 @@ _sk_load_4444_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 1582d <_sk_load_4444_sse41+0x7a>
+ .byte 117,95 // jne 15caa <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm3
- .byte 102,15,111,5,51,100,1,0 // movdqa 0x16433(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,182,101,1,0 // movdqa 0x165b6(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,53,100,1,0 // mulps 0x16435(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,61,100,1,0 // movdqa 0x1643d(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,184,101,1,0 // mulps 0x165b8(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,192,101,1,0 // movdqa 0x165c0(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,63,100,1,0 // mulps 0x1643f(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,71,100,1,0 // movdqa 0x16447(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,194,101,1,0 // mulps 0x165c2(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,202,101,1,0 // movdqa 0x165ca(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,73,100,1,0 // mulps 0x16449(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,81,100,1,0 // pand 0x16451(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,204,101,1,0 // mulps 0x165cc(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,212,101,1,0 // pand 0x165d4(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,87,100,1,0 // mulps 0x16457(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,218,101,1,0 // mulps 0x165da(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 1586f <_sk_load_4444_sse41+0xbc>
+ .byte 116,53 // je 15cec <_sk_load_4444_sse41+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15859 <_sk_load_4444_sse41+0xa6>
+ .byte 116,21 // je 15cd6 <_sk_load_4444_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 157d5 <_sk_load_4444_sse41+0x22>
+ .byte 117,139 // jne 15c52 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,102,255,255,255 // jmpq 157d5 <_sk_load_4444_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,88,255,255,255 // jmpq 157d5 <_sk_load_4444_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22>
HIDDEN _sk_load_4444_dst_sse41
.globl _sk_load_4444_dst_sse41
@@ -37558,44 +38008,44 @@ _sk_load_4444_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 158f7 <_sk_load_4444_dst_sse41+0x7a>
+ .byte 117,95 // jne 15d74 <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,89 // pmovzxwd (%r9,%r11,2),%xmm7
- .byte 102,15,111,37,105,99,1,0 // movdqa 0x16369(%rip),%xmm4 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,37,236,100,1,0 // movdqa 0x164ec(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,107,99,1,0 // mulps 0x1636b(%rip),%xmm4 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,45,115,99,1,0 // movdqa 0x16373(%rip),%xmm5 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,37,238,100,1,0 // mulps 0x164ee(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,45,246,100,1,0 // movdqa 0x164f6(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,117,99,1,0 // mulps 0x16375(%rip),%xmm5 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,53,125,99,1,0 // movdqa 0x1637d(%rip),%xmm6 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,45,248,100,1,0 // mulps 0x164f8(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,53,0,101,1,0 // movdqa 0x16500(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,127,99,1,0 // mulps 0x1637f(%rip),%xmm6 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,61,135,99,1,0 // pand 0x16387(%rip),%xmm7 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,53,2,101,1,0 // mulps 0x16502(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,61,10,101,1,0 // pand 0x1650a(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,141,99,1,0 // mulps 0x1638d(%rip),%xmm7 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,61,16,101,1,0 // mulps 0x16510(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15939 <_sk_load_4444_dst_sse41+0xbc>
+ .byte 116,53 // je 15db6 <_sk_load_4444_dst_sse41+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15923 <_sk_load_4444_dst_sse41+0xa6>
+ .byte 116,21 // je 15da0 <_sk_load_4444_dst_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1589f <_sk_load_4444_dst_sse41+0x22>
+ .byte 117,139 // jne 15d1c <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,102,255,255,255 // jmpq 1589f <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,88,255,255,255 // jmpq 1589f <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22>
HIDDEN _sk_gather_4444_sse41
.globl _sk_gather_4444_sse41
@@ -37623,21 +38073,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,95,98,1,0 // movdqa 0x1625f(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,226,99,1,0 // movdqa 0x163e2(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,97,98,1,0 // mulps 0x16261(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,105,98,1,0 // movdqa 0x16269(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,228,99,1,0 // mulps 0x163e4(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,236,99,1,0 // movdqa 0x163ec(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,107,98,1,0 // mulps 0x1626b(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,115,98,1,0 // movdqa 0x16273(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,238,99,1,0 // mulps 0x163ee(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,246,99,1,0 // movdqa 0x163f6(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,117,98,1,0 // mulps 0x16275(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,125,98,1,0 // pand 0x1627d(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,248,99,1,0 // mulps 0x163f8(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,0,100,1,0 // pand 0x16400(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,131,98,1,0 // mulps 0x16283(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,6,100,1,0 // mulps 0x16406(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -37653,7 +38103,7 @@ _sk_store_4444_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,112,98,1,0 // movaps 0x16270(%rip),%xmm8 # 2bc90 <_sk_overlay_sse2_8bit+0x12cf>
+ .byte 68,15,40,5,243,99,1,0 // movaps 0x163f3(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -37673,7 +38123,7 @@ _sk_store_4444_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15a86 <_sk_store_4444_sse41+0x84>
+ .byte 117,10 // jne 15f03 <_sk_store_4444_sse41+0x84>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -37681,17 +38131,17 @@ _sk_store_4444_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 15abc <_sk_store_4444_sse41+0xba>
+ .byte 116,35 // je 15f39 <_sk_store_4444_sse41+0xba>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15aae <_sk_store_4444_sse41+0xac>
+ .byte 116,15 // je 15f2b <_sk_store_4444_sse41+0xac>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 15a82 <_sk_store_4444_sse41+0x80>
+ .byte 117,221 // jne 15eff <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 15a82 <_sk_store_4444_sse41+0x80>
+ .byte 235,198 // jmp 15eff <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 15a82 <_sk_store_4444_sse41+0x80>
+ .byte 235,188 // jmp 15eff <_sk_store_4444_sse41+0x80>
HIDDEN _sk_load_8888_sse41
.globl _sk_load_8888_sse41
@@ -37705,19 +38155,19 @@ _sk_load_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15b3b <_sk_load_8888_sse41+0x75>
+ .byte 117,89 // jne 15fb8 <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,144,93,1,0 // movdqa 0x15d90(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,19,95,1,0 // movdqa 0x15f13(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,209,94,1,0 // movaps 0x15ed1(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,84,96,1,0 // movaps 0x16054(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,128,93,1,0 // pshufb 0x15d80(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,13,3,95,1,0 // pshufb 0x15f03(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,124,93,1,0 // pshufb 0x15d7c(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,21,255,94,1,0 // pshufb 0x15eff(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -37728,19 +38178,19 @@ _sk_load_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15b75 <_sk_load_8888_sse41+0xaf>
+ .byte 116,45 // je 15ff2 <_sk_load_8888_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15b64 <_sk_load_8888_sse41+0x9e>
+ .byte 116,18 // je 15fe1 <_sk_load_8888_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15ae8 <_sk_load_8888_sse41+0x22>
+ .byte 117,144 // jne 15f65 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 15ae8 <_sk_load_8888_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 15ae8 <_sk_load_8888_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22>
HIDDEN _sk_load_8888_dst_sse41
.globl _sk_load_8888_dst_sse41
@@ -37754,19 +38204,19 @@ _sk_load_8888_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15bf5 <_sk_load_8888_dst_sse41+0x75>
+ .byte 117,89 // jne 16072 <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,214,92,1,0 // movdqa 0x15cd6(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,89,94,1,0 // movdqa 0x15e59(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,23,94,1,0 // movaps 0x15e17(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,154,95,1,0 // movaps 0x15f9a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,198,92,1,0 // pshufb 0x15cc6(%rip),%xmm5 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,45,73,94,1,0 // pshufb 0x15e49(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,194,92,1,0 // pshufb 0x15cc2(%rip),%xmm6 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,53,69,94,1,0 // pshufb 0x15e45(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -37777,19 +38227,19 @@ _sk_load_8888_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15c2f <_sk_load_8888_dst_sse41+0xaf>
+ .byte 116,45 // je 160ac <_sk_load_8888_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15c1e <_sk_load_8888_dst_sse41+0x9e>
+ .byte 116,18 // je 1609b <_sk_load_8888_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15ba2 <_sk_load_8888_dst_sse41+0x22>
+ .byte 117,144 // jne 1601f <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 15ba2 <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 15ba2 <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22>
HIDDEN _sk_gather_8888_sse41
.globl _sk_gather_8888_sse41
@@ -37814,17 +38264,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,229,91,1,0 // movdqa 0x15be5(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,104,93,1,0 // movdqa 0x15d68(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,38,93,1,0 // movaps 0x15d26(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,169,94,1,0 // movaps 0x15ea9(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,213,91,1,0 // pshufb 0x15bd5(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,13,88,93,1,0 // pshufb 0x15d58(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,209,91,1,0 // pshufb 0x15bd1(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,21,84,93,1,0 // pshufb 0x15d54(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -37845,7 +38295,7 @@ _sk_store_8888_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,170,91,1,0 // movaps 0x15baa(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,45,93,1,0 // movaps 0x15d2d(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -37864,23 +38314,23 @@ _sk_store_8888_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15d66 <_sk_store_8888_sse41+0x7f>
+ .byte 117,10 // jne 161e3 <_sk_store_8888_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 15d90 <_sk_store_8888_sse41+0xa9>
+ .byte 116,29 // je 1620d <_sk_store_8888_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15d88 <_sk_store_8888_sse41+0xa1>
+ .byte 116,15 // je 16205 <_sk_store_8888_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 15d62 <_sk_store_8888_sse41+0x7b>
+ .byte 117,227 // jne 161df <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 15d62 <_sk_store_8888_sse41+0x7b>
+ .byte 235,210 // jmp 161df <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 15d62 <_sk_store_8888_sse41+0x7b>
+ .byte 235,202 // jmp 161df <_sk_store_8888_sse41+0x7b>
HIDDEN _sk_load_bgra_sse41
.globl _sk_load_bgra_sse41
@@ -37894,19 +38344,19 @@ _sk_load_bgra_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15e0d <_sk_load_bgra_sse41+0x75>
+ .byte 117,89 // jne 1628a <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,190,90,1,0 // movdqa 0x15abe(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,65,92,1,0 // movdqa 0x15c41(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,255,91,1,0 // movaps 0x15bff(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,130,93,1,0 // movaps 0x15d82(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,174,90,1,0 // pshufb 0x15aae(%rip),%xmm0 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,5,49,92,1,0 // pshufb 0x15c31(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,170,90,1,0 // pshufb 0x15aaa(%rip),%xmm0 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,5,45,92,1,0 // pshufb 0x15c2d(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -37917,19 +38367,19 @@ _sk_load_bgra_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15e47 <_sk_load_bgra_sse41+0xaf>
+ .byte 116,45 // je 162c4 <_sk_load_bgra_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15e36 <_sk_load_bgra_sse41+0x9e>
+ .byte 116,18 // je 162b3 <_sk_load_bgra_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15dba <_sk_load_bgra_sse41+0x22>
+ .byte 117,144 // jne 16237 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 15dba <_sk_load_bgra_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 15dba <_sk_load_bgra_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22>
HIDDEN _sk_load_bgra_dst_sse41
.globl _sk_load_bgra_dst_sse41
@@ -37943,19 +38393,19 @@ _sk_load_bgra_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15ec7 <_sk_load_bgra_dst_sse41+0x75>
+ .byte 117,89 // jne 16344 <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,4,90,1,0 // movdqa 0x15a04(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,135,91,1,0 // movdqa 0x15b87(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,69,91,1,0 // movaps 0x15b45(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,200,92,1,0 // movaps 0x15cc8(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,244,89,1,0 // pshufb 0x159f4(%rip),%xmm4 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,37,119,91,1,0 // pshufb 0x15b77(%rip),%xmm4 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,240,89,1,0 // pshufb 0x159f0(%rip),%xmm4 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,37,115,91,1,0 // pshufb 0x15b73(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -37966,19 +38416,19 @@ _sk_load_bgra_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15f01 <_sk_load_bgra_dst_sse41+0xaf>
+ .byte 116,45 // je 1637e <_sk_load_bgra_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15ef0 <_sk_load_bgra_dst_sse41+0x9e>
+ .byte 116,18 // je 1636d <_sk_load_bgra_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15e74 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 117,144 // jne 162f1 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 15e74 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 15e74 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22>
HIDDEN _sk_gather_bgra_sse41
.globl _sk_gather_bgra_sse41
@@ -38003,17 +38453,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,19,89,1,0 // movdqa 0x15913(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,150,90,1,0 // movdqa 0x15a96(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,84,90,1,0 // movaps 0x15a54(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,215,91,1,0 // movaps 0x15bd7(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,3,89,1,0 // pshufb 0x15903(%rip),%xmm0 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,5,134,90,1,0 // pshufb 0x15a86(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,255,88,1,0 // pshufb 0x158ff(%rip),%xmm0 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,5,130,90,1,0 // pshufb 0x15a82(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -38034,7 +38484,7 @@ _sk_store_bgra_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,216,88,1,0 // movaps 0x158d8(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,91,90,1,0 // movaps 0x15a5b(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -38053,23 +38503,23 @@ _sk_store_bgra_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 16038 <_sk_store_bgra_sse41+0x7f>
+ .byte 117,10 // jne 164b5 <_sk_store_bgra_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 16062 <_sk_store_bgra_sse41+0xa9>
+ .byte 116,29 // je 164df <_sk_store_bgra_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 1605a <_sk_store_bgra_sse41+0xa1>
+ .byte 116,15 // je 164d7 <_sk_store_bgra_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 16034 <_sk_store_bgra_sse41+0x7b>
+ .byte 117,227 // jne 164b1 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 16034 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,210 // jmp 164b1 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 16034 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,202 // jmp 164b1 <_sk_store_bgra_sse41+0x7b>
HIDDEN _sk_load_f16_sse41
.globl _sk_load_f16_sse41
@@ -38083,7 +38533,7 @@ _sk_load_f16_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 161c8 <_sk_load_f16_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 16645 <_sk_load_f16_sse41+0x15e>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 243,65,15,111,76,193,16 // movdqu 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,200 // movapd %xmm0,%xmm9
@@ -38093,18 +38543,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,221,91,1,0 // movdqa 0x15bdd(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,5,96,93,1,0 // movdqa 0x15d60(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,216,91,1,0 // movdqa 0x15bd8(%rip),%xmm3 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef>
+ .byte 102,15,111,29,91,93,1,0 // movdqa 0x15d5b(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,196,91,1,0 // movdqa 0x15bc4(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,21,71,93,1,0 // movdqa 0x15d47(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -38147,16 +38597,16 @@ _sk_load_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 161e1 <_sk_load_f16_sse41+0x177>
+ .byte 117,13 // jne 1665e <_sk_load_f16_sse41+0x177>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,182,254,255,255 // jmpq 16097 <_sk_load_f16_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 16097 <_sk_load_f16_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 16514 <_sk_load_f16_sse41+0x2d>
.byte 243,65,15,126,76,193,16 // movq 0x10(%r9,%rax,8),%xmm1
- .byte 233,149,254,255,255 // jmpq 16097 <_sk_load_f16_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d>
HIDDEN _sk_load_f16_dst_sse41
.globl _sk_load_f16_dst_sse41
@@ -38170,7 +38620,7 @@ _sk_load_f16_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 16360 <_sk_load_f16_dst_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 167dd <_sk_load_f16_dst_sse41+0x15e>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 243,65,15,111,108,193,16 // movdqu 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,204 // movapd %xmm4,%xmm9
@@ -38180,18 +38630,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,69,90,1,0 // movdqa 0x15a45(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,5,200,91,1,0 // movdqa 0x15bc8(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,64,90,1,0 // movdqa 0x15a40(%rip),%xmm7 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef>
+ .byte 102,15,111,61,195,91,1,0 // movdqa 0x15bc3(%rip),%xmm7 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,44,90,1,0 // movdqa 0x15a2c(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,21,175,91,1,0 // movdqa 0x15baf(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -38234,16 +38684,16 @@ _sk_load_f16_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 16379 <_sk_load_f16_dst_sse41+0x177>
+ .byte 117,13 // jne 167f6 <_sk_load_f16_dst_sse41+0x177>
.byte 243,15,126,228 // movq %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 233,182,254,255,255 // jmpq 1622f <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 1622f <_sk_load_f16_dst_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 166ac <_sk_load_f16_dst_sse41+0x2d>
.byte 243,65,15,126,108,193,16 // movq 0x10(%r9,%rax,8),%xmm5
- .byte 233,149,254,255,255 // jmpq 1622f <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d>
HIDDEN _sk_gather_f16_sse41
.globl _sk_gather_f16_sse41
@@ -38277,18 +38727,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,127,88,1,0 // movdqa 0x1587f(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,5,2,90,1,0 // movdqa 0x15a02(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,122,88,1,0 // movdqa 0x1587a(%rip),%xmm3 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef>
+ .byte 102,15,111,29,253,89,1,0 // movdqa 0x159fd(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,102,88,1,0 // movdqa 0x15866(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,21,233,89,1,0 // movdqa 0x159e9(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -38342,17 +38792,17 @@ _sk_store_f16_sse41:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,137,87,1,0 // movdqa 0x15789(%rip),%xmm10 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,21,12,89,1,0 // movdqa 0x1590c(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,124,87,1,0 // movdqa 0x1577c(%rip),%xmm9 # 2bce0 <_sk_overlay_sse2_8bit+0x131f>
+ .byte 102,68,15,111,13,255,88,1,0 // movdqa 0x158ff(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,109,87,1,0 // movdqa 0x1576d(%rip),%xmm12 # 2bcf0 <_sk_overlay_sse2_8bit+0x132f>
+ .byte 102,68,15,111,37,240,88,1,0 // movdqa 0x158f0(%rip),%xmm12 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -38396,7 +38846,7 @@ _sk_store_f16_sse41:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 16679 <_sk_store_f16_sse41+0x152>
+ .byte 117,21 // jne 16af6 <_sk_store_f16_sse41+0x152>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -38404,13 +38854,13 @@ _sk_store_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 16675 <_sk_store_f16_sse41+0x14e>
+ .byte 116,240 // je 16af2 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 16675 <_sk_store_f16_sse41+0x14e>
+ .byte 114,227 // jb 16af2 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 16675 <_sk_store_f16_sse41+0x14e>
+ .byte 235,213 // jmp 16af2 <_sk_store_f16_sse41+0x14e>
HIDDEN _sk_load_u16_be_sse41
.globl _sk_load_u16_be_sse41
@@ -38425,7 +38875,7 @@ _sk_load_u16_be_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,185,0,0,0 // jne 16780 <_sk_load_u16_be_sse41+0xe0>
+ .byte 15,133,185,0,0,0 // jne 16bfd <_sk_load_u16_be_sse41+0xe0>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -38441,7 +38891,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,77,83,1,0 // movaps 0x1534d(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,5,208,84,1,0 // movaps 0x154d0(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -38469,16 +38919,16 @@ _sk_load_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 16799 <_sk_load_u16_be_sse41+0xf9>
+ .byte 117,13 // jne 16c16 <_sk_load_u16_be_sse41+0xf9>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,59,255,255,255 // jmpq 166d4 <_sk_load_u16_be_sse41+0x34>
+ .byte 233,59,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,38,255,255,255 // jb 166d4 <_sk_load_u16_be_sse41+0x34>
+ .byte 15,130,38,255,255,255 // jb 16b51 <_sk_load_u16_be_sse41+0x34>
.byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1
- .byte 233,26,255,255,255 // jmpq 166d4 <_sk_load_u16_be_sse41+0x34>
+ .byte 233,26,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34>
HIDDEN _sk_load_rgb_u16_be_sse41
.globl _sk_load_rgb_u16_be_sse41
@@ -38495,7 +38945,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 1688f <_sk_load_rgb_u16_be_sse41+0xd5>
+ .byte 15,133,170,0,0,0 // jne 16d0c <_sk_load_rgb_u16_be_sse41+0xd5>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -38515,7 +38965,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,28,82,1,0 // movaps 0x1521c(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,5,159,83,1,0 // movaps 0x1539f(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -38532,27 +38982,27 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,67,79,1,0 // movaps 0x14f43(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,198,80,1,0 // movaps 0x150c6(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 168b4 <_sk_load_rgb_u16_be_sse41+0xfa>
+ .byte 117,13 // jne 16d31 <_sk_load_rgb_u16_be_sse41+0xfa>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,85,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 168e5 <_sk_load_rgb_u16_be_sse41+0x12b>
+ .byte 114,24 // jb 16d62 <_sk_load_rgb_u16_be_sse41+0x12b>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,36,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,36,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,27,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,27,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
HIDDEN _sk_store_u16_be_sse41
.globl _sk_store_u16_be_sse41
@@ -38566,7 +39016,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,236,83,1,0 // movaps 0x153ec(%rip),%xmm10 # 2bd00 <_sk_overlay_sse2_8bit+0x133f>
+ .byte 68,15,40,21,111,85,1,0 // movaps 0x1556f(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -38603,7 +39053,7 @@ _sk_store_u16_be_sse41:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 169e2 <_sk_store_u16_be_sse41+0xf4>
+ .byte 117,21 // jne 16e5f <_sk_store_u16_be_sse41+0xf4>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -38611,13 +39061,13 @@ _sk_store_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 169de <_sk_store_u16_be_sse41+0xf0>
+ .byte 116,240 // je 16e5b <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 169de <_sk_store_u16_be_sse41+0xf0>
+ .byte 114,227 // jb 16e5b <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 169de <_sk_store_u16_be_sse41+0xf0>
+ .byte 235,213 // jmp 16e5b <_sk_store_u16_be_sse41+0xf0>
HIDDEN _sk_load_f32_sse41
.globl _sk_load_f32_sse41
@@ -38633,7 +39083,7 @@ _sk_load_f32_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 16a74 <_sk_load_f32_sse41+0x6b>
+ .byte 117,66 // jne 16ef1 <_sk_load_f32_sse41+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -38653,17 +39103,17 @@ _sk_load_f32_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 16a86 <_sk_load_f32_sse41+0x7d>
+ .byte 117,8 // jne 16f03 <_sk_load_f32_sse41+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 16a44 <_sk_load_f32_sse41+0x3b>
+ .byte 235,190 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 16a9a <_sk_load_f32_sse41+0x91>
+ .byte 114,8 // jb 16f17 <_sk_load_f32_sse41+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 16a44 <_sk_load_f32_sse41+0x3b>
+ .byte 235,170 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 16a44 <_sk_load_f32_sse41+0x3b>
+ .byte 235,165 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
HIDDEN _sk_load_f32_dst_sse41
.globl _sk_load_f32_dst_sse41
@@ -38679,7 +39129,7 @@ _sk_load_f32_dst_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 16b0a <_sk_load_f32_dst_sse41+0x6b>
+ .byte 117,66 // jne 16f87 <_sk_load_f32_dst_sse41+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -38699,17 +39149,17 @@ _sk_load_f32_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 16b1c <_sk_load_f32_dst_sse41+0x7d>
+ .byte 117,8 // jne 16f99 <_sk_load_f32_dst_sse41+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,190 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 16b30 <_sk_load_f32_dst_sse41+0x91>
+ .byte 114,8 // jb 16fad <_sk_load_f32_dst_sse41+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,170 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,165 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
HIDDEN _sk_store_f32_sse41
.globl _sk_store_f32_sse41
@@ -38738,7 +39188,7 @@ _sk_store_f32_sse41:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 16bb2 <_sk_store_f32_sse41+0x7d>
+ .byte 117,29 // jne 1702f <_sk_store_f32_sse41+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -38746,12 +39196,12 @@ _sk_store_f32_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 16bae <_sk_store_f32_sse41+0x79>
+ .byte 116,246 // je 1702b <_sk_store_f32_sse41+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 16bae <_sk_store_f32_sse41+0x79>
+ .byte 114,234 // jb 1702b <_sk_store_f32_sse41+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 16bae <_sk_store_f32_sse41+0x79>
+ .byte 235,225 // jmp 1702b <_sk_store_f32_sse41+0x79>
HIDDEN _sk_clamp_x_sse41
.globl _sk_clamp_x_sse41
@@ -38841,7 +39291,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,38,65,1,0 // mulss 0x14126(%rip),%xmm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,13,157,66,1,0 // mulss 0x1429d(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -38872,7 +39322,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,180,64,1,0 // mulss 0x140b4(%rip),%xmm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,13,43,66,1,0 // mulss 0x1422b(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -38897,7 +39347,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,47,74,1,0 // minps 0x14a2f(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,93,5,178,75,1,0 // minps 0x14bb2(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -38915,9 +39365,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,112,74,1,0 // movaps 0x14a70(%rip),%xmm8 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,5,243,75,1,0 // movaps 0x14bf3(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,244,73,1,0 // movaps 0x149f4(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,119,75,1,0 // movaps 0x14b77(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -38934,10 +39384,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,19,79,1,0 // mulps 0x14f13(%rip),%xmm0 # 2bd10 <_sk_overlay_sse2_8bit+0x134f>
- .byte 15,89,13,28,79,1,0 // mulps 0x14f1c(%rip),%xmm1 # 2bd20 <_sk_overlay_sse2_8bit+0x135f>
+ .byte 15,89,5,150,80,1,0 // mulps 0x15096(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b>
+ .byte 15,89,13,159,80,1,0 // mulps 0x1509f(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,34,79,1,0 // mulps 0x14f22(%rip),%xmm3 # 2bd30 <_sk_overlay_sse2_8bit+0x136f>
+ .byte 15,89,29,165,80,1,0 // mulps 0x150a5(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -39250,9 +39700,9 @@ _sk_evenly_spaced_gradient_sse41:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 172b0 <_sk_evenly_spaced_gradient_sse41+0x1a>
+ .byte 120,7 // js 1772d <_sk_evenly_spaced_gradient_sse41+0x1a>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 172c5 <_sk_evenly_spaced_gradient_sse41+0x2f>
+ .byte 235,21 // jmp 17742 <_sk_evenly_spaced_gradient_sse41+0x2f>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -39342,15 +39792,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,205,72,1,0 // movaps 0x148cd(%rip),%xmm0 # 2bd40 <_sk_overlay_sse2_8bit+0x137f>
+ .byte 15,40,5,80,74,1,0 // movaps 0x14a50(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,211,72,1,0 // addps 0x148d3(%rip),%xmm0 # 2bd50 <_sk_overlay_sse2_8bit+0x138f>
+ .byte 15,88,5,86,74,1,0 // addps 0x14a56(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,217,72,1,0 // addps 0x148d9(%rip),%xmm0 # 2bd60 <_sk_overlay_sse2_8bit+0x139f>
+ .byte 15,88,5,92,74,1,0 // addps 0x14a5c(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,223,72,1,0 // addps 0x148df(%rip),%xmm0 # 2bd70 <_sk_overlay_sse2_8bit+0x13af>
+ .byte 15,88,5,98,74,1,0 // addps 0x14a62(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,229,72,1,0 // addps 0x148e5(%rip),%xmm0 # 2bd80 <_sk_overlay_sse2_8bit+0x13bf>
+ .byte 15,88,5,104,74,1,0 // addps 0x14a68(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -39368,12 +39818,12 @@ _sk_gradient_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 174ee <_sk_gradient_sse41+0x46>
+ .byte 114,50 // jb 1796b <_sk_gradient_sse41+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,14,67,1,0 // movaps 0x1430e(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 15,40,21,145,68,1,0 // movaps 0x14491(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -39381,7 +39831,7 @@ _sk_gradient_sse41:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 174d2 <_sk_gradient_sse41+0x2a>
+ .byte 117,228 // jne 1794f <_sk_gradient_sse41+0x2a>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -39511,26 +39961,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,79,70,1,0 // movaps 0x1464f(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0x13cf>
+ .byte 68,15,40,21,210,71,1,0 // movaps 0x147d2(%rip),%xmm10 # 2c390 <_sk_overlay_sse2_8bit+0x13db>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,83,70,1,0 // addps 0x14653(%rip),%xmm10 # 2bda0 <_sk_overlay_sse2_8bit+0x13df>
+ .byte 68,15,88,21,214,71,1,0 // addps 0x147d6(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,87,70,1,0 // addps 0x14657(%rip),%xmm10 # 2bdb0 <_sk_overlay_sse2_8bit+0x13ef>
+ .byte 68,15,88,21,218,71,1,0 // addps 0x147da(%rip),%xmm10 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,91,70,1,0 // addps 0x1465b(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0x13ff>
+ .byte 68,15,88,21,222,71,1,0 // addps 0x147de(%rip),%xmm10 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,90,70,1,0 // movaps 0x1465a(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0x140f>
+ .byte 68,15,40,29,221,71,1,0 // movaps 0x147dd(%rip),%xmm11 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,51,64,1,0 // movaps 0x14033(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,29,182,65,1,0 // movaps 0x141b6(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,37,64,1,0 // movaps 0x14025(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,168,65,1,0 // movaps 0x141a8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -39564,7 +40014,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,206,69,1,0 // mulps 0x145ce(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,81,71,1,0 // mulps 0x14751(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -39572,7 +40022,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,185,69,1,0 // mulps 0x145b9(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,60,71,1,0 // mulps 0x1473c(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -39581,8 +40031,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,113,68,1,0 // xorps 0x14471(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,89,63,1,0 // mulps 0x13f59(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,244,69,1,0 // xorps 0x145f4(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,220,64,1,0 // mulps 0x140dc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -39603,7 +40053,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,48,69,1,0 // mulps 0x14530(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,179,70,1,0 // mulps 0x146b3(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -39611,7 +40061,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,27,69,1,0 // mulps 0x1451b(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,158,70,1,0 // mulps 0x1469e(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -39620,8 +40070,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,211,67,1,0 // xorps 0x143d3(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,187,62,1,0 // mulps 0x13ebb(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,86,69,1,0 // xorps 0x14556(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,62,64,1,0 // mulps 0x1403e(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -39639,7 +40089,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,163,68,1,0 // mulps 0x144a3(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,38,70,1,0 // mulps 0x14626(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -39647,7 +40097,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,111,67,1,0 // xorps 0x1436f(%rip),%xmm0 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 15,87,5,242,68,1,0 // xorps 0x144f2(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39690,7 +40140,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,245,61,1,0 // movaps 0x13df5(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,120,63,1,0 // movaps 0x13f78(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -39734,8 +40184,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,167,67,1,0 // addps 0x143a7(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,111,61,1,0 // movaps 0x13d6f(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,42,69,1,0 // addps 0x1452a(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,242,62,1,0 // movaps 0x13ef2(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39748,7 +40198,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,62,61,1,0 // addps 0x13d3e(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,5,193,62,1,0 // addps 0x13ec1(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39760,8 +40210,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,96,67,1,0 // addps 0x14360(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,40,61,1,0 // movaps 0x13d28(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,227,68,1,0 // addps 0x144e3(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,171,62,1,0 // movaps 0x13eab(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39774,7 +40224,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,246,60,1,0 // addps 0x13cf6(%rip),%xmm1 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,13,121,62,1,0 // addps 0x13e79(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39786,13 +40236,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,41,67,1,0 // addps 0x14329(%rip),%xmm0 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,225,60,1,0 // movaps 0x13ce1(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,172,68,1,0 // addps 0x144ac(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,100,62,1,0 // movaps 0x13e64(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,29,67,1,0 // mulps 0x1431d(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,181,62,1,0 // addps 0x13eb5(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,160,68,1,0 // mulps 0x144a0(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,56,64,1,0 // addps 0x14038(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39805,16 +40255,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,212,66,1,0 // addps 0x142d4(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,156,60,1,0 // movaps 0x13c9c(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,87,68,1,0 // addps 0x14457(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,31,62,1,0 // movaps 0x13e1f(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,240,66,1,0 // movaps 0x142f0(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,115,68,1,0 // movaps 0x14473(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,244,66,1,0 // addps 0x142f4(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,119,68,1,0 // addps 0x14477(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,104,60,1,0 // addps 0x13c68(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,235,61,1,0 // addps 0x13deb(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,236,66,1,0 // addps 0x142ec(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,111,68,1,0 // addps 0x1446f(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39824,17 +40274,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,70,60,1,0 // movaps 0x13c46(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,201,61,1,0 // movaps 0x13dc9(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,162,66,1,0 // movaps 0x142a2(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,37,68,1,0 // movaps 0x14425(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,166,66,1,0 // addps 0x142a6(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,41,68,1,0 // addps 0x14429(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,162,66,1,0 // addps 0x142a2(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,37,68,1,0 // addps 0x14425(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39846,11 +40296,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,117,66,1,0 // addps 0x14275(%rip),%xmm0 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,5,248,67,1,0 // addps 0x143f8(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,69,66,1,0 // mulps 0x14245(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,221,61,1,0 // addps 0x13ddd(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,200,67,1,0 // mulps 0x143c8(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,96,63,1,0 // addps 0x13f60(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39863,13 +40313,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,11,66,1,0 // addps 0x1420b(%rip),%xmm1 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,195,59,1,0 // movaps 0x13bc3(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,142,67,1,0 // addps 0x1438e(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,70,61,1,0 // movaps 0x13d46(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,255,65,1,0 // mulps 0x141ff(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,151,61,1,0 // addps 0x13d97(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,130,67,1,0 // mulps 0x14382(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,26,63,1,0 // addps 0x13f1a(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39882,16 +40332,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,181,65,1,0 // addps 0x141b5(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,125,59,1,0 // movaps 0x13b7d(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,56,67,1,0 // addps 0x14338(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,0,61,1,0 // movaps 0x13d00(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,209,65,1,0 // movaps 0x141d1(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,84,67,1,0 // movaps 0x14354(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,213,65,1,0 // addps 0x141d5(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,88,67,1,0 // addps 0x14358(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,73,59,1,0 // addps 0x13b49(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,204,60,1,0 // addps 0x13ccc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,205,65,1,0 // addps 0x141cd(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,80,67,1,0 // addps 0x14350(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39901,17 +40351,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,39,59,1,0 // movaps 0x13b27(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,170,60,1,0 // movaps 0x13caa(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,130,65,1,0 // movaps 0x14182(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,5,67,1,0 // movaps 0x14305(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,134,65,1,0 // addps 0x14186(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,9,67,1,0 // addps 0x14309(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,130,65,1,0 // addps 0x14182(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,5,67,1,0 // addps 0x14305(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39923,11 +40373,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,84,65,1,0 // addps 0x14154(%rip),%xmm1 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,13,215,66,1,0 // addps 0x142d7(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,36,65,1,0 // mulps 0x14124(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,188,60,1,0 // addps 0x13cbc(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,167,66,1,0 // mulps 0x142a7(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,63,62,1,0 // addps 0x13e3f(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40074,10 +40524,10 @@ _sk_clut_3D_sse41:
.byte 102,68,15,56,64,227 // pmulld %xmm3,%xmm12
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,15,254,209 // paddd %xmm1,%xmm2
- .byte 102,15,111,37,117,63,1,0 // movdqa 0x13f75(%rip),%xmm4 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,37,248,64,1,0 // movdqa 0x140f8(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
- .byte 102,68,15,111,61,210,56,1,0 // movdqa 0x138d2(%rip),%xmm15 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,61,85,58,1,0 // movdqa 0x13a55(%rip),%xmm15 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,65,15,254,231 // paddd %xmm15,%xmm4
.byte 102,73,15,58,22,225,1 // pextrq $0x1,%xmm4,%r9
@@ -40097,7 +40547,7 @@ _sk_clut_3D_sse41:
.byte 102,65,15,58,22,210,1 // pextrd $0x1,%xmm2,%r10d
.byte 102,65,15,58,22,211,2 // pextrd $0x2,%xmm2,%r11d
.byte 102,65,15,58,22,214,3 // pextrd $0x3,%xmm2,%r14d
- .byte 102,68,15,111,13,132,56,1,0 // movdqa 0x13884(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,13,7,58,1,0 // movdqa 0x13a07(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,209 // paddd %xmm9,%xmm2
.byte 102,73,15,58,22,215,1 // pextrq $0x1,%xmm2,%r15
.byte 102,72,15,126,211 // movq %xmm2,%rbx
@@ -40111,7 +40561,7 @@ _sk_clut_3D_sse41:
.byte 73,193,239,32 // shr $0x20,%r15
.byte 243,66,15,16,20,184 // movss (%rax,%r15,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
- .byte 15,40,45,153,62,1,0 // movaps 0x13e99(%rip),%xmm5 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,45,28,64,1,0 // movaps 0x1401c(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,88,197 // addps %xmm5,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 15,40,215 // movaps %xmm7,%xmm2
@@ -40280,7 +40730,7 @@ _sk_clut_3D_sse41:
.byte 102,68,15,254,232 // paddd %xmm0,%xmm13
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
- .byte 102,15,111,45,88,59,1,0 // movdqa 0x13b58(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,45,219,60,1,0 // movdqa 0x13cdb(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,213 // pmulld %xmm5,%xmm2
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,254,207 // paddd %xmm15,%xmm1
@@ -40386,7 +40836,7 @@ _sk_clut_3D_sse41:
.byte 102,69,15,58,22,225,1 // pextrd $0x1,%xmm12,%r9d
.byte 102,69,15,58,22,226,2 // pextrd $0x2,%xmm12,%r10d
.byte 102,69,15,58,22,227,3 // pextrd $0x3,%xmm12,%r11d
- .byte 102,15,111,21,188,50,1,0 // movdqa 0x132bc(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,21,63,52,1,0 // movdqa 0x1343f(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,68,15,254,226 // paddd %xmm2,%xmm12
.byte 102,76,15,58,22,225,1 // pextrq $0x1,%xmm12,%rcx
.byte 102,76,15,126,226 // movq %xmm12,%rdx
@@ -40565,8 +41015,8 @@ _sk_clut_4D_sse41:
.byte 102,65,15,111,197 // movdqa %xmm13,%xmm0
.byte 102,68,15,127,108,36,176 // movdqa %xmm13,-0x50(%rsp)
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,56,64,5,37,54,1,0 // pmulld 0x13625(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
- .byte 102,68,15,111,29,140,47,1,0 // movdqa 0x12f8c(%rip),%xmm11 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,56,64,5,168,55,1,0 // pmulld 0x137a8(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,68,15,111,29,15,49,1,0 // movdqa 0x1310f(%rip),%xmm11 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,65,15,254,211 // paddd %xmm11,%xmm2
.byte 102,73,15,58,22,209,1 // pextrq $0x1,%xmm2,%r9
@@ -40586,7 +41036,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
.byte 102,65,15,58,22,195,2 // pextrd $0x2,%xmm0,%r11d
.byte 102,65,15,58,22,198,3 // pextrd $0x3,%xmm0,%r14d
- .byte 102,68,15,111,5,62,47,1,0 // movdqa 0x12f3e(%rip),%xmm8 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,5,193,48,1,0 // movdqa 0x130c1(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,73,15,58,22,199,1 // pextrq $0x1,%xmm0,%r15
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -40600,7 +41050,7 @@ _sk_clut_4D_sse41:
.byte 73,193,239,32 // shr $0x20,%r15
.byte 243,66,15,16,4,184 // movss (%rax,%r15,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
- .byte 15,40,53,83,53,1,0 // movaps 0x13553(%rip),%xmm6 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,53,214,54,1,0 // movaps 0x136d6(%rip),%xmm6 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,88,214 // addps %xmm6,%xmm10
.byte 68,15,41,84,36,48 // movaps %xmm10,0x30(%rsp)
.byte 15,88,254 // addps %xmm6,%xmm7
@@ -40613,7 +41063,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,68,15,111,214 // movdqa %xmm6,%xmm10
.byte 102,68,15,127,84,36,160 // movdqa %xmm10,-0x60(%rsp)
- .byte 102,15,56,64,13,36,53,1,0 // pmulld 0x13524(%rip),%xmm1 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,56,64,13,167,54,1,0 // pmulld 0x136a7(%rip),%xmm1 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,73,15,58,22,231,1 // pextrq $0x1,%xmm4,%r15
@@ -40671,11 +41121,11 @@ _sk_clut_4D_sse41:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,5,248,51,1,0 // movdqa 0x133f8(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,123,53,1,0 // movdqa 0x1357b(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,200 // pmulld %xmm0,%xmm1
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,5,81,45,1,0 // movdqa 0x12d51(%rip),%xmm8 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,5,212,46,1,0 // movdqa 0x12ed4(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -40777,7 +41227,7 @@ _sk_clut_4D_sse41:
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,68,15,111,108,36,176 // movdqa -0x50(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,45,205,49,1,0 // movdqa 0x131cd(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,45,80,51,1,0 // movdqa 0x13350(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,205 // pmulld %xmm5,%xmm1
.byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,58,22,202,1 // pextrd $0x1,%xmm1,%edx
@@ -40789,7 +41239,7 @@ _sk_clut_4D_sse41:
.byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,248,42,1,0 // movdqa 0x12af8(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,29,123,44,1,0 // movdqa 0x12c7b(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
.byte 102,72,15,126,210 // movq %xmm2,%rdx
@@ -40837,7 +41287,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
.byte 102,65,15,58,22,198,2 // pextrd $0x2,%xmm0,%r14d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,254,5,38,42,1,0 // paddd 0x12a26(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,169,43,1,0 // paddd 0x12ba9(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
.byte 137,211 // mov %edx,%ebx
@@ -40866,10 +41316,10 @@ _sk_clut_4D_sse41:
.byte 102,15,254,100,36,144 // paddd -0x70(%rsp),%xmm4
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,254,197 // paddd %xmm13,%xmm0
- .byte 102,68,15,111,45,8,48,1,0 // movdqa 0x13008(%rip),%xmm13 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,68,15,111,45,139,49,1,0 // movdqa 0x1318b(%rip),%xmm13 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,65,15,56,64,197 // pmulld %xmm13,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,53,102,41,1,0 // movdqa 0x12966(%rip),%xmm6 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,53,233,42,1,0 // movdqa 0x12ae9(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,202 // movq %xmm1,%rdx
@@ -40887,7 +41337,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,61,38,41,1,0 // movdqa 0x12926(%rip),%xmm7 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,61,169,42,1,0 // movdqa 0x12aa9(%rip),%xmm7 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,199 // paddd %xmm7,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -40904,7 +41354,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
- .byte 102,68,15,111,45,176,40,1,0 // movdqa 0x128b0(%rip),%xmm13 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,45,51,42,1,0 // movdqa 0x12a33(%rip),%xmm13 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,245 // paddd %xmm13,%xmm6
.byte 102,72,15,58,22,241,1 // pextrq $0x1,%xmm6,%rcx
.byte 102,72,15,126,242 // movq %xmm6,%rdx
@@ -40983,7 +41433,7 @@ _sk_clut_4D_sse41:
.byte 102,68,15,111,76,36,176 // movdqa -0x50(%rsp),%xmm9
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,254,194 // paddd %xmm2,%xmm0
- .byte 102,15,111,29,192,45,1,0 // movdqa 0x12dc0(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,67,47,1,0 // movdqa 0x12f43(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,195 // pmulld %xmm3,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,69,15,111,213 // movdqa %xmm13,%xmm10
@@ -41004,7 +41454,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,45,225,38,1,0 // movdqa 0x126e1(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,45,100,40,1,0 // movdqa 0x12864(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -41092,7 +41542,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,225,1 // pextrd $0x1,%xmm4,%r9d
.byte 102,65,15,58,22,226,2 // pextrd $0x2,%xmm4,%r10d
.byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d
- .byte 102,68,15,111,13,29,37,1,0 // movdqa 0x1251d(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,13,160,38,1,0 // movdqa 0x126a0(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,225 // paddd %xmm9,%xmm4
.byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
.byte 102,72,15,126,226 // movq %xmm4,%rdx
@@ -41174,7 +41624,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,76,36,176 // paddd -0x50(%rsp),%xmm1
.byte 102,65,15,56,64,205 // pmulld %xmm13,%xmm1
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,37,86,35,1,0 // movdqa 0x12356(%rip),%xmm12 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,37,217,36,1,0 // movdqa 0x124d9(%rip),%xmm12 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,196 // paddd %xmm12,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -41192,7 +41642,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d
.byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d
.byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d
- .byte 102,15,111,29,21,35,1,0 // movdqa 0x12315(%rip),%xmm3 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,29,152,36,1,0 // movdqa 0x12498(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,202 // movq %xmm1,%rdx
@@ -41261,9 +41711,9 @@ _sk_clut_4D_sse41:
.byte 102,68,15,254,116,36,144 // paddd -0x70(%rsp),%xmm14
.byte 102,15,111,68,36,176 // movdqa -0x50(%rsp),%xmm0
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
- .byte 102,15,56,64,5,22,40,1,0 // pmulld 0x12816(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,56,64,5,153,41,1,0 // pmulld 0x12999(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,5,122,33,1,0 // paddd 0x1217a(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,5,253,34,1,0 // paddd 0x122fd(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
.byte 137,213 // mov %edx,%ebp
@@ -41296,8 +41746,8 @@ _sk_clut_4D_sse41:
.byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
.byte 102,68,15,254,116,36,160 // paddd -0x60(%rsp),%xmm14
- .byte 102,68,15,56,64,53,95,39,1,0 // pmulld 0x1275f(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
- .byte 102,15,111,5,199,32,1,0 // movdqa 0x120c7(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,56,64,53,226,40,1,0 // pmulld 0x128e2(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,5,74,34,1,0 // movdqa 0x1224a(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -41378,7 +41828,7 @@ _sk_clut_4D_sse41:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,72,31,1,0 // movaps 0x11f48(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,203,32,1,0 // movaps 0x120cb(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 76,137,194 // mov %r8,%rdx
.byte 72,139,76,36,240 // mov -0x10(%rsp),%rcx
.byte 76,139,68,36,248 // mov -0x8(%rsp),%r8
@@ -41415,7 +41865,7 @@ _sk_start_pipeline_sse2:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 19960 <_sk_start_pipeline_sse2+0xa1>
+ .byte 115,117 // jae 19ddd <_sk_start_pipeline_sse2+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -41425,7 +41875,7 @@ _sk_start_pipeline_sse2:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,45 // ja 1993c <_sk_start_pipeline_sse2+0x7d>
+ .byte 119,45 // ja 19db9 <_sk_start_pipeline_sse2+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -41439,10 +41889,10 @@ _sk_start_pipeline_sse2:
.byte 73,131,199,8 // add $0x8,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 19913 <_sk_start_pipeline_sse2+0x54>
+ .byte 118,215 // jbe 19d90 <_sk_start_pipeline_sse2+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 19957 <_sk_start_pipeline_sse2+0x98>
+ .byte 116,19 // je 19dd4 <_sk_start_pipeline_sse2+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -41451,7 +41901,7 @@ _sk_start_pipeline_sse2:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 19905 <_sk_start_pipeline_sse2+0x46>
+ .byte 117,165 // jne 19d82 <_sk_start_pipeline_sse2+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -41474,7 +41924,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,61,30,1,0 // movaps 0x11e3d(%rip),%xmm2 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,40,21,192,31,1,0 // movaps 0x11fc0(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -41483,7 +41933,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,44,30,1,0 // movaps 0x11e2c(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,175,31,1,0 // movaps 0x11faf(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -41503,14 +41953,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,250,29,1,0 // movdqa 0x11dfa(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,125,31,1,0 // movdqa 0x11f7d(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,230,29,1,0 // movdqa 0x11de6(%rip),%xmm12 # 2b7f0 <_sk_overlay_sse2_8bit+0xe2f>
- .byte 102,68,15,111,45,237,29,1,0 // movdqa 0x11ded(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,37,105,31,1,0 // movdqa 0x11f69(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b>
+ .byte 102,68,15,111,45,112,31,1,0 // movdqa 0x11f70(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -41526,8 +41976,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,168,29,1,0 // mulps 0x11da8(%rip),%xmm8 # 2b810 <_sk_overlay_sse2_8bit+0xe4f>
- .byte 68,15,88,5,176,29,1,0 // addps 0x11db0(%rip),%xmm8 # 2b820 <_sk_overlay_sse2_8bit+0xe5f>
+ .byte 68,15,89,5,43,31,1,0 // mulps 0x11f2b(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b>
+ .byte 68,15,88,5,51,31,1,0 // addps 0x11f33(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -41569,7 +42019,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,230,28,1,0 // movaps 0x11ce6(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,105,30,1,0 // movaps 0x11e69(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -41580,7 +42030,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,210,28,1,0 // movaps 0x11cd2(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,5,85,30,1,0 // movaps 0x11e55(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -41626,7 +42076,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,130,28,1,0 // movaps 0x11c82(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,5,30,1,0 // movaps 0x11e05(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -41651,7 +42101,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,53,28,1,0 // movaps 0x11c35(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,184,29,1,0 // movaps 0x11db8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -41698,7 +42148,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,201,27,1,0 // movaps 0x11bc9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,76,29,1,0 // movaps 0x11d4c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -41711,7 +42161,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,169,27,1,0 // movaps 0x11ba9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,44,29,1,0 // movaps 0x11d2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -41728,7 +42178,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,124,27,1,0 // movaps 0x11b7c(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,255,28,1,0 // movaps 0x11cff(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -41748,7 +42198,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,64,27,1,0 // movaps 0x11b40(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,195,28,1,0 // movaps 0x11cc3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -41776,7 +42226,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,4,27,1,0 // movaps 0x11b04(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,135,28,1,0 // movaps 0x11c87(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -41814,9 +42264,14 @@ HIDDEN _sk_plus__sse2
FUNCTION(_sk_plus__sse2)
_sk_plus__sse2:
.byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 68,15,40,5,8,28,1,0 // movaps 0x11c08(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 65,15,93,208 // minps %xmm8,%xmm2
.byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 65,15,93,216 // minps %xmm8,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41851,7 +42306,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,41,26,1,0 // movaps 0x11a29(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,148,27,1,0 // movaps 0x11b94(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -41899,7 +42354,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,132,25,1,0 // movaps 0x11984(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,239,26,1,0 // movaps 0x11aef(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -41933,7 +42388,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,25,25,1,0 // movaps 0x11919(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,132,26,1,0 // movaps 0x11a84(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -41970,7 +42425,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,163,24,1,0 // movaps 0x118a3(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,14,26,1,0 // movaps 0x11a0e(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -41998,7 +42453,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,83,24,1,0 // movaps 0x11853(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,190,25,1,0 // movaps 0x119be(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -42011,7 +42466,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,13,54,24,1,0 // movaps 0x11836(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,161,25,1,0 // movaps 0x119a1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -42106,7 +42561,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,222,22,1,0 // movaps 0x116de(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,73,24,1,0 // movaps 0x11849(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -42198,7 +42653,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,135,21,1,0 // movaps 0x11587(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,29,242,22,1,0 // movaps 0x116f2(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -42286,7 +42741,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,69,20,1,0 // movaps 0x11445(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,176,21,1,0 // movaps 0x115b0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -42377,7 +42832,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,242,18,1,0 // movaps 0x112f2(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,93,20,1,0 // movaps 0x1145d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -42390,10 +42845,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,28,19,1,0 // movaps 0x1131c(%rip),%xmm14 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,53,135,20,1,0 // movaps 0x11487(%rip),%xmm14 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,28,19,1,0 // movaps 0x1131c(%rip),%xmm10 # 2b840 <_sk_overlay_sse2_8bit+0xe7f>
+ .byte 68,15,40,21,135,20,1,0 // movaps 0x11487(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0xe8b>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -42538,7 +42993,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,175,16,1,0 // movaps 0x110af(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,26,18,1,0 // movaps 0x1121a(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -42586,12 +43041,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,108,16,1,0 // movaps 0x1106c(%rip),%xmm15 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,61,215,17,1,0 // movaps 0x111d7(%rip),%xmm15 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,113,16,1,0 // movaps 0x11071(%rip),%xmm0 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,5,220,17,1,0 // movaps 0x111dc(%rip),%xmm0 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,115,16,1,0 // movaps 0x11073(%rip),%xmm14 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,53,222,17,1,0 // movaps 0x111de(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -42769,14 +43224,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,197,13,1,0 // movaps 0x10dc5(%rip),%xmm8 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,5,48,15,1,0 // movaps 0x10f30(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,199,13,1,0 // movaps 0x10dc7(%rip),%xmm1 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,13,50,15,1,0 // movaps 0x10f32(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,198,13,1,0 // movaps 0x10dc6(%rip),%xmm12 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,37,49,15,1,0 // movaps 0x10f31(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -42821,7 +43276,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,123,12,1,0 // movaps 0x10c7b(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,230,13,1,0 // movaps 0x10de6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -42922,14 +43377,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,137,11,1,0 // movaps 0x10b89(%rip),%xmm13 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,45,244,12,1,0 // movaps 0x10cf4(%rip),%xmm13 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,137,11,1,0 // movaps 0x10b89(%rip),%xmm14 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,53,244,12,1,0 // movaps 0x10cf4(%rip),%xmm14 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,133,11,1,0 // movaps 0x10b85(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,29,240,12,1,0 // movaps 0x10cf0(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -42937,7 +43392,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,193,10,1,0 // movaps 0x10ac1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,44,12,1,0 // movaps 0x10c2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -43073,15 +43528,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,72,9,1,0 // movaps 0x10948(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,37,179,10,1,0 // movaps 0x10ab3(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,72,9,1,0 // movaps 0x10948(%rip),%xmm13 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,45,179,10,1,0 // movaps 0x10ab3(%rip),%xmm13 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,68,9,1,0 // movaps 0x10944(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
- .byte 68,15,40,5,156,8,1,0 // movaps 0x1089c(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,29,175,10,1,0 // movaps 0x10aaf(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,5,7,10,1,0 // movaps 0x10a07(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -43222,10 +43677,10 @@ _sk_srcover_rgba_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,228,0,0,0 // jne 1b21f <_sk_srcover_rgba_8888_sse2+0x104>
+ .byte 15,133,228,0,0,0 // jne 1b6b4 <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,129 // movdqu (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,53,52,7,1,0 // movdqa 0x10734(%rip),%xmm6 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,53,159,8,1,0 // movdqa 0x1089f(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -43239,9 +43694,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,68,6,1,0 // movaps 0x10644(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,175,7,1,0 // movaps 0x107af(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,24,7,1,0 // movaps 0x10718(%rip),%xmm12 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,37,131,8,1,0 // movaps 0x10883(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -43267,7 +43722,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,84 // jne 1b259 <_sk_srcover_rgba_8888_sse2+0x13e>
+ .byte 117,84 // jne 1b6ee <_sk_srcover_rgba_8888_sse2+0x13e>
.byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -43278,32 +43733,32 @@ _sk_srcover_rgba_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,90 // je 1b286 <_sk_srcover_rgba_8888_sse2+0x16b>
+ .byte 116,90 // je 1b71b <_sk_srcover_rgba_8888_sse2+0x16b>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1b24e <_sk_srcover_rgba_8888_sse2+0x133>
+ .byte 116,23 // je 1b6e3 <_sk_srcover_rgba_8888_sse2+0x133>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,0,255,255,255 // jne 1b141 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 15,133,0,255,255,255 // jne 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,69,15,18,4,129 // movlpd (%r9,%rax,4),%xmm8
- .byte 233,232,254,255,255 // jmpq 1b141 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,232,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,43 // je 1b291 <_sk_srcover_rgba_8888_sse2+0x176>
+ .byte 116,43 // je 1b726 <_sk_srcover_rgba_8888_sse2+0x176>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1b27e <_sk_srcover_rgba_8888_sse2+0x163>
+ .byte 116,18 // je 1b713 <_sk_srcover_rgba_8888_sse2+0x163>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,153 // jne 1b20b <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 117,153 // jne 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,126,76,129,8 // movd %xmm1,0x8(%r9,%rax,4)
.byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4)
- .byte 235,133 // jmp 1b20b <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 235,133 // jmp 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,69,15,110,4,129 // movd (%r9,%rax,4),%xmm8
- .byte 233,176,254,255,255 // jmpq 1b141 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,176,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4)
- .byte 233,111,255,255,255 // jmpq 1b20b <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 233,111,255,255,255 // jmpq 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -43321,7 +43776,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,20,5,1,0 // movaps 0x10514(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,127,6,1,0 // movaps 0x1067f(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -43333,7 +43788,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,249,4,1,0 // minps 0x104f9(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,29,100,6,1,0 // minps 0x10664(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -43344,7 +43799,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,229,4,1,0 // minps 0x104e5(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,61,80,6,1,0 // minps 0x10650(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -43379,7 +43834,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,161,4,1,0 // movaps 0x104a1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,12,6,1,0 // movaps 0x1060c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -43441,7 +43896,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,43,4,1,0 // movaps 0x1042b(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,150,5,1,0 // movaps 0x10596(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -43455,20 +43910,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,246,4,1,0 // movaps 0x104f6(%rip),%xmm8 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,5,97,6,1,0 // movaps 0x10661(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,110,4,1,0 // movaps 0x1046e(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,13,217,5,1,0 // movaps 0x105d9(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,222,4,1,0 // movaps 0x104de(%rip),%xmm10 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,21,73,6,1,0 // movaps 0x10649(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,222,4,1,0 // movaps 0x104de(%rip),%xmm11 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,29,73,6,1,0 // movaps 0x10649(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,226,4,1,0 // movaps 0x104e2(%rip),%xmm12 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,37,77,6,1,0 // movaps 0x1064d(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -43504,20 +43959,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,51,4,1,0 // movaps 0x10433(%rip),%xmm8 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,5,158,5,1,0 // movaps 0x1059e(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,171,3,1,0 // movaps 0x103ab(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,13,22,5,1,0 // movaps 0x10516(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,27,4,1,0 // movaps 0x1041b(%rip),%xmm10 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,21,134,5,1,0 // movaps 0x10586(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,27,4,1,0 // movaps 0x1041b(%rip),%xmm11 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,29,134,5,1,0 // movaps 0x10586(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,31,4,1,0 // movaps 0x1041f(%rip),%xmm12 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,37,138,5,1,0 // movaps 0x1058a(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -43554,22 +44009,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,172,3,1,0 // movaps 0x103ac(%rip),%xmm8 # 2b900 <_sk_overlay_sse2_8bit+0xf3f>
+ .byte 68,15,40,5,23,5,1,0 // movaps 0x10517(%rip),%xmm8 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,172,3,1,0 // movaps 0x103ac(%rip),%xmm9 # 2b910 <_sk_overlay_sse2_8bit+0xf4f>
+ .byte 68,15,40,13,23,5,1,0 // movaps 0x10517(%rip),%xmm9 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,172,3,1,0 // movaps 0x103ac(%rip),%xmm10 # 2b920 <_sk_overlay_sse2_8bit+0xf5f>
+ .byte 68,15,40,21,23,5,1,0 // movaps 0x10517(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,172,3,1,0 // movaps 0x103ac(%rip),%xmm11 # 2b930 <_sk_overlay_sse2_8bit+0xf6f>
+ .byte 68,15,40,29,23,5,1,0 // movaps 0x10517(%rip),%xmm11 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,176,3,1,0 // movaps 0x103b0(%rip),%xmm12 # 2b940 <_sk_overlay_sse2_8bit+0xf7f>
+ .byte 68,15,40,37,27,5,1,0 // movaps 0x1051b(%rip),%xmm12 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,172,3,1,0 // movaps 0x103ac(%rip),%xmm15 # 2b950 <_sk_overlay_sse2_8bit+0xf8f>
+ .byte 68,15,40,61,23,5,1,0 // movaps 0x10517(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -43611,15 +44066,17 @@ FUNCTION(_sk_rgb_to_hsl_sse2)
_sk_rgb_to_hsl_sse2:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,95,194 // maxps %xmm2,%xmm0
.byte 69,15,40,208 // movaps %xmm8,%xmm10
- .byte 69,15,95,209 // maxps %xmm9,%xmm10
- .byte 68,15,95,210 // maxps %xmm2,%xmm10
+ .byte 68,15,95,208 // maxps %xmm0,%xmm10
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,93,194 // minps %xmm2,%xmm0
.byte 69,15,40,216 // movaps %xmm8,%xmm11
- .byte 69,15,93,217 // minps %xmm9,%xmm11
- .byte 68,15,93,218 // minps %xmm2,%xmm11
+ .byte 68,15,93,216 // minps %xmm0,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,117,1,1,0 // movaps 0x10175(%rip),%xmm13 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,45,218,2,1,0 // movaps 0x102da(%rip),%xmm13 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -43628,30 +44085,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,219,2,1,0 // andps 0x102db(%rip),%xmm14 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 68,15,84,53,64,4,1,0 // andps 0x10440(%rip),%xmm14 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,206,2,1,0 // movaps 0x102ce(%rip),%xmm12 # 2b970 <_sk_overlay_sse2_8bit+0xfaf>
+ .byte 68,15,40,37,51,4,1,0 // movaps 0x10433(%rip),%xmm12 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,202,2,1,0 // addps 0x102ca(%rip),%xmm8 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 68,15,88,5,47,4,1,0 // addps 0x1042f(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,187,2,1,0 // mulps 0x102bb(%rip),%xmm0 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 15,89,5,32,4,1,0 // mulps 0x10420(%rip),%xmm0 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,206,0,1,0 // movaps 0x100ce(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,51,2,1,0 // movaps 0x10233(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -43675,7 +44132,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,125,0,1,0 // movaps 0x1007d(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,226,1,1,0 // movaps 0x101e2(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -43692,28 +44149,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,22,2,1,0 // movaps 0x10216(%rip),%xmm0 # 2b9a0 <_sk_overlay_sse2_8bit+0xfdf>
+ .byte 15,40,5,123,3,1,0 // movaps 0x1037b(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,46,0,1,0 // andps 0x1002e(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,84,29,147,1,1,0 // andps 0x10193(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,0,2,1,0 // movaps 0x10200(%rip),%xmm13 # 2b9b0 <_sk_overlay_sse2_8bit+0xfef>
+ .byte 68,15,40,45,101,3,1,0 // movaps 0x10365(%rip),%xmm13 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,192,1,1,0 // movaps 0x101c0(%rip),%xmm2 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 15,40,21,37,3,1,0 // movaps 0x10325(%rip),%xmm2 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,128,1,1,0 // movaps 0x10180(%rip),%xmm1 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 15,40,13,229,2,1,0 // movaps 0x102e5(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,150,1,1,0 // movaps 0x10196(%rip),%xmm5 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 15,40,45,251,2,1,0 // movaps 0x102fb(%rip),%xmm5 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -43736,7 +44193,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,139,255,0,0 // andps 0xff8b(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,84,29,240,0,1,0 // andps 0x100f0(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -43766,12 +44223,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,3,1,1,0 // addps 0x10103(%rip),%xmm6 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 15,88,53,104,2,1,0 // addps 0x10268(%rip),%xmm6 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,254,254,0,0 // andps 0xfefe(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,84,29,99,0,1,0 // andps 0x10063(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -43835,13 +44292,13 @@ _sk_scale_u8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,61 // jne 1b9d3 <_sk_scale_u8_sse2+0x55>
+ .byte 117,61 // jne 1be6e <_sk_scale_u8_sse2+0x55>
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,209,254,0,0 // pand 0xfed1(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,54,0,1,0 // pand 0x10036(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,21,0,1,0 // mulps 0x10015(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,122,1,1,0 // mulps 0x1017a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -43852,12 +44309,12 @@ _sk_scale_u8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,61 // je 1ba1d <_sk_scale_u8_sse2+0x9f>
+ .byte 116,61 // je 1beb8 <_sk_scale_u8_sse2+0x9f>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1ba02 <_sk_scale_u8_sse2+0x84>
+ .byte 116,23 // je 1be9d <_sk_scale_u8_sse2+0x84>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,181 // jne 1b9a6 <_sk_scale_u8_sse2+0x28>
+ .byte 117,181 // jne 1be41 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -43866,10 +44323,79 @@ _sk_scale_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 235,137 // jmp 1b9a6 <_sk_scale_u8_sse2+0x28>
+ .byte 235,137 // jmp 1be41 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,122,255,255,255 // jmpq 1b9a6 <_sk_scale_u8_sse2+0x28>
+ .byte 233,122,255,255,255 // jmpq 1be41 <_sk_scale_u8_sse2+0x28>
+
+HIDDEN _sk_scale_565_sse2
+.globl _sk_scale_565_sse2
+FUNCTION(_sk_scale_565_sse2)
+_sk_scale_565_sse2:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,173,0,0,0 // jne 1bf93 <_sk_scale_565_sse2+0xcc>
+ .byte 243,71,15,126,20,89 // movq (%r9,%r11,2),%xmm10
+ .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
+ .byte 102,68,15,111,5,230,0,1,0 // movdqa 0x100e6(%rip),%xmm8 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,69,15,219,194 // pand %xmm10,%xmm8
+ .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
+ .byte 68,15,89,5,229,0,1,0 // mulps 0x100e5(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,68,15,111,13,236,0,1,0 // movdqa 0x100ec(%rip),%xmm9 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,69,15,219,202 // pand %xmm10,%xmm9
+ .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
+ .byte 68,15,89,13,235,0,1,0 // mulps 0x100eb(%rip),%xmm9 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,21,242,0,1,0 // pand 0x100f2(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
+ .byte 68,15,89,21,246,0,1,0 // mulps 0x100f6(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,40,219 // movaps %xmm3,%xmm11
+ .byte 68,15,194,223,1 // cmpltps %xmm7,%xmm11
+ .byte 69,15,40,225 // movaps %xmm9,%xmm12
+ .byte 69,15,93,226 // minps %xmm10,%xmm12
+ .byte 69,15,40,232 // movaps %xmm8,%xmm13
+ .byte 69,15,93,236 // minps %xmm12,%xmm13
+ .byte 69,15,40,225 // movaps %xmm9,%xmm12
+ .byte 69,15,95,226 // maxps %xmm10,%xmm12
+ .byte 69,15,40,240 // movaps %xmm8,%xmm14
+ .byte 69,15,95,244 // maxps %xmm12,%xmm14
+ .byte 69,15,84,235 // andps %xmm11,%xmm13
+ .byte 69,15,85,222 // andnps %xmm14,%xmm11
+ .byte 69,15,86,221 // orps %xmm13,%xmm11
+ .byte 68,15,89,192 // mulps %xmm0,%xmm8
+ .byte 68,15,89,201 // mulps %xmm1,%xmm9
+ .byte 68,15,89,210 // mulps %xmm2,%xmm10
+ .byte 68,15,89,219 // mulps %xmm3,%xmm11
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 65,15,40,201 // movaps %xmm9,%xmm1
+ .byte 65,15,40,210 // movaps %xmm10,%xmm2
+ .byte 65,15,40,219 // movaps %xmm11,%xmm3
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,3 // and $0x3,%r10b
+ .byte 65,128,250,1 // cmp $0x1,%r10b
+ .byte 116,59 // je 1bfdb <_sk_scale_565_sse2+0x114>
+ .byte 102,69,15,239,210 // pxor %xmm10,%xmm10
+ .byte 65,128,250,2 // cmp $0x2,%r10b
+ .byte 116,27 // je 1bfc6 <_sk_scale_565_sse2+0xff>
+ .byte 65,128,250,3 // cmp $0x3,%r10b
+ .byte 15,133,60,255,255,255 // jne 1bef1 <_sk_scale_565_sse2+0x2a>
+ .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10
+ .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8
+ .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
+ .byte 242,69,15,16,208 // movsd %xmm8,%xmm10
+ .byte 233,22,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a>
+ .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
+ .byte 102,68,15,110,208 // movd %eax,%xmm10
+ .byte 233,7,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -43904,13 +44430,13 @@ _sk_lerp_u8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,81 // jne 1bacd <_sk_lerp_u8_sse2+0x69>
+ .byte 117,81 // jne 1c08b <_sk_lerp_u8_sse2+0x69>
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,235,253,0,0 // pand 0xfdeb(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,45,254,0,0 // pand 0xfe2d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,47,255,0,0 // mulps 0xff2f(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,113,255,0,0 // mulps 0xff71(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -43928,12 +44454,12 @@ _sk_lerp_u8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,64 // je 1bb1a <_sk_lerp_u8_sse2+0xb6>
+ .byte 116,64 // je 1c0d8 <_sk_lerp_u8_sse2+0xb6>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1bafc <_sk_lerp_u8_sse2+0x98>
+ .byte 116,23 // je 1c0ba <_sk_lerp_u8_sse2+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,161 // jne 1ba8c <_sk_lerp_u8_sse2+0x28>
+ .byte 117,161 // jne 1c04a <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -43942,10 +44468,10 @@ _sk_lerp_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 233,114,255,255,255 // jmpq 1ba8c <_sk_lerp_u8_sse2+0x28>
+ .byte 233,114,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,99,255,255,255 // jmpq 1ba8c <_sk_lerp_u8_sse2+0x28>
+ .byte 233,99,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -43959,60 +44485,64 @@ _sk_lerp_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,156,0,0,0 // jne 1bbe4 <_sk_lerp_565_sse2+0xbb>
- .byte 243,71,15,126,12,89 // movq (%r9,%r11,2),%xmm9
- .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
- .byte 102,68,15,111,5,132,254,0,0 // movdqa 0xfe84(%rip),%xmm8 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
- .byte 102,69,15,219,193 // pand %xmm9,%xmm8
- .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,131,254,0,0 // mulps 0xfe83(%rip),%xmm8 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,68,15,111,21,138,254,0,0 // movdqa 0xfe8a(%rip),%xmm10 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
- .byte 102,69,15,219,209 // pand %xmm9,%xmm10
- .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,137,254,0,0 // mulps 0xfe89(%rip),%xmm10 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,68,15,219,13,144,254,0,0 // pand 0xfe90(%rip),%xmm9 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,133,173,0,0,0 // jne 1c1b3 <_sk_lerp_565_sse2+0xcc>
+ .byte 243,71,15,126,4,89 // movq (%r9,%r11,2),%xmm8
+ .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
+ .byte 102,68,15,111,13,198,254,0,0 // movdqa 0xfec6(%rip),%xmm9 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,69,15,219,200 // pand %xmm8,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,148,254,0,0 // mulps 0xfe94(%rip),%xmm9 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 68,15,89,13,197,254,0,0 // mulps 0xfec5(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,68,15,111,21,204,254,0,0 // movdqa 0xfecc(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,69,15,219,208 // pand %xmm8,%xmm10
+ .byte 69,15,91,218 // cvtdq2ps %xmm10,%xmm11
+ .byte 68,15,89,29,203,254,0,0 // mulps 0xfecb(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,5,210,254,0,0 // pand 0xfed2(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
+ .byte 68,15,89,5,214,254,0,0 // mulps 0xfed6(%rip),%xmm8 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,40,211 // movaps %xmm3,%xmm10
+ .byte 68,15,194,215,1 // cmpltps %xmm7,%xmm10
+ .byte 69,15,40,227 // movaps %xmm11,%xmm12
+ .byte 15,92,205 // subps %xmm5,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 69,15,93,216 // minps %xmm8,%xmm11
+ .byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 65,15,89,193 // mulps %xmm9,%xmm0
+ .byte 69,15,93,203 // minps %xmm11,%xmm9
+ .byte 69,15,95,224 // maxps %xmm8,%xmm12
+ .byte 69,15,95,236 // maxps %xmm12,%xmm13
+ .byte 69,15,84,202 // andps %xmm10,%xmm9
+ .byte 69,15,85,213 // andnps %xmm13,%xmm10
+ .byte 69,15,86,209 // orps %xmm9,%xmm10
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,92,205 // subps %xmm5,%xmm1
- .byte 65,15,89,202 // mulps %xmm10,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,92,214 // subps %xmm6,%xmm2
- .byte 65,15,89,209 // mulps %xmm9,%xmm2
+ .byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,92,223 // subps %xmm7,%xmm3
- .byte 68,15,89,195 // mulps %xmm3,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,88,215 // addps %xmm7,%xmm10
- .byte 65,15,89,217 // mulps %xmm9,%xmm3
+ .byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,95,211 // maxps %xmm3,%xmm10
- .byte 69,15,95,194 // maxps %xmm10,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 1bc2c <_sk_lerp_565_sse2+0x103>
- .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
+ .byte 116,59 // je 1c1fb <_sk_lerp_565_sse2+0x114>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,27 // je 1bc17 <_sk_lerp_565_sse2+0xee>
+ .byte 116,27 // je 1c1e6 <_sk_lerp_565_sse2+0xff>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,77,255,255,255 // jne 1bb53 <_sk_lerp_565_sse2+0x2a>
+ .byte 15,133,60,255,255,255 // jne 1c111 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 102,69,15,112,200,69 // pshufd $0x45,%xmm8,%xmm9
- .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8
- .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 242,69,15,16,200 // movsd %xmm8,%xmm9
- .byte 233,39,255,255,255 // jmpq 1bb53 <_sk_lerp_565_sse2+0x2a>
+ .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
+ .byte 102,71,15,110,12,89 // movd (%r9,%r11,2),%xmm9
+ .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
+ .byte 242,69,15,16,193 // movsd %xmm9,%xmm8
+ .byte 233,22,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
- .byte 102,68,15,110,200 // movd %eax,%xmm9
- .byte 233,24,255,255,255 // jmpq 1bb53 <_sk_lerp_565_sse2+0x2a>
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 233,7,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -44021,12 +44551,12 @@ _sk_load_tables_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,36,1,0,0 // jne 1bd6d <_sk_load_tables_sse2+0x132>
+ .byte 15,133,36,1,0,0 // jne 1c33c <_sk_load_tables_sse2+0x132>
.byte 243,69,15,111,12,145 // movdqu (%r9,%rdx,4),%xmm9
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,35,252,0,0 // movdqa 0xfc23(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,111,5,84,252,0,0 // movdqa 0xfc54(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -44082,7 +44612,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,108,252,0,0 // mulps 0xfc6c(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,157,252,0,0 // mulps 0xfc9d(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -44091,18 +44621,18 @@ _sk_load_tables_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 1bda7 <_sk_load_tables_sse2+0x16c>
+ .byte 116,45 // je 1c376 <_sk_load_tables_sse2+0x16c>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1bd9c <_sk_load_tables_sse2+0x161>
+ .byte 116,23 // je 1c36b <_sk_load_tables_sse2+0x161>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,192,254,255,255 // jne 1bc4f <_sk_load_tables_sse2+0x14>
+ .byte 15,133,192,254,255,255 // jne 1c21e <_sk_load_tables_sse2+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,145 // movlpd (%r9,%rdx,4),%xmm9
- .byte 233,168,254,255,255 // jmpq 1bc4f <_sk_load_tables_sse2+0x14>
+ .byte 233,168,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14>
.byte 102,69,15,110,12,145 // movd (%r9,%rdx,4),%xmm9
- .byte 233,157,254,255,255 // jmpq 1bc4f <_sk_load_tables_sse2+0x14>
+ .byte 233,157,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -44112,7 +44642,7 @@ _sk_load_tables_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,101,1,0,0 // jne 1bf2d <_sk_load_tables_u16_be_sse2+0x17b>
+ .byte 15,133,101,1,0,0 // jne 1c4fc <_sk_load_tables_u16_be_sse2+0x17b>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 102,67,15,16,76,81,16 // movupd 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -44124,7 +44654,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,65,252,0,0 // movdqa 0xfc41(%rip),%xmm10 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,21,114,252,0,0 // movdqa 0xfc72(%rip),%xmm10 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -44186,7 +44716,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,60,251,0,0 // mulps 0xfb3c(%rip),%xmm3 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 15,89,29,109,251,0,0 // mulps 0xfb6d(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -44194,17 +44724,17 @@ _sk_load_tables_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1bf4a <_sk_load_tables_u16_be_sse2+0x198>
+ .byte 117,17 // jne 1c519 <_sk_load_tables_u16_be_sse2+0x198>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,139,254,255,255 // jmpq 1bdd5 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,139,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,118,254,255,255 // jb 1bdd5 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 15,130,118,254,255,255 // jb 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 242,67,15,16,76,81,16 // movsd 0x10(%r9,%r10,2),%xmm1
- .byte 233,106,254,255,255 // jmpq 1bdd5 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,106,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -44214,7 +44744,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,84,1,0,0 // jne 1c0d1 <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ .byte 15,133,84,1,0,0 // jne 1c6a0 <_sk_load_tables_rgb_u16_be_sse2+0x166>
.byte 243,71,15,111,28,81 // movdqu (%r9,%r10,2),%xmm11
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -44229,7 +44759,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,123,250,0,0 // movdqa 0xfa7b(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,5,172,250,0,0 // movdqa 0xfaac(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -44285,7 +44815,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,6,247,0,0 // movaps 0xf706(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,55,247,0,0 // movaps 0xf737(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -44294,21 +44824,21 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,71,15,196,92,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 1c0f7 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ .byte 117,14 // jne 1c6c6 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
- .byte 233,172,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,172,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,71,15,110,84,81,6 // movd 0x6(%r9,%r10,2),%xmm10
.byte 102,71,15,196,84,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 1c128 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ .byte 114,24 // jb 1c6f7 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,123,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,123,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,114,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,114,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -44319,7 +44849,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,111,247,0,0 // movaps 0xf76f(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,160,247,0,0 // movaps 0xf7a0(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -44347,7 +44877,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,25,248,0,0 // movaps 0xf819(%rip),%xmm10 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,21,74,248,0,0 // movaps 0xf84a(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -44468,7 +44998,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,81,246,0,0 // movaps 0xf651(%rip),%xmm10 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,21,130,246,0,0 // movaps 0xf682(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -44675,15 +45205,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,37,244,0,0 // mulps 0xf425(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,45,244,0,0 // andps 0xf42d(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,85,241,0,0 // orps 0xf155(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,45,244,0,0 // addps 0xf42d(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,53,244,0,0 // movaps 0xf435(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,86,244,0,0 // mulps 0xf456(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,94,244,0,0 // andps 0xf45e(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,134,241,0,0 // orps 0xf186(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,94,244,0,0 // addps 0xf45e(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,102,244,0,0 // movaps 0xf466(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,53,244,0,0 // addps 0xf435(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,61,244,0,0 // movaps 0xf43d(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,102,244,0,0 // addps 0xf466(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,110,244,0,0 // movaps 0xf46e(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44691,22 +45221,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,23,241,0,0 // movaps 0xf117(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,72,241,0,0 // movaps 0xf148(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,11,244,0,0 // addps 0xf40b(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,19,244,0,0 // movaps 0xf413(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,60,244,0,0 // addps 0xf43c(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,19,244,0,0 // movaps 0xf413(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,23,244,0,0 // movaps 0xf417(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,72,244,0,0 // movaps 0xf448(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,23,244,0,0 // mulps 0xf417(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,72,244,0,0 // mulps 0xf448(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44742,15 +45272,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,231,242,0,0 // mulps 0xf2e7(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,239,242,0,0 // andps 0xf2ef(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,23,240,0,0 // orps 0xf017(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,239,242,0,0 // addps 0xf2ef(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,247,242,0,0 // movaps 0xf2f7(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,24,243,0,0 // mulps 0xf318(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,32,243,0,0 // andps 0xf320(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,72,240,0,0 // orps 0xf048(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,32,243,0,0 // addps 0xf320(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,40,243,0,0 // movaps 0xf328(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,247,242,0,0 // addps 0xf2f7(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,255,242,0,0 // movaps 0xf2ff(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,40,243,0,0 // addps 0xf328(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,48,243,0,0 // movaps 0xf330(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44758,22 +45288,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,217,239,0,0 // movaps 0xefd9(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,10,240,0,0 // movaps 0xf00a(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,205,242,0,0 // addps 0xf2cd(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,213,242,0,0 // movaps 0xf2d5(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,254,242,0,0 // addps 0xf2fe(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,213,242,0,0 // movaps 0xf2d5(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,217,242,0,0 // movaps 0xf2d9(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,10,243,0,0 // movaps 0xf30a(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,217,242,0,0 // mulps 0xf2d9(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,10,243,0,0 // mulps 0xf30a(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44809,15 +45339,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,169,241,0,0 // mulps 0xf1a9(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,177,241,0,0 // andps 0xf1b1(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,217,238,0,0 // orps 0xeed9(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,177,241,0,0 // addps 0xf1b1(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,185,241,0,0 // movaps 0xf1b9(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,218,241,0,0 // mulps 0xf1da(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,226,241,0,0 // andps 0xf1e2(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,10,239,0,0 // orps 0xef0a(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,226,241,0,0 // addps 0xf1e2(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,234,241,0,0 // movaps 0xf1ea(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,185,241,0,0 // addps 0xf1b9(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,193,241,0,0 // movaps 0xf1c1(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,234,241,0,0 // addps 0xf1ea(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,242,241,0,0 // movaps 0xf1f2(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44825,22 +45355,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,155,238,0,0 // movaps 0xee9b(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,204,238,0,0 // movaps 0xeecc(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,143,241,0,0 // addps 0xf18f(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,151,241,0,0 // movaps 0xf197(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,192,241,0,0 // addps 0xf1c0(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,151,241,0,0 // movaps 0xf197(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,155,241,0,0 // movaps 0xf19b(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,204,241,0,0 // movaps 0xf1cc(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,155,241,0,0 // mulps 0xf19b(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,204,241,0,0 // mulps 0xf1cc(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44876,15 +45406,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,107,240,0,0 // mulps 0xf06b(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,115,240,0,0 // andps 0xf073(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,155,237,0,0 // orps 0xed9b(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,115,240,0,0 // addps 0xf073(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,123,240,0,0 // movaps 0xf07b(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,156,240,0,0 // mulps 0xf09c(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,164,240,0,0 // andps 0xf0a4(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,204,237,0,0 // orps 0xedcc(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,164,240,0,0 // addps 0xf0a4(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,172,240,0,0 // movaps 0xf0ac(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,123,240,0,0 // addps 0xf07b(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,131,240,0,0 // movaps 0xf083(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,172,240,0,0 // addps 0xf0ac(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,180,240,0,0 // movaps 0xf0b4(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44892,22 +45422,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,93,237,0,0 // movaps 0xed5d(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,142,237,0,0 // movaps 0xed8e(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,81,240,0,0 // addps 0xf051(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,89,240,0,0 // movaps 0xf059(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,130,240,0,0 // addps 0xf082(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,89,240,0,0 // movaps 0xf059(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,93,240,0,0 // movaps 0xf05d(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,142,240,0,0 // movaps 0xf08e(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,93,240,0,0 // mulps 0xf05d(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,142,240,0,0 // mulps 0xf08e(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44932,19 +45462,19 @@ _sk_gamma_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,104,239,0,0 // mulps 0xef68(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,21,113,239,0,0 // andps 0xef71(%rip),%xmm2 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,40,53,153,236,0,0 // movaps 0xec99(%rip),%xmm14 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,89,5,153,239,0,0 // mulps 0xef99(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,21,162,239,0,0 // andps 0xefa2(%rip),%xmm2 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,40,53,202,236,0,0 // movaps 0xecca(%rip),%xmm14 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,86,214 // orps %xmm14,%xmm2
- .byte 68,15,40,37,109,239,0,0 // movaps 0xef6d(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
+ .byte 68,15,40,37,158,239,0,0 // movaps 0xef9e(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
.byte 65,15,88,196 // addps %xmm12,%xmm0
- .byte 68,15,40,29,113,239,0,0 // movaps 0xef71(%rip),%xmm11 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,40,29,162,239,0,0 // movaps 0xefa2(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,21,111,239,0,0 // movaps 0xef6f(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
+ .byte 68,15,40,21,160,239,0,0 // movaps 0xefa0(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
.byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 68,15,40,45,115,239,0,0 // movaps 0xef73(%rip),%xmm13 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,40,45,164,239,0,0 // movaps 0xefa4(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44956,27 +45486,27 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,226,1 // cmpltps %xmm2,%xmm4
- .byte 68,15,40,13,67,236,0,0 // movaps 0xec43(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,116,236,0,0 // movaps 0xec74(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,84,225 // andps %xmm9,%xmm4
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,63,239,0,0 // movaps 0xef3f(%rip),%xmm6 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
+ .byte 15,40,53,112,239,0,0 // movaps 0xef70(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,85,239,0,0 // movaps 0xef55(%rip),%xmm7 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 15,40,61,134,239,0,0 // movaps 0xef86(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,53,239,0,0 // movaps 0xef35(%rip),%xmm4 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 15,40,37,102,239,0,0 // movaps 0xef66(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,71,239,0,0 // movaps 0xef47(%rip),%xmm15 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,61,120,239,0,0 // movaps 0xef78(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,163,238,0,0 // mulps 0xeea3(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,13,172,238,0,0 // andps 0xeeac(%rip),%xmm1 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
+ .byte 15,89,5,212,238,0,0 // mulps 0xeed4(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,13,221,238,0,0 // andps 0xeedd(%rip),%xmm1 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
.byte 65,15,86,206 // orps %xmm14,%xmm1
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
@@ -45006,9 +45536,9 @@ _sk_gamma_sse2:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,50,238,0,0 // mulps 0xee32(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,29,59,238,0,0 // andps 0xee3b(%rip),%xmm3 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 15,86,29,100,235,0,0 // orps 0xeb64(%rip),%xmm3 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,89,5,99,238,0,0 // mulps 0xee63(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,29,108,238,0,0 // andps 0xee6c(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,86,29,149,235,0,0 // orps 0xeb95(%rip),%xmm3 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
.byte 65,15,92,195 // subps %xmm11,%xmm0
@@ -45030,7 +45560,7 @@ _sk_gamma_sse2:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,113,238,0,0 // movaps 0xee71(%rip),%xmm0 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,40,5,162,238,0,0 // movaps 0xeea2(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -45049,29 +45579,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,70,238,0,0 // mulps 0xee46(%rip),%xmm0 # 2bb30 <_sk_overlay_sse2_8bit+0x116f>
- .byte 68,15,40,5,190,235,0,0 // movaps 0xebbe(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 15,89,5,119,238,0,0 // mulps 0xee77(%rip),%xmm0 # 2c130 <_sk_overlay_sse2_8bit+0x117b>
+ .byte 68,15,40,5,239,235,0,0 // movaps 0xebef(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,66,238,0,0 // movaps 0xee42(%rip),%xmm9 # 2bb40 <_sk_overlay_sse2_8bit+0x117f>
+ .byte 68,15,40,13,115,238,0,0 // movaps 0xee73(%rip),%xmm9 # 2c140 <_sk_overlay_sse2_8bit+0x118b>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,63,238,0,0 // addps 0xee3f(%rip),%xmm0 # 2bb50 <_sk_overlay_sse2_8bit+0x118f>
- .byte 15,89,5,72,238,0,0 // mulps 0xee48(%rip),%xmm0 # 2bb60 <_sk_overlay_sse2_8bit+0x119f>
- .byte 15,89,13,81,238,0,0 // mulps 0xee51(%rip),%xmm1 # 2bb70 <_sk_overlay_sse2_8bit+0x11af>
+ .byte 15,88,5,112,238,0,0 // addps 0xee70(%rip),%xmm0 # 2c150 <_sk_overlay_sse2_8bit+0x119b>
+ .byte 15,89,5,121,238,0,0 // mulps 0xee79(%rip),%xmm0 # 2c160 <_sk_overlay_sse2_8bit+0x11ab>
+ .byte 15,89,13,130,238,0,0 // mulps 0xee82(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,87,238,0,0 // mulps 0xee57(%rip),%xmm2 # 2bb80 <_sk_overlay_sse2_8bit+0x11bf>
+ .byte 15,89,21,136,238,0,0 // mulps 0xee88(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,76,238,0,0 // movaps 0xee4c(%rip),%xmm2 # 2bb90 <_sk_overlay_sse2_8bit+0x11cf>
+ .byte 15,40,21,125,238,0,0 // movaps 0xee7d(%rip),%xmm2 # 2c190 <_sk_overlay_sse2_8bit+0x11db>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,75,238,0,0 // movaps 0xee4b(%rip),%xmm10 # 2bba0 <_sk_overlay_sse2_8bit+0x11df>
+ .byte 68,15,40,21,124,238,0,0 // movaps 0xee7c(%rip),%xmm10 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,79,238,0,0 // movaps 0xee4f(%rip),%xmm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x11ef>
+ .byte 68,15,40,29,128,238,0,0 // movaps 0xee80(%rip),%xmm11 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -45095,8 +45625,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,255,237,0,0 // mulps 0xedff(%rip),%xmm8 # 2bbc0 <_sk_overlay_sse2_8bit+0x11ff>
- .byte 15,89,21,8,238,0,0 // mulps 0xee08(%rip),%xmm2 # 2bbd0 <_sk_overlay_sse2_8bit+0x120f>
+ .byte 68,15,89,5,48,238,0,0 // mulps 0xee30(%rip),%xmm8 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b>
+ .byte 15,89,21,57,238,0,0 // mulps 0xee39(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -45112,13 +45642,13 @@ _sk_load_a8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 1ce16 <_sk_load_a8_sse2+0x46>
+ .byte 117,46 // jne 1d3e5 <_sk_load_a8_sse2+0x46>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,130,234,0,0 // pand 0xea82(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,179,234,0,0 // pand 0xeab3(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,200,235,0,0 // mulps 0xebc8(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,249,235,0,0 // mulps 0xebf9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -45127,12 +45657,12 @@ _sk_load_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1ce59 <_sk_load_a8_sse2+0x89>
+ .byte 116,54 // je 1d428 <_sk_load_a8_sse2+0x89>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1ce42 <_sk_load_a8_sse2+0x72>
+ .byte 116,21 // je 1d411 <_sk_load_a8_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 1cdf6 <_sk_load_a8_sse2+0x26>
+ .byte 117,195 // jne 1d3c5 <_sk_load_a8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -45141,10 +45671,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,157 // jmp 1cdf6 <_sk_load_a8_sse2+0x26>
+ .byte 235,157 // jmp 1d3c5 <_sk_load_a8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,146 // jmp 1cdf6 <_sk_load_a8_sse2+0x26>
+ .byte 235,146 // jmp 1d3c5 <_sk_load_a8_sse2+0x26>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -45157,13 +45687,13 @@ _sk_load_a8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 1ceaa <_sk_load_a8_dst_sse2+0x46>
+ .byte 117,46 // jne 1d479 <_sk_load_a8_dst_sse2+0x46>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,238,233,0,0 // pand 0xe9ee(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,31,234,0,0 // pand 0xea1f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,52,235,0,0 // mulps 0xeb34(%rip),%xmm7 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,61,101,235,0,0 // mulps 0xeb65(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -45172,12 +45702,12 @@ _sk_load_a8_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1ceed <_sk_load_a8_dst_sse2+0x89>
+ .byte 116,54 // je 1d4bc <_sk_load_a8_dst_sse2+0x89>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1ced6 <_sk_load_a8_dst_sse2+0x72>
+ .byte 116,21 // je 1d4a5 <_sk_load_a8_dst_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 1ce8a <_sk_load_a8_dst_sse2+0x26>
+ .byte 117,195 // jne 1d459 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -45186,10 +45716,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,157 // jmp 1ce8a <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,157 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,146 // jmp 1ce8a <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,146 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -45231,7 +45761,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,69,234,0,0 // mulps 0xea45(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,118,234,0,0 // mulps 0xea76(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -45250,7 +45780,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,249,232,0,0 // movaps 0xe8f9(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,42,233,0,0 // movaps 0xe92a(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -45258,7 +45788,7 @@ _sk_store_a8_sse2:
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 1cfe8 <_sk_store_a8_sse2+0x4c>
+ .byte 117,13 // jne 1d5b7 <_sk_store_a8_sse2+0x4c>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -45268,24 +45798,24 @@ _sk_store_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 1d03a <_sk_store_a8_sse2+0x9e>
+ .byte 116,59 // je 1d609 <_sk_store_a8_sse2+0x9e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 1d01b <_sk_store_a8_sse2+0x7f>
+ .byte 116,22 // je 1d5ea <_sk_store_a8_sse2+0x7f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,217 // jne 1cfe4 <_sk_store_a8_sse2+0x48>
+ .byte 117,217 // jne 1d5b3 <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,25,2 // mov %al,0x2(%r9,%r11,1)
- .byte 102,68,15,219,5,92,232,0,0 // pand 0xe85c(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,141,232,0,0 // pand 0xe88d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,25 // mov %ax,(%r9,%r11,1)
- .byte 235,170 // jmp 1cfe4 <_sk_store_a8_sse2+0x48>
+ .byte 235,170 // jmp 1d5b3 <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
.byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 67,136,4,25 // mov %al,(%r9,%r11,1)
- .byte 235,153 // jmp 1cfe4 <_sk_store_a8_sse2+0x48>
+ .byte 235,153 // jmp 1d5b3 <_sk_store_a8_sse2+0x48>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -45298,27 +45828,27 @@ _sk_load_g8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 1d094 <_sk_load_g8_sse2+0x49>
+ .byte 117,49 // jne 1d663 <_sk_load_g8_sse2+0x49>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,7,232,0,0 // pand 0xe807(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,56,232,0,0 // pand 0xe838(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,77,233,0,0 // mulps 0xe94d(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,126,233,0,0 // mulps 0xe97e(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,68,231,0,0 // movaps 0xe744(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,117,231,0,0 // movaps 0xe775(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d0d7 <_sk_load_g8_sse2+0x8c>
+ .byte 116,54 // je 1d6a6 <_sk_load_g8_sse2+0x8c>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d0c0 <_sk_load_g8_sse2+0x75>
+ .byte 116,21 // je 1d68f <_sk_load_g8_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 1d071 <_sk_load_g8_sse2+0x26>
+ .byte 117,192 // jne 1d640 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -45327,10 +45857,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,154 // jmp 1d071 <_sk_load_g8_sse2+0x26>
+ .byte 235,154 // jmp 1d640 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,143 // jmp 1d071 <_sk_load_g8_sse2+0x26>
+ .byte 235,143 // jmp 1d640 <_sk_load_g8_sse2+0x26>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -45343,27 +45873,27 @@ _sk_load_g8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 1d12b <_sk_load_g8_dst_sse2+0x49>
+ .byte 117,49 // jne 1d6fa <_sk_load_g8_dst_sse2+0x49>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,112,231,0,0 // pand 0xe770(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,161,231,0,0 // pand 0xe7a1(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,182,232,0,0 // mulps 0xe8b6(%rip),%xmm4 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,37,231,232,0,0 // mulps 0xe8e7(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,173,230,0,0 // movaps 0xe6ad(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,222,230,0,0 // movaps 0xe6de(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d16e <_sk_load_g8_dst_sse2+0x8c>
+ .byte 116,54 // je 1d73d <_sk_load_g8_dst_sse2+0x8c>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d157 <_sk_load_g8_dst_sse2+0x75>
+ .byte 116,21 // je 1d726 <_sk_load_g8_dst_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 1d108 <_sk_load_g8_dst_sse2+0x26>
+ .byte 117,192 // jne 1d6d7 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -45372,10 +45902,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,154 // jmp 1d108 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,154 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,143 // jmp 1d108 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,143 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -45417,9 +45947,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,196,231,0,0 // mulps 0xe7c4(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,245,231,0,0 // mulps 0xe7f5(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,187,229,0,0 // movaps 0xe5bb(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,236,229,0,0 // movaps 0xe5ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -45438,42 +45968,42 @@ _sk_load_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 1d28d <_sk_load_565_sse2+0x6e>
+ .byte 117,83 // jne 1d85c <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,89 // movq (%r9,%r11,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,148,231,0,0 // movdqa 0xe794(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,197,231,0,0 // movdqa 0xe7c5(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,150,231,0,0 // mulps 0xe796(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,158,231,0,0 // movdqa 0xe79e(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,199,231,0,0 // mulps 0xe7c7(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,207,231,0,0 // movdqa 0xe7cf(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,160,231,0,0 // mulps 0xe7a0(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,168,231,0,0 // pand 0xe7a8(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,209,231,0,0 // mulps 0xe7d1(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,217,231,0,0 // pand 0xe7d9(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,174,231,0,0 // mulps 0xe7ae(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,223,231,0,0 // mulps 0xe7df(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,69,229,0,0 // movaps 0xe545(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,118,229,0,0 // movaps 0xe576(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d2cc <_sk_load_565_sse2+0xad>
+ .byte 116,50 // je 1d89b <_sk_load_565_sse2+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d2b9 <_sk_load_565_sse2+0x9a>
+ .byte 116,21 // je 1d888 <_sk_load_565_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 1d244 <_sk_load_565_sse2+0x25>
+ .byte 117,154 // jne 1d813 <_sk_load_565_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,120,255,255,255 // jmpq 1d244 <_sk_load_565_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,106,255,255,255 // jmpq 1d244 <_sk_load_565_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -45487,42 +46017,42 @@ _sk_load_565_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 1d348 <_sk_load_565_dst_sse2+0x6e>
+ .byte 117,83 // jne 1d917 <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,89 // movq (%r9,%r11,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,217,230,0,0 // movdqa 0xe6d9(%rip),%xmm4 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,37,10,231,0,0 // movdqa 0xe70a(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,219,230,0,0 // mulps 0xe6db(%rip),%xmm4 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,45,227,230,0,0 // movdqa 0xe6e3(%rip),%xmm5 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,37,12,231,0,0 // mulps 0xe70c(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,45,20,231,0,0 // movdqa 0xe714(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,229,230,0,0 // mulps 0xe6e5(%rip),%xmm5 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,53,237,230,0,0 // pand 0xe6ed(%rip),%xmm6 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,45,22,231,0,0 // mulps 0xe716(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,53,30,231,0,0 // pand 0xe71e(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,243,230,0,0 // mulps 0xe6f3(%rip),%xmm6 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,53,36,231,0,0 // mulps 0xe724(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,138,228,0,0 // movaps 0xe48a(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,187,228,0,0 // movaps 0xe4bb(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d387 <_sk_load_565_dst_sse2+0xad>
+ .byte 116,50 // je 1d956 <_sk_load_565_dst_sse2+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d374 <_sk_load_565_dst_sse2+0x9a>
+ .byte 116,21 // je 1d943 <_sk_load_565_dst_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 1d2ff <_sk_load_565_dst_sse2+0x25>
+ .byte 117,154 // jne 1d8ce <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,120,255,255,255 // jmpq 1d2ff <_sk_load_565_dst_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,106,255,255,255 // jmpq 1d2ff <_sk_load_565_dst_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -45557,19 +46087,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,197,229,0,0 // movdqa 0xe5c5(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,246,229,0,0 // movdqa 0xe5f6(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,199,229,0,0 // mulps 0xe5c7(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,207,229,0,0 // movdqa 0xe5cf(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,248,229,0,0 // mulps 0xe5f8(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,0,230,0,0 // movdqa 0xe600(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,209,229,0,0 // mulps 0xe5d1(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,217,229,0,0 // pand 0xe5d9(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,2,230,0,0 // mulps 0xe602(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,10,230,0,0 // pand 0xe60a(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,223,229,0,0 // mulps 0xe5df(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,16,230,0,0 // mulps 0xe610(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,118,227,0,0 // movaps 0xe376(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,167,227,0,0 // movaps 0xe3a7(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -45584,12 +46114,12 @@ _sk_store_565_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,117,231,0,0 // movaps 0xe775(%rip),%xmm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x122f>
+ .byte 68,15,40,5,166,231,0,0 // movaps 0xe7a6(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,106,231,0,0 // movaps 0xe76a(%rip),%xmm10 # 2bc00 <_sk_overlay_sse2_8bit+0x123f>
+ .byte 68,15,40,21,155,231,0,0 // movaps 0xe79b(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -45601,7 +46131,7 @@ _sk_store_565_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1d4d8 <_sk_store_565_sse2+0x7b>
+ .byte 117,10 // jne 1daa7 <_sk_store_565_sse2+0x7b>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -45609,19 +46139,19 @@ _sk_store_565_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 1d510 <_sk_store_565_sse2+0xb3>
+ .byte 116,38 // je 1dadf <_sk_store_565_sse2+0xb3>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1d502 <_sk_store_565_sse2+0xa5>
+ .byte 116,18 // je 1dad1 <_sk_store_565_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 1d4d4 <_sk_store_565_sse2+0x77>
+ .byte 117,222 // jne 1daa3 <_sk_store_565_sse2+0x77>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 1d4d4 <_sk_store_565_sse2+0x77>
+ .byte 235,196 // jmp 1daa3 <_sk_store_565_sse2+0x77>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 1d4d4 <_sk_store_565_sse2+0x77>
+ .byte 235,184 // jmp 1daa3 <_sk_store_565_sse2+0x77>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -45635,45 +46165,45 @@ _sk_load_4444_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d599 <_sk_load_4444_sse2+0x7d>
+ .byte 117,98 // jne 1db68 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,89 // movq (%r9,%r11,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,199,230,0,0 // movdqa 0xe6c7(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,248,230,0,0 // movdqa 0xe6f8(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,201,230,0,0 // mulps 0xe6c9(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,209,230,0,0 // movdqa 0xe6d1(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,250,230,0,0 // mulps 0xe6fa(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,2,231,0,0 // movdqa 0xe702(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,211,230,0,0 // mulps 0xe6d3(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,219,230,0,0 // movdqa 0xe6db(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,4,231,0,0 // mulps 0xe704(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,12,231,0,0 // movdqa 0xe70c(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,221,230,0,0 // mulps 0xe6dd(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,229,230,0,0 // pand 0xe6e5(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,14,231,0,0 // mulps 0xe70e(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,22,231,0,0 // pand 0xe716(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,235,230,0,0 // mulps 0xe6eb(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,28,231,0,0 // mulps 0xe71c(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d5d8 <_sk_load_4444_sse2+0xbc>
+ .byte 116,50 // je 1dba7 <_sk_load_4444_sse2+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d5c5 <_sk_load_4444_sse2+0xa9>
+ .byte 116,21 // je 1db94 <_sk_load_4444_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1d541 <_sk_load_4444_sse2+0x25>
+ .byte 117,139 // jne 1db10 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,105,255,255,255 // jmpq 1d541 <_sk_load_4444_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,91,255,255,255 // jmpq 1d541 <_sk_load_4444_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -45687,45 +46217,45 @@ _sk_load_4444_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d663 <_sk_load_4444_dst_sse2+0x7d>
+ .byte 117,98 // jne 1dc32 <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,89 // movq (%r9,%r11,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,253,229,0,0 // movdqa 0xe5fd(%rip),%xmm4 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,37,46,230,0,0 // movdqa 0xe62e(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,255,229,0,0 // mulps 0xe5ff(%rip),%xmm4 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,45,7,230,0,0 // movdqa 0xe607(%rip),%xmm5 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,37,48,230,0,0 // mulps 0xe630(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,45,56,230,0,0 // movdqa 0xe638(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,9,230,0,0 // mulps 0xe609(%rip),%xmm5 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,53,17,230,0,0 // movdqa 0xe611(%rip),%xmm6 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,45,58,230,0,0 // mulps 0xe63a(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,53,66,230,0,0 // movdqa 0xe642(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,19,230,0,0 // mulps 0xe613(%rip),%xmm6 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,61,27,230,0,0 // pand 0xe61b(%rip),%xmm7 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,53,68,230,0,0 // mulps 0xe644(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,61,76,230,0,0 // pand 0xe64c(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,33,230,0,0 // mulps 0xe621(%rip),%xmm7 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,61,82,230,0,0 // mulps 0xe652(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d6a2 <_sk_load_4444_dst_sse2+0xbc>
+ .byte 116,50 // je 1dc71 <_sk_load_4444_dst_sse2+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d68f <_sk_load_4444_dst_sse2+0xa9>
+ .byte 116,21 // je 1dc5e <_sk_load_4444_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1d60b <_sk_load_4444_dst_sse2+0x25>
+ .byte 117,139 // jne 1dbda <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,252 // movsd %xmm4,%xmm7
- .byte 233,105,255,255,255 // jmpq 1d60b <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,91,255,255,255 // jmpq 1d60b <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -45760,21 +46290,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,218,228,0,0 // movdqa 0xe4da(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,11,229,0,0 // movdqa 0xe50b(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,220,228,0,0 // mulps 0xe4dc(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,228,228,0,0 // movdqa 0xe4e4(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,13,229,0,0 // mulps 0xe50d(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,21,229,0,0 // movdqa 0xe515(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,230,228,0,0 // mulps 0xe4e6(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,238,228,0,0 // movdqa 0xe4ee(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,23,229,0,0 // mulps 0xe517(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,31,229,0,0 // movdqa 0xe51f(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,240,228,0,0 // mulps 0xe4f0(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,248,228,0,0 // pand 0xe4f8(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,33,229,0,0 // mulps 0xe521(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,41,229,0,0 // pand 0xe529(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,254,228,0,0 // mulps 0xe4fe(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,47,229,0,0 // mulps 0xe52f(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -45790,7 +46320,7 @@ _sk_store_4444_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,235,228,0,0 // movaps 0xe4eb(%rip),%xmm8 # 2bc90 <_sk_overlay_sse2_8bit+0x12cf>
+ .byte 68,15,40,5,28,229,0,0 // movaps 0xe51c(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -45812,7 +46342,7 @@ _sk_store_4444_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1d816 <_sk_store_4444_sse2+0x8f>
+ .byte 117,10 // jne 1dde5 <_sk_store_4444_sse2+0x8f>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -45820,19 +46350,19 @@ _sk_store_4444_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 1d84e <_sk_store_4444_sse2+0xc7>
+ .byte 116,38 // je 1de1d <_sk_store_4444_sse2+0xc7>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1d840 <_sk_store_4444_sse2+0xb9>
+ .byte 116,18 // je 1de0f <_sk_store_4444_sse2+0xb9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 1d812 <_sk_store_4444_sse2+0x8b>
+ .byte 117,222 // jne 1dde1 <_sk_store_4444_sse2+0x8b>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 1d812 <_sk_store_4444_sse2+0x8b>
+ .byte 235,196 // jmp 1dde1 <_sk_store_4444_sse2+0x8b>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 1d812 <_sk_store_4444_sse2+0x8b>
+ .byte 235,184 // jmp 1dde1 <_sk_store_4444_sse2+0x8b>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -45846,13 +46376,13 @@ _sk_load_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d8d8 <_sk_load_8888_sse2+0x7e>
+ .byte 117,98 // jne 1dea7 <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,21,252,223,0,0 // movdqa 0xdffc(%rip),%xmm2 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,21,45,224,0,0 // movdqa 0xe02d(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,56,225,0,0 // movaps 0xe138(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,105,225,0,0 // movaps 0xe169(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -45872,18 +46402,18 @@ _sk_load_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1d90e <_sk_load_8888_sse2+0xb4>
+ .byte 116,41 // je 1dedd <_sk_load_8888_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1d903 <_sk_load_8888_sse2+0xa9>
+ .byte 116,19 // je 1ded2 <_sk_load_8888_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1d87c <_sk_load_8888_sse2+0x22>
+ .byte 117,134 // jne 1de4b <_sk_load_8888_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1d87c <_sk_load_8888_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1d87c <_sk_load_8888_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -45897,13 +46427,13 @@ _sk_load_8888_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d997 <_sk_load_8888_dst_sse2+0x7e>
+ .byte 117,98 // jne 1df66 <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,53,61,223,0,0 // movdqa 0xdf3d(%rip),%xmm6 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,53,110,223,0,0 // movdqa 0xdf6e(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,121,224,0,0 // movaps 0xe079(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,170,224,0,0 // movaps 0xe0aa(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -45923,18 +46453,18 @@ _sk_load_8888_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1d9cd <_sk_load_8888_dst_sse2+0xb4>
+ .byte 116,41 // je 1df9c <_sk_load_8888_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1d9c2 <_sk_load_8888_dst_sse2+0xa9>
+ .byte 116,19 // je 1df91 <_sk_load_8888_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1d93b <_sk_load_8888_dst_sse2+0x22>
+ .byte 117,134 // jne 1df0a <_sk_load_8888_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1d93b <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1d93b <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -45968,11 +46498,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,38,222,0,0 // movdqa 0xde26(%rip),%xmm2 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,21,87,222,0,0 // movdqa 0xde57(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,98,223,0,0 // movaps 0xdf62(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,147,223,0,0 // movaps 0xdf93(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -46002,7 +46532,7 @@ _sk_store_8888_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,226,221,0,0 // movaps 0xdde2(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,19,222,0,0 // movaps 0xde13(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -46021,24 +46551,24 @@ _sk_store_8888_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1db2e <_sk_store_8888_sse2+0x7f>
+ .byte 117,10 // jne 1e0fd <_sk_store_8888_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 1db5c <_sk_store_8888_sse2+0xad>
+ .byte 116,33 // je 1e12b <_sk_store_8888_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1db54 <_sk_store_8888_sse2+0xa5>
+ .byte 116,19 // je 1e123 <_sk_store_8888_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 1db2a <_sk_store_8888_sse2+0x7b>
+ .byte 117,227 // jne 1e0f9 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 1db2a <_sk_store_8888_sse2+0x7b>
+ .byte 235,206 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 1db2a <_sk_store_8888_sse2+0x7b>
+ .byte 235,198 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -46052,13 +46582,13 @@ _sk_load_bgra_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1dbe2 <_sk_load_bgra_sse2+0x7e>
+ .byte 117,98 // jne 1e1b1 <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,5,242,220,0,0 // movdqa 0xdcf2(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,35,221,0,0 // movdqa 0xdd23(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,46,222,0,0 // movaps 0xde2e(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,95,222,0,0 // movaps 0xde5f(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -46078,18 +46608,18 @@ _sk_load_bgra_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1dc18 <_sk_load_bgra_sse2+0xb4>
+ .byte 116,41 // je 1e1e7 <_sk_load_bgra_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1dc0d <_sk_load_bgra_sse2+0xa9>
+ .byte 116,19 // je 1e1dc <_sk_load_bgra_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1db86 <_sk_load_bgra_sse2+0x22>
+ .byte 117,134 // jne 1e155 <_sk_load_bgra_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1db86 <_sk_load_bgra_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1db86 <_sk_load_bgra_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -46103,13 +46633,13 @@ _sk_load_bgra_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1dca1 <_sk_load_bgra_dst_sse2+0x7e>
+ .byte 117,98 // jne 1e270 <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,37,51,220,0,0 // movdqa 0xdc33(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,100,220,0,0 // movdqa 0xdc64(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,111,221,0,0 // movaps 0xdd6f(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,160,221,0,0 // movaps 0xdda0(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -46129,18 +46659,18 @@ _sk_load_bgra_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1dcd7 <_sk_load_bgra_dst_sse2+0xb4>
+ .byte 116,41 // je 1e2a6 <_sk_load_bgra_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1dccc <_sk_load_bgra_dst_sse2+0xa9>
+ .byte 116,19 // je 1e29b <_sk_load_bgra_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1dc45 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 117,134 // jne 1e214 <_sk_load_bgra_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1dc45 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1dc45 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -46174,11 +46704,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,28,219,0,0 // movdqa 0xdb1c(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,77,219,0,0 // movdqa 0xdb4d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,88,220,0,0 // movaps 0xdc58(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,137,220,0,0 // movaps 0xdc89(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -46208,7 +46738,7 @@ _sk_store_bgra_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,216,218,0,0 // movaps 0xdad8(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,9,219,0,0 // movaps 0xdb09(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -46227,24 +46757,24 @@ _sk_store_bgra_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1de38 <_sk_store_bgra_sse2+0x7f>
+ .byte 117,10 // jne 1e407 <_sk_store_bgra_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 1de66 <_sk_store_bgra_sse2+0xad>
+ .byte 116,33 // je 1e435 <_sk_store_bgra_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1de5e <_sk_store_bgra_sse2+0xa5>
+ .byte 116,19 // je 1e42d <_sk_store_bgra_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 1de34 <_sk_store_bgra_sse2+0x7b>
+ .byte 117,227 // jne 1e403 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 1de34 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,206 // jmp 1e403 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 1de34 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,198 // jmp 1e403 <_sk_store_bgra_sse2+0x7b>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -46258,7 +46788,7 @@ _sk_load_f16_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 1dff0 <_sk_load_f16_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1e5bf <_sk_load_f16_sse2+0x182>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 102,65,15,16,76,193,16 // movupd 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,192 // movapd %xmm0,%xmm8
@@ -46270,7 +46800,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,208,221,0,0 // movdqa 0xddd0(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,13,1,222,0,0 // movdqa 0xde01(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -46278,11 +46808,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,197,221,0,0 // movdqa 0xddc5(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,29,246,221,0,0 // movdqa 0xddf6(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,199,221,0,0 // movdqa 0xddc7(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,37,248,221,0,0 // movdqa 0xddf8(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,106,223,0,0 // movdqa 0xdf6a(%rip),%xmm3 # 2be80 <_sk_overlay_sse2_8bit+0x14bf>
+ .byte 102,15,111,29,155,223,0,0 // movdqa 0xdf9b(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -46330,17 +46860,17 @@ _sk_load_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e00d <_sk_load_f16_sse2+0x19f>
+ .byte 117,17 // jne 1e5dc <_sk_load_f16_sse2+0x19f>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,142,254,255,255 // jmpq 1de9b <_sk_load_f16_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 1de9b <_sk_load_f16_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1e46a <_sk_load_f16_sse2+0x2d>
.byte 242,65,15,16,76,193,16 // movsd 0x10(%r9,%rax,8),%xmm1
- .byte 233,109,254,255,255 // jmpq 1de9b <_sk_load_f16_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -46354,7 +46884,7 @@ _sk_load_f16_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 1e1b0 <_sk_load_f16_dst_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1e77f <_sk_load_f16_dst_sse2+0x182>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 102,65,15,16,108,193,16 // movupd 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,196 // movapd %xmm4,%xmm8
@@ -46366,7 +46896,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,16,220,0,0 // movdqa 0xdc10(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,13,65,220,0,0 // movdqa 0xdc41(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -46374,11 +46904,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,5,220,0,0 // movdqa 0xdc05(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,29,54,220,0,0 // movdqa 0xdc36(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,7,220,0,0 // movdqa 0xdc07(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,37,56,220,0,0 // movdqa 0xdc38(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,170,221,0,0 // movdqa 0xddaa(%rip),%xmm7 # 2be80 <_sk_overlay_sse2_8bit+0x14bf>
+ .byte 102,15,111,61,219,221,0,0 // movdqa 0xdddb(%rip),%xmm7 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -46426,17 +46956,17 @@ _sk_load_f16_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e1cd <_sk_load_f16_dst_sse2+0x19f>
+ .byte 117,17 // jne 1e79c <_sk_load_f16_dst_sse2+0x19f>
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 102,15,20,229 // unpcklpd %xmm5,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
- .byte 233,142,254,255,255 // jmpq 1e05b <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 1e05b <_sk_load_f16_dst_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1e62a <_sk_load_f16_dst_sse2+0x2d>
.byte 242,65,15,16,108,193,16 // movsd 0x10(%r9,%rax,8),%xmm5
- .byte 233,109,254,255,255 // jmpq 1e05b <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -46478,7 +47008,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,9,218,0,0 // movdqa 0xda09(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,13,58,218,0,0 // movdqa 0xda3a(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -46486,11 +47016,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,254,217,0,0 // movdqa 0xd9fe(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,29,47,218,0,0 // movdqa 0xda2f(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,0,218,0,0 // movdqa 0xda00(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,37,49,218,0,0 // movdqa 0xda31(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,163,219,0,0 // movdqa 0xdba3(%rip),%xmm3 # 2be80 <_sk_overlay_sse2_8bit+0x14bf>
+ .byte 102,15,111,29,212,219,0,0 // movdqa 0xdbd4(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -46549,17 +47079,17 @@ _sk_store_f16_sse2:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,248,216,0,0 // movdqa 0xd8f8(%rip),%xmm10 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,21,41,217,0,0 // movdqa 0xd929(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,235,216,0,0 // movdqa 0xd8eb(%rip),%xmm9 # 2bce0 <_sk_overlay_sse2_8bit+0x131f>
+ .byte 102,68,15,111,13,28,217,0,0 // movdqa 0xd91c(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,220,216,0,0 // movdqa 0xd8dc(%rip),%xmm11 # 2bcf0 <_sk_overlay_sse2_8bit+0x132f>
+ .byte 102,68,15,111,29,13,217,0,0 // movdqa 0xd90d(%rip),%xmm11 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -46611,7 +47141,7 @@ _sk_store_f16_sse2:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 1e536 <_sk_store_f16_sse2+0x17e>
+ .byte 117,21 // jne 1eb05 <_sk_store_f16_sse2+0x17e>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -46619,13 +47149,13 @@ _sk_store_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 1e532 <_sk_store_f16_sse2+0x17a>
+ .byte 116,240 // je 1eb01 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 1e532 <_sk_store_f16_sse2+0x17a>
+ .byte 114,227 // jb 1eb01 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 1e532 <_sk_store_f16_sse2+0x17a>
+ .byte 235,213 // jmp 1eb01 <_sk_store_f16_sse2+0x17a>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -46640,7 +47170,7 @@ _sk_load_u16_be_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,190,0,0,0 // jne 1e642 <_sk_load_u16_be_sse2+0xe5>
+ .byte 15,133,190,0,0,0 // jne 1ec11 <_sk_load_u16_be_sse2+0xe5>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -46657,7 +47187,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,139,212,0,0 // movaps 0xd48b(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,5,188,212,0,0 // movaps 0xd4bc(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -46685,17 +47215,17 @@ _sk_load_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e65f <_sk_load_u16_be_sse2+0x102>
+ .byte 117,17 // jne 1ec2e <_sk_load_u16_be_sse2+0x102>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,50,255,255,255 // jmpq 1e591 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,50,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,29,255,255,255 // jb 1e591 <_sk_load_u16_be_sse2+0x34>
+ .byte 15,130,29,255,255,255 // jb 1eb60 <_sk_load_u16_be_sse2+0x34>
.byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1
- .byte 233,17,255,255,255 // jmpq 1e591 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,17,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -46712,7 +47242,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,175,0,0,0 // jne 1e75a <_sk_load_rgb_u16_be_sse2+0xda>
+ .byte 15,133,175,0,0,0 // jne 1ed29 <_sk_load_rgb_u16_be_sse2+0xda>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -46733,7 +47263,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,81,211,0,0 // movaps 0xd351(%rip),%xmm9 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,13,130,211,0,0 // movaps 0xd382(%rip),%xmm9 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -46750,27 +47280,27 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,120,208,0,0 // movaps 0xd078(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,169,208,0,0 // movaps 0xd0a9(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 1e77f <_sk_load_rgb_u16_be_sse2+0xff>
+ .byte 117,13 // jne 1ed4e <_sk_load_rgb_u16_be_sse2+0xff>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,80,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 1e7b0 <_sk_load_rgb_u16_be_sse2+0x130>
+ .byte 114,24 // jb 1ed7f <_sk_load_rgb_u16_be_sse2+0x130>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,31,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,31,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,22,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,22,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -46784,7 +47314,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,33,213,0,0 // movaps 0xd521(%rip),%xmm10 # 2bd00 <_sk_overlay_sse2_8bit+0x133f>
+ .byte 68,15,40,21,82,213,0,0 // movaps 0xd552(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -46829,7 +47359,7 @@ _sk_store_u16_be_sse2:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 1e8d9 <_sk_store_u16_be_sse2+0x120>
+ .byte 117,21 // jne 1eea8 <_sk_store_u16_be_sse2+0x120>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -46837,13 +47367,13 @@ _sk_store_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 1e8d5 <_sk_store_u16_be_sse2+0x11c>
+ .byte 116,240 // je 1eea4 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 1e8d5 <_sk_store_u16_be_sse2+0x11c>
+ .byte 114,227 // jb 1eea4 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 1e8d5 <_sk_store_u16_be_sse2+0x11c>
+ .byte 235,213 // jmp 1eea4 <_sk_store_u16_be_sse2+0x11c>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -46859,7 +47389,7 @@ _sk_load_f32_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 1e96b <_sk_load_f32_sse2+0x6b>
+ .byte 117,66 // jne 1ef3a <_sk_load_f32_sse2+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -46879,17 +47409,17 @@ _sk_load_f32_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 1e97d <_sk_load_f32_sse2+0x7d>
+ .byte 117,8 // jne 1ef4c <_sk_load_f32_sse2+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 1e93b <_sk_load_f32_sse2+0x3b>
+ .byte 235,190 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 1e991 <_sk_load_f32_sse2+0x91>
+ .byte 114,8 // jb 1ef60 <_sk_load_f32_sse2+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 1e93b <_sk_load_f32_sse2+0x3b>
+ .byte 235,170 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 1e93b <_sk_load_f32_sse2+0x3b>
+ .byte 235,165 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -46905,7 +47435,7 @@ _sk_load_f32_dst_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 1ea01 <_sk_load_f32_dst_sse2+0x6b>
+ .byte 117,66 // jne 1efd0 <_sk_load_f32_dst_sse2+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -46925,17 +47455,17 @@ _sk_load_f32_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 1ea13 <_sk_load_f32_dst_sse2+0x7d>
+ .byte 117,8 // jne 1efe2 <_sk_load_f32_dst_sse2+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,190 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 1ea27 <_sk_load_f32_dst_sse2+0x91>
+ .byte 114,8 // jb 1eff6 <_sk_load_f32_dst_sse2+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,170 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,165 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -46964,7 +47494,7 @@ _sk_store_f32_sse2:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 1eaa9 <_sk_store_f32_sse2+0x7d>
+ .byte 117,29 // jne 1f078 <_sk_store_f32_sse2+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -46972,12 +47502,12 @@ _sk_store_f32_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 1eaa5 <_sk_store_f32_sse2+0x79>
+ .byte 116,246 // je 1f074 <_sk_store_f32_sse2+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 1eaa5 <_sk_store_f32_sse2+0x79>
+ .byte 114,234 // jb 1f074 <_sk_store_f32_sse2+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 1eaa5 <_sk_store_f32_sse2+0x79>
+ .byte 235,225 // jmp 1f074 <_sk_store_f32_sse2+0x79>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -47023,7 +47553,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,142,204,0,0 // andps 0xcc8e(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,21,191,204,0,0 // andps 0xccbf(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -47049,7 +47579,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,52,204,0,0 // andps 0xcc34(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,21,101,204,0,0 // andps 0xcc65(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -47075,13 +47605,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,9,194,0,0 // mulss 0xc209(%rip),%xmm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,29,46,194,0,0 // mulss 0xc22e(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,186,203,0,0 // andps 0xcbba(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,29,235,203,0,0 // andps 0xcbeb(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -47110,13 +47640,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,132,193,0,0 // mulss 0xc184(%rip),%xmm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,29,169,193,0,0 // mulss 0xc1a9(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,53,203,0,0 // andps 0xcb35(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,29,102,203,0,0 // andps 0xcb66(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -47139,7 +47669,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,236,202,0,0 // minps 0xcaec(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,93,5,29,203,0,0 // minps 0xcb1d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -47152,7 +47682,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,202,202,0,0 // andps 0xcaca(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,13,251,202,0,0 // andps 0xcafb(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47162,14 +47692,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,22,203,0,0 // movaps 0xcb16(%rip),%xmm8 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,5,71,203,0,0 // movaps 0xcb47(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,154,202,0,0 // movaps 0xca9a(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,203,202,0,0 // movaps 0xcacb(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,144,202,0,0 // andps 0xca90(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,13,193,202,0,0 // andps 0xcac1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -47185,10 +47715,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,166,207,0,0 // mulps 0xcfa6(%rip),%xmm0 # 2bd10 <_sk_overlay_sse2_8bit+0x134f>
- .byte 15,89,13,175,207,0,0 // mulps 0xcfaf(%rip),%xmm1 # 2bd20 <_sk_overlay_sse2_8bit+0x135f>
+ .byte 15,89,5,215,207,0,0 // mulps 0xcfd7(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b>
+ .byte 15,89,13,224,207,0,0 // mulps 0xcfe0(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,181,207,0,0 // mulps 0xcfb5(%rip),%xmm3 # 2bd30 <_sk_overlay_sse2_8bit+0x136f>
+ .byte 15,89,29,230,207,0,0 // mulps 0xcfe6(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -47500,9 +48030,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 1f21b <_sk_evenly_spaced_gradient_sse2+0x18>
+ .byte 120,7 // js 1f7ea <_sk_evenly_spaced_gradient_sse2+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 1f230 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ .byte 235,21 // jmp 1f7ff <_sk_evenly_spaced_gradient_sse2+0x2d>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -47600,15 +48130,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,132,201,0,0 // movaps 0xc984(%rip),%xmm0 # 2bd40 <_sk_overlay_sse2_8bit+0x137f>
+ .byte 15,40,5,181,201,0,0 // movaps 0xc9b5(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,138,201,0,0 // addps 0xc98a(%rip),%xmm0 # 2bd50 <_sk_overlay_sse2_8bit+0x138f>
+ .byte 15,88,5,187,201,0,0 // addps 0xc9bb(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,144,201,0,0 // addps 0xc990(%rip),%xmm0 # 2bd60 <_sk_overlay_sse2_8bit+0x139f>
+ .byte 15,88,5,193,201,0,0 // addps 0xc9c1(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,150,201,0,0 // addps 0xc996(%rip),%xmm0 # 2bd70 <_sk_overlay_sse2_8bit+0x13af>
+ .byte 15,88,5,199,201,0,0 // addps 0xc9c7(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,156,201,0,0 // addps 0xc99c(%rip),%xmm0 # 2bd80 <_sk_overlay_sse2_8bit+0x13bf>
+ .byte 15,88,5,205,201,0,0 // addps 0xc9cd(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -47626,12 +48156,12 @@ _sk_gradient_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 1f437 <_sk_gradient_sse2+0x46>
+ .byte 114,50 // jb 1fa06 <_sk_gradient_sse2+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,197,195,0,0 // movaps 0xc3c5(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 15,40,21,246,195,0,0 // movaps 0xc3f6(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -47639,7 +48169,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 1f41b <_sk_gradient_sse2+0x2a>
+ .byte 117,228 // jne 1f9ea <_sk_gradient_sse2+0x2a>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,211 // movq %xmm2,%r11
.byte 69,137,217 // mov %r11d,%r9d
@@ -47778,29 +48308,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,38,199,0,0 // movaps 0xc726(%rip),%xmm13 # 2bd90 <_sk_overlay_sse2_8bit+0x13cf>
+ .byte 68,15,40,45,87,199,0,0 // movaps 0xc757(%rip),%xmm13 # 2c390 <_sk_overlay_sse2_8bit+0x13db>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,42,199,0,0 // addps 0xc72a(%rip),%xmm13 # 2bda0 <_sk_overlay_sse2_8bit+0x13df>
+ .byte 68,15,88,45,91,199,0,0 // addps 0xc75b(%rip),%xmm13 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,46,199,0,0 // addps 0xc72e(%rip),%xmm13 # 2bdb0 <_sk_overlay_sse2_8bit+0x13ef>
+ .byte 68,15,88,45,95,199,0,0 // addps 0xc75f(%rip),%xmm13 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,50,199,0,0 // addps 0xc732(%rip),%xmm13 # 2bdc0 <_sk_overlay_sse2_8bit+0x13ff>
+ .byte 68,15,88,45,99,199,0,0 // addps 0xc763(%rip),%xmm13 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,49,199,0,0 // movaps 0xc731(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0x140f>
+ .byte 68,15,40,21,98,199,0,0 // movaps 0xc762(%rip),%xmm10 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,4,193,0,0 // movaps 0xc104(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,21,53,193,0,0 // movaps 0xc135(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,243,192,0,0 // movaps 0xc0f3(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,36,193,0,0 // movaps 0xc124(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -47835,7 +48365,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,154,198,0,0 // mulps 0xc69a(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,203,198,0,0 // mulps 0xc6cb(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -47843,7 +48373,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,133,198,0,0 // mulps 0xc685(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,182,198,0,0 // mulps 0xc6b6(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -47852,8 +48382,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,61,197,0,0 // xorps 0xc53d(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,37,192,0,0 // mulps 0xc025(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,110,197,0,0 // xorps 0xc56e(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,86,192,0,0 // mulps 0xc056(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -47874,7 +48404,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,252,197,0,0 // mulps 0xc5fc(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,45,198,0,0 // mulps 0xc62d(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -47882,7 +48412,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,231,197,0,0 // mulps 0xc5e7(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,24,198,0,0 // mulps 0xc618(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -47891,8 +48421,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,159,196,0,0 // xorps 0xc49f(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,135,191,0,0 // mulps 0xbf87(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,208,196,0,0 // xorps 0xc4d0(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,184,191,0,0 // mulps 0xbfb8(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -47910,7 +48440,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,111,197,0,0 // mulps 0xc56f(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,160,197,0,0 // mulps 0xc5a0(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -47918,7 +48448,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,59,196,0,0 // xorps 0xc43b(%rip),%xmm0 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 15,87,5,108,196,0,0 // xorps 0xc46c(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -47961,7 +48491,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,193,190,0,0 // movaps 0xbec1(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,242,190,0,0 // movaps 0xbef2(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -47969,7 +48499,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,172,190,0,0 // movaps 0xbeac(%rip),%xmm12 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,37,221,190,0,0 // movaps 0xbedd(%rip),%xmm12 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -48016,8 +48546,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,69,196,0,0 // addps 0xc445(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,13,190,0,0 // movaps 0xbe0d(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,118,196,0,0 // addps 0xc476(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,62,190,0,0 // movaps 0xbe3e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48030,7 +48560,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,220,189,0,0 // addps 0xbddc(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,5,13,190,0,0 // addps 0xbe0d(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48042,8 +48572,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,254,195,0,0 // addps 0xc3fe(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,198,189,0,0 // movaps 0xbdc6(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,47,196,0,0 // addps 0xc42f(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,247,189,0,0 // movaps 0xbdf7(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48056,7 +48586,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,148,189,0,0 // addps 0xbd94(%rip),%xmm1 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,13,197,189,0,0 // addps 0xbdc5(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48068,13 +48598,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,199,195,0,0 // addps 0xc3c7(%rip),%xmm0 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,127,189,0,0 // movaps 0xbd7f(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,248,195,0,0 // addps 0xc3f8(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,176,189,0,0 // movaps 0xbdb0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,187,195,0,0 // mulps 0xc3bb(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,83,191,0,0 // addps 0xbf53(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,236,195,0,0 // mulps 0xc3ec(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,132,191,0,0 // addps 0xbf84(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48087,16 +48617,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,114,195,0,0 // addps 0xc372(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,58,189,0,0 // movaps 0xbd3a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,163,195,0,0 // addps 0xc3a3(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,107,189,0,0 // movaps 0xbd6b(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,142,195,0,0 // movaps 0xc38e(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,191,195,0,0 // movaps 0xc3bf(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,146,195,0,0 // addps 0xc392(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,195,195,0,0 // addps 0xc3c3(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,6,189,0,0 // addps 0xbd06(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,55,189,0,0 // addps 0xbd37(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,138,195,0,0 // addps 0xc38a(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,187,195,0,0 // addps 0xc3bb(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48106,17 +48636,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,228,188,0,0 // movaps 0xbce4(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,21,189,0,0 // movaps 0xbd15(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,64,195,0,0 // movaps 0xc340(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,113,195,0,0 // movaps 0xc371(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,68,195,0,0 // addps 0xc344(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,117,195,0,0 // addps 0xc375(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,64,195,0,0 // addps 0xc340(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,113,195,0,0 // addps 0xc371(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48128,11 +48658,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,19,195,0,0 // addps 0xc313(%rip),%xmm0 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,5,68,195,0,0 // addps 0xc344(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,227,194,0,0 // mulps 0xc2e3(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,123,190,0,0 // addps 0xbe7b(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,20,195,0,0 // mulps 0xc314(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,172,190,0,0 // addps 0xbeac(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48145,13 +48675,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,169,194,0,0 // addps 0xc2a9(%rip),%xmm1 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,97,188,0,0 // movaps 0xbc61(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,218,194,0,0 // addps 0xc2da(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,146,188,0,0 // movaps 0xbc92(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,157,194,0,0 // mulps 0xc29d(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,53,190,0,0 // addps 0xbe35(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,206,194,0,0 // mulps 0xc2ce(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,102,190,0,0 // addps 0xbe66(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48164,16 +48694,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,83,194,0,0 // addps 0xc253(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,27,188,0,0 // movaps 0xbc1b(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,132,194,0,0 // addps 0xc284(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,76,188,0,0 // movaps 0xbc4c(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,111,194,0,0 // movaps 0xc26f(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,160,194,0,0 // movaps 0xc2a0(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,115,194,0,0 // addps 0xc273(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,164,194,0,0 // addps 0xc2a4(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,231,187,0,0 // addps 0xbbe7(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,24,188,0,0 // addps 0xbc18(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,107,194,0,0 // addps 0xc26b(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,156,194,0,0 // addps 0xc29c(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48183,17 +48713,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,197,187,0,0 // movaps 0xbbc5(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,246,187,0,0 // movaps 0xbbf6(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,32,194,0,0 // movaps 0xc220(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,81,194,0,0 // movaps 0xc251(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,36,194,0,0 // addps 0xc224(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,85,194,0,0 // addps 0xc255(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,32,194,0,0 // addps 0xc220(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,81,194,0,0 // addps 0xc251(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48205,11 +48735,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,242,193,0,0 // addps 0xc1f2(%rip),%xmm1 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,13,35,194,0,0 // addps 0xc223(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,194,193,0,0 // mulps 0xc1c2(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,90,189,0,0 // addps 0xbd5a(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,243,193,0,0 // mulps 0xc1f3(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,139,189,0,0 // addps 0xbd8b(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48358,7 +48888,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,65,15,111,198 // movdqa %xmm14,%xmm0
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,45,244,191,0,0 // movdqa 0xbff4(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,45,37,192,0,0 // movdqa 0xc025(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
@@ -48381,7 +48911,7 @@ _sk_clut_3D_sse2:
.byte 15,20,241 // unpcklps %xmm1,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,248,184,0,0 // paddd 0xb8f8(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,13,41,185,0,0 // paddd 0xb929(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -48398,7 +48928,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,253 // unpcklps %xmm5,%xmm7
.byte 15,20,249 // unpcklps %xmm1,%xmm7
- .byte 102,15,254,5,206,184,0,0 // paddd 0xb8ce(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,255,184,0,0 // paddd 0xb8ff(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -48415,7 +48945,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,200 // unpcklps %xmm0,%xmm1
- .byte 15,40,45,229,190,0,0 // movaps 0xbee5(%rip),%xmm5 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,45,22,191,0,0 // movaps 0xbf16(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 15,88,229 // addps %xmm5,%xmm4
.byte 15,41,100,36,192 // movaps %xmm4,-0x40(%rsp)
.byte 68,15,88,213 // addps %xmm5,%xmm10
@@ -48430,7 +48960,7 @@ _sk_clut_3D_sse2:
.byte 102,15,127,68,36,160 // movdqa %xmm0,-0x60(%rsp)
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,5,174,190,0,0 // movdqa 0xbeae(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,223,190,0,0 // movdqa 0xbedf(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -48452,7 +48982,7 @@ _sk_clut_3D_sse2:
.byte 15,20,227 // unpcklps %xmm3,%xmm4
.byte 15,20,229 // unpcklps %xmm5,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 102,15,254,29,183,183,0,0 // paddd 0xb7b7(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,29,232,183,0,0 // paddd 0xb7e8(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,218 // movq %xmm3,%r10
@@ -48469,7 +48999,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
- .byte 102,15,254,21,141,183,0,0 // paddd 0xb78d(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,21,190,183,0,0 // paddd 0xb7be(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -48531,7 +49061,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,193 // unpcklps %xmm1,%xmm8
.byte 68,15,20,199 // unpcklps %xmm7,%xmm8
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,21,88,182,0,0 // movdqa 0xb658(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,137,182,0,0 // movdqa 0xb689(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
@@ -48549,7 +49079,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,111,45,41,182,0,0 // movdqa 0xb629(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,45,90,182,0,0 // movdqa 0xb65a(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -48607,7 +49137,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 68,15,20,223 // unpcklps %xmm7,%xmm11
.byte 68,15,20,221 // unpcklps %xmm5,%xmm11
- .byte 102,15,111,45,36,181,0,0 // movdqa 0xb524(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,45,85,181,0,0 // movdqa 0xb555(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5
@@ -48654,7 +49184,7 @@ _sk_clut_3D_sse2:
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,5,197,186,0,0 // movdqa 0xbac5(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,246,186,0,0 // movdqa 0xbaf6(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -48676,7 +49206,7 @@ _sk_clut_3D_sse2:
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,202 // unpcklps %xmm2,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,111,5,207,179,0,0 // movdqa 0xb3cf(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,5,0,180,0,0 // movdqa 0xb400(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -48752,7 +49282,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
.byte 15,20,240 // unpcklps %xmm0,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,29,160,178,0,0 // paddd 0xb2a0(%rip),%xmm3 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,29,209,178,0,0 // paddd 0xb2d1(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
.byte 102,73,15,126,218 // movq %xmm3,%r10
@@ -48803,7 +49333,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,156,177,0,0 // paddd 0xb19c(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,13,205,177,0,0 // paddd 0xb1cd(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -48820,7 +49350,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
.byte 68,15,20,242 // unpcklps %xmm2,%xmm14
.byte 68,15,20,241 // unpcklps %xmm1,%xmm14
- .byte 102,15,254,5,111,177,0,0 // paddd 0xb16f(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,160,177,0,0 // paddd 0xb1a0(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -48858,7 +49388,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,37,162,176,0,0 // movdqa 0xb0a2(%rip),%xmm4 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,37,211,176,0,0 // movdqa 0xb0d3(%rip),%xmm4 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -48876,7 +49406,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,116,176,0,0 // paddd 0xb074(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,21,165,176,0,0 // paddd 0xb0a5(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -49029,7 +49559,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,209 // paddd %xmm1,%xmm2
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,254,218 // paddd %xmm2,%xmm3
- .byte 102,68,15,111,21,94,180,0,0 // movdqa 0xb45e(%rip),%xmm10 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,68,15,111,21,143,180,0,0 // movdqa 0xb48f(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,112,235,245 // pshufd $0xf5,%xmm3,%xmm5
.byte 102,65,15,244,218 // pmuludq %xmm10,%xmm3
.byte 102,15,112,227,232 // pshufd $0xe8,%xmm3,%xmm4
@@ -49052,7 +49582,7 @@ _sk_clut_4D_sse2:
.byte 15,20,222 // unpcklps %xmm6,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
- .byte 102,15,254,45,96,173,0,0 // paddd 0xad60(%rip),%xmm5 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,45,145,173,0,0 // paddd 0xad91(%rip),%xmm5 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
.byte 102,73,15,126,241 // movq %xmm6,%r9
.byte 102,73,15,126,234 // movq %xmm5,%r10
@@ -49069,7 +49599,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,247 // unpcklps %xmm7,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,37,54,173,0,0 // paddd 0xad36(%rip),%xmm4 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,37,103,173,0,0 // paddd 0xad67(%rip),%xmm4 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,226 // movq %xmm4,%r10
@@ -49086,7 +49616,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,239 // unpcklps %xmm7,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,61,77,179,0,0 // movaps 0xb34d(%rip),%xmm7 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,61,126,179,0,0 // movaps 0xb37e(%rip),%xmm7 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,88,199 // addps %xmm7,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 68,15,88,207 // addps %xmm7,%xmm9
@@ -49124,7 +49654,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,234 // unpcklps %xmm2,%xmm13
.byte 68,15,20,239 // unpcklps %xmm7,%xmm13
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,254,21,20,172,0,0 // paddd 0xac14(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,21,69,172,0,0 // paddd 0xac45(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -49141,7 +49671,7 @@ _sk_clut_4D_sse2:
.byte 243,70,15,16,12,139 // movss (%rbx,%r9,4),%xmm9
.byte 65,15,20,209 // unpcklps %xmm9,%xmm2
.byte 15,20,215 // unpcklps %xmm7,%xmm2
- .byte 102,15,254,5,233,171,0,0 // paddd 0xabe9(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,26,172,0,0 // paddd 0xac1a(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -49182,7 +49712,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
.byte 102,15,254,92,36,160 // paddd -0x60(%rsp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,68,15,111,53,165,177,0,0 // movdqa 0xb1a5(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,68,15,111,53,214,177,0,0 // movdqa 0xb1d6(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4
@@ -49203,7 +49733,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,228 // unpcklps %xmm4,%xmm12
.byte 68,15,20,229 // unpcklps %xmm5,%xmm12
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,61,174,170,0,0 // movdqa 0xaaae(%rip),%xmm7 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,61,223,170,0,0 // movdqa 0xaadf(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,231 // paddd %xmm7,%xmm4
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -49221,7 +49751,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 15,20,244 // unpcklps %xmm4,%xmm6
- .byte 102,68,15,111,5,127,170,0,0 // movdqa 0xaa7f(%rip),%xmm8 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,5,176,170,0,0 // movdqa 0xaab0(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,216 // paddd %xmm8,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -49335,7 +49865,7 @@ _sk_clut_4D_sse2:
.byte 102,68,15,111,108,36,160 // movdqa -0x60(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,235,174,0,0 // movdqa 0xaeeb(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,28,175,0,0 // movdqa 0xaf1c(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -49357,7 +49887,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,205 // unpcklps %xmm5,%xmm9
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,242,167,0,0 // movdqa 0xa7f2(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,29,35,168,0,0 // movdqa 0xa823(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -49465,7 +49995,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,211 // movdqa %xmm11,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
.byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
- .byte 102,15,111,5,179,172,0,0 // movdqa 0xacb3(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,228,172,0,0 // movdqa 0xace4(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
.byte 102,15,112,250,232 // pshufd $0xe8,%xmm2,%xmm7
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
@@ -49486,7 +50016,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,203 // unpcklps %xmm3,%xmm9
.byte 102,15,111,215 // movdqa %xmm7,%xmm2
- .byte 102,15,111,5,190,165,0,0 // movdqa 0xa5be(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,5,239,165,0,0 // movdqa 0xa5ef(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -49504,7 +50034,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
.byte 15,20,243 // unpcklps %xmm3,%xmm6
.byte 15,20,242 // unpcklps %xmm2,%xmm6
- .byte 102,68,15,111,45,143,165,0,0 // movdqa 0xa58f(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,45,192,165,0,0 // movdqa 0xa5c0(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,253 // paddd %xmm13,%xmm7
.byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -49524,7 +50054,7 @@ _sk_clut_4D_sse2:
.byte 15,20,250 // unpcklps %xmm2,%xmm7
.byte 102,68,15,254,220 // paddd %xmm4,%xmm11
.byte 102,65,15,112,219,245 // pshufd $0xf5,%xmm11,%xmm3
- .byte 102,15,111,37,165,171,0,0 // movdqa 0xaba5(%rip),%xmm4 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,37,214,171,0,0 // movdqa 0xabd6(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,68,15,244,220 // pmuludq %xmm4,%xmm11
.byte 102,65,15,112,211,232 // pshufd $0xe8,%xmm11,%xmm2
.byte 102,15,244,220 // pmuludq %xmm4,%xmm3
@@ -49625,7 +50155,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,202 // movdqa %xmm10,%xmm1
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,231,169,0,0 // movdqa 0xa9e7(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,24,170,0,0 // movdqa 0xaa18(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -49647,7 +50177,7 @@ _sk_clut_4D_sse2:
.byte 15,20,212 // unpcklps %xmm4,%xmm2
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
- .byte 102,15,111,61,240,162,0,0 // movdqa 0xa2f0(%rip),%xmm7 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,61,33,163,0,0 // movdqa 0xa321(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,223 // paddd %xmm7,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -49665,7 +50195,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,220 // unpcklps %xmm4,%xmm3
- .byte 102,68,15,111,13,193,162,0,0 // movdqa 0xa2c1(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,13,242,162,0,0 // movdqa 0xa2f2(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -49777,7 +50307,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,246 // unpcklps %xmm6,%xmm14
.byte 68,15,20,243 // unpcklps %xmm3,%xmm14
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
- .byte 102,68,15,111,21,180,160,0,0 // movdqa 0xa0b4(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,229,160,0,0 // movdqa 0xa0e5(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,218 // paddd %xmm10,%xmm3
.byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
.byte 102,73,15,126,241 // movq %xmm6,%r9
@@ -49898,7 +50428,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,116,36,160 // movdqa -0x60(%rsp),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,29,46,165,0,0 // movdqa 0xa52e(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,95,165,0,0 // movdqa 0xa55f(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -49920,7 +50450,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,68,15,111,5,54,158,0,0 // movdqa 0x9e36(%rip),%xmm8 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,5,103,158,0,0 // movdqa 0x9e67(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,200 // paddd %xmm8,%xmm1
.byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -50026,7 +50556,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,124,36,128 // paddd -0x80(%rsp),%xmm7
.byte 102,15,254,247 // paddd %xmm7,%xmm6
.byte 102,15,112,206,245 // pshufd $0xf5,%xmm6,%xmm1
- .byte 102,15,111,21,248,162,0,0 // movdqa 0xa2f8(%rip),%xmm2 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,21,41,163,0,0 // movdqa 0xa329(%rip),%xmm2 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,242 // pmuludq %xmm2,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -50048,7 +50578,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,255,155,0,0 // paddd 0x9bff(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,13,48,156,0,0 // paddd 0x9c30(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -50104,7 +50634,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,53,5,155,0,0 // movdqa 0x9b05(%rip),%xmm6 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,53,54,155,0,0 // movdqa 0x9b36(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -50122,7 +50652,7 @@ _sk_clut_4D_sse2:
.byte 243,70,15,16,60,139 // movss (%rbx,%r9,4),%xmm15
.byte 65,15,20,207 // unpcklps %xmm15,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,214,154,0,0 // paddd 0x9ad6(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,21,7,155,0,0 // paddd 0x9b07(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -50184,7 +50714,7 @@ _sk_clut_4D_sse2:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,187,153,0,0 // movaps 0x99bb(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,236,153,0,0 // movaps 0x99ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,100,36,112 // movaps 0x70(%rsp),%xmm4
.byte 15,40,172,36,128,0,0,0 // movaps 0x80(%rsp),%xmm5
.byte 15,40,180,36,144,0,0,0 // movaps 0x90(%rsp),%xmm6
@@ -50192,6 +50722,7 @@ _sk_clut_4D_sse2:
.byte 72,129,196,176,0,0,0 // add $0xb0,%rsp
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
+ .byte 144 // nop
HIDDEN _sk_start_pipeline_hsw_8bit
.globl _sk_start_pipeline_hsw_8bit
@@ -50214,7 +50745,7 @@ _sk_start_pipeline_hsw_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 21ed1 <_sk_start_pipeline_hsw_8bit+0x95>
+ .byte 115,102 // jae 224a1 <_sk_start_pipeline_hsw_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,16 // lea 0x10(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -50224,7 +50755,7 @@ _sk_start_pipeline_hsw_8bit:
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
.byte 72,57,93,176 // cmp %rbx,-0x50(%rbp)
- .byte 119,30 // ja 21eb3 <_sk_start_pipeline_hsw_8bit+0x77>
+ .byte 119,30 // ja 22483 <_sk_start_pipeline_hsw_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -50233,17 +50764,17 @@ _sk_start_pipeline_hsw_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,32 // add $0x20,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 21e95 <_sk_start_pipeline_hsw_8bit+0x59>
+ .byte 118,226 // jbe 22465 <_sk_start_pipeline_hsw_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 21ec8 <_sk_start_pipeline_hsw_8bit+0x8c>
+ .byte 116,13 // je 22498 <_sk_start_pipeline_hsw_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 21e7b <_sk_start_pipeline_hsw_8bit+0x3f>
+ .byte 117,170 // jne 2244b <_sk_start_pipeline_hsw_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -50275,7 +50806,7 @@ HIDDEN _sk_set_rgb_hsw_8bit
FUNCTION(_sk_set_rgb_hsw_8bit)
_sk_set_rgb_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 197,250,16,37,50,143,0,0 // vmovss 0x8f32(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,250,16,37,86,143,0,0 // vmovss 0x8f56(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,218,89,40 // vmulss (%rax),%xmm4,%xmm5
.byte 196,225,250,44,205 // vcvttss2si %xmm5,%rcx
.byte 197,218,89,104,4 // vmulss 0x4(%rax),%xmm4,%xmm5
@@ -50288,7 +50819,7 @@ _sk_set_rgb_hsw_8bit:
.byte 9,208 // or %edx,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4
- .byte 197,253,111,45,106,148,0,0 // vmovdqa 0x946a(%rip),%ymm5 # 2b3a0 <_sk_overlay_sse2_8bit+0x9df>
+ .byte 197,253,111,45,154,148,0,0 // vmovdqa 0x949a(%rip),%ymm5 # 2b9a0 <_sk_overlay_sse2_8bit+0x9eb>
.byte 197,245,219,205 // vpand %ymm5,%ymm1,%ymm1
.byte 197,253,219,197 // vpand %ymm5,%ymm0,%ymm0
.byte 197,221,235,192 // vpor %ymm0,%ymm4,%ymm0
@@ -50300,10 +50831,10 @@ HIDDEN _sk_premul_hsw_8bit
.globl _sk_premul_hsw_8bit
FUNCTION(_sk_premul_hsw_8bit)
_sk_premul_hsw_8bit:
- .byte 197,253,111,37,110,148,0,0 // vmovdqa 0x946e(%rip),%ymm4 # 2b3c0 <_sk_overlay_sse2_8bit+0x9ff>
+ .byte 197,253,111,37,158,148,0,0 // vmovdqa 0x949e(%rip),%ymm4 # 2b9c0 <_sk_overlay_sse2_8bit+0xa0b>
.byte 196,226,125,0,236 // vpshufb %ymm4,%ymm0,%ymm5
.byte 196,226,117,0,228 // vpshufb %ymm4,%ymm1,%ymm4
- .byte 197,253,111,53,124,148,0,0 // vmovdqa 0x947c(%rip),%ymm6 # 2b3e0 <_sk_overlay_sse2_8bit+0xa1f>
+ .byte 197,253,111,53,172,148,0,0 // vmovdqa 0x94ac(%rip),%ymm6 # 2b9e0 <_sk_overlay_sse2_8bit+0xa2b>
.byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
.byte 197,213,235,238 // vpor %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -50343,7 +50874,7 @@ HIDDEN _sk_swap_rb_hsw_8bit
.globl _sk_swap_rb_hsw_8bit
FUNCTION(_sk_swap_rb_hsw_8bit)
_sk_swap_rb_hsw_8bit:
- .byte 197,253,111,37,244,147,0,0 // vmovdqa 0x93f4(%rip),%ymm4 # 2b400 <_sk_overlay_sse2_8bit+0xa3f>
+ .byte 197,253,111,37,36,148,0,0 // vmovdqa 0x9424(%rip),%ymm4 # 2ba00 <_sk_overlay_sse2_8bit+0xa4b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50372,7 +50903,7 @@ _sk_load_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 2205c <_sk_load_8888_hsw_8bit+0x32>
+ .byte 117,17 // jne 2262c <_sk_load_8888_hsw_8bit+0x32>
.byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50382,14 +50913,14 @@ _sk_load_8888_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,231 // ja 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 119,231 // ja 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22194 <_sk_load_8888_hsw_8bit+0x16a>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22764 <_sk_load_8888_hsw_8bit+0x16a>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 235,203 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50397,7 +50928,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,162 // jmp 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 235,162 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50410,7 +50941,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,83,255,255,255 // jmpq 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 233,83,255,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50419,7 +50950,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,23,255,255,255 // jmpq 22052 <_sk_load_8888_hsw_8bit+0x28>
+ .byte 233,23,255,255,255 // jmpq 22622 <_sk_load_8888_hsw_8bit+0x28>
.byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50433,7 +50964,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,199,254,255,255 // jmpq 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 233,199,254,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -50486,7 +51017,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 22202 <_sk_load_8888_dst_hsw_8bit+0x32>
+ .byte 117,17 // jne 227d2 <_sk_load_8888_dst_hsw_8bit+0x32>
.byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50496,14 +51027,14 @@ _sk_load_8888_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,231 // ja 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 119,231 // ja 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22338 <_sk_load_8888_dst_hsw_8bit+0x168>
+ .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22908 <_sk_load_8888_dst_hsw_8bit+0x168>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 235,203 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50511,7 +51042,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,162 // jmp 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 235,162 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50524,7 +51055,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,83,255,255,255 // jmpq 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 233,83,255,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50533,7 +51064,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,23,255,255,255 // jmpq 221f8 <_sk_load_8888_dst_hsw_8bit+0x28>
+ .byte 233,23,255,255,255 // jmpq 227c8 <_sk_load_8888_dst_hsw_8bit+0x28>
.byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50547,7 +51078,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,199,254,255,255 // jmpq 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 233,199,254,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 144 // nop
.byte 243,254 // repz (bad)
.byte 255 // (bad)
@@ -50600,7 +51131,7 @@ _sk_store_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 223a6 <_sk_store_8888_hsw_8bit+0x32>
+ .byte 117,17 // jne 22976 <_sk_store_8888_hsw_8bit+0x32>
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
.byte 196,161,126,127,76,130,32 // vmovdqu %ymm1,0x20(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50608,17 +51139,17 @@ _sk_store_8888_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 119,239 // ja 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22470 <_sk_store_8888_hsw_8bit+0xfc>
+ .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22a40 <_sk_store_8888_hsw_8bit+0xfc>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,4,130 // vmovd %xmm0,(%rdx,%r8,4)
- .byte 235,211 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,211 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,163,121,22,68,130,8,2 // vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
.byte 196,161,121,214,4,130 // vmovq %xmm0,(%rdx,%r8,4)
- .byte 235,195 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,195 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,163,121,22,100,130,24,2 // vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4)
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
@@ -50626,12 +51157,12 @@ _sk_store_8888_hsw_8bit:
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,161,121,126,100,130,16 // vmovd %xmm4,0x10(%rdx,%r8,4)
.byte 196,161,122,127,4,130 // vmovdqu %xmm0,(%rdx,%r8,4)
- .byte 235,146 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,146 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,163,121,22,76,130,40,2 // vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4)
.byte 196,163,121,22,76,130,36,1 // vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4)
.byte 196,161,121,126,76,130,32 // vmovd %xmm1,0x20(%rdx,%r8,4)
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
- .byte 233,112,255,255,255 // jmpq 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 233,112,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
.byte 196,163,121,22,100,130,56,2 // vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4)
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
@@ -50640,7 +51171,7 @@ _sk_store_8888_hsw_8bit:
.byte 196,161,121,126,100,130,48 // vmovd %xmm4,0x30(%rdx,%r8,4)
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
.byte 196,161,122,127,76,130,32 // vmovdqu %xmm1,0x20(%rdx,%r8,4)
- .byte 233,53,255,255,255 // jmpq 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 233,53,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 87 // push %rdi
.byte 255 // (bad)
@@ -50653,7 +51184,7 @@ _sk_store_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 22485 <_sk_store_8888_hsw_8bit+0x111>
+ .byte 125,255 // jge 22a55 <_sk_store_8888_hsw_8bit+0x111>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -50664,7 +51195,7 @@ _sk_store_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 2249d <_sk_store_8888_hsw_8bit+0x129>
+ .byte 235,255 // jmp 22a6d <_sk_store_8888_hsw_8bit+0x129>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 222,255 // fdivrp %st,%st(7)
@@ -50690,10 +51221,10 @@ _sk_load_bgra_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 224f0 <_sk_load_bgra_hsw_8bit+0x44>
+ .byte 117,35 // jne 22ac0 <_sk_load_bgra_hsw_8bit+0x44>
.byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
- .byte 197,253,111,37,62,143,0,0 // vmovdqa 0x8f3e(%rip),%ymm4 # 2b420 <_sk_overlay_sse2_8bit+0xa5f>
+ .byte 197,253,111,37,110,143,0,0 // vmovdqa 0x8f6e(%rip),%ymm4 # 2ba20 <_sk_overlay_sse2_8bit+0xa6b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50703,14 +51234,14 @@ _sk_load_bgra_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,213 // ja 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 119,213 // ja 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22628 <_sk_load_bgra_hsw_8bit+0x17c>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22bf8 <_sk_load_bgra_hsw_8bit+0x17c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0
- .byte 235,185 // jmp 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 235,185 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50718,7 +51249,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,144 // jmp 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 235,144 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50731,7 +51262,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,65,255,255,255 // jmpq 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 233,65,255,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50740,7 +51271,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,5,255,255,255 // jmpq 224d4 <_sk_load_bgra_hsw_8bit+0x28>
+ .byte 233,5,255,255,255 // jmpq 22aa4 <_sk_load_bgra_hsw_8bit+0x28>
.byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50754,7 +51285,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,181,254,255,255 // jmpq 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 233,181,254,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -50805,10 +51336,10 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 226a8 <_sk_load_bgra_dst_hsw_8bit+0x44>
+ .byte 117,35 // jne 22c78 <_sk_load_bgra_dst_hsw_8bit+0x44>
.byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
- .byte 197,253,111,37,166,141,0,0 // vmovdqa 0x8da6(%rip),%ymm4 # 2b440 <_sk_overlay_sse2_8bit+0xa7f>
+ .byte 197,253,111,37,214,141,0,0 // vmovdqa 0x8dd6(%rip),%ymm4 # 2ba40 <_sk_overlay_sse2_8bit+0xa8b>
.byte 196,226,109,0,212 // vpshufb %ymm4,%ymm2,%ymm2
.byte 196,226,101,0,220 // vpshufb %ymm4,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50818,14 +51349,14 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,213 // ja 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 119,213 // ja 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 227e0 <_sk_load_bgra_dst_hsw_8bit+0x17c>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22db0 <_sk_load_bgra_dst_hsw_8bit+0x17c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2
- .byte 235,185 // jmp 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 235,185 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50833,7 +51364,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,144 // jmp 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 235,144 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50846,7 +51377,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,65,255,255,255 // jmpq 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 233,65,255,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50855,7 +51386,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,5,255,255,255 // jmpq 2268c <_sk_load_bgra_dst_hsw_8bit+0x28>
+ .byte 233,5,255,255,255 // jmpq 22c5c <_sk_load_bgra_dst_hsw_8bit+0x28>
.byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50869,7 +51400,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,181,254,255,255 // jmpq 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 233,181,254,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -50919,11 +51450,11 @@ _sk_store_bgra_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 197,253,111,37,32,140,0,0 // vmovdqa 0x8c20(%rip),%ymm4 # 2b460 <_sk_overlay_sse2_8bit+0xa9f>
+ .byte 197,253,111,37,80,140,0,0 // vmovdqa 0x8c50(%rip),%ymm4 # 2ba60 <_sk_overlay_sse2_8bit+0xaab>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 22860 <_sk_store_bgra_hsw_8bit+0x44>
+ .byte 117,17 // jne 22e30 <_sk_store_bgra_hsw_8bit+0x44>
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
.byte 196,161,126,127,108,130,32 // vmovdqu %ymm5,0x20(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50931,17 +51462,17 @@ _sk_store_bgra_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 119,239 // ja 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 22928 <_sk_store_bgra_hsw_8bit+0x10c>
+ .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 22ef8 <_sk_store_bgra_hsw_8bit+0x10c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,36,130 // vmovd %xmm4,(%rdx,%r8,4)
- .byte 235,211 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,211 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,163,121,22,100,130,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4)
.byte 196,161,121,214,36,130 // vmovq %xmm4,(%rdx,%r8,4)
- .byte 235,195 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,195 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,163,121,22,108,130,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -50949,12 +51480,12 @@ _sk_store_bgra_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,161,121,126,108,130,16 // vmovd %xmm5,0x10(%rdx,%r8,4)
.byte 196,161,122,127,36,130 // vmovdqu %xmm4,(%rdx,%r8,4)
- .byte 235,146 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,146 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,163,121,22,108,130,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4)
.byte 196,163,121,22,108,130,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4)
.byte 196,161,121,126,108,130,32 // vmovd %xmm5,0x20(%rdx,%r8,4)
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
- .byte 233,112,255,255,255 // jmpq 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 233,112,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,163,121,22,116,130,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -50963,7 +51494,7 @@ _sk_store_bgra_hsw_8bit:
.byte 196,161,121,126,116,130,48 // vmovd %xmm6,0x30(%rdx,%r8,4)
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
.byte 196,161,122,127,108,130,32 // vmovdqu %xmm5,0x20(%rdx,%r8,4)
- .byte 233,53,255,255,255 // jmpq 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 233,53,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 144 // nop
.byte 89 // pop %rcx
.byte 255 // (bad)
@@ -50976,7 +51507,7 @@ _sk_store_bgra_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,255 // jg 2293d <_sk_store_bgra_hsw_8bit+0x121>
+ .byte 127,255 // jg 22f0d <_sk_store_bgra_hsw_8bit+0x121>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -51014,7 +51545,7 @@ _sk_load_a8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 229a4 <_sk_load_a8_hsw_8bit+0x40>
+ .byte 117,35 // jne 22f74 <_sk_load_a8_hsw_8bit+0x40>
.byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0
.byte 197,249,112,200,78 // vpshufd $0x4e,%xmm0,%xmm1
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
@@ -51027,35 +51558,35 @@ _sk_load_a8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 119,210 // ja 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 22a80 <_sk_load_a8_hsw_8bit+0x11c>
+ .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 23050 <_sk_load_a8_hsw_8bit+0x11c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,179 // jmp 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,179 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 235,150 // jmp 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,150 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,105,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,105,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,60,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,60,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -51063,7 +51594,7 @@ _sk_load_a8_hsw_8bit:
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,7,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,7,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 73,255 // rex.WB (bad)
.byte 255 // (bad)
.byte 255,96,255 // jmpq *-0x1(%rax)
@@ -51073,7 +51604,7 @@ _sk_load_a8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 22a95 <_sk_load_a8_hsw_8bit+0x131>
+ .byte 125,255 // jge 23065 <_sk_load_a8_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -51110,7 +51641,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 22afc <_sk_load_a8_dst_hsw_8bit+0x40>
+ .byte 117,35 // jne 230cc <_sk_load_a8_dst_hsw_8bit+0x40>
.byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2
.byte 197,249,112,218,78 // vpshufd $0x4e,%xmm2,%xmm3
.byte 196,226,125,49,219 // vpmovzxbd %xmm3,%ymm3
@@ -51123,35 +51654,35 @@ _sk_load_a8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 119,210 // ja 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 22bd8 <_sk_load_a8_dst_hsw_8bit+0x11c>
+ .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 231a8 <_sk_load_a8_dst_hsw_8bit+0x11c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,179 // jmp 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,179 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 235,150 // jmp 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,150 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,105,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,105,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,60,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,60,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -51159,7 +51690,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,7,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,7,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 73,255 // rex.WB (bad)
.byte 255 // (bad)
.byte 255,96,255 // jmpq *-0x1(%rax)
@@ -51169,7 +51700,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 22bed <_sk_load_a8_dst_hsw_8bit+0x131>
+ .byte 125,255 // jge 231bd <_sk_load_a8_dst_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -51205,49 +51736,49 @@ _sk_store_a8_hsw_8bit:
.byte 72,99,87,8 // movslq 0x8(%rdi),%rdx
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 197,253,111,37,76,136,0,0 // vmovdqa 0x884c(%rip),%ymm4 # 2b480 <_sk_overlay_sse2_8bit+0xabf>
+ .byte 197,253,111,37,124,136,0,0 // vmovdqa 0x887c(%rip),%ymm4 # 2ba80 <_sk_overlay_sse2_8bit+0xacb>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5
- .byte 197,249,111,53,73,146,0,0 // vmovdqa 0x9249(%rip),%xmm6 # 2be90 <_sk_overlay_sse2_8bit+0x14cf>
+ .byte 197,249,111,53,121,146,0,0 // vmovdqa 0x9279(%rip),%xmm6 # 2c490 <_sk_overlay_sse2_8bit+0x14db>
.byte 196,226,81,0,238 // vpshufb %xmm6,%xmm5,%xmm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4
.byte 196,226,89,0,230 // vpshufb %xmm6,%xmm4,%xmm4
.byte 197,217,108,229 // vpunpcklqdq %xmm5,%xmm4,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 22c6f <_sk_store_a8_hsw_8bit+0x5b>
+ .byte 117,10 // jne 2323f <_sk_store_a8_hsw_8bit+0x5b>
.byte 196,161,122,127,36,2 // vmovdqu %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 119,239 // ja 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 22d10 <_sk_store_a8_hsw_8bit+0xfc>
+ .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 232e0 <_sk_store_a8_hsw_8bit+0xfc>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,163,121,20,36,2,0 // vpextrb $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,210 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,210 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,2,2 // vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1)
.byte 196,163,121,21,36,2,0 // vpextrw $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,193 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,193 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,6,6 // vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1)
.byte 196,163,121,20,100,2,5,5 // vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1)
.byte 196,163,121,20,100,2,4,4 // vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1)
.byte 196,161,121,126,36,2 // vmovd %xmm4,(%rdx,%r8,1)
- .byte 235,161 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,161 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,10,10 // vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1)
.byte 196,163,121,20,100,2,9,9 // vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1)
.byte 196,163,121,20,100,2,8,8 // vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1)
- .byte 235,32 // jmp 22d04 <_sk_store_a8_hsw_8bit+0xf0>
+ .byte 235,32 // jmp 232d4 <_sk_store_a8_hsw_8bit+0xf0>
.byte 196,163,121,20,100,2,14,14 // vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1)
.byte 196,163,121,20,100,2,13,13 // vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1)
.byte 196,163,121,20,100,2,12,12 // vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1)
.byte 196,163,121,22,100,2,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1)
.byte 196,161,121,214,36,2 // vmovq %xmm4,(%rdx,%r8,1)
- .byte 233,92,255,255,255 // jmpq 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 233,92,255,255,255 // jmpq 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 144 // nop
.byte 128,255,255 // cmp $0xff,%bh
.byte 255,145,255,255,255,137 // callq *-0x76000001(%rcx)
@@ -51295,15 +51826,15 @@ _sk_load_g8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,61 // jne 22da6 <_sk_load_g8_hsw_8bit+0x5a>
+ .byte 117,61 // jne 23376 <_sk_load_g8_hsw_8bit+0x5a>
.byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0
.byte 196,226,125,49,200 // vpmovzxbd %xmm0,%ymm1
.byte 197,249,112,192,78 // vpshufd $0x4e,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
- .byte 196,226,125,88,37,13,130,0,0 // vpbroadcastd 0x820d(%rip),%ymm4 # 2af94 <_sk_overlay_sse2_8bit+0x5d3>
+ .byte 196,226,125,88,37,49,130,0,0 // vpbroadcastd 0x8231(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3>
.byte 196,226,125,64,236 // vpmulld %ymm4,%ymm0,%ymm5
.byte 196,226,117,64,196 // vpmulld %ymm4,%ymm1,%ymm0
- .byte 196,226,125,88,13,254,129,0,0 // vpbroadcastd 0x81fe(%rip),%ymm1 # 2af98 <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,88,13,34,130,0,0 // vpbroadcastd 0x8222(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,253,235,193 // vpor %ymm1,%ymm0,%ymm0
.byte 197,213,235,201 // vpor %ymm1,%ymm5,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51312,35 +51843,35 @@ _sk_load_g8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,184 // ja 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 119,184 // ja 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 22e88 <_sk_load_g8_hsw_8bit+0x13c>
+ .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23458 <_sk_load_g8_hsw_8bit+0x13c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 235,153 // jmp 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,121,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,121,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,76,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,76,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,31,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,31,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -51348,7 +51879,7 @@ _sk_load_g8_hsw_8bit:
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,234,254,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,234,254,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 67,255 // rex.XB (bad)
.byte 255 // (bad)
@@ -51360,7 +51891,7 @@ _sk_load_g8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 22e9d <_sk_load_g8_hsw_8bit+0x151>
+ .byte 122,255 // jp 2346d <_sk_load_g8_hsw_8bit+0x151>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -51396,15 +51927,15 @@ _sk_load_g8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,61 // jne 22f1e <_sk_load_g8_dst_hsw_8bit+0x5a>
+ .byte 117,61 // jne 234ee <_sk_load_g8_dst_hsw_8bit+0x5a>
.byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2
.byte 196,226,125,49,218 // vpmovzxbd %xmm2,%ymm3
.byte 197,249,112,210,78 // vpshufd $0x4e,%xmm2,%xmm2
.byte 196,226,125,49,210 // vpmovzxbd %xmm2,%ymm2
- .byte 196,226,125,88,37,149,128,0,0 // vpbroadcastd 0x8095(%rip),%ymm4 # 2af94 <_sk_overlay_sse2_8bit+0x5d3>
+ .byte 196,226,125,88,37,185,128,0,0 // vpbroadcastd 0x80b9(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3>
.byte 196,226,109,64,236 // vpmulld %ymm4,%ymm2,%ymm5
.byte 196,226,101,64,212 // vpmulld %ymm4,%ymm3,%ymm2
- .byte 196,226,125,88,29,134,128,0,0 // vpbroadcastd 0x8086(%rip),%ymm3 # 2af98 <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,88,29,170,128,0,0 // vpbroadcastd 0x80aa(%rip),%ymm3 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,237,235,211 // vpor %ymm3,%ymm2,%ymm2
.byte 197,213,235,219 // vpor %ymm3,%ymm5,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51413,35 +51944,35 @@ _sk_load_g8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,184 // ja 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 119,184 // ja 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23000 <_sk_load_g8_dst_hsw_8bit+0x13c>
+ .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 235d0 <_sk_load_g8_dst_hsw_8bit+0x13c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,153 // jmp 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 235,153 // jmp 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,121,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,121,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,76,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,76,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,31,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,31,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -51449,7 +51980,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,234,254,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,234,254,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 67,255 // rex.XB (bad)
.byte 255 // (bad)
@@ -51461,7 +51992,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 23015 <_sk_load_g8_dst_hsw_8bit+0x151>
+ .byte 122,255 // jp 235e5 <_sk_load_g8_dst_hsw_8bit+0x151>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -51498,10 +52029,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,222,0,0,0 // jne 2313f <_sk_srcover_rgba_8888_hsw_8bit+0x103>
+ .byte 15,133,222,0,0,0 // jne 2370f <_sk_srcover_rgba_8888_hsw_8bit+0x103>
.byte 196,33,126,111,76,138,32 // vmovdqu 0x20(%rdx,%r9,4),%ymm9
.byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11
- .byte 197,253,111,53,42,132,0,0 // vmovdqa 0x842a(%rip),%ymm6 # 2b4a0 <_sk_overlay_sse2_8bit+0xadf>
+ .byte 197,253,111,53,90,132,0,0 // vmovdqa 0x845a(%rip),%ymm6 # 2baa0 <_sk_overlay_sse2_8bit+0xaeb>
.byte 196,226,117,0,254 // vpshufb %ymm6,%ymm1,%ymm7
.byte 196,226,125,0,246 // vpshufb %ymm6,%ymm0,%ymm6
.byte 196,66,125,48,195 // vpmovzxbw %xmm11,%ymm8
@@ -51539,7 +52070,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 197,221,252,224 // vpaddb %ymm0,%ymm4,%ymm4
.byte 197,213,252,233 // vpaddb %ymm1,%ymm5,%ymm5
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 23176 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
+ .byte 117,72 // jne 23746 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
.byte 196,161,126,127,108,138,32 // vmovdqu %ymm5,0x20(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51550,25 +52081,25 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,65,37,239,219 // vpxor %ymm11,%ymm11,%ymm11
.byte 254,200 // dec %al
.byte 60,14 // cmp $0xe,%al
- .byte 15,135,22,255,255,255 // ja 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 15,135,22,255,255,255 // ja 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 2334c <_sk_srcover_rgba_8888_hsw_8bit+0x310>
+ .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 2391c <_sk_srcover_rgba_8888_hsw_8bit+0x310>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,33,121,110,28,138 // vmovd (%rdx,%r9,4),%xmm11
- .byte 233,248,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,248,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 65,128,224,15 // and $0xf,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,14 // cmp $0xe,%r8b
- .byte 119,184 // ja 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 119,184 // ja 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23388 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
+ .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23958 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,36,138 // vmovd %xmm4,(%rdx,%r9,4)
- .byte 235,156 // jmp 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 235,156 // jmp 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,161,121,110,100,138,8 // vmovd 0x8(%rdx,%r9,4),%xmm4
.byte 196,226,121,89,236 // vpbroadcastq %xmm4,%xmm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -51576,7 +52107,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,162,121,53,52,138 // vpmovzxdq (%rdx,%r9,4),%xmm6
.byte 197,249,112,246,232 // vpshufd $0xe8,%xmm6,%xmm6
.byte 196,99,37,2,222,3 // vpblendd $0x3,%ymm6,%ymm11,%ymm11
- .byte 233,162,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,162,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,161,121,110,100,138,24 // vmovd 0x18(%rdx,%r9,4),%xmm4
.byte 196,226,125,89,236 // vpbroadcastq %xmm4,%ymm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -51589,7 +52120,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,37,56,222,1 // vinserti128 $0x1,%xmm6,%ymm11,%ymm11
.byte 196,161,122,111,52,138 // vmovdqu (%rdx,%r9,4),%xmm6
.byte 196,67,77,2,219,240 // vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- .byte 233,82,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,82,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,161,121,110,100,138,40 // vmovd 0x28(%rdx,%r9,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -51598,7 +52129,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,53,2,205,15 // vpblendd $0xf,%ymm5,%ymm9,%ymm9
.byte 196,161,121,110,108,138,32 // vmovd 0x20(%rdx,%r9,4),%xmm5
.byte 196,99,53,2,205,1 // vpblendd $0x1,%ymm5,%ymm9,%ymm9
- .byte 233,22,254,255,255 // jmpq 23068 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
+ .byte 233,22,254,255,255 // jmpq 23638 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
.byte 196,161,121,110,100,138,56 // vmovd 0x38(%rdx,%r9,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -51612,10 +52143,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11
.byte 196,161,122,111,116,138,32 // vmovdqu 0x20(%rdx,%r9,4),%xmm6
.byte 196,67,77,2,201,240 // vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- .byte 233,198,253,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,198,253,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,163,121,22,100,138,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
.byte 196,161,121,214,36,138 // vmovq %xmm4,(%rdx,%r9,4)
- .byte 233,128,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,128,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,163,121,22,108,138,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -51623,12 +52154,12 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,161,121,126,108,138,16 // vmovd %xmm5,0x10(%rdx,%r9,4)
.byte 196,161,122,127,36,138 // vmovdqu %xmm4,(%rdx,%r9,4)
- .byte 233,76,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,76,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,163,121,22,108,138,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4)
.byte 196,163,121,22,108,138,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4)
.byte 196,161,121,126,108,138,32 // vmovd %xmm5,0x20(%rdx,%r9,4)
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
- .byte 233,42,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,42,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,163,121,22,116,138,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -51637,7 +52168,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,161,121,126,116,138,48 // vmovd %xmm6,0x30(%rdx,%r9,4)
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
.byte 196,161,122,127,108,138,32 // vmovdqu %xmm5,0x20(%rdx,%r9,4)
- .byte 233,239,253,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,239,253,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 31 // (bad)
.byte 254 // (bad)
.byte 255 // (bad)
@@ -51687,7 +52218,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 233a5 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
+ .byte 126,255 // jle 23975 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
.byte 255 // (bad)
.byte 255,119,255 // pushq -0x1(%rdi)
.byte 255 // (bad)
@@ -51709,7 +52240,7 @@ FUNCTION(_sk_scale_1_float_hsw_8bit)
_sk_scale_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,94,122,0,0 // vmulss 0x7a5e(%rip),%xmm4,%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,218,89,37,130,122,0,0 // vmulss 0x7a82(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -51719,7 +52250,7 @@ _sk_scale_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,37,185,128,0,0 // vpand 0x80b9(%rip),%ymm4,%ymm4 # 2b4c0 <_sk_overlay_sse2_8bit+0xaff>
+ .byte 197,221,219,37,233,128,0,0 // vpand 0x80e9(%rip),%ymm4,%ymm4 # 2bac0 <_sk_overlay_sse2_8bit+0xb0b>
.byte 197,221,213,249 // vpmullw %ymm1,%ymm4,%ymm7
.byte 197,93,213,198 // vpmullw %ymm6,%ymm4,%ymm8
.byte 197,93,213,200 // vpmullw %ymm0,%ymm4,%ymm9
@@ -51753,12 +52284,12 @@ _sk_scale_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,191,0,0,0 // jne 2353f <_sk_scale_u8_hsw_8bit+0xe0>
+ .byte 15,133,191,0,0,0 // jne 23b0f <_sk_scale_u8_hsw_8bit+0xe0>
.byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,67,128,0,0 // vmovdqa 0x8043(%rip),%ymm6 # 2b4e0 <_sk_overlay_sse2_8bit+0xb1f>
+ .byte 197,253,111,53,115,128,0,0 // vmovdqa 0x8073(%rip),%ymm6 # 2bae0 <_sk_overlay_sse2_8bit+0xb2b>
.byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4
.byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -51797,35 +52328,35 @@ _sk_scale_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,50,255,255,255 // ja 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 15,135,50,255,255,255 // ja 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23628 <_sk_scale_u8_hsw_8bit+0x1c9>
+ .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23bf8 <_sk_scale_u8_hsw_8bit+0x1c9>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,16,255,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,16,255,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,240,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,240,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,195,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,195,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,150,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,150,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -51833,7 +52364,7 @@ _sk_scale_u8_hsw_8bit:
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,97,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,97,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 64,255 // rex (bad)
.byte 255 // (bad)
@@ -51845,7 +52376,7 @@ _sk_scale_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 2363d <_sk_scale_u8_hsw_8bit+0x1de>
+ .byte 122,255 // jp 23c0d <_sk_scale_u8_hsw_8bit+0x1de>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -51875,7 +52406,7 @@ FUNCTION(_sk_lerp_1_float_hsw_8bit)
_sk_lerp_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,190,119,0,0 // vmulss 0x77be(%rip),%xmm4,%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,218,89,37,226,119,0,0 // vmulss 0x77e2(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -51885,7 +52416,7 @@ _sk_lerp_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,61,89,126,0,0 // vpand 0x7e59(%rip),%ymm4,%ymm7 # 2b500 <_sk_overlay_sse2_8bit+0xb3f>
+ .byte 197,221,219,61,137,126,0,0 // vpand 0x7e89(%rip),%ymm4,%ymm7 # 2bb00 <_sk_overlay_sse2_8bit+0xb4b>
.byte 197,69,213,193 // vpmullw %ymm1,%ymm7,%ymm8
.byte 197,69,213,206 // vpmullw %ymm6,%ymm7,%ymm9
.byte 197,69,213,208 // vpmullw %ymm0,%ymm7,%ymm10
@@ -51950,12 +52481,12 @@ _sk_lerp_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,106,1,0,0 // jne 2391f <_sk_lerp_u8_hsw_8bit+0x18b>
+ .byte 15,133,106,1,0,0 // jne 23eef <_sk_lerp_u8_hsw_8bit+0x18b>
.byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,78,125,0,0 // vmovdqa 0x7d4e(%rip),%ymm6 # 2b520 <_sk_overlay_sse2_8bit+0xb5f>
+ .byte 197,253,111,53,126,125,0,0 // vmovdqa 0x7d7e(%rip),%ymm6 # 2bb20 <_sk_overlay_sse2_8bit+0xb6b>
.byte 196,98,93,0,206 // vpshufb %ymm6,%ymm4,%ymm9
.byte 196,98,85,0,222 // vpshufb %ymm6,%ymm5,%ymm11
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -52029,35 +52560,35 @@ _sk_lerp_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,135,254,255,255 // ja 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 15,135,135,254,255,255 // ja 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23a08 <_sk_lerp_u8_hsw_8bit+0x274>
+ .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23fd8 <_sk_lerp_u8_hsw_8bit+0x274>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,101,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,101,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,69,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,69,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,24,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,24,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,235,253,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,235,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -52065,7 +52596,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,182,253,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,182,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 64,255 // rex (bad)
.byte 255 // (bad)
@@ -52077,7 +52608,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 23a1d <_sk_lerp_u8_hsw_8bit+0x289>
+ .byte 122,255 // jp 23fed <_sk_lerp_u8_hsw_8bit+0x289>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -52124,7 +52655,7 @@ HIDDEN _sk_black_color_hsw_8bit
FUNCTION(_sk_black_color_hsw_8bit)
_sk_black_color_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,49,117,0,0 // vbroadcastss 0x7531(%rip),%ymm0 # 2af98 <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,24,5,85,117,0,0 // vbroadcastss 0x7555(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 255,224 // jmpq *%rax
@@ -52150,7 +52681,7 @@ HIDDEN _sk_srcatop_hsw_8bit
.globl _sk_srcatop_hsw_8bit
FUNCTION(_sk_srcatop_hsw_8bit)
_sk_srcatop_hsw_8bit:
- .byte 197,125,111,5,179,122,0,0 // vmovdqa 0x7ab3(%rip),%ymm8 # 2b540 <_sk_overlay_sse2_8bit+0xb7f>
+ .byte 197,125,111,5,227,122,0,0 // vmovdqa 0x7ae3(%rip),%ymm8 # 2bb40 <_sk_overlay_sse2_8bit+0xb8b>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,232 // vpshufb %ymm8,%ymm2,%ymm5
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -52227,7 +52758,7 @@ HIDDEN _sk_dstatop_hsw_8bit
.globl _sk_dstatop_hsw_8bit
FUNCTION(_sk_dstatop_hsw_8bit)
_sk_dstatop_hsw_8bit:
- .byte 197,125,111,5,110,121,0,0 // vmovdqa 0x796e(%rip),%ymm8 # 2b560 <_sk_overlay_sse2_8bit+0xb9f>
+ .byte 197,125,111,5,158,121,0,0 // vmovdqa 0x799e(%rip),%ymm8 # 2bb60 <_sk_overlay_sse2_8bit+0xbab>
.byte 196,194,117,0,224 // vpshufb %ymm8,%ymm1,%ymm4
.byte 196,194,125,0,232 // vpshufb %ymm8,%ymm0,%ymm5
.byte 196,98,125,48,210 // vpmovzxbw %xmm2,%ymm10
@@ -52304,7 +52835,7 @@ HIDDEN _sk_srcin_hsw_8bit
.globl _sk_srcin_hsw_8bit
FUNCTION(_sk_srcin_hsw_8bit)
_sk_srcin_hsw_8bit:
- .byte 197,253,111,37,37,120,0,0 // vmovdqa 0x7825(%rip),%ymm4 # 2b580 <_sk_overlay_sse2_8bit+0xbbf>
+ .byte 197,253,111,37,85,120,0,0 // vmovdqa 0x7855(%rip),%ymm4 # 2bb80 <_sk_overlay_sse2_8bit+0xbcb>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -52344,7 +52875,7 @@ HIDDEN _sk_dstin_hsw_8bit
.globl _sk_dstin_hsw_8bit
FUNCTION(_sk_dstin_hsw_8bit)
_sk_dstin_hsw_8bit:
- .byte 197,253,111,37,155,119,0,0 // vmovdqa 0x779b(%rip),%ymm4 # 2b5a0 <_sk_overlay_sse2_8bit+0xbdf>
+ .byte 197,253,111,37,203,119,0,0 // vmovdqa 0x77cb(%rip),%ymm4 # 2bba0 <_sk_overlay_sse2_8bit+0xbeb>
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,125,48,226 // vpmovzxbw %xmm2,%ymm4
@@ -52384,7 +52915,7 @@ HIDDEN _sk_srcout_hsw_8bit
.globl _sk_srcout_hsw_8bit
FUNCTION(_sk_srcout_hsw_8bit)
_sk_srcout_hsw_8bit:
- .byte 197,253,111,37,15,119,0,0 // vmovdqa 0x770f(%rip),%ymm4 # 2b5c0 <_sk_overlay_sse2_8bit+0xbff>
+ .byte 197,253,111,37,63,119,0,0 // vmovdqa 0x773f(%rip),%ymm4 # 2bbc0 <_sk_overlay_sse2_8bit+0xc0b>
.byte 196,226,109,0,236 // vpshufb %ymm4,%ymm2,%ymm5
.byte 196,226,101,0,228 // vpshufb %ymm4,%ymm3,%ymm4
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -52427,7 +52958,7 @@ HIDDEN _sk_dstout_hsw_8bit
.globl _sk_dstout_hsw_8bit
FUNCTION(_sk_dstout_hsw_8bit)
_sk_dstout_hsw_8bit:
- .byte 197,253,111,37,121,118,0,0 // vmovdqa 0x7679(%rip),%ymm4 # 2b5e0 <_sk_overlay_sse2_8bit+0xc1f>
+ .byte 197,253,111,37,169,118,0,0 // vmovdqa 0x76a9(%rip),%ymm4 # 2bbe0 <_sk_overlay_sse2_8bit+0xc2b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -52470,7 +53001,7 @@ HIDDEN _sk_srcover_hsw_8bit
.globl _sk_srcover_hsw_8bit
FUNCTION(_sk_srcover_hsw_8bit)
_sk_srcover_hsw_8bit:
- .byte 197,253,111,37,225,117,0,0 // vmovdqa 0x75e1(%rip),%ymm4 # 2b600 <_sk_overlay_sse2_8bit+0xc3f>
+ .byte 197,253,111,37,17,118,0,0 // vmovdqa 0x7611(%rip),%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0xc4b>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,98,125,48,202 // vpmovzxbw %xmm2,%ymm9
@@ -52514,7 +53045,7 @@ HIDDEN _sk_dstover_hsw_8bit
.globl _sk_dstover_hsw_8bit
FUNCTION(_sk_dstover_hsw_8bit)
_sk_dstover_hsw_8bit:
- .byte 197,253,111,37,66,117,0,0 // vmovdqa 0x7542(%rip),%ymm4 # 2b620 <_sk_overlay_sse2_8bit+0xc5f>
+ .byte 197,253,111,37,114,117,0,0 // vmovdqa 0x7572(%rip),%ymm4 # 2bc20 <_sk_overlay_sse2_8bit+0xc6b>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,98,125,48,200 // vpmovzxbw %xmm0,%ymm9
@@ -52597,7 +53128,7 @@ FUNCTION(_sk_multiply_hsw_8bit)
_sk_multiply_hsw_8bit:
.byte 197,253,111,243 // vmovdqa %ymm3,%ymm6
.byte 197,253,111,218 // vmovdqa %ymm2,%ymm3
- .byte 197,125,111,13,3,116,0,0 // vmovdqa 0x7403(%rip),%ymm9 # 2b640 <_sk_overlay_sse2_8bit+0xc7f>
+ .byte 197,125,111,13,51,116,0,0 // vmovdqa 0x7433(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0xc8b>
.byte 196,194,101,0,225 // vpshufb %ymm9,%ymm3,%ymm4
.byte 196,194,77,0,233 // vpshufb %ymm9,%ymm6,%ymm5
.byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -52741,7 +53272,7 @@ HIDDEN _sk_xor__hsw_8bit
.globl _sk_xor__hsw_8bit
FUNCTION(_sk_xor__hsw_8bit)
_sk_xor__hsw_8bit:
- .byte 197,125,111,13,145,113,0,0 // vmovdqa 0x7191(%rip),%ymm9 # 2b660 <_sk_overlay_sse2_8bit+0xc9f>
+ .byte 197,125,111,13,193,113,0,0 // vmovdqa 0x71c1(%rip),%ymm9 # 2bc60 <_sk_overlay_sse2_8bit+0xcab>
.byte 196,194,109,0,225 // vpshufb %ymm9,%ymm2,%ymm4
.byte 196,194,101,0,249 // vpshufb %ymm9,%ymm3,%ymm7
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -52816,11 +53347,20 @@ _sk_xor__hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_plus__hsw_8bit
+.globl _sk_plus__hsw_8bit
+FUNCTION(_sk_plus__hsw_8bit)
+_sk_plus__hsw_8bit:
+ .byte 197,253,220,194 // vpaddusb %ymm2,%ymm0,%ymm0
+ .byte 197,245,220,203 // vpaddusb %ymm3,%ymm1,%ymm1
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_darken_hsw_8bit
.globl _sk_darken_hsw_8bit
FUNCTION(_sk_darken_hsw_8bit)
_sk_darken_hsw_8bit:
- .byte 197,125,111,5,63,112,0,0 // vmovdqa 0x703f(%rip),%ymm8 # 2b680 <_sk_overlay_sse2_8bit+0xcbf>
+ .byte 197,125,111,5,99,112,0,0 // vmovdqa 0x7063(%rip),%ymm8 # 2bc80 <_sk_overlay_sse2_8bit+0xccb>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -52893,7 +53433,7 @@ _sk_darken_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,236,103,0,0 // vpbroadcastd 0x67ec(%rip),%ymm4 # 2af9c <_sk_overlay_sse2_8bit+0x5db>
+ .byte 196,226,125,88,37,4,104,0,0 // vpbroadcastd 0x6804(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -52903,7 +53443,7 @@ HIDDEN _sk_lighten_hsw_8bit
.globl _sk_lighten_hsw_8bit
FUNCTION(_sk_lighten_hsw_8bit)
_sk_lighten_hsw_8bit:
- .byte 197,125,111,5,216,110,0,0 // vmovdqa 0x6ed8(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0xcdf>
+ .byte 197,125,111,5,252,110,0,0 // vmovdqa 0x6efc(%rip),%ymm8 # 2bca0 <_sk_overlay_sse2_8bit+0xceb>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -52976,7 +53516,7 @@ _sk_lighten_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,101,102,0,0 // vpbroadcastd 0x6665(%rip),%ymm4 # 2af9c <_sk_overlay_sse2_8bit+0x5db>
+ .byte 196,226,125,88,37,125,102,0,0 // vpbroadcastd 0x667d(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53016,7 +53556,7 @@ _sk_exclusion_hsw_8bit:
.byte 196,227,77,56,252,1 // vinserti128 $0x1,%xmm4,%ymm6,%ymm7
.byte 196,227,77,70,228,49 // vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
.byte 197,197,103,228 // vpackuswb %ymm4,%ymm7,%ymm4
- .byte 197,253,111,53,218,108,0,0 // vmovdqa 0x6cda(%rip),%ymm6 # 2b6c0 <_sk_overlay_sse2_8bit+0xcff>
+ .byte 197,253,111,53,254,108,0,0 // vmovdqa 0x6cfe(%rip),%ymm6 # 2bcc0 <_sk_overlay_sse2_8bit+0xd0b>
.byte 197,221,219,254 // vpand %ymm6,%ymm4,%ymm7
.byte 197,213,219,246 // vpand %ymm6,%ymm5,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -53032,7 +53572,7 @@ HIDDEN _sk_difference_hsw_8bit
.globl _sk_difference_hsw_8bit
FUNCTION(_sk_difference_hsw_8bit)
_sk_difference_hsw_8bit:
- .byte 197,125,111,5,206,108,0,0 // vmovdqa 0x6cce(%rip),%ymm8 # 2b6e0 <_sk_overlay_sse2_8bit+0xd1f>
+ .byte 197,125,111,5,242,108,0,0 // vmovdqa 0x6cf2(%rip),%ymm8 # 2bce0 <_sk_overlay_sse2_8bit+0xd2b>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -53099,7 +53639,7 @@ _sk_difference_hsw_8bit:
.byte 197,197,103,237 // vpackuswb %ymm5,%ymm7,%ymm5
.byte 197,181,218,228 // vpminub %ymm4,%ymm9,%ymm4
.byte 197,165,218,237 // vpminub %ymm5,%ymm11,%ymm5
- .byte 197,253,111,53,152,107,0,0 // vmovdqa 0x6b98(%rip),%ymm6 # 2b700 <_sk_overlay_sse2_8bit+0xd3f>
+ .byte 197,253,111,53,188,107,0,0 // vmovdqa 0x6bbc(%rip),%ymm6 # 2bd00 <_sk_overlay_sse2_8bit+0xd4b>
.byte 197,213,219,254 // vpand %ymm6,%ymm5,%ymm7
.byte 197,221,219,246 // vpand %ymm6,%ymm4,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -53125,7 +53665,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,227,125,57,203,1 // vextracti128 $0x1,%ymm1,%xmm3
.byte 196,98,125,48,195 // vpmovzxbw %xmm3,%ymm8
.byte 197,126,127,132,36,192,0,0,0 // vmovdqu %ymm8,0xc0(%rsp)
- .byte 197,253,111,29,77,107,0,0 // vmovdqa 0x6b4d(%rip),%ymm3 # 2b720 <_sk_overlay_sse2_8bit+0xd5f>
+ .byte 197,253,111,29,113,107,0,0 // vmovdqa 0x6b71(%rip),%ymm3 # 2bd20 <_sk_overlay_sse2_8bit+0xd6b>
.byte 196,226,125,0,227 // vpshufb %ymm3,%ymm0,%ymm4
.byte 196,226,117,0,203 // vpshufb %ymm3,%ymm1,%ymm1
.byte 197,125,111,251 // vmovdqa %ymm3,%ymm15
@@ -53154,7 +53694,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,65,125,111,231 // vmovdqa %ymm15,%ymm12
.byte 196,194,93,0,220 // vpshufb %ymm12,%ymm4,%ymm3
.byte 196,226,125,48,211 // vpmovzxbw %xmm3,%ymm2
- .byte 196,226,125,121,5,207,106,0,0 // vpbroadcastw 0x6acf(%rip),%ymm0 # 2b740 <_sk_overlay_sse2_8bit+0xd7f>
+ .byte 196,226,125,121,5,243,106,0,0 // vpbroadcastw 0x6af3(%rip),%ymm0 # 2bd40 <_sk_overlay_sse2_8bit+0xd8b>
.byte 197,109,239,248 // vpxor %ymm0,%ymm2,%ymm15
.byte 197,133,213,207 // vpmullw %ymm7,%ymm15,%ymm1
.byte 197,254,127,140,36,32,1,0,0 // vmovdqu %ymm1,0x120(%rsp)
@@ -53254,7 +53794,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,254,111,116,36,224 // vmovdqu -0x20(%rsp),%ymm6
.byte 197,205,253,52,36 // vpaddw (%rsp),%ymm6,%ymm6
.byte 196,193,53,253,252 // vpaddw %ymm12,%ymm9,%ymm7
- .byte 196,98,125,121,5,199,104,0,0 // vpbroadcastw 0x68c7(%rip),%ymm8 # 2b742 <_sk_overlay_sse2_8bit+0xd81>
+ .byte 196,98,125,121,5,235,104,0,0 // vpbroadcastw 0x68eb(%rip),%ymm8 # 2bd42 <_sk_overlay_sse2_8bit+0xd8d>
.byte 196,193,93,253,224 // vpaddw %ymm8,%ymm4,%ymm4
.byte 197,229,253,220 // vpaddw %ymm4,%ymm3,%ymm3
.byte 196,193,85,253,224 // vpaddw %ymm8,%ymm5,%ymm4
@@ -53263,7 +53803,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,156,104,0,0 // vpbroadcastw 0x689c(%rip),%ymm4 # 2b744 <_sk_overlay_sse2_8bit+0xd83>
+ .byte 196,226,125,121,37,192,104,0,0 // vpbroadcastw 0x68c0(%rip),%ymm4 # 2bd44 <_sk_overlay_sse2_8bit+0xd8f>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,237,228,212 // vpmulhuw %ymm4,%ymm2,%ymm2
@@ -53290,7 +53830,7 @@ FUNCTION(_sk_overlay_hsw_8bit)
_sk_overlay_hsw_8bit:
.byte 72,129,236,152,1,0,0 // sub $0x198,%rsp
.byte 197,252,17,140,36,64,1,0,0 // vmovups %ymm1,0x140(%rsp)
- .byte 197,253,111,45,66,104,0,0 // vmovdqa 0x6842(%rip),%ymm5 # 2b760 <_sk_overlay_sse2_8bit+0xd9f>
+ .byte 197,253,111,45,102,104,0,0 // vmovdqa 0x6866(%rip),%ymm5 # 2bd60 <_sk_overlay_sse2_8bit+0xdab>
.byte 197,253,111,226 // vmovdqa %ymm2,%ymm4
.byte 196,227,125,57,225,1 // vextracti128 $0x1,%ymm4,%xmm1
.byte 196,98,125,48,193 // vpmovzxbw %xmm1,%ymm8
@@ -53325,7 +53865,7 @@ _sk_overlay_hsw_8bit:
.byte 197,93,117,251 // vpcmpeqw %ymm3,%ymm4,%ymm15
.byte 197,253,111,216 // vmovdqa %ymm0,%ymm3
.byte 196,226,125,48,227 // vpmovzxbw %xmm3,%ymm4
- .byte 196,226,125,121,5,156,103,0,0 // vpbroadcastw 0x679c(%rip),%ymm0 # 2b780 <_sk_overlay_sse2_8bit+0xdbf>
+ .byte 196,226,125,121,5,192,103,0,0 // vpbroadcastw 0x67c0(%rip),%ymm0 # 2bd80 <_sk_overlay_sse2_8bit+0xdcb>
.byte 197,117,239,232 // vpxor %ymm0,%ymm1,%ymm13
.byte 197,21,213,212 // vpmullw %ymm4,%ymm13,%ymm10
.byte 197,126,127,148,36,192,0,0,0 // vmovdqu %ymm10,0xc0(%rsp)
@@ -53426,7 +53966,7 @@ _sk_overlay_hsw_8bit:
.byte 197,254,111,116,36,192 // vmovdqu -0x40(%rsp),%ymm6
.byte 197,205,253,116,36,224 // vpaddw -0x20(%rsp),%ymm6,%ymm6
.byte 196,193,29,253,253 // vpaddw %ymm13,%ymm12,%ymm7
- .byte 196,98,125,121,5,167,101,0,0 // vpbroadcastw 0x65a7(%rip),%ymm8 # 2b782 <_sk_overlay_sse2_8bit+0xdc1>
+ .byte 196,98,125,121,5,203,101,0,0 // vpbroadcastw 0x65cb(%rip),%ymm8 # 2bd82 <_sk_overlay_sse2_8bit+0xdcd>
.byte 196,193,109,253,208 // vpaddw %ymm8,%ymm2,%ymm2
.byte 197,229,253,210 // vpaddw %ymm2,%ymm3,%ymm2
.byte 196,193,85,253,216 // vpaddw %ymm8,%ymm5,%ymm3
@@ -53435,7 +53975,7 @@ _sk_overlay_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,124,101,0,0 // vpbroadcastw 0x657c(%rip),%ymm4 # 2b784 <_sk_overlay_sse2_8bit+0xdc3>
+ .byte 196,226,125,121,37,160,101,0,0 // vpbroadcastw 0x65a0(%rip),%ymm4 # 2bd84 <_sk_overlay_sse2_8bit+0xdcf>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,229,228,220 // vpmulhuw %ymm4,%ymm3,%ymm3
@@ -53480,7 +54020,7 @@ _sk_start_pipeline_sse41_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 25301 <_sk_start_pipeline_sse41_8bit+0x95>
+ .byte 115,102 // jae 258dd <_sk_start_pipeline_sse41_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -53490,7 +54030,7 @@ _sk_start_pipeline_sse41_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
- .byte 119,30 // ja 252e3 <_sk_start_pipeline_sse41_8bit+0x77>
+ .byte 119,30 // ja 258bf <_sk_start_pipeline_sse41_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -53499,17 +54039,17 @@ _sk_start_pipeline_sse41_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,16 // add $0x10,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 252c5 <_sk_start_pipeline_sse41_8bit+0x59>
+ .byte 118,226 // jbe 258a1 <_sk_start_pipeline_sse41_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 252f8 <_sk_start_pipeline_sse41_8bit+0x8c>
+ .byte 116,13 // je 258d4 <_sk_start_pipeline_sse41_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 252ab <_sk_start_pipeline_sse41_8bit+0x3f>
+ .byte 117,170 // jne 25887 <_sk_start_pipeline_sse41_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -53541,7 +54081,7 @@ HIDDEN _sk_set_rgb_sse41_8bit
FUNCTION(_sk_set_rgb_sse41_8bit)
_sk_set_rgb_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,1,91,0,0 // movss 0x5b01(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,16,37,25,91,0,0 // movss 0x5b19(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx
@@ -53556,7 +54096,7 @@ _sk_set_rgb_sse41_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,49,107,0,0 // movdqa 0x6b31(%rip),%xmm5 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,45,85,107,0,0 // movdqa 0x6b55(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -53570,12 +54110,12 @@ FUNCTION(_sk_premul_sse41_8bit)
_sk_premul_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,29,107,0,0 // movdqa 0x6b1d(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,5,65,107,0,0 // movdqa 0x6b41(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
- .byte 102,15,111,5,243,106,0,0 // movdqa 0x6af3(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,5,23,107,0,0 // movdqa 0x6b17(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -53608,7 +54148,7 @@ HIDDEN _sk_swap_rb_sse41_8bit
.globl _sk_swap_rb_sse41_8bit
FUNCTION(_sk_swap_rb_sse41_8bit)
_sk_swap_rb_sse41_8bit:
- .byte 102,15,111,37,144,106,0,0 // movdqa 0x6a90(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,37,180,106,0,0 // movdqa 0x6ab4(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53637,7 +54177,7 @@ _sk_load_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 25480 <_sk_load_8888_sse41_8bit+0x32>
+ .byte 117,17 // jne 25a5c <_sk_load_8888_sse41_8bit+0x32>
.byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53647,24 +54187,24 @@ _sk_load_8888_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 2547c <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 119,231 // ja 25a58 <_sk_load_8888_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 254ec <_sk_load_8888_sse41_8bit+0x9e>
+ .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 25ac8 <_sk_load_8888_sse41_8bit+0x9e>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 2547c <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 235,203 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,177 // jmp 2547c <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 235,177 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
.byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- .byte 235,139 // jmp 25476 <_sk_load_8888_sse41_8bit+0x28>
+ .byte 235,139 // jmp 25a52 <_sk_load_8888_sse41_8bit+0x28>
.byte 144 // nop
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
@@ -53676,7 +54216,7 @@ _sk_load_8888_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 25501 <_sk_load_8888_sse41_8bit+0xb3>
+ .byte 235,255 // jmp 25add <_sk_load_8888_sse41_8bit+0xb3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 223,255 // (bad)
@@ -53696,7 +54236,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 2553a <_sk_load_8888_dst_sse41_8bit+0x32>
+ .byte 117,17 // jne 25b16 <_sk_load_8888_dst_sse41_8bit+0x32>
.byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53706,24 +54246,24 @@ _sk_load_8888_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 25536 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 119,231 // ja 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 255a8 <_sk_load_8888_dst_sse41_8bit+0xa0>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 25b84 <_sk_load_8888_dst_sse41_8bit+0xa0>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 25536 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 235,203 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,177 // jmp 25536 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 235,177 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
.byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- .byte 235,139 // jmp 25530 <_sk_load_8888_dst_sse41_8bit+0x28>
+ .byte 235,139 // jmp 25b0c <_sk_load_8888_dst_sse41_8bit+0x28>
.byte 15,31,0 // nopl (%rax)
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -53735,7 +54275,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde0255c0 <_sk_overlay_sse2_8bit+0xffffffffddffabff>
+ .byte 233,255,255,255,221 // jmpq ffffffffde025b9c <_sk_overlay_sse2_8bit+0xffffffffddffabe7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -53753,7 +54293,7 @@ _sk_store_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 255f6 <_sk_store_8888_sse41_8bit+0x32>
+ .byte 117,17 // jne 25bd2 <_sk_store_8888_sse41_8bit+0x32>
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
.byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53761,22 +54301,22 @@ _sk_store_8888_sse41_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 119,239 // ja 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 25654 <_sk_store_8888_sse41_8bit+0x90>
+ .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 25c30 <_sk_store_8888_sse41_8bit+0x90>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4)
- .byte 235,211 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,211 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 102,66,15,58,22,68,138,8,2 // pextrd $0x2,%xmm0,0x8(%rdx,%r9,4)
.byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4)
- .byte 235,194 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,194 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 102,66,15,58,22,76,138,24,2 // pextrd $0x2,%xmm1,0x18(%rdx,%r9,4)
.byte 102,66,15,58,22,76,138,20,1 // pextrd $0x1,%xmm1,0x14(%rdx,%r9,4)
.byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4)
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
- .byte 235,161 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,161 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 195 // retq
.byte 255 // (bad)
@@ -53815,10 +54355,10 @@ _sk_load_bgra_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 256b4 <_sk_load_bgra_sse41_8bit+0x44>
+ .byte 117,35 // jne 25c90 <_sk_load_bgra_sse41_8bit+0x44>
.byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
- .byte 102,15,111,37,26,104,0,0 // movdqa 0x681a(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,37,62,104,0,0 // movdqa 0x683e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53828,24 +54368,24 @@ _sk_load_bgra_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,213 // ja 2569e <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 119,213 // ja 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25724 <_sk_load_bgra_sse41_8bit+0xb4>
+ .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25d00 <_sk_load_bgra_sse41_8bit+0xb4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,185 // jmp 2569e <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 235,185 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,159 // jmp 2569e <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 235,159 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
.byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- .byte 233,118,255,255,255 // jmpq 25698 <_sk_load_bgra_sse41_8bit+0x28>
+ .byte 233,118,255,255,255 // jmpq 25c74 <_sk_load_bgra_sse41_8bit+0x28>
.byte 102,144 // xchg %ax,%ax
.byte 185,255,255,255,205 // mov $0xcdffffff,%ecx
.byte 255 // (bad)
@@ -53878,10 +54418,10 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 25784 <_sk_load_bgra_dst_sse41_8bit+0x44>
+ .byte 117,35 // jne 25d60 <_sk_load_bgra_dst_sse41_8bit+0x44>
.byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
- .byte 102,15,111,37,74,103,0,0 // movdqa 0x674a(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,37,110,103,0,0 // movdqa 0x676e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,212 // pshufb %xmm4,%xmm2
.byte 102,15,56,0,220 // pshufb %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53891,24 +54431,24 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,213 // ja 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 119,213 // ja 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 257f4 <_sk_load_bgra_dst_sse41_8bit+0xb4>
+ .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25dd0 <_sk_load_bgra_dst_sse41_8bit+0xb4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 235,185 // jmp 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 235,185 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,159 // jmp 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 235,159 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
.byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- .byte 233,118,255,255,255 // jmpq 25768 <_sk_load_bgra_dst_sse41_8bit+0x28>
+ .byte 233,118,255,255,255 // jmpq 25d44 <_sk_load_bgra_dst_sse41_8bit+0x28>
.byte 102,144 // xchg %ax,%ax
.byte 185,255,255,255,205 // mov $0xcdffffff,%ecx
.byte 255 // (bad)
@@ -53940,13 +54480,13 @@ _sk_store_bgra_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 102,15,111,53,140,102,0,0 // movdqa 0x668c(%rip),%xmm6 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,53,176,102,0,0 // movdqa 0x66b0(%rip),%xmm6 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,56,0,238 // pshufb %xmm6,%xmm5
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,230 // pshufb %xmm6,%xmm4
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 2585c <_sk_store_bgra_sse41_8bit+0x4c>
+ .byte 117,17 // jne 25e38 <_sk_store_bgra_sse41_8bit+0x4c>
.byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4)
.byte 243,66,15,127,108,138,16 // movdqu %xmm5,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53954,22 +54494,22 @@ _sk_store_bgra_sse41_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 119,239 // ja 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 258b8 <_sk_store_bgra_sse41_8bit+0xa8>
+ .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 25e94 <_sk_store_bgra_sse41_8bit+0xa8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,36,138 // movd %xmm4,(%rdx,%r9,4)
- .byte 235,211 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,211 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 102,66,15,58,22,100,138,8,2 // pextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,36,138 // movq %xmm4,(%rdx,%r9,4)
- .byte 235,194 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,194 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 102,66,15,58,22,108,138,24,2 // pextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
.byte 102,66,15,58,22,108,138,20,1 // pextrd $0x1,%xmm5,0x14(%rdx,%r9,4)
.byte 102,66,15,126,108,138,16 // movd %xmm5,0x10(%rdx,%r9,4)
.byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4)
- .byte 235,161 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,161 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 144 // nop
.byte 197,255,255 // (bad)
.byte 255,214 // callq *%rsi
@@ -54004,9 +54544,9 @@ _sk_load_a8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,42 // jne 2591b <_sk_load_a8_sse41_8bit+0x47>
+ .byte 117,42 // jne 25ef7 <_sk_load_a8_sse41_8bit+0x47>
.byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1
- .byte 102,15,219,13,144,94,0,0 // pand 0x5e90(%rip),%xmm1 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,13,180,94,0,0 // pand 0x5eb4(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -54018,15 +54558,15 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,204 // ja 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 119,204 // ja 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 259ac <_sk_load_a8_sse41_8bit+0xd8>
+ .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 25f88 <_sk_load_a8_sse41_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,173 // jmp 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,173 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -54034,7 +54574,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 235,136 // jmp 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,136 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -54045,7 +54585,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,77,255,255,255 // jmpq 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 233,77,255,255,255 // jmpq 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -54054,7 +54594,7 @@ _sk_load_a8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0259bc <_sk_overlay_sse2_8bit+0xffffffffdeffaffb>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf025f98 <_sk_overlay_sse2_8bit+0xffffffffdeffafe3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -54077,9 +54617,9 @@ _sk_load_a8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,42 // jne 25a0f <_sk_load_a8_dst_sse41_8bit+0x47>
+ .byte 117,42 // jne 25feb <_sk_load_a8_dst_sse41_8bit+0x47>
.byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3
- .byte 102,15,219,29,156,93,0,0 // pand 0x5d9c(%rip),%xmm3 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,29,192,93,0,0 // pand 0x5dc0(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -54091,15 +54631,15 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,204 // ja 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 119,204 // ja 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 25aa0 <_sk_load_a8_dst_sse41_8bit+0xd8>
+ .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 2607c <_sk_load_a8_dst_sse41_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,173 // jmp 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,173 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -54107,7 +54647,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 235,136 // jmp 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,136 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -54118,7 +54658,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,77,255,255,255 // jmpq 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 233,77,255,255,255 // jmpq 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -54127,7 +54667,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf025ab0 <_sk_overlay_sse2_8bit+0xffffffffdeffb0ef>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf02608c <_sk_overlay_sse2_8bit+0xffffffffdeffb0d7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -54149,39 +54689,39 @@ _sk_store_a8_sse41_8bit:
.byte 72,99,87,8 // movslq 0x8(%rdi),%rdx
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 102,15,111,45,244,99,0,0 // movdqa 0x63f4(%rip),%xmm5 # 2bed0 <_sk_overlay_sse2_8bit+0x150f>
+ .byte 102,15,111,45,24,100,0,0 // movdqa 0x6418(%rip),%xmm5 # 2c4d0 <_sk_overlay_sse2_8bit+0x151b>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,19 // jne 25b0a <_sk_store_a8_sse41_8bit+0x4e>
- .byte 102,15,56,0,37,144,99,0,0 // pshufb 0x6390(%rip),%xmm4 # 2be90 <_sk_overlay_sse2_8bit+0x14cf>
+ .byte 117,19 // jne 260e6 <_sk_store_a8_sse41_8bit+0x4e>
+ .byte 102,15,56,0,37,180,99,0,0 // pshufb 0x63b4(%rip),%xmm4 # 2c490 <_sk_overlay_sse2_8bit+0x14db>
.byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,239 // ja 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 119,239 // ja 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 25b80 <_sk_store_a8_sse41_8bit+0xc4>
+ .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 2615c <_sk_store_a8_sse41_8bit+0xc4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,58,20,36,2,0 // pextrb $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,209 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,209 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 102,66,15,58,20,100,2,2,4 // pextrb $0x4,%xmm4,0x2(%rdx,%r8,1)
- .byte 102,15,56,0,37,89,92,0,0 // pshufb 0x5c59(%rip),%xmm4 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf>
+ .byte 102,15,56,0,37,125,92,0,0 // pshufb 0x5c7d(%rip),%xmm4 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,66,15,58,21,36,2,0 // pextrw $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,181 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,181 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 102,66,15,58,20,100,2,6,12 // pextrb $0xc,%xmm4,0x6(%rdx,%r8,1)
.byte 102,66,15,58,20,100,2,5,10 // pextrb $0xa,%xmm4,0x5(%rdx,%r8,1)
.byte 102,66,15,58,20,100,2,4,8 // pextrb $0x8,%xmm4,0x4(%rdx,%r8,1)
- .byte 102,15,56,0,37,59,92,0,0 // pshufb 0x5c3b(%rip),%xmm4 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef>
+ .byte 102,15,56,0,37,95,92,0,0 // pshufb 0x5c5f(%rip),%xmm4 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1)
- .byte 235,137 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,137 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 15,31,0 // nopl (%rax)
.byte 171 // stos %eax,%es:(%rdi)
.byte 255 // (bad)
@@ -54217,16 +54757,16 @@ _sk_load_g8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,66 // jne 25bfb <_sk_load_g8_sse41_8bit+0x5f>
+ .byte 117,66 // jne 261d7 <_sk_load_g8_sse41_8bit+0x5f>
.byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1
- .byte 102,15,219,13,200,91,0,0 // pand 0x5bc8(%rip),%xmm1 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,13,236,91,0,0 // pand 0x5bec(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
- .byte 102,15,111,37,3,99,0,0 // movdqa 0x6303(%rip),%xmm4 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,37,39,99,0,0 // movdqa 0x6327(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,56,64,204 // pmulld %xmm4,%xmm1
.byte 102,15,56,64,196 // pmulld %xmm4,%xmm0
- .byte 102,15,111,37,177,98,0,0 // movdqa 0x62b1(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,213,98,0,0 // movdqa 0x62d5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -54235,15 +54775,15 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,180 // ja 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 119,180 // ja 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 25c90 <_sk_load_g8_sse41_8bit+0xf4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2626c <_sk_load_g8_sse41_8bit+0xf4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,149 // jmp 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 235,149 // jmp 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -54251,7 +54791,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 233,109,255,255,255 // jmpq 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 233,109,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -54262,7 +54802,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,50,255,255,255 // jmpq 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 233,50,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -54271,7 +54811,7 @@ _sk_load_g8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde025ca0 <_sk_overlay_sse2_8bit+0xffffffffddffb2df>
+ .byte 232,255,255,255,221 // callq ffffffffde02627c <_sk_overlay_sse2_8bit+0xffffffffddffb2c7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -54294,16 +54834,16 @@ _sk_load_g8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,66 // jne 25d0b <_sk_load_g8_dst_sse41_8bit+0x5f>
+ .byte 117,66 // jne 262e7 <_sk_load_g8_dst_sse41_8bit+0x5f>
.byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3
- .byte 102,15,219,29,184,90,0,0 // pand 0x5ab8(%rip),%xmm3 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,29,220,90,0,0 // pand 0x5adc(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
- .byte 102,15,111,37,243,97,0,0 // movdqa 0x61f3(%rip),%xmm4 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,37,23,98,0,0 // movdqa 0x6217(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,56,64,220 // pmulld %xmm4,%xmm3
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
- .byte 102,15,111,37,161,97,0,0 // movdqa 0x61a1(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,197,97,0,0 // movdqa 0x61c5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -54312,15 +54852,15 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,180 // ja 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 119,180 // ja 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 25da0 <_sk_load_g8_dst_sse41_8bit+0xf4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2637c <_sk_load_g8_dst_sse41_8bit+0xf4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,149 // jmp 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 235,149 // jmp 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -54328,7 +54868,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 233,109,255,255,255 // jmpq 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 233,109,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -54339,7 +54879,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,50,255,255,255 // jmpq 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 233,50,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -54348,7 +54888,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde025db0 <_sk_overlay_sse2_8bit+0xffffffffddffb3ef>
+ .byte 232,255,255,255,221 // callq ffffffffde02638c <_sk_overlay_sse2_8bit+0xffffffffddffb3d7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -54372,11 +54912,11 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,206,0,0,0 // jne 25eaf <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
+ .byte 15,133,206,0,0,0 // jne 2648b <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
.byte 243,70,15,111,68,138,16 // movdqu 0x10(%rdx,%r9,4),%xmm8
.byte 243,70,15,111,12,138 // movdqu (%rdx,%r9,4),%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,183,96,0,0 // movdqa 0x60b7(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,219,96,0,0 // movdqa 0x60db(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,244 // pshufb %xmm4,%xmm6
.byte 102,15,111,248 // movdqa %xmm0,%xmm7
@@ -54410,7 +54950,7 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,68,15,248,204 // psubb %xmm4,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,72 // jne 25ee6 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
+ .byte 117,72 // jne 264c2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
.byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -54421,43 +54961,43 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 254,200 // dec %al
.byte 60,6 // cmp $0x6,%al
- .byte 15,135,38,255,255,255 // ja 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 15,135,38,255,255,255 // ja 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 25f8c <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
+ .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 26568 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,110,12,138 // movd (%rdx,%r9,4),%xmm9
- .byte 233,8,255,255,255 // jmpq 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 233,8,255,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,184 // ja 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 119,184 // ja 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 25fa8 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
+ .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 26584 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4)
- .byte 235,156 // jmp 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 235,156 // jmp 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 243,66,15,126,36,138 // movq (%rdx,%r9,4),%xmm4
.byte 102,68,15,58,14,204,15 // pblendw $0xf,%xmm4,%xmm9
- .byte 233,192,254,255,255 // jmpq 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 233,192,254,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,70,15,58,34,68,138,20,1 // pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8
.byte 102,70,15,58,34,68,138,16,0 // pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8
- .byte 233,150,254,255,255 // jmpq 25de8 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
+ .byte 233,150,254,255,255 // jmpq 263c4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
.byte 102,70,15,58,22,76,138,8,2 // pextrd $0x2,%xmm9,0x8(%rdx,%r9,4)
.byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4)
- .byte 233,69,255,255,255 // jmpq 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 233,69,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,70,15,58,22,68,138,24,2 // pextrd $0x2,%xmm8,0x18(%rdx,%r9,4)
.byte 102,70,15,58,22,68,138,20,1 // pextrd $0x1,%xmm8,0x14(%rdx,%r9,4)
.byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4)
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
- .byte 233,33,255,255,255 // jmpq 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 233,33,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,144 // xchg %ax,%ax
.byte 79,255 // rex.WRXB (bad)
.byte 255 // (bad)
@@ -54498,7 +55038,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,86,78,0,0 // mulss 0x4e56(%rip),%xmm0 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,5,110,78,0,0 // mulss 0x4e6e(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,68,15,56,48,197 // pmovzxbw %xmm5,%xmm8
@@ -54506,7 +55046,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,68,15,56,48,204 // pmovzxbw %xmm4,%xmm9
.byte 102,15,104,224 // punpckhbw %xmm0,%xmm4
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 102,15,56,0,53,238,94,0,0 // pshufb 0x5eee(%rip),%xmm6 # 2bef0 <_sk_overlay_sse2_8bit+0x152f>
+ .byte 102,15,56,0,53,18,95,0,0 // pshufb 0x5f12(%rip),%xmm6 # 2c4f0 <_sk_overlay_sse2_8bit+0x153b>
.byte 102,15,111,206 // movdqa %xmm6,%xmm1
.byte 102,65,15,213,201 // pmullw %xmm9,%xmm1
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
@@ -54539,13 +55079,13 @@ _sk_scale_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,160,0,0,0 // jne 26113 <_sk_scale_u8_sse41_8bit+0xc1>
+ .byte 15,133,160,0,0,0 // jne 266ef <_sk_scale_u8_sse41_8bit+0xc1>
.byte 102,66,15,56,48,52,2 // pmovzxbw (%rdx,%r8,1),%xmm6
- .byte 102,15,219,53,14,87,0,0 // pand 0x570e(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,53,50,87,0,0 // pand 0x5732(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
- .byte 102,15,56,0,61,108,94,0,0 // pshufb 0x5e6c(%rip),%xmm7 # 2bf00 <_sk_overlay_sse2_8bit+0x153f>
- .byte 102,15,56,0,53,115,94,0,0 // pshufb 0x5e73(%rip),%xmm6 # 2bf10 <_sk_overlay_sse2_8bit+0x154f>
+ .byte 102,15,56,0,61,144,94,0,0 // pshufb 0x5e90(%rip),%xmm7 # 2c500 <_sk_overlay_sse2_8bit+0x154b>
+ .byte 102,15,56,0,53,151,94,0,0 // pshufb 0x5e97(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0x155b>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -54576,15 +55116,15 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,82,255,255,255 // ja 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 15,135,82,255,255,255 // ja 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 261b0 <_sk_scale_u8_sse41_8bit+0x15e>
+ .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 2678c <_sk_scale_u8_sse41_8bit+0x15e>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,48,255,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,48,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,2 // pinsrw $0x2,%eax,%xmm6
@@ -54592,7 +55132,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,3 // pblendw $0x3,%xmm4,%xmm6
- .byte 233,8,255,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,8,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,6 // pinsrw $0x6,%eax,%xmm6
@@ -54603,7 +55143,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,205,254,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,205,254,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 15,31,0 // nopl (%rax)
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -54630,7 +55170,7 @@ FUNCTION(_sk_lerp_1_float_sse41_8bit)
_sk_lerp_1_float_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,86,76,0,0 // mulss 0x4c56(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,37,110,76,0,0 // mulss 0x4c6e(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -54641,7 +55181,7 @@ _sk_lerp_1_float_sse41_8bit:
.byte 102,65,15,104,193 // punpckhbw %xmm9,%xmm0
.byte 102,68,15,56,48,217 // pmovzxbw %xmm1,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,56,0,61,11,93,0,0 // pshufb 0x5d0b(%rip),%xmm7 # 2bf20 <_sk_overlay_sse2_8bit+0x155f>
+ .byte 102,15,56,0,61,47,93,0,0 // pshufb 0x5d2f(%rip),%xmm7 # 2c520 <_sk_overlay_sse2_8bit+0x156b>
.byte 102,68,15,111,231 // movdqa %xmm7,%xmm12
.byte 102,69,15,213,227 // pmullw %xmm11,%xmm12
.byte 102,68,15,111,239 // movdqa %xmm7,%xmm13
@@ -54702,13 +55242,13 @@ _sk_lerp_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,46,1,0,0 // jne 2643d <_sk_lerp_u8_sse41_8bit+0x14f>
+ .byte 15,133,46,1,0,0 // jne 26a19 <_sk_lerp_u8_sse41_8bit+0x14f>
.byte 102,66,15,56,48,60,2 // pmovzxbw (%rdx,%r8,1),%xmm7
- .byte 102,15,219,61,114,84,0,0 // pand 0x5472(%rip),%xmm7 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,61,150,84,0,0 // pand 0x5496(%rip),%xmm7 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,208,91,0,0 // pshufb 0x5bd0(%rip),%xmm6 # 2bf00 <_sk_overlay_sse2_8bit+0x153f>
- .byte 102,15,56,0,61,215,91,0,0 // pshufb 0x5bd7(%rip),%xmm7 # 2bf10 <_sk_overlay_sse2_8bit+0x154f>
+ .byte 102,15,56,0,53,244,91,0,0 // pshufb 0x5bf4(%rip),%xmm6 # 2c500 <_sk_overlay_sse2_8bit+0x154b>
+ .byte 102,15,56,0,61,251,91,0,0 // pshufb 0x5bfb(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0x155b>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -54768,15 +55308,15 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,196,254,255,255 // ja 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 15,135,196,254,255,255 // ja 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 264d8 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 26ab4 <_sk_lerp_u8_sse41_8bit+0x1ea>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,162,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,162,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,2 // pinsrw $0x2,%eax,%xmm7
@@ -54784,7 +55324,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,3 // pblendw $0x3,%xmm5,%xmm7
- .byte 233,122,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,122,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,6 // pinsrw $0x6,%eax,%xmm7
@@ -54795,7 +55335,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,15 // pblendw $0xf,%xmm5,%xmm7
- .byte 233,63,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,63,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 144 // nop
.byte 142,255 // mov %edi,%?
.byte 255 // (bad)
@@ -54803,7 +55343,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0264e8 <_sk_overlay_sse2_8bit+0xffffffffdeffbb27>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf026ac4 <_sk_overlay_sse2_8bit+0xffffffffdeffbb0f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -54837,7 +55377,7 @@ HIDDEN _sk_black_color_sse41_8bit
FUNCTION(_sk_black_color_sse41_8bit)
_sk_black_color_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,143,89,0,0 // movaps 0x598f(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 15,40,5,179,89,0,0 // movaps 0x59b3(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -54863,7 +55403,7 @@ HIDDEN _sk_srcatop_sse41_8bit
.globl _sk_srcatop_sse41_8bit
FUNCTION(_sk_srcatop_sse41_8bit)
_sk_srcatop_sse41_8bit:
- .byte 102,68,15,111,21,123,89,0,0 // movdqa 0x597b(%rip),%xmm10 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,21,159,89,0,0 // movdqa 0x599f(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,195 // pmovzxbw %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
@@ -54933,7 +55473,7 @@ HIDDEN _sk_dstatop_sse41_8bit
.globl _sk_dstatop_sse41_8bit
FUNCTION(_sk_dstatop_sse41_8bit)
_sk_dstatop_sse41_8bit:
- .byte 102,68,15,111,29,64,88,0,0 // movdqa 0x5840(%rip),%xmm11 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,29,100,88,0,0 // movdqa 0x5864(%rip),%xmm11 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,69,15,56,0,235 // pshufb %xmm11,%xmm13
.byte 102,68,15,111,248 // movdqa %xmm0,%xmm15
@@ -55005,7 +55545,7 @@ FUNCTION(_sk_srcin_sse41_8bit)
_sk_srcin_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,247,86,0,0 // movdqa 0x56f7(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,5,27,87,0,0 // movdqa 0x571b(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
@@ -55040,7 +55580,7 @@ HIDDEN _sk_dstin_sse41_8bit
.globl _sk_dstin_sse41_8bit
FUNCTION(_sk_dstin_sse41_8bit)
_sk_dstin_sse41_8bit:
- .byte 102,15,111,37,106,86,0,0 // movdqa 0x566a(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,142,86,0,0 // movdqa 0x568e(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
@@ -55079,7 +55619,7 @@ FUNCTION(_sk_srcout_sse41_8bit)
_sk_srcout_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,205,85,0,0 // movdqa 0x55cd(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,5,241,85,0,0 // movdqa 0x55f1(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55117,7 +55657,7 @@ HIDDEN _sk_dstout_sse41_8bit
.globl _sk_dstout_sse41_8bit
FUNCTION(_sk_dstout_sse41_8bit)
_sk_dstout_sse41_8bit:
- .byte 102,15,111,37,52,85,0,0 // movdqa 0x5534(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,88,85,0,0 // movdqa 0x5558(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,118,228 // pcmpeqd %xmm4,%xmm4
@@ -55157,7 +55697,7 @@ HIDDEN _sk_srcover_sse41_8bit
.globl _sk_srcover_sse41_8bit
FUNCTION(_sk_srcover_sse41_8bit)
_sk_srcover_sse41_8bit:
- .byte 102,15,111,53,147,84,0,0 // movdqa 0x5493(%rip),%xmm6 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,53,183,84,0,0 // movdqa 0x54b7(%rip),%xmm6 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,68,15,56,0,222 // pshufb %xmm6,%xmm11
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
@@ -55198,7 +55738,7 @@ HIDDEN _sk_dstover_sse41_8bit
.globl _sk_dstover_sse41_8bit
FUNCTION(_sk_dstover_sse41_8bit)
_sk_dstover_sse41_8bit:
- .byte 102,68,15,111,5,227,83,0,0 // movdqa 0x53e3(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,5,7,84,0,0 // movdqa 0x5407(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,209 // movdqa %xmm1,%xmm10
.byte 102,68,15,56,48,201 // pmovzxbw %xmm1,%xmm9
.byte 102,15,252,203 // paddb %xmm3,%xmm1
@@ -55277,7 +55817,7 @@ _sk_multiply_sse41_8bit:
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,53,161,82,0,0 // movdqa 0x52a1(%rip),%xmm14 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,53,197,82,0,0 // movdqa 0x52c5(%rip),%xmm14 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,195 // movdqa %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,65,15,56,0,238 // pshufb %xmm14,%xmm5
@@ -55406,7 +55946,7 @@ HIDDEN _sk_xor__sse41_8bit
.globl _sk_xor__sse41_8bit
FUNCTION(_sk_xor__sse41_8bit)
_sk_xor__sse41_8bit:
- .byte 102,68,15,111,21,95,80,0,0 // movdqa 0x505f(%rip),%xmm10 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,21,131,80,0,0 // movdqa 0x5083(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,226 // movdqa %xmm2,%xmm12
.byte 102,68,15,56,48,194 // pmovzxbw %xmm2,%xmm8
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
@@ -55474,12 +56014,21 @@ _sk_xor__sse41_8bit:
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_plus__sse41_8bit
+.globl _sk_plus__sse41_8bit
+FUNCTION(_sk_plus__sse41_8bit)
+_sk_plus__sse41_8bit:
+ .byte 102,15,220,194 // paddusb %xmm2,%xmm0
+ .byte 102,15,220,203 // paddusb %xmm3,%xmm1
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_darken_sse41_8bit
.globl _sk_darken_sse41_8bit
FUNCTION(_sk_darken_sse41_8bit)
_sk_darken_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,18,79,0,0 // movdqa 0x4f12(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,5,42,79,0,0 // movdqa 0x4f2a(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55546,7 +56095,7 @@ _sk_darken_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,70,78,0,0 // movaps 0x4e46(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 15,40,5,94,78,0,0 // movaps 0x4e5e(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -55558,7 +56107,7 @@ HIDDEN _sk_lighten_sse41_8bit
FUNCTION(_sk_lighten_sse41_8bit)
_sk_lighten_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,163,77,0,0 // movdqa 0x4da3(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,5,187,77,0,0 // movdqa 0x4dbb(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55625,7 +56174,7 @@ _sk_lighten_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,215,76,0,0 // movaps 0x4cd7(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 15,40,5,239,76,0,0 // movaps 0x4cef(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -55665,7 +56214,7 @@ _sk_exclusion_sse41_8bit:
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,253 // packuswb %xmm5,%xmm7
.byte 102,15,103,230 // packuswb %xmm6,%xmm4
- .byte 102,15,111,45,45,76,0,0 // movdqa 0x4c2d(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,45,69,76,0,0 // movdqa 0x4c45(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,248,204 // psubb %xmm4,%xmm1
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,239 // pand %xmm7,%xmm5
@@ -55680,7 +56229,7 @@ HIDDEN _sk_difference_sse41_8bit
FUNCTION(_sk_difference_sse41_8bit)
_sk_difference_sse41_8bit:
.byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
- .byte 102,15,111,13,132,75,0,0 // movdqa 0x4b84(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,13,156,75,0,0 // movdqa 0x4b9c(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55718,7 +56267,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,254 // packuswb %xmm6,%xmm7
- .byte 102,15,111,37,201,74,0,0 // movdqa 0x4ac9(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,225,74,0,0 // movdqa 0x4ae1(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,236 // pshufb %xmm4,%xmm5
.byte 102,69,15,104,236 // punpckhbw %xmm12,%xmm13
@@ -55743,7 +56292,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,103,241 // packuswb %xmm1,%xmm6
.byte 102,65,15,218,230 // pminub %xmm14,%xmm4
.byte 102,15,218,247 // pminub %xmm7,%xmm6
- .byte 102,15,111,13,204,74,0,0 // movdqa 0x4acc(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,13,228,74,0,0 // movdqa 0x4ae4(%rip),%xmm1 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,68,15,248,198 // psubb %xmm6,%xmm8
.byte 102,15,219,241 // pand %xmm1,%xmm6
.byte 102,15,219,204 // pand %xmm4,%xmm1
@@ -55772,7 +56321,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,69,15,56,48,221 // pmovzxbw %xmm13,%xmm11
.byte 102,68,15,127,92,36,48 // movdqa %xmm11,0x30(%rsp)
- .byte 102,15,111,13,214,73,0,0 // movdqa 0x49d6(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,13,238,73,0,0 // movdqa 0x49ee(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,68,15,56,0,233 // pshufb %xmm1,%xmm13
.byte 102,69,15,56,48,205 // pmovzxbw %xmm13,%xmm9
@@ -55821,7 +56370,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,65,15,56,58,242 // pminuw %xmm10,%xmm6
.byte 102,15,117,240 // pcmpeqw %xmm0,%xmm6
.byte 102,15,127,116,36,64 // movdqa %xmm6,0x40(%rsp)
- .byte 102,15,111,53,186,65,0,0 // movdqa 0x41ba(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,210,65,0,0 // movdqa 0x41d2(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,192 // pmullw %xmm8,%xmm0
@@ -55928,7 +56477,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,15,253,124,36,144 // paddw -0x70(%rsp),%xmm7
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,74,71,0,0 // movdqa 0x474a(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,98,71,0,0 // movdqa 0x4762(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,68,15,253,219 // paddw %xmm3,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -55937,7 +56486,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,252 // paddw %xmm4,%xmm7
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,48,71,0,0 // movdqa 0x4730(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,72,71,0,0 // movdqa 0x4748(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -55972,7 +56521,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,65,15,56,48,206 // pmovzxbw %xmm14,%xmm1
.byte 102,15,127,140,36,144,0,0,0 // movdqa %xmm1,0x90(%rsp)
- .byte 102,15,111,13,249,69,0,0 // movdqa 0x45f9(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,13,17,70,0,0 // movdqa 0x4611(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,56,0,249 // pshufb %xmm1,%xmm15
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,65,15,56,48,238 // pmovzxbw %xmm14,%xmm5
@@ -56024,7 +56573,7 @@ _sk_overlay_sse41_8bit:
.byte 102,65,15,56,58,221 // pminuw %xmm13,%xmm3
.byte 102,15,117,216 // pcmpeqw %xmm0,%xmm3
.byte 102,15,127,92,36,48 // movdqa %xmm3,0x30(%rsp)
- .byte 102,15,111,53,203,61,0,0 // movdqa 0x3dcb(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,227,61,0,0 // movdqa 0x3de3(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
@@ -56133,7 +56682,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,68,15,253,4,36 // paddw (%rsp),%xmm8
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,87,67,0,0 // movdqa 0x4357(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,111,67,0,0 // movdqa 0x436f(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,69,15,253,217 // paddw %xmm9,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -56142,7 +56691,7 @@ _sk_overlay_sse41_8bit:
.byte 102,68,15,253,195 // paddw %xmm3,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,59,67,0,0 // movdqa 0x433b(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,83,67,0,0 // movdqa 0x4353(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -56184,7 +56733,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 27d01 <_sk_start_pipeline_sse2_8bit+0x95>
+ .byte 115,102 // jae 282e9 <_sk_start_pipeline_sse2_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -56194,7 +56743,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
- .byte 119,30 // ja 27ce3 <_sk_start_pipeline_sse2_8bit+0x77>
+ .byte 119,30 // ja 282cb <_sk_start_pipeline_sse2_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -56203,17 +56752,17 @@ _sk_start_pipeline_sse2_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,16 // add $0x10,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 27cc5 <_sk_start_pipeline_sse2_8bit+0x59>
+ .byte 118,226 // jbe 282ad <_sk_start_pipeline_sse2_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 27cf8 <_sk_start_pipeline_sse2_8bit+0x8c>
+ .byte 116,13 // je 282e0 <_sk_start_pipeline_sse2_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 27cab <_sk_start_pipeline_sse2_8bit+0x3f>
+ .byte 117,170 // jne 28293 <_sk_start_pipeline_sse2_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -56245,7 +56794,7 @@ HIDDEN _sk_set_rgb_sse2_8bit
FUNCTION(_sk_set_rgb_sse2_8bit)
_sk_set_rgb_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,1,49,0,0 // movss 0x3101(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,16,37,13,49,0,0 // movss 0x310d(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx
@@ -56260,7 +56809,7 @@ _sk_set_rgb_sse2_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,49,65,0,0 // movdqa 0x4131(%rip),%xmm5 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,45,73,65,0,0 // movdqa 0x4149(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -56285,7 +56834,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 242,15,112,192,95 // pshuflw $0x5f,%xmm0,%xmm0
.byte 243,15,112,248,95 // pshufhw $0x5f,%xmm0,%xmm7
- .byte 102,15,111,5,213,64,0,0 // movdqa 0x40d5(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,5,237,64,0,0 // movdqa 0x40ed(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -56366,7 +56915,7 @@ _sk_load_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 27eeb <_sk_load_8888_sse2_8bit+0x31>
+ .byte 117,16 // jne 284d3 <_sk_load_8888_sse2_8bit+0x31>
.byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1
.byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56376,18 +56925,18 @@ _sk_load_8888_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 27ee7 <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 119,231 // ja 284cf <_sk_load_8888_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 27f5c <_sk_load_8888_sse2_8bit+0xa2>
+ .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 28544 <_sk_load_8888_sse2_8bit+0xa2>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 27ee7 <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 235,203 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 235,183 // jmp 27ee7 <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 235,183 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0
@@ -56396,7 +56945,7 @@ _sk_load_8888_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 235,134 // jmp 27ee1 <_sk_load_8888_sse2_8bit+0x27>
+ .byte 235,134 // jmp 284c9 <_sk_load_8888_sse2_8bit+0x27>
.byte 144 // nop
.byte 184,255,255,255,204 // mov $0xccffffff,%eax
.byte 255 // (bad)
@@ -56428,7 +56977,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 27fa9 <_sk_load_8888_dst_sse2_8bit+0x31>
+ .byte 117,16 // jne 28591 <_sk_load_8888_dst_sse2_8bit+0x31>
.byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3
.byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56438,18 +56987,18 @@ _sk_load_8888_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 119,231 // ja 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 2801c <_sk_load_8888_dst_sse2_8bit+0xa4>
+ .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 28604 <_sk_load_8888_dst_sse2_8bit+0xa4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 235,203 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2
- .byte 235,183 // jmp 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 235,183 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2
@@ -56458,7 +57007,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 235,134 // jmp 27f9f <_sk_load_8888_dst_sse2_8bit+0x27>
+ .byte 235,134 // jmp 28587 <_sk_load_8888_dst_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -56493,7 +57042,7 @@ _sk_store_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 2806a <_sk_store_8888_sse2_8bit+0x32>
+ .byte 117,17 // jne 28652 <_sk_store_8888_sse2_8bit+0x32>
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
.byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56501,25 +57050,25 @@ _sk_store_8888_sse2_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 119,239 // ja 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 280d0 <_sk_store_8888_sse2_8bit+0x98>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 286b8 <_sk_store_8888_sse2_8bit+0x98>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4)
- .byte 235,211 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,211 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4)
- .byte 235,191 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,191 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4)
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4)
.byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4)
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
- .byte 235,152 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,152 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,144 // xchg %ax,%ax
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -56555,7 +57104,7 @@ _sk_load_bgra_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,92 // jne 28169 <_sk_load_bgra_sse2_8bit+0x7d>
+ .byte 117,92 // jne 28751 <_sk_load_bgra_sse2_8bit+0x7d>
.byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1
.byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -56582,18 +57131,18 @@ _sk_load_bgra_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,155 // ja 28119 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 119,155 // ja 28701 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 281e4 <_sk_load_bgra_sse2_8bit+0xf8>
+ .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 287cc <_sk_load_bgra_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0
- .byte 233,124,255,255,255 // jmpq 28119 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 233,124,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 233,101,255,255,255 // jmpq 28119 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 233,101,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0
@@ -56602,7 +57151,7 @@ _sk_load_bgra_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 233,49,255,255,255 // jmpq 28113 <_sk_load_bgra_sse2_8bit+0x27>
+ .byte 233,49,255,255,255 // jmpq 286fb <_sk_load_bgra_sse2_8bit+0x27>
.byte 102,144 // xchg %ax,%ax
.byte 174 // scas %es:(%rdi),%al
.byte 255 // (bad)
@@ -56639,7 +57188,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,92 // jne 2827d <_sk_load_bgra_dst_sse2_8bit+0x7d>
+ .byte 117,92 // jne 28865 <_sk_load_bgra_dst_sse2_8bit+0x7d>
.byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3
.byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -56666,18 +57215,18 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,155 // ja 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 119,155 // ja 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 282f8 <_sk_load_bgra_dst_sse2_8bit+0xf8>
+ .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 288e0 <_sk_load_bgra_dst_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2
- .byte 233,124,255,255,255 // jmpq 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 233,124,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2
- .byte 233,101,255,255,255 // jmpq 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 233,101,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2
@@ -56686,7 +57235,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 233,49,255,255,255 // jmpq 28227 <_sk_load_bgra_dst_sse2_8bit+0x27>
+ .byte 233,49,255,255,255 // jmpq 2880f <_sk_load_bgra_dst_sse2_8bit+0x27>
.byte 102,144 // xchg %ax,%ax
.byte 174 // scas %es:(%rdi),%al
.byte 255 // (bad)
@@ -56742,7 +57291,7 @@ _sk_store_bgra_sse2_8bit:
.byte 243,15,112,237,198 // pshufhw $0xc6,%xmm5,%xmm5
.byte 102,15,103,238 // packuswb %xmm6,%xmm5
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 2839a <_sk_store_bgra_sse2_8bit+0x86>
+ .byte 117,17 // jne 28982 <_sk_store_bgra_sse2_8bit+0x86>
.byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4)
.byte 243,66,15,127,100,138,16 // movdqu %xmm4,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56750,25 +57299,25 @@ _sk_store_bgra_sse2_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 119,239 // ja 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 28400 <_sk_store_bgra_sse2_8bit+0xec>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 289e8 <_sk_store_bgra_sse2_8bit+0xec>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,44,138 // movd %xmm5,(%rdx,%r9,4)
- .byte 235,211 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,211 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,15,112,229,78 // pshufd $0x4e,%xmm5,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,44,138 // movq %xmm5,(%rdx,%r9,4)
- .byte 235,191 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,191 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
.byte 102,66,15,126,116,138,24 // movd %xmm6,0x18(%rdx,%r9,4)
.byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
.byte 102,66,15,126,116,138,20 // movd %xmm6,0x14(%rdx,%r9,4)
.byte 102,66,15,126,100,138,16 // movd %xmm4,0x10(%rdx,%r9,4)
.byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4)
- .byte 235,152 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,152 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,144 // xchg %ax,%ax
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -56803,10 +57352,10 @@ _sk_load_a8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,48 // jne 28469 <_sk_load_a8_sse2_8bit+0x4d>
+ .byte 117,48 // jne 28a51 <_sk_load_a8_sse2_8bit+0x4d>
.byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,84,5,69,51,0,0 // andpd 0x3345(%rip),%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,5,93,51,0,0 // andpd 0x335d(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,40,200 // movapd %xmm0,%xmm1
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -56819,15 +57368,15 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 119,201 // ja 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 284f4 <_sk_load_a8_sse2_8bit+0xd8>
+ .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28adc <_sk_load_a8_sse2_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,170 // jmp 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 235,170 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -56835,7 +57384,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,136 // jmp 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 235,136 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -56846,7 +57395,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,80,255,255,255 // jmpq 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 233,80,255,255,255 // jmpq 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 144 // nop
.byte 154 // (bad)
.byte 255 // (bad)
@@ -56880,10 +57429,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,48 // jne 2855d <_sk_load_a8_dst_sse2_8bit+0x4d>
+ .byte 117,48 // jne 28b45 <_sk_load_a8_dst_sse2_8bit+0x4d>
.byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,84,21,81,50,0,0 // andpd 0x3251(%rip),%xmm2 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,21,105,50,0,0 // andpd 0x3269(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,40,218 // movapd %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -56896,15 +57445,15 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 119,201 // ja 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 285e8 <_sk_load_a8_dst_sse2_8bit+0xd8>
+ .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28bd0 <_sk_load_a8_dst_sse2_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 235,170 // jmp 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 235,170 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -56912,7 +57461,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 235,136 // jmp 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 235,136 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -56923,7 +57472,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,80,255,255,255 // jmpq 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 233,80,255,255,255 // jmpq 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 144 // nop
.byte 154 // (bad)
.byte 255 // (bad)
@@ -56966,8 +57515,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,22 // jne 28661 <_sk_store_a8_sse2_8bit+0x5d>
- .byte 102,15,219,37,61,49,0,0 // pand 0x313d(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 117,22 // jne 28c49 <_sk_store_a8_sse2_8bit+0x5d>
+ .byte 102,15,219,37,85,49,0,0 // pand 0x3155(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56975,24 +57524,24 @@ _sk_store_a8_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,239 // ja 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 119,239 // ja 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 286fc <_sk_store_a8_sse2_8bit+0xf8>
+ .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 28ce4 <_sk_store_a8_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,15,127,100,36,168 // movdqa %xmm4,-0x58(%rsp)
.byte 138,68,36,168 // mov -0x58(%rsp),%al
.byte 66,136,4,2 // mov %al,(%rdx,%r8,1)
- .byte 235,203 // jmp 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 235,203 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 102,15,127,100,36,184 // movdqa %xmm4,-0x48(%rsp)
.byte 138,68,36,188 // mov -0x44(%rsp),%al
.byte 66,136,68,2,2 // mov %al,0x2(%rdx,%r8,1)
- .byte 102,15,219,37,231,48,0,0 // pand 0x30e7(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,37,255,48,0,0 // pand 0x30ff(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,66,137,4,2 // mov %ax,(%rdx,%r8,1)
- .byte 235,165 // jmp 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 235,165 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 102,15,127,100,36,232 // movdqa %xmm4,-0x18(%rsp)
.byte 138,68,36,244 // mov -0xc(%rsp),%al
.byte 66,136,68,2,6 // mov %al,0x6(%rdx,%r8,1)
@@ -57002,17 +57551,17 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,100,36,200 // movdqa %xmm4,-0x38(%rsp)
.byte 138,68,36,208 // mov -0x30(%rsp),%al
.byte 66,136,68,2,4 // mov %al,0x4(%rdx,%r8,1)
- .byte 102,15,219,37,163,48,0,0 // pand 0x30a3(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,37,187,48,0,0 // pand 0x30bb(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1)
- .byte 233,97,255,255,255 // jmpq 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 233,97,255,255,255 // jmpq 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 134,255 // xchg %bh,%bh
.byte 255 // (bad)
.byte 255,165,255,255,255,150 // jmpq *-0x69000001(%rbp)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,218 // jmpq ffffffffdb02870c <_sk_overlay_sse2_8bit+0xffffffffdaffdd4b>
+ .byte 233,255,255,255,218 // jmpq ffffffffdb028cf4 <_sk_overlay_sse2_8bit+0xffffffffdaffdd3f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,203 // dec %ebx
@@ -57036,15 +57585,15 @@ _sk_load_g8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,116 // jne 287a9 <_sk_load_g8_sse2_8bit+0x91>
+ .byte 117,116 // jne 28d91 <_sk_load_g8_sse2_8bit+0x91>
.byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,84,5,73,48,0,0 // andpd 0x3049(%rip),%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,5,97,48,0,0 // andpd 0x3061(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,40,224 // movapd %xmm0,%xmm4
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,45,129,55,0,0 // movdqa 0x3781(%rip),%xmm5 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,45,153,55,0,0 // movdqa 0x3799(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
@@ -57057,7 +57606,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,196 // punpckldq %xmm4,%xmm0
- .byte 102,15,111,37,3,55,0,0 // movdqa 0x3703(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,27,55,0,0 // movdqa 0x371b(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -57066,15 +57615,15 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,133 // ja 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 119,133 // ja 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 2883c <_sk_load_g8_sse2_8bit+0x124>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28e24 <_sk_load_g8_sse2_8bit+0x124>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 233,99,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,99,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -57082,7 +57631,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 233,62,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,62,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -57093,7 +57642,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,6,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,6,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -57128,15 +57677,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,116 // jne 288e9 <_sk_load_g8_dst_sse2_8bit+0x91>
+ .byte 117,116 // jne 28ed1 <_sk_load_g8_dst_sse2_8bit+0x91>
.byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,84,21,9,47,0,0 // andpd 0x2f09(%rip),%xmm2 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,21,33,47,0,0 // andpd 0x2f21(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,40,226 // movapd %xmm2,%xmm4
.byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
.byte 102,15,105,211 // punpckhwd %xmm3,%xmm2
- .byte 102,15,111,45,65,54,0,0 // movdqa 0x3641(%rip),%xmm5 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,45,89,54,0,0 // movdqa 0x3659(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6
.byte 102,15,244,213 // pmuludq %xmm5,%xmm2
.byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3
@@ -57149,7 +57698,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,212 // punpckldq %xmm4,%xmm2
- .byte 102,15,111,37,195,53,0,0 // movdqa 0x35c3(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,219,53,0,0 // movdqa 0x35db(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -57158,15 +57707,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,133 // ja 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 119,133 // ja 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 2897c <_sk_load_g8_dst_sse2_8bit+0x124>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28f64 <_sk_load_g8_dst_sse2_8bit+0x124>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,99,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,99,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -57174,7 +57723,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,62,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,62,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -57185,7 +57734,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,6,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,6,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -57221,7 +57770,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne 28aba <_sk_srcover_rgba_8888_sse2_8bit+0x122>
+ .byte 15,133,253,0,0,0 // jne 290a2 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
.byte 70,15,16,68,138,16 // movups 0x10(%rdx,%r9,4),%xmm8
.byte 102,70,15,16,12,138 // movupd (%rdx,%r9,4),%xmm9
.byte 77,133,192 // test %r8,%r8
@@ -57270,7 +57819,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,68,15,248,207 // psubb %xmm7,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,72 // jne 28af1 <_sk_srcover_rgba_8888_sse2_8bit+0x159>
+ .byte 117,72 // jne 290d9 <_sk_srcover_rgba_8888_sse2_8bit+0x159>
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
.byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -57281,29 +57830,29 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 254,200 // dec %al
.byte 60,6 // cmp $0x6,%al
- .byte 15,135,246,254,255,255 // ja 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 15,135,246,254,255,255 // ja 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 28bac <_sk_srcover_rgba_8888_sse2_8bit+0x214>
+ .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 29194 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,70,15,16,12,138 // movss (%rdx,%r9,4),%xmm9
- .byte 233,216,254,255,255 // jmpq 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 233,216,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,184 // ja 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 119,184 // ja 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 28bc8 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
+ .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 291b0 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4)
- .byte 235,156 // jmp 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 235,156 // jmp 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,70,15,18,12,138 // movlpd (%rdx,%r9,4),%xmm9
- .byte 233,151,254,255,255 // jmpq 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 233,151,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 243,66,15,16,100,138,20 // movss 0x14(%rdx,%r9,4),%xmm4
@@ -57312,23 +57861,23 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 68,15,40,196 // movaps %xmm4,%xmm8
.byte 243,66,15,16,100,138,16 // movss 0x10(%rdx,%r9,4),%xmm4
.byte 243,68,15,16,196 // movss %xmm4,%xmm8
- .byte 233,94,254,255,255 // jmpq 289c3 <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
+ .byte 233,94,254,255,255 // jmpq 28fab <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
.byte 102,65,15,112,225,78 // pshufd $0x4e,%xmm9,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4)
- .byte 233,57,255,255,255 // jmpq 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 233,57,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 102,65,15,112,224,78 // pshufd $0x4e,%xmm8,%xmm4
.byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4)
.byte 102,65,15,112,224,229 // pshufd $0xe5,%xmm8,%xmm4
.byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4)
.byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4)
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
- .byte 233,13,255,255,255 // jmpq 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 233,13,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 15,31,0 // nopl (%rax)
.byte 58,255 // cmp %bh,%bh
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 28bb1 <_sk_srcover_rgba_8888_sse2_8bit+0x219>
+ .byte 123,255 // jnp 29199 <_sk_srcover_rgba_8888_sse2_8bit+0x219>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -57366,7 +57915,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,52,34,0,0 // mulss 0x2234(%rip),%xmm0 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,5,64,34,0,0 // mulss 0x2240(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
@@ -57378,7 +57927,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,246 // punpcklbw %xmm6,%xmm6
.byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6
.byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6
- .byte 102,15,219,53,91,43,0,0 // pand 0x2b5b(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,53,115,43,0,0 // pand 0x2b73(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,65,15,213,248 // pmullw %xmm8,%xmm7
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
@@ -57411,10 +57960,10 @@ _sk_scale_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,239,0,0,0 // jne 28d95 <_sk_scale_u8_sse2_8bit+0x110>
+ .byte 15,133,239,0,0,0 // jne 2937d <_sk_scale_u8_sse2_8bit+0x110>
.byte 243,66,15,126,36,2 // movq (%rdx,%r8,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
- .byte 102,15,84,37,216,42,0,0 // andpd 0x2ad8(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,37,240,42,0,0 // andpd 0x2af0(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,40,236 // movapd %xmm4,%xmm5
.byte 102,65,15,105,232 // punpckhwd %xmm8,%xmm5
@@ -57467,15 +58016,15 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,6,255,255,255 // ja 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 15,135,6,255,255,255 // ja 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28e2c <_sk_scale_u8_sse2_8bit+0x1a7>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 29414 <_sk_scale_u8_sse2_8bit+0x1a7>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 233,228,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,228,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,2 // pinsrw $0x2,%eax,%xmm4
@@ -57483,7 +58032,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 243,15,16,229 // movss %xmm5,%xmm4
- .byte 233,191,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,191,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,6 // pinsrw $0x6,%eax,%xmm4
@@ -57494,7 +58043,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,135,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,135,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -57523,7 +58072,7 @@ FUNCTION(_sk_lerp_1_float_sse2_8bit)
_sk_lerp_1_float_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,218,31,0,0 // mulss 0x1fda(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,37,230,31,0,0 // mulss 0x1fe6(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -57536,7 +58085,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,69,15,96,217 // punpcklbw %xmm9,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,111,53,249,40,0,0 // movdqa 0x28f9(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,17,41,0,0 // movdqa 0x2911(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
.byte 102,15,213,225 // pmullw %xmm1,%xmm4
@@ -57601,10 +58150,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,141,1,0,0 // jne 2912c <_sk_lerp_u8_sse2_8bit+0x1ae>
+ .byte 15,133,141,1,0,0 // jne 29714 <_sk_lerp_u8_sse2_8bit+0x1ae>
.byte 243,66,15,126,44,2 // movq (%rdx,%r8,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,84,45,223,39,0,0 // andpd 0x27df(%rip),%xmm5 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,45,247,39,0,0 // andpd 0x27f7(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,40,229 // movapd %xmm5,%xmm4
.byte 102,65,15,105,224 // punpckhwd %xmm8,%xmm4
@@ -57690,15 +58239,15 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,104,254,255,255 // ja 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 15,135,104,254,255,255 // ja 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 291c0 <_sk_lerp_u8_sse2_8bit+0x242>
+ .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 297a8 <_sk_lerp_u8_sse2_8bit+0x242>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,232 // movd %eax,%xmm5
- .byte 233,70,254,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,70,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,2 // pinsrw $0x2,%eax,%xmm5
@@ -57706,7 +58255,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 243,15,16,236 // movss %xmm4,%xmm5
- .byte 233,33,254,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,33,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,6 // pinsrw $0x6,%eax,%xmm5
@@ -57717,7 +58266,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 242,15,16,236 // movsd %xmm4,%xmm5
- .byte 233,233,253,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,233,253,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 149 // xchg %eax,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
@@ -57762,7 +58311,7 @@ HIDDEN _sk_black_color_sse2_8bit
FUNCTION(_sk_black_color_sse2_8bit)
_sk_black_color_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,167,44,0,0 // movaps 0x2ca7(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 15,40,5,191,44,0,0 // movaps 0x2cbf(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -58559,6 +59108,15 @@ _sk_xor__sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_plus__sse2_8bit
+.globl _sk_plus__sse2_8bit
+FUNCTION(_sk_plus__sse2_8bit)
+_sk_plus__sse2_8bit:
+ .byte 102,15,220,194 // paddusb %xmm2,%xmm0
+ .byte 102,15,220,203 // paddusb %xmm3,%xmm1
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_darken_sse2_8bit
.globl _sk_darken_sse2_8bit
FUNCTION(_sk_darken_sse2_8bit)
@@ -58654,7 +59212,7 @@ _sk_darken_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,66,30,0,0 // movdqa 0x1e42(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,37,78,30,0,0 // movdqa 0x1e4e(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -58762,7 +59320,7 @@ _sk_lighten_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,86,28,0,0 // movdqa 0x1c56(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,37,98,28,0,0 // movdqa 0x1c62(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -58812,7 +59370,7 @@ _sk_exclusion_sse2_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,103,244 // packuswb %xmm4,%xmm6
.byte 102,15,103,239 // packuswb %xmm7,%xmm5
- .byte 102,15,111,37,137,27,0,0 // movdqa 0x1b89(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,37,149,27,0,0 // movdqa 0x1b95(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,248,205 // psubb %xmm5,%xmm1
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,219,230 // pand %xmm6,%xmm4
@@ -58911,7 +59469,7 @@ _sk_difference_sse2_8bit:
.byte 102,65,15,103,244 // packuswb %xmm12,%xmm6
.byte 102,65,15,218,226 // pminub %xmm10,%xmm4
.byte 102,65,15,218,243 // pminub %xmm11,%xmm6
- .byte 102,15,111,45,198,25,0,0 // movdqa 0x19c6(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,45,210,25,0,0 // movdqa 0x19d2(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 102,15,219,236 // pand %xmm4,%xmm5
@@ -59008,7 +59566,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
.byte 102,69,15,217,211 // psubusw %xmm11,%xmm10
.byte 102,68,15,117,213 // pcmpeqw %xmm5,%xmm10
- .byte 102,15,111,45,97,16,0,0 // movdqa 0x1061(%rip),%xmm5 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,45,109,16,0,0 // movdqa 0x106d(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
.byte 102,15,239,197 // pxor %xmm5,%xmm0
.byte 102,65,15,213,198 // pmullw %xmm14,%xmm0
@@ -59112,7 +59670,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,253,124,36,32 // paddw 0x20(%rsp),%xmm15
.byte 102,68,15,253,76,36,144 // paddw -0x70(%rsp),%xmm9
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,5,22,0,0 // movdqa 0x1605(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,17,22,0,0 // movdqa 0x1611(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,15,253,208 // paddw %xmm0,%xmm2
.byte 102,68,15,253,210 // paddw %xmm2,%xmm10
.byte 102,68,15,253,248 // paddw %xmm0,%xmm15
@@ -59121,7 +59679,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,69,15,253,193 // paddw %xmm9,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,233 // paddw %xmm1,%xmm5
- .byte 102,15,111,5,232,21,0,0 // movdqa 0x15e8(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,244,21,0,0 // movdqa 0x15f4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,192 // pmulhuw %xmm0,%xmm8
.byte 102,68,15,228,248 // pmulhuw %xmm0,%xmm15
@@ -59226,7 +59784,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,217,234 // psubusw %xmm2,%xmm5
.byte 102,15,117,236 // pcmpeqw %xmm4,%xmm5
.byte 102,15,127,108,36,32 // movdqa %xmm5,0x20(%rsp)
- .byte 102,15,111,53,49,12,0,0 // movdqa 0xc31(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,61,12,0,0 // movdqa 0xc3d(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,194 // movdqa %xmm2,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,199 // pmullw %xmm15,%xmm0
@@ -59334,7 +59892,7 @@ _sk_overlay_sse2_8bit:
.byte 102,68,15,253,92,36,240 // paddw -0x10(%rsp),%xmm11
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
.byte 102,15,253,116,36,144 // paddw -0x70(%rsp),%xmm6
- .byte 102,15,111,5,196,17,0,0 // movdqa 0x11c4(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,208,17,0,0 // movdqa 0x11d0(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,253,224 // paddw %xmm0,%xmm12
.byte 102,68,15,253,227 // paddw %xmm3,%xmm12
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
@@ -59343,7 +59901,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,234 // paddw %xmm2,%xmm5
.byte 102,15,253,240 // paddw %xmm0,%xmm6
.byte 102,15,253,241 // paddw %xmm1,%xmm6
- .byte 102,15,111,5,168,17,0,0 // movdqa 0x11a8(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,180,17,0,0 // movdqa 0x11b4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
@@ -59377,14 +59935,14 @@ BALIGN4
.byte 252 // cld
.byte 190,0,0,128,191 // mov $0xbf800000,%esi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2ae64 <.literal4+0x64>
+ .byte 224,64 // loopne 2b458 <.literal4+0x64>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 2ae6d <.literal4+0x6d>
+ .byte 71,225,61 // rex.RXB loope 2b461 <.literal4+0x6d>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2ae77 <.literal4+0x77>
+ .byte 127,67 // jg 2b46b <.literal4+0x77>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi)
.byte 10,215 // or %bh,%dl
@@ -59417,7 +59975,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2ae8d <.literal4+0x8d>
+ .byte 224,7 // loopne 2b481 <.literal4+0x8d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -59428,8 +59986,8 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 2aea0 <.literal4+0xa0>
- .byte 119,115 // ja 2af15 <.literal4+0x115>
+ .byte 127,0 // jg 2b494 <.literal4+0xa0>
+ .byte 119,115 // ja 2b509 <.literal4+0x115>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -59452,12 +60010,12 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2af2b <.literal4+0x12b>
+ .byte 118,63 // jbe 2b51f <.literal4+0x12b>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2af3a <.literal4+0x13a>
+ .byte 124,66 // jl 2b52e <.literal4+0x13a>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -59467,9 +60025,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 2af5d <.literal4+0x15d>
+ .byte 112,65 // jo 2b551 <.literal4+0x15d>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2af67 <.literal4+0x167>
+ .byte 127,71 // jg 2b55b <.literal4+0x167>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,89 // ds pop %rcx
@@ -59496,15 +60054,15 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,0,0 // addb $0x0,(%rax)
.byte 0,191,0,0,192,191 // add %bh,-0x40400000(%rdi)
- .byte 114,28 // jb 2af86 <.literal4+0x186>
+ .byte 114,28 // jb 2b57a <.literal4+0x186>
.byte 199 // (bad)
.byte 62,0,0 // add %al,%ds:(%rax)
.byte 192,63,85 // sarb $0x55,(%rdi)
.byte 85 // push %rbp
.byte 149 // xchg %eax,%ebp
.byte 191,57,142,99,61 // mov $0x3d638e39,%edi
- .byte 114,249 // jb 2af73 <.literal4+0x173>
- .byte 127,63 // jg 2afbb <_sk_overlay_sse2_8bit+0x5fa>
+ .byte 114,249 // jb 2b567 <.literal4+0x173>
+ .byte 127,63 // jg 2b5af <_sk_overlay_sse2_8bit+0x5fa>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,4 // add %al,0x4000000(%rax)
@@ -59540,16 +60098,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02afc8 <_sk_overlay_sse2_8bit+0xa000607>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b5c8 <_sk_overlay_sse2_8bit+0xa000613>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202afd0 <_sk_overlay_sse2_8bit+0x1200060f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b5d0 <_sk_overlay_sse2_8bit+0x1200061b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02afd8 <_sk_overlay_sse2_8bit+0x1a000617>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b5d8 <_sk_overlay_sse2_8bit+0x1a000623>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302afe0 <_sk_overlay_sse2_8bit+0x300061f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b5e0 <_sk_overlay_sse2_8bit+0x300062b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59592,16 +60150,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b028 <_sk_overlay_sse2_8bit+0xa000667>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b628 <_sk_overlay_sse2_8bit+0xa000673>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b030 <_sk_overlay_sse2_8bit+0x1200066f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b630 <_sk_overlay_sse2_8bit+0x1200067b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b038 <_sk_overlay_sse2_8bit+0x1a000677>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b638 <_sk_overlay_sse2_8bit+0x1a000683>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b040 <_sk_overlay_sse2_8bit+0x300067f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b640 <_sk_overlay_sse2_8bit+0x300068b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59644,16 +60202,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b088 <_sk_overlay_sse2_8bit+0xa0006c7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b688 <_sk_overlay_sse2_8bit+0xa0006d3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b090 <_sk_overlay_sse2_8bit+0x120006cf>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b690 <_sk_overlay_sse2_8bit+0x120006db>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b098 <_sk_overlay_sse2_8bit+0x1a0006d7>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b698 <_sk_overlay_sse2_8bit+0x1a0006e3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b0a0 <_sk_overlay_sse2_8bit+0x30006df>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b6a0 <_sk_overlay_sse2_8bit+0x30006eb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59696,16 +60254,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b0e8 <_sk_overlay_sse2_8bit+0xa000727>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b6e8 <_sk_overlay_sse2_8bit+0xa000733>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b0f0 <_sk_overlay_sse2_8bit+0x1200072f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b6f0 <_sk_overlay_sse2_8bit+0x1200073b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b0f8 <_sk_overlay_sse2_8bit+0x1a000737>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b6f8 <_sk_overlay_sse2_8bit+0x1a000743>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b100 <_sk_overlay_sse2_8bit+0x300073f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b700 <_sk_overlay_sse2_8bit+0x300074b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59748,16 +60306,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b148 <_sk_overlay_sse2_8bit+0xa000787>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b748 <_sk_overlay_sse2_8bit+0xa000793>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b150 <_sk_overlay_sse2_8bit+0x1200078f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b750 <_sk_overlay_sse2_8bit+0x1200079b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b158 <_sk_overlay_sse2_8bit+0x1a000797>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b758 <_sk_overlay_sse2_8bit+0x1a0007a3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b160 <_sk_overlay_sse2_8bit+0x300079f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b760 <_sk_overlay_sse2_8bit+0x30007ab>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59800,16 +60358,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b1a8 <_sk_overlay_sse2_8bit+0xa0007e7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b7a8 <_sk_overlay_sse2_8bit+0xa0007f3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b1b0 <_sk_overlay_sse2_8bit+0x120007ef>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b7b0 <_sk_overlay_sse2_8bit+0x120007fb>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b1b8 <_sk_overlay_sse2_8bit+0x1a0007f7>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b7b8 <_sk_overlay_sse2_8bit+0x1a000803>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b1c0 <_sk_overlay_sse2_8bit+0x30007ff>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b7c0 <_sk_overlay_sse2_8bit+0x300080b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59852,16 +60410,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b208 <_sk_overlay_sse2_8bit+0xa000847>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b808 <_sk_overlay_sse2_8bit+0xa000853>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b210 <_sk_overlay_sse2_8bit+0x1200084f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b810 <_sk_overlay_sse2_8bit+0x1200085b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b218 <_sk_overlay_sse2_8bit+0x1a000857>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b818 <_sk_overlay_sse2_8bit+0x1a000863>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b220 <_sk_overlay_sse2_8bit+0x300085f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b820 <_sk_overlay_sse2_8bit+0x300086b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59904,16 +60462,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b268 <_sk_overlay_sse2_8bit+0xa0008a7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b868 <_sk_overlay_sse2_8bit+0xa0008b3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b270 <_sk_overlay_sse2_8bit+0x120008af>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b870 <_sk_overlay_sse2_8bit+0x120008bb>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b278 <_sk_overlay_sse2_8bit+0x1a0008b7>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b878 <_sk_overlay_sse2_8bit+0x1a0008c3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b280 <_sk_overlay_sse2_8bit+0x30008bf>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b880 <_sk_overlay_sse2_8bit+0x30008cb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -60750,11 +61308,11 @@ BALIGN16
.byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax)
.byte 191,0,0,224,64 // mov $0x40e00000,%edi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b888 <.literal16+0xf8>
+ .byte 224,64 // loopne 2be88 <.literal16+0xf8>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b88c <.literal16+0xfc>
+ .byte 224,64 // loopne 2be8c <.literal16+0xfc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b890 <.literal16+0x100>
+ .byte 224,64 // loopne 2be90 <.literal16+0x100>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -60774,13 +61332,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8b1 <.literal16+0x121>
+ .byte 71,225,61 // rex.RXB loope 2beb1 <.literal16+0x121>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8b5 <.literal16+0x125>
+ .byte 71,225,61 // rex.RXB loope 2beb5 <.literal16+0x125>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8b9 <.literal16+0x129>
+ .byte 71,225,61 // rex.RXB loope 2beb9 <.literal16+0x129>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8bd <.literal16+0x12d>
+ .byte 71,225,61 // rex.RXB loope 2bebd <.literal16+0x12d>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -60791,10 +61349,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b898 <_sk_overlay_sse2_8bit+0xa000ed7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02be98 <_sk_overlay_sse2_8bit+0xa000ee3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302b8a0 <_sk_overlay_sse2_8bit+0x3000edf>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302bea0 <_sk_overlay_sse2_8bit+0x3000eeb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -60809,11 +61367,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b8fb <.literal16+0x16b>
+ .byte 127,67 // jg 2befb <.literal16+0x16b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b8ff <.literal16+0x16f>
+ .byte 127,67 // jg 2beff <.literal16+0x16f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b903 <.literal16+0x173>
+ .byte 127,67 // jg 2bf03 <.literal16+0x173>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
.byte 145 // xchg %eax,%ecx
@@ -60964,13 +61522,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2ba09 <.literal16+0x279>
+ .byte 224,7 // loopne 2c009 <.literal16+0x279>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2ba0d <.literal16+0x27d>
+ .byte 224,7 // loopne 2c00d <.literal16+0x27d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2ba11 <.literal16+0x281>
+ .byte 224,7 // loopne 2c011 <.literal16+0x281>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2ba15 <.literal16+0x285>
+ .byte 224,7 // loopne 2c015 <.literal16+0x285>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -61030,17 +61588,17 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 2ba94 <.literal16+0x304>
+ .byte 127,0 // jg 2c094 <.literal16+0x304>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2ba98 <.literal16+0x308>
+ .byte 127,0 // jg 2c098 <.literal16+0x308>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2ba9c <.literal16+0x30c>
+ .byte 127,0 // jg 2c09c <.literal16+0x30c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2baa0 <.literal16+0x310>
- .byte 119,115 // ja 2bb15 <.literal16+0x385>
+ .byte 127,0 // jg 2c0a0 <.literal16+0x310>
+ .byte 119,115 // ja 2c115 <.literal16+0x385>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -61051,7 +61609,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 2ba79 <.literal16+0x2e9>
+ .byte 117,191 // jne 2c079 <.literal16+0x2e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -61063,7 +61621,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a5faba <_sk_overlay_sse2_8bit+0xffffffffe9a350f9>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a600ba <_sk_overlay_sse2_8bit+0xffffffffe9a35105>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -61153,16 +61711,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc03 <.literal16+0x473>
+ .byte 118,63 // jbe 2c203 <.literal16+0x473>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc07 <.literal16+0x477>
+ .byte 118,63 // jbe 2c207 <.literal16+0x477>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc0b <.literal16+0x47b>
+ .byte 118,63 // jbe 2c20b <.literal16+0x47b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc0f <.literal16+0x47f>
+ .byte 118,63 // jbe 2c20f <.literal16+0x47f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -61183,13 +61741,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2bc46 <.literal16+0x4b6>
+ .byte 124,66 // jl 2c246 <.literal16+0x4b6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2bc4a <.literal16+0x4ba>
+ .byte 124,66 // jl 2c24a <.literal16+0x4ba>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2bc4e <.literal16+0x4be>
+ .byte 124,66 // jl 2c24e <.literal16+0x4be>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2bc52 <.literal16+0x4c2>
+ .byte 124,66 // jl 2c252 <.literal16+0x4c2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -61235,13 +61793,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bcd5 <.literal16+0x545>
+ .byte 112,65 // jo 2c2d5 <.literal16+0x545>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bcd9 <.literal16+0x549>
+ .byte 112,65 // jo 2c2d9 <.literal16+0x549>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bcdd <.literal16+0x54d>
+ .byte 112,65 // jo 2c2dd <.literal16+0x54d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bce1 <.literal16+0x551>
+ .byte 112,65 // jo 2c2e1 <.literal16+0x551>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -61280,13 +61838,13 @@ BALIGN16
.byte 64,254 // rex (bad)
.byte 255,0 // incl (%rax)
.byte 255 // (bad)
- .byte 127,71 // jg 2bd4b <.literal16+0x5bb>
+ .byte 127,71 // jg 2c34b <.literal16+0x5bb>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2bd4f <.literal16+0x5bf>
+ .byte 127,71 // jg 2c34f <.literal16+0x5bf>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2bd53 <.literal16+0x5c3>
+ .byte 127,71 // jg 2c353 <.literal16+0x5c3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2bd57 <.literal16+0x5c7>
+ .byte 127,71 // jg 2c357 <.literal16+0x5c7>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,208 // ds (bad)
@@ -61316,10 +61874,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2ce5a <_sk_overlay_sse2_8bit+0x2dc02499>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2d45a <_sk_overlay_sse2_8bit+0x2dc024a5>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 2bd8c <.literal16+0x5fc>
+ .byte 120,57 // js 2c38c <.literal16+0x5fc>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -61384,13 +61942,13 @@ BALIGN16
.byte 192,191,0,0,192,191,0 // sarb $0x0,-0x40400000(%rdi)
.byte 0,192 // add %al,%al
.byte 191,0,0,192,191 // mov $0xbfc00000,%edi
- .byte 114,28 // jb 2be3e <.literal16+0x6ae>
+ .byte 114,28 // jb 2c43e <.literal16+0x6ae>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2be42 <.literal16+0x6b2>
+ .byte 62,114,28 // jb,pt 2c442 <.literal16+0x6b2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2be46 <.literal16+0x6b6>
+ .byte 62,114,28 // jb,pt 2c446 <.literal16+0x6b6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2be4a <.literal16+0x6ba>
+ .byte 62,114,28 // jb,pt 2c44a <.literal16+0x6ba>
.byte 199 // (bad)
.byte 62,85 // ds push %rbp
.byte 85 // push %rbp
@@ -61409,15 +61967,15 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d664c95 <_sk_overlay_sse2_8bit+0x3d63a2d4>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d665295 <_sk_overlay_sse2_8bit+0x3d63a2e0>
.byte 57,142,99,61,114,249 // cmp %ecx,-0x68dc29d(%rsi)
- .byte 127,63 // jg 2bea3 <.literal16+0x713>
- .byte 114,249 // jb 2be5f <.literal16+0x6cf>
- .byte 127,63 // jg 2bea7 <.literal16+0x717>
- .byte 114,249 // jb 2be63 <.literal16+0x6d3>
- .byte 127,63 // jg 2beab <.literal16+0x71b>
- .byte 114,249 // jb 2be67 <.literal16+0x6d7>
- .byte 127,63 // jg 2beaf <.literal16+0x71f>
+ .byte 127,63 // jg 2c4a3 <.literal16+0x713>
+ .byte 114,249 // jb 2c45f <.literal16+0x6cf>
+ .byte 127,63 // jg 2c4a7 <.literal16+0x717>
+ .byte 114,249 // jb 2c463 <.literal16+0x6d3>
+ .byte 127,63 // jg 2c4ab <.literal16+0x71b>
+ .byte 114,249 // jb 2c467 <.literal16+0x6d7>
+ .byte 127,63 // jg 2c4af <.literal16+0x71f>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 3,0 // add (%rax),%eax
@@ -61524,14 +62082,14 @@ BALIGN16
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,0 // incl (%rax)
- .byte 127,0 // jg 2bf42 <.literal16+0x7b2>
- .byte 127,0 // jg 2bf44 <.literal16+0x7b4>
- .byte 127,0 // jg 2bf46 <.literal16+0x7b6>
- .byte 127,0 // jg 2bf48 <.literal16+0x7b8>
- .byte 127,0 // jg 2bf4a <.literal16+0x7ba>
- .byte 127,0 // jg 2bf4c <.literal16+0x7bc>
- .byte 127,0 // jg 2bf4e <.literal16+0x7be>
- .byte 127,0 // jg 2bf50 <.literal16+0x7c0>
+ .byte 127,0 // jg 2c542 <.literal16+0x7b2>
+ .byte 127,0 // jg 2c544 <.literal16+0x7b4>
+ .byte 127,0 // jg 2c546 <.literal16+0x7b6>
+ .byte 127,0 // jg 2c548 <.literal16+0x7b8>
+ .byte 127,0 // jg 2c54a <.literal16+0x7ba>
+ .byte 127,0 // jg 2c54c <.literal16+0x7bc>
+ .byte 127,0 // jg 2c54e <.literal16+0x7be>
+ .byte 127,0 // jg 2c550 <.literal16+0x7c0>
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
.byte 129 // .byte 0x81
.byte 128 // .byte 0x80
@@ -61629,7 +62187,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,144,230,144,0,0 // movaps 0x90e6(%eax),%xmm2
+ .byte 15,40,144,102,146,0,0 // movaps 0x9266(%eax),%xmm2
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -61644,7 +62202,7 @@ _sk_seed_shader_sse2:
.byte 15,41,82,32 // movaps %xmm2,0x20(%edx)
.byte 15,41,82,16 // movaps %xmm2,0x10(%edx)
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,144,246,144,0,0 // movaps 0x90f6(%eax),%xmm2
+ .byte 15,40,144,118,146,0,0 // movaps 0x9276(%eax),%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 86 // push %esi
.byte 82 // push %edx
@@ -61677,16 +62235,16 @@ _sk_dither_sse2:
.byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,177,137,144,0,0 // movdqa 0x9089(%ecx),%xmm6
+ .byte 102,15,111,177,9,146,0,0 // movdqa 0x9209(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,129,169,144,0,0 // movdqa 0x90a9(%ecx),%xmm0
+ .byte 102,15,111,129,41,146,0,0 // movdqa 0x9229(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,219,185,153,144,0,0 // pand 0x9099(%ecx),%xmm7
- .byte 102,15,219,169,153,144,0,0 // pand 0x9099(%ecx),%xmm5
+ .byte 102,15,219,185,25,146,0,0 // pand 0x9219(%ecx),%xmm7
+ .byte 102,15,219,169,25,146,0,0 // pand 0x9219(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
@@ -61701,8 +62259,8 @@ _sk_dither_sse2:
.byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,129,185,144,0,0 // mulps 0x90b9(%ecx),%xmm0
- .byte 15,88,129,201,144,0,0 // addps 0x90c9(%ecx),%xmm0
+ .byte 15,89,129,57,146,0,0 // mulps 0x9239(%ecx),%xmm0
+ .byte 15,88,129,73,146,0,0 // addps 0x9249(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -61770,7 +62328,7 @@ _sk_black_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,152,153,143,0,0 // movaps 0x8f99(%eax),%xmm3
+ .byte 15,40,152,25,145,0,0 // movaps 0x9119(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -61793,7 +62351,7 @@ _sk_white_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,128,121,143,0,0 // movaps 0x8f79(%eax),%xmm0
+ .byte 15,40,128,249,144,0,0 // movaps 0x90f9(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -61883,7 +62441,7 @@ _sk_srcatop_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,170,218,142,0,0 // movaps 0x8eda(%edx),%xmm5
+ .byte 15,40,170,90,144,0,0 // movaps 0x905a(%edx),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
@@ -61922,7 +62480,7 @@ _sk_dstatop_sse2:
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,40,162,139,142,0,0 // movaps 0x8e8b(%edx),%xmm4
+ .byte 15,40,162,11,144,0,0 // movaps 0x900b(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
@@ -62006,7 +62564,7 @@ _sk_srcout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,218,141,0,0 // movaps 0x8dda(%eax),%xmm4
+ .byte 15,40,160,90,143,0,0 // movaps 0x8f5a(%eax),%xmm4
.byte 15,92,98,64 // subps 0x40(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
@@ -62032,7 +62590,7 @@ _sk_dstout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,178,141,0,0 // movaps 0x8db2(%eax),%xmm4
+ .byte 15,40,160,50,143,0,0 // movaps 0x8f32(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -62062,7 +62620,7 @@ _sk_srcover_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,123,141,0,0 // movaps 0x8d7b(%eax),%xmm4
+ .byte 15,40,160,251,142,0,0 // movaps 0x8efb(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -62096,7 +62654,7 @@ _sk_dstover_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
- .byte 15,40,160,59,141,0,0 // movaps 0x8d3b(%eax),%xmm4
+ .byte 15,40,160,187,142,0,0 // movaps 0x8ebb(%eax),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
@@ -62152,7 +62710,7 @@ _sk_multiply_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,40,129,204,140,0,0 // movaps 0x8ccc(%ecx),%xmm0
+ .byte 15,40,129,76,142,0,0 // movaps 0x8e4c(%ecx),%xmm0
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -62207,17 +62765,24 @@ _sk_plus__sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 15,88,65,16 // addps 0x10(%ecx),%xmm0
- .byte 15,88,73,32 // addps 0x20(%ecx),%xmm1
- .byte 15,88,81,48 // addps 0x30(%ecx),%xmm2
- .byte 15,88,89,64 // addps 0x40(%ecx),%xmm3
- .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 232,0,0,0,0 // call 64a <_sk_plus__sse2+0xb>
+ .byte 88 // pop %eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 15,88,66,16 // addps 0x10(%edx),%xmm0
+ .byte 15,40,160,182,141,0,0 // movaps 0x8db6(%eax),%xmm4
+ .byte 15,93,196 // minps %xmm4,%xmm0
+ .byte 15,88,74,32 // addps 0x20(%edx),%xmm1
+ .byte 15,93,204 // minps %xmm4,%xmm1
+ .byte 15,88,82,48 // addps 0x30(%edx),%xmm2
+ .byte 15,93,212 // minps %xmm4,%xmm2
+ .byte 15,88,90,64 // addps 0x40(%edx),%xmm3
+ .byte 15,93,220 // minps %xmm4,%xmm3
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
.byte 82 // push %edx
- .byte 81 // push %ecx
- .byte 255,16 // call *(%eax)
+ .byte 255,17 // call *(%ecx)
.byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -62272,12 +62837,12 @@ _sk_xor__sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 232,0,0,0,0 // call 6df <_sk_xor__sse2+0xe>
+ .byte 232,0,0,0,0 // call 6f8 <_sk_xor__sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
- .byte 15,40,154,161,139,0,0 // movaps 0x8ba1(%edx),%xmm3
+ .byte 15,40,154,24,141,0,0 // movaps 0x8d18(%edx),%xmm3
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,89,198 // mulps %xmm6,%xmm0
@@ -62313,7 +62878,7 @@ _sk_darken_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 747 <_sk_darken_sse2+0xe>
+ .byte 232,0,0,0,0 // call 760 <_sk_darken_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62339,7 +62904,7 @@ _sk_darken_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,95,209 // maxps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,73,139,0,0 // movaps 0x8b49(%edx),%xmm1
+ .byte 15,40,138,192,140,0,0 // movaps 0x8cc0(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -62362,7 +62927,7 @@ _sk_lighten_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 7c7 <_sk_lighten_sse2+0xe>
+ .byte 232,0,0,0,0 // call 7e0 <_sk_lighten_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62388,7 +62953,7 @@ _sk_lighten_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,93,209 // minps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,217,138,0,0 // movaps 0x8ad9(%edx),%xmm1
+ .byte 15,40,138,80,140,0,0 // movaps 0x8c50(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -62412,7 +62977,7 @@ _sk_difference_sse2:
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,225 // movaps %xmm1,%xmm4
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 84a <_sk_difference_sse2+0x11>
+ .byte 232,0,0,0,0 // call 863 <_sk_difference_sse2+0x11>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62441,7 +63006,7 @@ _sk_difference_sse2:
.byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,146,102,138,0,0 // movaps 0x8a66(%edx),%xmm2
+ .byte 15,40,146,221,139,0,0 // movaps 0x8bdd(%edx),%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -62463,7 +63028,7 @@ _sk_exclusion_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 8d0 <_sk_exclusion_sse2+0xe>
+ .byte 232,0,0,0,0 // call 8e9 <_sk_exclusion_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62485,7 +63050,7 @@ _sk_exclusion_sse2:
.byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,40,138,240,137,0,0 // movaps 0x89f0(%edx),%xmm1
+ .byte 15,40,138,103,139,0,0 // movaps 0x8b67(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -62511,7 +63076,7 @@ _sk_colorburn_sse2:
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 94f <_sk_colorburn_sse2+0x19>
+ .byte 232,0,0,0,0 // call 968 <_sk_colorburn_sse2+0x19>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
@@ -62526,7 +63091,7 @@ _sk_colorburn_sse2:
.byte 15,93,198 // minps %xmm6,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
- .byte 15,40,177,129,137,0,0 // movaps 0x8981(%ecx),%xmm6
+ .byte 15,40,177,248,138,0,0 // movaps 0x8af8(%ecx),%xmm6
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
@@ -62639,11 +63204,11 @@ _sk_colordodge_sse2:
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
- .byte 232,0,0,0,0 // call ad8 <_sk_colordodge_sse2+0x16>
+ .byte 232,0,0,0,0 // call af1 <_sk_colordodge_sse2+0x16>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
- .byte 15,40,145,8,136,0,0 // movaps 0x8808(%ecx),%xmm2
+ .byte 15,40,145,127,137,0,0 // movaps 0x897f(%ecx),%xmm2
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,250 // movaps %xmm2,%xmm7
@@ -62756,11 +63321,11 @@ _sk_hardlight_sse2:
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
- .byte 232,0,0,0,0 // call c39 <_sk_hardlight_sse2+0x16>
+ .byte 232,0,0,0,0 // call c52 <_sk_hardlight_sse2+0x16>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
- .byte 15,40,145,183,134,0,0 // movaps 0x86b7(%ecx),%xmm2
+ .byte 15,40,145,46,136,0,0 // movaps 0x882e(%ecx),%xmm2
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
@@ -62866,11 +63431,11 @@ _sk_overlay_sse2:
.byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
.byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 232,0,0,0,0 // call d84 <_sk_overlay_sse2+0x1a>
+ .byte 232,0,0,0,0 // call d9d <_sk_overlay_sse2+0x1a>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
- .byte 15,40,161,124,133,0,0 // movaps 0x857c(%ecx),%xmm4
+ .byte 15,40,161,243,134,0,0 // movaps 0x86f3(%ecx),%xmm4
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -62995,20 +63560,20 @@ _sk_softlight_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,241 // addps %xmm1,%xmm6
- .byte 232,0,0,0,0 // call f14 <_sk_softlight_sse2+0x52>
+ .byte 232,0,0,0,0 // call f2d <_sk_softlight_sse2+0x52>
.byte 89 // pop %ecx
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,137,12,132,0,0 // movaps 0x840c(%ecx),%xmm1
+ .byte 15,40,137,131,133,0,0 // movaps 0x8583(%ecx),%xmm1
.byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
.byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,185,252,131,0,0 // movaps 0x83fc(%ecx),%xmm7
+ .byte 15,40,185,115,133,0,0 // movaps 0x8573(%ecx),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,82,242 // rsqrtps %xmm2,%xmm6
.byte 15,83,206 // rcpps %xmm6,%xmm1
.byte 15,92,202 // subps %xmm2,%xmm1
- .byte 15,40,161,28,132,0,0 // movaps 0x841c(%ecx),%xmm4
+ .byte 15,40,161,147,133,0,0 // movaps 0x8593(%ecx),%xmm4
.byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
@@ -63204,7 +63769,7 @@ _sk_hue_sse2:
.byte 15,93,200 // minps %xmm0,%xmm1
.byte 15,92,225 // subps %xmm1,%xmm4
.byte 15,41,101,168 // movaps %xmm4,-0x58(%ebp)
- .byte 232,0,0,0,0 // call 11d5 <_sk_hue_sse2+0x4f>
+ .byte 232,0,0,0,0 // call 11ee <_sk_hue_sse2+0x4f>
.byte 89 // pop %ecx
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -63214,7 +63779,7 @@ _sk_hue_sse2:
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,169,155,129,0,0 // movaps 0x819b(%ecx),%xmm5
+ .byte 15,40,169,18,131,0,0 // movaps 0x8312(%ecx),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
@@ -63247,17 +63812,17 @@ _sk_hue_sse2:
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,153,107,129,0,0 // movaps 0x816b(%ecx),%xmm3
+ .byte 15,40,153,226,130,0,0 // movaps 0x82e2(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,153,123,129,0,0 // movaps 0x817b(%ecx),%xmm3
+ .byte 15,40,153,242,130,0,0 // movaps 0x82f2(%ecx),%xmm3
.byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,137,155,129,0,0 // movaps 0x819b(%ecx),%xmm1
+ .byte 15,40,137,18,131,0,0 // movaps 0x8312(%ecx),%xmm1
.byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
@@ -63267,7 +63832,7 @@ _sk_hue_sse2:
.byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,40,169,139,129,0,0 // movaps 0x818b(%ecx),%xmm5
+ .byte 15,40,169,2,131,0,0 // movaps 0x8302(%ecx),%xmm5
.byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
.byte 15,94,212 // divps %xmm4,%xmm2
@@ -63458,19 +64023,19 @@ _sk_saturation_sse2:
.byte 15,89,221 // mulps %xmm5,%xmm3
.byte 15,40,211 // movaps %xmm3,%xmm2
.byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 232,0,0,0,0 // call 1529 <_sk_saturation_sse2+0xb0>
+ .byte 232,0,0,0,0 // call 1542 <_sk_saturation_sse2+0xb0>
.byte 89 // pop %ecx
- .byte 15,40,153,87,126,0,0 // movaps 0x7e57(%ecx),%xmm3
+ .byte 15,40,153,206,127,0,0 // movaps 0x7fce(%ecx),%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,153,103,126,0,0 // movaps 0x7e67(%ecx),%xmm3
+ .byte 15,40,153,222,127,0,0 // movaps 0x7fde(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,129,135,126,0,0 // movaps 0x7e87(%ecx),%xmm0
+ .byte 15,40,129,254,127,0,0 // movaps 0x7ffe(%ecx),%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -63482,7 +64047,7 @@ _sk_saturation_sse2:
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,129,119,126,0,0 // movaps 0x7e77(%ecx),%xmm0
+ .byte 15,40,129,238,127,0,0 // movaps 0x7fee(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
@@ -63636,21 +64201,21 @@ _sk_color_sse2:
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
- .byte 232,0,0,0,0 // call 1784 <_sk_color_sse2+0x2a>
+ .byte 232,0,0,0,0 // call 179d <_sk_color_sse2+0x2a>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
.byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
- .byte 15,40,177,60,124,0,0 // movaps 0x7c3c(%ecx),%xmm6
+ .byte 15,40,177,179,125,0,0 // movaps 0x7db3(%ecx),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,153,76,124,0,0 // movaps 0x7c4c(%ecx),%xmm3
+ .byte 15,40,153,195,125,0,0 // movaps 0x7dc3(%ecx),%xmm3
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 15,40,129,108,124,0,0 // movaps 0x7c6c(%ecx),%xmm0
+ .byte 15,40,129,227,125,0,0 // movaps 0x7de3(%ecx),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
.byte 15,89,208 // mulps %xmm0,%xmm2
@@ -63660,7 +64225,7 @@ _sk_color_sse2:
.byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
.byte 15,89,194 // mulps %xmm2,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
- .byte 15,40,137,92,124,0,0 // movaps 0x7c5c(%ecx),%xmm1
+ .byte 15,40,137,211,125,0,0 // movaps 0x7dd3(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
@@ -63816,21 +64381,21 @@ _sk_luminosity_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 129,236,184,0,0,0 // sub $0xb8,%esp
.byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 232,0,0,0,0 // call 19e7 <_sk_luminosity_sse2+0x11>
+ .byte 232,0,0,0,0 // call 1a00 <_sk_luminosity_sse2+0x11>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 15,40,161,25,122,0,0 // movaps 0x7a19(%ecx),%xmm4
+ .byte 15,40,161,144,123,0,0 // movaps 0x7b90(%ecx),%xmm4
.byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,161,41,122,0,0 // movaps 0x7a29(%ecx),%xmm4
+ .byte 15,40,161,160,123,0,0 // movaps 0x7ba0(%ecx),%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,161,73,122,0,0 // movaps 0x7a49(%ecx),%xmm4
+ .byte 15,40,161,192,123,0,0 // movaps 0x7bc0(%ecx),%xmm4
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -63840,7 +64405,7 @@ _sk_luminosity_sse2:
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
.byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,137,57,122,0,0 // movaps 0x7a39(%ecx),%xmm1
+ .byte 15,40,137,176,123,0,0 // movaps 0x7bb0(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
@@ -64002,7 +64567,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 131,236,44 // sub $0x2c,%esp
.byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 1c52 <_sk_srcover_rgba_8888_sse2+0x17>
+ .byte 232,0,0,0,0 // call 1c6b <_sk_srcover_rgba_8888_sse2+0x17>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -64014,9 +64579,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,133,224,0,0,0 // jne 1d54 <_sk_srcover_rgba_8888_sse2+0x119>
+ .byte 15,133,224,0,0,0 // jne 1d6d <_sk_srcover_rgba_8888_sse2+0x119>
.byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
- .byte 102,15,111,167,238,119,0,0 // movdqa 0x77ee(%edi),%xmm4
+ .byte 102,15,111,167,101,121,0,0 // movdqa 0x7965(%edi),%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -64027,9 +64592,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,175,254,119,0,0 // movaps 0x77fe(%edi),%xmm5
+ .byte 15,40,175,117,121,0,0 // movaps 0x7975(%edi),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,40,143,14,120,0,0 // movaps 0x780e(%edi),%xmm1
+ .byte 15,40,143,133,121,0,0 // movaps 0x7985(%edi),%xmm1
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
@@ -64062,7 +64627,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
.byte 133,219 // test %ebx,%ebx
- .byte 117,95 // jne 1d8f <_sk_srcover_rgba_8888_sse2+0x154>
+ .byte 117,95 // jne 1da8 <_sk_srcover_rgba_8888_sse2+0x154>
.byte 243,15,127,4,178 // movdqu %xmm0,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -64083,33 +64648,33 @@ _sk_srcover_rgba_8888_sse2:
.byte 136,69,243 // mov %al,-0xd(%ebp)
.byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
.byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,80 // je 1db3 <_sk_srcover_rgba_8888_sse2+0x178>
+ .byte 116,80 // je 1dcc <_sk_srcover_rgba_8888_sse2+0x178>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 116,21 // je 1d85 <_sk_srcover_rgba_8888_sse2+0x14a>
+ .byte 116,21 // je 1d9e <_sk_srcover_rgba_8888_sse2+0x14a>
.byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 15,133,255,254,255,255 // jne 1c79 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 15,133,255,254,255,255 // jne 1c92 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 102,15,110,84,178,8 // movd 0x8(%edx,%esi,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,15,18,20,178 // movlpd (%edx,%esi,4),%xmm2
- .byte 233,234,254,255,255 // jmp 1c79 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 233,234,254,255,255 // jmp 1c92 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,41 // je 1dc0 <_sk_srcover_rgba_8888_sse2+0x185>
+ .byte 116,41 // je 1dd9 <_sk_srcover_rgba_8888_sse2+0x185>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 1dac <_sk_srcover_rgba_8888_sse2+0x171>
+ .byte 116,16 // je 1dc5 <_sk_srcover_rgba_8888_sse2+0x171>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,148 // jne 1d35 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 117,148 // jne 1d4e <_sk_srcover_rgba_8888_sse2+0xfa>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,15,126,76,178,8 // movd %xmm1,0x8(%edx,%esi,4)
.byte 102,15,214,4,178 // movq %xmm0,(%edx,%esi,4)
- .byte 235,130 // jmp 1d35 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 235,130 // jmp 1d4e <_sk_srcover_rgba_8888_sse2+0xfa>
.byte 102,15,110,20,178 // movd (%edx,%esi,4),%xmm2
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 233,185,254,255,255 // jmp 1c79 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 233,185,254,255,255 // jmp 1c92 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 102,15,126,4,178 // movd %xmm0,(%edx,%esi,4)
- .byte 233,107,255,255,255 // jmp 1d35 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 233,107,255,255,255 // jmp 1d4e <_sk_srcover_rgba_8888_sse2+0xfa>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -64140,10 +64705,10 @@ _sk_clamp_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1dfe <_sk_clamp_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e17 <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,114,118,0,0 // movaps 0x7672(%eax),%xmm4
+ .byte 15,40,160,233,119,0,0 // movaps 0x77e9(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,93,204 // minps %xmm4,%xmm1
.byte 15,93,212 // minps %xmm4,%xmm2
@@ -64164,10 +64729,10 @@ _sk_clamp_a_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1e31 <_sk_clamp_a_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e4a <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,93,152,79,118,0,0 // minps 0x764f(%eax),%xmm3
+ .byte 15,93,152,198,119,0,0 // minps 0x77c6(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -64187,12 +64752,12 @@ _sk_clamp_a_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1e61 <_sk_clamp_a_dst_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e7a <_sk_clamp_a_dst_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
- .byte 15,93,160,47,118,0,0 // minps 0x762f(%eax),%xmm4
+ .byte 15,93,160,166,119,0,0 // minps 0x77a6(%eax),%xmm4
.byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
@@ -64263,10 +64828,10 @@ _sk_invert_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1f0c <_sk_invert_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1f25 <_sk_invert_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,148,117,0,0 // movaps 0x7594(%eax),%xmm4
+ .byte 15,40,160,11,119,0,0 // movaps 0x770b(%eax),%xmm4
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
@@ -64385,11 +64950,11 @@ _sk_unpremul_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 200a <_sk_unpremul_sse2+0xb>
+ .byte 232,0,0,0,0 // call 2023 <_sk_unpremul_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,168,166,116,0,0 // movaps 0x74a6(%eax),%xmm5
+ .byte 15,40,168,29,118,0,0 // movaps 0x761d(%eax),%xmm5
.byte 15,94,235 // divps %xmm3,%xmm5
.byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
.byte 15,84,229 // andps %xmm5,%xmm4
@@ -64416,23 +64981,23 @@ _sk_from_srgb_sse2:
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 2054 <_sk_from_srgb_sse2+0x18>
+ .byte 232,0,0,0,0 // call 206d <_sk_from_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,201 // mulps %xmm1,%xmm1
- .byte 15,40,160,124,116,0,0 // movaps 0x747c(%eax),%xmm4
+ .byte 15,40,160,243,117,0,0 // movaps 0x75f3(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,176,140,116,0,0 // movaps 0x748c(%eax),%xmm6
+ .byte 15,40,176,3,118,0,0 // movaps 0x7603(%eax),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,176,108,116,0,0 // movaps 0x746c(%eax),%xmm6
+ .byte 15,40,176,227,117,0,0 // movaps 0x75e3(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,184,156,116,0,0 // movaps 0x749c(%eax),%xmm7
+ .byte 15,40,184,19,118,0,0 // movaps 0x7613(%eax),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,172,116,0,0 // movaps 0x74ac(%eax),%xmm7
+ .byte 15,40,184,35,118,0,0 // movaps 0x7623(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -64486,24 +65051,24 @@ _sk_from_srgb_dst_sse2:
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 212f <_sk_from_srgb_dst_sse2+0x1b>
+ .byte 232,0,0,0,0 // call 2148 <_sk_from_srgb_dst_sse2+0x1b>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,40,161,241,115,0,0 // movaps 0x73f1(%ecx),%xmm4
+ .byte 15,40,161,104,117,0,0 // movaps 0x7568(%ecx),%xmm4
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,177,1,116,0,0 // movaps 0x7401(%ecx),%xmm6
+ .byte 15,40,177,120,117,0,0 // movaps 0x7578(%ecx),%xmm6
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,169,225,115,0,0 // movaps 0x73e1(%ecx),%xmm5
+ .byte 15,40,169,88,117,0,0 // movaps 0x7558(%ecx),%xmm5
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,185,17,116,0,0 // movaps 0x7411(%ecx),%xmm7
+ .byte 15,40,185,136,117,0,0 // movaps 0x7588(%ecx),%xmm7
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,153,33,116,0,0 // movaps 0x7421(%ecx),%xmm3
+ .byte 15,40,153,152,117,0,0 // movaps 0x7598(%ecx),%xmm3
.byte 15,194,203,1 // cmpltps %xmm3,%xmm1
.byte 15,84,209 // andps %xmm1,%xmm2
.byte 15,85,200 // andnps %xmm0,%xmm1
@@ -64562,28 +65127,28 @@ _sk_to_srgb_sse2:
.byte 15,40,250 // movaps %xmm2,%xmm7
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 221a <_sk_to_srgb_sse2+0x18>
+ .byte 232,0,0,0,0 // call 2233 <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,86,115,0,0 // movaps 0x7356(%eax),%xmm4
+ .byte 15,40,160,205,116,0,0 // movaps 0x74cd(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,102,115,0,0 // movaps 0x7366(%eax),%xmm0
+ .byte 15,40,128,221,116,0,0 // movaps 0x74dd(%eax),%xmm0
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,118,115,0,0 // movaps 0x7376(%eax),%xmm0
+ .byte 15,40,128,237,116,0,0 // movaps 0x74ed(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,134,115,0,0 // movaps 0x7386(%eax),%xmm0
+ .byte 15,40,128,253,116,0,0 // movaps 0x74fd(%eax),%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,70,115,0,0 // movaps 0x7346(%eax),%xmm5
+ .byte 15,40,168,189,116,0,0 // movaps 0x74bd(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,150,115,0,0 // movaps 0x7396(%eax),%xmm3
+ .byte 15,40,152,13,117,0,0 // movaps 0x750d(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -64640,60 +65205,62 @@ _sk_rgb_to_hsl_sse2:
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,249 // movaps %xmm1,%xmm7
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 2311 <_sk_rgb_to_hsl_sse2+0x15>
+ .byte 232,0,0,0,0 // call 232a <_sk_rgb_to_hsl_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,95,207 // maxps %xmm7,%xmm1
- .byte 15,95,202 // maxps %xmm2,%xmm1
+ .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 15,95,194 // maxps %xmm2,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
- .byte 15,93,223 // minps %xmm7,%xmm3
- .byte 15,93,218 // minps %xmm2,%xmm3
- .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,95,216 // maxps %xmm0,%xmm3
+ .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 15,93,194 // minps %xmm2,%xmm0
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,93,200 // minps %xmm0,%xmm1
+ .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,152,175,114,0,0 // movaps 0x72af(%eax),%xmm3
- .byte 15,94,216 // divps %xmm0,%xmm3
+ .byte 15,40,136,38,116,0,0 // movaps 0x7426(%eax),%xmm1
+ .byte 15,94,200 // divps %xmm0,%xmm1
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,191,114,0,0 // andps 0x72bf(%eax),%xmm5
+ .byte 15,84,168,54,116,0,0 // andps 0x7436(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
- .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,194,247,0 // cmpeqps %xmm7,%xmm6
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,89,211 // mulps %xmm3,%xmm2
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,40,152,207,114,0,0 // movaps 0x72cf(%eax),%xmm3
- .byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,88,160,223,114,0,0 // addps 0x72df(%eax),%xmm4
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,40,136,70,116,0,0 // movaps 0x7446(%eax),%xmm1
+ .byte 15,88,209 // addps %xmm1,%xmm2
+ .byte 15,88,160,86,116,0,0 // addps 0x7456(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,198 // andnps %xmm6,%xmm0
.byte 15,86,197 // orps %xmm5,%xmm0
- .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2
.byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
- .byte 15,92,217 // subps %xmm1,%xmm3
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,40,168,255,114,0,0 // movaps 0x72ff(%eax),%xmm5
- .byte 15,92,218 // subps %xmm2,%xmm3
- .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 15,40,168,118,116,0,0 // movaps 0x7476(%eax),%xmm5
+ .byte 15,92,202 // subps %xmm2,%xmm1
+ .byte 15,40,211 // movaps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,221 // andps %xmm5,%xmm3
- .byte 15,85,233 // andnps %xmm1,%xmm5
- .byte 15,86,235 // orps %xmm3,%xmm5
+ .byte 15,84,205 // andps %xmm5,%xmm1
+ .byte 15,85,235 // andnps %xmm3,%xmm5
+ .byte 15,86,233 // orps %xmm1,%xmm5
.byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,89,128,239,114,0,0 // mulps 0x72ef(%eax),%xmm0
+ .byte 15,89,128,102,116,0,0 // mulps 0x7466(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -64716,9 +65283,9 @@ _sk_hsl_to_rgb_sse2:
.byte 129,236,200,0,0,0 // sub $0xc8,%esp
.byte 15,41,157,56,255,255,255 // movaps %xmm3,-0xc8(%ebp)
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 2406 <_sk_hsl_to_rgb_sse2+0x19>
+ .byte 232,0,0,0,0 // call 2425 <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,160,26,114,0,0 // movaps 0x721a(%eax),%xmm4
+ .byte 15,40,160,139,115,0,0 // movaps 0x738b(%eax),%xmm4
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,194,218,2 // cmpleps %xmm2,%xmm3
@@ -64731,13 +65298,13 @@ _sk_hsl_to_rgb_sse2:
.byte 15,84,243 // andps %xmm3,%xmm6
.byte 15,85,217 // andnps %xmm1,%xmm3
.byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,40,168,42,114,0,0 // movaps 0x722a(%eax),%xmm5
+ .byte 15,40,168,155,115,0,0 // movaps 0x739b(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,193,1 // cmpltps %xmm1,%xmm0
- .byte 15,40,176,58,114,0,0 // movaps 0x723a(%eax),%xmm6
+ .byte 15,40,176,171,115,0,0 // movaps 0x73ab(%eax),%xmm6
.byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,200 // subps %xmm0,%xmm1
@@ -64747,19 +65314,19 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,184,74,114,0,0 // movaps 0x724a(%eax),%xmm7
+ .byte 15,40,184,187,115,0,0 // movaps 0x73bb(%eax),%xmm7
.byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
.byte 15,194,253,2 // cmpleps %xmm5,%xmm7
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,204 // movaps %xmm4,%xmm1
.byte 15,194,205,2 // cmpleps %xmm5,%xmm1
- .byte 15,40,160,122,114,0,0 // movaps 0x727a(%eax),%xmm4
+ .byte 15,40,160,235,115,0,0 // movaps 0x73eb(%eax),%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
- .byte 15,40,176,90,114,0,0 // movaps 0x725a(%eax),%xmm6
+ .byte 15,40,176,203,115,0,0 // movaps 0x73cb(%eax),%xmm6
.byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,128,106,114,0,0 // movaps 0x726a(%eax),%xmm0
+ .byte 15,40,128,219,115,0,0 // movaps 0x73db(%eax),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
@@ -64785,18 +65352,18 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,58,114,0,0 // andps 0x723a(%eax),%xmm1
+ .byte 15,84,136,171,115,0,0 // andps 0x73ab(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,74,114,0,0 // movaps 0x724a(%eax),%xmm0
+ .byte 15,40,128,187,115,0,0 // movaps 0x73bb(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,152,26,114,0,0 // movaps 0x721a(%eax),%xmm3
+ .byte 15,40,152,139,115,0,0 // movaps 0x738b(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,40,160,122,114,0,0 // movaps 0x727a(%eax),%xmm4
+ .byte 15,40,160,235,115,0,0 // movaps 0x73eb(%eax),%xmm4
.byte 15,194,225,2 // cmpleps %xmm1,%xmm4
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,168,106,114,0,0 // movaps 0x726a(%eax),%xmm5
+ .byte 15,40,168,219,115,0,0 // movaps 0x73db(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
@@ -64816,7 +65383,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,85,252 // andnps %xmm4,%xmm7
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,88,152,138,114,0,0 // addps 0x728a(%eax),%xmm3
+ .byte 15,88,152,251,115,0,0 // addps 0x73fb(%eax),%xmm3
.byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
@@ -64903,7 +65470,7 @@ _sk_scale_u8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2680 <_sk_scale_u8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 269f <_sk_scale_u8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -64914,13 +65481,13 @@ _sk_scale_u8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,65 // jne 26dc <_sk_scale_u8_sse2+0x6a>
+ .byte 117,65 // jne 26fb <_sk_scale_u8_sse2+0x6a>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,32,112,0,0 // pand 0x7020(%edx),%xmm4
+ .byte 102,15,219,162,145,113,0,0 // pand 0x7191(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,48,112,0,0 // mulps 0x7030(%edx),%xmm4
+ .byte 15,89,162,161,113,0,0 // mulps 0x71a1(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
@@ -64939,12 +65506,12 @@ _sk_scale_u8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 2716 <_sk_scale_u8_sse2+0xa4>
+ .byte 116,50 // je 2735 <_sk_scale_u8_sse2+0xa4>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 2700 <_sk_scale_u8_sse2+0x8e>
+ .byte 116,19 // je 271f <_sk_scale_u8_sse2+0x8e>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,182 // jne 26a8 <_sk_scale_u8_sse2+0x36>
+ .byte 117,182 // jne 26c7 <_sk_scale_u8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -64953,10 +65520,100 @@ _sk_scale_u8_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,146 // jmp 26a8 <_sk_scale_u8_sse2+0x36>
+ .byte 235,146 // jmp 26c7 <_sk_scale_u8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,136 // jmp 26a8 <_sk_scale_u8_sse2+0x36>
+ .byte 235,136 // jmp 26c7 <_sk_scale_u8_sse2+0x36>
+
+HIDDEN _sk_scale_565_sse2
+.globl _sk_scale_565_sse2
+FUNCTION(_sk_scale_565_sse2)
+_sk_scale_565_sse2:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 83 // push %ebx
+ .byte 87 // push %edi
+ .byte 86 // push %esi
+ .byte 131,236,44 // sub $0x2c,%esp
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 232,0,0,0,0 // call 2759 <_sk_scale_565_sse2+0x1a>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 1,246 // add %esi,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 133,219 // test %ebx,%ebx
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 15,133,157,0,0,0 // jne 2817 <_sk_scale_565_sse2+0xd8>
+ .byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
+ .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
+ .byte 102,15,111,162,247,112,0,0 // movdqa 0x70f7(%edx),%xmm4
+ .byte 102,15,219,230 // pand %xmm6,%xmm4
+ .byte 15,91,212 // cvtdq2ps %xmm4,%xmm2
+ .byte 15,89,146,7,113,0,0 // mulps 0x7107(%edx),%xmm2
+ .byte 102,15,111,170,23,113,0,0 // movdqa 0x7117(%edx),%xmm5
+ .byte 102,15,219,238 // pand %xmm6,%xmm5
+ .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
+ .byte 15,89,170,39,113,0,0 // mulps 0x7127(%edx),%xmm5
+ .byte 102,15,219,178,55,113,0,0 // pand 0x7137(%edx),%xmm6
+ .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
+ .byte 15,89,178,71,113,0,0 // mulps 0x7147(%edx),%xmm6
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,93,254 // minps %xmm6,%xmm7
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 15,93,231 // minps %xmm7,%xmm4
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,95,254 // maxps %xmm6,%xmm7
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,95,199 // maxps %xmm7,%xmm0
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,194,121,64,1 // cmpltps 0x40(%ecx),%xmm7
+ .byte 15,84,231 // andps %xmm7,%xmm4
+ .byte 15,85,248 // andnps %xmm0,%xmm7
+ .byte 15,86,252 // orps %xmm4,%xmm7
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,89,109,216 // mulps -0x28(%ebp),%xmm5
+ .byte 15,89,117,200 // mulps -0x38(%ebp),%xmm6
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,40,223 // movaps %xmm7,%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,60 // add $0x3c,%esp
+ .byte 94 // pop %esi
+ .byte 95 // pop %edi
+ .byte 91 // pop %ebx
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 2851 <_sk_scale_565_sse2+0x112>
+ .byte 102,15,239,246 // pxor %xmm6,%xmm6
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,23 // je 283f <_sk_scale_565_sse2+0x100>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 15,133,82,255,255,255 // jne 2783 <_sk_scale_565_sse2+0x44>
+ .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
+ .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
+ .byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4
+ .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
+ .byte 242,15,16,244 // movsd %xmm4,%xmm6
+ .byte 233,50,255,255,255 // jmp 2783 <_sk_scale_565_sse2+0x44>
+ .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
+ .byte 102,15,110,246 // movd %esi,%xmm6
+ .byte 233,37,255,255,255 // jmp 2783 <_sk_scale_565_sse2+0x44>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -65005,7 +65662,7 @@ _sk_lerp_u8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2788 <_sk_lerp_u8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 28c6 <_sk_lerp_u8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -65016,13 +65673,13 @@ _sk_lerp_u8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 2809 <_sk_lerp_u8_sse2+0x8f>
+ .byte 117,102 // jne 2947 <_sk_lerp_u8_sse2+0x8f>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,56,111,0,0 // pand 0x6f38(%edx),%xmm4
+ .byte 102,15,219,162,234,111,0,0 // pand 0x6fea(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,72,111,0,0 // mulps 0x6f48(%edx),%xmm4
+ .byte 15,89,162,250,111,0,0 // mulps 0x6ffa(%edx),%xmm4
.byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
@@ -65052,12 +65709,12 @@ _sk_lerp_u8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,53 // je 2846 <_sk_lerp_u8_sse2+0xcc>
+ .byte 116,53 // je 2984 <_sk_lerp_u8_sse2+0xcc>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 282d <_sk_lerp_u8_sse2+0xb3>
+ .byte 116,19 // je 296b <_sk_lerp_u8_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,145 // jne 27b0 <_sk_lerp_u8_sse2+0x36>
+ .byte 117,145 // jne 28ee <_sk_lerp_u8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -65066,10 +65723,10 @@ _sk_lerp_u8_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,106,255,255,255 // jmp 27b0 <_sk_lerp_u8_sse2+0x36>
+ .byte 233,106,255,255,255 // jmp 28ee <_sk_lerp_u8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,93,255,255,255 // jmp 27b0 <_sk_lerp_u8_sse2+0x36>
+ .byte 233,93,255,255,255 // jmp 28ee <_sk_lerp_u8_sse2+0x36>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -65080,8 +65737,12 @@ _sk_lerp_565_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2861 <_sk_lerp_565_sse2+0xe>
+ .byte 131,236,108 // sub $0x6c,%esp
+ .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
+ .byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
+ .byte 15,41,77,152 // movaps %xmm1,-0x68(%ebp)
+ .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp)
+ .byte 232,0,0,0,0 // call 29b0 <_sk_lerp_565_sse2+0x1f>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -65093,49 +65754,62 @@ _sk_lerp_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,163,0,0,0 // jne 2925 <_sk_lerp_565_sse2+0xd2>
- .byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
- .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,162,127,110,0,0 // movdqa 0x6e7f(%edx),%xmm4
- .byte 102,15,219,230 // pand %xmm6,%xmm4
- .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,143,110,0,0 // mulps 0x6e8f(%edx),%xmm4
- .byte 102,15,111,170,159,110,0,0 // movdqa 0x6e9f(%edx),%xmm5
- .byte 102,15,219,238 // pand %xmm6,%xmm5
- .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,175,110,0,0 // mulps 0x6eaf(%edx),%xmm5
- .byte 102,15,219,178,191,110,0,0 // pand 0x6ebf(%edx),%xmm6
+ .byte 15,133,211,0,0,0 // jne 2aa4 <_sk_lerp_565_sse2+0x113>
+ .byte 243,15,126,44,126 // movq (%esi,%edi,2),%xmm5
+ .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
+ .byte 102,15,111,162,32,111,0,0 // movdqa 0x6f20(%edx),%xmm4
+ .byte 102,15,219,229 // pand %xmm5,%xmm4
+ .byte 15,91,204 // cvtdq2ps %xmm4,%xmm1
+ .byte 15,89,138,48,111,0,0 // mulps 0x6f30(%edx),%xmm1
+ .byte 102,15,111,178,64,111,0,0 // movdqa 0x6f40(%edx),%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,207,110,0,0 // mulps 0x6ecf(%edx),%xmm6
- .byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7
- .byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7
- .byte 15,92,207 // subps %xmm7,%xmm1
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,40,121,48 // movaps 0x30(%ecx),%xmm7
- .byte 15,92,215 // subps %xmm7,%xmm2
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,40,121,64 // movaps 0x40(%ecx),%xmm7
- .byte 15,92,223 // subps %xmm7,%xmm3
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,88,231 // addps %xmm7,%xmm4
- .byte 15,88,239 // addps %xmm7,%xmm5
- .byte 15,88,223 // addps %xmm7,%xmm3
- .byte 15,95,235 // maxps %xmm3,%xmm5
- .byte 15,95,229 // maxps %xmm5,%xmm4
+ .byte 15,89,178,80,111,0,0 // mulps 0x6f50(%edx),%xmm6
+ .byte 102,15,219,170,96,111,0,0 // pand 0x6f60(%edx),%xmm5
+ .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
+ .byte 15,89,146,112,111,0,0 // mulps 0x6f70(%edx),%xmm2
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,40,65,32 // movaps 0x20(%ecx),%xmm0
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4
+ .byte 15,92,224 // subps %xmm0,%xmm4
+ .byte 15,89,230 // mulps %xmm6,%xmm4
+ .byte 15,93,243 // minps %xmm3,%xmm6
+ .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,40,65,16 // movaps 0x10(%ecx),%xmm0
+ .byte 15,40,109,184 // movaps -0x48(%ebp),%xmm5
+ .byte 15,92,232 // subps %xmm0,%xmm5
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 15,93,206 // minps %xmm6,%xmm1
+ .byte 15,40,113,64 // movaps 0x40(%ecx),%xmm6
+ .byte 15,95,251 // maxps %xmm3,%xmm7
+ .byte 15,95,215 // maxps %xmm7,%xmm2
+ .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,194,254,1 // cmpltps %xmm6,%xmm7
+ .byte 15,84,207 // andps %xmm7,%xmm1
+ .byte 15,85,250 // andnps %xmm2,%xmm7
+ .byte 15,86,249 // orps %xmm1,%xmm7
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,88,101,216 // addps -0x28(%ebp),%xmm4
+ .byte 15,40,65,48 // movaps 0x30(%ecx),%xmm0
+ .byte 15,40,85,136 // movaps -0x78(%ebp),%xmm2
+ .byte 15,92,208 // subps %xmm0,%xmm2
+ .byte 15,89,85,200 // mulps -0x38(%ebp),%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,92,222 // subps %xmm6,%xmm3
+ .byte 15,89,223 // mulps %xmm7,%xmm3
+ .byte 15,88,222 // addps %xmm6,%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,40,204 // movaps %xmm4,%xmm1
.byte 82 // push %edx
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,28 // add $0x1c,%esp
+ .byte 131,196,124 // add $0x7c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -65143,22 +65817,22 @@ _sk_lerp_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 295f <_sk_lerp_565_sse2+0x10c>
- .byte 102,15,239,246 // pxor %xmm6,%xmm6
+ .byte 116,50 // je 2ade <_sk_lerp_565_sse2+0x14d>
+ .byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 294d <_sk_lerp_565_sse2+0xfa>
+ .byte 116,23 // je 2acc <_sk_lerp_565_sse2+0x13b>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,76,255,255,255 // jne 288b <_sk_lerp_565_sse2+0x38>
+ .byte 15,133,28,255,255,255 // jne 29da <_sk_lerp_565_sse2+0x49>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
- .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
+ .byte 102,15,112,236,69 // pshufd $0x45,%xmm4,%xmm5
.byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,44,255,255,255 // jmp 288b <_sk_lerp_565_sse2+0x38>
+ .byte 242,15,16,236 // movsd %xmm4,%xmm5
+ .byte 233,252,254,255,255 // jmp 29da <_sk_lerp_565_sse2+0x49>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
- .byte 102,15,110,246 // movd %esi,%xmm6
- .byte 233,31,255,255,255 // jmp 288b <_sk_lerp_565_sse2+0x38>
+ .byte 102,15,110,238 // movd %esi,%xmm5
+ .byte 233,239,254,255,255 // jmp 29da <_sk_lerp_565_sse2+0x49>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -65170,7 +65844,7 @@ _sk_load_tables_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 297a <_sk_load_tables_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2af9 <_sk_load_tables_sse2+0xe>
.byte 90 // pop %edx
.byte 139,117,12 // mov 0xc(%ebp),%esi
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -65179,9 +65853,9 @@ _sk_load_tables_sse2:
.byte 133,192 // test %eax,%eax
.byte 139,54 // mov (%esi),%esi
.byte 139,30 // mov (%esi),%ebx
- .byte 15,133,19,1,0,0 // jne 2aa5 <_sk_load_tables_sse2+0x139>
+ .byte 15,133,19,1,0,0 // jne 2c24 <_sk_load_tables_sse2+0x139>
.byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
- .byte 102,15,111,146,198,109,0,0 // movdqa 0x6dc6(%edx),%xmm2
+ .byte 102,15,111,146,55,110,0,0 // movdqa 0x6e37(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
@@ -65237,7 +65911,7 @@ _sk_load_tables_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,214,109,0,0 // mulps 0x6dd6(%edx),%xmm3
+ .byte 15,89,154,71,110,0,0 // mulps 0x6e47(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,194 // mov %eax,%edx
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -65253,18 +65927,18 @@ _sk_load_tables_sse2:
.byte 195 // ret
.byte 36,3 // and $0x3,%al
.byte 60,1 // cmp $0x1,%al
- .byte 116,37 // je 2ad0 <_sk_load_tables_sse2+0x164>
+ .byte 116,37 // je 2c4f <_sk_load_tables_sse2+0x164>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 60,2 // cmp $0x2,%al
- .byte 116,19 // je 2ac6 <_sk_load_tables_sse2+0x15a>
+ .byte 116,19 // je 2c45 <_sk_load_tables_sse2+0x15a>
.byte 60,3 // cmp $0x3,%al
- .byte 15,133,220,254,255,255 // jne 2997 <_sk_load_tables_sse2+0x2b>
+ .byte 15,133,220,254,255,255 // jne 2b16 <_sk_load_tables_sse2+0x2b>
.byte 102,15,110,68,187,8 // movd 0x8(%ebx,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,187 // movlpd (%ebx,%edi,4),%xmm3
- .byte 233,199,254,255,255 // jmp 2997 <_sk_load_tables_sse2+0x2b>
+ .byte 233,199,254,255,255 // jmp 2b16 <_sk_load_tables_sse2+0x2b>
.byte 102,15,110,28,187 // movd (%ebx,%edi,4),%xmm3
- .byte 233,189,254,255,255 // jmp 2997 <_sk_load_tables_sse2+0x2b>
+ .byte 233,189,254,255,255 // jmp 2b16 <_sk_load_tables_sse2+0x2b>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -65276,7 +65950,7 @@ _sk_load_tables_u16_be_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,44 // sub $0x2c,%esp
- .byte 232,0,0,0,0 // call 2ae8 <_sk_load_tables_u16_be_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2c67 <_sk_load_tables_u16_be_sse2+0xe>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
@@ -65287,7 +65961,7 @@ _sk_load_tables_u16_be_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 139,15 // mov (%edi),%ecx
.byte 190,255,0,255,0 // mov $0xff00ff,%esi
- .byte 15,133,166,1,0,0 // jne 2cae <_sk_load_tables_u16_be_sse2+0x1d4>
+ .byte 15,133,166,1,0,0 // jne 2e2d <_sk_load_tables_u16_be_sse2+0x1d4>
.byte 102,15,16,4,89 // movupd (%ecx,%ebx,2),%xmm0
.byte 243,15,111,76,89,16 // movdqu 0x10(%ecx,%ebx,2),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -65384,7 +66058,7 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,120,108,0,0 // mulps 0x6c78(%edx),%xmm3
+ .byte 15,89,154,233,108,0,0 // mulps 0x6ce9(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
@@ -65401,12 +66075,12 @@ _sk_load_tables_u16_be_sse2:
.byte 242,15,16,4,89 // movsd (%ecx,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,248,1 // cmp $0x1,%eax
- .byte 15,132,83,254,255,255 // je 2b13 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 15,132,83,254,255,255 // je 2c92 <_sk_load_tables_u16_be_sse2+0x39>
.byte 102,15,22,68,89,8 // movhpd 0x8(%ecx,%ebx,2),%xmm0
.byte 131,248,3 // cmp $0x3,%eax
- .byte 15,130,68,254,255,255 // jb 2b13 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 15,130,68,254,255,255 // jb 2c92 <_sk_load_tables_u16_be_sse2+0x39>
.byte 243,15,126,76,89,16 // movq 0x10(%ecx,%ebx,2),%xmm1
- .byte 233,57,254,255,255 // jmp 2b13 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 233,57,254,255,255 // jmp 2c92 <_sk_load_tables_u16_be_sse2+0x39>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -65418,7 +66092,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,28 // sub $0x1c,%esp
- .byte 232,0,0,0,0 // call 2ce8 <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2e67 <_sk_load_tables_rgb_u16_be_sse2+0xe>
.byte 88 // pop %eax
.byte 137,69,240 // mov %eax,-0x10(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -65429,7 +66103,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 139,56 // mov (%eax),%edi
.byte 139,7 // mov (%edi),%eax
.byte 190,255,0,255,0 // mov $0xff00ff,%esi
- .byte 15,133,141,1,0,0 // jne 2e96 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ .byte 15,133,141,1,0,0 // jne 3015 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
.byte 243,15,111,12,88 // movdqu (%eax,%ebx,2),%xmm1
.byte 243,15,111,92,88,8 // movdqu 0x8(%eax,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -65523,7 +66197,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 139,85,240 // mov -0x10(%ebp),%edx
- .byte 15,40,162,136,106,0,0 // movaps 0x6a88(%edx),%xmm4
+ .byte 15,40,162,249,106,0,0 // movaps 0x6af9(%edx),%xmm4
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 80 // push %eax
@@ -65539,20 +66213,20 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,15,196,76,88,4,2 // pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 131,249,1 // cmp $0x1,%ecx
- .byte 117,13 // jne 2eb8 <_sk_load_tables_rgb_u16_be_sse2+0x1de>
+ .byte 117,13 // jne 3037 <_sk_load_tables_rgb_u16_be_sse2+0x1de>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,115,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,115,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51>
.byte 102,15,110,68,88,6 // movd 0x6(%eax,%ebx,2),%xmm0
.byte 102,15,196,68,88,10,2 // pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 131,249,3 // cmp $0x3,%ecx
- .byte 114,18 // jb 2ee0 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ .byte 114,18 // jb 305f <_sk_load_tables_rgb_u16_be_sse2+0x206>
.byte 102,15,110,92,88,12 // movd 0xc(%eax,%ebx,2),%xmm3
.byte 102,15,196,92,88,16,2 // pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
- .byte 233,75,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,75,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,66,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,66,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -65564,11 +66238,11 @@ _sk_byte_tables_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2ef7 <_sk_byte_tables_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3076 <_sk_byte_tables_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,162,137,104,0,0 // movaps 0x6889(%edx),%xmm4
+ .byte 15,40,162,250,104,0,0 // movaps 0x68fa(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
@@ -65590,7 +66264,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,170,153,104,0,0 // movaps 0x6899(%edx),%xmm5
+ .byte 15,40,170,10,105,0,0 // movaps 0x690a(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -65715,12 +66389,12 @@ _sk_byte_tables_rgb_sse2:
.byte 15,182,60,31 // movzbl (%edi,%ebx,1),%edi
.byte 193,231,8 // shl $0x8,%edi
.byte 9,215 // or %edx,%edi
- .byte 232,0,0,0,0 // call 30f7 <_sk_byte_tables_rgb_sse2+0x65>
+ .byte 232,0,0,0,0 // call 3276 <_sk_byte_tables_rgb_sse2+0x65>
.byte 90 // pop %edx
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,169,102,0,0 // movaps 0x66a9(%edx),%xmm5
+ .byte 15,40,170,26,103,0,0 // movaps 0x671a(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -65956,7 +66630,7 @@ _sk_parametric_r_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 33c6 <_sk_parametric_r_sse2+0x18>
+ .byte 232,0,0,0,0 // call 3545 <_sk_parametric_r_sse2+0x18>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -65976,15 +66650,15 @@ _sk_parametric_r_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,234,99,0,0 // mulps 0x63ea(%edx),%xmm5
- .byte 15,84,178,250,99,0,0 // andps 0x63fa(%edx),%xmm6
- .byte 15,86,178,10,100,0,0 // orps 0x640a(%edx),%xmm6
- .byte 15,88,170,26,100,0,0 // addps 0x641a(%edx),%xmm5
- .byte 15,40,186,42,100,0,0 // movaps 0x642a(%edx),%xmm7
+ .byte 15,89,170,91,100,0,0 // mulps 0x645b(%edx),%xmm5
+ .byte 15,84,178,107,100,0,0 // andps 0x646b(%edx),%xmm6
+ .byte 15,86,178,123,100,0,0 // orps 0x647b(%edx),%xmm6
+ .byte 15,88,170,139,100,0,0 // addps 0x648b(%edx),%xmm5
+ .byte 15,40,186,155,100,0,0 // movaps 0x649b(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,58,100,0,0 // addps 0x643a(%edx),%xmm6
- .byte 15,40,186,74,100,0,0 // movaps 0x644a(%edx),%xmm7
+ .byte 15,88,178,171,100,0,0 // addps 0x64ab(%edx),%xmm6
+ .byte 15,40,186,187,100,0,0 // movaps 0x64bb(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -65994,21 +66668,21 @@ _sk_parametric_r_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,90,100,0,0 // movaps 0x645a(%edx),%xmm6
+ .byte 15,40,178,203,100,0,0 // movaps 0x64cb(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,106,100,0,0 // addps 0x646a(%edx),%xmm5
- .byte 15,40,186,122,100,0,0 // movaps 0x647a(%edx),%xmm7
+ .byte 15,88,170,219,100,0,0 // addps 0x64db(%edx),%xmm5
+ .byte 15,40,186,235,100,0,0 // movaps 0x64eb(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,138,100,0,0 // movaps 0x648a(%edx),%xmm7
+ .byte 15,40,186,251,100,0,0 // movaps 0x64fb(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,154,100,0,0 // movaps 0x649a(%edx),%xmm0
+ .byte 15,40,130,11,101,0,0 // movaps 0x650b(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,170,100,0,0 // mulps 0x64aa(%edx),%xmm0
+ .byte 15,89,130,27,101,0,0 // mulps 0x651b(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66042,7 +66716,7 @@ _sk_parametric_g_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 34fd <_sk_parametric_g_sse2+0x15>
+ .byte 232,0,0,0,0 // call 367c <_sk_parametric_g_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -66062,15 +66736,15 @@ _sk_parametric_g_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,131,99,0,0 // mulps 0x6383(%edx),%xmm5
- .byte 15,84,178,147,99,0,0 // andps 0x6393(%edx),%xmm6
- .byte 15,86,178,163,99,0,0 // orps 0x63a3(%edx),%xmm6
- .byte 15,88,170,179,99,0,0 // addps 0x63b3(%edx),%xmm5
- .byte 15,40,186,195,99,0,0 // movaps 0x63c3(%edx),%xmm7
+ .byte 15,89,170,244,99,0,0 // mulps 0x63f4(%edx),%xmm5
+ .byte 15,84,178,4,100,0,0 // andps 0x6404(%edx),%xmm6
+ .byte 15,86,178,20,100,0,0 // orps 0x6414(%edx),%xmm6
+ .byte 15,88,170,36,100,0,0 // addps 0x6424(%edx),%xmm5
+ .byte 15,40,186,52,100,0,0 // movaps 0x6434(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,211,99,0,0 // addps 0x63d3(%edx),%xmm6
- .byte 15,40,186,227,99,0,0 // movaps 0x63e3(%edx),%xmm7
+ .byte 15,88,178,68,100,0,0 // addps 0x6444(%edx),%xmm6
+ .byte 15,40,186,84,100,0,0 // movaps 0x6454(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -66080,21 +66754,21 @@ _sk_parametric_g_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,243,99,0,0 // movaps 0x63f3(%edx),%xmm6
+ .byte 15,40,178,100,100,0,0 // movaps 0x6464(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,3,100,0,0 // addps 0x6403(%edx),%xmm5
- .byte 15,40,186,19,100,0,0 // movaps 0x6413(%edx),%xmm7
+ .byte 15,88,170,116,100,0,0 // addps 0x6474(%edx),%xmm5
+ .byte 15,40,186,132,100,0,0 // movaps 0x6484(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,35,100,0,0 // movaps 0x6423(%edx),%xmm7
+ .byte 15,40,186,148,100,0,0 // movaps 0x6494(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,51,100,0,0 // movaps 0x6433(%edx),%xmm0
+ .byte 15,40,130,164,100,0,0 // movaps 0x64a4(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,67,100,0,0 // mulps 0x6443(%edx),%xmm0
+ .byte 15,89,130,180,100,0,0 // mulps 0x64b4(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66127,7 +66801,7 @@ _sk_parametric_b_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 3631 <_sk_parametric_b_sse2+0x15>
+ .byte 232,0,0,0,0 // call 37b0 <_sk_parametric_b_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -66147,15 +66821,15 @@ _sk_parametric_b_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,31,99,0,0 // mulps 0x631f(%edx),%xmm5
- .byte 15,84,178,47,99,0,0 // andps 0x632f(%edx),%xmm6
- .byte 15,86,178,63,99,0,0 // orps 0x633f(%edx),%xmm6
- .byte 15,88,170,79,99,0,0 // addps 0x634f(%edx),%xmm5
- .byte 15,40,186,95,99,0,0 // movaps 0x635f(%edx),%xmm7
+ .byte 15,89,170,144,99,0,0 // mulps 0x6390(%edx),%xmm5
+ .byte 15,84,178,160,99,0,0 // andps 0x63a0(%edx),%xmm6
+ .byte 15,86,178,176,99,0,0 // orps 0x63b0(%edx),%xmm6
+ .byte 15,88,170,192,99,0,0 // addps 0x63c0(%edx),%xmm5
+ .byte 15,40,186,208,99,0,0 // movaps 0x63d0(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,111,99,0,0 // addps 0x636f(%edx),%xmm6
- .byte 15,40,186,127,99,0,0 // movaps 0x637f(%edx),%xmm7
+ .byte 15,88,178,224,99,0,0 // addps 0x63e0(%edx),%xmm6
+ .byte 15,40,186,240,99,0,0 // movaps 0x63f0(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -66165,21 +66839,21 @@ _sk_parametric_b_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,143,99,0,0 // movaps 0x638f(%edx),%xmm6
+ .byte 15,40,178,0,100,0,0 // movaps 0x6400(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,159,99,0,0 // addps 0x639f(%edx),%xmm5
- .byte 15,40,186,175,99,0,0 // movaps 0x63af(%edx),%xmm7
+ .byte 15,88,170,16,100,0,0 // addps 0x6410(%edx),%xmm5
+ .byte 15,40,186,32,100,0,0 // movaps 0x6420(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,191,99,0,0 // movaps 0x63bf(%edx),%xmm7
+ .byte 15,40,186,48,100,0,0 // movaps 0x6430(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,207,99,0,0 // movaps 0x63cf(%edx),%xmm0
+ .byte 15,40,130,64,100,0,0 // movaps 0x6440(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,223,99,0,0 // mulps 0x63df(%edx),%xmm0
+ .byte 15,89,130,80,100,0,0 // mulps 0x6450(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66212,7 +66886,7 @@ _sk_parametric_a_sse2:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 3765 <_sk_parametric_a_sse2+0x15>
+ .byte 232,0,0,0,0 // call 38e4 <_sk_parametric_a_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -66232,15 +66906,15 @@ _sk_parametric_a_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,187,98,0,0 // mulps 0x62bb(%edx),%xmm5
- .byte 15,84,178,203,98,0,0 // andps 0x62cb(%edx),%xmm6
- .byte 15,86,178,219,98,0,0 // orps 0x62db(%edx),%xmm6
- .byte 15,88,170,235,98,0,0 // addps 0x62eb(%edx),%xmm5
- .byte 15,40,186,251,98,0,0 // movaps 0x62fb(%edx),%xmm7
+ .byte 15,89,170,44,99,0,0 // mulps 0x632c(%edx),%xmm5
+ .byte 15,84,178,60,99,0,0 // andps 0x633c(%edx),%xmm6
+ .byte 15,86,178,76,99,0,0 // orps 0x634c(%edx),%xmm6
+ .byte 15,88,170,92,99,0,0 // addps 0x635c(%edx),%xmm5
+ .byte 15,40,186,108,99,0,0 // movaps 0x636c(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,11,99,0,0 // addps 0x630b(%edx),%xmm6
- .byte 15,40,186,27,99,0,0 // movaps 0x631b(%edx),%xmm7
+ .byte 15,88,178,124,99,0,0 // addps 0x637c(%edx),%xmm6
+ .byte 15,40,186,140,99,0,0 // movaps 0x638c(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -66250,21 +66924,21 @@ _sk_parametric_a_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,43,99,0,0 // movaps 0x632b(%edx),%xmm6
+ .byte 15,40,178,156,99,0,0 // movaps 0x639c(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,59,99,0,0 // addps 0x633b(%edx),%xmm5
- .byte 15,40,186,75,99,0,0 // movaps 0x634b(%edx),%xmm7
+ .byte 15,88,170,172,99,0,0 // addps 0x63ac(%edx),%xmm5
+ .byte 15,40,186,188,99,0,0 // movaps 0x63bc(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,91,99,0,0 // movaps 0x635b(%edx),%xmm7
+ .byte 15,40,186,204,99,0,0 // movaps 0x63cc(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,107,99,0,0 // movaps 0x636b(%edx),%xmm0
+ .byte 15,40,130,220,99,0,0 // movaps 0x63dc(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,123,99,0,0 // mulps 0x637b(%edx),%xmm0
+ .byte 15,89,130,236,99,0,0 // mulps 0x63ec(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66296,18 +66970,18 @@ _sk_gamma_sse2:
.byte 131,236,40 // sub $0x28,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 232,0,0,0,0 // call 3896 <_sk_gamma_sse2+0x12>
+ .byte 232,0,0,0,0 // call 3a15 <_sk_gamma_sse2+0x12>
.byte 88 // pop %eax
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0
- .byte 15,84,152,106,98,0,0 // andps 0x626a(%eax),%xmm3
- .byte 15,86,152,122,98,0,0 // orps 0x627a(%eax),%xmm3
- .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0
+ .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0
+ .byte 15,84,152,219,98,0,0 // andps 0x62db(%eax),%xmm3
+ .byte 15,86,152,235,98,0,0 // orps 0x62eb(%eax),%xmm3
+ .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,89,160,154,98,0,0 // mulps 0x629a(%eax),%xmm4
+ .byte 15,89,160,11,99,0,0 // mulps 0x630b(%eax),%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,88,152,170,98,0,0 // addps 0x62aa(%eax),%xmm3
- .byte 15,40,160,186,98,0,0 // movaps 0x62ba(%eax),%xmm4
+ .byte 15,88,152,27,99,0,0 // addps 0x631b(%eax),%xmm3
+ .byte 15,40,160,43,99,0,0 // movaps 0x632b(%eax),%xmm4
.byte 15,94,227 // divps %xmm3,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 139,77,12 // mov 0xc(%ebp),%ecx
@@ -66320,30 +66994,30 @@ _sk_gamma_sse2:
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,227,1 // cmpltps %xmm3,%xmm4
- .byte 15,84,160,202,98,0,0 // andps 0x62ca(%eax),%xmm4
+ .byte 15,84,160,59,99,0,0 // andps 0x633b(%eax),%xmm4
.byte 15,92,220 // subps %xmm4,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0
- .byte 15,40,176,250,98,0,0 // movaps 0x62fa(%eax),%xmm6
+ .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0
+ .byte 15,40,176,107,99,0,0 // movaps 0x636b(%eax),%xmm6
.byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,40,168,234,98,0,0 // movaps 0x62ea(%eax),%xmm5
+ .byte 15,40,168,91,99,0,0 // movaps 0x635b(%eax),%xmm5
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,40,152,10,99,0,0 // movaps 0x630a(%eax),%xmm3
+ .byte 15,40,152,123,99,0,0 // movaps 0x637b(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,94,230 // divps %xmm6,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0
- .byte 15,84,136,106,98,0,0 // andps 0x626a(%eax),%xmm1
- .byte 15,86,136,122,98,0,0 // orps 0x627a(%eax),%xmm1
- .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0
+ .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0
+ .byte 15,84,136,219,98,0,0 // andps 0x62db(%eax),%xmm1
+ .byte 15,86,136,235,98,0,0 // orps 0x62eb(%eax),%xmm1
+ .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,89,176,154,98,0,0 // mulps 0x629a(%eax),%xmm6
+ .byte 15,89,176,11,99,0,0 // mulps 0x630b(%eax),%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,136,170,98,0,0 // addps 0x62aa(%eax),%xmm1
- .byte 15,40,176,186,98,0,0 // movaps 0x62ba(%eax),%xmm6
+ .byte 15,88,136,27,99,0,0 // addps 0x631b(%eax),%xmm1
+ .byte 15,40,176,43,99,0,0 // movaps 0x632b(%eax),%xmm6
.byte 15,94,241 // divps %xmm1,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -66351,12 +67025,12 @@ _sk_gamma_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,241,1 // cmpltps %xmm1,%xmm6
- .byte 15,84,176,202,98,0,0 // andps 0x62ca(%eax),%xmm6
+ .byte 15,84,176,59,99,0,0 // andps 0x633b(%eax),%xmm6
.byte 15,92,206 // subps %xmm6,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0
- .byte 15,40,184,250,98,0,0 // movaps 0x62fa(%eax),%xmm7
+ .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0
+ .byte 15,40,184,107,99,0,0 // movaps 0x636b(%eax),%xmm7
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
@@ -66364,15 +67038,15 @@ _sk_gamma_sse2:
.byte 15,94,207 // divps %xmm7,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0
- .byte 15,84,144,106,98,0,0 // andps 0x626a(%eax),%xmm2
- .byte 15,86,144,122,98,0,0 // orps 0x627a(%eax),%xmm2
- .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0
- .byte 15,40,176,154,98,0,0 // movaps 0x629a(%eax),%xmm6
+ .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0
+ .byte 15,84,144,219,98,0,0 // andps 0x62db(%eax),%xmm2
+ .byte 15,86,144,235,98,0,0 // orps 0x62eb(%eax),%xmm2
+ .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0
+ .byte 15,40,176,11,99,0,0 // movaps 0x630b(%eax),%xmm6
.byte 15,89,242 // mulps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,144,170,98,0,0 // addps 0x62aa(%eax),%xmm2
- .byte 15,40,176,186,98,0,0 // movaps 0x62ba(%eax),%xmm6
+ .byte 15,88,144,27,99,0,0 // addps 0x631b(%eax),%xmm2
+ .byte 15,40,176,43,99,0,0 // movaps 0x632b(%eax),%xmm6
.byte 15,94,242 // divps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
@@ -66380,18 +67054,18 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,242,1 // cmpltps %xmm2,%xmm6
- .byte 15,84,176,202,98,0,0 // andps 0x62ca(%eax),%xmm6
+ .byte 15,84,176,59,99,0,0 // andps 0x633b(%eax),%xmm6
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0
+ .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0
.byte 15,89,238 // mulps %xmm6,%xmm5
.byte 15,92,197 // subps %xmm5,%xmm0
- .byte 15,40,144,250,98,0,0 // movaps 0x62fa(%eax),%xmm2
+ .byte 15,40,144,107,99,0,0 // movaps 0x636b(%eax),%xmm2
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,94,218 // divps %xmm2,%xmm3
.byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,40,128,26,99,0,0 // movaps 0x631a(%eax),%xmm0
+ .byte 15,40,128,139,99,0,0 // movaps 0x638b(%eax),%xmm0
.byte 15,89,224 // mulps %xmm0,%xmm4
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,89,216 // mulps %xmm0,%xmm3
@@ -66418,31 +67092,31 @@ _sk_lab_to_xyz_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 3a7e <_sk_lab_to_xyz_sse2+0x15>
+ .byte 232,0,0,0,0 // call 3bfd <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,66,97,0,0 // mulps 0x6142(%eax),%xmm2
- .byte 15,40,160,82,97,0,0 // movaps 0x6152(%eax),%xmm4
+ .byte 15,89,144,179,97,0,0 // mulps 0x61b3(%eax),%xmm2
+ .byte 15,40,160,195,97,0,0 // movaps 0x61c3(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,98,97,0,0 // movaps 0x6162(%eax),%xmm5
+ .byte 15,40,168,211,97,0,0 // movaps 0x61d3(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,114,97,0,0 // addps 0x6172(%eax),%xmm2
- .byte 15,89,144,130,97,0,0 // mulps 0x6182(%eax),%xmm2
- .byte 15,89,136,146,97,0,0 // mulps 0x6192(%eax),%xmm1
+ .byte 15,88,144,227,97,0,0 // addps 0x61e3(%eax),%xmm2
+ .byte 15,89,144,243,97,0,0 // mulps 0x61f3(%eax),%xmm2
+ .byte 15,89,136,3,98,0,0 // mulps 0x6203(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,162,97,0,0 // mulps 0x61a2(%eax),%xmm3
+ .byte 15,89,152,19,98,0,0 // mulps 0x6213(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,178,97,0,0 // movaps 0x61b2(%eax),%xmm3
+ .byte 15,40,152,35,98,0,0 // movaps 0x6223(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,194,97,0,0 // movaps 0x61c2(%eax),%xmm6
+ .byte 15,40,176,51,98,0,0 // movaps 0x6233(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,210,97,0,0 // movaps 0x61d2(%eax),%xmm7
+ .byte 15,40,184,67,98,0,0 // movaps 0x6243(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -66467,8 +67141,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,85,221 // andnps %xmm5,%xmm3
.byte 15,86,216 // orps %xmm0,%xmm3
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,160,226,97,0,0 // mulps 0x61e2(%eax),%xmm4
- .byte 15,89,152,242,97,0,0 // mulps 0x61f2(%eax),%xmm3
+ .byte 15,89,160,83,98,0,0 // mulps 0x6253(%eax),%xmm4
+ .byte 15,89,152,99,98,0,0 // mulps 0x6263(%eax),%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -66491,7 +67165,7 @@ _sk_load_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3b6e <_sk_load_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3ced <_sk_load_a8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66502,13 +67176,13 @@ _sk_load_a8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,60 // jne 3bc5 <_sk_load_a8_sse2+0x65>
+ .byte 117,60 // jne 3d44 <_sk_load_a8_sse2+0x65>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,18,97,0,0 // pand 0x6112(%edx),%xmm0
+ .byte 102,15,219,130,131,97,0,0 // pand 0x6183(%edx),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,154,34,97,0,0 // mulps 0x6122(%edx),%xmm3
+ .byte 15,89,154,147,97,0,0 // mulps 0x6193(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -66525,12 +67199,12 @@ _sk_load_a8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3bff <_sk_load_a8_sse2+0x9f>
+ .byte 116,50 // je 3d7e <_sk_load_a8_sse2+0x9f>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3be9 <_sk_load_a8_sse2+0x89>
+ .byte 116,19 // je 3d68 <_sk_load_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,187 // jne 3b96 <_sk_load_a8_sse2+0x36>
+ .byte 117,187 // jne 3d15 <_sk_load_a8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -66539,10 +67213,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,151 // jmp 3b96 <_sk_load_a8_sse2+0x36>
+ .byte 235,151 // jmp 3d15 <_sk_load_a8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,141 // jmp 3b96 <_sk_load_a8_sse2+0x36>
+ .byte 235,141 // jmp 3d15 <_sk_load_a8_sse2+0x36>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -66567,15 +67241,15 @@ _sk_load_a8_dst_sse2:
.byte 102,15,127,97,32 // movdqa %xmm4,0x20(%ecx)
.byte 102,15,127,97,16 // movdqa %xmm4,0x10(%ecx)
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 3c42 <_sk_load_a8_dst_sse2+0x39>
+ .byte 232,0,0,0,0 // call 3dc1 <_sk_load_a8_dst_sse2+0x39>
.byte 90 // pop %edx
- .byte 117,54 // jne 3c7b <_sk_load_a8_dst_sse2+0x72>
+ .byte 117,54 // jne 3dfa <_sk_load_a8_dst_sse2+0x72>
.byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,94,96,0,0 // pand 0x605e(%edx),%xmm4
+ .byte 102,15,219,162,207,96,0,0 // pand 0x60cf(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,110,96,0,0 // mulps 0x606e(%edx),%xmm4
+ .byte 15,89,162,223,96,0,0 // mulps 0x60df(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -66590,11 +67264,11 @@ _sk_load_a8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 3cb1 <_sk_load_a8_dst_sse2+0xa8>
+ .byte 116,46 // je 3e30 <_sk_load_a8_dst_sse2+0xa8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3c9b <_sk_load_a8_dst_sse2+0x92>
+ .byte 116,19 // je 3e1a <_sk_load_a8_dst_sse2+0x92>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,197 // jne 3c52 <_sk_load_a8_dst_sse2+0x49>
+ .byte 117,197 // jne 3dd1 <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,92,55,2 // movzbl 0x2(%edi,%esi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -66603,10 +67277,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,161 // jmp 3c52 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,161 // jmp 3dd1 <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,151 // jmp 3c52 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,151 // jmp 3dd1 <_sk_load_a8_dst_sse2+0x49>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -66647,13 +67321,13 @@ _sk_gather_a8_sse2:
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
- .byte 232,0,0,0,0 // call 3d40 <_sk_gather_a8_sse2+0x85>
+ .byte 232,0,0,0,0 // call 3ebf <_sk_gather_a8_sse2+0x85>
.byte 89 // pop %ecx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,153,128,95,0,0 // mulps 0x5f80(%ecx),%xmm3
+ .byte 15,89,153,241,95,0,0 // mulps 0x5ff1(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -66678,7 +67352,7 @@ _sk_store_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 3d84 <_sk_store_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3f03 <_sk_store_a8_sse2+0xe>
.byte 94 // pop %esi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66687,7 +67361,7 @@ _sk_store_a8_sse2:
.byte 15,175,81,4 // imul 0x4(%ecx),%edx
.byte 3,23 // add (%edi),%edx
.byte 139,89,8 // mov 0x8(%ecx),%ebx
- .byte 15,40,166,76,95,0,0 // movaps 0x5f4c(%esi),%xmm4
+ .byte 15,40,166,189,95,0,0 // movaps 0x5fbd(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
@@ -66696,7 +67370,7 @@ _sk_store_a8_sse2:
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,26 // jne 3dd9 <_sk_store_a8_sse2+0x63>
+ .byte 117,26 // jne 3f58 <_sk_store_a8_sse2+0x63>
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 137,52,58 // mov %esi,(%edx,%edi,1)
.byte 141,80,8 // lea 0x8(%eax),%edx
@@ -66714,26 +67388,26 @@ _sk_store_a8_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,57 // je 3e22 <_sk_store_a8_sse2+0xac>
+ .byte 116,57 // je 3fa1 <_sk_store_a8_sse2+0xac>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,17 // je 3dff <_sk_store_a8_sse2+0x89>
+ .byte 116,17 // je 3f7e <_sk_store_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,211 // jne 3dc6 <_sk_store_a8_sse2+0x50>
+ .byte 117,211 // jne 3f45 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp)
.byte 138,93,208 // mov -0x30(%ebp),%bl
.byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,166,92,95,0,0 // pand 0x5f5c(%esi),%xmm4
+ .byte 102,15,219,166,205,95,0,0 // pand 0x5fcd(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 102,137,52,58 // mov %si,(%edx,%edi,1)
- .byte 235,164 // jmp 3dc6 <_sk_store_a8_sse2+0x50>
+ .byte 235,164 // jmp 3f45 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
.byte 138,93,216 // mov -0x28(%ebp),%bl
.byte 136,28,58 // mov %bl,(%edx,%edi,1)
- .byte 235,151 // jmp 3dc6 <_sk_store_a8_sse2+0x50>
+ .byte 235,151 // jmp 3f45 <_sk_store_a8_sse2+0x50>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -66745,7 +67419,7 @@ _sk_load_g8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3e3d <_sk_load_g8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3fbc <_sk_load_g8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66756,16 +67430,16 @@ _sk_load_g8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,63 // jne 3e97 <_sk_load_g8_sse2+0x68>
+ .byte 117,63 // jne 4016 <_sk_load_g8_sse2+0x68>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,179,94,0,0 // pand 0x5eb3(%edx),%xmm0
+ .byte 102,15,219,130,36,95,0,0 // pand 0x5f24(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,195,94,0,0 // mulps 0x5ec3(%edx),%xmm0
+ .byte 15,89,130,52,95,0,0 // mulps 0x5f34(%edx),%xmm0
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,211,94,0,0 // movaps 0x5ed3(%edx),%xmm3
+ .byte 15,40,154,68,95,0,0 // movaps 0x5f44(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 86 // push %esi
@@ -66779,12 +67453,12 @@ _sk_load_g8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3ed1 <_sk_load_g8_sse2+0xa2>
+ .byte 116,50 // je 4050 <_sk_load_g8_sse2+0xa2>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3ebb <_sk_load_g8_sse2+0x8c>
+ .byte 116,19 // je 403a <_sk_load_g8_sse2+0x8c>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,184 // jne 3e65 <_sk_load_g8_sse2+0x36>
+ .byte 117,184 // jne 3fe4 <_sk_load_g8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -66793,10 +67467,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,148 // jmp 3e65 <_sk_load_g8_sse2+0x36>
+ .byte 235,148 // jmp 3fe4 <_sk_load_g8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,138 // jmp 3e65 <_sk_load_g8_sse2+0x36>
+ .byte 235,138 // jmp 3fe4 <_sk_load_g8_sse2+0x36>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -66808,7 +67482,7 @@ _sk_load_g8_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3ee9 <_sk_load_g8_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4068 <_sk_load_g8_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66819,17 +67493,17 @@ _sk_load_g8_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,73 // jne 3f4d <_sk_load_g8_dst_sse2+0x72>
+ .byte 117,73 // jne 40cc <_sk_load_g8_dst_sse2+0x72>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,55,94,0,0 // pand 0x5e37(%edx),%xmm4
+ .byte 102,15,219,162,168,94,0,0 // pand 0x5ea8(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,71,94,0,0 // mulps 0x5e47(%edx),%xmm4
+ .byte 15,89,162,184,94,0,0 // mulps 0x5eb8(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
.byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,162,87,94,0,0 // movaps 0x5e57(%edx),%xmm4
+ .byte 15,40,162,200,94,0,0 // movaps 0x5ec8(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -66844,12 +67518,12 @@ _sk_load_g8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3f87 <_sk_load_g8_dst_sse2+0xac>
+ .byte 116,50 // je 4106 <_sk_load_g8_dst_sse2+0xac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3f71 <_sk_load_g8_dst_sse2+0x96>
+ .byte 116,19 // je 40f0 <_sk_load_g8_dst_sse2+0x96>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,174 // jne 3f11 <_sk_load_g8_dst_sse2+0x36>
+ .byte 117,174 // jne 4090 <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -66858,10 +67532,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,138 // jmp 3f11 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,138 // jmp 4090 <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,128 // jmp 3f11 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,128 // jmp 4090 <_sk_load_g8_dst_sse2+0x36>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -66901,17 +67575,17 @@ _sk_gather_g8_sse2:
.byte 193,226,8 // shl $0x8,%edx
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
- .byte 232,0,0,0,0 // call 4011 <_sk_gather_g8_sse2+0x80>
+ .byte 232,0,0,0,0 // call 4190 <_sk_gather_g8_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,63,93,0,0 // mulps 0x5d3f(%ecx),%xmm0
+ .byte 15,89,129,176,93,0,0 // mulps 0x5db0(%ecx),%xmm0
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,79,93,0,0 // movaps 0x5d4f(%ecx),%xmm3
+ .byte 15,40,153,192,93,0,0 // movaps 0x5dc0(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 82 // push %edx
@@ -66933,7 +67607,7 @@ _sk_load_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 405c <_sk_load_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 41db <_sk_load_565_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66945,23 +67619,23 @@ _sk_load_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,97 // jne 40da <_sk_load_565_sse2+0x8c>
+ .byte 117,97 // jne 4259 <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,20,93,0,0 // movdqa 0x5d14(%edx),%xmm0
+ .byte 102,15,111,130,133,93,0,0 // movdqa 0x5d85(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,36,93,0,0 // mulps 0x5d24(%edx),%xmm0
- .byte 102,15,111,138,52,93,0,0 // movdqa 0x5d34(%edx),%xmm1
+ .byte 15,89,130,149,93,0,0 // mulps 0x5d95(%edx),%xmm0
+ .byte 102,15,111,138,165,93,0,0 // movdqa 0x5da5(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,68,93,0,0 // mulps 0x5d44(%edx),%xmm1
- .byte 102,15,219,146,84,93,0,0 // pand 0x5d54(%edx),%xmm2
+ .byte 15,89,138,181,93,0,0 // mulps 0x5db5(%edx),%xmm1
+ .byte 102,15,219,146,197,93,0,0 // pand 0x5dc5(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,100,93,0,0 // mulps 0x5d64(%edx),%xmm2
+ .byte 15,89,146,213,93,0,0 // mulps 0x5dd5(%edx),%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,116,93,0,0 // movaps 0x5d74(%edx),%xmm3
+ .byte 15,40,154,229,93,0,0 // movaps 0x5de5(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -66973,22 +67647,22 @@ _sk_load_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 4110 <_sk_load_565_sse2+0xc2>
+ .byte 116,46 // je 428f <_sk_load_565_sse2+0xc2>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 40fe <_sk_load_565_sse2+0xb0>
+ .byte 116,19 // je 427d <_sk_load_565_sse2+0xb0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,146 // jne 4082 <_sk_load_565_sse2+0x34>
+ .byte 117,146 // jne 4201 <_sk_load_565_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,114,255,255,255 // jmp 4082 <_sk_load_565_sse2+0x34>
+ .byte 233,114,255,255,255 // jmp 4201 <_sk_load_565_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,214 // movd %esi,%xmm2
- .byte 233,101,255,255,255 // jmp 4082 <_sk_load_565_sse2+0x34>
+ .byte 233,101,255,255,255 // jmp 4201 <_sk_load_565_sse2+0x34>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -67000,7 +67674,7 @@ _sk_load_565_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 412b <_sk_load_565_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 42aa <_sk_load_565_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67012,24 +67686,24 @@ _sk_load_565_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,113 // jne 41b9 <_sk_load_565_dst_sse2+0x9c>
+ .byte 117,113 // jne 4338 <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,181,92,0,0 // movdqa 0x5cb5(%edx),%xmm5
+ .byte 102,15,111,170,38,93,0,0 // movdqa 0x5d26(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,197,92,0,0 // mulps 0x5cc5(%edx),%xmm5
+ .byte 15,89,170,54,93,0,0 // mulps 0x5d36(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,213,92,0,0 // movdqa 0x5cd5(%edx),%xmm5
+ .byte 102,15,111,170,70,93,0,0 // movdqa 0x5d46(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,229,92,0,0 // mulps 0x5ce5(%edx),%xmm5
+ .byte 15,89,170,86,93,0,0 // mulps 0x5d56(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,219,162,245,92,0,0 // pand 0x5cf5(%edx),%xmm4
+ .byte 102,15,219,162,102,93,0,0 // pand 0x5d66(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,5,93,0,0 // mulps 0x5d05(%edx),%xmm4
+ .byte 15,89,162,118,93,0,0 // mulps 0x5d76(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
- .byte 15,40,162,21,93,0,0 // movaps 0x5d15(%edx),%xmm4
+ .byte 15,40,162,134,93,0,0 // movaps 0x5d86(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -67044,22 +67718,22 @@ _sk_load_565_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 41ef <_sk_load_565_dst_sse2+0xd2>
+ .byte 116,46 // je 436e <_sk_load_565_dst_sse2+0xd2>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 41dd <_sk_load_565_dst_sse2+0xc0>
+ .byte 116,19 // je 435c <_sk_load_565_dst_sse2+0xc0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,130 // jne 4151 <_sk_load_565_dst_sse2+0x34>
+ .byte 117,130 // jne 42d0 <_sk_load_565_dst_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,98,255,255,255 // jmp 4151 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,98,255,255,255 // jmp 42d0 <_sk_load_565_dst_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,85,255,255,255 // jmp 4151 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,85,255,255,255 // jmp 42d0 <_sk_load_565_dst_sse2+0x34>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -67094,25 +67768,25 @@ _sk_gather_565_sse2:
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
- .byte 232,0,0,0,0 // call 4277 <_sk_gather_565_sse2+0x7b>
+ .byte 232,0,0,0,0 // call 43f6 <_sk_gather_565_sse2+0x7b>
.byte 90 // pop %edx
.byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,217,91,0,0 // movdqa 0x5bd9(%edx),%xmm0
+ .byte 102,15,111,130,74,92,0,0 // movdqa 0x5c4a(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,233,91,0,0 // mulps 0x5be9(%edx),%xmm0
- .byte 102,15,111,138,249,91,0,0 // movdqa 0x5bf9(%edx),%xmm1
+ .byte 15,89,130,90,92,0,0 // mulps 0x5c5a(%edx),%xmm0
+ .byte 102,15,111,138,106,92,0,0 // movdqa 0x5c6a(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,9,92,0,0 // mulps 0x5c09(%edx),%xmm1
- .byte 102,15,219,146,25,92,0,0 // pand 0x5c19(%edx),%xmm2
+ .byte 15,89,138,122,92,0,0 // mulps 0x5c7a(%edx),%xmm1
+ .byte 102,15,219,146,138,92,0,0 // pand 0x5c8a(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,41,92,0,0 // mulps 0x5c29(%edx),%xmm2
+ .byte 15,89,146,154,92,0,0 // mulps 0x5c9a(%edx),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,57,92,0,0 // movaps 0x5c39(%edx),%xmm3
+ .byte 15,40,154,170,92,0,0 // movaps 0x5caa(%edx),%xmm3
.byte 81 // push %ecx
.byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
@@ -67130,7 +67804,7 @@ _sk_store_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 42ea <_sk_store_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4469 <_sk_store_565_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67140,8 +67814,8 @@ _sk_store_565_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,214,91,0,0 // movaps 0x5bd6(%edi),%xmm4
- .byte 15,40,175,230,91,0,0 // movaps 0x5be6(%edi),%xmm5
+ .byte 15,40,167,71,92,0,0 // movaps 0x5c47(%edi),%xmm4
+ .byte 15,40,175,87,92,0,0 // movaps 0x5c57(%edi),%xmm5
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,89,244 // mulps %xmm4,%xmm6
@@ -67161,7 +67835,7 @@ _sk_store_565_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 437e <_sk_store_565_sse2+0xa2>
+ .byte 117,34 // jne 44fd <_sk_store_565_sse2+0xa2>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -67181,20 +67855,20 @@ _sk_store_565_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 43b4 <_sk_store_565_sse2+0xd8>
+ .byte 116,37 // je 4533 <_sk_store_565_sse2+0xd8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 43a3 <_sk_store_565_sse2+0xc7>
+ .byte 116,15 // je 4522 <_sk_store_565_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 436b <_sk_store_565_sse2+0x8f>
+ .byte 117,210 // jne 44ea <_sk_store_565_sse2+0x8f>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 436b <_sk_store_565_sse2+0x8f>
+ .byte 235,183 // jmp 44ea <_sk_store_565_sse2+0x8f>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 436b <_sk_store_565_sse2+0x8f>
+ .byte 235,173 // jmp 44ea <_sk_store_565_sse2+0x8f>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -67206,7 +67880,7 @@ _sk_load_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 43cc <_sk_load_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 454b <_sk_load_4444_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67218,24 +67892,24 @@ _sk_load_4444_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,112 // jne 4459 <_sk_load_4444_sse2+0x9b>
+ .byte 117,112 // jne 45d8 <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,20,91,0,0 // movdqa 0x5b14(%edx),%xmm0
+ .byte 102,15,111,130,133,91,0,0 // movdqa 0x5b85(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,36,91,0,0 // mulps 0x5b24(%edx),%xmm0
- .byte 102,15,111,138,52,91,0,0 // movdqa 0x5b34(%edx),%xmm1
+ .byte 15,89,130,149,91,0,0 // mulps 0x5b95(%edx),%xmm0
+ .byte 102,15,111,138,165,91,0,0 // movdqa 0x5ba5(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,68,91,0,0 // mulps 0x5b44(%edx),%xmm1
- .byte 102,15,111,146,84,91,0,0 // movdqa 0x5b54(%edx),%xmm2
+ .byte 15,89,138,181,91,0,0 // mulps 0x5bb5(%edx),%xmm1
+ .byte 102,15,111,146,197,91,0,0 // movdqa 0x5bc5(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,100,91,0,0 // mulps 0x5b64(%edx),%xmm2
- .byte 102,15,219,154,116,91,0,0 // pand 0x5b74(%edx),%xmm3
+ .byte 15,89,146,213,91,0,0 // mulps 0x5bd5(%edx),%xmm2
+ .byte 102,15,219,154,229,91,0,0 // pand 0x5be5(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,132,91,0,0 // mulps 0x5b84(%edx),%xmm3
+ .byte 15,89,154,245,91,0,0 // mulps 0x5bf5(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 82 // push %edx
@@ -67249,22 +67923,22 @@ _sk_load_4444_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 448f <_sk_load_4444_sse2+0xd1>
+ .byte 116,46 // je 460e <_sk_load_4444_sse2+0xd1>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 447d <_sk_load_4444_sse2+0xbf>
+ .byte 116,19 // je 45fc <_sk_load_4444_sse2+0xbf>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,131 // jne 43f2 <_sk_load_4444_sse2+0x34>
+ .byte 117,131 // jne 4571 <_sk_load_4444_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,99,255,255,255 // jmp 43f2 <_sk_load_4444_sse2+0x34>
+ .byte 233,99,255,255,255 // jmp 4571 <_sk_load_4444_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,222 // movd %esi,%xmm3
- .byte 233,86,255,255,255 // jmp 43f2 <_sk_load_4444_sse2+0x34>
+ .byte 233,86,255,255,255 // jmp 4571 <_sk_load_4444_sse2+0x34>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -67276,7 +67950,7 @@ _sk_load_4444_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 44aa <_sk_load_4444_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4629 <_sk_load_4444_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67288,27 +67962,27 @@ _sk_load_4444_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,128,0,0,0 // jne 454b <_sk_load_4444_dst_sse2+0xaf>
+ .byte 15,133,128,0,0,0 // jne 46ca <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,182,90,0,0 // movdqa 0x5ab6(%edx),%xmm5
+ .byte 102,15,111,170,39,91,0,0 // movdqa 0x5b27(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,198,90,0,0 // mulps 0x5ac6(%edx),%xmm5
+ .byte 15,89,170,55,91,0,0 // mulps 0x5b37(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,214,90,0,0 // movdqa 0x5ad6(%edx),%xmm5
+ .byte 102,15,111,170,71,91,0,0 // movdqa 0x5b47(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,230,90,0,0 // mulps 0x5ae6(%edx),%xmm5
+ .byte 15,89,170,87,91,0,0 // mulps 0x5b57(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,111,170,246,90,0,0 // movdqa 0x5af6(%edx),%xmm5
+ .byte 102,15,111,170,103,91,0,0 // movdqa 0x5b67(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,6,91,0,0 // mulps 0x5b06(%edx),%xmm5
+ .byte 15,89,170,119,91,0,0 // mulps 0x5b77(%edx),%xmm5
.byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
- .byte 102,15,219,162,22,91,0,0 // pand 0x5b16(%edx),%xmm4
+ .byte 102,15,219,162,135,91,0,0 // pand 0x5b87(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,38,91,0,0 // mulps 0x5b26(%edx),%xmm4
+ .byte 15,89,162,151,91,0,0 // mulps 0x5b97(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -67323,22 +67997,22 @@ _sk_load_4444_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 4585 <_sk_load_4444_dst_sse2+0xe9>
+ .byte 116,50 // je 4704 <_sk_load_4444_dst_sse2+0xe9>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 4573 <_sk_load_4444_dst_sse2+0xd7>
+ .byte 116,23 // je 46f2 <_sk_load_4444_dst_sse2+0xd7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,111,255,255,255 // jne 44d4 <_sk_load_4444_dst_sse2+0x38>
+ .byte 15,133,111,255,255,255 // jne 4653 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,79,255,255,255 // jmp 44d4 <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,79,255,255,255 // jmp 4653 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,66,255,255,255 // jmp 44d4 <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,66,255,255,255 // jmp 4653 <_sk_load_4444_dst_sse2+0x38>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -67374,25 +68048,25 @@ _sk_gather_4444_sse2:
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
.byte 102,15,196,217,3 // pinsrw $0x3,%ecx,%xmm3
- .byte 232,0,0,0,0 // call 4612 <_sk_gather_4444_sse2+0x80>
+ .byte 232,0,0,0,0 // call 4791 <_sk_gather_4444_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,129,206,89,0,0 // movdqa 0x59ce(%ecx),%xmm0
+ .byte 102,15,111,129,63,90,0,0 // movdqa 0x5a3f(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,222,89,0,0 // mulps 0x59de(%ecx),%xmm0
- .byte 102,15,111,137,238,89,0,0 // movdqa 0x59ee(%ecx),%xmm1
+ .byte 15,89,129,79,90,0,0 // mulps 0x5a4f(%ecx),%xmm0
+ .byte 102,15,111,137,95,90,0,0 // movdqa 0x5a5f(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,137,254,89,0,0 // mulps 0x59fe(%ecx),%xmm1
- .byte 102,15,111,145,14,90,0,0 // movdqa 0x5a0e(%ecx),%xmm2
+ .byte 15,89,137,111,90,0,0 // mulps 0x5a6f(%ecx),%xmm1
+ .byte 102,15,111,145,127,90,0,0 // movdqa 0x5a7f(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,145,30,90,0,0 // mulps 0x5a1e(%ecx),%xmm2
- .byte 102,15,219,153,46,90,0,0 // pand 0x5a2e(%ecx),%xmm3
+ .byte 15,89,145,143,90,0,0 // mulps 0x5a8f(%ecx),%xmm2
+ .byte 102,15,219,153,159,90,0,0 // pand 0x5a9f(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,153,62,90,0,0 // mulps 0x5a3e(%ecx),%xmm3
+ .byte 15,89,153,175,90,0,0 // mulps 0x5aaf(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 81 // push %ecx
@@ -67412,7 +68086,7 @@ _sk_store_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 468f <_sk_store_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 480e <_sk_store_4444_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67422,7 +68096,7 @@ _sk_store_4444_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,209,89,0,0 // movaps 0x59d1(%edi),%xmm4
+ .byte 15,40,167,66,90,0,0 // movaps 0x5a42(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -67448,7 +68122,7 @@ _sk_store_4444_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 4732 <_sk_store_4444_sse2+0xb1>
+ .byte 117,34 // jne 48b1 <_sk_store_4444_sse2+0xb1>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -67468,20 +68142,20 @@ _sk_store_4444_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 4768 <_sk_store_4444_sse2+0xe7>
+ .byte 116,37 // je 48e7 <_sk_store_4444_sse2+0xe7>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 4757 <_sk_store_4444_sse2+0xd6>
+ .byte 116,15 // je 48d6 <_sk_store_4444_sse2+0xd6>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 471f <_sk_store_4444_sse2+0x9e>
+ .byte 117,210 // jne 489e <_sk_store_4444_sse2+0x9e>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 471f <_sk_store_4444_sse2+0x9e>
+ .byte 235,183 // jmp 489e <_sk_store_4444_sse2+0x9e>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 471f <_sk_store_4444_sse2+0x9e>
+ .byte 235,173 // jmp 489e <_sk_store_4444_sse2+0x9e>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -67493,7 +68167,7 @@ _sk_load_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4780 <_sk_load_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 48ff <_sk_load_8888_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67505,13 +68179,13 @@ _sk_load_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4804 <_sk_load_8888_sse2+0x92>
+ .byte 117,102 // jne 4983 <_sk_load_8888_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,146,240,88,0,0 // movdqa 0x58f0(%edx),%xmm2
+ .byte 102,15,111,146,97,89,0,0 // movdqa 0x5961(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,0,89,0,0 // movaps 0x5900(%edx),%xmm4
+ .byte 15,40,162,113,89,0,0 // movaps 0x5971(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67539,18 +68213,18 @@ _sk_load_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 482f <_sk_load_8888_sse2+0xbd>
+ .byte 116,35 // je 49ae <_sk_load_8888_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4825 <_sk_load_8888_sse2+0xb3>
+ .byte 116,16 // je 49a4 <_sk_load_8888_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 47a3 <_sk_load_8888_sse2+0x31>
+ .byte 117,137 // jne 4922 <_sk_load_8888_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 47a3 <_sk_load_8888_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4922 <_sk_load_8888_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 47a3 <_sk_load_8888_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4922 <_sk_load_8888_sse2+0x31>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -67562,7 +68236,7 @@ _sk_load_8888_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4847 <_sk_load_8888_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 49c6 <_sk_load_8888_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67574,13 +68248,13 @@ _sk_load_8888_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 48db <_sk_load_8888_dst_sse2+0xa2>
+ .byte 117,118 // jne 4a5a <_sk_load_8888_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,73,88,0,0 // movdqa 0x5849(%edx),%xmm5
+ .byte 102,15,111,170,186,88,0,0 // movdqa 0x58ba(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,89,88,0,0 // movaps 0x5859(%edx),%xmm7
+ .byte 15,40,186,202,88,0,0 // movaps 0x58ca(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -67612,18 +68286,18 @@ _sk_load_8888_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 490a <_sk_load_8888_dst_sse2+0xd1>
+ .byte 116,39 // je 4a89 <_sk_load_8888_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4900 <_sk_load_8888_dst_sse2+0xc7>
+ .byte 116,20 // je 4a7f <_sk_load_8888_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 486a <_sk_load_8888_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 49e9 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 486a <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 49e9 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 486a <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 49e9 <_sk_load_8888_dst_sse2+0x31>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -67657,16 +68331,16 @@ _sk_gather_8888_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 498a <_sk_gather_8888_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4b09 <_sk_gather_8888_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,145,38,87,0,0 // movdqa 0x5726(%ecx),%xmm2
+ .byte 102,15,111,145,151,87,0,0 // movdqa 0x5797(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,161,54,87,0,0 // movaps 0x5736(%ecx),%xmm4
+ .byte 15,40,161,167,87,0,0 // movaps 0x57a7(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67700,7 +68374,7 @@ _sk_store_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4a05 <_sk_store_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4b84 <_sk_store_8888_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67710,7 +68384,7 @@ _sk_store_8888_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,203,86,0,0 // movaps 0x56cb(%edi),%xmm4
+ .byte 15,40,167,60,87,0,0 // movaps 0x573c(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -67730,7 +68404,7 @@ _sk_store_8888_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4a82 <_sk_store_8888_sse2+0x8b>
+ .byte 117,24 // jne 4c01 <_sk_store_8888_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -67745,17 +68419,17 @@ _sk_store_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4aa6 <_sk_store_8888_sse2+0xaf>
+ .byte 116,28 // je 4c25 <_sk_store_8888_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4a9f <_sk_store_8888_sse2+0xa8>
+ .byte 116,16 // je 4c1e <_sk_store_8888_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4a6f <_sk_store_8888_sse2+0x78>
+ .byte 117,219 // jne 4bee <_sk_store_8888_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4a6f <_sk_store_8888_sse2+0x78>
+ .byte 235,201 // jmp 4bee <_sk_store_8888_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4a6f <_sk_store_8888_sse2+0x78>
+ .byte 235,194 // jmp 4bee <_sk_store_8888_sse2+0x78>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -67767,7 +68441,7 @@ _sk_load_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4abb <_sk_load_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4c3a <_sk_load_bgra_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67779,13 +68453,13 @@ _sk_load_bgra_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4b3f <_sk_load_bgra_sse2+0x92>
+ .byte 117,102 // jne 4cbe <_sk_load_bgra_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,130,37,86,0,0 // movdqa 0x5625(%edx),%xmm0
+ .byte 102,15,111,130,150,86,0,0 // movdqa 0x5696(%edx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,162,53,86,0,0 // movaps 0x5635(%edx),%xmm4
+ .byte 15,40,162,166,86,0,0 // movaps 0x56a6(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67813,18 +68487,18 @@ _sk_load_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 4b6a <_sk_load_bgra_sse2+0xbd>
+ .byte 116,35 // je 4ce9 <_sk_load_bgra_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4b60 <_sk_load_bgra_sse2+0xb3>
+ .byte 116,16 // je 4cdf <_sk_load_bgra_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 4ade <_sk_load_bgra_sse2+0x31>
+ .byte 117,137 // jne 4c5d <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 4ade <_sk_load_bgra_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4c5d <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 4ade <_sk_load_bgra_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4c5d <_sk_load_bgra_sse2+0x31>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -67836,7 +68510,7 @@ _sk_load_bgra_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4b82 <_sk_load_bgra_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4d01 <_sk_load_bgra_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67848,13 +68522,13 @@ _sk_load_bgra_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4c16 <_sk_load_bgra_dst_sse2+0xa2>
+ .byte 117,118 // jne 4d95 <_sk_load_bgra_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,126,85,0,0 // movdqa 0x557e(%edx),%xmm5
+ .byte 102,15,111,170,239,85,0,0 // movdqa 0x55ef(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,142,85,0,0 // movaps 0x558e(%edx),%xmm7
+ .byte 15,40,186,255,85,0,0 // movaps 0x55ff(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -67886,18 +68560,18 @@ _sk_load_bgra_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4c45 <_sk_load_bgra_dst_sse2+0xd1>
+ .byte 116,39 // je 4dc4 <_sk_load_bgra_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4c3b <_sk_load_bgra_dst_sse2+0xc7>
+ .byte 116,20 // je 4dba <_sk_load_bgra_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 4ba5 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 4d24 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 4ba5 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 4d24 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 4ba5 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 4d24 <_sk_load_bgra_dst_sse2+0x31>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -67931,16 +68605,16 @@ _sk_gather_bgra_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 4cc5 <_sk_gather_bgra_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4e44 <_sk_gather_bgra_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,129,91,84,0,0 // movdqa 0x545b(%ecx),%xmm0
+ .byte 102,15,111,129,204,84,0,0 // movdqa 0x54cc(%ecx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,161,107,84,0,0 // movaps 0x546b(%ecx),%xmm4
+ .byte 15,40,161,220,84,0,0 // movaps 0x54dc(%ecx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67974,7 +68648,7 @@ _sk_store_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4d40 <_sk_store_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4ebf <_sk_store_bgra_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67984,7 +68658,7 @@ _sk_store_bgra_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,0,84,0,0 // movaps 0x5400(%edi),%xmm4
+ .byte 15,40,167,113,84,0,0 // movaps 0x5471(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -68004,7 +68678,7 @@ _sk_store_bgra_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4dbd <_sk_store_bgra_sse2+0x8b>
+ .byte 117,24 // jne 4f3c <_sk_store_bgra_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -68019,17 +68693,17 @@ _sk_store_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4de1 <_sk_store_bgra_sse2+0xaf>
+ .byte 116,28 // je 4f60 <_sk_store_bgra_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4dda <_sk_store_bgra_sse2+0xa8>
+ .byte 116,16 // je 4f59 <_sk_store_bgra_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4daa <_sk_store_bgra_sse2+0x78>
+ .byte 117,219 // jne 4f29 <_sk_store_bgra_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4daa <_sk_store_bgra_sse2+0x78>
+ .byte 235,201 // jmp 4f29 <_sk_store_bgra_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4daa <_sk_store_bgra_sse2+0x78>
+ .byte 235,194 // jmp 4f29 <_sk_store_bgra_sse2+0x78>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -68041,7 +68715,7 @@ _sk_load_f16_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,92 // sub $0x5c,%esp
- .byte 232,0,0,0,0 // call 4df6 <_sk_load_f16_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4f75 <_sk_load_f16_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -68053,7 +68727,7 @@ _sk_load_f16_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,160,1,0,0 // jne 4fb8 <_sk_load_f16_sse2+0x1d0>
+ .byte 15,133,160,1,0,0 // jne 5137 <_sk_load_f16_sse2+0x1d0>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -68081,7 +68755,7 @@ _sk_load_f16_sse2:
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,154,90,83,0,0 // movdqa 0x535a(%edx),%xmm3
+ .byte 102,15,111,154,203,83,0,0 // movdqa 0x53cb(%edx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -68114,15 +68788,15 @@ _sk_load_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,154,106,83,0,0 // movdqa 0x536a(%edx),%xmm3
+ .byte 102,15,111,154,219,83,0,0 // movdqa 0x53db(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,154,122,83,0,0 // movdqa 0x537a(%edx),%xmm3
+ .byte 102,15,111,154,235,83,0,0 // movdqa 0x53eb(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,154,138,83,0,0 // movdqa 0x538a(%edx),%xmm3
+ .byte 102,15,111,154,251,83,0,0 // movdqa 0x53fb(%edx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -68154,12 +68828,12 @@ _sk_load_f16_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,89,254,255,255 // je 4e23 <_sk_load_f16_sse2+0x3b>
+ .byte 15,132,89,254,255,255 // je 4fa2 <_sk_load_f16_sse2+0x3b>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,74,254,255,255 // jb 4e23 <_sk_load_f16_sse2+0x3b>
+ .byte 15,130,74,254,255,255 // jb 4fa2 <_sk_load_f16_sse2+0x3b>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,63,254,255,255 // jmp 4e23 <_sk_load_f16_sse2+0x3b>
+ .byte 233,63,254,255,255 // jmp 4fa2 <_sk_load_f16_sse2+0x3b>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -68175,7 +68849,7 @@ _sk_load_f16_dst_sse2:
.byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp)
.byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
.byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
- .byte 232,0,0,0,0 // call 500c <_sk_load_f16_dst_sse2+0x28>
+ .byte 232,0,0,0,0 // call 518b <_sk_load_f16_dst_sse2+0x28>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -68187,7 +68861,7 @@ _sk_load_f16_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,206,1,0,0 // jne 51fc <_sk_load_f16_dst_sse2+0x218>
+ .byte 15,133,206,1,0,0 // jne 537b <_sk_load_f16_dst_sse2+0x218>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -68215,7 +68889,7 @@ _sk_load_f16_dst_sse2:
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
- .byte 102,15,111,154,132,81,0,0 // movdqa 0x5184(%edx),%xmm3
+ .byte 102,15,111,154,245,81,0,0 // movdqa 0x51f5(%edx),%xmm3
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,239,226 // pxor %xmm2,%xmm4
@@ -68223,13 +68897,13 @@ _sk_load_f16_dst_sse2:
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,146,164,81,0,0 // movdqa 0x51a4(%edx),%xmm2
+ .byte 102,15,111,146,21,82,0,0 // movdqa 0x5215(%edx),%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
.byte 102,15,239,226 // pxor %xmm2,%xmm4
- .byte 102,15,111,178,180,81,0,0 // movdqa 0x51b4(%edx),%xmm6
+ .byte 102,15,111,178,37,82,0,0 // movdqa 0x5225(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
- .byte 102,15,111,146,148,81,0,0 // movdqa 0x5194(%edx),%xmm2
+ .byte 102,15,111,146,5,82,0,0 // movdqa 0x5205(%edx),%xmm2
.byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,223,249 // pandn %xmm1,%xmm7
@@ -68297,12 +68971,12 @@ _sk_load_f16_dst_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,43,254,255,255 // je 5039 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,132,43,254,255,255 // je 51b8 <_sk_load_f16_dst_sse2+0x55>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,28,254,255,255 // jb 5039 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,130,28,254,255,255 // jb 51b8 <_sk_load_f16_dst_sse2+0x55>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,17,254,255,255 // jmp 5039 <_sk_load_f16_dst_sse2+0x55>
+ .byte 233,17,254,255,255 // jmp 51b8 <_sk_load_f16_dst_sse2+0x55>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -68340,7 +69014,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,194 // movd %xmm0,%edx
.byte 102,15,110,68,209,4 // movd 0x4(%ecx,%edx,8),%xmm0
.byte 102,15,110,60,209 // movd (%ecx,%edx,8),%xmm7
- .byte 232,0,0,0,0 // call 52b6 <_sk_gather_f16_sse2+0x8e>
+ .byte 232,0,0,0,0 // call 5435 <_sk_gather_f16_sse2+0x8e>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,227 // punpckldq %xmm3,%xmm4
@@ -68373,7 +69047,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,153,26,79,0,0 // movdqa 0x4f1a(%ecx),%xmm3
+ .byte 102,15,111,153,139,79,0,0 // movdqa 0x4f8b(%ecx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -68406,15 +69080,15 @@ _sk_gather_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,153,42,79,0,0 // movdqa 0x4f2a(%ecx),%xmm3
+ .byte 102,15,111,153,155,79,0,0 // movdqa 0x4f9b(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,153,58,79,0,0 // movdqa 0x4f3a(%ecx),%xmm3
+ .byte 102,15,111,153,171,79,0,0 // movdqa 0x4fab(%ecx),%xmm3
.byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,153,74,79,0,0 // movdqa 0x4f4a(%ecx),%xmm3
+ .byte 102,15,111,153,187,79,0,0 // movdqa 0x4fbb(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -68453,20 +69127,20 @@ _sk_store_f16_sse2:
.byte 131,236,80 // sub $0x50,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 5479 <_sk_store_f16_sse2+0x15>
+ .byte 232,0,0,0,0 // call 55f8 <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,151,77,0,0 // movdqa 0x4d97(%eax),%xmm6
+ .byte 102,15,111,176,8,78,0,0 // movdqa 0x4e08(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
.byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,167,77,0,0 // movdqa 0x4da7(%eax),%xmm4
+ .byte 102,15,111,160,24,78,0,0 // movdqa 0x4e18(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,183,77,0,0 // movdqa 0x4db7(%eax),%xmm7
+ .byte 102,15,111,184,40,78,0,0 // movdqa 0x4e28(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
@@ -68528,7 +69202,7 @@ _sk_store_f16_sse2:
.byte 3,55 // add (%edi),%esi
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,53 // jne 55eb <_sk_store_f16_sse2+0x187>
+ .byte 117,53 // jne 576a <_sk_store_f16_sse2+0x187>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,98,197 // punpckldq %xmm5,%xmm0
.byte 243,15,127,4,214 // movdqu %xmm0,(%esi,%edx,8)
@@ -68551,13 +69225,13 @@ _sk_store_f16_sse2:
.byte 102,15,98,213 // punpckldq %xmm5,%xmm2
.byte 102,15,214,20,214 // movq %xmm2,(%esi,%edx,8)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,208 // je 55cd <_sk_store_f16_sse2+0x169>
+ .byte 116,208 // je 574c <_sk_store_f16_sse2+0x169>
.byte 102,15,23,84,214,8 // movhpd %xmm2,0x8(%esi,%edx,8)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,197 // jb 55cd <_sk_store_f16_sse2+0x169>
+ .byte 114,197 // jb 574c <_sk_store_f16_sse2+0x169>
.byte 102,15,106,205 // punpckhdq %xmm5,%xmm1
.byte 102,15,214,76,214,16 // movq %xmm1,0x10(%esi,%edx,8)
- .byte 235,185 // jmp 55cd <_sk_store_f16_sse2+0x169>
+ .byte 235,185 // jmp 574c <_sk_store_f16_sse2+0x169>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -68580,9 +69254,9 @@ _sk_load_u16_be_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 193,230,2 // shl $0x2,%esi
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 563f <_sk_load_u16_be_sse2+0x2b>
+ .byte 232,0,0,0,0 // call 57be <_sk_load_u16_be_sse2+0x2b>
.byte 90 // pop %edx
- .byte 15,133,11,1,0,0 // jne 5751 <_sk_load_u16_be_sse2+0x13d>
+ .byte 15,133,11,1,0,0 // jne 58d0 <_sk_load_u16_be_sse2+0x13d>
.byte 102,15,16,4,119 // movupd (%edi,%esi,2),%xmm0
.byte 243,15,111,76,119,16 // movdqu 0x10(%edi,%esi,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -68603,7 +69277,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,1,76,0,0 // movaps 0x4c01(%edx),%xmm4
+ .byte 15,40,162,114,76,0,0 // movaps 0x4c72(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -68653,12 +69327,12 @@ _sk_load_u16_be_sse2:
.byte 242,15,16,4,119 // movsd (%edi,%esi,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,238,254,255,255 // je 5651 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,132,238,254,255,255 // je 57d0 <_sk_load_u16_be_sse2+0x3d>
.byte 102,15,22,68,119,8 // movhpd 0x8(%edi,%esi,2),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,223,254,255,255 // jb 5651 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,130,223,254,255,255 // jb 57d0 <_sk_load_u16_be_sse2+0x3d>
.byte 243,15,126,76,119,16 // movq 0x10(%edi,%esi,2),%xmm1
- .byte 233,212,254,255,255 // jmp 5651 <_sk_load_u16_be_sse2+0x3d>
+ .byte 233,212,254,255,255 // jmp 57d0 <_sk_load_u16_be_sse2+0x3d>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -68680,9 +69354,9 @@ _sk_load_rgb_u16_be_sse2:
.byte 3,50 // add (%edx),%esi
.byte 107,25,3 // imul $0x3,(%ecx),%ebx
.byte 133,255 // test %edi,%edi
- .byte 232,0,0,0,0 // call 57a6 <_sk_load_rgb_u16_be_sse2+0x29>
+ .byte 232,0,0,0,0 // call 5925 <_sk_load_rgb_u16_be_sse2+0x29>
.byte 90 // pop %edx
- .byte 15,133,240,0,0,0 // jne 589d <_sk_load_rgb_u16_be_sse2+0x120>
+ .byte 15,133,240,0,0,0 // jne 5a1c <_sk_load_rgb_u16_be_sse2+0x120>
.byte 243,15,111,20,94 // movdqu (%esi,%ebx,2),%xmm2
.byte 243,15,111,92,94,8 // movdqu 0x8(%esi,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -68707,7 +69381,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,170,170,74,0,0 // movaps 0x4aaa(%edx),%xmm5
+ .byte 15,40,170,27,75,0,0 // movaps 0x4b1b(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -68733,7 +69407,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,186,74,0,0 // movaps 0x4aba(%edx),%xmm3
+ .byte 15,40,154,43,75,0,0 // movaps 0x4b2b(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -68747,20 +69421,20 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,196,84,94,4,2 // pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,13 // jne 58bf <_sk_load_rgb_u16_be_sse2+0x142>
+ .byte 117,13 // jne 5a3e <_sk_load_rgb_u16_be_sse2+0x142>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,16,255,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,16,255,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,110,68,94,6 // movd 0x6(%esi,%ebx,2),%xmm0
.byte 102,15,196,68,94,10,2 // pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,18 // jb 58e7 <_sk_load_rgb_u16_be_sse2+0x16a>
+ .byte 114,18 // jb 5a66 <_sk_load_rgb_u16_be_sse2+0x16a>
.byte 102,15,110,92,94,12 // movd 0xc(%esi,%ebx,2),%xmm3
.byte 102,15,196,92,94,16,2 // pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- .byte 233,232,254,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,232,254,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,223,254,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,223,254,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -68772,9 +69446,9 @@ _sk_store_u16_be_sse2:
.byte 86 // push %esi
.byte 131,236,16 // sub $0x10,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 5901 <_sk_store_u16_be_sse2+0x11>
+ .byte 232,0,0,0,0 // call 5a80 <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,111,73,0,0 // movaps 0x496f(%eax),%xmm6
+ .byte 15,40,176,224,73,0,0 // movaps 0x49e0(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -68827,7 +69501,7 @@ _sk_store_u16_be_sse2:
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 193,226,2 // shl $0x2,%edx
.byte 133,255 // test %edi,%edi
- .byte 117,45 // jne 5a03 <_sk_store_u16_be_sse2+0x113>
+ .byte 117,45 // jne 5b82 <_sk_store_u16_be_sse2+0x113>
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,98,221 // punpckldq %xmm5,%xmm3
.byte 243,15,127,28,86 // movdqu %xmm3,(%esi,%edx,2)
@@ -68848,13 +69522,13 @@ _sk_store_u16_be_sse2:
.byte 102,15,98,245 // punpckldq %xmm5,%xmm6
.byte 102,15,214,52,86 // movq %xmm6,(%esi,%edx,2)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,216 // je 59ed <_sk_store_u16_be_sse2+0xfd>
+ .byte 116,216 // je 5b6c <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,23,116,86,8 // movhpd %xmm6,0x8(%esi,%edx,2)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,205 // jb 59ed <_sk_store_u16_be_sse2+0xfd>
+ .byte 114,205 // jb 5b6c <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,106,229 // punpckhdq %xmm5,%xmm4
.byte 102,15,214,100,86,16 // movq %xmm4,0x10(%esi,%edx,2)
- .byte 235,193 // jmp 59ed <_sk_store_u16_be_sse2+0xfd>
+ .byte 235,193 // jmp 5b6c <_sk_store_u16_be_sse2+0xfd>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -68877,7 +69551,7 @@ _sk_load_f32_sse2:
.byte 15,16,36,23 // movups (%edi,%edx,1),%xmm4
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,71 // jne 5aa3 <_sk_load_f32_sse2+0x77>
+ .byte 117,71 // jne 5c22 <_sk_load_f32_sse2+0x77>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,68,178,48 // movups 0x30(%edx,%esi,4),%xmm0
@@ -68905,17 +69579,17 @@ _sk_load_f32_sse2:
.byte 195 // ret
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 5ab3 <_sk_load_f32_sse2+0x87>
+ .byte 117,8 // jne 5c32 <_sk_load_f32_sse2+0x87>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 235,184 // jmp 5a6b <_sk_load_f32_sse2+0x3f>
+ .byte 235,184 // jmp 5bea <_sk_load_f32_sse2+0x3f>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 5ac4 <_sk_load_f32_sse2+0x98>
+ .byte 114,7 // jb 5c43 <_sk_load_f32_sse2+0x98>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,167 // jmp 5a6b <_sk_load_f32_sse2+0x3f>
+ .byte 235,167 // jmp 5bea <_sk_load_f32_sse2+0x3f>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,162 // jmp 5a6b <_sk_load_f32_sse2+0x3f>
+ .byte 235,162 // jmp 5bea <_sk_load_f32_sse2+0x3f>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -68941,7 +69615,7 @@ _sk_load_f32_dst_sse2:
.byte 15,16,52,23 // movups (%edi,%edx,1),%xmm6
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,97 // jne 5b65 <_sk_load_f32_dst_sse2+0x9c>
+ .byte 117,97 // jne 5ce4 <_sk_load_f32_dst_sse2+0x9c>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,84,178,48 // movups 0x30(%edx,%esi,4),%xmm2
@@ -68975,17 +69649,17 @@ _sk_load_f32_dst_sse2:
.byte 195 // ret
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 5b75 <_sk_load_f32_dst_sse2+0xac>
+ .byte 117,8 // jne 5cf4 <_sk_load_f32_dst_sse2+0xac>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,158 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,158 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 5b86 <_sk_load_f32_dst_sse2+0xbd>
+ .byte 114,7 // jb 5d05 <_sk_load_f32_dst_sse2+0xbd>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,141 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,141 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,136 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,136 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -69023,7 +69697,7 @@ _sk_store_f32_sse2:
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 102,15,20,239 // unpcklpd %xmm7,%xmm5
.byte 133,255 // test %edi,%edi
- .byte 117,40 // jne 5c11 <_sk_store_f32_sse2+0x86>
+ .byte 117,40 // jne 5d90 <_sk_store_f32_sse2+0x86>
.byte 102,15,21,247 // unpckhpd %xmm7,%xmm6
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
@@ -69040,12 +69714,12 @@ _sk_store_f32_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,232 // je 5bfe <_sk_store_f32_sse2+0x73>
+ .byte 116,232 // je 5d7d <_sk_store_f32_sse2+0x73>
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,222 // jb 5bfe <_sk_store_f32_sse2+0x73>
+ .byte 114,222 // jb 5d7d <_sk_store_f32_sse2+0x73>
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
- .byte 235,214 // jmp 5bfe <_sk_store_f32_sse2+0x73>
+ .byte 235,214 // jmp 5d7d <_sk_store_f32_sse2+0x73>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -69106,7 +69780,7 @@ _sk_repeat_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ca5 <_sk_repeat_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e24 <_sk_repeat_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69117,7 +69791,7 @@ _sk_repeat_x_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,219,69,0,0 // andps 0x45db(%ecx),%xmm6
+ .byte 15,84,177,76,70,0,0 // andps 0x464c(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69144,7 +69818,7 @@ _sk_repeat_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5d0b <_sk_repeat_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e8a <_sk_repeat_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69155,7 +69829,7 @@ _sk_repeat_y_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,133,69,0,0 // andps 0x4585(%ecx),%xmm6
+ .byte 15,84,177,246,69,0,0 // andps 0x45f6(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69182,7 +69856,7 @@ _sk_mirror_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5d71 <_sk_mirror_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5ef0 <_sk_mirror_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69191,13 +69865,13 @@ _sk_mirror_x_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,177,175,74,0,0 // mulss 0x4aaf(%ecx),%xmm6
+ .byte 243,15,89,177,32,75,0,0 // mulss 0x4b20(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,47,69,0,0 // andps 0x452f(%ecx),%xmm6
+ .byte 15,84,177,160,69,0,0 // andps 0x45a0(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69228,7 +69902,7 @@ _sk_mirror_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5df6 <_sk_mirror_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5f75 <_sk_mirror_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69237,13 +69911,13 @@ _sk_mirror_y_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,177,46,74,0,0 // mulss 0x4a2e(%ecx),%xmm6
+ .byte 243,15,89,177,159,74,0,0 // mulss 0x4a9f(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,186,68,0,0 // andps 0x44ba(%ecx),%xmm6
+ .byte 15,84,177,43,69,0,0 // andps 0x452b(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69274,12 +69948,12 @@ _sk_clamp_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5e7b <_sk_clamp_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5ffa <_sk_clamp_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,93,160,69,68,0,0 // minps 0x4445(%eax),%xmm4
+ .byte 15,93,160,182,68,0,0 // minps 0x44b6(%eax),%xmm4
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -69297,14 +69971,14 @@ _sk_repeat_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5eab <_sk_repeat_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 602a <_sk_repeat_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 243,15,91,224 // cvttps2dq %xmm0,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,84,168,37,68,0,0 // andps 0x4425(%eax),%xmm5
+ .byte 15,84,168,150,68,0,0 // andps 0x4496(%eax),%xmm5
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -69323,17 +69997,17 @@ _sk_mirror_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ee6 <_sk_mirror_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6065 <_sk_mirror_x_1_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,161,250,67,0,0 // movaps 0x43fa(%ecx),%xmm4
+ .byte 15,40,161,107,68,0,0 // movaps 0x446b(%ecx),%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,169,10,68,0,0 // movaps 0x440a(%ecx),%xmm5
+ .byte 15,40,169,123,68,0,0 // movaps 0x447b(%ecx),%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,169,26,68,0,0 // andps 0x441a(%ecx),%xmm5
+ .byte 15,84,169,139,68,0,0 // andps 0x448b(%ecx),%xmm5
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
@@ -69358,13 +70032,13 @@ _sk_luminance_to_alpha_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 5f44 <_sk_luminance_to_alpha_sse2+0xe>
+ .byte 232,0,0,0,0 // call 60c3 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,128,204,67,0,0 // mulps 0x43cc(%eax),%xmm0
- .byte 15,89,136,220,67,0,0 // mulps 0x43dc(%eax),%xmm1
+ .byte 15,89,128,61,68,0,0 // mulps 0x443d(%eax),%xmm0
+ .byte 15,89,136,77,68,0,0 // mulps 0x444d(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,152,236,67,0,0 // mulps 0x43ec(%eax),%xmm3
+ .byte 15,89,152,93,68,0,0 // mulps 0x445d(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -69754,7 +70428,7 @@ _sk_evenly_spaced_gradient_sse2:
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 63e1 <_sk_evenly_spaced_gradient_sse2+0x12>
+ .byte 232,0,0,0,0 // call 6560 <_sk_evenly_spaced_gradient_sse2+0x12>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -69765,12 +70439,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,95,63,0,0 // movdqa 0x3f5f(%edx),%xmm2
+ .byte 102,15,111,146,208,63,0,0 // movdqa 0x3fd0(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,111,63,0,0 // por 0x3f6f(%edx),%xmm2
+ .byte 102,15,235,146,224,63,0,0 // por 0x3fe0(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,127,63,0,0 // por 0x3f7f(%edx),%xmm1
- .byte 15,88,138,143,63,0,0 // addps 0x3f8f(%edx),%xmm1
+ .byte 102,15,235,138,240,63,0,0 // por 0x3ff0(%edx),%xmm1
+ .byte 15,88,138,0,64,0,0 // addps 0x4000(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -69877,18 +70551,18 @@ _sk_gauss_a_to_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6597 <_sk_gauss_a_to_rgba_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6716 <_sk_gauss_a_to_rgba_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,128,233,61,0,0 // movaps 0x3de9(%eax),%xmm0
+ .byte 15,40,128,90,62,0,0 // movaps 0x3e5a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,249,61,0,0 // addps 0x3df9(%eax),%xmm0
+ .byte 15,88,128,106,62,0,0 // addps 0x3e6a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,9,62,0,0 // addps 0x3e09(%eax),%xmm0
+ .byte 15,88,128,122,62,0,0 // addps 0x3e7a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,25,62,0,0 // addps 0x3e19(%eax),%xmm0
+ .byte 15,88,128,138,62,0,0 // addps 0x3e8a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,41,62,0,0 // addps 0x3e29(%eax),%xmm0
+ .byte 15,88,128,154,62,0,0 // addps 0x3e9a(%eax),%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
@@ -69911,7 +70585,7 @@ _sk_gradient_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 65f2 <_sk_gradient_sse2+0xe>
+ .byte 232,0,0,0,0 // call 6771 <_sk_gradient_sse2+0xe>
.byte 95 // pop %edi
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
@@ -69920,12 +70594,12 @@ _sk_gradient_sse2:
.byte 139,17 // mov (%ecx),%edx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,250,2 // cmp $0x2,%edx
- .byte 114,43 // jb 6634 <_sk_gradient_sse2+0x50>
+ .byte 114,43 // jb 67b3 <_sk_gradient_sse2+0x50>
.byte 139,113,36 // mov 0x24(%ecx),%esi
.byte 74 // dec %edx
.byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,151,222,61,0,0 // movaps 0x3dde(%edi),%xmm2
+ .byte 15,40,151,79,62,0,0 // movaps 0x3e4f(%edi),%xmm2
.byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -69933,7 +70607,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 131,198,4 // add $0x4,%esi
.byte 74 // dec %edx
- .byte 117,231 // jne 661b <_sk_gradient_sse2+0x37>
+ .byte 117,231 // jne 679a <_sk_gradient_sse2+0x37>
.byte 102,15,126,202 // movd %xmm1,%edx
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,214 // movd %xmm2,%esi
@@ -70085,7 +70759,7 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 682e <_sk_xy_to_unit_angle_sse2+0x18>
+ .byte 232,0,0,0,0 // call 69ad <_sk_xy_to_unit_angle_sse2+0x18>
.byte 88 // pop %eax
.byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
@@ -70100,30 +70774,30 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,178,59,0,0 // movaps 0x3bb2(%eax),%xmm0
+ .byte 15,40,128,35,60,0,0 // movaps 0x3c23(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,194,59,0,0 // addps 0x3bc2(%eax),%xmm0
+ .byte 15,88,128,51,60,0,0 // addps 0x3c33(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,210,59,0,0 // addps 0x3bd2(%eax),%xmm0
+ .byte 15,88,128,67,60,0,0 // addps 0x3c43(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,226,59,0,0 // addps 0x3be2(%eax),%xmm0
+ .byte 15,88,128,83,60,0,0 // addps 0x3c53(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,176,242,59,0,0 // movaps 0x3bf2(%eax),%xmm6
+ .byte 15,40,176,99,60,0,0 // movaps 0x3c63(%eax),%xmm6
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,2,60,0,0 // movaps 0x3c02(%eax),%xmm0
+ .byte 15,40,128,115,60,0,0 // movaps 0x3c73(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,18,60,0,0 // movaps 0x3c12(%eax),%xmm5
+ .byte 15,40,168,131,60,0,0 // movaps 0x3c83(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
@@ -70184,15 +70858,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 694b <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6aca <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,5,59,0,0 // mulps 0x3b05(%edx),%xmm4
- .byte 15,89,130,21,59,0,0 // mulps 0x3b15(%edx),%xmm0
+ .byte 15,89,162,118,59,0,0 // mulps 0x3b76(%edx),%xmm4
+ .byte 15,89,130,134,59,0,0 // mulps 0x3b86(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -70200,11 +70874,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,37,59,0,0 // xorps 0x3b25(%edx),%xmm4
+ .byte 15,87,162,150,59,0,0 // xorps 0x3b96(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,53,59,0,0 // mulps 0x3b35(%edx),%xmm5
+ .byte 15,89,170,166,59,0,0 // mulps 0x3ba6(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
@@ -70235,15 +70909,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 69e9 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6b68 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,167,58,0,0 // mulps 0x3aa7(%edx),%xmm4
- .byte 15,89,130,183,58,0,0 // mulps 0x3ab7(%edx),%xmm0
+ .byte 15,89,162,24,59,0,0 // mulps 0x3b18(%edx),%xmm4
+ .byte 15,89,130,40,59,0,0 // mulps 0x3b28(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -70251,11 +70925,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,199,58,0,0 // xorps 0x3ac7(%edx),%xmm4
+ .byte 15,87,162,56,59,0,0 // xorps 0x3b38(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,215,58,0,0 // mulps 0x3ad7(%edx),%xmm5
+ .byte 15,89,170,72,59,0,0 // mulps 0x3b48(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
@@ -70275,7 +70949,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6a61 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6be0 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -70284,7 +70958,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,169,111,58,0,0 // mulps 0x3a6f(%ecx),%xmm5
+ .byte 15,89,169,224,58,0,0 // mulps 0x3ae0(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -70292,7 +70966,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,129,127,58,0,0 // xorps 0x3a7f(%ecx),%xmm0
+ .byte 15,87,129,240,58,0,0 // xorps 0x3af0(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
@@ -70366,16 +71040,16 @@ _sk_save_xy_sse2:
.byte 131,236,24 // sub $0x18,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 6b3e <_sk_save_xy_sse2+0x12>
+ .byte 232,0,0,0,0 // call 6cbd <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,178,57,0,0 // movaps 0x39b2(%eax),%xmm4
+ .byte 15,40,160,35,58,0,0 // movaps 0x3a23(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,194,57,0,0 // movaps 0x39c2(%eax),%xmm2
+ .byte 15,40,144,51,58,0,0 // movaps 0x3a33(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -70450,15 +71124,15 @@ _sk_bilinear_nx_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c20 <_sk_bilinear_nx_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6d9f <_sk_bilinear_nx_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,240,56,0,0 // addps 0x38f0(%eax),%xmm0
- .byte 15,40,168,0,57,0,0 // movaps 0x3900(%eax),%xmm5
+ .byte 15,88,128,97,57,0,0 // addps 0x3961(%eax),%xmm0
+ .byte 15,40,168,113,57,0,0 // movaps 0x3971(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70479,14 +71153,14 @@ _sk_bilinear_px_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c63 <_sk_bilinear_px_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6de2 <_sk_bilinear_px_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,205,56,0,0 // addps 0x38cd(%eax),%xmm0
+ .byte 15,88,128,62,57,0,0 // addps 0x393e(%eax),%xmm0
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70506,15 +71180,15 @@ _sk_bilinear_ny_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c9c <_sk_bilinear_ny_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e1b <_sk_bilinear_ny_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,164,56,0,0 // addps 0x38a4(%eax),%xmm1
- .byte 15,40,168,180,56,0,0 // movaps 0x38b4(%eax),%xmm5
+ .byte 15,88,136,21,57,0,0 // addps 0x3915(%eax),%xmm1
+ .byte 15,40,168,37,57,0,0 // movaps 0x3925(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70535,14 +71209,14 @@ _sk_bilinear_py_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ce0 <_sk_bilinear_py_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e5f <_sk_bilinear_py_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,128,56,0,0 // addps 0x3880(%eax),%xmm1
+ .byte 15,88,136,241,56,0,0 // addps 0x38f1(%eax),%xmm1
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70562,20 +71236,20 @@ _sk_bicubic_n3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d1a <_sk_bicubic_n3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e99 <_sk_bicubic_n3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,86,56,0,0 // addps 0x3856(%eax),%xmm0
- .byte 15,40,168,102,56,0,0 // movaps 0x3866(%eax),%xmm5
+ .byte 15,88,128,199,56,0,0 // addps 0x38c7(%eax),%xmm0
+ .byte 15,40,168,215,56,0,0 // movaps 0x38d7(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,118,56,0,0 // mulps 0x3876(%eax),%xmm5
- .byte 15,88,168,134,56,0,0 // addps 0x3886(%eax),%xmm5
+ .byte 15,89,168,231,56,0,0 // mulps 0x38e7(%eax),%xmm5
+ .byte 15,88,168,247,56,0,0 // addps 0x38f7(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70596,23 +71270,23 @@ _sk_bicubic_n1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d74 <_sk_bicubic_n1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6ef3 <_sk_bicubic_n1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,60,56,0,0 // addps 0x383c(%eax),%xmm0
- .byte 15,40,168,76,56,0,0 // movaps 0x384c(%eax),%xmm5
+ .byte 15,88,128,173,56,0,0 // addps 0x38ad(%eax),%xmm0
+ .byte 15,40,168,189,56,0,0 // movaps 0x38bd(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,92,56,0,0 // movaps 0x385c(%eax),%xmm4
+ .byte 15,40,160,205,56,0,0 // movaps 0x38cd(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,108,56,0,0 // addps 0x386c(%eax),%xmm4
+ .byte 15,88,160,221,56,0,0 // addps 0x38dd(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,124,56,0,0 // addps 0x387c(%eax),%xmm4
+ .byte 15,88,160,237,56,0,0 // addps 0x38ed(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,140,56,0,0 // addps 0x388c(%eax),%xmm4
+ .byte 15,88,160,253,56,0,0 // addps 0x38fd(%eax),%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70632,22 +71306,22 @@ _sk_bicubic_p1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ddc <_sk_bicubic_p1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6f5b <_sk_bicubic_p1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,52,56,0,0 // movaps 0x3834(%eax),%xmm4
+ .byte 15,40,160,165,56,0,0 // movaps 0x38a5(%eax),%xmm4
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,176,68,56,0,0 // movaps 0x3844(%eax),%xmm6
+ .byte 15,40,176,181,56,0,0 // movaps 0x38b5(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,84,56,0,0 // addps 0x3854(%eax),%xmm6
+ .byte 15,88,176,197,56,0,0 // addps 0x38c5(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,100,56,0,0 // addps 0x3864(%eax),%xmm6
+ .byte 15,88,176,213,56,0,0 // addps 0x38d5(%eax),%xmm6
.byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70667,18 +71341,18 @@ _sk_bicubic_p3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6e39 <_sk_bicubic_p3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6fb8 <_sk_bicubic_p3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,23,56,0,0 // addps 0x3817(%eax),%xmm0
+ .byte 15,88,128,136,56,0,0 // addps 0x3888(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,39,56,0,0 // mulps 0x3827(%eax),%xmm4
- .byte 15,88,160,55,56,0,0 // addps 0x3837(%eax),%xmm4
+ .byte 15,89,160,152,56,0,0 // mulps 0x3898(%eax),%xmm4
+ .byte 15,88,160,168,56,0,0 // addps 0x38a8(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70699,20 +71373,20 @@ _sk_bicubic_n3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6e89 <_sk_bicubic_n3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 7008 <_sk_bicubic_n3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,247,55,0,0 // addps 0x37f7(%eax),%xmm1
- .byte 15,40,168,7,56,0,0 // movaps 0x3807(%eax),%xmm5
+ .byte 15,88,136,104,56,0,0 // addps 0x3868(%eax),%xmm1
+ .byte 15,40,168,120,56,0,0 // movaps 0x3878(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,23,56,0,0 // mulps 0x3817(%eax),%xmm5
- .byte 15,88,168,39,56,0,0 // addps 0x3827(%eax),%xmm5
+ .byte 15,89,168,136,56,0,0 // mulps 0x3888(%eax),%xmm5
+ .byte 15,88,168,152,56,0,0 // addps 0x3898(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70733,23 +71407,23 @@ _sk_bicubic_n1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ee4 <_sk_bicubic_n1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 7063 <_sk_bicubic_n1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,220,55,0,0 // addps 0x37dc(%eax),%xmm1
- .byte 15,40,168,236,55,0,0 // movaps 0x37ec(%eax),%xmm5
+ .byte 15,88,136,77,56,0,0 // addps 0x384d(%eax),%xmm1
+ .byte 15,40,168,93,56,0,0 // movaps 0x385d(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,252,55,0,0 // movaps 0x37fc(%eax),%xmm4
+ .byte 15,40,160,109,56,0,0 // movaps 0x386d(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,12,56,0,0 // addps 0x380c(%eax),%xmm4
+ .byte 15,88,160,125,56,0,0 // addps 0x387d(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,28,56,0,0 // addps 0x381c(%eax),%xmm4
+ .byte 15,88,160,141,56,0,0 // addps 0x388d(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,44,56,0,0 // addps 0x382c(%eax),%xmm4
+ .byte 15,88,160,157,56,0,0 // addps 0x389d(%eax),%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70769,22 +71443,22 @@ _sk_bicubic_p1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6f4d <_sk_bicubic_p1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 70cc <_sk_bicubic_p1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,211,55,0,0 // movaps 0x37d3(%eax),%xmm4
+ .byte 15,40,160,68,56,0,0 // movaps 0x3844(%eax),%xmm4
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,176,227,55,0,0 // movaps 0x37e3(%eax),%xmm6
+ .byte 15,40,176,84,56,0,0 // movaps 0x3854(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,243,55,0,0 // addps 0x37f3(%eax),%xmm6
+ .byte 15,88,176,100,56,0,0 // addps 0x3864(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,3,56,0,0 // addps 0x3803(%eax),%xmm6
+ .byte 15,88,176,116,56,0,0 // addps 0x3874(%eax),%xmm6
.byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70804,18 +71478,18 @@ _sk_bicubic_p3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6fab <_sk_bicubic_p3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 712a <_sk_bicubic_p3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,181,55,0,0 // addps 0x37b5(%eax),%xmm1
+ .byte 15,88,136,38,56,0,0 // addps 0x3826(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,197,55,0,0 // mulps 0x37c5(%eax),%xmm4
- .byte 15,88,160,213,55,0,0 // addps 0x37d5(%eax),%xmm4
+ .byte 15,89,160,54,56,0,0 // mulps 0x3836(%eax),%xmm4
+ .byte 15,88,160,70,56,0,0 // addps 0x3846(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70960,7 +71634,7 @@ _sk_clut_3D_sse2:
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,98,233 // punpckldq %xmm1,%xmm5
.byte 102,15,127,173,104,255,255,255 // movdqa %xmm5,-0x98(%ebp)
- .byte 232,0,0,0,0 // call 719f <_sk_clut_3D_sse2+0xff>
+ .byte 232,0,0,0,0 // call 731e <_sk_clut_3D_sse2+0xff>
.byte 90 // pop %edx
.byte 243,15,91,196 // cvttps2dq %xmm4,%xmm0
.byte 102,15,127,133,232,254,255,255 // movdqa %xmm0,-0x118(%ebp)
@@ -70969,7 +71643,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,254,202 // paddd %xmm2,%xmm1
- .byte 102,15,111,130,1,54,0,0 // movdqa 0x3601(%edx),%xmm0
+ .byte 102,15,111,130,114,54,0,0 // movdqa 0x3672(%edx),%xmm0
.byte 102,15,127,133,88,255,255,255 // movdqa %xmm0,-0xa8(%ebp)
.byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
@@ -70993,7 +71667,7 @@ _sk_clut_3D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
- .byte 102,15,111,130,17,54,0,0 // movdqa 0x3611(%edx),%xmm0
+ .byte 102,15,111,130,130,54,0,0 // movdqa 0x3682(%edx),%xmm0
.byte 102,15,127,133,72,255,255,255 // movdqa %xmm0,-0xb8(%ebp)
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,224 // paddd %xmm0,%xmm4
@@ -71011,7 +71685,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
.byte 15,20,252 // unpcklps %xmm4,%xmm7
.byte 15,20,248 // unpcklps %xmm0,%xmm7
- .byte 102,15,111,130,33,54,0,0 // movdqa 0x3621(%edx),%xmm0
+ .byte 102,15,111,130,146,54,0,0 // movdqa 0x3692(%edx),%xmm0
.byte 102,15,127,69,216 // movdqa %xmm0,-0x28(%ebp)
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0
@@ -71028,7 +71702,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
.byte 15,20,232 // unpcklps %xmm0,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,130,241,53,0,0 // movaps 0x35f1(%edx),%xmm0
+ .byte 15,40,130,98,54,0,0 // movaps 0x3662(%edx),%xmm0
.byte 15,88,240 // addps %xmm0,%xmm6
.byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
.byte 15,40,141,56,255,255,255 // movaps -0xc8(%ebp),%xmm1
@@ -71641,7 +72315,7 @@ _sk_clut_4D_sse2:
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,98,209 // punpckldq %xmm1,%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
- .byte 232,0,0,0,0 // call 7d15 <_sk_clut_4D_sse2+0x179>
+ .byte 232,0,0,0,0 // call 7e94 <_sk_clut_4D_sse2+0x179>
.byte 89 // pop %ecx
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,41,165,120,254,255,255 // movaps %xmm4,-0x188(%ebp)
@@ -71654,7 +72328,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,15,254,206 // paddd %xmm6,%xmm1
- .byte 102,15,111,153,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm3
+ .byte 102,15,111,153,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm3
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
@@ -71677,7 +72351,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 102,15,111,153,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm3
+ .byte 102,15,111,153,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
@@ -71695,7 +72369,7 @@ _sk_clut_4D_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 15,20,213 // unpcklps %xmm5,%xmm2
.byte 15,41,149,136,254,255,255 // movaps %xmm2,-0x178(%ebp)
- .byte 102,15,254,137,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm1
+ .byte 102,15,254,137,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm1
.byte 102,15,112,233,229 // pshufd $0xe5,%xmm1,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
@@ -71711,7 +72385,7 @@ _sk_clut_4D_sse2:
.byte 15,20,207 // unpcklps %xmm7,%xmm1
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,41,141,152,254,255,255 // movaps %xmm1,-0x168(%ebp)
- .byte 15,40,185,187,42,0,0 // movaps 0x2abb(%ecx),%xmm7
+ .byte 15,40,185,44,43,0,0 // movaps 0x2b2c(%ecx),%xmm7
.byte 15,88,231 // addps %xmm7,%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,40,141,232,254,255,255 // movaps -0x118(%ebp),%xmm1
@@ -71732,7 +72406,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp)
.byte 102,15,254,241 // paddd %xmm1,%xmm6
.byte 102,15,112,254,245 // pshufd $0xf5,%xmm6,%xmm7
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,241 // pmuludq %xmm1,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,249 // pmuludq %xmm1,%xmm7
@@ -71769,7 +72443,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,217 // unpcklps %xmm1,%xmm3
- .byte 102,15,111,177,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm6
+ .byte 102,15,111,177,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -71817,7 +72491,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,254,77,168 // paddd -0x58(%ebp),%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0
+ .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -71839,7 +72513,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,129,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm0
+ .byte 102,15,111,129,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm0
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
@@ -71875,7 +72549,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,184 // paddd -0x48(%ebp),%xmm0
.byte 102,15,112,216,245 // pshufd $0xf5,%xmm0,%xmm3
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,217 // pmuludq %xmm1,%xmm3
@@ -71911,7 +72585,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,224 // unpcklps %xmm0,%xmm4
.byte 15,20,227 // unpcklps %xmm3,%xmm4
- .byte 102,15,111,153,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm3
+ .byte 102,15,111,153,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
@@ -71975,7 +72649,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2
+ .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -71997,7 +72671,7 @@ _sk_clut_4D_sse2:
.byte 15,20,214 // unpcklps %xmm6,%xmm2
.byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,145,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm2
+ .byte 102,15,111,145,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm2
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
@@ -72030,7 +72704,7 @@ _sk_clut_4D_sse2:
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,254,109,184 // paddd -0x48(%ebp),%xmm5
.byte 102,15,112,245,245 // pshufd $0xf5,%xmm5,%xmm6
- .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0
+ .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0
.byte 102,15,244,232 // pmuludq %xmm0,%xmm5
.byte 102,15,112,253,232 // pshufd $0xe8,%xmm5,%xmm7
.byte 102,15,244,240 // pmuludq %xmm0,%xmm6
@@ -72066,7 +72740,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,111,153,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm3
+ .byte 102,15,111,153,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm3
.byte 102,15,254,251 // paddd %xmm3,%xmm7
.byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
@@ -72100,7 +72774,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,177,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm6
+ .byte 102,15,111,177,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm6
.byte 102,15,244,198 // pmuludq %xmm6,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,206 // pmuludq %xmm6,%xmm1
@@ -72122,7 +72796,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,254,137,219,42,0,0 // paddd 0x2adb(%ecx),%xmm1
+ .byte 102,15,254,137,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -72156,7 +72830,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,254,85,184 // paddd -0x48(%ebp),%xmm2
.byte 102,15,112,194,245 // pshufd $0xf5,%xmm2,%xmm0
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
.byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
@@ -72177,7 +72851,7 @@ _sk_clut_4D_sse2:
.byte 15,20,200 // unpcklps %xmm0,%xmm1
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
- .byte 102,15,254,129,219,42,0,0 // paddd 0x2adb(%ecx),%xmm0
+ .byte 102,15,254,129,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm0
.byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
@@ -72192,7 +72866,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,208 // unpcklps %xmm0,%xmm2
.byte 15,20,214 // unpcklps %xmm6,%xmm2
- .byte 102,15,254,161,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm4
+ .byte 102,15,254,161,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm4
.byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,196,78 // pshufd $0x4e,%xmm4,%xmm0
@@ -72260,7 +72934,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,69,168 // movdqa -0x58(%ebp),%xmm0
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,112,224,245 // pshufd $0xf5,%xmm0,%xmm4
- .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2
+ .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,216,232 // pshufd $0xe8,%xmm0,%xmm3
.byte 102,15,244,226 // pmuludq %xmm2,%xmm4
@@ -72283,7 +72957,7 @@ _sk_clut_4D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,145,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm2
+ .byte 102,15,111,145,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm2
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -72299,7 +72973,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,236 // unpcklps %xmm4,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,254,153,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm3
+ .byte 102,15,254,153,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm3
.byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
@@ -72351,7 +73025,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,223 // unpcklps %xmm7,%xmm3
- .byte 102,15,254,161,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm4
+ .byte 102,15,254,161,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm4
.byte 102,15,112,212,229 // pshufd $0xe5,%xmm4,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,212,78 // pshufd $0x4e,%xmm4,%xmm2
@@ -72384,7 +73058,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,133,56,255,255,255 // movdqa %xmm0,-0xc8(%ebp)
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,208,245 // pshufd $0xf5,%xmm0,%xmm2
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,240,232 // pshufd $0xe8,%xmm0,%xmm6
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
@@ -72406,7 +73080,7 @@ _sk_clut_4D_sse2:
.byte 15,20,194 // unpcklps %xmm2,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,214 // movdqa %xmm6,%xmm2
- .byte 102,15,111,153,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm3
+ .byte 102,15,111,153,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -72422,7 +73096,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,239 // unpcklps %xmm7,%xmm5
- .byte 102,15,254,177,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm6
+ .byte 102,15,254,177,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm6
.byte 102,15,112,214,229 // pshufd $0xe5,%xmm6,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,214,78 // pshufd $0x4e,%xmm6,%xmm2
@@ -72475,7 +73149,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
- .byte 102,15,254,185,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm7
+ .byte 102,15,254,185,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm7
.byte 102,15,112,199,229 // pshufd $0xe5,%xmm7,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,199,78 // pshufd $0x4e,%xmm7,%xmm0
@@ -72525,7 +73199,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,153,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm3
+ .byte 102,15,111,153,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm3
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -72547,7 +73221,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,111,177,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm6
+ .byte 102,15,111,177,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm6
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -72563,7 +73237,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,203 // unpcklps %xmm3,%xmm1
- .byte 102,15,111,185,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm7
+ .byte 102,15,111,185,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -72582,7 +73256,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,221 // movdqa %xmm5,%xmm3
.byte 102,15,254,93,184 // paddd -0x48(%ebp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0
+ .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -72651,7 +73325,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2
+ .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -72674,7 +73348,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,137,219,42,0,0 // paddd 0x2adb(%ecx),%xmm1
+ .byte 102,15,254,137,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm1
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
@@ -72690,7 +73364,7 @@ _sk_clut_4D_sse2:
.byte 15,20,217 // unpcklps %xmm1,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
- .byte 102,15,254,129,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm0
+ .byte 102,15,254,129,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -72727,7 +73401,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,177,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm6
+ .byte 102,15,111,177,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm6
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,229 // pshufd $0xe5,%xmm6,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -72743,7 +73417,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,52,178 // movss (%edx,%esi,4),%xmm6
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,145,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm2
+ .byte 102,15,254,145,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm2
.byte 102,15,112,242,229 // pshufd $0xe5,%xmm2,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
@@ -72813,7 +73487,7 @@ _sk_clut_4D_sse2:
.byte 139,117,12 // mov 0xc(%ebp),%esi
.byte 141,86,8 // lea 0x8(%esi),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,251,42,0,0 // movaps 0x2afb(%ecx),%xmm3
+ .byte 15,40,153,108,43,0,0 // movaps 0x2b6c(%ecx),%xmm3
.byte 82 // push %edx
.byte 80 // push %eax
.byte 255,86,4 // call *0x4(%esi)
@@ -72974,16 +73648,22 @@ BALIGN16
.byte 63 // aas
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
- .byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%eax)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
+ .byte 63 // aas
+ .byte 0,0 // add %al,(%eax)
+ .byte 128,63,0 // cmpb $0x0,(%edi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
.byte 191,0,0,128,191 // mov $0xbf800000,%edi
.byte 0,0 // add %al,(%eax)
- .byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%edi)
+ .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%edi)
.byte 0,224 // add %ah,%al
.byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 937c <.literal16+0x1fc>
+ .byte 224,64 // loopne 9508 <.literal16+0x208>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 9380 <.literal16+0x200>
+ .byte 224,64 // loopne 950c <.literal16+0x20c>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,64 // loopne 9510 <.literal16+0x210>
.byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999
.byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999
.byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax
@@ -72994,16 +73674,16 @@ BALIGN16
.byte 63 // aas
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93a1 <.literal16+0x221>
+ .byte 225,61 // loope 9531 <.literal16+0x231>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93a5 <.literal16+0x225>
+ .byte 225,61 // loope 9535 <.literal16+0x235>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93a9 <.literal16+0x229>
+ .byte 225,61 // loope 9539 <.literal16+0x239>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93ad <.literal16+0x22d>
+ .byte 225,61 // loope 953d <.literal16+0x23d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73020,16 +73700,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 93e1 <.literal16+0x261>
+ .byte 225,61 // loope 9571 <.literal16+0x271>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93e5 <.literal16+0x265>
+ .byte 225,61 // loope 9575 <.literal16+0x275>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93e9 <.literal16+0x269>
+ .byte 225,61 // loope 9579 <.literal16+0x279>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93ed <.literal16+0x26d>
+ .byte 225,61 // loope 957d <.literal16+0x27d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73046,16 +73726,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 9421 <.literal16+0x2a1>
+ .byte 225,61 // loope 95b1 <.literal16+0x2b1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9425 <.literal16+0x2a5>
+ .byte 225,61 // loope 95b5 <.literal16+0x2b5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9429 <.literal16+0x2a9>
+ .byte 225,61 // loope 95b9 <.literal16+0x2b9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 942d <.literal16+0x2ad>
+ .byte 225,61 // loope 95bd <.literal16+0x2bd>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73072,16 +73752,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 9461 <.literal16+0x2e1>
+ .byte 225,61 // loope 95f1 <.literal16+0x2f1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9465 <.literal16+0x2e5>
+ .byte 225,61 // loope 95f5 <.literal16+0x2f5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9469 <.literal16+0x2e9>
+ .byte 225,61 // loope 95f9 <.literal16+0x2f9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 946d <.literal16+0x2ed>
+ .byte 225,61 // loope 95fd <.literal16+0x2fd>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73103,11 +73783,11 @@ BALIGN16
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax)
.byte 67 // inc %ebx
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 94ab <.literal16+0x32b>
+ .byte 127,67 // jg 963b <.literal16+0x33b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 94af <.literal16+0x32f>
+ .byte 127,67 // jg 963f <.literal16+0x33f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 94b3 <.literal16+0x333>
+ .byte 127,67 // jg 9643 <.literal16+0x343>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73357,7 +74037,53 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
- .byte 128,128,59,255,0,0,0 // addb $0x0,0xff3b(%eax)
+ .byte 128,128,59,0,248,0,0 // addb $0x0,0xf8003b(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 224,7 // loopne 9879 <.literal16+0x579>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,7 // loopne 987d <.literal16+0x57d>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,7 // loopne 9881 <.literal16+0x581>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,7 // loopne 9885 <.literal16+0x585>
+ .byte 0,0 // add %al,(%eax)
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 31 // pop %ds
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,31 // add %bl,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,31 // add %bl,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,31 // add %bl,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,8 // add %cl,(%eax)
+ .byte 33,4,61,8,33,4,61 // and %eax,0x3d042108(,%edi,1)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 4,61 // add $0x3d,%al
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 4,61 // add $0x3d,%al
+ .byte 255,0 // incl (%eax)
+ .byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -73381,13 +74107,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9709 <.literal16+0x589>
+ .byte 224,7 // loopne 98f9 <.literal16+0x5f9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 970d <.literal16+0x58d>
+ .byte 224,7 // loopne 98fd <.literal16+0x5fd>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9711 <.literal16+0x591>
+ .byte 224,7 // loopne 9901 <.literal16+0x601>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9715 <.literal16+0x595>
+ .byte 224,7 // loopne 9905 <.literal16+0x605>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -73436,11 +74162,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97cb <.literal16+0x64b>
+ .byte 127,67 // jg 99bb <.literal16+0x6bb>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97cf <.literal16+0x64f>
+ .byte 127,67 // jg 99bf <.literal16+0x6bf>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97d3 <.literal16+0x653>
+ .byte 127,67 // jg 99c3 <.literal16+0x6c3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax)
@@ -73455,16 +74181,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 97c4 <.literal16+0x644>
+ .byte 127,0 // jg 99b4 <.literal16+0x6b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97c8 <.literal16+0x648>
+ .byte 127,0 // jg 99b8 <.literal16+0x6b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97cc <.literal16+0x64c>
+ .byte 127,0 // jg 99bc <.literal16+0x6bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97d0 <.literal16+0x650>
+ .byte 127,0 // jg 99c0 <.literal16+0x6c0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73473,7 +74199,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9855 <.literal16+0x6d5>
+ .byte 119,115 // ja 9a45 <.literal16+0x745>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73484,7 +74210,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 97b9 <.literal16+0x639>
+ .byte 117,191 // jne 99a9 <.literal16+0x6a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73500,7 +74226,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d7f6 <_sk_clut_4D_sse2+0xe9a35c5a>
+ .byte 233,220,63,163,233 // jmp e9a3d9e6 <_sk_clut_4D_sse2+0xe9a35ccb>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73555,16 +74281,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9894 <.literal16+0x714>
+ .byte 127,0 // jg 9a84 <.literal16+0x784>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9898 <.literal16+0x718>
+ .byte 127,0 // jg 9a88 <.literal16+0x788>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 989c <.literal16+0x71c>
+ .byte 127,0 // jg 9a8c <.literal16+0x78c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 98a0 <.literal16+0x720>
+ .byte 127,0 // jg 9a90 <.literal16+0x790>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73573,7 +74299,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9925 <.literal16+0x7a5>
+ .byte 119,115 // ja 9b15 <.literal16+0x815>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73584,7 +74310,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9889 <.literal16+0x709>
+ .byte 117,191 // jne 9a79 <.literal16+0x779>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73600,7 +74326,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d8c6 <_sk_clut_4D_sse2+0xe9a35d2a>
+ .byte 233,220,63,163,233 // jmp e9a3dab6 <_sk_clut_4D_sse2+0xe9a35d9b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73655,16 +74381,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9964 <.literal16+0x7e4>
+ .byte 127,0 // jg 9b54 <.literal16+0x854>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9968 <.literal16+0x7e8>
+ .byte 127,0 // jg 9b58 <.literal16+0x858>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 996c <.literal16+0x7ec>
+ .byte 127,0 // jg 9b5c <.literal16+0x85c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9970 <.literal16+0x7f0>
+ .byte 127,0 // jg 9b60 <.literal16+0x860>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73673,7 +74399,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 99f5 <.literal16+0x875>
+ .byte 119,115 // ja 9be5 <.literal16+0x8e5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73684,7 +74410,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9959 <.literal16+0x7d9>
+ .byte 117,191 // jne 9b49 <.literal16+0x849>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73700,7 +74426,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d996 <_sk_clut_4D_sse2+0xe9a35dfa>
+ .byte 233,220,63,163,233 // jmp e9a3db86 <_sk_clut_4D_sse2+0xe9a35e6b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73755,16 +74481,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9a34 <.literal16+0x8b4>
+ .byte 127,0 // jg 9c24 <.literal16+0x924>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a38 <.literal16+0x8b8>
+ .byte 127,0 // jg 9c28 <.literal16+0x928>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a3c <.literal16+0x8bc>
+ .byte 127,0 // jg 9c2c <.literal16+0x92c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a40 <.literal16+0x8c0>
+ .byte 127,0 // jg 9c30 <.literal16+0x930>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73773,7 +74499,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9ac5 <.literal16+0x945>
+ .byte 119,115 // ja 9cb5 <.literal16+0x9b5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73784,7 +74510,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9a29 <.literal16+0x8a9>
+ .byte 117,191 // jne 9c19 <.literal16+0x919>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73800,7 +74526,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3da66 <_sk_clut_4D_sse2+0xe9a35eca>
+ .byte 233,220,63,163,233 // jmp e9a3dc56 <_sk_clut_4D_sse2+0xe9a35f3b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73855,16 +74581,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9b04 <.literal16+0x984>
+ .byte 127,0 // jg 9cf4 <.literal16+0x9f4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9b08 <.literal16+0x988>
+ .byte 127,0 // jg 9cf8 <.literal16+0x9f8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9b0c <.literal16+0x98c>
+ .byte 127,0 // jg 9cfc <.literal16+0x9fc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9b10 <.literal16+0x990>
+ .byte 127,0 // jg 9d00 <.literal16+0xa00>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73873,7 +74599,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9b95 <.literal16+0xa15>
+ .byte 119,115 // ja 9d85 <.literal16+0xa85>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73884,7 +74610,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9af9 <.literal16+0x979>
+ .byte 117,191 // jne 9ce9 <.literal16+0x9e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73900,7 +74626,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3db36 <_sk_clut_4D_sse2+0xe9a35f9a>
+ .byte 233,220,63,163,233 // jmp e9a3dd26 <_sk_clut_4D_sse2+0xe9a3600b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73951,13 +74677,13 @@ BALIGN16
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
- .byte 127,67 // jg 9c17 <.literal16+0xa97>
+ .byte 127,67 // jg 9e07 <.literal16+0xb07>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c1b <.literal16+0xa9b>
+ .byte 127,67 // jg 9e0b <.literal16+0xb0b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c1f <.literal16+0xa9f>
+ .byte 127,67 // jg 9e0f <.literal16+0xb0f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c23 <.literal16+0xaa3>
+ .byte 127,67 // jg 9e13 <.literal16+0xb13>
.byte 0,0 // add %al,(%eax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%eax)
@@ -74008,16 +74734,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%ebx)
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9ca3 <.literal16+0xb23>
+ .byte 118,63 // jbe 9e93 <.literal16+0xb93>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9ca7 <.literal16+0xb27>
+ .byte 118,63 // jbe 9e97 <.literal16+0xb97>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9cab <.literal16+0xb2b>
+ .byte 118,63 // jbe 9e9b <.literal16+0xb9b>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9caf <.literal16+0xb2f>
+ .byte 118,63 // jbe 9e9f <.literal16+0xb9f>
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
@@ -74046,11 +74772,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%ebx)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9d1b <.literal16+0xb9b>
+ .byte 127,67 // jg 9f0b <.literal16+0xc0b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9d1f <.literal16+0xb9f>
+ .byte 127,67 // jg 9f0f <.literal16+0xc0f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9d23 <.literal16+0xba3>
+ .byte 127,67 // jg 9f13 <.literal16+0xc13>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,0 // add %al,(%eax)
@@ -74112,13 +74838,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9d99 <.literal16+0xc19>
+ .byte 224,7 // loopne 9f89 <.literal16+0xc89>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d9d <.literal16+0xc1d>
+ .byte 224,7 // loopne 9f8d <.literal16+0xc8d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9da1 <.literal16+0xc21>
+ .byte 224,7 // loopne 9f91 <.literal16+0xc91>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9da5 <.literal16+0xc25>
+ .byte 224,7 // loopne 9f95 <.literal16+0xc95>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -74164,13 +74890,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9e09 <.literal16+0xc89>
+ .byte 224,7 // loopne 9ff9 <.literal16+0xcf9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e0d <.literal16+0xc8d>
+ .byte 224,7 // loopne 9ffd <.literal16+0xcfd>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e11 <.literal16+0xc91>
+ .byte 224,7 // loopne a001 <.literal16+0xd01>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e15 <.literal16+0xc95>
+ .byte 224,7 // loopne a005 <.literal16+0xd05>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -74216,13 +74942,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9e79 <.literal16+0xcf9>
+ .byte 224,7 // loopne a069 <.literal16+0xd69>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e7d <.literal16+0xcfd>
+ .byte 224,7 // loopne a06d <.literal16+0xd6d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e81 <.literal16+0xd01>
+ .byte 224,7 // loopne a071 <.literal16+0xd71>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e85 <.literal16+0xd05>
+ .byte 224,7 // loopne a075 <.literal16+0xd75>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -74264,13 +74990,13 @@ BALIGN16
.byte 248 // clc
.byte 65 // inc %ecx
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f16 <.literal16+0xd96>
+ .byte 124,66 // jl a106 <.literal16+0xe06>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f1a <.literal16+0xd9a>
+ .byte 124,66 // jl a10a <.literal16+0xe0a>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f1e <.literal16+0xd9e>
+ .byte 124,66 // jl a10e <.literal16+0xe0e>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f22 <.literal16+0xda2>
+ .byte 124,66 // jl a112 <.literal16+0xe12>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%eax)
.byte 0,240 // add %dh,%al
@@ -74404,13 +75130,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0a5 <.literal16+0xf25>
+ .byte 112,65 // jo a295 <.literal16+0xf95>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0a9 <.literal16+0xf29>
+ .byte 112,65 // jo a299 <.literal16+0xf99>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0ad <.literal16+0xf2d>
+ .byte 112,65 // jo a29d <.literal16+0xf9d>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0b1 <.literal16+0xf31>
+ .byte 112,65 // jo a2a1 <.literal16+0xfa1>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -74441,11 +75167,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a11b <.literal16+0xf9b>
+ .byte 127,67 // jg a30b <.literal16+0x100b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a11f <.literal16+0xf9f>
+ .byte 127,67 // jg a30f <.literal16+0x100f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a123 <.literal16+0xfa3>
+ .byte 127,67 // jg a313 <.literal16+0x1013>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -74476,11 +75202,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a18b <.literal16+0x100b>
+ .byte 127,67 // jg a37b <.literal16+0x107b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a18f <.literal16+0x100f>
+ .byte 127,67 // jg a37f <.literal16+0x107f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a193 <.literal16+0x1013>
+ .byte 127,67 // jg a383 <.literal16+0x1083>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
@@ -74579,13 +75305,13 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 255 // (bad)
- .byte 127,71 // jg a2bb <.literal16+0x113b>
+ .byte 127,71 // jg a4ab <.literal16+0x11ab>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a2bf <.literal16+0x113f>
+ .byte 127,71 // jg a4af <.literal16+0x11af>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a2c3 <.literal16+0x1143>
+ .byte 127,71 // jg a4b3 <.literal16+0x11b3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a2c7 <.literal16+0x1147>
+ .byte 127,71 // jg a4b7 <.literal16+0x11b7>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -74693,7 +75419,7 @@ BALIGN16
.byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js a3cc <.literal16+0x124c>
+ .byte 120,57 // js a5bc <.literal16+0x12bc>
.byte 64 // inc %eax
.byte 18,120,57 // adc 0x39(%eax),%bh
.byte 64 // inc %eax
@@ -74886,11 +75612,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt a5b2 <.literal16+0x1432>
+ .byte 62,114,28 // jb,pt a7a2 <.literal16+0x14a2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a5b6 <.literal16+0x1436>
+ .byte 62,114,28 // jb,pt a7a6 <.literal16+0x14a6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a5ba <.literal16+0x143a>
+ .byte 62,114,28 // jb,pt a7aa <.literal16+0x14aa>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -74969,13 +75695,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb a67e <.literal16+0x14fe>
+ .byte 114,28 // jb a86e <.literal16+0x156e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a682 <.literal16+0x1502>
+ .byte 62,114,28 // jb,pt a872 <.literal16+0x1572>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a686 <.literal16+0x1506>
+ .byte 62,114,28 // jb,pt a876 <.literal16+0x1576>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a68a <.literal16+0x150a>
+ .byte 62,114,28 // jb,pt a87a <.literal16+0x157a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -74996,11 +75722,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt a6c2 <.literal16+0x1542>
+ .byte 62,114,28 // jb,pt a8b2 <.literal16+0x15b2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a6c6 <.literal16+0x1546>
+ .byte 62,114,28 // jb,pt a8b6 <.literal16+0x15b6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a6ca <.literal16+0x154a>
+ .byte 62,114,28 // jb,pt a8ba <.literal16+0x15ba>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -75079,13 +75805,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb a78e <.literal16+0x160e>
+ .byte 114,28 // jb a97e <.literal16+0x167e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a792 <.literal16+0x1612>
+ .byte 62,114,28 // jb,pt a982 <.literal16+0x1682>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a796 <.literal16+0x1616>
+ .byte 62,114,28 // jb,pt a986 <.literal16+0x1686>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a79a <.literal16+0x161a>
+ .byte 62,114,28 // jb,pt a98a <.literal16+0x168a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -75095,14 +75821,14 @@ BALIGN16
.byte 170 // stos %al,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
.byte 190,171,170,170,190 // mov $0xbeaaaaab,%esi
- .byte 114,249 // jb a78b <.literal16+0x160b>
- .byte 127,63 // jg a7d3 <.literal16+0x1653>
- .byte 114,249 // jb a78f <.literal16+0x160f>
- .byte 127,63 // jg a7d7 <.literal16+0x1657>
- .byte 114,249 // jb a793 <.literal16+0x1613>
- .byte 127,63 // jg a7db <.literal16+0x165b>
- .byte 114,249 // jb a797 <.literal16+0x1617>
- .byte 127,63 // jg a7df <.literal16+0x165f>
+ .byte 114,249 // jb a97b <.literal16+0x167b>
+ .byte 127,63 // jg a9c3 <.literal16+0x16c3>
+ .byte 114,249 // jb a97f <.literal16+0x167f>
+ .byte 127,63 // jg a9c7 <.literal16+0x16c7>
+ .byte 114,249 // jb a983 <.literal16+0x1683>
+ .byte 127,63 // jg a9cb <.literal16+0x16cb>
+ .byte 114,249 // jb a987 <.literal16+0x1687>
+ .byte 127,63 // jg a9cf <.literal16+0x16cf>
.byte 3,0 // add (%eax),%eax
.byte 0,0 // add %al,(%eax)
.byte 3,0 // add (%eax),%eax
@@ -75127,14 +75853,14 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 2,0 // add (%eax),%al
.byte 0,0 // add %al,(%eax)
- .byte 114,249 // jb a7cb <.literal16+0x164b>
- .byte 127,63 // jg a813 <.literal16+0x1693>
- .byte 114,249 // jb a7cf <.literal16+0x164f>
- .byte 127,63 // jg a817 <.literal16+0x1697>
- .byte 114,249 // jb a7d3 <.literal16+0x1653>
- .byte 127,63 // jg a81b <.literal16+0x169b>
- .byte 114,249 // jb a7d7 <.literal16+0x1657>
- .byte 127,63 // jg a81f <.literal16+0x169f>
+ .byte 114,249 // jb a9bb <.literal16+0x16bb>
+ .byte 127,63 // jg aa03 <.literal16+0x1703>
+ .byte 114,249 // jb a9bf <.literal16+0x16bf>
+ .byte 127,63 // jg aa07 <.literal16+0x1707>
+ .byte 114,249 // jb a9c3 <.literal16+0x16c3>
+ .byte 127,63 // jg aa0b <.literal16+0x170b>
+ .byte 114,249 // jb a9c7 <.literal16+0x16c7>
+ .byte 127,63 // jg aa0f <.literal16+0x170f>
.byte 3,0 // add (%eax),%eax
.byte 0,0 // add %al,(%eax)
.byte 3,0 // add (%eax),%eax
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index eee638a8c3..f681ed5531 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -101,7 +101,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,45,180,2,0 ; vbroadcastss 0x2b42d(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,25,186,2,0 ; vbroadcastss 0x2ba19(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -109,7 +109,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,13,180,2,0 ; vbroadcastss 0x2b40d(%rip),%ymm2 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,21,249,185,2,0 ; vbroadcastss 0x2b9f9(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -126,13 +126,13 @@ _sk_dither_hsw LABEL PROC
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,212,179,2,0 ; vpbroadcastd 0x2b3d4(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,21,192,185,2,0 ; vpbroadcastd 0x2b9c0(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,185,179,2,0 ; vpbroadcastd 0x2b3b9(%rip),%ymm12 # 2b598 <_sk_overlay_sse2_8bit+0x477>
- DB 196,98,125,88,45,180,179,2,0 ; vpbroadcastd 0x2b3b4(%rip),%ymm13 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,37,165,185,2,0 ; vpbroadcastd 0x2b9a5(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477>
+ DB 196,98,125,88,45,160,185,2,0 ; vpbroadcastd 0x2b9a0(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -147,8 +147,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,102,179,2,0 ; vbroadcastss 0x2b366(%rip),%ymm9 # 2b5a0 <_sk_overlay_sse2_8bit+0x47f>
- DB 196,98,125,24,21,97,179,2,0 ; vbroadcastss 0x2b361(%rip),%ymm10 # 2b5a4 <_sk_overlay_sse2_8bit+0x483>
+ DB 196,98,125,24,13,82,185,2,0 ; vbroadcastss 0x2b952(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f>
+ DB 196,98,125,24,21,77,185,2,0 ; vbroadcastss 0x2b94d(%rip),%ymm10 # 2bb90 <_sk_overlay_sse2_8bit+0x483>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
@@ -178,7 +178,7 @@ _sk_uniform_color_hsw LABEL PROC
PUBLIC _sk_black_color_hsw
_sk_black_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,233,178,2,0 ; vbroadcastss 0x2b2e9(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,213,184,2,0 ; vbroadcastss 0x2b8d5(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -187,7 +187,7 @@ _sk_black_color_hsw LABEL PROC
PUBLIC _sk_white_color_hsw
_sk_white_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,208,178,2,0 ; vbroadcastss 0x2b2d0(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,188,184,2,0 ; vbroadcastss 0x2b8bc(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -225,7 +225,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,111,178,2,0 ; vbroadcastss 0x2b26f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,91,184,2,0 ; vbroadcastss 0x2b85b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -239,7 +239,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,62,178,2,0 ; vbroadcastss 0x2b23e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,42,184,2,0 ; vbroadcastss 0x2b82a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -272,7 +272,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,225,177,2,0 ; vbroadcastss 0x2b1e1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,205,183,2,0 ; vbroadcastss 0x2b7cd(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -283,7 +283,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,192,177,2,0 ; vbroadcastss 0x2b1c0(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,172,183,2,0 ; vbroadcastss 0x2b7ac(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -294,7 +294,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,159,177,2,0 ; vbroadcastss 0x2b19f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,139,183,2,0 ; vbroadcastss 0x2b78b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -305,7 +305,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,122,177,2,0 ; vbroadcastss 0x2b17a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,102,183,2,0 ; vbroadcastss 0x2b766(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -325,7 +325,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,65,177,2,0 ; vbroadcastss 0x2b141(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,45,183,2,0 ; vbroadcastss 0x2b72d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -346,9 +346,14 @@ _sk_multiply_hsw LABEL PROC
PUBLIC _sk_plus__hsw
_sk_plus__hsw LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
+ DB 196,98,125,24,5,220,182,2,0 ; vbroadcastss 0x2b6dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
+ DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2
+ DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -367,7 +372,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,184,176,2,0 ; vbroadcastss 0x2b0b8(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,135,182,2,0 ; vbroadcastss 0x2b687(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -399,7 +404,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,60,176,2,0 ; vbroadcastss 0x2b03c(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,11,182,2,0 ; vbroadcastss 0x2b60b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -422,7 +427,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,231,175,2,0 ; vbroadcastss 0x2afe7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,182,181,2,0 ; vbroadcastss 0x2b5b6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -448,7 +453,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,134,175,2,0 ; vbroadcastss 0x2af86(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,85,181,2,0 ; vbroadcastss 0x2b555(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -468,7 +473,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,64,175,2,0 ; vbroadcastss 0x2af40(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,15,181,2,0 ; vbroadcastss 0x2b50f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -476,7 +481,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,42,175,2,0 ; vbroadcastss 0x2af2a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,249,180,2,0 ; vbroadcastss 0x2b4f9(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -532,7 +537,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,58,174,2,0 ; vbroadcastss 0x2ae3a(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,9,180,2,0 ; vbroadcastss 0x2b409(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -583,7 +588,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,84,173,2,0 ; vbroadcastss 0x2ad54(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,35,179,2,0 ; vbroadcastss 0x2b323(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -632,7 +637,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,136,172,2,0 ; vbroadcastss 0x2ac88(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,87,178,2,0 ; vbroadcastss 0x2b257(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -692,10 +697,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,159,171,2,0 ; vbroadcastss 0x2ab9f(%rip),%ymm11 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,29,110,177,2,0 ; vbroadcastss 0x2b16e(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,144,171,2,0 ; vbroadcastss 0x2ab90(%rip),%ymm12 # 2b5ac <_sk_overlay_sse2_8bit+0x48b>
+ DB 196,98,125,24,37,95,177,2,0 ; vbroadcastss 0x2b15f(%rip),%ymm12 # 2bb98 <_sk_overlay_sse2_8bit+0x48b>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -705,7 +710,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,63,171,2,0 ; vbroadcastss 0x2ab3f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,14,177,2,0 ; vbroadcastss 0x2b10e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -818,11 +823,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,82,169,2,0 ; vbroadcastss 0x2a952(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,61,77,169,2,0 ; vbroadcastss 0x2a94d(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,33,175,2,0 ; vbroadcastss 0x2af21(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,61,28,175,2,0 ; vbroadcastss 0x2af1c(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,62,169,2,0 ; vbroadcastss 0x2a93e(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,13,175,2,0 ; vbroadcastss 0x2af0d(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -877,7 +882,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,255,167,2,0 ; vbroadcastss 0x2a7ff(%rip),%ymm1 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,13,206,173,2,0 ; vbroadcastss 0x2adce(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -931,11 +936,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,44,167,2,0 ; vbroadcastss 0x2a72c(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,61,39,167,2,0 ; vbroadcastss 0x2a727(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,251,172,2,0 ; vbroadcastss 0x2acfb(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,61,246,172,2,0 ; vbroadcastss 0x2acf6(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,24,167,2,0 ; vbroadcastss 0x2a718(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,231,172,2,0 ; vbroadcastss 0x2ace7(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -990,7 +995,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,217,165,2,0 ; vbroadcastss 0x2a5d9(%rip),%ymm1 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,13,168,171,2,0 ; vbroadcastss 0x2aba8(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1018,11 +1023,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,136,165,2,0 ; vbroadcastss 0x2a588(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,53,131,165,2,0 ; vbroadcastss 0x2a583(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,45,87,171,2,0 ; vbroadcastss 0x2ab57(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,82,171,2,0 ; vbroadcastss 0x2ab52(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,116,165,2,0 ; vbroadcastss 0x2a574(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,67,171,2,0 ; vbroadcastss 0x2ab43(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1078,7 +1083,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,42,164,2,0 ; vbroadcastss 0x2a42a(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,249,169,2,0 ; vbroadcastss 0x2a9f9(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1106,11 +1111,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,217,163,2,0 ; vbroadcastss 0x2a3d9(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,53,212,163,2,0 ; vbroadcastss 0x2a3d4(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,45,168,169,2,0 ; vbroadcastss 0x2a9a8(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,163,169,2,0 ; vbroadcastss 0x2a9a3(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,197,163,2,0 ; vbroadcastss 0x2a3c5(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,148,169,2,0 ; vbroadcastss 0x2a994(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1166,7 +1171,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,123,162,2,0 ; vbroadcastss 0x2a27b(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,74,168,2,0 ; vbroadcastss 0x2a84a(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1195,19 +1200,19 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,180,0,0,0 ; jne 142f <_sk_srcover_rgba_8888_hsw+0xd5>
+ DB 15,133,180,0,0,0 ; jne 144c <_sk_srcover_rgba_8888_hsw+0xd5>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,183,163,2,0 ; vpand 0x2a3b7(%rip),%ymm7,%ymm4 # 2b740 <_sk_overlay_sse2_8bit+0x61f>
+ DB 197,197,219,37,122,169,2,0 ; vpand 0x2a97a(%rip),%ymm7,%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0x613>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,202,163,2,0 ; vpshufb 0x2a3ca(%rip),%ymm7,%ymm5 # 2b760 <_sk_overlay_sse2_8bit+0x63f>
+ DB 196,226,69,0,45,141,169,2,0 ; vpshufb 0x2a98d(%rip),%ymm7,%ymm5 # 2bd40 <_sk_overlay_sse2_8bit+0x633>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,221,163,2,0 ; vpshufb 0x2a3dd(%rip),%ymm7,%ymm6 # 2b780 <_sk_overlay_sse2_8bit+0x65f>
+ DB 196,226,69,0,53,160,169,2,0 ; vpshufb 0x2a9a0(%rip),%ymm7,%ymm6 # 2bd60 <_sk_overlay_sse2_8bit+0x653>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,215,161,2,0 ; vbroadcastss 0x2a1d7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,166,167,2,0 ; vbroadcastss 0x2a7a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,246,161,2,0 ; vbroadcastss 0x2a1f6(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,13,197,167,2,0 ; vbroadcastss 0x2a7c5(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1227,7 +1232,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,65,53,235,202 ; vpor %ymm10,%ymm9,%ymm9
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1466 <_sk_srcover_rgba_8888_hsw+0x10c>
+ DB 117,66 ; jne 1483 <_sk_srcover_rgba_8888_hsw+0x10c>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -1237,33 +1242,33 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,58,255,255,255 ; ja 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 15,135,58,255,255,255 ; ja 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,254,0,0,0 ; lea 0xfe(%rip),%r11 # 1550 <_sk_srcover_rgba_8888_hsw+0x1f6>
+ DB 76,141,29,253,0,0,0 ; lea 0xfd(%rip),%r11 # 156c <_sk_srcover_rgba_8888_hsw+0x1f5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,27,255,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 233,27,255,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,180 ; ja 142a <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 119,180 ; ja 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
DB 65,15,182,194 ; movzbl %r10b,%eax
- DB 76,141,21,235,0,0,0 ; lea 0xeb(%rip),%r10 # 156c <_sk_srcover_rgba_8888_hsw+0x212>
+ DB 76,141,21,234,0,0,0 ; lea 0xea(%rip),%r10 # 1588 <_sk_srcover_rgba_8888_hsw+0x211>
DB 73,99,4,130 ; movslq (%r10,%rax,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,152 ; jmp 142a <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 235,152 ; jmp 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,200,254,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 233,200,254,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -1276,10 +1281,10 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,121,254,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 233,121,254,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 233,15,255,255,255 ; jmpq 142a <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 233,15,255,255,255 ; jmpq 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -1287,35 +1292,33 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 233,219,254,255,255 ; jmpq 142a <_sk_srcover_rgba_8888_hsw+0xd0>
- DB 144 ; nop
- DB 11,255 ; or %edi,%edi
+ DB 233,219,254,255,255 ; jmpq 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 12,255 ; or $0xff,%al
DB 255 ; (bad)
- DB 255,88,255 ; lcall *-0x1(%rax)
+ DB 255,89,255 ; lcall *-0x1(%rcx)
DB 255 ; (bad)
- DB 255,66,255 ; incl -0x1(%rdx)
+ DB 255,67,255 ; incl -0x1(%rbx)
DB 255 ; (bad)
- DB 255,167,255,255,255,147 ; jmpq *-0x6c000001(%rdi)
+ DB 255,168,255,255,255,148 ; ljmp *-0x6b000001(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,128,255,255,255,106 ; incl 0x6affffff(%rax)
DB 255 ; (bad)
- DB 127,255 ; jg 1565 <_sk_srcover_rgba_8888_hsw+0x20b>
DB 255 ; (bad)
- DB 255,105,255 ; ljmp *-0x1(%rcx)
+ DB 255,31 ; lcall *(%rdi)
DB 255 ; (bad)
- DB 255,30 ; lcall *(%rsi)
DB 255 ; (bad)
+ DB 255,165,255,255,255,157 ; jmpq *-0x62000001(%rbp)
DB 255 ; (bad)
- DB 255,164,255,255,255,156,255 ; jmpq *-0x630001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 216,255 ; fdivr %st(7),%st
+ DB 217,255 ; fcos
DB 255 ; (bad)
- DB 255,203 ; dec %ebx
+ DB 255,204 ; dec %esp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 189,255,255,255,175 ; mov $0xafffffff,%ebp
+ DB 190,255,255,255,176 ; mov $0xb0ffffff,%esi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -1332,7 +1335,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,226,159,2,0 ; vbroadcastss 0x29fe2(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,178,165,2,0 ; vbroadcastss 0x2a5b2(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1342,7 +1345,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,193,159,2,0 ; vbroadcastss 0x29fc1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,145,165,2,0 ; vbroadcastss 0x2a591(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1352,7 +1355,7 @@ _sk_clamp_a_hsw LABEL PROC
PUBLIC _sk_clamp_a_dst_hsw
_sk_clamp_a_dst_hsw LABEL PROC
- DB 196,98,125,24,5,163,159,2,0 ; vbroadcastss 0x29fa3(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,115,165,2,0 ; vbroadcastss 0x2a573(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -1379,7 +1382,7 @@ _sk_swap_rb_hsw LABEL PROC
PUBLIC _sk_invert_hsw
_sk_invert_hsw LABEL PROC
- DB 196,98,125,24,5,94,159,2,0 ; vbroadcastss 0x29f5e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,46,165,2,0 ; vbroadcastss 0x2a52e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -1425,7 +1428,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,238,158,2,0 ; vbroadcastss 0x29eee(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,190,164,2,0 ; vbroadcastss 0x2a4be(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1436,16 +1439,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,251,158,2,0 ; vbroadcastss 0x29efb(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,203,164,2,0 ; vbroadcastss 0x2a4cb(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,237,158,2,0 ; vbroadcastss 0x29eed(%rip),%ymm11 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
- DB 196,98,125,24,37,208,158,2,0 ; vbroadcastss 0x29ed0(%rip),%ymm12 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,189,164,2,0 ; vbroadcastss 0x2a4bd(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,37,160,164,2,0 ; vbroadcastss 0x2a4a0(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,213,158,2,0 ; vbroadcastss 0x29ed5(%rip),%ymm14 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,53,165,164,2,0 ; vbroadcastss 0x2a4a5(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,203,158,2,0 ; vbroadcastss 0x29ecb(%rip),%ymm10 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,21,155,164,2,0 ; vbroadcastss 0x2a49b(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1466,16 +1469,16 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_from_srgb_dst_hsw
_sk_from_srgb_dst_hsw LABEL PROC
- DB 196,98,125,24,5,99,158,2,0 ; vbroadcastss 0x29e63(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,51,164,2,0 ; vbroadcastss 0x2a433(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,85,158,2,0 ; vbroadcastss 0x29e55(%rip),%ymm11 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
- DB 196,98,125,24,37,56,158,2,0 ; vbroadcastss 0x29e38(%rip),%ymm12 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,37,164,2,0 ; vbroadcastss 0x2a425(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,37,8,164,2,0 ; vbroadcastss 0x2a408(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13
- DB 196,98,125,24,53,61,158,2,0 ; vbroadcastss 0x29e3d(%rip),%ymm14 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,53,13,164,2,0 ; vbroadcastss 0x2a40d(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,51,158,2,0 ; vbroadcastss 0x29e33(%rip),%ymm10 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,21,3,164,2,0 ; vbroadcastss 0x2a403(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4
DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -1497,19 +1500,19 @@ _sk_from_srgb_dst_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,215,157,2,0 ; vbroadcastss 0x29dd7(%rip),%ymm8 # 2b5d0 <_sk_overlay_sse2_8bit+0x4af>
+ DB 196,98,125,24,5,167,163,2,0 ; vbroadcastss 0x2a3a7(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,205,157,2,0 ; vbroadcastss 0x29dcd(%rip),%ymm11 # 2b5d4 <_sk_overlay_sse2_8bit+0x4b3>
- DB 196,98,125,24,37,200,157,2,0 ; vbroadcastss 0x29dc8(%rip),%ymm12 # 2b5d8 <_sk_overlay_sse2_8bit+0x4b7>
+ DB 196,98,125,24,29,157,163,2,0 ; vbroadcastss 0x2a39d(%rip),%ymm11 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3>
+ DB 196,98,125,24,37,152,163,2,0 ; vbroadcastss 0x2a398(%rip),%ymm12 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,185,157,2,0 ; vbroadcastss 0x29db9(%rip),%ymm14 # 2b5dc <_sk_overlay_sse2_8bit+0x4bb>
+ DB 196,98,125,24,53,137,163,2,0 ; vbroadcastss 0x2a389(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,175,157,2,0 ; vbroadcastss 0x29daf(%rip),%ymm15 # 2b5e0 <_sk_overlay_sse2_8bit+0x4bf>
+ DB 196,98,125,24,61,127,163,2,0 ; vbroadcastss 0x2a37f(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,155,157,2,0 ; vbroadcastss 0x29d9b(%rip),%ymm13 # 2b5e4 <_sk_overlay_sse2_8bit+0x4c3>
+ DB 196,98,125,24,45,107,163,2,0 ; vbroadcastss 0x2a36b(%rip),%ymm13 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1536,31 +1539,31 @@ _sk_to_srgb_hsw LABEL PROC
PUBLIC _sk_rgb_to_hsl_hsw
_sk_rgb_to_hsl_hsw LABEL PROC
- DB 197,124,95,193 ; vmaxps %ymm1,%ymm0,%ymm8
- DB 197,60,95,194 ; vmaxps %ymm2,%ymm8,%ymm8
- DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
- DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
+ DB 197,116,95,194 ; vmaxps %ymm2,%ymm1,%ymm8
+ DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8
+ DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
+ DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,184,156,2,0 ; vbroadcastss 0x29cb8(%rip),%ymm11 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,29,134,162,2,0 ; vbroadcastss 0x2a286(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,249,156,2,0 ; vbroadcastss 0x29cf9(%rip),%ymm14 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,53,199,162,2,0 ; vbroadcastss 0x2a2c7(%rip),%ymm14 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,224,156,2,0 ; vbroadcastss 0x29ce0(%rip),%ymm14 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,53,174,162,2,0 ; vbroadcastss 0x2a2ae(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,206,156,2,0 ; vbroadcastss 0x29cce(%rip),%ymm14 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,53,156,162,2,0 ; vbroadcastss 0x2a29c(%rip),%ymm14 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,69,156,2,0 ; vbroadcastss 0x29c45(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,19,162,2,0 ; vbroadcastss 0x2a213(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1570,7 +1573,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,116,156,2,0 ; vbroadcastss 0x29c74(%rip),%ymm8 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,5,66,162,2,0 ; vbroadcastss 0x2a242(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1585,30 +1588,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,203,155,2,0 ; vbroadcastss 0x29bcb(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,153,161,2,0 ; vbroadcastss 0x2a199(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,10,156,2,0 ; vbroadcastss 0x29c0a(%rip),%ymm9 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,13,216,161,2,0 ; vbroadcastss 0x2a1d8(%rip),%ymm9 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,8,156,2,0 ; vbroadcastss 0x29c08(%rip),%ymm11 # 2b5f8 <_sk_overlay_sse2_8bit+0x4d7>
+ DB 196,98,125,24,29,214,161,2,0 ; vbroadcastss 0x2a1d6(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,218,155,2,0 ; vbroadcastss 0x29bda(%rip),%ymm13 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,45,168,161,2,0 ; vbroadcastss 0x2a1a8(%rip),%ymm13 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,212,155,2,0 ; vbroadcastss 0x29bd4(%rip),%ymm14 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,53,162,161,2,0 ; vbroadcastss 0x2a1a2(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,206,155,2,0 ; vbroadcastss 0x29bce(%rip),%ymm3 # 2b5fc <_sk_overlay_sse2_8bit+0x4db>
+ DB 196,226,125,24,29,156,161,2,0 ; vbroadcastss 0x2a19c(%rip),%ymm3 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,165,155,2,0 ; vbroadcastss 0x29ba5(%rip),%ymm12 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,37,115,161,2,0 ; vbroadcastss 0x2a173(%rip),%ymm12 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1624,7 +1627,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,89,155,2,0 ; vbroadcastss 0x29b59(%rip),%ymm0 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,226,125,24,5,39,161,2,0 ; vbroadcastss 0x2a127(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1673,12 +1676,12 @@ _sk_scale_u8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,59 ; jne 1b9e <_sk_scale_u8_hsw+0x54>
+ DB 117,59 ; jne 1bbc <_sk_scale_u8_hsw+0x54>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,191,163,2,0 ; vpand 0x2a3bf(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,129,169,2,0 ; vpand 0x2a981(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,128,154,2,0 ; vbroadcastss 0x29a80(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,78,160,2,0 ; vbroadcastss 0x2a04e(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1692,15 +1695,15 @@ _sk_scale_u8_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,182 ; ja 1b69 <_sk_scale_u8_hsw+0x1f>
+ DB 119,182 ; ja 1b87 <_sk_scale_u8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 1c38 <_sk_scale_u8_hsw+0xee>
+ DB 76,141,29,124,0,0,0 ; lea 0x7c(%rip),%r11 # 1c58 <_sk_scale_u8_hsw+0xf0>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,151 ; jmp 1b69 <_sk_scale_u8_hsw+0x1f>
+ DB 235,151 ; jmp 1b87 <_sk_scale_u8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -1708,7 +1711,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,110,255,255,255 ; jmpq 1b69 <_sk_scale_u8_hsw+0x1f>
+ DB 233,110,255,255,255 ; jmpq 1b87 <_sk_scale_u8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1719,22 +1722,111 @@ _sk_scale_u8_hsw LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,50,255,255,255 ; jmpq 1b69 <_sk_scale_u8_hsw+0x1f>
- DB 144 ; nop
- DB 143 ; (bad)
+ DB 233,50,255,255,255 ; jmpq 1b87 <_sk_scale_u8_hsw+0x1f>
+ DB 15,31,0 ; nopl (%rax)
+ DB 141 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,170,255,255,255,154 ; ljmp *-0x65000001(%rdx)
+ DB 255,168,255,255,255,152 ; ljmp *-0x67000001(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf001c48 <_sk_overlay_sse2_8bit+0xffffffffdefd6b27>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,211 ; callq *%rbx
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
+ DB 255,209 ; callq *%rcx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,193 ; inc %ecx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
+PUBLIC _sk_scale_565_hsw
+_sk_scale_565_hsw LABEL PROC
+ DB 83 ; push %rbx
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 72,99,218 ; movslq %edx,%rbx
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,162,0,0,0 ; jne 1d36 <_sk_scale_565_hsw+0xc2>
+ DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
+ DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
+ DB 196,98,125,88,13,76,159,2,0 ; vpbroadcastd 0x29f4c(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
+ DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
+ DB 196,98,125,24,21,61,159,2,0 ; vbroadcastss 0x29f3d(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
+ DB 196,98,125,88,21,51,159,2,0 ; vpbroadcastd 0x29f33(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
+ DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
+ DB 196,98,125,24,29,36,159,2,0 ; vbroadcastss 0x29f24(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
+ DB 196,98,125,88,29,26,159,2,0 ; vpbroadcastd 0x29f1a(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
+ DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
+ DB 196,98,125,24,29,11,159,2,0 ; vbroadcastss 0x29f0b(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
+ DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2
+ DB 197,164,89,219 ; vmulps %ymm3,%ymm11,%ymm3
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 91 ; pop %rbx
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,7 ; and $0x7,%r10b
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 65,254,202 ; dec %r10b
+ DB 65,128,250,6 ; cmp $0x6,%r10b
+ DB 15,135,75,255,255,255 ; ja 1c9a <_sk_scale_565_hsw+0x26>
+ DB 69,15,182,210 ; movzbl %r10b,%r10d
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 1dc0 <_sk_scale_565_hsw+0x14c>
+ DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
+ DB 76,1,216 ; add %r11,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 233,41,255,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
+ DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ DB 233,11,255,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
+ DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ DB 233,221,254,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26>
+ DB 15,31,0 ; nopl (%rax)
+ DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
- DB 255,195 ; inc %ebx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 236 ; in (%dx),%al
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,228 ; jmpq *%rsp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -1764,12 +1856,12 @@ _sk_lerp_u8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,79 ; jne 1ceb <_sk_lerp_u8_hsw+0x68>
+ DB 117,79 ; jne 1e73 <_sk_lerp_u8_hsw+0x68>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,134,162,2,0 ; vpand 0x2a286(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,222,166,2,0 ; vpand 0x2a6de(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,71,153,2,0 ; vbroadcastss 0x29947(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,171,157,2,0 ; vbroadcastss 0x29dab(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1787,15 +1879,15 @@ _sk_lerp_u8_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,162 ; ja 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 119,162 ; ja 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 1d84 <_sk_lerp_u8_hsw+0x101>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 1f0c <_sk_lerp_u8_hsw+0x101>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,131 ; jmp 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 235,131 ; jmp 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -1803,7 +1895,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,90,255,255,255 ; jmpq 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 233,90,255,255,255 ; jmpq 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1814,7 +1906,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,30,255,255,255 ; jmpq 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 233,30,255,255,255 ; jmpq 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 144 ; nop
DB 255 ; (bad)
DB 255 ; (bad)
@@ -1847,24 +1939,30 @@ _sk_lerp_565_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,170,0,0,0 ; jne 1e6a <_sk_lerp_565_hsw+0xca>
+ DB 15,133,182,0,0,0 ; jne 1ffe <_sk_lerp_565_hsw+0xd6>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,52,152,2,0 ; vpbroadcastd 0x29834(%rip),%ymm9 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,88,13,152,156,2,0 ; vpbroadcastd 0x29c98(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,37,152,2,0 ; vbroadcastss 0x29825(%rip),%ymm10 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,137,156,2,0 ; vbroadcastss 0x29c89(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,27,152,2,0 ; vpbroadcastd 0x2981b(%rip),%ymm10 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,88,21,127,156,2,0 ; vpbroadcastd 0x29c7f(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,12,152,2,0 ; vbroadcastss 0x2980c(%rip),%ymm11 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,112,156,2,0 ; vbroadcastss 0x29c70(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,2,152,2,0 ; vpbroadcastd 0x29802(%rip),%ymm11 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,88,29,102,156,2,0 ; vpbroadcastd 0x29c66(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,243,151,2,0 ; vbroadcastss 0x297f3(%rip),%ymm11 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,87,156,2,0 ; vbroadcastss 0x29c57(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
@@ -1872,11 +1970,7 @@ _sk_lerp_565_hsw LABEL PROC
DB 197,236,92,214 ; vsubps %ymm6,%ymm2,%ymm2
DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
DB 197,228,92,223 ; vsubps %ymm7,%ymm3,%ymm3
- DB 196,98,101,168,207 ; vfmadd213ps %ymm7,%ymm3,%ymm9
- DB 196,98,101,168,215 ; vfmadd213ps %ymm7,%ymm3,%ymm10
- DB 196,98,101,168,199 ; vfmadd213ps %ymm7,%ymm3,%ymm8
- DB 196,193,44,95,216 ; vmaxps %ymm8,%ymm10,%ymm3
- DB 197,180,95,219 ; vmaxps %ymm3,%ymm9,%ymm3
+ DB 196,226,37,168,223 ; vfmadd213ps %ymm7,%ymm11,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -1885,27 +1979,27 @@ _sk_lerp_565_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,67,255,255,255 ; ja 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 15,135,55,255,255,255 ; ja 1f4e <_sk_lerp_565_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 1ef4 <_sk_lerp_565_hsw+0x154>
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 2088 <_sk_lerp_565_hsw+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,33,255,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 233,21,255,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,3,255,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,213,254,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 233,201,254,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26>
DB 15,31,0 ; nopl (%rax)
DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
@@ -1930,23 +2024,23 @@ _sk_load_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 117,103 ; jne 1f81 <_sk_load_tables_hsw+0x71>
+ DB 117,103 ; jne 2115 <_sk_load_tables_hsw+0x71>
DB 196,193,126,111,28,145 ; vmovdqu (%r9,%rdx,4),%ymm3
- DB 197,229,219,13,120,152,2,0 ; vpand 0x29878(%rip),%ymm3,%ymm1 # 2b7a0 <_sk_overlay_sse2_8bit+0x67f>
+ DB 197,229,219,13,196,156,2,0 ; vpand 0x29cc4(%rip),%ymm3,%ymm1 # 2bd80 <_sk_overlay_sse2_8bit+0x673>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 76,139,80,16 ; mov 0x10(%rax),%r10
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,194,109,146,4,137 ; vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
- DB 196,226,101,0,21,120,152,2,0 ; vpshufb 0x29878(%rip),%ymm3,%ymm2 # 2b7c0 <_sk_overlay_sse2_8bit+0x69f>
+ DB 196,226,101,0,21,196,156,2,0 ; vpshufb 0x29cc4(%rip),%ymm3,%ymm2 # 2bda0 <_sk_overlay_sse2_8bit+0x693>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,128,152,2,0 ; vpshufb 0x29880(%rip),%ymm3,%ymm9 # 2b7e0 <_sk_overlay_sse2_8bit+0x6bf>
+ DB 196,98,101,0,13,204,156,2,0 ; vpshufb 0x29ccc(%rip),%ymm3,%ymm9 # 2bdc0 <_sk_overlay_sse2_8bit+0x6b3>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,140,150,2,0 ; vbroadcastss 0x2968c(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,228,154,2,0 ; vbroadcastss 0x29ae4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1955,21 +2049,21 @@ _sk_load_tables_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,139 ; ja 1f20 <_sk_load_tables_hsw+0x10>
+ DB 119,139 ; ja 20b4 <_sk_load_tables_hsw+0x10>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,140,0,0,0 ; lea 0x8c(%rip),%r11 # 202c <_sk_load_tables_hsw+0x11c>
+ DB 76,141,29,140,0,0,0 ; lea 0x8c(%rip),%r11 # 21c0 <_sk_load_tables_hsw+0x11c>
DB 79,99,20,147 ; movslq (%r11,%r10,4),%r10
DB 77,1,218 ; add %r11,%r10
DB 65,255,226 ; jmpq *%r10
DB 196,193,121,110,28,145 ; vmovd (%r9,%rdx,4),%xmm3
- DB 233,107,255,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10>
+ DB 233,107,255,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10>
DB 196,193,121,110,68,145,8 ; vmovd 0x8(%r9,%rdx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,145 ; vmovq (%r9,%rdx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,68,255,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10>
+ DB 233,68,255,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10>
DB 196,193,121,110,68,145,24 ; vmovd 0x18(%r9,%rdx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -1982,9 +2076,9 @@ _sk_load_tables_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,145 ; vmovdqu (%r9,%rdx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,245,254,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10>
+ DB 233,245,254,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10>
DB 144 ; nop
- DB 126,255 ; jle 202d <_sk_load_tables_hsw+0x11d>
+ DB 126,255 ; jle 21c1 <_sk_load_tables_hsw+0x11d>
DB 255 ; (bad)
DB 255,159,255,255,255,137 ; lcall *-0x76000001(%rdi)
DB 255 ; (bad)
@@ -2010,7 +2104,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,201,0,0,0 ; jne 2127 <_sk_load_tables_u16_be_hsw+0xdf>
+ DB 15,133,201,0,0,0 ; jne 22bb <_sk_load_tables_u16_be_hsw+0xdf>
DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8
DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2
DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -2026,7 +2120,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,129,158,2,0 ; vmovdqa 0x29e81(%rip),%xmm10 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,21,205,162,2,0 ; vmovdqa 0x2a2cd(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -2048,36 +2142,36 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,2,149,2,0 ; vbroadcastss 0x29502(%rip),%ymm8 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,5,90,153,2,0 ; vbroadcastss 0x2995a(%rip),%ymm8 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 218d <_sk_load_tables_u16_be_hsw+0x145>
+ DB 116,85 ; je 2321 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 218d <_sk_load_tables_u16_be_hsw+0x145>
+ DB 114,72 ; jb 2321 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 219a <_sk_load_tables_u16_be_hsw+0x152>
+ DB 116,72 ; je 232e <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 219a <_sk_load_tables_u16_be_hsw+0x152>
+ DB 114,59 ; jb 232e <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,9,255,255,255 ; je 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,132,9,255,255,255 ; je 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,248,254,255,255 ; jb 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,130,248,254,255,255 ; jb 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9
- DB 233,236,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,236,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,223,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,223,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,214,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,214,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31>
PUBLIC _sk_load_tables_rgb_u16_be_hsw
_sk_load_tables_rgb_u16_be_hsw LABEL PROC
@@ -2085,7 +2179,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,193,0,0,0 ; jne 2276 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ DB 15,133,193,0,0,0 ; jne 240a <_sk_load_tables_rgb_u16_be_hsw+0xd3>
DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -2106,7 +2200,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,17,157,2,0 ; vmovdqa 0x29d11(%rip),%xmm9 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,13,93,161,2,0 ; vmovdqa 0x2a15d(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -2123,46 +2217,46 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8
DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,28,147,2,0 ; vbroadcastss 0x2931c(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,116,151,2,0 ; vbroadcastss 0x29774(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 228f <_sk_load_tables_rgb_u16_be_hsw+0xec>
- DB 233,90,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,5 ; jne 2423 <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ DB 233,90,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 22be <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ DB 114,26 ; jb 2452 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 22c3 <_sk_load_tables_rgb_u16_be_hsw+0x120>
- DB 233,43,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,38,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 2457 <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ DB 233,43,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,38,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 22f2 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ DB 114,26 ; jb 2486 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 22f7 <_sk_load_tables_rgb_u16_be_hsw+0x154>
- DB 233,247,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,242,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 248b <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ DB 233,247,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,242,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 2320 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ DB 114,20 ; jb 24b4 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,201,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,196,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,201,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,196,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,140,146,2,0 ; vbroadcastss 0x2928c(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,228,150,2,0 ; vbroadcastss 0x296e4(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -2284,7 +2378,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,117,144,2,0 ; vbroadcastss 0x29075(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,205,148,2,0 ; vbroadcastss 0x294cd(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2398,7 +2492,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,93,142,2,0 ; vbroadcastss 0x28e5d(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,181,146,2,0 ; vbroadcastss 0x292b5(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2487,33 +2581,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,83,141,2,0 ; vbroadcastss 0x28d53(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,78,141,2,0 ; vbroadcastss 0x28d4e(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,171,145,2,0 ; vbroadcastss 0x291ab(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,166,145,2,0 ; vbroadcastss 0x291a6(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,164,140,2,0 ; vbroadcastss 0x28ca4(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,252,144,2,0 ; vbroadcastss 0x290fc(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,54,141,2,0 ; vbroadcastss 0x28d36(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,142,145,2,0 ; vbroadcastss 0x2918e(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,44,141,2,0 ; vbroadcastss 0x28d2c(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,132,145,2,0 ; vbroadcastss 0x29184(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,34,141,2,0 ; vbroadcastss 0x28d22(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,122,145,2,0 ; vbroadcastss 0x2917a(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,24,141,2,0 ; vbroadcastss 0x28d18(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,112,145,2,0 ; vbroadcastss 0x29170(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,249,140,2,0 ; vbroadcastss 0x28cf9(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,81,145,2,0 ; vbroadcastss 0x29151(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,239,140,2,0 ; vbroadcastss 0x28cef(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,71,145,2,0 ; vbroadcastss 0x29147(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,229,140,2,0 ; vbroadcastss 0x28ce5(%rip),%ymm0 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,5,61,145,2,0 ; vbroadcastss 0x2913d(%rip),%ymm0 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,219,140,2,0 ; vbroadcastss 0x28cdb(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,51,145,2,0 ; vbroadcastss 0x29133(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,206,140,2,0 ; vbroadcastss 0x28cce(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,38,145,2,0 ; vbroadcastss 0x29126(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2521,7 +2615,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,229,139,2,0 ; vbroadcastss 0x28be5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,61,144,2,0 ; vbroadcastss 0x2903d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2539,33 +2633,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,45,140,2,0 ; vbroadcastss 0x28c2d(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,40,140,2,0 ; vbroadcastss 0x28c28(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,133,144,2,0 ; vbroadcastss 0x29085(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,128,144,2,0 ; vbroadcastss 0x29080(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,126,139,2,0 ; vbroadcastss 0x28b7e(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,214,143,2,0 ; vbroadcastss 0x28fd6(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,16,140,2,0 ; vbroadcastss 0x28c10(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,104,144,2,0 ; vbroadcastss 0x29068(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,6,140,2,0 ; vbroadcastss 0x28c06(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,94,144,2,0 ; vbroadcastss 0x2905e(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,252,139,2,0 ; vbroadcastss 0x28bfc(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,84,144,2,0 ; vbroadcastss 0x29054(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,242,139,2,0 ; vbroadcastss 0x28bf2(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,74,144,2,0 ; vbroadcastss 0x2904a(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,211,139,2,0 ; vbroadcastss 0x28bd3(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,43,144,2,0 ; vbroadcastss 0x2902b(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,201,139,2,0 ; vbroadcastss 0x28bc9(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,33,144,2,0 ; vbroadcastss 0x29021(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,191,139,2,0 ; vbroadcastss 0x28bbf(%rip),%ymm1 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,13,23,144,2,0 ; vbroadcastss 0x29017(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,181,139,2,0 ; vbroadcastss 0x28bb5(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,13,144,2,0 ; vbroadcastss 0x2900d(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,168,139,2,0 ; vbroadcastss 0x28ba8(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,0,144,2,0 ; vbroadcastss 0x29000(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2573,7 +2667,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,191,138,2,0 ; vbroadcastss 0x28abf(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,23,143,2,0 ; vbroadcastss 0x28f17(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2591,33 +2685,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,7,139,2,0 ; vbroadcastss 0x28b07(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,2,139,2,0 ; vbroadcastss 0x28b02(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,95,143,2,0 ; vbroadcastss 0x28f5f(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,90,143,2,0 ; vbroadcastss 0x28f5a(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,88,138,2,0 ; vbroadcastss 0x28a58(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,176,142,2,0 ; vbroadcastss 0x28eb0(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,234,138,2,0 ; vbroadcastss 0x28aea(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,66,143,2,0 ; vbroadcastss 0x28f42(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,224,138,2,0 ; vbroadcastss 0x28ae0(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,56,143,2,0 ; vbroadcastss 0x28f38(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,214,138,2,0 ; vbroadcastss 0x28ad6(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,46,143,2,0 ; vbroadcastss 0x28f2e(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,204,138,2,0 ; vbroadcastss 0x28acc(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,36,143,2,0 ; vbroadcastss 0x28f24(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,173,138,2,0 ; vbroadcastss 0x28aad(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,5,143,2,0 ; vbroadcastss 0x28f05(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,163,138,2,0 ; vbroadcastss 0x28aa3(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,251,142,2,0 ; vbroadcastss 0x28efb(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,153,138,2,0 ; vbroadcastss 0x28a99(%rip),%ymm2 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,21,241,142,2,0 ; vbroadcastss 0x28ef1(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,143,138,2,0 ; vbroadcastss 0x28a8f(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,231,142,2,0 ; vbroadcastss 0x28ee7(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,130,138,2,0 ; vbroadcastss 0x28a82(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,218,142,2,0 ; vbroadcastss 0x28eda(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2625,7 +2719,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,153,137,2,0 ; vbroadcastss 0x28999(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,241,141,2,0 ; vbroadcastss 0x28df1(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2643,33 +2737,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,225,137,2,0 ; vbroadcastss 0x289e1(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,220,137,2,0 ; vbroadcastss 0x289dc(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,57,142,2,0 ; vbroadcastss 0x28e39(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,52,142,2,0 ; vbroadcastss 0x28e34(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,50,137,2,0 ; vbroadcastss 0x28932(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,138,141,2,0 ; vbroadcastss 0x28d8a(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,196,137,2,0 ; vbroadcastss 0x289c4(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,28,142,2,0 ; vbroadcastss 0x28e1c(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,186,137,2,0 ; vbroadcastss 0x289ba(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,18,142,2,0 ; vbroadcastss 0x28e12(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,176,137,2,0 ; vbroadcastss 0x289b0(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,8,142,2,0 ; vbroadcastss 0x28e08(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,166,137,2,0 ; vbroadcastss 0x289a6(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,254,141,2,0 ; vbroadcastss 0x28dfe(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,135,137,2,0 ; vbroadcastss 0x28987(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,223,141,2,0 ; vbroadcastss 0x28ddf(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,125,137,2,0 ; vbroadcastss 0x2897d(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,213,141,2,0 ; vbroadcastss 0x28dd5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,115,137,2,0 ; vbroadcastss 0x28973(%rip),%ymm3 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,29,203,141,2,0 ; vbroadcastss 0x28dcb(%rip),%ymm3 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,105,137,2,0 ; vbroadcastss 0x28969(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,193,141,2,0 ; vbroadcastss 0x28dc1(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,92,137,2,0 ; vbroadcastss 0x2895c(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,180,141,2,0 ; vbroadcastss 0x28db4(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2677,7 +2771,7 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,115,136,2,0 ; vbroadcastss 0x28873(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,203,140,2,0 ; vbroadcastss 0x28ccb(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2694,35 +2788,35 @@ _sk_gamma_hsw LABEL PROC
DB 197,252,40,241 ; vmovaps %ymm1,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10
- DB 196,98,125,24,29,192,136,2,0 ; vbroadcastss 0x288c0(%rip),%ymm11 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,226,125,24,45,187,136,2,0 ; vbroadcastss 0x288bb(%rip),%ymm5 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,29,24,141,2,0 ; vbroadcastss 0x28d18(%rip),%ymm11 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,226,125,24,45,19,141,2,0 ; vbroadcastss 0x28d13(%rip),%ymm5 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9
- DB 196,226,125,24,37,18,136,2,0 ; vbroadcastss 0x28812(%rip),%ymm4 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,37,106,140,2,0 ; vbroadcastss 0x28c6a(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12
- DB 196,98,125,24,45,165,136,2,0 ; vbroadcastss 0x288a5(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,253,140,2,0 ; vbroadcastss 0x28cfd(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10
- DB 196,98,125,24,13,155,136,2,0 ; vbroadcastss 0x2889b(%rip),%ymm9 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,13,243,140,2,0 ; vbroadcastss 0x28cf3(%rip),%ymm9 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10
DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14
DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14
DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15
DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15
- DB 196,98,125,24,29,127,136,2,0 ; vbroadcastss 0x2887f(%rip),%ymm11 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,29,215,140,2,0 ; vbroadcastss 0x28cd7(%rip),%ymm11 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12
- DB 196,98,125,24,45,117,136,2,0 ; vbroadcastss 0x28875(%rip),%ymm13 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,45,205,140,2,0 ; vbroadcastss 0x28ccd(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12
DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10
DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8
DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8
- DB 196,226,125,24,21,81,136,2,0 ; vbroadcastss 0x28851(%rip),%ymm2 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,226,125,24,21,169,140,2,0 ; vbroadcastss 0x28ca9(%rip),%ymm2 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10
- DB 196,226,125,24,29,72,136,2,0 ; vbroadcastss 0x28848(%rip),%ymm3 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,226,125,24,29,160,140,2,0 ; vbroadcastss 0x28ca0(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10
- DB 196,226,125,24,13,62,136,2,0 ; vbroadcastss 0x2883e(%rip),%ymm1 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,13,150,140,2,0 ; vbroadcastss 0x28c96(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,5,52,136,2,0 ; vbroadcastss 0x28834(%rip),%ymm0 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,226,125,24,5,140,140,2,0 ; vbroadcastss 0x28c8c(%rip),%ymm0 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6
@@ -2753,7 +2847,7 @@ _sk_gamma_hsw LABEL PROC
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
- DB 196,226,125,24,13,165,135,2,0 ; vbroadcastss 0x287a5(%rip),%ymm1 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,226,125,24,13,253,139,2,0 ; vbroadcastss 0x28bfd(%rip),%ymm1 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2
DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3
DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4
@@ -2771,26 +2865,26 @@ _sk_gamma_hsw LABEL PROC
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,93,135,2,0 ; vbroadcastss 0x2875d(%rip),%ymm8 # 2b650 <_sk_overlay_sse2_8bit+0x52f>
- DB 196,98,125,24,13,192,134,2,0 ; vbroadcastss 0x286c0(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
- DB 196,98,125,24,21,79,135,2,0 ; vbroadcastss 0x2874f(%rip),%ymm10 # 2b654 <_sk_overlay_sse2_8bit+0x533>
+ DB 196,98,125,24,5,181,139,2,0 ; vbroadcastss 0x28bb5(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f>
+ DB 196,98,125,24,13,24,139,2,0 ; vbroadcastss 0x28b18(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,21,167,139,2,0 ; vbroadcastss 0x28ba7(%rip),%ymm10 # 2bc40 <_sk_overlay_sse2_8bit+0x533>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,64,135,2,0 ; vbroadcastss 0x28740(%rip),%ymm9 # 2b658 <_sk_overlay_sse2_8bit+0x537>
+ DB 196,98,125,24,13,152,139,2,0 ; vbroadcastss 0x28b98(%rip),%ymm9 # 2bc44 <_sk_overlay_sse2_8bit+0x537>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,54,135,2,0 ; vbroadcastss 0x28736(%rip),%ymm0 # 2b65c <_sk_overlay_sse2_8bit+0x53b>
+ DB 196,226,125,24,5,142,139,2,0 ; vbroadcastss 0x28b8e(%rip),%ymm0 # 2bc48 <_sk_overlay_sse2_8bit+0x53b>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,45,135,2,0 ; vbroadcastss 0x2872d(%rip),%ymm8 # 2b660 <_sk_overlay_sse2_8bit+0x53f>
+ DB 196,98,125,24,5,133,139,2,0 ; vbroadcastss 0x28b85(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,35,135,2,0 ; vbroadcastss 0x28723(%rip),%ymm9 # 2b664 <_sk_overlay_sse2_8bit+0x543>
+ DB 196,98,125,24,13,123,139,2,0 ; vbroadcastss 0x28b7b(%rip),%ymm9 # 2bc50 <_sk_overlay_sse2_8bit+0x543>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,16,135,2,0 ; vbroadcastss 0x28710(%rip),%ymm2 # 2b668 <_sk_overlay_sse2_8bit+0x547>
+ DB 196,226,125,24,21,104,139,2,0 ; vbroadcastss 0x28b68(%rip),%ymm2 # 2bc54 <_sk_overlay_sse2_8bit+0x547>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,6,135,2,0 ; vbroadcastss 0x28706(%rip),%ymm11 # 2b66c <_sk_overlay_sse2_8bit+0x54b>
+ DB 196,98,125,24,29,94,139,2,0 ; vbroadcastss 0x28b5e(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,252,134,2,0 ; vbroadcastss 0x286fc(%rip),%ymm12 # 2b670 <_sk_overlay_sse2_8bit+0x54f>
+ DB 196,98,125,24,37,84,139,2,0 ; vbroadcastss 0x28b54(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2805,9 +2899,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,177,134,2,0 ; vbroadcastss 0x286b1(%rip),%ymm0 # 2b674 <_sk_overlay_sse2_8bit+0x553>
+ DB 196,226,125,24,5,9,139,2,0 ; vbroadcastss 0x28b09(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,168,134,2,0 ; vbroadcastss 0x286a8(%rip),%ymm8 # 2b678 <_sk_overlay_sse2_8bit+0x557>
+ DB 196,98,125,24,5,0,139,2,0 ; vbroadcastss 0x28b00(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2822,12 +2916,12 @@ _sk_load_a8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 3027 <_sk_load_a8_hsw+0x4e>
+ DB 117,53 ; jne 31bb <_sk_load_a8_hsw+0x4e>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,48,143,2,0 ; vpand 0x28f30(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,124,147,2,0 ; vpand 0x2937c(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,242,133,2,0 ; vbroadcastss 0x285f2(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,74,138,2,0 ; vbroadcastss 0x28a4a(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2840,15 +2934,15 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 119,189 ; ja 318c <_sk_load_a8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 30c0 <_sk_load_a8_hsw+0xe7>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3254 <_sk_load_a8_hsw+0xe7>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,158 ; jmp 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 235,158 ; jmp 318c <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -2856,7 +2950,7 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,118,255,255,255 ; jmpq 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2867,7 +2961,7 @@ _sk_load_a8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,59,255,255,255 ; jmpq 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -2899,12 +2993,12 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 312a <_sk_load_a8_dst_hsw+0x4e>
+ DB 117,53 ; jne 32be <_sk_load_a8_dst_hsw+0x4e>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,45,142,2,0 ; vpand 0x28e2d(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,121,146,2,0 ; vpand 0x29279(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,239,132,2,0 ; vbroadcastss 0x284ef(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,71,137,2,0 ; vbroadcastss 0x28947(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -2917,15 +3011,15 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 119,189 ; ja 328f <_sk_load_a8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 31c0 <_sk_load_a8_dst_hsw+0xe4>
+ DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 3354 <_sk_load_a8_dst_hsw+0xe4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,158 ; jmp 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 235,158 ; jmp 328f <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -2933,7 +3027,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,118,255,255,255 ; jmpq 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -2944,7 +3038,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,59,255,255,255 ; jmpq 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3003,7 +3097,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,114,131,2,0 ; vbroadcastss 0x28372(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,202,135,2,0 ; vbroadcastss 0x287ca(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -3020,14 +3114,14 @@ _sk_store_a8_hsw LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,249,130,2,0 ; vbroadcastss 0x282f9(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,81,135,2,0 ; vbroadcastss 0x28751(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 32ed <_sk_store_a8_hsw+0x47>
+ DB 117,11 ; jne 3481 <_sk_store_a8_hsw+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3036,25 +3130,25 @@ _sk_store_a8_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 32e8 <_sk_store_a8_hsw+0x42>
+ DB 119,235 ; ja 347c <_sk_store_a8_hsw+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 3364 <_sk_store_a8_hsw+0xbe>
+ DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 34f8 <_sk_store_a8_hsw+0xbe>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp 32e8 <_sk_store_a8_hsw+0x42>
+ DB 235,201 ; jmp 347c <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,16,140,2,0 ; vpshufb 0x28c10(%rip),%xmm8,%xmm8 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f>
+ DB 196,98,57,0,5,92,144,2,0 ; vpshufb 0x2905c(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp 32e8 <_sk_store_a8_hsw+0x42>
+ DB 235,175 ; jmp 347c <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,246,139,2,0 ; vpshufb 0x28bf6(%rip),%xmm8,%xmm8 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f>
+ DB 196,98,57,0,5,66,144,2,0 ; vpshufb 0x29042(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp 32e8 <_sk_store_a8_hsw+0x42>
+ DB 235,134 ; jmp 347c <_sk_store_a8_hsw+0x42>
DB 102,144 ; xchg %ax,%ax
DB 178,255 ; mov $0xff,%dl
DB 255 ; (bad)
@@ -3086,15 +3180,15 @@ _sk_load_g8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 33d3 <_sk_load_g8_hsw+0x53>
+ DB 117,58 ; jne 3567 <_sk_load_g8_hsw+0x53>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,137,139,2,0 ; vpand 0x28b89(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,213,143,2,0 ; vpand 0x28fd5(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,75,130,2,0 ; vbroadcastss 0x2824b(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,163,134,2,0 ; vbroadcastss 0x286a3(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,200,129,2,0 ; vbroadcastss 0x281c8(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,32,134,2,0 ; vbroadcastss 0x28620(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -3104,15 +3198,15 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 339f <_sk_load_g8_hsw+0x1f>
+ DB 119,184 ; ja 3533 <_sk_load_g8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 346c <_sk_load_g8_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3600 <_sk_load_g8_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,153 ; jmp 339f <_sk_load_g8_hsw+0x1f>
+ DB 235,153 ; jmp 3533 <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -3120,7 +3214,7 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,113,255,255,255 ; jmpq 339f <_sk_load_g8_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -3131,7 +3225,7 @@ _sk_load_g8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,54,255,255,255 ; jmpq 339f <_sk_load_g8_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -3163,15 +3257,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 34db <_sk_load_g8_dst_hsw+0x53>
+ DB 117,58 ; jne 366f <_sk_load_g8_dst_hsw+0x53>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,129,138,2,0 ; vpand 0x28a81(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,205,142,2,0 ; vpand 0x28ecd(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,67,129,2,0 ; vbroadcastss 0x28143(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,155,133,2,0 ; vbroadcastss 0x2859b(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,192,128,2,0 ; vbroadcastss 0x280c0(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,24,133,2,0 ; vbroadcastss 0x28518(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -3181,15 +3275,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 119,184 ; ja 363b <_sk_load_g8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3574 <_sk_load_g8_dst_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3708 <_sk_load_g8_dst_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,153 ; jmp 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 235,153 ; jmp 363b <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -3197,7 +3291,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,113,255,255,255 ; jmpq 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -3208,7 +3302,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,54,255,255,255 ; jmpq 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -3268,10 +3362,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,190,127,2,0 ; vbroadcastss 0x27fbe(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,22,132,2,0 ; vbroadcastss 0x28416(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,59,127,2,0 ; vbroadcastss 0x27f3b(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,147,131,2,0 ; vbroadcastss 0x28393(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -3287,26 +3381,26 @@ _sk_load_565_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 36ee <_sk_load_565_hsw+0x8f>
+ DB 117,115 ; jne 3882 <_sk_load_565_hsw+0x8f>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,121,127,2,0 ; vpbroadcastd 0x27f79(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,5,209,131,2,0 ; vpbroadcastd 0x283d1(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,108,127,2,0 ; vbroadcastss 0x27f6c(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,196,131,2,0 ; vbroadcastss 0x283c4(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,99,127,2,0 ; vpbroadcastd 0x27f63(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,13,187,131,2,0 ; vpbroadcastd 0x283bb(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,86,127,2,0 ; vbroadcastss 0x27f56(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,174,131,2,0 ; vbroadcastss 0x283ae(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,77,127,2,0 ; vpbroadcastd 0x27f4d(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,29,165,131,2,0 ; vpbroadcastd 0x283a5(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,64,127,2,0 ; vbroadcastss 0x27f40(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,152,131,2,0 ; vbroadcastss 0x28398(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,165,126,2,0 ; vbroadcastss 0x27ea5(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,253,130,2,0 ; vbroadcastss 0x282fd(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3314,27 +3408,27 @@ _sk_load_565_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 3681 <_sk_load_565_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 3815 <_sk_load_565_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3774 <_sk_load_565_hsw+0x115>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3908 <_sk_load_565_hsw+0x115>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,89,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,60,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,15,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3366,26 +3460,26 @@ _sk_load_565_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 381f <_sk_load_565_dst_hsw+0x8f>
+ DB 117,115 ; jne 39b3 <_sk_load_565_dst_hsw+0x8f>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6
- DB 196,226,125,88,37,72,126,2,0 ; vpbroadcastd 0x27e48(%rip),%ymm4 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,37,160,130,2,0 ; vpbroadcastd 0x282a0(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,59,126,2,0 ; vbroadcastss 0x27e3b(%rip),%ymm5 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,45,147,130,2,0 ; vbroadcastss 0x28293(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,50,126,2,0 ; vpbroadcastd 0x27e32(%rip),%ymm5 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,45,138,130,2,0 ; vpbroadcastd 0x2828a(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,37,126,2,0 ; vbroadcastss 0x27e25(%rip),%ymm7 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,61,125,130,2,0 ; vbroadcastss 0x2827d(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,88,61,28,126,2,0 ; vpbroadcastd 0x27e1c(%rip),%ymm7 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,61,116,130,2,0 ; vpbroadcastd 0x28274(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,15,126,2,0 ; vbroadcastss 0x27e0f(%rip),%ymm7 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,61,103,130,2,0 ; vbroadcastss 0x28267(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,116,125,2,0 ; vbroadcastss 0x27d74(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,204,129,2,0 ; vbroadcastss 0x281cc(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3393,27 +3487,27 @@ _sk_load_565_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 3946 <_sk_load_565_dst_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 38a4 <_sk_load_565_dst_hsw+0x114>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3a38 <_sk_load_565_dst_hsw+0x114>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,89,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,60,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,15,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3474,23 +3568,23 @@ _sk_gather_565_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,151,124,2,0 ; vpbroadcastd 0x27c97(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,5,239,128,2,0 ; vpbroadcastd 0x280ef(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,138,124,2,0 ; vbroadcastss 0x27c8a(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,226,128,2,0 ; vbroadcastss 0x280e2(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,129,124,2,0 ; vpbroadcastd 0x27c81(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,13,217,128,2,0 ; vpbroadcastd 0x280d9(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,116,124,2,0 ; vbroadcastss 0x27c74(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,204,128,2,0 ; vbroadcastss 0x280cc(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,107,124,2,0 ; vpbroadcastd 0x27c6b(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,29,195,128,2,0 ; vpbroadcastd 0x280c3(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,94,124,2,0 ; vbroadcastss 0x27c5e(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,182,128,2,0 ; vbroadcastss 0x280b6(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,195,123,2,0 ; vbroadcastss 0x27bc3(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,27,128,2,0 ; vbroadcastss 0x2801b(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_hsw
@@ -3503,11 +3597,11 @@ _sk_store_565_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,141,124,2,0 ; vbroadcastss 0x27c8d(%rip),%ymm8 # 2b67c <_sk_overlay_sse2_8bit+0x55b>
+ DB 196,98,125,24,5,229,128,2,0 ; vbroadcastss 0x280e5(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,120,124,2,0 ; vbroadcastss 0x27c78(%rip),%ymm10 # 2b680 <_sk_overlay_sse2_8bit+0x55f>
+ DB 196,98,125,24,21,208,128,2,0 ; vbroadcastss 0x280d0(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3518,7 +3612,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3a47 <_sk_store_565_hsw+0x78>
+ DB 117,11 ; jne 3bdb <_sk_store_565_hsw+0x78>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3527,22 +3621,22 @@ _sk_store_565_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 3a42 <_sk_store_565_hsw+0x73>
+ DB 119,235 ; ja 3bd6 <_sk_store_565_hsw+0x73>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3aa4 <_sk_store_565_hsw+0xd5>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3c38 <_sk_store_565_hsw+0xd5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 3a42 <_sk_store_565_hsw+0x73>
+ DB 235,206 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 3a42 <_sk_store_565_hsw+0x73>
+ DB 235,190 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 3a42 <_sk_store_565_hsw+0x73>
+ DB 235,158 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3560,7 +3654,7 @@ _sk_store_565_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003abc <_sk_overlay_sse2_8bit+0xffffffffe0fd899b>
+ DB 232,255,255,255,224 ; callq ffffffffe1003c50 <_sk_overlay_sse2_8bit+0xffffffffe0fd8543>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3576,28 +3670,28 @@ _sk_load_4444_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 3b6b <_sk_load_4444_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 3cff <_sk_load_4444_hsw+0xab>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,144,123,2,0 ; vpbroadcastd 0x27b90(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,5,232,127,2,0 ; vpbroadcastd 0x27fe8(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,131,123,2,0 ; vbroadcastss 0x27b83(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,219,127,2,0 ; vbroadcastss 0x27fdb(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,122,123,2,0 ; vpbroadcastd 0x27b7a(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,13,210,127,2,0 ; vpbroadcastd 0x27fd2(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,109,123,2,0 ; vbroadcastss 0x27b6d(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,197,127,2,0 ; vbroadcastss 0x27fc5(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,100,123,2,0 ; vpbroadcastd 0x27b64(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,21,188,127,2,0 ; vpbroadcastd 0x27fbc(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,87,123,2,0 ; vbroadcastss 0x27b57(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,175,127,2,0 ; vbroadcastss 0x27faf(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,77,123,2,0 ; vpbroadcastd 0x27b4d(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,165,127,2,0 ; vpbroadcastd 0x27fa5(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,63,123,2,0 ; vbroadcastss 0x27b3f(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,151,127,2,0 ; vbroadcastss 0x27f97(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3607,27 +3701,27 @@ _sk_load_4444_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3c7a <_sk_load_4444_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3bf0 <_sk_load_4444_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3d84 <_sk_load_4444_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,65,255,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,36,255,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,247,254,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3660,28 +3754,28 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 3cb7 <_sk_load_4444_dst_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 3e4b <_sk_load_4444_dst_hsw+0xab>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7
- DB 196,226,125,88,37,68,122,2,0 ; vpbroadcastd 0x27a44(%rip),%ymm4 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,37,156,126,2,0 ; vpbroadcastd 0x27e9c(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,55,122,2,0 ; vbroadcastss 0x27a37(%rip),%ymm5 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,45,143,126,2,0 ; vbroadcastss 0x27e8f(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,46,122,2,0 ; vpbroadcastd 0x27a2e(%rip),%ymm5 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,45,134,126,2,0 ; vpbroadcastd 0x27e86(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,33,122,2,0 ; vbroadcastss 0x27a21(%rip),%ymm6 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,53,121,126,2,0 ; vbroadcastss 0x27e79(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,88,53,24,122,2,0 ; vpbroadcastd 0x27a18(%rip),%ymm6 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,53,112,126,2,0 ; vpbroadcastd 0x27e70(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,11,122,2,0 ; vbroadcastss 0x27a0b(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,99,126,2,0 ; vbroadcastss 0x27e63(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,1,122,2,0 ; vpbroadcastd 0x27a01(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,89,126,2,0 ; vpbroadcastd 0x27e59(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,243,121,2,0 ; vbroadcastss 0x279f3(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,75,126,2,0 ; vbroadcastss 0x27e4b(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3691,27 +3785,27 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3d3c <_sk_load_4444_dst_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3ed0 <_sk_load_4444_dst_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,65,255,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,36,255,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,247,254,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3772,25 +3866,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,123,120,2,0 ; vpbroadcastd 0x2787b(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,5,211,124,2,0 ; vpbroadcastd 0x27cd3(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,110,120,2,0 ; vbroadcastss 0x2786e(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,198,124,2,0 ; vbroadcastss 0x27cc6(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,101,120,2,0 ; vpbroadcastd 0x27865(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,13,189,124,2,0 ; vpbroadcastd 0x27cbd(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,88,120,2,0 ; vbroadcastss 0x27858(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,176,124,2,0 ; vbroadcastss 0x27cb0(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,79,120,2,0 ; vpbroadcastd 0x2784f(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,21,167,124,2,0 ; vpbroadcastd 0x27ca7(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,66,120,2,0 ; vbroadcastss 0x27842(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,154,124,2,0 ; vbroadcastss 0x27c9a(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,56,120,2,0 ; vpbroadcastd 0x27838(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,144,124,2,0 ; vpbroadcastd 0x27c90(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,42,120,2,0 ; vbroadcastss 0x2782a(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,130,124,2,0 ; vbroadcastss 0x27c82(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3805,7 +3899,7 @@ _sk_store_4444_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,5,120,2,0 ; vbroadcastss 0x27805(%rip),%ymm8 # 2b6a4 <_sk_overlay_sse2_8bit+0x583>
+ DB 196,98,125,24,5,93,124,2,0 ; vbroadcastss 0x27c5d(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3823,7 +3917,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3f03 <_sk_store_4444_hsw+0x84>
+ DB 117,11 ; jne 4097 <_sk_store_4444_hsw+0x84>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3832,22 +3926,22 @@ _sk_store_4444_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 3efe <_sk_store_4444_hsw+0x7f>
+ DB 119,235 ; ja 4092 <_sk_store_4444_hsw+0x7f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3f60 <_sk_store_4444_hsw+0xe1>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 40f4 <_sk_store_4444_hsw+0xe1>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 3efe <_sk_store_4444_hsw+0x7f>
+ DB 235,206 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 3efe <_sk_store_4444_hsw+0x7f>
+ DB 235,190 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 3efe <_sk_store_4444_hsw+0x7f>
+ DB 235,158 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3865,7 +3959,7 @@ _sk_store_4444_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003f78 <_sk_overlay_sse2_8bit+0xffffffffe0fd8e57>
+ DB 232,255,255,255,224 ; callq ffffffffe100410c <_sk_overlay_sse2_8bit+0xffffffffe0fd89ff>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3881,16 +3975,16 @@ _sk_load_8888_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 3ff0 <_sk_load_8888_hsw+0x74>
+ DB 117,87 ; jne 4184 <_sk_load_8888_hsw+0x74>
DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3
- DB 197,229,219,5,89,120,2,0 ; vpand 0x27859(%rip),%ymm3,%ymm0 # 2b800 <_sk_overlay_sse2_8bit+0x6df>
+ DB 197,229,219,5,165,124,2,0 ; vpand 0x27ca5(%rip),%ymm3,%ymm0 # 2bde0 <_sk_overlay_sse2_8bit+0x6d3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,80,118,2,0 ; vbroadcastss 0x27650(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,168,122,2,0 ; vbroadcastss 0x27aa8(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,94,120,2,0 ; vpshufb 0x2785e(%rip),%ymm3,%ymm1 # 2b820 <_sk_overlay_sse2_8bit+0x6ff>
+ DB 196,226,101,0,13,170,124,2,0 ; vpshufb 0x27caa(%rip),%ymm3,%ymm1 # 2be00 <_sk_overlay_sse2_8bit+0x6f3>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,108,120,2,0 ; vpshufb 0x2786c(%rip),%ymm3,%ymm2 # 2b840 <_sk_overlay_sse2_8bit+0x71f>
+ DB 196,226,101,0,21,184,124,2,0 ; vpshufb 0x27cb8(%rip),%ymm3,%ymm2 # 2be20 <_sk_overlay_sse2_8bit+0x713>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3904,21 +3998,21 @@ _sk_load_8888_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 3f9f <_sk_load_8888_hsw+0x23>
+ DB 119,155 ; ja 4133 <_sk_load_8888_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 409c <_sk_load_8888_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4230 <_sk_load_8888_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3
- DB 233,124,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,85,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -3931,9 +4025,9 @@ _sk_load_8888_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,6,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 409d <_sk_load_8888_hsw+0x121>
+ DB 124,255 ; jl 4231 <_sk_load_8888_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -3965,16 +4059,16 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 412c <_sk_load_8888_dst_hsw+0x74>
+ DB 117,87 ; jne 42c0 <_sk_load_8888_dst_hsw+0x74>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,125,119,2,0 ; vpand 0x2777d(%rip),%ymm7,%ymm4 # 2b860 <_sk_overlay_sse2_8bit+0x73f>
+ DB 197,197,219,37,201,123,2,0 ; vpand 0x27bc9(%rip),%ymm7,%ymm4 # 2be40 <_sk_overlay_sse2_8bit+0x733>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,20,117,2,0 ; vbroadcastss 0x27514(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,108,121,2,0 ; vbroadcastss 0x2796c(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
- DB 196,226,69,0,45,130,119,2,0 ; vpshufb 0x27782(%rip),%ymm7,%ymm5 # 2b880 <_sk_overlay_sse2_8bit+0x75f>
+ DB 196,226,69,0,45,206,123,2,0 ; vpshufb 0x27bce(%rip),%ymm7,%ymm5 # 2be60 <_sk_overlay_sse2_8bit+0x753>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5
- DB 196,226,69,0,53,144,119,2,0 ; vpshufb 0x27790(%rip),%ymm7,%ymm6 # 2b8a0 <_sk_overlay_sse2_8bit+0x77f>
+ DB 196,226,69,0,53,220,123,2,0 ; vpshufb 0x27bdc(%rip),%ymm7,%ymm6 # 2be80 <_sk_overlay_sse2_8bit+0x773>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -3988,21 +4082,21 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 119,155 ; ja 426f <_sk_load_8888_dst_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 41d8 <_sk_load_8888_dst_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 436c <_sk_load_8888_dst_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,124,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,85,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4015,9 +4109,9 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,6,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 41d9 <_sk_load_8888_dst_hsw+0x121>
+ DB 124,255 ; jl 436d <_sk_load_8888_dst_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4049,14 +4143,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,158,118,2,0 ; vpand 0x2769e(%rip),%ymm3,%ymm0 # 2b8c0 <_sk_overlay_sse2_8bit+0x79f>
+ DB 197,229,219,5,234,122,2,0 ; vpand 0x27aea(%rip),%ymm3,%ymm0 # 2bea0 <_sk_overlay_sse2_8bit+0x793>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,213,115,2,0 ; vbroadcastss 0x273d5(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,45,120,2,0 ; vbroadcastss 0x2782d(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,163,118,2,0 ; vpshufb 0x276a3(%rip),%ymm3,%ymm1 # 2b8e0 <_sk_overlay_sse2_8bit+0x7bf>
+ DB 196,226,101,0,13,239,122,2,0 ; vpshufb 0x27aef(%rip),%ymm3,%ymm1 # 2bec0 <_sk_overlay_sse2_8bit+0x7b3>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,177,118,2,0 ; vpshufb 0x276b1(%rip),%ymm3,%ymm2 # 2b900 <_sk_overlay_sse2_8bit+0x7df>
+ DB 196,226,101,0,21,253,122,2,0 ; vpshufb 0x27afd(%rip),%ymm3,%ymm2 # 2bee0 <_sk_overlay_sse2_8bit+0x7d3>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4075,7 +4169,7 @@ _sk_store_8888_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,49,115,2,0 ; vbroadcastss 0x27331(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,137,119,2,0 ; vbroadcastss 0x27789(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4091,7 +4185,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 42e4 <_sk_store_8888_hsw+0x7a>
+ DB 117,11 ; jne 4478 <_sk_store_8888_hsw+0x7a>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -4100,17 +4194,17 @@ _sk_store_8888_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 42df <_sk_store_8888_hsw+0x75>
+ DB 119,235 ; ja 4473 <_sk_store_8888_hsw+0x75>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 4354 <_sk_store_8888_hsw+0xea>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 44e8 <_sk_store_8888_hsw+0xea>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp 42df <_sk_store_8888_hsw+0x75>
+ DB 235,207 ; jmp 4473 <_sk_store_8888_hsw+0x75>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp 42df <_sk_store_8888_hsw+0x75>
+ DB 235,191 ; jmp 4473 <_sk_store_8888_hsw+0x75>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4118,7 +4212,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp 42df <_sk_store_8888_hsw+0x75>
+ DB 235,142 ; jmp 4473 <_sk_store_8888_hsw+0x75>
DB 15,31,0 ; nopl (%rax)
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
@@ -4130,7 +4224,7 @@ _sk_store_8888_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,218 ; callq ffffffffdb004368 <_sk_overlay_sse2_8bit+0xffffffffdafd9247>
+ DB 232,255,255,255,218 ; callq ffffffffdb0044fc <_sk_overlay_sse2_8bit+0xffffffffdafd8def>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,204 ; dec %esp
@@ -4149,16 +4243,16 @@ _sk_load_bgra_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 43e4 <_sk_load_bgra_hsw+0x74>
+ DB 117,87 ; jne 4578 <_sk_load_bgra_hsw+0x74>
DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3
- DB 197,229,219,5,133,117,2,0 ; vpand 0x27585(%rip),%ymm3,%ymm0 # 2b920 <_sk_overlay_sse2_8bit+0x7ff>
+ DB 197,229,219,5,209,121,2,0 ; vpand 0x279d1(%rip),%ymm3,%ymm0 # 2bf00 <_sk_overlay_sse2_8bit+0x7f3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,92,114,2,0 ; vbroadcastss 0x2725c(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,180,118,2,0 ; vbroadcastss 0x276b4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,138,117,2,0 ; vpshufb 0x2758a(%rip),%ymm3,%ymm0 # 2b940 <_sk_overlay_sse2_8bit+0x81f>
+ DB 196,226,101,0,5,214,121,2,0 ; vpshufb 0x279d6(%rip),%ymm3,%ymm0 # 2bf20 <_sk_overlay_sse2_8bit+0x813>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,152,117,2,0 ; vpshufb 0x27598(%rip),%ymm3,%ymm0 # 2b960 <_sk_overlay_sse2_8bit+0x83f>
+ DB 196,226,101,0,5,228,121,2,0 ; vpshufb 0x279e4(%rip),%ymm3,%ymm0 # 2bf40 <_sk_overlay_sse2_8bit+0x833>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4172,21 +4266,21 @@ _sk_load_bgra_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 4393 <_sk_load_bgra_hsw+0x23>
+ DB 119,155 ; ja 4527 <_sk_load_bgra_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4490 <_sk_load_bgra_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4624 <_sk_load_bgra_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3
- DB 233,124,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,85,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -4199,9 +4293,9 @@ _sk_load_bgra_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,6,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 4491 <_sk_load_bgra_hsw+0x121>
+ DB 124,255 ; jl 4625 <_sk_load_bgra_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4233,16 +4327,16 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 4520 <_sk_load_bgra_dst_hsw+0x74>
+ DB 117,87 ; jne 46b4 <_sk_load_bgra_dst_hsw+0x74>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,169,116,2,0 ; vpand 0x274a9(%rip),%ymm7,%ymm4 # 2b980 <_sk_overlay_sse2_8bit+0x85f>
+ DB 197,197,219,37,245,120,2,0 ; vpand 0x278f5(%rip),%ymm7,%ymm4 # 2bf60 <_sk_overlay_sse2_8bit+0x853>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,32,113,2,0 ; vbroadcastss 0x27120(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,120,117,2,0 ; vbroadcastss 0x27578(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6
- DB 196,226,69,0,37,174,116,2,0 ; vpshufb 0x274ae(%rip),%ymm7,%ymm4 # 2b9a0 <_sk_overlay_sse2_8bit+0x87f>
+ DB 196,226,69,0,37,250,120,2,0 ; vpshufb 0x278fa(%rip),%ymm7,%ymm4 # 2bf80 <_sk_overlay_sse2_8bit+0x873>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5
- DB 196,226,69,0,37,188,116,2,0 ; vpshufb 0x274bc(%rip),%ymm7,%ymm4 # 2b9c0 <_sk_overlay_sse2_8bit+0x89f>
+ DB 196,226,69,0,37,8,121,2,0 ; vpshufb 0x27908(%rip),%ymm7,%ymm4 # 2bfa0 <_sk_overlay_sse2_8bit+0x893>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4256,21 +4350,21 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 119,155 ; ja 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 45cc <_sk_load_bgra_dst_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4760 <_sk_load_bgra_dst_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,124,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,85,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4283,9 +4377,9 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,6,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 45cd <_sk_load_bgra_dst_hsw+0x121>
+ DB 124,255 ; jl 4761 <_sk_load_bgra_dst_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4317,14 +4411,14 @@ _sk_gather_bgra_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,202,115,2,0 ; vpand 0x273ca(%rip),%ymm3,%ymm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x8bf>
+ DB 197,229,219,5,22,120,2,0 ; vpand 0x27816(%rip),%ymm3,%ymm0 # 2bfc0 <_sk_overlay_sse2_8bit+0x8b3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,225,111,2,0 ; vbroadcastss 0x26fe1(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,57,116,2,0 ; vbroadcastss 0x27439(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,207,115,2,0 ; vpshufb 0x273cf(%rip),%ymm3,%ymm0 # 2ba00 <_sk_overlay_sse2_8bit+0x8df>
+ DB 196,226,101,0,5,27,120,2,0 ; vpshufb 0x2781b(%rip),%ymm3,%ymm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x8d3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,221,115,2,0 ; vpshufb 0x273dd(%rip),%ymm3,%ymm0 # 2ba20 <_sk_overlay_sse2_8bit+0x8ff>
+ DB 196,226,101,0,5,41,120,2,0 ; vpshufb 0x27829(%rip),%ymm3,%ymm0 # 2c000 <_sk_overlay_sse2_8bit+0x8f3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4343,7 +4437,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,61,111,2,0 ; vbroadcastss 0x26f3d(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,149,115,2,0 ; vbroadcastss 0x27395(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4359,7 +4453,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 46d8 <_sk_store_bgra_hsw+0x7a>
+ DB 117,11 ; jne 486c <_sk_store_bgra_hsw+0x7a>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -4368,17 +4462,17 @@ _sk_store_bgra_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 119,235 ; ja 4867 <_sk_store_bgra_hsw+0x75>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 4748 <_sk_store_bgra_hsw+0xea>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 48dc <_sk_store_bgra_hsw+0xea>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 235,207 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 235,191 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4386,7 +4480,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 235,142 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
DB 15,31,0 ; nopl (%rax)
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
@@ -4398,7 +4492,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,218 ; callq ffffffffdb00475c <_sk_overlay_sse2_8bit+0xffffffffdafd963b>
+ DB 232,255,255,255,218 ; callq ffffffffdb0048f0 <_sk_overlay_sse2_8bit+0xffffffffdafd91e3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,204 ; dec %esp
@@ -4416,7 +4510,7 @@ _sk_load_f16_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 47e5 <_sk_load_f16_hsw+0x81>
+ DB 117,101 ; jne 4979 <_sk_load_f16_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,92,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -4442,29 +4536,29 @@ _sk_load_f16_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 484b <_sk_load_f16_hsw+0xe7>
+ DB 116,85 ; je 49df <_sk_load_f16_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 484b <_sk_load_f16_hsw+0xe7>
+ DB 114,72 ; jb 49df <_sk_load_f16_hsw+0xe7>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4858 <_sk_load_f16_hsw+0xf4>
+ DB 116,72 ; je 49ec <_sk_load_f16_hsw+0xf4>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4858 <_sk_load_f16_hsw+0xf4>
+ DB 114,59 ; jb 49ec <_sk_load_f16_hsw+0xf4>
DB 196,193,123,16,92,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 479b <_sk_load_f16_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 492f <_sk_load_f16_hsw+0x37>
DB 196,193,97,22,92,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 479b <_sk_load_f16_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 492f <_sk_load_f16_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,67,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,58,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
PUBLIC _sk_load_f16_dst_hsw
_sk_load_f16_dst_hsw LABEL PROC
@@ -4476,7 +4570,7 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 48e2 <_sk_load_f16_dst_hsw+0x81>
+ DB 117,101 ; jne 4a76 <_sk_load_f16_dst_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,124,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -4502,29 +4596,29 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 4948 <_sk_load_f16_dst_hsw+0xe7>
+ DB 116,85 ; je 4adc <_sk_load_f16_dst_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 4948 <_sk_load_f16_dst_hsw+0xe7>
+ DB 114,72 ; jb 4adc <_sk_load_f16_dst_hsw+0xe7>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4955 <_sk_load_f16_dst_hsw+0xf4>
+ DB 116,72 ; je 4ae9 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4955 <_sk_load_f16_dst_hsw+0xf4>
+ DB 114,59 ; jb 4ae9 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,123,16,124,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm7
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 196,193,65,22,124,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,67,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
- DB 233,58,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
PUBLIC _sk_gather_f16_hsw
_sk_gather_f16_hsw LABEL PROC
@@ -4583,7 +4677,7 @@ _sk_store_f16_hsw LABEL PROC
DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9
DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 4a63 <_sk_store_f16_hsw+0x7b>
+ DB 117,31 ; jne 4bf7 <_sk_store_f16_hsw+0x7b>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -4592,22 +4686,22 @@ _sk_store_f16_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4a5f <_sk_store_f16_hsw+0x77>
+ DB 116,240 ; je 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4a5f <_sk_store_f16_hsw+0x77>
+ DB 114,227 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,218 ; je 4a5f <_sk_store_f16_hsw+0x77>
+ DB 116,218 ; je 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 4a5f <_sk_store_f16_hsw+0x77>
+ DB 114,205 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,196 ; je 4a5f <_sk_store_f16_hsw+0x77>
+ DB 116,196 ; je 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 4a5f <_sk_store_f16_hsw+0x77>
+ DB 114,183 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 235,174 ; jmp 4a5f <_sk_store_f16_hsw+0x77>
+ DB 235,174 ; jmp 4bf3 <_sk_store_f16_hsw+0x77>
PUBLIC _sk_load_u16_be_hsw
_sk_load_u16_be_hsw LABEL PROC
@@ -4620,7 +4714,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 4ba4 <_sk_load_u16_be_hsw+0xf3>
+ DB 15,133,204,0,0,0 ; jne 4d38 <_sk_load_u16_be_hsw+0xf3>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -4639,7 +4733,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,231,106,2,0 ; vbroadcastss 0x26ae7(%rip),%ymm10 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,21,63,111,2,0 ; vbroadcastss 0x26f3f(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4667,29 +4761,29 @@ _sk_load_u16_be_hsw LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 4c0a <_sk_load_u16_be_hsw+0x159>
+ DB 116,85 ; je 4d9e <_sk_load_u16_be_hsw+0x159>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 4c0a <_sk_load_u16_be_hsw+0x159>
+ DB 114,72 ; jb 4d9e <_sk_load_u16_be_hsw+0x159>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4c17 <_sk_load_u16_be_hsw+0x166>
+ DB 116,72 ; je 4dab <_sk_load_u16_be_hsw+0x166>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4c17 <_sk_load_u16_be_hsw+0x166>
+ DB 114,59 ; jb 4dab <_sk_load_u16_be_hsw+0x166>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,6,255,255,255 ; je 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 15,132,6,255,255,255 ; je 4c87 <_sk_load_u16_be_hsw+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,245,254,255,255 ; jb 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 15,130,245,254,255,255 ; jb 4c87 <_sk_load_u16_be_hsw+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,233,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,233,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,220,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,220,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,211,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,211,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
PUBLIC _sk_load_rgb_u16_be_hsw
_sk_load_rgb_u16_be_hsw LABEL PROC
@@ -4704,7 +4798,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 4d17 <_sk_load_rgb_u16_be_hsw+0xf7>
+ DB 15,133,204,0,0,0 ; jne 4eab <_sk_load_rgb_u16_be_hsw+0xf7>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -4728,7 +4822,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,91,105,2,0 ; vbroadcastss 0x2695b(%rip),%ymm10 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,21,179,109,2,0 ; vbroadcastss 0x26db3(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4745,41 +4839,41 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,123,104,2,0 ; vbroadcastss 0x2687b(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,211,108,2,0 ; vbroadcastss 0x26cd3(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 4d30 <_sk_load_rgb_u16_be_hsw+0x110>
- DB 233,79,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,5 ; jne 4ec4 <_sk_load_rgb_u16_be_hsw+0x110>
+ DB 233,79,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 4d5f <_sk_load_rgb_u16_be_hsw+0x13f>
+ DB 114,26 ; jb 4ef3 <_sk_load_rgb_u16_be_hsw+0x13f>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 4d64 <_sk_load_rgb_u16_be_hsw+0x144>
- DB 233,32,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,27,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,10 ; jne 4ef8 <_sk_load_rgb_u16_be_hsw+0x144>
+ DB 233,32,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,27,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 4d93 <_sk_load_rgb_u16_be_hsw+0x173>
+ DB 114,26 ; jb 4f27 <_sk_load_rgb_u16_be_hsw+0x173>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 4d98 <_sk_load_rgb_u16_be_hsw+0x178>
- DB 233,236,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,231,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,10 ; jne 4f2c <_sk_load_rgb_u16_be_hsw+0x178>
+ DB 233,236,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,231,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 4dc1 <_sk_load_rgb_u16_be_hsw+0x1a1>
+ DB 114,20 ; jb 4f55 <_sk_load_rgb_u16_be_hsw+0x1a1>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,190,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,185,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,190,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,185,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
PUBLIC _sk_store_u16_be_hsw
_sk_store_u16_be_hsw LABEL PROC
@@ -4791,7 +4885,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,187,104,2,0 ; vbroadcastss 0x268bb(%rip),%ymm8 # 2b6a8 <_sk_overlay_sse2_8bit+0x587>
+ DB 196,98,125,24,5,19,109,2,0 ; vbroadcastss 0x26d13(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -4829,7 +4923,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 4ed1 <_sk_store_u16_be_hsw+0x10b>
+ DB 117,31 ; jne 5065 <_sk_store_u16_be_hsw+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -4838,28 +4932,28 @@ _sk_store_u16_be_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 116,240 ; je 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 114,227 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 116,218 ; je 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 114,205 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 116,196 ; je 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 114,183 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 235,174 ; jmp 5061 <_sk_store_u16_be_hsw+0x107>
PUBLIC _sk_load_f32_hsw
_sk_load_f32_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 4fab <_sk_load_f32_hsw+0x8c>
+ DB 15,135,128,0,0,0 ; ja 513f <_sk_load_f32_hsw+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -4867,7 +4961,7 @@ _sk_load_f32_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 4fd4 <_sk_load_f32_hsw+0xb5>
+ DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 5168 <_sk_load_f32_hsw+0xb5>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -4913,7 +5007,7 @@ PUBLIC _sk_load_f32_dst_hsw
_sk_load_f32_dst_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 5080 <_sk_load_f32_dst_hsw+0x8c>
+ DB 15,135,128,0,0,0 ; ja 5214 <_sk_load_f32_dst_hsw+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -4921,7 +5015,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 50a8 <_sk_load_f32_dst_hsw+0xb4>
+ DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 523c <_sk_load_f32_dst_hsw+0xb4>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -4983,7 +5077,7 @@ _sk_store_f32_hsw LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne 5147 <_sk_store_f32_hsw+0x7f>
+ DB 117,55 ; jne 52db <_sk_store_f32_hsw+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -4996,22 +5090,22 @@ _sk_store_f32_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 5143 <_sk_store_f32_hsw+0x7b>
+ DB 116,240 ; je 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 5143 <_sk_store_f32_hsw+0x7b>
+ DB 114,227 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je 5143 <_sk_store_f32_hsw+0x7b>
+ DB 116,218 ; je 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 5143 <_sk_store_f32_hsw+0x7b>
+ DB 114,205 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je 5143 <_sk_store_f32_hsw+0x7b>
+ DB 116,195 ; je 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb 5143 <_sk_store_f32_hsw+0x7b>
+ DB 114,181 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp 5143 <_sk_store_f32_hsw+0x7b>
+ DB 235,171 ; jmp 52d7 <_sk_store_f32_hsw+0x7b>
PUBLIC _sk_clamp_x_hsw
_sk_clamp_x_hsw LABEL PROC
@@ -5078,7 +5172,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,23,99,2,0 ; vmulss 0x26317(%rip),%xmm9,%xmm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,5,111,103,2,0 ; vmulss 0x2676f(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -5103,7 +5197,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,179,98,2,0 ; vmulss 0x262b3(%rip),%xmm9,%xmm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,13,11,103,2,0 ; vmulss 0x2670b(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -5123,7 +5217,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,104,98,2,0 ; vbroadcastss 0x26268(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,192,102,2,0 ; vbroadcastss 0x266c0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -5137,9 +5231,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,95,98,2,0 ; vbroadcastss 0x2625f(%rip),%ymm8 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,5,183,102,2,0 ; vbroadcastss 0x266b7(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,53,98,2,0 ; vbroadcastss 0x26235(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,141,102,2,0 ; vbroadcastss 0x2668d(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -5153,11 +5247,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,33,99,2,0 ; vbroadcastss 0x26321(%rip),%ymm3 # 2b6ac <_sk_overlay_sse2_8bit+0x58b>
- DB 196,98,125,24,5,28,99,2,0 ; vbroadcastss 0x2631c(%rip),%ymm8 # 2b6b0 <_sk_overlay_sse2_8bit+0x58f>
+ DB 196,226,125,24,29,121,103,2,0 ; vbroadcastss 0x26779(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b>
+ DB 196,98,125,24,5,116,103,2,0 ; vbroadcastss 0x26774(%rip),%ymm8 # 2bc9c <_sk_overlay_sse2_8bit+0x58f>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,13,99,2,0 ; vbroadcastss 0x2630d(%rip),%ymm3 # 2b6b4 <_sk_overlay_sse2_8bit+0x593>
+ DB 196,226,125,24,29,101,103,2,0 ; vbroadcastss 0x26765(%rip),%ymm3 # 2bca0 <_sk_overlay_sse2_8bit+0x593>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -5341,9 +5435,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 77,137,211 ; mov %r10,%r11
DB 73,255,203 ; dec %r11
- DB 120,7 ; js 56a0 <_sk_evenly_spaced_gradient_hsw+0x19>
+ DB 120,7 ; js 5834 <_sk_evenly_spaced_gradient_hsw+0x19>
DB 196,193,242,42,203 ; vcvtsi2ss %r11,%xmm1,%xmm1
- DB 235,22 ; jmp 56b6 <_sk_evenly_spaced_gradient_hsw+0x2f>
+ DB 235,22 ; jmp 584a <_sk_evenly_spaced_gradient_hsw+0x2f>
DB 76,137,219 ; mov %r11,%rbx
DB 72,209,235 ; shr %rbx
DB 65,131,227,1 ; and $0x1,%r11d
@@ -5354,7 +5448,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1
DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11
DB 73,131,250,8 ; cmp $0x8,%r10
- DB 119,70 ; ja 570f <_sk_evenly_spaced_gradient_hsw+0x88>
+ DB 119,70 ; ja 58a3 <_sk_evenly_spaced_gradient_hsw+0x88>
DB 196,66,37,22,1 ; vpermps (%r9),%ymm11,%ymm8
DB 72,139,88,40 ; mov 0x28(%rax),%rbx
DB 196,98,37,22,11 ; vpermps (%rbx),%ymm11,%ymm9
@@ -5370,7 +5464,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 196,226,37,22,27 ; vpermps (%rbx),%ymm11,%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13
- DB 235,110 ; jmp 577d <_sk_evenly_spaced_gradient_hsw+0xf6>
+ DB 235,110 ; jmp 5911 <_sk_evenly_spaced_gradient_hsw+0xf6>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,153 ; vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -5405,14 +5499,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,21,95,2,0 ; vbroadcastss 0x25f15(%rip),%ymm0 # 2b6b8 <_sk_overlay_sse2_8bit+0x597>
- DB 196,226,125,24,13,16,95,2,0 ; vbroadcastss 0x25f10(%rip),%ymm1 # 2b6bc <_sk_overlay_sse2_8bit+0x59b>
+ DB 196,226,125,24,5,109,99,2,0 ; vbroadcastss 0x2636d(%rip),%ymm0 # 2bca4 <_sk_overlay_sse2_8bit+0x597>
+ DB 196,226,125,24,13,104,99,2,0 ; vbroadcastss 0x26368(%rip),%ymm1 # 2bca8 <_sk_overlay_sse2_8bit+0x59b>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,6,95,2,0 ; vbroadcastss 0x25f06(%rip),%ymm0 # 2b6c0 <_sk_overlay_sse2_8bit+0x59f>
+ DB 196,226,125,24,5,94,99,2,0 ; vbroadcastss 0x2635e(%rip),%ymm0 # 2bcac <_sk_overlay_sse2_8bit+0x59f>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,252,94,2,0 ; vbroadcastss 0x25efc(%rip),%ymm1 # 2b6c4 <_sk_overlay_sse2_8bit+0x5a3>
+ DB 196,226,125,24,13,84,99,2,0 ; vbroadcastss 0x26354(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,242,94,2,0 ; vbroadcastss 0x25ef2(%rip),%ymm0 # 2b6c8 <_sk_overlay_sse2_8bit+0x5a7>
+ DB 196,226,125,24,5,74,99,2,0 ; vbroadcastss 0x2634a(%rip),%ymm0 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -5425,11 +5519,11 @@ _sk_gradient_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 73,131,249,1 ; cmp $0x1,%r9
- DB 15,134,180,0,0,0 ; jbe 58ae <_sk_gradient_hsw+0xc3>
+ DB 15,134,180,0,0,0 ; jbe 5a42 <_sk_gradient_hsw+0xc3>
DB 76,139,80,72 ; mov 0x48(%rax),%r10
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,187,1,0,0,0 ; mov $0x1,%r11d
- DB 196,226,125,24,21,131,93,2,0 ; vbroadcastss 0x25d83(%rip),%ymm2 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,226,125,24,21,219,97,2,0 ; vbroadcastss 0x261db(%rip),%ymm2 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -5437,10 +5531,10 @@ _sk_gradient_hsw LABEL PROC
DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9
DB 73,255,195 ; inc %r11
DB 77,57,217 ; cmp %r11,%r9
- DB 117,226 ; jne 5816 <_sk_gradient_hsw+0x2b>
+ DB 117,226 ; jne 59aa <_sk_gradient_hsw+0x2b>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 73,131,249,8 ; cmp $0x8,%r9
- DB 118,121 ; jbe 58b7 <_sk_gradient_hsw+0xcc>
+ DB 118,121 ; jbe 5a4b <_sk_gradient_hsw+0xcc>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,138 ; vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -5464,7 +5558,7 @@ _sk_gradient_hsw LABEL PROC
DB 196,130,21,146,28,137 ; vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- DB 235,77 ; jmp 58fb <_sk_gradient_hsw+0x110>
+ DB 235,77 ; jmp 5a8f <_sk_gradient_hsw+0x110>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 196,66,53,22,2 ; vpermps (%r10),%ymm9,%ymm8
@@ -5520,24 +5614,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,54,93,2,0 ; vbroadcastss 0x25d36(%rip),%ymm13 # 2b6cc <_sk_overlay_sse2_8bit+0x5ab>
- DB 196,98,125,24,53,49,93,2,0 ; vbroadcastss 0x25d31(%rip),%ymm14 # 2b6d0 <_sk_overlay_sse2_8bit+0x5af>
+ DB 196,98,125,24,45,142,97,2,0 ; vbroadcastss 0x2618e(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab>
+ DB 196,98,125,24,53,137,97,2,0 ; vbroadcastss 0x26189(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,39,93,2,0 ; vbroadcastss 0x25d27(%rip),%ymm13 # 2b6d4 <_sk_overlay_sse2_8bit+0x5b3>
+ DB 196,98,125,24,45,127,97,2,0 ; vbroadcastss 0x2617f(%rip),%ymm13 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,29,93,2,0 ; vbroadcastss 0x25d1d(%rip),%ymm14 # 2b6d8 <_sk_overlay_sse2_8bit+0x5b7>
+ DB 196,98,125,24,53,117,97,2,0 ; vbroadcastss 0x26175(%rip),%ymm14 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,8,93,2,0 ; vbroadcastss 0x25d08(%rip),%ymm10 # 2b6dc <_sk_overlay_sse2_8bit+0x5bb>
+ DB 196,98,125,24,21,96,97,2,0 ; vbroadcastss 0x26160(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,158,91,2,0 ; vbroadcastss 0x25b9e(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,246,95,2,0 ; vbroadcastss 0x25ff6(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,136,91,2,0 ; vbroadcastss 0x25b88(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,224,95,2,0 ; vbroadcastss 0x25fe0(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -5561,23 +5655,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,136,92,2,0 ; vbroadcastss 0x25c88(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,224,96,2,0 ; vbroadcastss 0x260e0(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,103,92,2,0 ; vbroadcastss 0x25c67(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,191,96,2,0 ; vbroadcastss 0x260bf(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,74,92,2,0 ; vbroadcastss 0x25c4a(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,162,96,2,0 ; vbroadcastss 0x260a2(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,219,90,2,0 ; vbroadcastss 0x25adb(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,51,95,2,0 ; vbroadcastss 0x25f33(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5594,23 +5688,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,240,91,2,0 ; vbroadcastss 0x25bf0(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,72,96,2,0 ; vbroadcastss 0x26048(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,207,91,2,0 ; vbroadcastss 0x25bcf(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,39,96,2,0 ; vbroadcastss 0x26027(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,178,91,2,0 ; vbroadcastss 0x25bb2(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,10,96,2,0 ; vbroadcastss 0x2600a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,67,90,2,0 ; vbroadcastss 0x25a43(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,155,94,2,0 ; vbroadcastss 0x25e9b(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5626,14 +5720,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC
DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9
DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,94,91,2,0 ; vbroadcastss 0x25b5e(%rip),%ymm10 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,21,182,95,2,0 ; vbroadcastss 0x25fb6(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10
DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,65,91,2,0 ; vbroadcastss 0x25b41(%rip),%ymm8 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,5,153,95,2,0 ; vbroadcastss 0x25f99(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5667,7 +5761,7 @@ _sk_apply_vector_mask_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,129,89,2,0 ; vbroadcastss 0x25981(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,217,93,2,0 ; vbroadcastss 0x25dd9(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -5697,9 +5791,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,113,90,2,0 ; vbroadcastss 0x25a71(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,201,94,2,0 ; vbroadcastss 0x25ec9(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,8,89,2,0 ; vbroadcastss 0x25908(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,96,93,2,0 ; vbroadcastss 0x25d60(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5708,7 +5802,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,232,88,2,0 ; vbroadcastss 0x258e8(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,5,64,93,2,0 ; vbroadcastss 0x25d40(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5718,9 +5812,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,40,90,2,0 ; vbroadcastss 0x25a28(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,128,94,2,0 ; vbroadcastss 0x25e80(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,190,88,2,0 ; vbroadcastss 0x258be(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,22,93,2,0 ; vbroadcastss 0x25d16(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5729,7 +5823,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,158,88,2,0 ; vbroadcastss 0x2589e(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,246,92,2,0 ; vbroadcastss 0x25cf6(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5739,13 +5833,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,225,89,2,0 ; vbroadcastss 0x259e1(%rip),%ymm0 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,5,57,94,2,0 ; vbroadcastss 0x25e39(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,116,88,2,0 ; vbroadcastss 0x25874(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,204,92,2,0 ; vbroadcastss 0x25ccc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,209,88,2,0 ; vbroadcastss 0x258d1(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,188,89,2,0 ; vbroadcastss 0x259bc(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,41,93,2,0 ; vbroadcastss 0x25d29(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,20,94,2,0 ; vbroadcastss 0x25e14(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5755,16 +5849,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,147,89,2,0 ; vbroadcastss 0x25993(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,235,93,2,0 ; vbroadcastss 0x25deb(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,42,88,2,0 ; vbroadcastss 0x2582a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,130,92,2,0 ; vbroadcastss 0x25c82(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,132,89,2,0 ; vbroadcastss 0x25984(%rip),%ymm9 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,21,127,89,2,0 ; vbroadcastss 0x2597f(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,220,93,2,0 ; vbroadcastss 0x25ddc(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,215,93,2,0 ; vbroadcastss 0x25dd7(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,1,88,2,0 ; vbroadcastss 0x25801(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,89,92,2,0 ; vbroadcastss 0x25c59(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,103,89,2,0 ; vbroadcastss 0x25967(%rip),%ymm10 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,21,191,93,2,0 ; vbroadcastss 0x25dbf(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5773,14 +5867,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,215,87,2,0 ; vbroadcastss 0x257d7(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,47,92,2,0 ; vbroadcastss 0x25c2f(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,49,89,2,0 ; vbroadcastss 0x25931(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,29,44,89,2,0 ; vbroadcastss 0x2592c(%rip),%ymm11 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,137,93,2,0 ; vbroadcastss 0x25d89(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,132,93,2,0 ; vbroadcastss 0x25d84(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,29,89,2,0 ; vbroadcastss 0x2591d(%rip),%ymm8 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,5,117,93,2,0 ; vbroadcastss 0x25d75(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5789,12 +5883,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,249,88,2,0 ; vbroadcastss 0x258f9(%rip),%ymm0 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,5,81,93,2,0 ; vbroadcastss 0x25d51(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,234,87,2,0 ; vbroadcastss 0x257ea(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,213,88,2,0 ; vbroadcastss 0x258d5(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,66,92,2,0 ; vbroadcastss 0x25c42(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,45,93,2,0 ; vbroadcastss 0x25d2d(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5804,13 +5898,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,176,88,2,0 ; vbroadcastss 0x258b0(%rip),%ymm1 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,13,8,93,2,0 ; vbroadcastss 0x25d08(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,66,87,2,0 ; vbroadcastss 0x25742(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,154,91,2,0 ; vbroadcastss 0x25b9a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,159,87,2,0 ; vbroadcastss 0x2579f(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,138,88,2,0 ; vbroadcastss 0x2588a(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,247,91,2,0 ; vbroadcastss 0x25bf7(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,226,92,2,0 ; vbroadcastss 0x25ce2(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5820,16 +5914,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,97,88,2,0 ; vbroadcastss 0x25861(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,185,92,2,0 ; vbroadcastss 0x25cb9(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,247,86,2,0 ; vbroadcastss 0x256f7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,79,91,2,0 ; vbroadcastss 0x25b4f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,81,88,2,0 ; vbroadcastss 0x25851(%rip),%ymm9 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,21,76,88,2,0 ; vbroadcastss 0x2584c(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,169,92,2,0 ; vbroadcastss 0x25ca9(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,164,92,2,0 ; vbroadcastss 0x25ca4(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,206,86,2,0 ; vbroadcastss 0x256ce(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,38,91,2,0 ; vbroadcastss 0x25b26(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,52,88,2,0 ; vbroadcastss 0x25834(%rip),%ymm10 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,21,140,92,2,0 ; vbroadcastss 0x25c8c(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5838,14 +5932,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,164,86,2,0 ; vbroadcastss 0x256a4(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,252,90,2,0 ; vbroadcastss 0x25afc(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,253,87,2,0 ; vbroadcastss 0x257fd(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,29,248,87,2,0 ; vbroadcastss 0x257f8(%rip),%ymm11 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,85,92,2,0 ; vbroadcastss 0x25c55(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,80,92,2,0 ; vbroadcastss 0x25c50(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,233,87,2,0 ; vbroadcastss 0x257e9(%rip),%ymm8 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,5,65,92,2,0 ; vbroadcastss 0x25c41(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5854,12 +5948,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,197,87,2,0 ; vbroadcastss 0x257c5(%rip),%ymm1 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,13,29,92,2,0 ; vbroadcastss 0x25c1d(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,181,86,2,0 ; vbroadcastss 0x256b5(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,160,87,2,0 ; vbroadcastss 0x257a0(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,13,91,2,0 ; vbroadcastss 0x25b0d(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,248,91,2,0 ; vbroadcastss 0x25bf8(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5989,19 +6083,19 @@ _sk_clut_3D_hsw LABEL PROC
DB 197,254,127,76,36,32 ; vmovdqu %ymm1,0x20(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
- DB 196,226,125,88,61,115,85,2,0 ; vpbroadcastd 0x25573(%rip),%ymm7 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,226,125,88,61,203,89,2,0 ; vpbroadcastd 0x259cb(%rip),%ymm7 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- DB 196,98,125,88,21,231,83,2,0 ; vpbroadcastd 0x253e7(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,21,63,88,2,0 ; vpbroadcastd 0x2583f(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,193,117,254,242 ; vpaddd %ymm10,%ymm1,%ymm6
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
DB 196,226,37,146,28,176 ; vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- DB 196,98,125,88,29,214,83,2,0 ; vpbroadcastd 0x253d6(%rip),%ymm11 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,29,46,88,2,0 ; vpbroadcastd 0x2582e(%rip),%ymm11 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,226,77,146,36,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- DB 196,98,125,24,45,38,85,2,0 ; vbroadcastss 0x25526(%rip),%ymm13 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,98,125,24,45,126,89,2,0 ; vbroadcastss 0x2597e(%rip),%ymm13 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 196,193,124,88,245 ; vaddps %ymm13,%ymm0,%ymm6
DB 197,254,91,246 ; vcvttps2dq %ymm6,%ymm6
DB 196,226,77,64,205 ; vpmulld %ymm5,%ymm6,%ymm1
@@ -6219,19 +6313,19 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,126,91,245 ; vcvttps2dq %ymm5,%ymm14
DB 196,98,13,64,233 ; vpmulld %ymm1,%ymm14,%ymm13
DB 197,149,254,198 ; vpaddd %ymm6,%ymm13,%ymm0
- DB 196,98,125,88,21,159,80,2,0 ; vpbroadcastd 0x2509f(%rip),%ymm10 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,125,88,21,247,84,2,0 ; vpbroadcastd 0x254f7(%rip),%ymm10 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,98,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- DB 196,98,125,88,29,18,79,2,0 ; vpbroadcastd 0x24f12(%rip),%ymm11 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,29,106,83,2,0 ; vpbroadcastd 0x2536a(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm8
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,162,53,146,20,128 ; vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- DB 196,98,125,88,37,1,79,2,0 ; vpbroadcastd 0x24f01(%rip),%ymm12 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,37,89,83,2,0 ; vpbroadcastd 0x25359(%rip),%ymm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,226,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- DB 196,98,125,24,13,80,80,2,0 ; vbroadcastss 0x25050(%rip),%ymm9 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,98,125,24,13,168,84,2,0 ; vbroadcastss 0x254a8(%rip),%ymm9 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 196,65,84,88,193 ; vaddps %ymm9,%ymm5,%ymm8
DB 196,65,126,91,192 ; vcvttps2dq %ymm8,%ymm8
DB 196,226,61,64,193 ; vpmulld %ymm1,%ymm8,%ymm0
@@ -6556,7 +6650,7 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,196,92,214 ; vsubps %ymm6,%ymm7,%ymm2
DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,223,71,2,0 ; vbroadcastss 0x247df(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,55,76,2,0 ; vbroadcastss 0x24c37(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,164,36,160,3,0,0 ; vmovups 0x3a0(%rsp),%ymm4
DB 197,252,16,172,36,192,3,0,0 ; vmovups 0x3c0(%rsp),%ymm5
DB 197,252,16,180,36,224,3,0,0 ; vmovups 0x3e0(%rsp),%ymm6
@@ -6597,13 +6691,13 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 6ecd <_sk_start_pipeline_avx+0xed>
+ DB 115,110 ; jae 7061 <_sk_start_pipeline_avx+0xed>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
- DB 119,43 ; ja 6eac <_sk_start_pipeline_avx+0xcc>
+ DB 119,43 ; ja 7040 <_sk_start_pipeline_avx+0xcc>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -6615,17 +6709,17 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 6e88 <_sk_start_pipeline_avx+0xa8>
+ DB 118,220 ; jbe 701c <_sk_start_pipeline_avx+0xa8>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 6ec1 <_sk_start_pipeline_avx+0xe1>
+ DB 116,13 ; je 7055 <_sk_start_pipeline_avx+0xe1>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 6e71 <_sk_start_pipeline_avx+0x91>
+ DB 117,164 ; jne 7005 <_sk_start_pipeline_avx+0x91>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -6658,7 +6752,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,71,70,2,0 ; vbroadcastss 0x24647(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,159,74,2,0 ; vbroadcastss 0x24a9f(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -6667,7 +6761,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,33,70,2,0 ; vbroadcastss 0x24621(%rip),%ymm2 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,21,121,74,2,0 ; vbroadcastss 0x24a79(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -6689,7 +6783,7 @@ _sk_dither_avx LABEL PROC
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,202,69,2,0 ; vbroadcastss 0x245ca(%rip),%ymm11 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,24,29,34,74,2,0 ; vbroadcastss 0x24a22(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -6700,8 +6794,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,139,69,2,0 ; vbroadcastss 0x2458b(%rip),%ymm12 # 2b598 <_sk_overlay_sse2_8bit+0x477>
- DB 196,98,125,24,45,134,69,2,0 ; vbroadcastss 0x24586(%rip),%ymm13 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,24,37,227,73,2,0 ; vbroadcastss 0x249e3(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477>
+ DB 196,98,125,24,45,222,73,2,0 ; vbroadcastss 0x249de(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -6728,9 +6822,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,241,68,2,0 ; vbroadcastss 0x244f1(%rip),%ymm9 # 2b5a0 <_sk_overlay_sse2_8bit+0x47f>
+ DB 196,98,125,24,13,73,73,2,0 ; vbroadcastss 0x24949(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,231,68,2,0 ; vbroadcastss 0x244e7(%rip),%ymm9 # 2b5a4 <_sk_overlay_sse2_8bit+0x483>
+ DB 196,98,125,24,13,63,73,2,0 ; vbroadcastss 0x2493f(%rip),%ymm9 # 2bb90 <_sk_overlay_sse2_8bit+0x483>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
@@ -6760,7 +6854,7 @@ _sk_uniform_color_avx LABEL PROC
PUBLIC _sk_black_color_avx
_sk_black_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,111,68,2,0 ; vbroadcastss 0x2446f(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,199,72,2,0 ; vbroadcastss 0x248c7(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -6769,7 +6863,7 @@ _sk_black_color_avx LABEL PROC
PUBLIC _sk_white_color_avx
_sk_white_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,86,68,2,0 ; vbroadcastss 0x24456(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,174,72,2,0 ; vbroadcastss 0x248ae(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -6807,7 +6901,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,245,67,2,0 ; vbroadcastss 0x243f5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,77,72,2,0 ; vbroadcastss 0x2484d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6826,7 +6920,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,179,67,2,0 ; vbroadcastss 0x243b3(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,11,72,2,0 ; vbroadcastss 0x2480b(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -6862,7 +6956,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,78,67,2,0 ; vbroadcastss 0x2434e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,166,71,2,0 ; vbroadcastss 0x247a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -6873,7 +6967,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,45,67,2,0 ; vbroadcastss 0x2432d(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,133,71,2,0 ; vbroadcastss 0x24785(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -6884,7 +6978,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,12,67,2,0 ; vbroadcastss 0x2430c(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,100,71,2,0 ; vbroadcastss 0x24764(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6899,7 +6993,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,219,66,2,0 ; vbroadcastss 0x242db(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,51,71,2,0 ; vbroadcastss 0x24733(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -6923,7 +7017,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,150,66,2,0 ; vbroadcastss 0x24296(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,238,70,2,0 ; vbroadcastss 0x246ee(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6952,9 +7046,14 @@ _sk_multiply_avx LABEL PROC
PUBLIC _sk_plus__avx
_sk_plus__avx LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
+ DB 196,98,125,24,5,125,70,2,0 ; vbroadcastss 0x2467d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
+ DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2
+ DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -6977,7 +7076,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,225,65,2,0 ; vbroadcastss 0x241e1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,28,70,2,0 ; vbroadcastss 0x2461c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7012,7 +7111,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,93,65,2,0 ; vbroadcastss 0x2415d(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,152,69,2,0 ; vbroadcastss 0x24598(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7036,7 +7135,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,5,65,2,0 ; vbroadcastss 0x24105(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,64,69,2,0 ; vbroadcastss 0x24540(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7063,7 +7162,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,161,64,2,0 ; vbroadcastss 0x240a1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,220,68,2,0 ; vbroadcastss 0x244dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7084,7 +7183,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,88,64,2,0 ; vbroadcastss 0x24058(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,147,68,2,0 ; vbroadcastss 0x24493(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7093,7 +7192,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,63,64,2,0 ; vbroadcastss 0x2403f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,122,68,2,0 ; vbroadcastss 0x2447a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -7153,7 +7252,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,67,63,2,0 ; vbroadcastss 0x23f43(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,126,67,2,0 ; vbroadcastss 0x2437e(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -7208,7 +7307,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,78,62,2,0 ; vbroadcastss 0x23e4e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,137,66,2,0 ; vbroadcastss 0x24289(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7261,7 +7360,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,115,61,2,0 ; vbroadcastss 0x23d73(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,174,65,2,0 ; vbroadcastss 0x241ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7326,10 +7425,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,118,60,2,0 ; vbroadcastss 0x23c76(%rip),%ymm11 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,29,177,64,2,0 ; vbroadcastss 0x240b1(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,103,60,2,0 ; vbroadcastss 0x23c67(%rip),%ymm13 # 2b5ac <_sk_overlay_sse2_8bit+0x48b>
+ DB 196,98,125,24,45,162,64,2,0 ; vbroadcastss 0x240a2(%rip),%ymm13 # 2bb98 <_sk_overlay_sse2_8bit+0x48b>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -7340,7 +7439,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,17,60,2,0 ; vbroadcastss 0x23c11(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,76,64,2,0 ; vbroadcastss 0x2404c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -7467,12 +7566,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,239,57,2,0 ; vbroadcastss 0x239ef(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,42,62,2,0 ; vbroadcastss 0x23e2a(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,229,57,2,0 ; vbroadcastss 0x239e5(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,61,32,62,2,0 ; vbroadcastss 0x23e20(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,214,57,2,0 ; vbroadcastss 0x239d6(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,17,62,2,0 ; vbroadcastss 0x23e11(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7533,7 +7632,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,131,56,2,0 ; vbroadcastss 0x23883(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,190,60,2,0 ; vbroadcastss 0x23cbe(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7590,12 +7689,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,167,55,2,0 ; vbroadcastss 0x237a7(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,226,59,2,0 ; vbroadcastss 0x23be2(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,157,55,2,0 ; vbroadcastss 0x2379d(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,61,216,59,2,0 ; vbroadcastss 0x23bd8(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,142,55,2,0 ; vbroadcastss 0x2378e(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,201,59,2,0 ; vbroadcastss 0x23bc9(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7656,7 +7755,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,59,54,2,0 ; vbroadcastss 0x2363b(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,118,58,2,0 ; vbroadcastss 0x23a76(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7685,12 +7784,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,231,53,2,0 ; vbroadcastss 0x235e7(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,45,34,58,2,0 ; vbroadcastss 0x23a22(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,221,53,2,0 ; vbroadcastss 0x235dd(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,24,58,2,0 ; vbroadcastss 0x23a18(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,206,53,2,0 ; vbroadcastss 0x235ce(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,9,58,2,0 ; vbroadcastss 0x23a09(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7753,7 +7852,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,105,52,2,0 ; vbroadcastss 0x23469(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,164,56,2,0 ; vbroadcastss 0x238a4(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7783,12 +7882,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,17,52,2,0 ; vbroadcastss 0x23411(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,45,76,56,2,0 ; vbroadcastss 0x2384c(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,7,52,2,0 ; vbroadcastss 0x23407(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,66,56,2,0 ; vbroadcastss 0x23842(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,248,51,2,0 ; vbroadcastss 0x233f8(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,51,56,2,0 ; vbroadcastss 0x23833(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7851,7 +7950,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,147,50,2,0 ; vbroadcastss 0x23293(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,206,54,2,0 ; vbroadcastss 0x236ce(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7883,9 +7982,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,43,1,0,0 ; jne 8497 <_sk_srcover_rgba_8888_avx+0x14c>
+ DB 15,133,43,1,0,0 ; jne 8648 <_sk_srcover_rgba_8888_avx+0x14c>
DB 196,65,125,16,4,153 ; vmovupd (%r9,%rbx,4),%ymm8
- DB 197,125,40,13,198,54,2,0 ; vmovapd 0x236c6(%rip),%ymm9 # 2ba40 <_sk_overlay_sse2_8bit+0x91f>
+ DB 197,125,40,13,245,58,2,0 ; vmovapd 0x23af5(%rip),%ymm9 # 2c020 <_sk_overlay_sse2_8bit+0x913>
DB 196,193,61,84,225 ; vandpd %ymm9,%ymm8,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,81,114,208,8 ; vpsrld $0x8,%xmm8,%xmm5
@@ -7903,9 +8002,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 197,193,114,215,24 ; vpsrld $0x18,%xmm7,%xmm7
DB 196,227,61,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,181,49,2,0 ; vbroadcastss 0x231b5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,240,53,2,0 ; vbroadcastss 0x235f0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,212,49,2,0 ; vbroadcastss 0x231d4(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,13,15,54,2,0 ; vbroadcastss 0x2360f(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -7938,7 +8037,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,53,86,202 ; vorpd %ymm10,%ymm9,%ymm9
DB 196,65,61,86,193 ; vorpd %ymm9,%ymm8,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne 84cf <_sk_srcover_rgba_8888_avx+0x184>
+ DB 117,67 ; jne 8680 <_sk_srcover_rgba_8888_avx+0x184>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -7948,33 +8047,33 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,194,254,255,255 ; ja 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 15,135,194,254,255,255 ; ja 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,5,1,0,0 ; lea 0x105(%rip),%r11 # 85c0 <_sk_srcover_rgba_8888_avx+0x275>
+ DB 76,141,29,4,1,0,0 ; lea 0x104(%rip),%r11 # 8770 <_sk_srcover_rgba_8888_avx+0x274>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,4,153 ; vmovss (%r9,%rbx,4),%xmm8
- DB 233,163,254,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,163,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,179 ; ja 8492 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 119,179 ; ja 8643 <_sk_srcover_rgba_8888_avx+0x147>
DB 65,15,182,194 ; movzbl %r10b,%eax
- DB 76,141,21,242,0,0,0 ; lea 0xf2(%rip),%r10 # 85dc <_sk_srcover_rgba_8888_avx+0x291>
+ DB 76,141,21,241,0,0,0 ; lea 0xf1(%rip),%r10 # 878c <_sk_srcover_rgba_8888_avx+0x290>
DB 73,99,4,130 ; movslq (%r10,%rax,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,151 ; jmp 8492 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 235,151 ; jmp 8643 <_sk_srcover_rgba_8888_avx+0x147>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,196,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm8
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,61,13,196,1 ; vblendpd $0x1,%ymm4,%ymm8,%ymm8
- DB 233,80,254,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,80,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -7988,10 +8087,10 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,99,61,24,196,1 ; vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,192,12 ; vblendpd $0xc,%ymm8,%ymm4,%ymm8
- DB 233,251,253,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,251,253,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 233,8,255,255,255 ; jmpq 8492 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 233,8,255,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -7999,37 +8098,35 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 233,212,254,255,255 ; jmpq 8492 <_sk_srcover_rgba_8888_avx+0x147>
- DB 102,144 ; xchg %ax,%ax
- DB 4,255 ; add $0xff,%al
+ DB 233,212,254,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 144 ; nop
+ DB 5,255,255,255,82 ; add $0x52ffffff,%eax
DB 255 ; (bad)
- DB 255,81,255 ; callq *-0x1(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 59,255 ; cmp %edi,%edi
+ DB 60,255 ; cmp $0xff,%al
DB 255 ; (bad)
- DB 255,166,255,255,255,146 ; jmpq *-0x6d000001(%rsi)
+ DB 255,167,255,255,255,147 ; jmpq *-0x6c000001(%rdi)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 85d5 <_sk_srcover_rgba_8888_avx+0x28a>
+ DB 127,255 ; jg 8785 <_sk_srcover_rgba_8888_avx+0x289>
DB 255 ; (bad)
- DB 255,98,255 ; jmpq *-0x1(%rdx)
+ DB 255,99,255 ; jmpq *-0x1(%rbx)
DB 255 ; (bad)
- DB 255,23 ; callq *(%rdi)
+ DB 255,24 ; lcall *(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,163,255,255,255,155 ; jmpq *-0x64000001(%rbx)
+ DB 255,164,255,255,255,156,255 ; jmpq *-0x630001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,215 ; callq *%rdi
- DB 255 ; (bad)
+ DB 216,255 ; fdivr %st(7),%st
DB 255 ; (bad)
- DB 255,202 ; dec %edx
+ DB 255,203 ; dec %ebx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 188,255,255,255,174 ; mov $0xaeffffff,%esp
+ DB 189,255,255,255,175 ; mov $0xafffffff,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8046,7 +8143,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,114,47,2,0 ; vbroadcastss 0x22f72(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,174,51,2,0 ; vbroadcastss 0x233ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -8056,7 +8153,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,81,47,2,0 ; vbroadcastss 0x22f51(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,141,51,2,0 ; vbroadcastss 0x2338d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -8066,7 +8163,7 @@ _sk_clamp_a_avx LABEL PROC
PUBLIC _sk_clamp_a_dst_avx
_sk_clamp_a_dst_avx LABEL PROC
- DB 196,98,125,24,5,51,47,2,0 ; vbroadcastss 0x22f33(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,111,51,2,0 ; vbroadcastss 0x2336f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -8093,7 +8190,7 @@ _sk_swap_rb_avx LABEL PROC
PUBLIC _sk_invert_avx
_sk_invert_avx LABEL PROC
- DB 196,98,125,24,5,238,46,2,0 ; vbroadcastss 0x22eee(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,42,51,2,0 ; vbroadcastss 0x2332a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -8139,7 +8236,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,126,46,2,0 ; vbroadcastss 0x22e7e(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,186,50,2,0 ; vbroadcastss 0x232ba(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -8150,17 +8247,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,139,46,2,0 ; vbroadcastss 0x22e8b(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,199,50,2,0 ; vbroadcastss 0x232c7(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,105,46,2,0 ; vbroadcastss 0x22e69(%rip),%ymm11 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,165,50,2,0 ; vbroadcastss 0x232a5(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,111,46,2,0 ; vbroadcastss 0x22e6f(%rip),%ymm13 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,45,171,50,2,0 ; vbroadcastss 0x232ab(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,96,46,2,0 ; vbroadcastss 0x22e60(%rip),%ymm12 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,37,156,50,2,0 ; vbroadcastss 0x2329c(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,86,46,2,0 ; vbroadcastss 0x22e56(%rip),%ymm14 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,53,146,50,2,0 ; vbroadcastss 0x23292(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -8184,17 +8281,17 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_from_srgb_dst_avx
_sk_from_srgb_dst_avx LABEL PROC
- DB 196,98,125,24,5,223,45,2,0 ; vbroadcastss 0x22ddf(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,27,50,2,0 ; vbroadcastss 0x2321b(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,189,45,2,0 ; vbroadcastss 0x22dbd(%rip),%ymm11 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,249,49,2,0 ; vbroadcastss 0x231f9(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12
- DB 196,98,125,24,45,195,45,2,0 ; vbroadcastss 0x22dc3(%rip),%ymm13 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,45,255,49,2,0 ; vbroadcastss 0x231ff(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,180,45,2,0 ; vbroadcastss 0x22db4(%rip),%ymm12 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,37,240,49,2,0 ; vbroadcastss 0x231f0(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,170,45,2,0 ; vbroadcastss 0x22daa(%rip),%ymm14 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,53,230,49,2,0 ; vbroadcastss 0x231e6(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4
DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -8219,20 +8316,20 @@ _sk_from_srgb_dst_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,63,45,2,0 ; vbroadcastss 0x22d3f(%rip),%ymm8 # 2b5d0 <_sk_overlay_sse2_8bit+0x4af>
+ DB 196,98,125,24,5,123,49,2,0 ; vbroadcastss 0x2317b(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,57,45,2,0 ; vbroadcastss 0x22d39(%rip),%ymm11 # 2b5d8 <_sk_overlay_sse2_8bit+0x4b7>
+ DB 196,98,125,24,29,117,49,2,0 ; vbroadcastss 0x23175(%rip),%ymm11 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,39,45,2,0 ; vbroadcastss 0x22d27(%rip),%ymm13 # 2b5d4 <_sk_overlay_sse2_8bit+0x4b3>
+ DB 196,98,125,24,45,99,49,2,0 ; vbroadcastss 0x23163(%rip),%ymm13 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,28,45,2,0 ; vbroadcastss 0x22d1c(%rip),%ymm14 # 2b5dc <_sk_overlay_sse2_8bit+0x4bb>
+ DB 196,98,125,24,53,88,49,2,0 ; vbroadcastss 0x23158(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,18,45,2,0 ; vbroadcastss 0x22d12(%rip),%ymm15 # 2b5e0 <_sk_overlay_sse2_8bit+0x4bf>
+ DB 196,98,125,24,61,78,49,2,0 ; vbroadcastss 0x2314e(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,254,44,2,0 ; vbroadcastss 0x22cfe(%rip),%ymm12 # 2b5e4 <_sk_overlay_sse2_8bit+0x4c3>
+ DB 196,98,125,24,37,58,49,2,0 ; vbroadcastss 0x2313a(%rip),%ymm12 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -8262,12 +8359,12 @@ _sk_to_srgb_avx LABEL PROC
PUBLIC _sk_rgb_to_hsl_avx
_sk_rgb_to_hsl_avx LABEL PROC
- DB 197,124,95,193 ; vmaxps %ymm1,%ymm0,%ymm8
- DB 197,60,95,194 ; vmaxps %ymm2,%ymm8,%ymm8
- DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
- DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
+ DB 197,116,95,194 ; vmaxps %ymm2,%ymm1,%ymm8
+ DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8
+ DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
+ DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,12,44,2,0 ; vbroadcastss 0x22c0c(%rip),%ymm11 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,29,70,48,2,0 ; vbroadcastss 0x23046(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -8277,19 +8374,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,57,44,2,0 ; vbroadcastss 0x22c39(%rip),%ymm11 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,29,115,48,2,0 ; vbroadcastss 0x23073(%rip),%ymm11 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,39,44,2,0 ; vbroadcastss 0x22c27(%rip),%ymm11 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,29,97,48,2,0 ; vbroadcastss 0x23061(%rip),%ymm11 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,15,44,2,0 ; vbroadcastss 0x22c0f(%rip),%ymm2 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,226,125,24,21,73,48,2,0 ; vbroadcastss 0x23049(%rip),%ymm2 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,138,43,2,0 ; vbroadcastss 0x22b8a(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,196,47,2,0 ; vbroadcastss 0x22fc4(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -8299,7 +8396,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,185,43,2,0 ; vbroadcastss 0x22bb9(%rip),%ymm8 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,5,243,47,2,0 ; vbroadcastss 0x22ff3(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8314,7 +8411,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,16,43,2,0 ; vbroadcastss 0x22b10(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,74,47,2,0 ; vbroadcastss 0x22f4a(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -8322,23 +8419,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,82,43,2,0 ; vbroadcastss 0x22b52(%rip),%ymm11 # 2b5f8 <_sk_overlay_sse2_8bit+0x4d7>
+ DB 196,98,125,24,29,140,47,2,0 ; vbroadcastss 0x22f8c(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,36,43,2,0 ; vbroadcastss 0x22b24(%rip),%ymm12 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,37,94,47,2,0 ; vbroadcastss 0x22f5e(%rip),%ymm12 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,30,43,2,0 ; vbroadcastss 0x22b1e(%rip),%ymm13 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,45,88,47,2,0 ; vbroadcastss 0x22f58(%rip),%ymm13 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,19,43,2,0 ; vbroadcastss 0x22b13(%rip),%ymm1 # 2b5fc <_sk_overlay_sse2_8bit+0x4db>
+ DB 196,226,125,24,13,77,47,2,0 ; vbroadcastss 0x22f4d(%rip),%ymm1 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,234,42,2,0 ; vbroadcastss 0x22aea(%rip),%ymm14 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,53,36,47,2,0 ; vbroadcastss 0x22f24(%rip),%ymm14 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -8357,7 +8454,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,148,42,2,0 ; vbroadcastss 0x22a94(%rip),%ymm0 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,226,125,24,5,206,46,2,0 ; vbroadcastss 0x22ece(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -8408,15 +8505,15 @@ _sk_scale_u8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,75 ; jne 8c79 <_sk_scale_u8_avx+0x64>
+ DB 117,75 ; jne 8e2b <_sk_scale_u8_avx+0x64>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,244,50,2,0 ; vpand 0x232f4(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,34,55,2,0 ; vpand 0x23722(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,165,41,2,0 ; vbroadcastss 0x229a5(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,223,45,2,0 ; vbroadcastss 0x22ddf(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -8430,15 +8527,15 @@ _sk_scale_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,166 ; ja 8c34 <_sk_scale_u8_avx+0x1f>
+ DB 119,166 ; ja 8de6 <_sk_scale_u8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,123,0,0,0 ; lea 0x7b(%rip),%r11 # 8d14 <_sk_scale_u8_avx+0xff>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 8ec4 <_sk_scale_u8_avx+0xfd>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,135 ; jmp 8c34 <_sk_scale_u8_avx+0x1f>
+ DB 235,135 ; jmp 8de6 <_sk_scale_u8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8446,7 +8543,7 @@ _sk_scale_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,94,255,255,255 ; jmpq 8c34 <_sk_scale_u8_avx+0x1f>
+ DB 233,94,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8457,21 +8554,114 @@ _sk_scale_u8_avx LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,34,255,255,255 ; jmpq 8c34 <_sk_scale_u8_avx+0x1f>
- DB 102,144 ; xchg %ax,%ax
- DB 142,255 ; mov %edi,%?
+ DB 233,34,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f>
+ DB 144 ; nop
DB 255 ; (bad)
- DB 255,169,255,255,255,153 ; ljmp *-0x66000001(%rcx)
DB 255 ; (bad)
+ DB 255,171,255,255,255,155 ; ljmp *-0x64000001(%rbx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde008d24 <_sk_overlay_sse2_8bit+0xffffffffddfddc03>
DB 255 ; (bad)
+ DB 234 ; (bad)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,194 ; inc %edx
+ DB 223,255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,212 ; callq *%rsp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,196 ; inc %esp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
+PUBLIC _sk_scale_565_avx
+_sk_scale_565_avx LABEL PROC
+ DB 83 ; push %rbx
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 72,99,218 ; movslq %edx,%rbx
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,178,0,0,0 ; jne 8fb2 <_sk_scale_565_avx+0xd2>
+ DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
+ DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
+ DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
+ DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
+ DB 196,98,125,24,13,208,44,2,0 ; vbroadcastss 0x22cd0(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
+ DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
+ DB 196,98,125,24,21,193,44,2,0 ; vbroadcastss 0x22cc1(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
+ DB 196,98,125,24,21,183,44,2,0 ; vbroadcastss 0x22cb7(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
+ DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
+ DB 196,98,125,24,29,168,44,2,0 ; vbroadcastss 0x22ca8(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
+ DB 196,98,125,24,29,158,44,2,0 ; vbroadcastss 0x22c9e(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
+ DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
+ DB 196,98,125,24,29,143,44,2,0 ; vbroadcastss 0x22c8f(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
+ DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2
+ DB 197,164,89,219 ; vmulps %ymm3,%ymm11,%ymm3
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 91 ; pop %rbx
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,7 ; and $0x7,%r10b
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 65,254,202 ; dec %r10b
+ DB 65,128,250,6 ; cmp $0x6,%r10b
+ DB 15,135,59,255,255,255 ; ja 8f06 <_sk_scale_565_avx+0x26>
+ DB 69,15,182,210 ; movzbl %r10b,%r10d
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 903c <_sk_scale_565_avx+0x15c>
+ DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
+ DB 76,1,216 ; add %r11,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 233,25,255,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
+ DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ DB 233,251,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
+ DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ DB 233,205,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 15,31,0 ; nopl (%rax)
+ DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 236 ; in (%dx),%al
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,228 ; jmpq *%rsp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8505,15 +8695,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,111 ; jne 8df7 <_sk_lerp_u8_avx+0x88>
+ DB 117,111 ; jne 911f <_sk_lerp_u8_avx+0x88>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,154,49,2,0 ; vpand 0x2319a(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,82,52,2,0 ; vpand 0x23452(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,75,40,2,0 ; vbroadcastss 0x2284b(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,15,43,2,0 ; vbroadcastss 0x22b0f(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -8535,15 +8725,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,130 ; ja 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 119,130 ; ja 90b6 <_sk_lerp_u8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 8e94 <_sk_lerp_u8_avx+0x125>
+ DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 91bc <_sk_lerp_u8_avx+0x125>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,96,255,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 233,96,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8551,7 +8741,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,55,255,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 233,55,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8562,7 +8752,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,251,254,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 233,251,254,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
DB 144 ; nop
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -8570,7 +8760,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf008ea4 <_sk_overlay_sse2_8bit+0xffffffffdefddd83>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf0091cc <_sk_overlay_sse2_8bit+0xffffffffdefddabf>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -8592,27 +8782,33 @@ _sk_lerp_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,209,0,0,0 ; jne 8fa1 <_sk_lerp_565_avx+0xf1>
+ DB 15,133,214,0,0,0 ; jne 92ce <_sk_lerp_565_avx+0xf6>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,20,39,2,0 ; vbroadcastss 0x22714(%rip),%ymm9 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,24,13,216,41,2,0 ; vbroadcastss 0x229d8(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,5,39,2,0 ; vbroadcastss 0x22705(%rip),%ymm10 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,201,41,2,0 ; vbroadcastss 0x229c9(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,251,38,2,0 ; vbroadcastss 0x226fb(%rip),%ymm10 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,24,21,191,41,2,0 ; vbroadcastss 0x229bf(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,236,38,2,0 ; vbroadcastss 0x226ec(%rip),%ymm11 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,176,41,2,0 ; vbroadcastss 0x229b0(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,226,38,2,0 ; vbroadcastss 0x226e2(%rip),%ymm11 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,24,29,166,41,2,0 ; vbroadcastss 0x229a6(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,211,38,2,0 ; vbroadcastss 0x226d3(%rip),%ymm11 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,151,41,2,0 ; vbroadcastss 0x22997(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -8623,14 +8819,8 @@ _sk_lerp_565_avx LABEL PROC
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2
DB 197,228,92,223 ; vsubps %ymm7,%ymm3,%ymm3
- DB 196,65,100,89,201 ; vmulps %ymm9,%ymm3,%ymm9
- DB 197,52,88,207 ; vaddps %ymm7,%ymm9,%ymm9
- DB 196,65,100,89,210 ; vmulps %ymm10,%ymm3,%ymm10
- DB 197,44,88,215 ; vaddps %ymm7,%ymm10,%ymm10
- DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
+ DB 196,193,100,89,219 ; vmulps %ymm11,%ymm3,%ymm3
DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
- DB 197,172,95,219 ; vmaxps %ymm3,%ymm10,%ymm3
- DB 197,180,95,219 ; vmaxps %ymm3,%ymm9,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -8639,42 +8829,42 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,28,255,255,255 ; ja 8ed6 <_sk_lerp_565_avx+0x26>
+ DB 15,135,23,255,255,255 ; ja 91fe <_sk_lerp_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 9028 <_sk_lerp_565_avx+0x178>
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 9358 <_sk_lerp_565_avx+0x180>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,250,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26>
+ DB 233,245,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,220,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26>
+ DB 233,215,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,174,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26>
- DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
+ DB 233,169,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
+ DB 15,31,0 ; nopl (%rax)
+ DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,193 ; inc %ecx
DB 255 ; (bad)
+ DB 236 ; in (%dx),%al
DB 255 ; (bad)
- DB 255,180,255,255,255,239,255 ; pushq -0x100001(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 255,231 ; jmpq *%rdi
+ DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 223,255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
+ DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8686,9 +8876,9 @@ _sk_load_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,7,2,0,0 ; jne 9262 <_sk_load_tables_avx+0x21e>
+ DB 15,133,7,2,0,0 ; jne 9592 <_sk_load_tables_avx+0x21e>
DB 196,65,125,16,20,145 ; vmovupd (%r9,%rdx,4),%ymm10
- DB 197,125,40,13,247,41,2,0 ; vmovapd 0x229f7(%rip),%ymm9 # 2ba60 <_sk_overlay_sse2_8bit+0x93f>
+ DB 197,125,40,13,167,44,2,0 ; vmovapd 0x22ca7(%rip),%ymm9 # 2c040 <_sk_overlay_sse2_8bit+0x933>
DB 196,193,45,84,201 ; vandpd %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,193 ; vmovq %xmm0,%r9
@@ -8780,7 +8970,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,213,24 ; vpsrld $0x18,%xmm13,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,179,35,2,0 ; vbroadcastss 0x223b3(%rip),%ymm7 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,61,111,38,2,0 ; vbroadcastss 0x2266f(%rip),%ymm7 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -8791,21 +8981,21 @@ _sk_load_tables_avx LABEL PROC
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,230,253,255,255 ; ja 9061 <_sk_load_tables_avx+0x1d>
+ DB 15,135,230,253,255,255 ; ja 9391 <_sk_load_tables_avx+0x1d>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 9318 <_sk_load_tables_avx+0x2d4>
+ DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 9648 <_sk_load_tables_avx+0x2d4>
DB 79,99,20,147 ; movslq (%r11,%r10,4),%r10
DB 77,1,218 ; add %r11,%r10
DB 65,255,226 ; jmpq *%r10
DB 196,65,122,16,20,145 ; vmovss (%r9,%rdx,4),%xmm10
- DB 233,198,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d>
+ DB 233,198,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,145,8 ; vmovd 0x8(%r9,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,208,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm10
DB 196,193,123,16,4,145 ; vmovsd (%r9,%rdx,4),%xmm0
DB 196,99,45,13,208,1 ; vblendpd $0x1,%ymm0,%ymm10,%ymm10
- DB 233,159,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d>
+ DB 233,159,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,145,24 ; vmovd 0x18(%r9,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -8819,9 +9009,9 @@ _sk_load_tables_avx LABEL PROC
DB 196,99,45,24,208,1 ; vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
DB 196,193,121,16,4,145 ; vmovupd (%r9,%rdx,4),%xmm0
DB 196,67,125,13,210,12 ; vblendpd $0xc,%ymm10,%ymm0,%ymm10
- DB 233,74,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d>
+ DB 233,74,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
DB 144 ; nop
- DB 120,255 ; js 9319 <_sk_load_tables_avx+0x2d5>
+ DB 120,255 ; js 9649 <_sk_load_tables_avx+0x2d5>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -8850,7 +9040,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,60,36 ; vmovups %ymm7,(%rsp)
- DB 15,133,87,2,0,0 ; jne 95aa <_sk_load_tables_u16_be_avx+0x276>
+ DB 15,133,87,2,0,0 ; jne 98da <_sk_load_tables_u16_be_avx+0x276>
DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8
DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2
DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -8865,7 +9055,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,144,43,2,0 ; vmovdqa 0x22b90(%rip),%xmm10 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,21,64,46,2,0 ; vmovdqa 0x22e40(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -8963,7 +9153,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,135,32,2,0 ; vbroadcastss 0x22087(%rip),%ymm7 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,226,125,24,61,67,35,2,0 ; vbroadcastss 0x22343(%rip),%ymm7 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -8972,29 +9162,29 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 9610 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 116,85 ; je 9940 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 9610 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 114,72 ; jb 9940 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 961d <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 116,72 ; je 994d <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 961d <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 114,59 ; jb 994d <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,123,253,255,255 ; je 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,132,123,253,255,255 ; je 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,106,253,255,255 ; jb 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,130,106,253,255,255 ; jb 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9
- DB 233,94,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,94,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,81,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,81,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,72,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,72,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
PUBLIC _sk_load_tables_rgb_u16_be_avx
_sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -9005,7 +9195,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,124,36,32 ; vmovups %ymm7,0x20(%rsp)
DB 197,252,17,52,36 ; vmovups %ymm6,(%rsp)
- DB 15,133,74,2,0,0 ; jne 9891 <_sk_load_tables_rgb_u16_be_avx+0x26b>
+ DB 15,133,74,2,0,0 ; jne 9bc1 <_sk_load_tables_rgb_u16_be_avx+0x26b>
DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -9026,7 +9216,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,127,40,2,0 ; vmovdqa 0x2287f(%rip),%xmm9 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,13,47,43,2,0 ; vmovdqa 0x22b2f(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -9116,7 +9306,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,16,29,2,0 ; vbroadcastss 0x21d10(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,204,31,2,0 ; vbroadcastss 0x21fcc(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
@@ -9124,41 +9314,41 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 98aa <_sk_load_tables_rgb_u16_be_avx+0x284>
- DB 233,209,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,5 ; jne 9bda <_sk_load_tables_rgb_u16_be_avx+0x284>
+ DB 233,209,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 98d9 <_sk_load_tables_rgb_u16_be_avx+0x2b3>
+ DB 114,26 ; jb 9c09 <_sk_load_tables_rgb_u16_be_avx+0x2b3>
DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 98de <_sk_load_tables_rgb_u16_be_avx+0x2b8>
- DB 233,162,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,157,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,10 ; jne 9c0e <_sk_load_tables_rgb_u16_be_avx+0x2b8>
+ DB 233,162,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,157,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 990d <_sk_load_tables_rgb_u16_be_avx+0x2e7>
+ DB 114,26 ; jb 9c3d <_sk_load_tables_rgb_u16_be_avx+0x2e7>
DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 9912 <_sk_load_tables_rgb_u16_be_avx+0x2ec>
- DB 233,110,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,105,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,10 ; jne 9c42 <_sk_load_tables_rgb_u16_be_avx+0x2ec>
+ DB 233,110,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,105,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 993b <_sk_load_tables_rgb_u16_be_avx+0x315>
+ DB 114,20 ; jb 9c6b <_sk_load_tables_rgb_u16_be_avx+0x315>
DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,64,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,59,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,64,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,59,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,113,28,2,0 ; vbroadcastss 0x21c71(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,45,31,2,0 ; vbroadcastss 0x21f2d(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -9277,7 +9467,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,95,26,2,0 ; vbroadcastss 0x21a5f(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,27,29,2,0 ; vbroadcastss 0x21d1b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -9391,7 +9581,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,60,24,2,0 ; vbroadcastss 0x2183c(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,248,26,2,0 ; vbroadcastss 0x21af8(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -9586,36 +9776,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,5,21,2,0 ; vbroadcastss 0x21505(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,193,23,2,0 ; vbroadcastss 0x217c1(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,251,20,2,0 ; vbroadcastss 0x214fb(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,183,23,2,0 ; vbroadcastss 0x217b7(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,81,20,2,0 ; vbroadcastss 0x21451(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,13,23,2,0 ; vbroadcastss 0x2170d(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,227,20,2,0 ; vbroadcastss 0x214e3(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,159,23,2,0 ; vbroadcastss 0x2179f(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,217,20,2,0 ; vbroadcastss 0x214d9(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,149,23,2,0 ; vbroadcastss 0x21795(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,202,20,2,0 ; vbroadcastss 0x214ca(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,134,23,2,0 ; vbroadcastss 0x21786(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,192,20,2,0 ; vbroadcastss 0x214c0(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,124,23,2,0 ; vbroadcastss 0x2177c(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,164,20,2,0 ; vbroadcastss 0x214a4(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,96,23,2,0 ; vbroadcastss 0x21760(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,154,20,2,0 ; vbroadcastss 0x2149a(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,86,23,2,0 ; vbroadcastss 0x21756(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,139,20,2,0 ; vbroadcastss 0x2148b(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,71,23,2,0 ; vbroadcastss 0x21747(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,129,20,2,0 ; vbroadcastss 0x21481(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,61,23,2,0 ; vbroadcastss 0x2173d(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,114,20,2,0 ; vbroadcastss 0x21472(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,46,23,2,0 ; vbroadcastss 0x2172e(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9623,7 +9813,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,137,19,2,0 ; vbroadcastss 0x21389(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,69,22,2,0 ; vbroadcastss 0x21645(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9643,36 +9833,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,202,19,2,0 ; vbroadcastss 0x213ca(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,134,22,2,0 ; vbroadcastss 0x21686(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,192,19,2,0 ; vbroadcastss 0x213c0(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,124,22,2,0 ; vbroadcastss 0x2167c(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,22,19,2,0 ; vbroadcastss 0x21316(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,210,21,2,0 ; vbroadcastss 0x215d2(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,168,19,2,0 ; vbroadcastss 0x213a8(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,100,22,2,0 ; vbroadcastss 0x21664(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,158,19,2,0 ; vbroadcastss 0x2139e(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,90,22,2,0 ; vbroadcastss 0x2165a(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,143,19,2,0 ; vbroadcastss 0x2138f(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,75,22,2,0 ; vbroadcastss 0x2164b(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,133,19,2,0 ; vbroadcastss 0x21385(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,65,22,2,0 ; vbroadcastss 0x21641(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,105,19,2,0 ; vbroadcastss 0x21369(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,37,22,2,0 ; vbroadcastss 0x21625(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,95,19,2,0 ; vbroadcastss 0x2135f(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,27,22,2,0 ; vbroadcastss 0x2161b(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,80,19,2,0 ; vbroadcastss 0x21350(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,12,22,2,0 ; vbroadcastss 0x2160c(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,70,19,2,0 ; vbroadcastss 0x21346(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,2,22,2,0 ; vbroadcastss 0x21602(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,55,19,2,0 ; vbroadcastss 0x21337(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,243,21,2,0 ; vbroadcastss 0x215f3(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9680,7 +9870,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,78,18,2,0 ; vbroadcastss 0x2124e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,10,21,2,0 ; vbroadcastss 0x2150a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9700,36 +9890,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,143,18,2,0 ; vbroadcastss 0x2128f(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,75,21,2,0 ; vbroadcastss 0x2154b(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,133,18,2,0 ; vbroadcastss 0x21285(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,65,21,2,0 ; vbroadcastss 0x21541(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,219,17,2,0 ; vbroadcastss 0x211db(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,151,20,2,0 ; vbroadcastss 0x21497(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,109,18,2,0 ; vbroadcastss 0x2126d(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,41,21,2,0 ; vbroadcastss 0x21529(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,99,18,2,0 ; vbroadcastss 0x21263(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,31,21,2,0 ; vbroadcastss 0x2151f(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,84,18,2,0 ; vbroadcastss 0x21254(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,16,21,2,0 ; vbroadcastss 0x21510(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,74,18,2,0 ; vbroadcastss 0x2124a(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,6,21,2,0 ; vbroadcastss 0x21506(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,46,18,2,0 ; vbroadcastss 0x2122e(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,234,20,2,0 ; vbroadcastss 0x214ea(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,36,18,2,0 ; vbroadcastss 0x21224(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,224,20,2,0 ; vbroadcastss 0x214e0(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,21,18,2,0 ; vbroadcastss 0x21215(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,209,20,2,0 ; vbroadcastss 0x214d1(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,11,18,2,0 ; vbroadcastss 0x2120b(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,199,20,2,0 ; vbroadcastss 0x214c7(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,252,17,2,0 ; vbroadcastss 0x211fc(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,184,20,2,0 ; vbroadcastss 0x214b8(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9737,7 +9927,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,19,17,2,0 ; vbroadcastss 0x21113(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,207,19,2,0 ; vbroadcastss 0x213cf(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9757,36 +9947,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,84,17,2,0 ; vbroadcastss 0x21154(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,16,20,2,0 ; vbroadcastss 0x21410(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,74,17,2,0 ; vbroadcastss 0x2114a(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,6,20,2,0 ; vbroadcastss 0x21406(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,160,16,2,0 ; vbroadcastss 0x210a0(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,92,19,2,0 ; vbroadcastss 0x2135c(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,50,17,2,0 ; vbroadcastss 0x21132(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,238,19,2,0 ; vbroadcastss 0x213ee(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,40,17,2,0 ; vbroadcastss 0x21128(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,228,19,2,0 ; vbroadcastss 0x213e4(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,25,17,2,0 ; vbroadcastss 0x21119(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,213,19,2,0 ; vbroadcastss 0x213d5(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,15,17,2,0 ; vbroadcastss 0x2110f(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,203,19,2,0 ; vbroadcastss 0x213cb(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,243,16,2,0 ; vbroadcastss 0x210f3(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,175,19,2,0 ; vbroadcastss 0x213af(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,233,16,2,0 ; vbroadcastss 0x210e9(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,165,19,2,0 ; vbroadcastss 0x213a5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,218,16,2,0 ; vbroadcastss 0x210da(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,150,19,2,0 ; vbroadcastss 0x21396(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,208,16,2,0 ; vbroadcastss 0x210d0(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,140,19,2,0 ; vbroadcastss 0x2138c(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,193,16,2,0 ; vbroadcastss 0x210c1(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,125,19,2,0 ; vbroadcastss 0x2137d(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9794,7 +9984,7 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,216,15,2,0 ; vbroadcastss 0x20fd8(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,148,18,2,0 ; vbroadcastss 0x21294(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9811,34 +10001,34 @@ _sk_gamma_avx LABEL PROC
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1
- DB 196,98,125,24,5,33,16,2,0 ; vbroadcastss 0x21021(%rip),%ymm8 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,5,221,18,2,0 ; vbroadcastss 0x212dd(%rip),%ymm8 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,23,16,2,0 ; vbroadcastss 0x21017(%rip),%ymm9 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,13,211,18,2,0 ; vbroadcastss 0x212d3(%rip),%ymm9 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
- DB 196,226,125,24,37,109,15,2,0 ; vbroadcastss 0x20f6d(%rip),%ymm4 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,37,41,18,2,0 ; vbroadcastss 0x21229(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,21,0,16,2,0 ; vbroadcastss 0x21000(%rip),%ymm10 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,21,188,18,2,0 ; vbroadcastss 0x212bc(%rip),%ymm10 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,29,246,15,2,0 ; vbroadcastss 0x20ff6(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,178,18,2,0 ; vbroadcastss 0x212b2(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2
DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
- DB 196,98,125,24,37,232,15,2,0 ; vbroadcastss 0x20fe8(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,164,18,2,0 ; vbroadcastss 0x212a4(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,45,222,15,2,0 ; vbroadcastss 0x20fde(%rip),%ymm13 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,45,154,18,2,0 ; vbroadcastss 0x2129a(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0
DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14
DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6
- DB 196,98,125,24,61,189,15,2,0 ; vbroadcastss 0x20fbd(%rip),%ymm15 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,61,121,18,2,0 ; vbroadcastss 0x21279(%rip),%ymm15 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
- DB 196,226,125,24,29,179,15,2,0 ; vbroadcastss 0x20fb3(%rip),%ymm3 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,226,125,24,29,111,18,2,0 ; vbroadcastss 0x2126f(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
- DB 196,226,125,24,21,166,15,2,0 ; vbroadcastss 0x20fa6(%rip),%ymm2 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,21,98,18,2,0 ; vbroadcastss 0x21262(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
- DB 196,226,125,24,53,157,15,2,0 ; vbroadcastss 0x20f9d(%rip),%ymm6 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,226,125,24,53,89,18,2,0 ; vbroadcastss 0x21259(%rip),%ymm6 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0
DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
@@ -9880,7 +10070,7 @@ _sk_gamma_avx LABEL PROC
DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2
DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,225,14,2,0 ; vbroadcastss 0x20ee1(%rip),%ymm2 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,226,125,24,21,157,17,2,0 ; vbroadcastss 0x2119d(%rip),%ymm2 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3
DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4
DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2
@@ -9898,31 +10088,31 @@ _sk_gamma_avx LABEL PROC
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,148,14,2,0 ; vbroadcastss 0x20e94(%rip),%ymm8 # 2b650 <_sk_overlay_sse2_8bit+0x52f>
+ DB 196,98,125,24,5,80,17,2,0 ; vbroadcastss 0x21150(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,242,13,2,0 ; vbroadcastss 0x20df2(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,174,16,2,0 ; vbroadcastss 0x210ae(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,124,14,2,0 ; vbroadcastss 0x20e7c(%rip),%ymm9 # 2b654 <_sk_overlay_sse2_8bit+0x533>
+ DB 196,98,125,24,13,56,17,2,0 ; vbroadcastss 0x21138(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0x533>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,104,14,2,0 ; vbroadcastss 0x20e68(%rip),%ymm8 # 2b658 <_sk_overlay_sse2_8bit+0x537>
+ DB 196,98,125,24,5,36,17,2,0 ; vbroadcastss 0x21124(%rip),%ymm8 # 2bc44 <_sk_overlay_sse2_8bit+0x537>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,94,14,2,0 ; vbroadcastss 0x20e5e(%rip),%ymm8 # 2b65c <_sk_overlay_sse2_8bit+0x53b>
+ DB 196,98,125,24,5,26,17,2,0 ; vbroadcastss 0x2111a(%rip),%ymm8 # 2bc48 <_sk_overlay_sse2_8bit+0x53b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,84,14,2,0 ; vbroadcastss 0x20e54(%rip),%ymm8 # 2b660 <_sk_overlay_sse2_8bit+0x53f>
+ DB 196,98,125,24,5,16,17,2,0 ; vbroadcastss 0x21110(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,70,14,2,0 ; vbroadcastss 0x20e46(%rip),%ymm8 # 2b664 <_sk_overlay_sse2_8bit+0x543>
+ DB 196,98,125,24,5,2,17,2,0 ; vbroadcastss 0x21102(%rip),%ymm8 # 2bc50 <_sk_overlay_sse2_8bit+0x543>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,47,14,2,0 ; vbroadcastss 0x20e2f(%rip),%ymm9 # 2b668 <_sk_overlay_sse2_8bit+0x547>
+ DB 196,98,125,24,13,235,16,2,0 ; vbroadcastss 0x210eb(%rip),%ymm9 # 2bc54 <_sk_overlay_sse2_8bit+0x547>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,36,14,2,0 ; vbroadcastss 0x20e24(%rip),%ymm11 # 2b66c <_sk_overlay_sse2_8bit+0x54b>
+ DB 196,98,125,24,29,224,16,2,0 ; vbroadcastss 0x210e0(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,26,14,2,0 ; vbroadcastss 0x20e1a(%rip),%ymm12 # 2b670 <_sk_overlay_sse2_8bit+0x54f>
+ DB 196,98,125,24,37,214,16,2,0 ; vbroadcastss 0x210d6(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -9937,9 +10127,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,208,13,2,0 ; vbroadcastss 0x20dd0(%rip),%ymm0 # 2b674 <_sk_overlay_sse2_8bit+0x553>
+ DB 196,226,125,24,5,140,16,2,0 ; vbroadcastss 0x2108c(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,199,13,2,0 ; vbroadcastss 0x20dc7(%rip),%ymm8 # 2b678 <_sk_overlay_sse2_8bit+0x557>
+ DB 196,98,125,24,5,131,16,2,0 ; vbroadcastss 0x21083(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9954,15 +10144,15 @@ _sk_load_a8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne a916 <_sk_load_a8_avx+0x5c>
+ DB 117,67 ; jne ac46 <_sk_load_a8_avx+0x5c>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,79,22,2,0 ; vpand 0x2164f(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,255,24,2,0 ; vpand 0x218ff(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,3,13,2,0 ; vbroadcastss 0x20d03(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,191,15,2,0 ; vbroadcastss 0x20fbf(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -9975,15 +10165,15 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja a8d9 <_sk_load_a8_avx+0x1f>
+ DB 119,175 ; ja ac09 <_sk_load_a8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # a9ac <_sk_load_a8_avx+0xf2>
+ DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # acdc <_sk_load_a8_avx+0xf2>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,144 ; jmp a8d9 <_sk_load_a8_avx+0x1f>
+ DB 235,144 ; jmp ac09 <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -9991,7 +10181,7 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,104,255,255,255 ; jmpq a8d9 <_sk_load_a8_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10002,7 +10192,7 @@ _sk_load_a8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,45,255,255,255 ; jmpq a8d9 <_sk_load_a8_avx+0x1f>
+ DB 233,45,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -10033,15 +10223,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne aa24 <_sk_load_a8_dst_avx+0x5c>
+ DB 117,67 ; jne ad54 <_sk_load_a8_dst_avx+0x5c>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,65,21,2,0 ; vpand 0x21541(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,241,23,2,0 ; vpand 0x217f1(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,245,11,2,0 ; vbroadcastss 0x20bf5(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,177,14,2,0 ; vbroadcastss 0x20eb1(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -10054,15 +10244,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 119,175 ; ja ad17 <_sk_load_a8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # aabc <_sk_load_a8_dst_avx+0xf4>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # adec <_sk_load_a8_dst_avx+0xf4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,144 ; jmp a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 235,144 ; jmp ad17 <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10070,7 +10260,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,104,255,255,255 ; jmpq a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10081,7 +10271,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,45,255,255,255 ; jmpq a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,45,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -10090,7 +10280,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde00aacc <_sk_overlay_sse2_8bit+0xffffffffddfdf9ab>
+ DB 232,255,255,255,221 ; callq ffffffffde00adfc <_sk_overlay_sse2_8bit+0xffffffffddfdf6ef>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -10143,7 +10333,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,96,10,2,0 ; vbroadcastss 0x20a60(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,28,13,2,0 ; vbroadcastss 0x20d1c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10160,14 +10350,14 @@ _sk_store_a8_avx LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,231,9,2,0 ; vbroadcastss 0x209e7(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,163,12,2,0 ; vbroadcastss 0x20ca3(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne abff <_sk_store_a8_avx+0x47>
+ DB 117,11 ; jne af2f <_sk_store_a8_avx+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10176,25 +10366,25 @@ _sk_store_a8_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja abfa <_sk_store_a8_avx+0x42>
+ DB 119,235 ; ja af2a <_sk_store_a8_avx+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # ac74 <_sk_store_a8_avx+0xbc>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # afa4 <_sk_store_a8_avx+0xbc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp abfa <_sk_store_a8_avx+0x42>
+ DB 235,201 ; jmp af2a <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,254,18,2,0 ; vpshufb 0x212fe(%rip),%xmm8,%xmm8 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f>
+ DB 196,98,57,0,5,174,21,2,0 ; vpshufb 0x215ae(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp abfa <_sk_store_a8_avx+0x42>
+ DB 235,175 ; jmp af2a <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,228,18,2,0 ; vpshufb 0x212e4(%rip),%xmm8,%xmm8 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f>
+ DB 196,98,57,0,5,148,21,2,0 ; vpshufb 0x21594(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp abfa <_sk_store_a8_avx+0x42>
+ DB 235,134 ; jmp af2a <_sk_store_a8_avx+0x42>
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
DB 255,197 ; inc %ebp
@@ -10225,18 +10415,18 @@ _sk_load_g8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne acf1 <_sk_load_g8_avx+0x61>
+ DB 117,72 ; jne b021 <_sk_load_g8_avx+0x61>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,121,18,2,0 ; vpand 0x21279(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,41,21,2,0 ; vpand 0x21529(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,45,9,2,0 ; vbroadcastss 0x2092d(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,233,11,2,0 ; vbroadcastss 0x20be9(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,170,8,2,0 ; vbroadcastss 0x208aa(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,102,11,2,0 ; vbroadcastss 0x20b66(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -10246,15 +10436,15 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja acaf <_sk_load_g8_avx+0x1f>
+ DB 119,170 ; ja afdf <_sk_load_g8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # ad88 <_sk_load_g8_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b0b8 <_sk_load_g8_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,139 ; jmp acaf <_sk_load_g8_avx+0x1f>
+ DB 235,139 ; jmp afdf <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -10262,7 +10452,7 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,99,255,255,255 ; jmpq acaf <_sk_load_g8_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10273,7 +10463,7 @@ _sk_load_g8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,40,255,255,255 ; jmpq acaf <_sk_load_g8_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10282,7 +10472,7 @@ _sk_load_g8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00ad98 <_sk_overlay_sse2_8bit+0xffffffffdefdfc77>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b0c8 <_sk_overlay_sse2_8bit+0xffffffffdefdf9bb>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10303,18 +10493,18 @@ _sk_load_g8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne ae05 <_sk_load_g8_dst_avx+0x61>
+ DB 117,72 ; jne b135 <_sk_load_g8_dst_avx+0x61>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,101,17,2,0 ; vpand 0x21165(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,21,20,2,0 ; vpand 0x21415(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,25,8,2,0 ; vbroadcastss 0x20819(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,213,10,2,0 ; vbroadcastss 0x20ad5(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,150,7,2,0 ; vbroadcastss 0x20796(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,82,10,2,0 ; vbroadcastss 0x20a52(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -10324,15 +10514,15 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 119,170 ; ja b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # ae9c <_sk_load_g8_dst_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b1cc <_sk_load_g8_dst_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,139 ; jmp adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 235,139 ; jmp b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10340,7 +10530,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,99,255,255,255 ; jmpq adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10351,7 +10541,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,40,255,255,255 ; jmpq adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10360,7 +10550,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00aeac <_sk_overlay_sse2_8bit+0xffffffffdefdfd8b>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b1dc <_sk_overlay_sse2_8bit+0xffffffffdefdfacf>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10413,10 +10603,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,128,6,2,0 ; vbroadcastss 0x20680(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,60,9,2,0 ; vbroadcastss 0x2093c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,253,5,2,0 ; vbroadcastss 0x205fd(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -10432,29 +10622,29 @@ _sk_load_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne b03e <_sk_load_565_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne b36e <_sk_load_565_avx+0xa1>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,41,6,2,0 ; vbroadcastss 0x20629(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,5,229,8,2,0 ; vbroadcastss 0x208e5(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,28,6,2,0 ; vbroadcastss 0x2061c(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,216,8,2,0 ; vbroadcastss 0x208d8(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,19,6,2,0 ; vbroadcastss 0x20613(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,13,207,8,2,0 ; vbroadcastss 0x208cf(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,6,6,2,0 ; vbroadcastss 0x20606(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,194,8,2,0 ; vbroadcastss 0x208c2(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,253,5,2,0 ; vbroadcastss 0x205fd(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,240,5,2,0 ; vbroadcastss 0x205f0(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,172,8,2,0 ; vbroadcastss 0x208ac(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,85,5,2,0 ; vbroadcastss 0x20555(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,17,8,2,0 ; vbroadcastss 0x20811(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10462,27 +10652,27 @@ _sk_load_565_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja afc3 <_sk_load_565_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja b2f3 <_sk_load_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b0c4 <_sk_load_565_avx+0x127>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b3f4 <_sk_load_565_avx+0x127>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,75,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,46,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,1,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -10514,29 +10704,29 @@ _sk_load_565_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne b181 <_sk_load_565_dst_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne b4b1 <_sk_load_565_dst_avx+0xa1>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- DB 196,226,125,24,37,230,4,2,0 ; vbroadcastss 0x204e6(%rip),%ymm4 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,37,162,7,2,0 ; vbroadcastss 0x207a2(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,217,4,2,0 ; vbroadcastss 0x204d9(%rip),%ymm5 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,45,149,7,2,0 ; vbroadcastss 0x20795(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,208,4,2,0 ; vbroadcastss 0x204d0(%rip),%ymm5 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,45,140,7,2,0 ; vbroadcastss 0x2078c(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,195,4,2,0 ; vbroadcastss 0x204c3(%rip),%ymm7 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,61,127,7,2,0 ; vbroadcastss 0x2077f(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,24,61,186,4,2,0 ; vbroadcastss 0x204ba(%rip),%ymm7 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,61,118,7,2,0 ; vbroadcastss 0x20776(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,173,4,2,0 ; vbroadcastss 0x204ad(%rip),%ymm7 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,61,105,7,2,0 ; vbroadcastss 0x20769(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,18,4,2,0 ; vbroadcastss 0x20412(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,206,6,2,0 ; vbroadcastss 0x206ce(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10544,27 +10734,27 @@ _sk_load_565_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja b106 <_sk_load_565_dst_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja b436 <_sk_load_565_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b208 <_sk_load_565_dst_avx+0x128>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b538 <_sk_load_565_dst_avx+0x128>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,75,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,46,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,1,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10634,23 +10824,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,18,3,2,0 ; vbroadcastss 0x20312(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,5,206,5,2,0 ; vbroadcastss 0x205ce(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,5,3,2,0 ; vbroadcastss 0x20305(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,193,5,2,0 ; vbroadcastss 0x205c1(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,252,2,2,0 ; vbroadcastss 0x202fc(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,13,184,5,2,0 ; vbroadcastss 0x205b8(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,239,2,2,0 ; vbroadcastss 0x202ef(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,171,5,2,0 ; vbroadcastss 0x205ab(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,230,2,2,0 ; vbroadcastss 0x202e6(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,29,162,5,2,0 ; vbroadcastss 0x205a2(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,217,2,2,0 ; vbroadcastss 0x202d9(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,149,5,2,0 ; vbroadcastss 0x20595(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,62,2,2,0 ; vbroadcastss 0x2023e(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,250,4,2,0 ; vbroadcastss 0x204fa(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_avx
@@ -10663,14 +10853,14 @@ _sk_store_565_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,8,3,2,0 ; vbroadcastss 0x20308(%rip),%ymm8 # 2b67c <_sk_overlay_sse2_8bit+0x55b>
+ DB 196,98,125,24,5,196,5,2,0 ; vbroadcastss 0x205c4(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,225,2,2,0 ; vbroadcastss 0x202e1(%rip),%ymm10 # 2b680 <_sk_overlay_sse2_8bit+0x55f>
+ DB 196,98,125,24,21,157,5,2,0 ; vbroadcastss 0x2059d(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -10684,7 +10874,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne b3f0 <_sk_store_565_avx+0x9c>
+ DB 117,11 ; jne b720 <_sk_store_565_avx+0x9c>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10693,22 +10883,22 @@ _sk_store_565_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja b3eb <_sk_store_565_avx+0x97>
+ DB 119,235 ; ja b71b <_sk_store_565_avx+0x97>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # b450 <_sk_store_565_avx+0xfc>
+ DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # b780 <_sk_store_565_avx+0xfc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp b3eb <_sk_store_565_avx+0x97>
+ DB 235,206 ; jmp b71b <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp b3eb <_sk_store_565_avx+0x97>
+ DB 235,190 ; jmp b71b <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp b3eb <_sk_store_565_avx+0x97>
+ DB 235,158 ; jmp b71b <_sk_store_565_avx+0x97>
DB 15,31,0 ; nopl (%rax)
DB 196 ; (bad)
DB 255 ; (bad)
@@ -10745,31 +10935,31 @@ _sk_load_4444_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne b525 <_sk_load_4444_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne b855 <_sk_load_4444_avx+0xb9>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,214,1,2,0 ; vbroadcastss 0x201d6(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,5,146,4,2,0 ; vbroadcastss 0x20492(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,201,1,2,0 ; vbroadcastss 0x201c9(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,133,4,2,0 ; vbroadcastss 0x20485(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,192,1,2,0 ; vbroadcastss 0x201c0(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,13,124,4,2,0 ; vbroadcastss 0x2047c(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,179,1,2,0 ; vbroadcastss 0x201b3(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,111,4,2,0 ; vbroadcastss 0x2046f(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,170,1,2,0 ; vbroadcastss 0x201aa(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,21,102,4,2,0 ; vbroadcastss 0x20466(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,157,1,2,0 ; vbroadcastss 0x2019d(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,89,4,2,0 ; vbroadcastss 0x20459(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,147,1,2,0 ; vbroadcastss 0x20193(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,79,4,2,0 ; vbroadcastss 0x2044f(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,133,1,2,0 ; vbroadcastss 0x20185(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,65,4,2,0 ; vbroadcastss 0x20441(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10779,27 +10969,27 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja b492 <_sk_load_4444_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja b7c2 <_sk_load_4444_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b5ac <_sk_load_4444_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b8dc <_sk_load_4444_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,51,255,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,22,255,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,233,254,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10834,31 +11024,31 @@ _sk_load_4444_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne b681 <_sk_load_4444_dst_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne b9b1 <_sk_load_4444_dst_avx+0xb9>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- DB 196,226,125,24,37,122,0,2,0 ; vbroadcastss 0x2007a(%rip),%ymm4 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,37,54,3,2,0 ; vbroadcastss 0x20336(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,109,0,2,0 ; vbroadcastss 0x2006d(%rip),%ymm5 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,45,41,3,2,0 ; vbroadcastss 0x20329(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,100,0,2,0 ; vbroadcastss 0x20064(%rip),%ymm5 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,45,32,3,2,0 ; vbroadcastss 0x20320(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,87,0,2,0 ; vbroadcastss 0x20057(%rip),%ymm6 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,53,19,3,2,0 ; vbroadcastss 0x20313(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,24,53,78,0,2,0 ; vbroadcastss 0x2004e(%rip),%ymm6 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,53,10,3,2,0 ; vbroadcastss 0x2030a(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,65,0,2,0 ; vbroadcastss 0x20041(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,253,2,2,0 ; vbroadcastss 0x202fd(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,24,5,55,0,2,0 ; vbroadcastss 0x20037(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,243,2,2,0 ; vbroadcastss 0x202f3(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,41,0,2,0 ; vbroadcastss 0x20029(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,229,2,2,0 ; vbroadcastss 0x202e5(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10868,27 +11058,27 @@ _sk_load_4444_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja b91e <_sk_load_4444_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b708 <_sk_load_4444_dst_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # ba38 <_sk_load_4444_dst_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,51,255,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,22,255,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,233,254,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10958,25 +11148,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,142,254,1,0 ; vbroadcastss 0x1fe8e(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,5,74,1,2,0 ; vbroadcastss 0x2014a(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,129,254,1,0 ; vbroadcastss 0x1fe81(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,61,1,2,0 ; vbroadcastss 0x2013d(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,120,254,1,0 ; vbroadcastss 0x1fe78(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,13,52,1,2,0 ; vbroadcastss 0x20134(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,107,254,1,0 ; vbroadcastss 0x1fe6b(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,39,1,2,0 ; vbroadcastss 0x20127(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,98,254,1,0 ; vbroadcastss 0x1fe62(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,21,30,1,2,0 ; vbroadcastss 0x2011e(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,85,254,1,0 ; vbroadcastss 0x1fe55(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,17,1,2,0 ; vbroadcastss 0x20111(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,75,254,1,0 ; vbroadcastss 0x1fe4b(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,7,1,2,0 ; vbroadcastss 0x20107(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,61,254,1,0 ; vbroadcastss 0x1fe3d(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,249,0,2,0 ; vbroadcastss 0x200f9(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10991,7 +11181,7 @@ _sk_store_4444_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,24,254,1,0 ; vbroadcastss 0x1fe18(%rip),%ymm8 # 2b6a4 <_sk_overlay_sse2_8bit+0x583>
+ DB 196,98,125,24,5,212,0,2,0 ; vbroadcastss 0x200d4(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -11018,7 +11208,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne b926 <_sk_store_4444_avx+0xba>
+ DB 117,11 ; jne bc56 <_sk_store_4444_avx+0xba>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11027,22 +11217,22 @@ _sk_store_4444_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja b921 <_sk_store_4444_avx+0xb5>
+ DB 119,235 ; ja bc51 <_sk_store_4444_avx+0xb5>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # b984 <_sk_store_4444_avx+0x118>
+ DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # bcb4 <_sk_store_4444_avx+0x118>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp b921 <_sk_store_4444_avx+0xb5>
+ DB 235,206 ; jmp bc51 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp b921 <_sk_store_4444_avx+0xb5>
+ DB 235,190 ; jmp bc51 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp b921 <_sk_store_4444_avx+0xb5>
+ DB 235,158 ; jmp bc51 <_sk_store_4444_avx+0xb5>
DB 144 ; nop
DB 198 ; (bad)
DB 255 ; (bad)
@@ -11079,12 +11269,12 @@ _sk_load_8888_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne ba49 <_sk_load_8888_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne bd79 <_sk_load_8888_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,177,0,2,0 ; vmovapd 0x200b1(%rip),%ymm10 # 2ba80 <_sk_overlay_sse2_8bit+0x95f>
+ DB 197,125,40,21,97,3,2,0 ; vmovapd 0x20361(%rip),%ymm10 # 2c060 <_sk_overlay_sse2_8bit+0x953>
DB 196,193,53,84,194 ; vandpd %ymm10,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,35,252,1,0 ; vbroadcastss 0x1fc23(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,223,254,1,0 ; vbroadcastss 0x1fedf(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11112,21 +11302,21 @@ _sk_load_8888_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja b9c7 <_sk_load_8888_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja bcf7 <_sk_load_8888_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bb00 <_sk_load_8888_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # be30 <_sk_load_8888_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11140,9 +11330,9 @@ _sk_load_8888_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,202,254,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe bb01 <_sk_load_8888_avx+0x161>
+ DB 118,255 ; jbe be31 <_sk_load_8888_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11173,12 +11363,12 @@ _sk_load_8888_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne bbc5 <_sk_load_8888_dst_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne bef5 <_sk_load_8888_dst_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,85,255,1,0 ; vmovapd 0x1ff55(%rip),%ymm10 # 2baa0 <_sk_overlay_sse2_8bit+0x97f>
+ DB 197,125,40,21,5,2,2,0 ; vmovapd 0x20205(%rip),%ymm10 # 2c080 <_sk_overlay_sse2_8bit+0x973>
DB 196,193,53,84,226 ; vandpd %ymm10,%ymm9,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,167,250,1,0 ; vbroadcastss 0x1faa7(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,99,253,1,0 ; vbroadcastss 0x1fd63(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11206,21 +11396,21 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja be73 <_sk_load_8888_dst_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bc7c <_sk_load_8888_dst_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bfac <_sk_load_8888_dst_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11234,9 +11424,9 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,202,254,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe bc7d <_sk_load_8888_dst_avx+0x161>
+ DB 118,255 ; jbe bfad <_sk_load_8888_dst_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11291,10 +11481,10 @@ _sk_gather_8888_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,125,253,1,0 ; vmovaps 0x1fd7d(%rip),%ymm10 # 2bac0 <_sk_overlay_sse2_8bit+0x99f>
+ DB 197,124,40,21,45,0,2,0 ; vmovaps 0x2002d(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x993>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,175,248,1,0 ; vbroadcastss 0x1f8af(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,107,251,1,0 ; vbroadcastss 0x1fb6b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -11326,7 +11516,7 @@ _sk_store_8888_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,229,247,1,0 ; vbroadcastss 0x1f7e5(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,161,250,1,0 ; vbroadcastss 0x1faa1(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11351,7 +11541,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne be66 <_sk_store_8888_avx+0xb0>
+ DB 117,11 ; jne c196 <_sk_store_8888_avx+0xb0>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11360,17 +11550,17 @@ _sk_store_8888_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja be61 <_sk_store_8888_avx+0xab>
+ DB 119,235 ; ja c191 <_sk_store_8888_avx+0xab>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # bed4 <_sk_store_8888_avx+0x11e>
+ DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c204 <_sk_store_8888_avx+0x11e>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp be61 <_sk_store_8888_avx+0xab>
+ DB 235,207 ; jmp c191 <_sk_store_8888_avx+0xab>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp be61 <_sk_store_8888_avx+0xab>
+ DB 235,191 ; jmp c191 <_sk_store_8888_avx+0xab>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -11378,7 +11568,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp be61 <_sk_store_8888_avx+0xab>
+ DB 235,142 ; jmp c191 <_sk_store_8888_avx+0xab>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -11412,12 +11602,12 @@ _sk_load_bgra_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne bf99 <_sk_load_bgra_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c2c9 <_sk_load_bgra_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,193,251,1,0 ; vmovapd 0x1fbc1(%rip),%ymm10 # 2bae0 <_sk_overlay_sse2_8bit+0x9bf>
+ DB 197,125,40,21,113,254,1,0 ; vmovapd 0x1fe71(%rip),%ymm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x9b3>
DB 196,193,53,84,202 ; vandpd %ymm10,%ymm9,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,98,125,24,5,211,246,1,0 ; vbroadcastss 0x1f6d3(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,143,249,1,0 ; vbroadcastss 0x1f98f(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11445,21 +11635,21 @@ _sk_load_bgra_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja bf17 <_sk_load_bgra_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c247 <_sk_load_bgra_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c050 <_sk_load_bgra_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c380 <_sk_load_bgra_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11473,9 +11663,9 @@ _sk_load_bgra_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,202,254,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe c051 <_sk_load_bgra_avx+0x161>
+ DB 118,255 ; jbe c381 <_sk_load_bgra_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11506,12 +11696,12 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne c115 <_sk_load_bgra_dst_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c445 <_sk_load_bgra_dst_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,101,250,1,0 ; vmovapd 0x1fa65(%rip),%ymm10 # 2bb00 <_sk_overlay_sse2_8bit+0x9df>
+ DB 197,125,40,21,21,253,1,0 ; vmovapd 0x1fd15(%rip),%ymm10 # 2c0e0 <_sk_overlay_sse2_8bit+0x9d3>
DB 196,193,53,84,234 ; vandpd %ymm10,%ymm9,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,98,125,24,5,87,245,1,0 ; vbroadcastss 0x1f557(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,19,248,1,0 ; vbroadcastss 0x1f813(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11539,21 +11729,21 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c1cc <_sk_load_bgra_dst_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c4fc <_sk_load_bgra_dst_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11567,9 +11757,9 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,202,254,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe c1cd <_sk_load_bgra_dst_avx+0x161>
+ DB 118,255 ; jbe c4fd <_sk_load_bgra_dst_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11624,10 +11814,10 @@ _sk_gather_bgra_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,13,141,248,1,0 ; vmovaps 0x1f88d(%rip),%ymm9 # 2bb20 <_sk_overlay_sse2_8bit+0x9ff>
+ DB 197,124,40,13,61,251,1,0 ; vmovaps 0x1fb3d(%rip),%ymm9 # 2c100 <_sk_overlay_sse2_8bit+0x9f3>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,95,243,1,0 ; vbroadcastss 0x1f35f(%rip),%ymm10 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,21,27,246,1,0 ; vbroadcastss 0x1f61b(%rip),%ymm10 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2
DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
@@ -11659,7 +11849,7 @@ _sk_store_bgra_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,149,242,1,0 ; vbroadcastss 0x1f295(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,81,245,1,0 ; vbroadcastss 0x1f551(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11684,7 +11874,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne c3b6 <_sk_store_bgra_avx+0xb0>
+ DB 117,11 ; jne c6e6 <_sk_store_bgra_avx+0xb0>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11693,17 +11883,17 @@ _sk_store_bgra_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja c3b1 <_sk_store_bgra_avx+0xab>
+ DB 119,235 ; ja c6e1 <_sk_store_bgra_avx+0xab>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c424 <_sk_store_bgra_avx+0x11e>
+ DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c754 <_sk_store_bgra_avx+0x11e>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp c3b1 <_sk_store_bgra_avx+0xab>
+ DB 235,207 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp c3b1 <_sk_store_bgra_avx+0xab>
+ DB 235,191 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -11711,7 +11901,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp c3b1 <_sk_store_bgra_avx+0xab>
+ DB 235,142 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -11749,7 +11939,7 @@ _sk_load_f16_avx LABEL PROC
DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp)
DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp)
DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp)
- DB 15,133,147,2,0,0 ; jne c711 <_sk_load_f16_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne ca41 <_sk_load_f16_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,76,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -11767,13 +11957,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,49,242,1,0 ; vbroadcastss 0x1f231(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,237,244,1,0 ; vbroadcastss 0x1f4ed(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,245,241,1,0 ; vbroadcastss 0x1f1f5(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,177,244,1,0 ; vbroadcastss 0x1f4b1(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,15,242,1,0 ; vbroadcastss 0x1f20f(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,203,244,1,0 ; vbroadcastss 0x1f4cb(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11787,7 +11977,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,197,241,1,0 ; vbroadcastss 0x1f1c5(%rip),%xmm3 # 2b714 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,29,129,244,1,0 ; vbroadcastss 0x1f481(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -11880,29 +12070,29 @@ _sk_load_f16_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je c777 <_sk_load_f16_avx+0x337>
+ DB 116,85 ; je caa7 <_sk_load_f16_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb c777 <_sk_load_f16_avx+0x337>
+ DB 114,72 ; jb caa7 <_sk_load_f16_avx+0x337>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je c784 <_sk_load_f16_avx+0x344>
+ DB 116,72 ; je cab4 <_sk_load_f16_avx+0x344>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb c784 <_sk_load_f16_avx+0x344>
+ DB 114,59 ; jb cab4 <_sk_load_f16_avx+0x344>
DB 196,193,123,16,76,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je c499 <_sk_load_f16_avx+0x59>
+ DB 15,132,63,253,255,255 ; je c7c9 <_sk_load_f16_avx+0x59>
DB 196,193,113,22,76,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb c499 <_sk_load_f16_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb c7c9 <_sk_load_f16_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,21,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
- DB 233,12,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
PUBLIC _sk_load_f16_dst_avx
_sk_load_f16_dst_avx LABEL PROC
@@ -11919,7 +12109,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,252,17,84,36,64 ; vmovups %ymm2,0x40(%rsp)
DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp)
DB 197,254,127,4,36 ; vmovdqu %ymm0,(%rsp)
- DB 15,133,147,2,0,0 ; jne ca5e <_sk_load_f16_dst_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne cd8e <_sk_load_f16_dst_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,108,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -11937,13 +12127,13 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- DB 196,98,125,24,37,228,238,1,0 ; vbroadcastss 0x1eee4(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,160,241,1,0 ; vbroadcastss 0x1f1a0(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5
DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4
DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14
- DB 196,98,121,24,29,168,238,1,0 ; vbroadcastss 0x1eea8(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,100,241,1,0 ; vbroadcastss 0x1f164(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7
- DB 196,98,121,24,45,194,238,1,0 ; vbroadcastss 0x1eec2(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,126,241,1,0 ; vbroadcastss 0x1f17e(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7
DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11957,7 +12147,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4
DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5
- DB 196,226,121,24,61,120,238,1,0 ; vbroadcastss 0x1ee78(%rip),%xmm7 # 2b714 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,61,52,241,1,0 ; vbroadcastss 0x1f134(%rip),%xmm7 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5
DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -12050,29 +12240,29 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je cac4 <_sk_load_f16_dst_avx+0x337>
+ DB 116,85 ; je cdf4 <_sk_load_f16_dst_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb cac4 <_sk_load_f16_dst_avx+0x337>
+ DB 114,72 ; jb cdf4 <_sk_load_f16_dst_avx+0x337>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je cad1 <_sk_load_f16_dst_avx+0x344>
+ DB 116,72 ; je ce01 <_sk_load_f16_dst_avx+0x344>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb cad1 <_sk_load_f16_dst_avx+0x344>
+ DB 114,59 ; jb ce01 <_sk_load_f16_dst_avx+0x344>
DB 196,193,123,16,108,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm5
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 15,132,63,253,255,255 ; je cb16 <_sk_load_f16_dst_avx+0x59>
DB 196,193,81,22,108,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb cb16 <_sk_load_f16_dst_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,21,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
- DB 233,12,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
PUBLIC _sk_gather_f16_avx
_sk_gather_f16_avx LABEL PROC
@@ -12131,13 +12321,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,38,235,1,0 ; vbroadcastss 0x1eb26(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,226,237,1,0 ; vbroadcastss 0x1ede2(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,234,234,1,0 ; vbroadcastss 0x1eaea(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,166,237,1,0 ; vbroadcastss 0x1eda6(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,4,235,1,0 ; vbroadcastss 0x1eb04(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,192,237,1,0 ; vbroadcastss 0x1edc0(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12151,7 +12341,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,186,234,1,0 ; vbroadcastss 0x1eaba(%rip),%xmm3 # 2b714 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,29,118,237,1,0 ; vbroadcastss 0x1ed76(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -12249,12 +12439,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,158,232,1,0 ; vbroadcastss 0x1e89e(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,90,235,1,0 ; vbroadcastss 0x1eb5a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,176,232,1,0 ; vbroadcastss 0x1e8b0(%rip),%xmm8 # 2b718 <_sk_overlay_sse2_8bit+0x5f7>
+ DB 196,98,121,24,5,108,235,1,0 ; vbroadcastss 0x1eb6c(%rip),%xmm8 # 2bd04 <_sk_overlay_sse2_8bit+0x5f7>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -12264,7 +12454,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,119,232,1,0 ; vbroadcastss 0x1e877(%rip),%ymm10 # 2b71c <_sk_overlay_sse2_8bit+0x5fb>
+ DB 196,98,125,24,21,51,235,1,0 ; vbroadcastss 0x1eb33(%rip),%ymm10 # 2bd08 <_sk_overlay_sse2_8bit+0x5fb>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -12351,7 +12541,7 @@ _sk_store_f16_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,79 ; jne d0a2 <_sk_store_f16_avx+0x286>
+ DB 117,79 ; jne d3d2 <_sk_store_f16_avx+0x286>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -12367,22 +12557,22 @@ _sk_store_f16_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,192 ; je d06e <_sk_store_f16_avx+0x252>
+ DB 116,192 ; je d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,179 ; jb d06e <_sk_store_f16_avx+0x252>
+ DB 114,179 ; jb d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,170 ; je d06e <_sk_store_f16_avx+0x252>
+ DB 116,170 ; je d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,157 ; jb d06e <_sk_store_f16_avx+0x252>
+ DB 114,157 ; jb d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,148 ; je d06e <_sk_store_f16_avx+0x252>
+ DB 116,148 ; je d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,135 ; jb d06e <_sk_store_f16_avx+0x252>
+ DB 114,135 ; jb d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 233,123,255,255,255 ; jmpq d06e <_sk_store_f16_avx+0x252>
+ DB 233,123,255,255,255 ; jmpq d39e <_sk_store_f16_avx+0x252>
PUBLIC _sk_load_u16_be_avx
_sk_load_u16_be_avx LABEL PROC
@@ -12395,7 +12585,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne d217 <_sk_load_u16_be_avx+0x124>
+ DB 15,133,253,0,0,0 ; jne d547 <_sk_load_u16_be_avx+0x124>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -12417,7 +12607,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,149,228,1,0 ; vbroadcastss 0x1e495(%rip),%ymm11 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,29,81,231,1,0 ; vbroadcastss 0x1e751(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12451,29 +12641,29 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je d27d <_sk_load_u16_be_avx+0x18a>
+ DB 116,85 ; je d5ad <_sk_load_u16_be_avx+0x18a>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb d27d <_sk_load_u16_be_avx+0x18a>
+ DB 114,72 ; jb d5ad <_sk_load_u16_be_avx+0x18a>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je d28a <_sk_load_u16_be_avx+0x197>
+ DB 116,72 ; je d5ba <_sk_load_u16_be_avx+0x197>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb d28a <_sk_load_u16_be_avx+0x197>
+ DB 114,59 ; jb d5ba <_sk_load_u16_be_avx+0x197>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,213,254,255,255 ; je d135 <_sk_load_u16_be_avx+0x42>
+ DB 15,132,213,254,255,255 ; je d465 <_sk_load_u16_be_avx+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,196,254,255,255 ; jb d135 <_sk_load_u16_be_avx+0x42>
+ DB 15,130,196,254,255,255 ; jb d465 <_sk_load_u16_be_avx+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,184,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42>
+ DB 233,184,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,171,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42>
+ DB 233,171,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,162,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42>
+ DB 233,162,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
PUBLIC _sk_load_rgb_u16_be_avx
_sk_load_rgb_u16_be_avx LABEL PROC
@@ -12488,7 +12678,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,243,0,0,0 ; jne d3b1 <_sk_load_rgb_u16_be_avx+0x11e>
+ DB 15,133,243,0,0,0 ; jne d6e1 <_sk_load_rgb_u16_be_avx+0x11e>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -12515,7 +12705,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,216,226,1,0 ; vbroadcastss 0x1e2d8(%rip),%ymm11 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,29,148,229,1,0 ; vbroadcastss 0x1e594(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12536,41 +12726,41 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,225,225,1,0 ; vbroadcastss 0x1e1e1(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,157,228,1,0 ; vbroadcastss 0x1e49d(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne d3ca <_sk_load_rgb_u16_be_avx+0x137>
- DB 233,40,255,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,5 ; jne d6fa <_sk_load_rgb_u16_be_avx+0x137>
+ DB 233,40,255,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb d3f9 <_sk_load_rgb_u16_be_avx+0x166>
+ DB 114,26 ; jb d729 <_sk_load_rgb_u16_be_avx+0x166>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne d3fe <_sk_load_rgb_u16_be_avx+0x16b>
- DB 233,249,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,244,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,10 ; jne d72e <_sk_load_rgb_u16_be_avx+0x16b>
+ DB 233,249,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,244,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb d42d <_sk_load_rgb_u16_be_avx+0x19a>
+ DB 114,26 ; jb d75d <_sk_load_rgb_u16_be_avx+0x19a>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne d432 <_sk_load_rgb_u16_be_avx+0x19f>
- DB 233,197,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,192,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,10 ; jne d762 <_sk_load_rgb_u16_be_avx+0x19f>
+ DB 233,197,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,192,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb d45b <_sk_load_rgb_u16_be_avx+0x1c8>
+ DB 114,20 ; jb d78b <_sk_load_rgb_u16_be_avx+0x1c8>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,151,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,146,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,151,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,146,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
PUBLIC _sk_store_u16_be_avx
_sk_store_u16_be_avx LABEL PROC
@@ -12582,7 +12772,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,33,226,1,0 ; vbroadcastss 0x1e221(%rip),%ymm8 # 2b6a8 <_sk_overlay_sse2_8bit+0x587>
+ DB 196,98,125,24,5,221,228,1,0 ; vbroadcastss 0x1e4dd(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -12620,7 +12810,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne d56b <_sk_store_u16_be_avx+0x10b>
+ DB 117,31 ; jne d89b <_sk_store_u16_be_avx+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -12629,28 +12819,28 @@ _sk_store_u16_be_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je d567 <_sk_store_u16_be_avx+0x107>
+ DB 116,240 ; je d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb d567 <_sk_store_u16_be_avx+0x107>
+ DB 114,227 ; jb d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je d567 <_sk_store_u16_be_avx+0x107>
+ DB 116,218 ; je d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb d567 <_sk_store_u16_be_avx+0x107>
+ DB 114,205 ; jb d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je d567 <_sk_store_u16_be_avx+0x107>
+ DB 116,196 ; je d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb d567 <_sk_store_u16_be_avx+0x107>
+ DB 114,183 ; jb d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp d567 <_sk_store_u16_be_avx+0x107>
+ DB 235,174 ; jmp d897 <_sk_store_u16_be_avx+0x107>
PUBLIC _sk_load_f32_avx
_sk_load_f32_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja d645 <_sk_load_f32_avx+0x8c>
+ DB 15,135,128,0,0,0 ; ja d975 <_sk_load_f32_avx+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12658,7 +12848,7 @@ _sk_load_f32_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # d670 <_sk_load_f32_avx+0xb7>
+ DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # d9a0 <_sk_load_f32_avx+0xb7>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -12707,7 +12897,7 @@ PUBLIC _sk_load_f32_dst_avx
_sk_load_f32_dst_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja d71c <_sk_load_f32_dst_avx+0x8c>
+ DB 15,135,128,0,0,0 ; ja da4c <_sk_load_f32_dst_avx+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12715,7 +12905,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # d744 <_sk_load_f32_dst_avx+0xb4>
+ DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # da74 <_sk_load_f32_dst_avx+0xb4>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -12777,7 +12967,7 @@ _sk_store_f32_avx LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne d7e3 <_sk_store_f32_avx+0x7f>
+ DB 117,55 ; jne db13 <_sk_store_f32_avx+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -12790,22 +12980,22 @@ _sk_store_f32_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je d7df <_sk_store_f32_avx+0x7b>
+ DB 116,240 ; je db0f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb d7df <_sk_store_f32_avx+0x7b>
+ DB 114,227 ; jb db0f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je d7df <_sk_store_f32_avx+0x7b>
+ DB 116,218 ; je db0f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb d7df <_sk_store_f32_avx+0x7b>
+ DB 114,205 ; jb db0f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je d7df <_sk_store_f32_avx+0x7b>
+ DB 116,195 ; je db0f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb d7df <_sk_store_f32_avx+0x7b>
+ DB 114,181 ; jb db0f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp d7df <_sk_store_f32_avx+0x7b>
+ DB 235,171 ; jmp db0f <_sk_store_f32_avx+0x7b>
PUBLIC _sk_clamp_x_avx
_sk_clamp_x_avx LABEL PROC
@@ -12888,7 +13078,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,35,220,1,0 ; vmulss 0x1dc23(%rip),%xmm9,%xmm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,5,223,222,1,0 ; vmulss 0x1dedf(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -12920,7 +13110,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,150,219,1,0 ; vmulss 0x1db96(%rip),%xmm9,%xmm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,13,82,222,1,0 ; vmulss 0x1de52(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -12945,7 +13135,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,48,219,1,0 ; vbroadcastss 0x1db30(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,236,221,1,0 ; vbroadcastss 0x1ddec(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -12959,9 +13149,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,39,219,1,0 ; vbroadcastss 0x1db27(%rip),%ymm8 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,5,227,221,1,0 ; vbroadcastss 0x1dde3(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,253,218,1,0 ; vbroadcastss 0x1dafd(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,185,221,1,0 ; vbroadcastss 0x1ddb9(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -12975,12 +13165,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,233,219,1,0 ; vbroadcastss 0x1dbe9(%rip),%ymm3 # 2b6ac <_sk_overlay_sse2_8bit+0x58b>
+ DB 196,226,125,24,29,165,222,1,0 ; vbroadcastss 0x1dea5(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,224,219,1,0 ; vbroadcastss 0x1dbe0(%rip),%ymm3 # 2b6b0 <_sk_overlay_sse2_8bit+0x58f>
+ DB 196,226,125,24,29,156,222,1,0 ; vbroadcastss 0x1de9c(%rip),%ymm3 # 2bc9c <_sk_overlay_sse2_8bit+0x58f>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,211,219,1,0 ; vbroadcastss 0x1dbd3(%rip),%ymm1 # 2b6b4 <_sk_overlay_sse2_8bit+0x593>
+ DB 196,226,125,24,13,143,222,1,0 ; vbroadcastss 0x1de8f(%rip),%ymm1 # 2bca0 <_sk_overlay_sse2_8bit+0x593>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13213,9 +13403,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 72,139,104,8 ; mov 0x8(%rax),%rbp
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js de88 <_sk_evenly_spaced_gradient_avx+0x28>
+ DB 120,7 ; js e1b8 <_sk_evenly_spaced_gradient_avx+0x28>
DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1
- DB 235,21 ; jmp de9d <_sk_evenly_spaced_gradient_avx+0x3d>
+ DB 235,21 ; jmp e1cd <_sk_evenly_spaced_gradient_avx+0x3d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -13372,18 +13562,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,184,212,1,0 ; vbroadcastss 0x1d4b8(%rip),%ymm0 # 2b6bc <_sk_overlay_sse2_8bit+0x59b>
+ DB 196,226,125,24,5,116,215,1,0 ; vbroadcastss 0x1d774(%rip),%ymm0 # 2bca8 <_sk_overlay_sse2_8bit+0x59b>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,167,212,1,0 ; vbroadcastss 0x1d4a7(%rip),%ymm1 # 2b6b8 <_sk_overlay_sse2_8bit+0x597>
+ DB 196,226,125,24,13,99,215,1,0 ; vbroadcastss 0x1d763(%rip),%ymm1 # 2bca4 <_sk_overlay_sse2_8bit+0x597>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,158,212,1,0 ; vbroadcastss 0x1d49e(%rip),%ymm1 # 2b6c0 <_sk_overlay_sse2_8bit+0x59f>
+ DB 196,226,125,24,13,90,215,1,0 ; vbroadcastss 0x1d75a(%rip),%ymm1 # 2bcac <_sk_overlay_sse2_8bit+0x59f>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,145,212,1,0 ; vbroadcastss 0x1d491(%rip),%ymm1 # 2b6c4 <_sk_overlay_sse2_8bit+0x5a3>
+ DB 196,226,125,24,13,77,215,1,0 ; vbroadcastss 0x1d74d(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,132,212,1,0 ; vbroadcastss 0x1d484(%rip),%ymm1 # 2b6c8 <_sk_overlay_sse2_8bit+0x5a7>
+ DB 196,226,125,24,13,64,215,1,0 ; vbroadcastss 0x1d740(%rip),%ymm1 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -13405,12 +13595,12 @@ _sk_gradient_avx LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,80 ; jb e2ca <_sk_gradient_avx+0x72>
+ DB 114,80 ; jb e5fa <_sk_gradient_avx+0x72>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,1,211,1,0 ; vbroadcastss 0x1d301(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,24,21,189,213,1,0 ; vbroadcastss 0x1d5bd(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -13422,7 +13612,7 @@ _sk_gradient_avx LABEL PROC
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,205 ; jne e297 <_sk_gradient_avx+0x3f>
+ DB 117,205 ; jne e5c7 <_sk_gradient_avx+0x3f>
DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -13602,27 +13792,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,40,208,1,0 ; vbroadcastss 0x1d028(%rip),%ymm13 # 2b6cc <_sk_overlay_sse2_8bit+0x5ab>
+ DB 196,98,125,24,45,228,210,1,0 ; vbroadcastss 0x1d2e4(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,30,208,1,0 ; vbroadcastss 0x1d01e(%rip),%ymm14 # 2b6d0 <_sk_overlay_sse2_8bit+0x5af>
+ DB 196,98,125,24,53,218,210,1,0 ; vbroadcastss 0x1d2da(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,15,208,1,0 ; vbroadcastss 0x1d00f(%rip),%ymm14 # 2b6d4 <_sk_overlay_sse2_8bit+0x5b3>
+ DB 196,98,125,24,53,203,210,1,0 ; vbroadcastss 0x1d2cb(%rip),%ymm14 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,0,208,1,0 ; vbroadcastss 0x1d000(%rip),%ymm13 # 2b6d8 <_sk_overlay_sse2_8bit+0x5b7>
+ DB 196,98,125,24,45,188,210,1,0 ; vbroadcastss 0x1d2bc(%rip),%ymm13 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,235,207,1,0 ; vbroadcastss 0x1cfeb(%rip),%ymm10 # 2b6dc <_sk_overlay_sse2_8bit+0x5bb>
+ DB 196,98,125,24,21,167,210,1,0 ; vbroadcastss 0x1d2a7(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,129,206,1,0 ; vbroadcastss 0x1ce81(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,61,209,1,0 ; vbroadcastss 0x1d13d(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,107,206,1,0 ; vbroadcastss 0x1ce6b(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,39,209,1,0 ; vbroadcastss 0x1d127(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -13648,7 +13838,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,97,207,1,0 ; vbroadcastss 0x1cf61(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,29,210,1,0 ; vbroadcastss 0x1d21d(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13657,17 +13847,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,53,207,1,0 ; vbroadcastss 0x1cf35(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,241,209,1,0 ; vbroadcastss 0x1d1f1(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,19,207,1,0 ; vbroadcastss 0x1cf13(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,207,209,1,0 ; vbroadcastss 0x1d1cf(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,164,205,1,0 ; vbroadcastss 0x1cda4(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,96,208,1,0 ; vbroadcastss 0x1d060(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13685,7 +13875,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,179,206,1,0 ; vbroadcastss 0x1ceb3(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,111,209,1,0 ; vbroadcastss 0x1d16f(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13694,17 +13884,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,135,206,1,0 ; vbroadcastss 0x1ce87(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,67,209,1,0 ; vbroadcastss 0x1d143(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,101,206,1,0 ; vbroadcastss 0x1ce65(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,33,209,1,0 ; vbroadcastss 0x1d121(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,246,204,1,0 ; vbroadcastss 0x1ccf6(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,178,207,1,0 ; vbroadcastss 0x1cfb2(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13721,7 +13911,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,11,206,1,0 ; vbroadcastss 0x1ce0b(%rip),%ymm10 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,21,199,208,1,0 ; vbroadcastss 0x1d0c7(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
@@ -13730,7 +13920,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,227,205,1,0 ; vbroadcastss 0x1cde3(%rip),%ymm8 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,5,159,208,1,0 ; vbroadcastss 0x1d09f(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13765,7 +13955,7 @@ _sk_apply_vector_mask_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,31,204,1,0 ; vbroadcastss 0x1cc1f(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,219,206,1,0 ; vbroadcastss 0x1cedb(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -13798,9 +13988,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,7,205,1,0 ; vbroadcastss 0x1cd07(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,195,207,1,0 ; vbroadcastss 0x1cfc3(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,158,203,1,0 ; vbroadcastss 0x1cb9e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,90,206,1,0 ; vbroadcastss 0x1ce5a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13809,7 +13999,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,126,203,1,0 ; vbroadcastss 0x1cb7e(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,5,58,206,1,0 ; vbroadcastss 0x1ce3a(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13819,9 +14009,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,190,204,1,0 ; vbroadcastss 0x1ccbe(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,122,207,1,0 ; vbroadcastss 0x1cf7a(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,84,203,1,0 ; vbroadcastss 0x1cb54(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,16,206,1,0 ; vbroadcastss 0x1ce10(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13830,7 +14020,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,52,203,1,0 ; vbroadcastss 0x1cb34(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,240,205,1,0 ; vbroadcastss 0x1cdf0(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13840,14 +14030,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,119,204,1,0 ; vbroadcastss 0x1cc77(%rip),%ymm0 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,5,51,207,1,0 ; vbroadcastss 0x1cf33(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,10,203,1,0 ; vbroadcastss 0x1cb0a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,198,205,1,0 ; vbroadcastss 0x1cdc6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,91,204,1,0 ; vbroadcastss 0x1cc5b(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,23,207,1,0 ; vbroadcastss 0x1cf17(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,89,203,1,0 ; vbroadcastss 0x1cb59(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,21,206,1,0 ; vbroadcastss 0x1ce15(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13857,19 +14047,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,36,204,1,0 ; vbroadcastss 0x1cc24(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,224,206,1,0 ; vbroadcastss 0x1cee0(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,187,202,1,0 ; vbroadcastss 0x1cabb(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,119,205,1,0 ; vbroadcastss 0x1cd77(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,25,204,1,0 ; vbroadcastss 0x1cc19(%rip),%ymm9 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,213,206,1,0 ; vbroadcastss 0x1ced5(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,7,204,1,0 ; vbroadcastss 0x1cc07(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,195,206,1,0 ; vbroadcastss 0x1cec3(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,136,202,1,0 ; vbroadcastss 0x1ca88(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,68,205,1,0 ; vbroadcastss 0x1cd44(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,165,206,1,0 ; vbroadcastss 0x1cea5(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13878,17 +14068,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,89,202,1,0 ; vbroadcastss 0x1ca59(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,21,205,1,0 ; vbroadcastss 0x1cd15(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,183,203,1,0 ; vbroadcastss 0x1cbb7(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,115,206,1,0 ; vbroadcastss 0x1ce73(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,165,203,1,0 ; vbroadcastss 0x1cba5(%rip),%ymm11 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,97,206,1,0 ; vbroadcastss 0x1ce61(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,144,203,1,0 ; vbroadcastss 0x1cb90(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,76,206,1,0 ; vbroadcastss 0x1ce4c(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13897,13 +14087,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,108,203,1,0 ; vbroadcastss 0x1cb6c(%rip),%ymm0 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,5,40,206,1,0 ; vbroadcastss 0x1ce28(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,81,203,1,0 ; vbroadcastss 0x1cb51(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,13,206,1,0 ; vbroadcastss 0x1ce0d(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,79,202,1,0 ; vbroadcastss 0x1ca4f(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,11,205,1,0 ; vbroadcastss 0x1cd0b(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13913,14 +14103,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,30,203,1,0 ; vbroadcastss 0x1cb1e(%rip),%ymm1 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,13,218,205,1,0 ; vbroadcastss 0x1cdda(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,176,201,1,0 ; vbroadcastss 0x1c9b0(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,108,204,1,0 ; vbroadcastss 0x1cc6c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,1,203,1,0 ; vbroadcastss 0x1cb01(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,189,205,1,0 ; vbroadcastss 0x1cdbd(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,255,201,1,0 ; vbroadcastss 0x1c9ff(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,187,204,1,0 ; vbroadcastss 0x1ccbb(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13930,19 +14120,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,202,202,1,0 ; vbroadcastss 0x1caca(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,134,205,1,0 ; vbroadcastss 0x1cd86(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,96,201,1,0 ; vbroadcastss 0x1c960(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,28,204,1,0 ; vbroadcastss 0x1cc1c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,190,202,1,0 ; vbroadcastss 0x1cabe(%rip),%ymm9 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,122,205,1,0 ; vbroadcastss 0x1cd7a(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,172,202,1,0 ; vbroadcastss 0x1caac(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,104,205,1,0 ; vbroadcastss 0x1cd68(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,45,201,1,0 ; vbroadcastss 0x1c92d(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,142,202,1,0 ; vbroadcastss 0x1ca8e(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,74,205,1,0 ; vbroadcastss 0x1cd4a(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13951,17 +14141,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,254,200,1,0 ; vbroadcastss 0x1c8fe(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,186,203,1,0 ; vbroadcastss 0x1cbba(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,91,202,1,0 ; vbroadcastss 0x1ca5b(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,23,205,1,0 ; vbroadcastss 0x1cd17(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,73,202,1,0 ; vbroadcastss 0x1ca49(%rip),%ymm11 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,5,205,1,0 ; vbroadcastss 0x1cd05(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,52,202,1,0 ; vbroadcastss 0x1ca34(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,240,204,1,0 ; vbroadcastss 0x1ccf0(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13970,13 +14160,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,16,202,1,0 ; vbroadcastss 0x1ca10(%rip),%ymm1 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,13,204,204,1,0 ; vbroadcastss 0x1cccc(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,244,201,1,0 ; vbroadcastss 0x1c9f4(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,176,204,1,0 ; vbroadcastss 0x1ccb0(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,242,200,1,0 ; vbroadcastss 0x1c8f2(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,174,203,1,0 ; vbroadcastss 0x1cbae(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14112,7 +14302,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,121,254,194 ; vpaddd %xmm10,%xmm0,%xmm0
- DB 196,98,121,24,29,155,199,1,0 ; vbroadcastss 0x1c79b(%rip),%xmm11 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,121,24,29,87,202,1,0 ; vbroadcastss 0x1ca57(%rip),%xmm11 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,121,64,203 ; vpmulld %xmm11,%xmm0,%xmm1
DB 196,193,249,126,201 ; vmovq %xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
@@ -14146,7 +14336,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,227,93,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
DB 197,252,17,156,36,192,0,0,0 ; vmovups %ymm3,0xc0(%rsp)
- DB 196,98,121,24,13,100,197,1,0 ; vbroadcastss 0x1c564(%rip),%xmm9 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,121,24,13,32,200,1,0 ; vbroadcastss 0x1c820(%rip),%xmm9 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,193,105,254,249 ; vpaddd %xmm9,%xmm2,%xmm7
DB 196,195,249,22,249,1 ; vpextrq $0x1,%xmm7,%r9
DB 196,193,249,126,250 ; vmovq %xmm7,%r10
@@ -14174,7 +14364,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,254,1 ; vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- DB 196,98,121,24,37,215,196,1,0 ; vbroadcastss 0x1c4d7(%rip),%xmm12 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,121,24,37,147,199,1,0 ; vbroadcastss 0x1c793(%rip),%xmm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2
DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
DB 196,193,249,126,210 ; vmovq %xmm2,%r10
@@ -14202,7 +14392,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,105,33,213,48 ; vinsertps $0x30,%xmm5,%xmm2,%xmm2
DB 196,227,109,24,225,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- DB 196,226,125,24,13,171,197,1,0 ; vbroadcastss 0x1c5ab(%rip),%ymm1 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,226,125,24,13,103,200,1,0 ; vbroadcastss 0x1c867(%rip),%ymm1 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 197,188,88,209 ; vaddps %ymm1,%ymm8,%ymm2
DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp)
DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2
@@ -14955,7 +15145,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,226,25,64,200 ; vpmulld %xmm0,%xmm12,%xmm1
DB 197,249,127,12,36 ; vmovdqa %xmm1,(%rsp)
DB 197,241,254,202 ; vpaddd %xmm2,%xmm1,%xmm1
- DB 196,98,121,24,61,46,182,1,0 ; vbroadcastss 0x1b62e(%rip),%xmm15 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,121,24,61,234,184,1,0 ; vbroadcastss 0x1b8ea(%rip),%xmm15 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,113,64,247 ; vpmulld %xmm15,%xmm1,%xmm6
DB 196,193,249,126,241 ; vmovq %xmm6,%r9
DB 69,137,202 ; mov %r9d,%r10d
@@ -14993,7 +15183,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,99,53,24,247,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- DB 196,98,121,24,21,222,179,1,0 ; vbroadcastss 0x1b3de(%rip),%xmm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,121,24,21,154,182,1,0 ; vbroadcastss 0x1b69a(%rip),%xmm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm9
DB 196,67,249,22,201,1 ; vpextrq $0x1,%xmm9,%r9
DB 196,65,249,126,202 ; vmovq %xmm9,%r10
@@ -15021,7 +15211,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,220,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- DB 196,98,121,24,13,81,179,1,0 ; vbroadcastss 0x1b351(%rip),%xmm9 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,121,24,13,13,182,1,0 ; vbroadcastss 0x1b60d(%rip),%xmm9 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
DB 196,193,249,126,218 ; vmovq %xmm3,%r10
@@ -15049,7 +15239,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4
DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- DB 196,226,125,24,37,37,180,1,0 ; vbroadcastss 0x1b425(%rip),%ymm4 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,226,125,24,37,225,182,1,0 ; vbroadcastss 0x1b6e1(%rip),%ymm4 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 197,148,88,220 ; vaddps %ymm4,%ymm13,%ymm3
DB 197,252,40,252 ; vmovaps %ymm4,%ymm7
DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp)
@@ -16479,7 +16669,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2
DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,236,148,1,0 ; vbroadcastss 0x194ec(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,168,151,1,0 ; vbroadcastss 0x197a8(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,164,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm4
DB 197,252,16,172,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm5
DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6
@@ -16521,13 +16711,13 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 121c1 <_sk_start_pipeline_sse41+0xeb>
+ DB 115,110 ; jae 124f1 <_sk_start_pipeline_sse41+0xeb>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,43 ; ja 121a0 <_sk_start_pipeline_sse41+0xca>
+ DB 119,43 ; ja 124d0 <_sk_start_pipeline_sse41+0xca>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -16539,17 +16729,17 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 1217c <_sk_start_pipeline_sse41+0xa6>
+ DB 118,220 ; jbe 124ac <_sk_start_pipeline_sse41+0xa6>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 121b5 <_sk_start_pipeline_sse41+0xdf>
+ DB 116,13 ; je 124e5 <_sk_start_pipeline_sse41+0xdf>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 12165 <_sk_start_pipeline_sse41+0x8f>
+ DB 117,164 ; jne 12495 <_sk_start_pipeline_sse41+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -16580,7 +16770,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,53,157,1,0 ; movaps 0x19d35(%rip),%xmm2 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,40,21,229,159,1,0 ; movaps 0x19fe5(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -16589,7 +16779,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,36,157,1,0 ; movaps 0x19d24(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,212,159,1,0 ; movaps 0x19fd4(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -16607,14 +16797,14 @@ _sk_dither_sse41 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,242,156,1,0 ; movdqa 0x19cf2(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,162,159,1,0 ; movdqa 0x19fa2(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,222,156,1,0 ; movdqa 0x19cde(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xe6f>
- DB 102,68,15,111,45,229,156,1,0 ; movdqa 0x19ce5(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,37,142,159,1,0 ; movdqa 0x19f8e(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63>
+ DB 102,68,15,111,45,149,159,1,0 ; movdqa 0x19f95(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -16630,8 +16820,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,160,156,1,0 ; mulps 0x19ca0(%rip),%xmm8 # 2bfb0 <_sk_overlay_sse2_8bit+0xe8f>
- DB 68,15,88,5,168,156,1,0 ; addps 0x19ca8(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0xe9f>
+ DB 68,15,89,5,80,159,1,0 ; mulps 0x19f50(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83>
+ DB 68,15,88,5,88,159,1,0 ; addps 0x19f58(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -16669,7 +16859,7 @@ _sk_uniform_color_sse41 LABEL PROC
PUBLIC _sk_black_color_sse41
_sk_black_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,222,155,1,0 ; movaps 0x19bde(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,142,158,1,0 ; movaps 0x19e8e(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -16678,7 +16868,7 @@ _sk_black_color_sse41 LABEL PROC
PUBLIC _sk_white_color_sse41
_sk_white_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,202,155,1,0 ; movaps 0x19bca(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,5,122,158,1,0 ; movaps 0x19e7a(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -16716,7 +16906,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,122,155,1,0 ; movaps 0x19b7a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,42,158,1,0 ; movaps 0x19e2a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -16739,7 +16929,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,45,155,1,0 ; movaps 0x19b2d(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,221,157,1,0 ; movaps 0x19ddd(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -16780,7 +16970,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,193,154,1,0 ; movaps 0x19ac1(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,113,157,1,0 ; movaps 0x19d71(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -16791,7 +16981,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,161,154,1,0 ; movaps 0x19aa1(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,81,157,1,0 ; movaps 0x19d51(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -16806,7 +16996,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,116,154,1,0 ; movaps 0x19a74(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,36,157,1,0 ; movaps 0x19d24(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -16824,7 +17014,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,56,154,1,0 ; movaps 0x19a38(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,232,156,1,0 ; movaps 0x19ce8(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -16848,7 +17038,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,252,153,1,0 ; movaps 0x199fc(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,172,156,1,0 ; movaps 0x19cac(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -16884,9 +17074,14 @@ _sk_multiply_sse41 LABEL PROC
PUBLIC _sk_plus__sse41
_sk_plus__sse41 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 68,15,40,5,45,156,1,0 ; movaps 0x19c2d(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 65,15,93,208 ; minps %xmm8,%xmm2
DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 65,15,93,216 ; minps %xmm8,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -16917,7 +17112,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,33,153,1,0 ; movaps 0x19921(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,185,155,1,0 ; movaps 0x19bb9(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -16963,7 +17158,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,124,152,1,0 ; movaps 0x1987c(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,20,155,1,0 ; movaps 0x19b14(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -16995,7 +17190,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,17,152,1,0 ; movaps 0x19811(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,169,154,1,0 ; movaps 0x19aa9(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17030,7 +17225,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,155,151,1,0 ; movaps 0x1979b(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,51,154,1,0 ; movaps 0x19a33(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17056,7 +17251,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,75,151,1,0 ; movaps 0x1974b(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,227,153,1,0 ; movaps 0x199e3(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17066,7 +17261,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
- DB 68,15,40,29,50,151,1,0 ; movaps 0x19732(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,29,202,153,1,0 ; movaps 0x199ca(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 68,15,92,231 ; subps %xmm7,%xmm12
DB 69,15,40,204 ; movaps %xmm12,%xmm9
@@ -17148,7 +17343,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,252,149,1,0 ; movaps 0x195fc(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,148,152,1,0 ; movaps 0x19894(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -17229,7 +17424,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,196,148,1,0 ; movaps 0x194c4(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,92,151,1,0 ; movaps 0x1975c(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -17311,7 +17506,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,150,147,1,0 ; movaps 0x19396(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,46,150,1,0 ; movaps 0x1962e(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -17395,7 +17590,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,89,146,1,0 ; movaps 0x19259(%rip),%xmm1 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,13,241,148,1,0 ; movaps 0x194f1(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -17408,10 +17603,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,135,146,1,0 ; movaps 0x19287(%rip),%xmm13 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,45,31,149,1,0 ; movaps 0x1951f(%rip),%xmm13 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,135,146,1,0 ; movaps 0x19287(%rip),%xmm12 # 2bfe0 <_sk_overlay_sse2_8bit+0xebf>
+ DB 68,15,40,37,31,149,1,0 ; movaps 0x1951f(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -17597,12 +17792,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,237,143,1,0 ; movaps 0x18fed(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 15,40,5,133,146,1,0 ; movaps 0x19285(%rip),%xmm0 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,242,143,1,0 ; movaps 0x18ff2(%rip),%xmm2 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,21,138,146,1,0 ; movaps 0x1928a(%rip),%xmm2 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,243,143,1,0 ; movaps 0x18ff3(%rip),%xmm14 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,53,139,146,1,0 ; movaps 0x1928b(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -17685,7 +17880,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,8,142,1,0 ; movaps 0x18e08(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,160,144,1,0 ; movaps 0x190a0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -17779,14 +17974,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,43,141,1,0 ; movaps 0x18d2b(%rip),%xmm2 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 15,40,21,195,143,1,0 ; movaps 0x18fc3(%rip),%xmm2 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,46,141,1,0 ; movaps 0x18d2e(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,13,198,143,1,0 ; movaps 0x18fc6(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,45,141,1,0 ; movaps 0x18d2d(%rip),%xmm13 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,45,197,143,1,0 ; movaps 0x18fc5(%rip),%xmm13 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -17867,7 +18062,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,67,139,1,0 ; movaps 0x18b43(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,219,141,1,0 ; movaps 0x18ddb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -17922,14 +18117,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,248,138,1,0 ; movaps 0x18af8(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,13,144,141,1,0 ; movaps 0x18d90(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,248,138,1,0 ; movaps 0x18af8(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,21,144,141,1,0 ; movaps 0x18d90(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,245,138,1,0 ; movaps 0x18af5(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,29,141,141,1,0 ; movaps 0x18d8d(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -18014,7 +18209,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,1,137,1,0 ; movaps 0x18901(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,153,139,1,0 ; movaps 0x18b99(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -18066,13 +18261,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,195,136,1,0 ; movaps 0x188c3(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,5,91,139,1,0 ; movaps 0x18b5b(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,199,136,1,0 ; movaps 0x188c7(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,21,95,139,1,0 ; movaps 0x18b5f(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,197,136,1,0 ; movaps 0x188c5(%rip),%xmm12 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,37,93,139,1,0 ; movaps 0x18b5d(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -18157,7 +18352,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,203,134,1,0 ; movaps 0x186cb(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,5,99,137,1,0 ; movaps 0x18963(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -18201,23 +18396,23 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,219,0,0,0 ; jne 13a10 <_sk_srcover_rgba_8888_sse41+0xfb>
+ DB 15,133,219,0,0,0 ; jne 13d58 <_sk_srcover_rgba_8888_sse41+0xfb>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,218,134,1,0 ; movdqa 0x186da(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,114,137,1,0 ; movdqa 0x18972(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,214,134,1,0 ; pshufb 0x186d6(%rip),%xmm5 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,45,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,214,134,1,0 ; pshufb 0x186d6(%rip),%xmm6 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,53,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,243,133,1,0 ; movaps 0x185f3(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,139,136,1,0 ; movaps 0x1888b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,199,134,1,0 ; movaps 0x186c7(%rip),%xmm12 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,37,95,137,1,0 ; movaps 0x1895f(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -18243,7 +18438,7 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,88 ; jne 13a4e <_sk_srcover_rgba_8888_sse41+0x139>
+ DB 117,88 ; jne 13d96 <_sk_srcover_rgba_8888_sse41+0x139>
DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -18254,32 +18449,32 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,91 ; je 13a78 <_sk_srcover_rgba_8888_sse41+0x163>
+ DB 116,91 ; je 13dc0 <_sk_srcover_rgba_8888_sse41+0x163>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,22 ; je 13a3d <_sk_srcover_rgba_8888_sse41+0x128>
+ DB 116,22 ; je 13d85 <_sk_srcover_rgba_8888_sse41+0x128>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,10,255,255,255 ; jne 1393b <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 15,133,10,255,255,255 ; jne 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,237,254,255,255 ; jmpq 1393b <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,237,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,40 ; je 13a83 <_sk_srcover_rgba_8888_sse41+0x16e>
+ DB 116,40 ; je 13dcb <_sk_srcover_rgba_8888_sse41+0x16e>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 13a70 <_sk_srcover_rgba_8888_sse41+0x15b>
+ DB 116,15 ; je 13db8 <_sk_srcover_rgba_8888_sse41+0x15b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,149 ; jne 139fc <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 117,149 ; jne 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm0,0x8(%r9,%rax,4)
DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4)
- DB 235,132 ; jmp 139fc <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 235,132 ; jmp 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,184,254,255,255 ; jmpq 1393b <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,184,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4)
- DB 233,110,255,255,255 ; jmpq 139fc <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 233,110,255,255,255 ; jmpq 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
PUBLIC _sk_clamp_0_sse41
_sk_clamp_0_sse41 LABEL PROC
@@ -18293,7 +18488,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,194,132,1,0 ; movaps 0x184c2(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,90,135,1,0 ; movaps 0x1875a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -18303,7 +18498,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,167,132,1,0 ; minps 0x184a7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,29,63,135,1,0 ; minps 0x1873f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -18312,7 +18507,7 @@ _sk_clamp_a_sse41 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse41
_sk_clamp_a_dst_sse41 LABEL PROC
- DB 15,93,61,147,132,1,0 ; minps 0x18493(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,61,43,135,1,0 ; minps 0x1872b(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -18341,7 +18536,7 @@ _sk_swap_rb_sse41 LABEL PROC
PUBLIC _sk_invert_sse41
_sk_invert_sse41 LABEL PROC
- DB 68,15,40,5,79,132,1,0 ; movaps 0x1844f(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,231,134,1,0 ; movaps 0x186e7(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -18393,7 +18588,7 @@ _sk_premul_dst_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,217,131,1,0 ; movaps 0x183d9(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,113,134,1,0 ; movaps 0x18671(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -18405,20 +18600,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,164,132,1,0 ; movaps 0x184a4(%rip),%xmm11 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,29,60,135,1,0 ; movaps 0x1873c(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,28,132,1,0 ; movaps 0x1841c(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,37,180,134,1,0 ; movaps 0x186b4(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,140,132,1,0 ; movaps 0x1848c(%rip),%xmm13 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,45,36,135,1,0 ; movaps 0x18724(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,140,132,1,0 ; movaps 0x1848c(%rip),%xmm14 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,53,36,135,1,0 ; movaps 0x18724(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,144,132,1,0 ; movaps 0x18490(%rip),%xmm15 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,61,40,135,1,0 ; movaps 0x18728(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -18453,19 +18648,19 @@ PUBLIC _sk_from_srgb_dst_sse41
_sk_from_srgb_dst_sse41 LABEL PROC
DB 68,15,40,204 ; movaps %xmm4,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,29,219,131,1,0 ; movaps 0x183db(%rip),%xmm11 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,29,115,134,1,0 ; movaps 0x18673(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 68,15,40,37,84,131,1,0 ; movaps 0x18354(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,37,236,133,1,0 ; movaps 0x185ec(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,228 ; mulps %xmm12,%xmm4
- DB 68,15,40,45,200,131,1,0 ; movaps 0x183c8(%rip),%xmm13 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,45,96,134,1,0 ; movaps 0x18660(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 65,15,88,229 ; addps %xmm13,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 68,15,40,53,201,131,1,0 ; movaps 0x183c9(%rip),%xmm14 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,53,97,134,1,0 ; movaps 0x18661(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 65,15,88,230 ; addps %xmm14,%xmm4
- DB 68,15,40,61,205,131,1,0 ; movaps 0x183cd(%rip),%xmm15 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,61,101,134,1,0 ; movaps 0x18665(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4
@@ -18508,22 +18703,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,62,131,1,0 ; movaps 0x1833e(%rip),%xmm11 # 2c0a0 <_sk_overlay_sse2_8bit+0xf7f>
+ DB 68,15,40,29,214,133,1,0 ; movaps 0x185d6(%rip),%xmm11 # 2c680 <_sk_overlay_sse2_8bit+0xf73>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,62,131,1,0 ; movaps 0x1833e(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0xf8f>
+ DB 68,15,40,37,214,133,1,0 ; movaps 0x185d6(%rip),%xmm12 # 2c690 <_sk_overlay_sse2_8bit+0xf83>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,62,131,1,0 ; movaps 0x1833e(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0xf9f>
+ DB 68,15,40,21,214,133,1,0 ; movaps 0x185d6(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,62,131,1,0 ; movaps 0x1833e(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0xfaf>
+ DB 68,15,40,45,214,133,1,0 ; movaps 0x185d6(%rip),%xmm13 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,66,131,1,0 ; movaps 0x18342(%rip),%xmm14 # 2c0e0 <_sk_overlay_sse2_8bit+0xfbf>
+ DB 68,15,40,53,218,133,1,0 ; movaps 0x185da(%rip),%xmm14 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,62,131,1,0 ; movaps 0x1833e(%rip),%xmm15 # 2c0f0 <_sk_overlay_sse2_8bit+0xfcf>
+ DB 68,15,40,61,214,133,1,0 ; movaps 0x185d6(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -18567,15 +18762,17 @@ PUBLIC _sk_rgb_to_hsl_sse41
_sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,95,194 ; maxps %xmm2,%xmm0
DB 69,15,40,216 ; movaps %xmm8,%xmm11
- DB 69,15,95,217 ; maxps %xmm9,%xmm11
- DB 68,15,95,218 ; maxps %xmm2,%xmm11
+ DB 68,15,95,216 ; maxps %xmm0,%xmm11
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,93,194 ; minps %xmm2,%xmm0
DB 69,15,40,224 ; movaps %xmm8,%xmm12
- DB 69,15,93,225 ; minps %xmm9,%xmm12
- DB 68,15,93,226 ; minps %xmm2,%xmm12
+ DB 68,15,93,224 ; minps %xmm0,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,248,128,1,0 ; movaps 0x180f8(%rip),%xmm14 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,53,138,131,1,0 ; movaps 0x1838a(%rip),%xmm14 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -18584,27 +18781,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,95,130,1,0 ; andps 0x1825f(%rip),%xmm15 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 68,15,84,61,241,132,1,0 ; andps 0x184f1(%rip),%xmm15 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,82,130,1,0 ; movaps 0x18252(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0xfef>
+ DB 68,15,40,45,228,132,1,0 ; movaps 0x184e4(%rip),%xmm13 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,78,130,1,0 ; addps 0x1824e(%rip),%xmm8 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 68,15,88,5,224,132,1,0 ; addps 0x184e0(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,70,130,1,0 ; mulps 0x18246(%rip),%xmm8 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 68,15,89,5,216,132,1,0 ; mulps 0x184d8(%rip),%xmm8 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,90,128,1,0 ; movaps 0x1805a(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,40,5,236,130,1,0 ; movaps 0x182ec(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -18625,7 +18822,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,12,128,1,0 ; movaps 0x1800c(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,158,130,1,0 ; movaps 0x1829e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -18638,19 +18835,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,184,129,1,0 ; movaps 0x181b8(%rip),%xmm14 # 2c140 <_sk_overlay_sse2_8bit+0x101f>
+ DB 68,15,40,53,74,132,1,0 ; movaps 0x1844a(%rip),%xmm14 # 2c720 <_sk_overlay_sse2_8bit+0x1013>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,177,129,1,0 ; movaps 0x181b1(%rip),%xmm11 # 2c150 <_sk_overlay_sse2_8bit+0x102f>
+ DB 68,15,40,29,67,132,1,0 ; movaps 0x18443(%rip),%xmm11 # 2c730 <_sk_overlay_sse2_8bit+0x1023>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,74,129,1,0 ; movaps 0x1814a(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 15,40,61,220,131,1,0 ; movaps 0x183dc(%rip),%xmm7 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,91,129,1,0 ; movaps 0x1815b(%rip),%xmm3 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 15,40,29,237,131,1,0 ; movaps 0x183ed(%rip),%xmm3 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -18660,7 +18857,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,58,129,1,0 ; movaps 0x1813a(%rip),%xmm12 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 68,15,40,37,204,131,1,0 ; movaps 0x183cc(%rip),%xmm12 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -18694,7 +18891,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,211,128,1,0 ; addps 0x180d3(%rip),%xmm10 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,88,21,101,131,1,0 ; addps 0x18365(%rip),%xmm10 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -18746,11 +18943,11 @@ _sk_scale_u8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,52 ; jne 14178 <_sk_scale_u8_sse41+0x4c>
+ DB 117,52 ; jne 144c6 <_sk_scale_u8_sse41+0x4c>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,204,126,1,0 ; pand 0x17ecc(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,94,129,1,0 ; pand 0x1815e(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,16,128,1,0 ; mulps 0x18010(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,162,130,1,0 ; mulps 0x182a2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -18761,12 +18958,12 @@ _sk_scale_u8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 141c0 <_sk_scale_u8_sse41+0x94>
+ DB 116,59 ; je 1450e <_sk_scale_u8_sse41+0x94>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 141a7 <_sk_scale_u8_sse41+0x7b>
+ DB 116,23 ; je 144f5 <_sk_scale_u8_sse41+0x7b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,181 ; jne 1414b <_sk_scale_u8_sse41+0x1f>
+ DB 117,181 ; jne 14499 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -18774,10 +18971,75 @@ _sk_scale_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 235,139 ; jmp 1414b <_sk_scale_u8_sse41+0x1f>
+ DB 235,139 ; jmp 14499 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,124,255,255,255 ; jmpq 1414b <_sk_scale_u8_sse41+0x1f>
+ DB 233,124,255,255,255 ; jmpq 14499 <_sk_scale_u8_sse41+0x1f>
+
+PUBLIC _sk_scale_565_sse41
+_sk_scale_565_sse41 LABEL PROC
+ DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,159,0,0,0 ; jne 145e0 <_sk_scale_565_sse41+0xc3>
+ DB 102,71,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm11
+ DB 102,15,111,5,16,130,1,0 ; movdqa 0x18210(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,65,15,219,195 ; pand %xmm11,%xmm0
+ DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
+ DB 68,15,89,13,15,130,1,0 ; mulps 0x1820f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,5,23,130,1,0 ; movdqa 0x18217(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,65,15,219,195 ; pand %xmm11,%xmm0
+ DB 68,15,91,208 ; cvtdq2ps %xmm0,%xmm10
+ DB 68,15,89,21,22,130,1,0 ; mulps 0x18216(%rip),%xmm10 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,29,29,130,1,0 ; pand 0x1821d(%rip),%xmm11 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
+ DB 68,15,89,29,33,130,1,0 ; mulps 0x18221(%rip),%xmm11 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 69,15,40,226 ; movaps %xmm10,%xmm12
+ DB 69,15,93,227 ; minps %xmm11,%xmm12
+ DB 69,15,40,233 ; movaps %xmm9,%xmm13
+ DB 69,15,93,236 ; minps %xmm12,%xmm13
+ DB 69,15,40,242 ; movaps %xmm10,%xmm14
+ DB 69,15,95,243 ; maxps %xmm11,%xmm14
+ DB 69,15,40,225 ; movaps %xmm9,%xmm12
+ DB 69,15,95,230 ; maxps %xmm14,%xmm12
+ DB 102,69,15,56,20,229 ; blendvps %xmm0,%xmm13,%xmm12
+ DB 69,15,89,200 ; mulps %xmm8,%xmm9
+ DB 68,15,89,209 ; mulps %xmm1,%xmm10
+ DB 68,15,89,218 ; mulps %xmm2,%xmm11
+ DB 68,15,89,227 ; mulps %xmm3,%xmm12
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,40,202 ; movaps %xmm10,%xmm1
+ DB 65,15,40,211 ; movaps %xmm11,%xmm2
+ DB 65,15,40,220 ; movaps %xmm12,%xmm3
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,3 ; and $0x3,%r10b
+ DB 65,128,250,1 ; cmp $0x1,%r10b
+ DB 116,60 ; je 14629 <_sk_scale_565_sse41+0x10c>
+ DB 102,69,15,239,219 ; pxor %xmm11,%xmm11
+ DB 65,128,250,2 ; cmp $0x2,%r10b
+ DB 116,26 ; je 14612 <_sk_scale_565_sse41+0xf5>
+ DB 65,128,250,3 ; cmp $0x3,%r10b
+ DB 15,133,70,255,255,255 ; jne 14548 <_sk_scale_565_sse41+0x2b>
+ DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 102,68,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm11
+ DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
+ DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
+ DB 102,68,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm11
+ DB 233,31,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b>
+ DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
+ DB 102,68,15,110,216 ; movd %eax,%xmm11
+ DB 233,16,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b>
PUBLIC _sk_lerp_1_float_sse41
_sk_lerp_1_float_sse41 LABEL PROC
@@ -18808,11 +19070,11 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 14267 <_sk_lerp_u8_sse41+0x60>
+ DB 117,72 ; jne 146d0 <_sk_lerp_u8_sse41+0x60>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,241,125,1,0 ; pand 0x17df1(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,104,127,1,0 ; pand 0x17f68(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,53,127,1,0 ; mulps 0x17f35(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,172,128,1,0 ; mulps 0x180ac(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -18830,12 +19092,12 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,62 ; je 142b2 <_sk_lerp_u8_sse41+0xab>
+ DB 116,62 ; je 1471b <_sk_lerp_u8_sse41+0xab>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 14296 <_sk_lerp_u8_sse41+0x8f>
+ DB 116,23 ; je 146ff <_sk_lerp_u8_sse41+0x8f>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,161 ; jne 14226 <_sk_lerp_u8_sse41+0x1f>
+ DB 117,161 ; jne 1468f <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -18843,13 +19105,14 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 233,116,255,255,255 ; jmpq 14226 <_sk_lerp_u8_sse41+0x1f>
+ DB 233,116,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,101,255,255,255 ; jmpq 14226 <_sk_lerp_u8_sse41+0x1f>
+ DB 233,101,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f>
PUBLIC _sk_lerp_565_sse41
_sk_lerp_565_sse41 LABEL PROC
+ DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,99,80,8 ; movslq 0x8(%rax),%r10
DB 76,99,201 ; movslq %ecx,%r9
@@ -18858,71 +19121,74 @@ _sk_lerp_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,152,0,0,0 ; jne 14378 <_sk_lerp_565_sse41+0xb7>
+ DB 15,133,165,0,0,0 ; jne 147f3 <_sk_lerp_565_sse41+0xc9>
DB 102,71,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm10
- DB 102,68,15,111,5,144,126,1,0 ; movdqa 0x17e90(%rip),%xmm8 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
- DB 102,69,15,219,194 ; pand %xmm10,%xmm8
- DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,143,126,1,0 ; mulps 0x17e8f(%rip),%xmm8 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,68,15,111,13,150,126,1,0 ; movdqa 0x17e96(%rip),%xmm9 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
- DB 102,69,15,219,202 ; pand %xmm10,%xmm9
- DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,149,126,1,0 ; mulps 0x17e95(%rip),%xmm9 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,68,15,219,21,156,126,1,0 ; pand 0x17e9c(%rip),%xmm10 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 102,15,111,5,3,128,1,0 ; movdqa 0x18003(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,65,15,219,194 ; pand %xmm10,%xmm0
+ DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
+ DB 68,15,89,13,2,128,1,0 ; mulps 0x18002(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,5,10,128,1,0 ; movdqa 0x1800a(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,65,15,219,194 ; pand %xmm10,%xmm0
+ DB 68,15,91,216 ; cvtdq2ps %xmm0,%xmm11
+ DB 68,15,89,29,9,128,1,0 ; mulps 0x18009(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,21,16,128,1,0 ; pand 0x18010(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,160,126,1,0 ; mulps 0x17ea0(%rip),%xmm10 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
- DB 15,92,196 ; subps %xmm4,%xmm0
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 68,15,89,21,20,128,1,0 ; mulps 0x18014(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 15,92,205 ; subps %xmm5,%xmm1
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 69,15,93,218 ; minps %xmm10,%xmm11
+ DB 69,15,40,233 ; movaps %xmm9,%xmm13
+ DB 68,15,92,196 ; subps %xmm4,%xmm8
+ DB 69,15,89,193 ; mulps %xmm9,%xmm8
+ DB 69,15,93,203 ; minps %xmm11,%xmm9
+ DB 69,15,95,226 ; maxps %xmm10,%xmm12
+ DB 69,15,95,236 ; maxps %xmm12,%xmm13
+ DB 102,69,15,56,20,233 ; blendvps %xmm0,%xmm9,%xmm13
+ DB 68,15,88,196 ; addps %xmm4,%xmm8
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,92,214 ; subps %xmm6,%xmm2
DB 65,15,89,210 ; mulps %xmm10,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,92,223 ; subps %xmm7,%xmm3
- DB 68,15,89,195 ; mulps %xmm3,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 68,15,89,203 ; mulps %xmm3,%xmm9
- DB 68,15,88,207 ; addps %xmm7,%xmm9
- DB 65,15,89,218 ; mulps %xmm10,%xmm3
+ DB 65,15,89,221 ; mulps %xmm13,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,95,203 ; maxps %xmm3,%xmm9
- DB 69,15,95,193 ; maxps %xmm9,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,62 ; je 143c3 <_sk_lerp_565_sse41+0x102>
+ DB 116,60 ; je 1483c <_sk_lerp_565_sse41+0x112>
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,27 ; je 143ab <_sk_lerp_565_sse41+0xea>
+ DB 116,26 ; je 14825 <_sk_lerp_565_sse41+0xfb>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,77,255,255,255 ; jne 142e7 <_sk_lerp_565_sse41+0x26>
+ DB 15,133,64,255,255,255 ; jne 14755 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
- DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10
- DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8
- DB 102,69,15,56,51,192 ; pmovzxwd %xmm8,%xmm8
- DB 102,69,15,58,14,208,15 ; pblendw $0xf,%xmm8,%xmm10
- DB 233,36,255,255,255 ; jmpq 142e7 <_sk_lerp_565_sse41+0x26>
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 102,68,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm10
+ DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
+ DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
+ DB 102,68,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm10
+ DB 233,25,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,68,15,110,208 ; movd %eax,%xmm10
- DB 233,21,255,255,255 ; jmpq 142e7 <_sk_lerp_565_sse41+0x26>
+ DB 233,10,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b>
PUBLIC _sk_load_tables_sse41
_sk_load_tables_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,24,1,0,0 ; jne 144f8 <_sk_load_tables_sse41+0x126>
+ DB 15,133,24,1,0,0 ; jne 14971 <_sk_load_tables_sse41+0x126>
DB 243,69,15,111,4,145 ; movdqu (%r9,%rdx,4),%xmm8
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,45,124,1,0 ; movdqa 0x17c2d(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,148,125,1,0 ; movdqa 0x17d94(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -18937,7 +19203,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0
DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,232,123,1,0 ; pshufb 0x17be8(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,13,79,125,1,0 ; pshufb 0x17d4f(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,211 ; movzbl %bl,%r10d
@@ -18952,7 +19218,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,72,24 ; mov 0x18(%rax),%r9
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,164,123,1,0 ; pshufb 0x17ba4(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,21,11,125,1,0 ; pshufb 0x17d0b(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,208 ; movzbl %al,%r10d
@@ -18967,7 +19233,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,129,124,1,0 ; mulps 0x17c81(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,232,125,1,0 ; mulps 0x17de8(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -18976,19 +19242,19 @@ _sk_load_tables_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,52 ; je 14539 <_sk_load_tables_sse41+0x167>
+ DB 116,52 ; je 149b2 <_sk_load_tables_sse41+0x167>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 14527 <_sk_load_tables_sse41+0x155>
+ DB 116,23 ; je 149a0 <_sk_load_tables_sse41+0x155>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,204,254,255,255 ; jne 143e6 <_sk_load_tables_sse41+0x14>
+ DB 15,133,204,254,255,255 ; jne 1485f <_sk_load_tables_sse41+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8
DB 243,65,15,126,4,145 ; movq (%r9,%rdx,4),%xmm0
DB 102,68,15,58,14,192,15 ; pblendw $0xf,%xmm0,%xmm8
- DB 233,173,254,255,255 ; jmpq 143e6 <_sk_load_tables_sse41+0x14>
+ DB 233,173,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14>
DB 102,69,15,110,4,145 ; movd (%r9,%rdx,4),%xmm8
- DB 233,162,254,255,255 ; jmpq 143e6 <_sk_load_tables_sse41+0x14>
+ DB 233,162,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14>
PUBLIC _sk_load_tables_u16_be_sse41
_sk_load_tables_u16_be_sse41 LABEL PROC
@@ -18996,7 +19262,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,99,1,0,0 ; jne 146bd <_sk_load_tables_u16_be_sse41+0x179>
+ DB 15,133,99,1,0,0 ; jne 14b36 <_sk_load_tables_u16_be_sse41+0x179>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 243,67,15,111,76,81,16 ; movdqu 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -19008,7 +19274,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,79,124,1,0 ; movdqa 0x17c4f(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,5,182,125,1,0 ; movdqa 0x17db6(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19026,7 +19292,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,254,123,1,0 ; pshufb 0x17bfe(%rip),%xmm1 # 2c1f0 <_sk_overlay_sse2_8bit+0x10cf>
+ DB 102,15,56,0,13,101,125,1,0 ; pshufb 0x17d65(%rip),%xmm1 # 2c7d0 <_sk_overlay_sse2_8bit+0x10c3>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19062,7 +19328,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,76,123,1,0 ; mulps 0x17b4c(%rip),%xmm3 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 15,89,29,179,124,1,0 ; mulps 0x17cb3(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -19070,16 +19336,16 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 146d6 <_sk_load_tables_u16_be_sse41+0x192>
+ DB 117,13 ; jne 14b4f <_sk_load_tables_u16_be_sse41+0x192>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,145,254,255,255 ; jmpq 14567 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,145,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,124,254,255,255 ; jb 14567 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 15,130,124,254,255,255 ; jb 149e0 <_sk_load_tables_u16_be_sse41+0x23>
DB 243,67,15,126,76,81,16 ; movq 0x10(%r9,%r10,2),%xmm1
- DB 233,112,254,255,255 ; jmpq 14567 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,112,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse41
_sk_load_tables_rgb_u16_be_sse41 LABEL PROC
@@ -19087,7 +19353,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,83,1,0,0 ; jne 1485c <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ DB 15,133,83,1,0,0 ; jne 14cd5 <_sk_load_tables_rgb_u16_be_sse41+0x165>
DB 243,67,15,111,20,81 ; movdqu (%r9,%r10,2),%xmm2
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -19102,7 +19368,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,145,122,1,0 ; movdqa 0x17a91(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,5,248,123,1,0 ; movdqa 0x17bf8(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19120,7 +19386,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,96,122,1,0 ; pshufb 0x17a60(%rip),%xmm1 # 2c210 <_sk_overlay_sse2_8bit+0x10ef>
+ DB 102,15,56,0,13,199,123,1,0 ; pshufb 0x17bc7(%rip),%xmm1 # 2c7f0 <_sk_overlay_sse2_8bit+0x10e3>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19151,7 +19417,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,27,119,1,0 ; movaps 0x1771b(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,130,120,1,0 ; movaps 0x17882(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -19160,21 +19426,21 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,67,15,196,84,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 14882 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ DB 117,14 ; jne 14cfb <_sk_load_tables_rgb_u16_be_sse41+0x18b>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
- DB 233,173,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,173,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,71,15,110,76,81,6 ; movd 0x6(%r9,%r10,2),%xmm9
DB 102,71,15,196,76,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 148b3 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ DB 114,24 ; jb 14d2c <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,124,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,124,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,115,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,115,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
PUBLIC _sk_byte_tables_sse41
_sk_byte_tables_sse41 LABEL PROC
@@ -19183,7 +19449,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,131,119,1,0 ; movaps 0x17783(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,234,120,1,0 ; movaps 0x178ea(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
@@ -19202,7 +19468,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,68,120,1,0 ; movaps 0x17844(%rip),%xmm9 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,13,171,121,1,0 ; movaps 0x179ab(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19296,7 +19562,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,172,118,1,0 ; movaps 0x176ac(%rip),%xmm9 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,13,19,120,1,0 ; movaps 0x17813(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19473,31 +19739,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,148,116,1,0 ; mulps 0x17494(%rip),%xmm8 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,156,116,1,0 ; andps 0x1749c(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,196,113,1,0 ; orps 0x171c4(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,5,156,116,1,0 ; addps 0x1749c(%rip),%xmm8 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,164,116,1,0 ; movaps 0x174a4(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,5,251,117,1,0 ; mulps 0x175fb(%rip),%xmm8 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,3,118,1,0 ; andps 0x17603(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,43,115,1,0 ; orps 0x1732b(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,5,3,118,1,0 ; addps 0x17603(%rip),%xmm8 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,11,118,1,0 ; movaps 0x1760b(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,164,116,1,0 ; addps 0x174a4(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,172,116,1,0 ; movaps 0x174ac(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,11,118,1,0 ; addps 0x1760b(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,19,118,1,0 ; movaps 0x17613(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,153,116,1,0 ; addps 0x17499(%rip),%xmm8 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,21,161,116,1,0 ; movaps 0x174a1(%rip),%xmm10 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,5,0,118,1,0 ; addps 0x17600(%rip),%xmm8 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,161,116,1,0 ; movaps 0x174a1(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,165,116,1,0 ; movaps 0x174a5(%rip),%xmm11 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,29,12,118,1,0 ; movaps 0x1760c(%rip),%xmm11 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,165,116,1,0 ; mulps 0x174a5(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,29,12,118,1,0 ; mulps 0x1760c(%rip),%xmm11 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -19505,7 +19771,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,44,113,1,0 ; minps 0x1712c(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,93,5,147,114,1,0 ; minps 0x17293(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19533,31 +19799,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,109,115,1,0 ; mulps 0x1736d(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,29,117,115,1,0 ; andps 0x17375(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,29,157,112,1,0 ; orps 0x1709d(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,37,117,115,1,0 ; addps 0x17375(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 15,40,13,126,115,1,0 ; movaps 0x1737e(%rip),%xmm1 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,37,212,116,1,0 ; mulps 0x174d4(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,220,116,1,0 ; andps 0x174dc(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,4,114,1,0 ; orps 0x17204(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,220,116,1,0 ; addps 0x174dc(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,13,229,116,1,0 ; movaps 0x174e5(%rip),%xmm1 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,126,115,1,0 ; addps 0x1737e(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 15,40,13,135,115,1,0 ; movaps 0x17387(%rip),%xmm1 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,29,229,116,1,0 ; addps 0x174e5(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,13,238,116,1,0 ; movaps 0x174ee(%rip),%xmm1 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,116,115,1,0 ; addps 0x17374(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 15,40,13,125,115,1,0 ; movaps 0x1737d(%rip),%xmm1 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,37,219,116,1,0 ; addps 0x174db(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,13,228,116,1,0 ; movaps 0x174e4(%rip),%xmm1 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,125,115,1,0 ; movaps 0x1737d(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,228,116,1,0 ; movaps 0x174e4(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,130,115,1,0 ; movaps 0x17382(%rip),%xmm1 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 15,40,13,233,116,1,0 ; movaps 0x174e9(%rip),%xmm1 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,131,115,1,0 ; mulps 0x17383(%rip),%xmm1 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,89,13,234,116,1,0 ; mulps 0x174ea(%rip),%xmm1 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -19565,7 +19831,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,14,112,1,0 ; minps 0x1700e(%rip),%xmm1 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,13,117,113,1,0 ; minps 0x17175(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19593,31 +19859,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,79,114,1,0 ; mulps 0x1724f(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,29,87,114,1,0 ; andps 0x17257(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,29,127,111,1,0 ; orps 0x16f7f(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,37,87,114,1,0 ; addps 0x17257(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 15,40,21,96,114,1,0 ; movaps 0x17260(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,37,182,115,1,0 ; mulps 0x173b6(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,190,115,1,0 ; andps 0x173be(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,230,112,1,0 ; orps 0x170e6(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,190,115,1,0 ; addps 0x173be(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,21,199,115,1,0 ; movaps 0x173c7(%rip),%xmm2 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,96,114,1,0 ; addps 0x17260(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 15,40,21,105,114,1,0 ; movaps 0x17269(%rip),%xmm2 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,29,199,115,1,0 ; addps 0x173c7(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,21,208,115,1,0 ; movaps 0x173d0(%rip),%xmm2 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,86,114,1,0 ; addps 0x17256(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 15,40,21,95,114,1,0 ; movaps 0x1725f(%rip),%xmm2 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,37,189,115,1,0 ; addps 0x173bd(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm2 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,95,114,1,0 ; movaps 0x1725f(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,100,114,1,0 ; movaps 0x17264(%rip),%xmm2 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 15,40,21,203,115,1,0 ; movaps 0x173cb(%rip),%xmm2 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,101,114,1,0 ; mulps 0x17265(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,89,21,204,115,1,0 ; mulps 0x173cc(%rip),%xmm2 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -19625,7 +19891,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,240,110,1,0 ; minps 0x16ef0(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,21,87,112,1,0 ; minps 0x17057(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19653,31 +19919,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,49,113,1,0 ; mulps 0x17131(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,29,57,113,1,0 ; andps 0x17139(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,29,97,110,1,0 ; orps 0x16e61(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,37,57,113,1,0 ; addps 0x17139(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 15,40,29,66,113,1,0 ; movaps 0x17142(%rip),%xmm3 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,37,152,114,1,0 ; mulps 0x17298(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,160,114,1,0 ; andps 0x172a0(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,200,111,1,0 ; orps 0x16fc8(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,160,114,1,0 ; addps 0x172a0(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,29,169,114,1,0 ; movaps 0x172a9(%rip),%xmm3 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,66,113,1,0 ; addps 0x17142(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 15,40,29,75,113,1,0 ; movaps 0x1714b(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,29,169,114,1,0 ; addps 0x172a9(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,29,178,114,1,0 ; movaps 0x172b2(%rip),%xmm3 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,56,113,1,0 ; addps 0x17138(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 15,40,29,65,113,1,0 ; movaps 0x17141(%rip),%xmm3 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,37,159,114,1,0 ; addps 0x1729f(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,29,168,114,1,0 ; movaps 0x172a8(%rip),%xmm3 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,65,113,1,0 ; movaps 0x17141(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,168,114,1,0 ; movaps 0x172a8(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,70,113,1,0 ; movaps 0x17146(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 15,40,29,173,114,1,0 ; movaps 0x172ad(%rip),%xmm3 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,71,113,1,0 ; mulps 0x17147(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,89,29,174,114,1,0 ; mulps 0x172ae(%rip),%xmm3 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -19685,7 +19951,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,210,109,1,0 ; minps 0x16dd2(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,29,57,111,1,0 ; minps 0x16f39(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19701,20 +19967,20 @@ _sk_gamma_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,78,112,1,0 ; mulps 0x1704e(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,40,53,86,112,1,0 ; movaps 0x17056(%rip),%xmm14 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
+ DB 15,89,5,181,113,1,0 ; mulps 0x171b5(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,40,53,189,113,1,0 ; movaps 0x171bd(%rip),%xmm14 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,37,122,109,1,0 ; movaps 0x16d7a(%rip),%xmm12 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,37,225,110,1,0 ; movaps 0x16ee1(%rip),%xmm12 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,86,212 ; orps %xmm12,%xmm2
- DB 68,15,40,21,78,112,1,0 ; movaps 0x1704e(%rip),%xmm10 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
+ DB 68,15,40,21,181,113,1,0 ; movaps 0x171b5(%rip),%xmm10 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,29,82,112,1,0 ; movaps 0x17052(%rip),%xmm11 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,40,29,185,113,1,0 ; movaps 0x171b9(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,13,80,112,1,0 ; movaps 0x17050(%rip),%xmm9 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
+ DB 68,15,40,13,183,113,1,0 ; movaps 0x171b7(%rip),%xmm9 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 68,15,40,45,84,112,1,0 ; movaps 0x17054(%rip),%xmm13 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,40,45,187,113,1,0 ; movaps 0x171bb(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -19725,21 +19991,21 @@ _sk_gamma_sse41 LABEL PROC
DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,55,112,1,0 ; movaps 0x17037(%rip),%xmm6 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
+ DB 15,40,53,158,113,1,0 ; movaps 0x1719e(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,77,112,1,0 ; movaps 0x1704d(%rip),%xmm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 15,40,61,180,113,1,0 ; movaps 0x171b4(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,45,112,1,0 ; movaps 0x1702d(%rip),%xmm4 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 15,40,37,148,113,1,0 ; movaps 0x17194(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,63,112,1,0 ; movaps 0x1703f(%rip),%xmm15 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,61,166,113,1,0 ; movaps 0x171a6(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,155,111,1,0 ; mulps 0x16f9b(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
+ DB 15,89,5,2,113,1,0 ; mulps 0x17102(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
DB 65,15,84,206 ; andps %xmm14,%xmm1
DB 65,15,86,204 ; orps %xmm12,%xmm1
DB 65,15,88,194 ; addps %xmm10,%xmm0
@@ -19765,8 +20031,8 @@ _sk_gamma_sse41 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,60,111,1,0 ; mulps 0x16f3c(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,29,69,111,1,0 ; andps 0x16f45(%rip),%xmm3 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
+ DB 15,89,5,163,112,1,0 ; mulps 0x170a3(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,29,172,112,1,0 ; andps 0x170ac(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,86,220 ; orps %xmm12,%xmm3
DB 65,15,88,194 ; addps %xmm10,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
@@ -19784,7 +20050,7 @@ _sk_gamma_sse41 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,141,111,1,0 ; movaps 0x16f8d(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,40,5,244,112,1,0 ; movaps 0x170f4(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -19803,29 +20069,29 @@ _sk_gamma_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,90,111,1,0 ; mulps 0x16f5a(%rip),%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0x11af>
- DB 68,15,40,13,210,108,1,0 ; movaps 0x16cd2(%rip),%xmm9 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,89,5,193,112,1,0 ; mulps 0x170c1(%rip),%xmm8 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3>
+ DB 68,15,40,13,57,110,1,0 ; movaps 0x16e39(%rip),%xmm9 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,87,111,1,0 ; movaps 0x16f57(%rip),%xmm0 # 2c2e0 <_sk_overlay_sse2_8bit+0x11bf>
+ DB 15,40,5,190,112,1,0 ; movaps 0x170be(%rip),%xmm0 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,85,111,1,0 ; addps 0x16f55(%rip),%xmm8 # 2c2f0 <_sk_overlay_sse2_8bit+0x11cf>
- DB 68,15,89,5,93,111,1,0 ; mulps 0x16f5d(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0x11df>
- DB 15,89,13,102,111,1,0 ; mulps 0x16f66(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0x11ef>
+ DB 68,15,88,5,188,112,1,0 ; addps 0x170bc(%rip),%xmm8 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3>
+ DB 68,15,89,5,196,112,1,0 ; mulps 0x170c4(%rip),%xmm8 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3>
+ DB 15,89,13,205,112,1,0 ; mulps 0x170cd(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,107,111,1,0 ; mulps 0x16f6b(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0x11ff>
+ DB 15,89,21,210,112,1,0 ; mulps 0x170d2(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,95,111,1,0 ; movaps 0x16f5f(%rip),%xmm9 # 2c330 <_sk_overlay_sse2_8bit+0x120f>
+ DB 68,15,40,13,198,112,1,0 ; movaps 0x170c6(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x1203>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,95,111,1,0 ; movaps 0x16f5f(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0x121f>
+ DB 15,40,21,198,112,1,0 ; movaps 0x170c6(%rip),%xmm2 # 2c920 <_sk_overlay_sse2_8bit+0x1213>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,100,111,1,0 ; movaps 0x16f64(%rip),%xmm12 # 2c350 <_sk_overlay_sse2_8bit+0x122f>
+ DB 68,15,40,37,203,112,1,0 ; movaps 0x170cb(%rip),%xmm12 # 2c930 <_sk_overlay_sse2_8bit+0x1223>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -19844,8 +20110,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,29,111,1,0 ; mulps 0x16f1d(%rip),%xmm1 # 2c360 <_sk_overlay_sse2_8bit+0x123f>
- DB 15,89,21,38,111,1,0 ; mulps 0x16f26(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0x124f>
+ DB 15,89,13,132,112,1,0 ; mulps 0x17084(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x1233>
+ DB 15,89,21,141,112,1,0 ; mulps 0x1708d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -19860,11 +20126,11 @@ _sk_load_a8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 15494 <_sk_load_a8_sse41+0x3f>
+ DB 117,39 ; jne 1590d <_sk_load_a8_sse41+0x3f>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,164,107,1,0 ; pand 0x16ba4(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,11,109,1,0 ; pand 0x16d0b(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,234,108,1,0 ; mulps 0x16cea(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,81,110,1,0 ; mulps 0x16e51(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -19873,12 +20139,12 @@ _sk_load_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 154d6 <_sk_load_a8_sse41+0x81>
+ DB 116,53 ; je 1594f <_sk_load_a8_sse41+0x81>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 154c0 <_sk_load_a8_sse41+0x6b>
+ DB 116,21 ; je 15939 <_sk_load_a8_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 15474 <_sk_load_a8_sse41+0x1f>
+ DB 117,195 ; jne 158ed <_sk_load_a8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -19886,10 +20152,10 @@ _sk_load_a8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,158 ; jmp 15474 <_sk_load_a8_sse41+0x1f>
+ DB 235,158 ; jmp 158ed <_sk_load_a8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,147 ; jmp 15474 <_sk_load_a8_sse41+0x1f>
+ DB 235,147 ; jmp 158ed <_sk_load_a8_sse41+0x1f>
PUBLIC _sk_load_a8_dst_sse41
_sk_load_a8_dst_sse41 LABEL PROC
@@ -19900,11 +20166,11 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 15520 <_sk_load_a8_dst_sse41+0x3f>
+ DB 117,39 ; jne 15999 <_sk_load_a8_dst_sse41+0x3f>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,24,107,1,0 ; pand 0x16b18(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,127,108,1,0 ; pand 0x16c7f(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,94,108,1,0 ; mulps 0x16c5e(%rip),%xmm7 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,61,197,109,1,0 ; mulps 0x16dc5(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
@@ -19913,12 +20179,12 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15562 <_sk_load_a8_dst_sse41+0x81>
+ DB 116,53 ; je 159db <_sk_load_a8_dst_sse41+0x81>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1554c <_sk_load_a8_dst_sse41+0x6b>
+ DB 116,21 ; je 159c5 <_sk_load_a8_dst_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 15500 <_sk_load_a8_dst_sse41+0x1f>
+ DB 117,195 ; jne 15979 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -19926,10 +20192,10 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,158 ; jmp 15500 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,158 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,147 ; jmp 15500 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,147 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f>
PUBLIC _sk_gather_a8_sse41
_sk_gather_a8_sse41 LABEL PROC
@@ -19956,7 +20222,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,147,107,1,0 ; mulps 0x16b93(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,250,108,1,0 ; mulps 0x16cfa(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -19973,13 +20239,13 @@ _sk_store_a8_sse41 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,68,106,1,0 ; movaps 0x16a44(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,171,107,1,0 ; movaps 0x16bab(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 15636 <_sk_store_a8_sse41+0x49>
+ DB 117,17 ; jne 15aaf <_sk_store_a8_sse41+0x49>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -19989,17 +20255,17 @@ _sk_store_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 15672 <_sk_store_a8_sse41+0x85>
+ DB 116,41 ; je 15aeb <_sk_store_a8_sse41+0x85>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 1565e <_sk_store_a8_sse41+0x71>
+ DB 116,15 ; je 15ad7 <_sk_store_a8_sse41+0x71>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,217 ; jne 1562e <_sk_store_a8_sse41+0x41>
+ DB 117,217 ; jne 15aa7 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,68,25,2,8 ; pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- DB 102,68,15,56,0,5,24,109,1,0 ; pshufb 0x16d18(%rip),%xmm8 # 2c380 <_sk_overlay_sse2_8bit+0x125f>
+ DB 102,68,15,56,0,5,127,110,1,0 ; pshufb 0x16e7f(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x1253>
DB 102,71,15,58,21,4,25,0 ; pextrw $0x0,%xmm8,(%r9,%r11,1)
- DB 235,188 ; jmp 1562e <_sk_store_a8_sse41+0x41>
+ DB 235,188 ; jmp 15aa7 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,4,25,0 ; pextrb $0x0,%xmm8,(%r9,%r11,1)
- DB 235,178 ; jmp 1562e <_sk_store_a8_sse41+0x41>
+ DB 235,178 ; jmp 15aa7 <_sk_store_a8_sse41+0x41>
PUBLIC _sk_load_g8_sse41
_sk_load_g8_sse41 LABEL PROC
@@ -20010,25 +20276,25 @@ _sk_load_g8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 156be <_sk_load_g8_sse41+0x42>
+ DB 117,42 ; jne 15b37 <_sk_load_g8_sse41+0x42>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,125,105,1,0 ; pand 0x1697d(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,228,106,1,0 ; pand 0x16ae4(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,195,106,1,0 ; mulps 0x16ac3(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,42,108,1,0 ; mulps 0x16c2a(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,186,104,1,0 ; movaps 0x168ba(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,33,106,1,0 ; movaps 0x16a21(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15700 <_sk_load_g8_sse41+0x84>
+ DB 116,53 ; je 15b79 <_sk_load_g8_sse41+0x84>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 156ea <_sk_load_g8_sse41+0x6e>
+ DB 116,21 ; je 15b63 <_sk_load_g8_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1569b <_sk_load_g8_sse41+0x1f>
+ DB 117,192 ; jne 15b14 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -20036,10 +20302,10 @@ _sk_load_g8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,155 ; jmp 1569b <_sk_load_g8_sse41+0x1f>
+ DB 235,155 ; jmp 15b14 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,144 ; jmp 1569b <_sk_load_g8_sse41+0x1f>
+ DB 235,144 ; jmp 15b14 <_sk_load_g8_sse41+0x1f>
PUBLIC _sk_load_g8_dst_sse41
_sk_load_g8_dst_sse41 LABEL PROC
@@ -20050,25 +20316,25 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 1574d <_sk_load_g8_dst_sse41+0x42>
+ DB 117,42 ; jne 15bc6 <_sk_load_g8_dst_sse41+0x42>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,238,104,1,0 ; pand 0x168ee(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,85,106,1,0 ; pand 0x16a55(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,52,106,1,0 ; mulps 0x16a34(%rip),%xmm4 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,37,155,107,1,0 ; mulps 0x16b9b(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,43,104,1,0 ; movaps 0x1682b(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,146,105,1,0 ; movaps 0x16992(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 1578f <_sk_load_g8_dst_sse41+0x84>
+ DB 116,53 ; je 15c08 <_sk_load_g8_dst_sse41+0x84>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15779 <_sk_load_g8_dst_sse41+0x6e>
+ DB 116,21 ; je 15bf2 <_sk_load_g8_dst_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1572a <_sk_load_g8_dst_sse41+0x1f>
+ DB 117,192 ; jne 15ba3 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -20076,10 +20342,10 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,155 ; jmp 1572a <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,155 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,144 ; jmp 1572a <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,144 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f>
PUBLIC _sk_gather_g8_sse41
_sk_gather_g8_sse41 LABEL PROC
@@ -20106,9 +20372,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,102,105,1,0 ; mulps 0x16966(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,205,106,1,0 ; mulps 0x16acd(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,93,103,1,0 ; movaps 0x1675d(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,196,104,1,0 ; movaps 0x168c4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -20124,41 +20390,41 @@ _sk_load_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 15887 <_sk_load_565_sse41+0x6b>
+ DB 117,80 ; jne 15d00 <_sk_load_565_sse41+0x6b>
DB 102,67,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm2
- DB 102,15,111,5,58,105,1,0 ; movdqa 0x1693a(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,161,106,1,0 ; movdqa 0x16aa1(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,60,105,1,0 ; mulps 0x1693c(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,68,105,1,0 ; movdqa 0x16944(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,163,106,1,0 ; mulps 0x16aa3(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,171,106,1,0 ; movdqa 0x16aab(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,70,105,1,0 ; mulps 0x16946(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,78,105,1,0 ; pand 0x1694e(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,173,106,1,0 ; mulps 0x16aad(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,181,106,1,0 ; pand 0x16ab5(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,84,105,1,0 ; mulps 0x16954(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,187,106,1,0 ; mulps 0x16abb(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,235,102,1,0 ; movaps 0x166eb(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,82,104,1,0 ; movaps 0x16852(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 158c9 <_sk_load_565_sse41+0xad>
+ DB 116,53 ; je 15d42 <_sk_load_565_sse41+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 158b3 <_sk_load_565_sse41+0x97>
+ DB 116,21 ; je 15d2c <_sk_load_565_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1583e <_sk_load_565_sse41+0x22>
+ DB 117,154 ; jne 15cb7 <_sk_load_565_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2
- DB 233,117,255,255,255 ; jmpq 1583e <_sk_load_565_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,103,255,255,255 ; jmpq 1583e <_sk_load_565_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22>
PUBLIC _sk_load_565_dst_sse41
_sk_load_565_dst_sse41 LABEL PROC
@@ -20170,41 +20436,41 @@ _sk_load_565_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 15942 <_sk_load_565_dst_sse41+0x6b>
+ DB 117,80 ; jne 15dbb <_sk_load_565_dst_sse41+0x6b>
DB 102,67,15,56,51,52,89 ; pmovzxwd (%r9,%r11,2),%xmm6
- DB 102,15,111,37,127,104,1,0 ; movdqa 0x1687f(%rip),%xmm4 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,37,230,105,1,0 ; movdqa 0x169e6(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,129,104,1,0 ; mulps 0x16881(%rip),%xmm4 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,45,137,104,1,0 ; movdqa 0x16889(%rip),%xmm5 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,37,232,105,1,0 ; mulps 0x169e8(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,45,240,105,1,0 ; movdqa 0x169f0(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,139,104,1,0 ; mulps 0x1688b(%rip),%xmm5 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,53,147,104,1,0 ; pand 0x16893(%rip),%xmm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,45,242,105,1,0 ; mulps 0x169f2(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,53,250,105,1,0 ; pand 0x169fa(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,153,104,1,0 ; mulps 0x16899(%rip),%xmm6 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,53,0,106,1,0 ; mulps 0x16a00(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,48,102,1,0 ; movaps 0x16630(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,151,103,1,0 ; movaps 0x16797(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15984 <_sk_load_565_dst_sse41+0xad>
+ DB 116,53 ; je 15dfd <_sk_load_565_dst_sse41+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1596e <_sk_load_565_dst_sse41+0x97>
+ DB 116,21 ; je 15de7 <_sk_load_565_dst_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 158f9 <_sk_load_565_dst_sse41+0x22>
+ DB 117,154 ; jne 15d72 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,117,255,255,255 ; jmpq 158f9 <_sk_load_565_dst_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,103,255,255,255 ; jmpq 158f9 <_sk_load_565_dst_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22>
PUBLIC _sk_gather_565_sse41
_sk_gather_565_sse41 LABEL PROC
@@ -20230,19 +20496,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,132,103,1,0 ; movdqa 0x16784(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,235,104,1,0 ; movdqa 0x168eb(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,134,103,1,0 ; mulps 0x16786(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,142,103,1,0 ; movdqa 0x1678e(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,237,104,1,0 ; mulps 0x168ed(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,245,104,1,0 ; movdqa 0x168f5(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,144,103,1,0 ; mulps 0x16790(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,152,103,1,0 ; pand 0x16798(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,247,104,1,0 ; mulps 0x168f7(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,255,104,1,0 ; pand 0x168ff(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,158,103,1,0 ; mulps 0x1679e(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,5,105,1,0 ; mulps 0x16905(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,53,101,1,0 ; movaps 0x16535(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,156,102,1,0 ; movaps 0x1669c(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -20255,12 +20521,12 @@ _sk_store_565_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,52,105,1,0 ; movaps 0x16934(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0x126f>
+ DB 68,15,40,5,155,106,1,0 ; movaps 0x16a9b(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,41,105,1,0 ; movaps 0x16929(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x127f>
+ DB 68,15,40,21,144,106,1,0 ; movaps 0x16a90(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -20270,7 +20536,7 @@ _sk_store_565_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 15aae <_sk_store_565_sse41+0x70>
+ DB 117,10 ; jne 15f27 <_sk_store_565_sse41+0x70>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20278,17 +20544,17 @@ _sk_store_565_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 15ae4 <_sk_store_565_sse41+0xa6>
+ DB 116,35 ; je 15f5d <_sk_store_565_sse41+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 15ad6 <_sk_store_565_sse41+0x98>
+ DB 116,15 ; je 15f4f <_sk_store_565_sse41+0x98>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 15aaa <_sk_store_565_sse41+0x6c>
+ DB 117,221 ; jne 15f23 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 15aaa <_sk_store_565_sse41+0x6c>
+ DB 235,198 ; jmp 15f23 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 15aaa <_sk_store_565_sse41+0x6c>
+ DB 235,188 ; jmp 15f23 <_sk_store_565_sse41+0x6c>
PUBLIC _sk_load_4444_sse41
_sk_load_4444_sse41 LABEL PROC
@@ -20300,44 +20566,44 @@ _sk_load_4444_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 15b68 <_sk_load_4444_sse41+0x7a>
+ DB 117,95 ; jne 15fe1 <_sk_load_4444_sse41+0x7a>
DB 102,67,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm3
- DB 102,15,111,5,152,104,1,0 ; movdqa 0x16898(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,255,105,1,0 ; movdqa 0x169ff(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,154,104,1,0 ; mulps 0x1689a(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,162,104,1,0 ; movdqa 0x168a2(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,1,106,1,0 ; mulps 0x16a01(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,9,106,1,0 ; movdqa 0x16a09(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,164,104,1,0 ; mulps 0x168a4(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,172,104,1,0 ; movdqa 0x168ac(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,11,106,1,0 ; mulps 0x16a0b(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,19,106,1,0 ; movdqa 0x16a13(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,174,104,1,0 ; mulps 0x168ae(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,182,104,1,0 ; pand 0x168b6(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,21,106,1,0 ; mulps 0x16a15(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,29,106,1,0 ; pand 0x16a1d(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,188,104,1,0 ; mulps 0x168bc(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,35,106,1,0 ; mulps 0x16a23(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15baa <_sk_load_4444_sse41+0xbc>
+ DB 116,53 ; je 16023 <_sk_load_4444_sse41+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15b94 <_sk_load_4444_sse41+0xa6>
+ DB 116,21 ; je 1600d <_sk_load_4444_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 15b10 <_sk_load_4444_sse41+0x22>
+ DB 117,139 ; jne 15f89 <_sk_load_4444_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,102,255,255,255 ; jmpq 15b10 <_sk_load_4444_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,88,255,255,255 ; jmpq 15b10 <_sk_load_4444_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22>
PUBLIC _sk_load_4444_dst_sse41
_sk_load_4444_dst_sse41 LABEL PROC
@@ -20349,44 +20615,44 @@ _sk_load_4444_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 15c32 <_sk_load_4444_dst_sse41+0x7a>
+ DB 117,95 ; jne 160ab <_sk_load_4444_dst_sse41+0x7a>
DB 102,67,15,56,51,60,89 ; pmovzxwd (%r9,%r11,2),%xmm7
- DB 102,15,111,37,206,103,1,0 ; movdqa 0x167ce(%rip),%xmm4 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,37,53,105,1,0 ; movdqa 0x16935(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,208,103,1,0 ; mulps 0x167d0(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,45,216,103,1,0 ; movdqa 0x167d8(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,37,55,105,1,0 ; mulps 0x16937(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,45,63,105,1,0 ; movdqa 0x1693f(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,218,103,1,0 ; mulps 0x167da(%rip),%xmm5 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,53,226,103,1,0 ; movdqa 0x167e2(%rip),%xmm6 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,45,65,105,1,0 ; mulps 0x16941(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,53,73,105,1,0 ; movdqa 0x16949(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,228,103,1,0 ; mulps 0x167e4(%rip),%xmm6 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,61,236,103,1,0 ; pand 0x167ec(%rip),%xmm7 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,53,75,105,1,0 ; mulps 0x1694b(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,61,83,105,1,0 ; pand 0x16953(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,242,103,1,0 ; mulps 0x167f2(%rip),%xmm7 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,61,89,105,1,0 ; mulps 0x16959(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15c74 <_sk_load_4444_dst_sse41+0xbc>
+ DB 116,53 ; je 160ed <_sk_load_4444_dst_sse41+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15c5e <_sk_load_4444_dst_sse41+0xa6>
+ DB 116,21 ; je 160d7 <_sk_load_4444_dst_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 15bda <_sk_load_4444_dst_sse41+0x22>
+ DB 117,139 ; jne 16053 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,102,255,255,255 ; jmpq 15bda <_sk_load_4444_dst_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,88,255,255,255 ; jmpq 15bda <_sk_load_4444_dst_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22>
PUBLIC _sk_gather_4444_sse41
_sk_gather_4444_sse41 LABEL PROC
@@ -20412,21 +20678,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,196,102,1,0 ; movdqa 0x166c4(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,43,104,1,0 ; movdqa 0x1682b(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,198,102,1,0 ; mulps 0x166c6(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,206,102,1,0 ; movdqa 0x166ce(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,45,104,1,0 ; mulps 0x1682d(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,53,104,1,0 ; movdqa 0x16835(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,208,102,1,0 ; mulps 0x166d0(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,216,102,1,0 ; movdqa 0x166d8(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,55,104,1,0 ; mulps 0x16837(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,63,104,1,0 ; movdqa 0x1683f(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,218,102,1,0 ; mulps 0x166da(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,226,102,1,0 ; pand 0x166e2(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,65,104,1,0 ; mulps 0x16841(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,73,104,1,0 ; pand 0x16849(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,232,102,1,0 ; mulps 0x166e8(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,79,104,1,0 ; mulps 0x1684f(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -20440,7 +20706,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,213,102,1,0 ; movaps 0x166d5(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x130f>
+ DB 68,15,40,5,60,104,1,0 ; movaps 0x1683c(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20460,7 +20726,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 15dc1 <_sk_store_4444_sse41+0x84>
+ DB 117,10 ; jne 1623a <_sk_store_4444_sse41+0x84>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20468,17 +20734,17 @@ _sk_store_4444_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 15df7 <_sk_store_4444_sse41+0xba>
+ DB 116,35 ; je 16270 <_sk_store_4444_sse41+0xba>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 15de9 <_sk_store_4444_sse41+0xac>
+ DB 116,15 ; je 16262 <_sk_store_4444_sse41+0xac>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 15dbd <_sk_store_4444_sse41+0x80>
+ DB 117,221 ; jne 16236 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 15dbd <_sk_store_4444_sse41+0x80>
+ DB 235,198 ; jmp 16236 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 15dbd <_sk_store_4444_sse41+0x80>
+ DB 235,188 ; jmp 16236 <_sk_store_4444_sse41+0x80>
PUBLIC _sk_load_8888_sse41
_sk_load_8888_sse41 LABEL PROC
@@ -20490,19 +20756,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 15e76 <_sk_load_8888_sse41+0x75>
+ DB 117,89 ; jne 162ef <_sk_load_8888_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,245,97,1,0 ; movdqa 0x161f5(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,92,99,1,0 ; movdqa 0x1635c(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,54,99,1,0 ; movaps 0x16336(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,157,100,1,0 ; movaps 0x1649d(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,229,97,1,0 ; pshufb 0x161e5(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,13,76,99,1,0 ; pshufb 0x1634c(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,225,97,1,0 ; pshufb 0x161e1(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,21,72,99,1,0 ; pshufb 0x16348(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20513,19 +20779,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 15eb0 <_sk_load_8888_sse41+0xaf>
+ DB 116,45 ; je 16329 <_sk_load_8888_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 15e9f <_sk_load_8888_sse41+0x9e>
+ DB 116,18 ; je 16318 <_sk_load_8888_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 15e23 <_sk_load_8888_sse41+0x22>
+ DB 117,144 ; jne 1629c <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 15e23 <_sk_load_8888_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 15e23 <_sk_load_8888_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22>
PUBLIC _sk_load_8888_dst_sse41
_sk_load_8888_dst_sse41 LABEL PROC
@@ -20537,19 +20803,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 15f30 <_sk_load_8888_dst_sse41+0x75>
+ DB 117,89 ; jne 163a9 <_sk_load_8888_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,59,97,1,0 ; movdqa 0x1613b(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,162,98,1,0 ; movdqa 0x162a2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,124,98,1,0 ; movaps 0x1627c(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,227,99,1,0 ; movaps 0x163e3(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,43,97,1,0 ; pshufb 0x1612b(%rip),%xmm5 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,45,146,98,1,0 ; pshufb 0x16292(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,39,97,1,0 ; pshufb 0x16127(%rip),%xmm6 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,53,142,98,1,0 ; pshufb 0x1628e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -20560,19 +20826,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 15f6a <_sk_load_8888_dst_sse41+0xaf>
+ DB 116,45 ; je 163e3 <_sk_load_8888_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 15f59 <_sk_load_8888_dst_sse41+0x9e>
+ DB 116,18 ; je 163d2 <_sk_load_8888_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 15edd <_sk_load_8888_dst_sse41+0x22>
+ DB 117,144 ; jne 16356 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 15edd <_sk_load_8888_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 15edd <_sk_load_8888_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22>
PUBLIC _sk_gather_8888_sse41
_sk_gather_8888_sse41 LABEL PROC
@@ -20595,17 +20861,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,74,96,1,0 ; movdqa 0x1604a(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,177,97,1,0 ; movdqa 0x161b1(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,139,97,1,0 ; movaps 0x1618b(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,242,98,1,0 ; movaps 0x162f2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,58,96,1,0 ; pshufb 0x1603a(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,13,161,97,1,0 ; pshufb 0x161a1(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,54,96,1,0 ; pshufb 0x16036(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,21,157,97,1,0 ; pshufb 0x1619d(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20624,7 +20890,7 @@ _sk_store_8888_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,15,96,1,0 ; movaps 0x1600f(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,118,97,1,0 ; movaps 0x16176(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20643,23 +20909,23 @@ _sk_store_8888_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 160a1 <_sk_store_8888_sse41+0x7f>
+ DB 117,10 ; jne 1651a <_sk_store_8888_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 160cb <_sk_store_8888_sse41+0xa9>
+ DB 116,29 ; je 16544 <_sk_store_8888_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 160c3 <_sk_store_8888_sse41+0xa1>
+ DB 116,15 ; je 1653c <_sk_store_8888_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1609d <_sk_store_8888_sse41+0x7b>
+ DB 117,227 ; jne 16516 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 1609d <_sk_store_8888_sse41+0x7b>
+ DB 235,210 ; jmp 16516 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 1609d <_sk_store_8888_sse41+0x7b>
+ DB 235,202 ; jmp 16516 <_sk_store_8888_sse41+0x7b>
PUBLIC _sk_load_bgra_sse41
_sk_load_bgra_sse41 LABEL PROC
@@ -20671,19 +20937,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 16148 <_sk_load_bgra_sse41+0x75>
+ DB 117,89 ; jne 165c1 <_sk_load_bgra_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,35,95,1,0 ; movdqa 0x15f23(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,138,96,1,0 ; movdqa 0x1608a(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,100,96,1,0 ; movaps 0x16064(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,203,97,1,0 ; movaps 0x161cb(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,19,95,1,0 ; pshufb 0x15f13(%rip),%xmm0 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,5,122,96,1,0 ; pshufb 0x1607a(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,15,95,1,0 ; pshufb 0x15f0f(%rip),%xmm0 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,5,118,96,1,0 ; pshufb 0x16076(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20694,19 +20960,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 16182 <_sk_load_bgra_sse41+0xaf>
+ DB 116,45 ; je 165fb <_sk_load_bgra_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 16171 <_sk_load_bgra_sse41+0x9e>
+ DB 116,18 ; je 165ea <_sk_load_bgra_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 160f5 <_sk_load_bgra_sse41+0x22>
+ DB 117,144 ; jne 1656e <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 160f5 <_sk_load_bgra_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 160f5 <_sk_load_bgra_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22>
PUBLIC _sk_load_bgra_dst_sse41
_sk_load_bgra_dst_sse41 LABEL PROC
@@ -20718,19 +20984,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 16202 <_sk_load_bgra_dst_sse41+0x75>
+ DB 117,89 ; jne 1667b <_sk_load_bgra_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,105,94,1,0 ; movdqa 0x15e69(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,208,95,1,0 ; movdqa 0x15fd0(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6
- DB 68,15,40,5,170,95,1,0 ; movaps 0x15faa(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,17,97,1,0 ; movaps 0x16111(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,89,94,1,0 ; pshufb 0x15e59(%rip),%xmm4 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,37,192,95,1,0 ; pshufb 0x15fc0(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,85,94,1,0 ; pshufb 0x15e55(%rip),%xmm4 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,37,188,95,1,0 ; pshufb 0x15fbc(%rip),%xmm4 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -20741,19 +21007,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 1623c <_sk_load_bgra_dst_sse41+0xaf>
+ DB 116,45 ; je 166b5 <_sk_load_bgra_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1622b <_sk_load_bgra_dst_sse41+0x9e>
+ DB 116,18 ; je 166a4 <_sk_load_bgra_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 161af <_sk_load_bgra_dst_sse41+0x22>
+ DB 117,144 ; jne 16628 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 161af <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 161af <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22>
PUBLIC _sk_gather_bgra_sse41
_sk_gather_bgra_sse41 LABEL PROC
@@ -20776,17 +21042,17 @@ _sk_gather_bgra_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,120,93,1,0 ; movdqa 0x15d78(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,223,94,1,0 ; movdqa 0x15edf(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,185,94,1,0 ; movaps 0x15eb9(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,32,96,1,0 ; movaps 0x16020(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,104,93,1,0 ; pshufb 0x15d68(%rip),%xmm0 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,5,207,94,1,0 ; pshufb 0x15ecf(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,100,93,1,0 ; pshufb 0x15d64(%rip),%xmm0 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,5,203,94,1,0 ; pshufb 0x15ecb(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20805,7 +21071,7 @@ _sk_store_bgra_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,61,93,1,0 ; movaps 0x15d3d(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,164,94,1,0 ; movaps 0x15ea4(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20824,23 +21090,23 @@ _sk_store_bgra_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 16373 <_sk_store_bgra_sse41+0x7f>
+ DB 117,10 ; jne 167ec <_sk_store_bgra_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 1639d <_sk_store_bgra_sse41+0xa9>
+ DB 116,29 ; je 16816 <_sk_store_bgra_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 16395 <_sk_store_bgra_sse41+0xa1>
+ DB 116,15 ; je 1680e <_sk_store_bgra_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1636f <_sk_store_bgra_sse41+0x7b>
+ DB 117,227 ; jne 167e8 <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 1636f <_sk_store_bgra_sse41+0x7b>
+ DB 235,210 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 1636f <_sk_store_bgra_sse41+0x7b>
+ DB 235,202 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b>
PUBLIC _sk_load_f16_sse41
_sk_load_f16_sse41 LABEL PROC
@@ -20852,7 +21118,7 @@ _sk_load_f16_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 16503 <_sk_load_f16_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 1697c <_sk_load_f16_sse41+0x15e>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 243,65,15,111,76,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,200 ; movapd %xmm0,%xmm9
@@ -20862,18 +21128,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,66,96,1,0 ; movdqa 0x16042(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,5,169,97,1,0 ; movdqa 0x161a9(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,61,96,1,0 ; movdqa 0x1603d(%rip),%xmm3 # 2c450 <_sk_overlay_sse2_8bit+0x132f>
+ DB 102,15,111,29,164,97,1,0 ; movdqa 0x161a4(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,41,96,1,0 ; movdqa 0x16029(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,21,144,97,1,0 ; movdqa 0x16190(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -20916,16 +21182,16 @@ _sk_load_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 1651c <_sk_load_f16_sse41+0x177>
+ DB 117,13 ; jne 16995 <_sk_load_f16_sse41+0x177>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,182,254,255,255 ; jmpq 163d2 <_sk_load_f16_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 163d2 <_sk_load_f16_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 1684b <_sk_load_f16_sse41+0x2d>
DB 243,65,15,126,76,193,16 ; movq 0x10(%r9,%rax,8),%xmm1
- DB 233,149,254,255,255 ; jmpq 163d2 <_sk_load_f16_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d>
PUBLIC _sk_load_f16_dst_sse41
_sk_load_f16_dst_sse41 LABEL PROC
@@ -20937,7 +21203,7 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 1669b <_sk_load_f16_dst_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 16b14 <_sk_load_f16_dst_sse41+0x15e>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 243,65,15,111,108,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,204 ; movapd %xmm4,%xmm9
@@ -20947,18 +21213,18 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11
DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9
DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5
- DB 102,68,15,111,5,170,94,1,0 ; movdqa 0x15eaa(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,5,17,96,1,0 ; movdqa 0x16011(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,245 ; movdqa %xmm5,%xmm6
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,239,238 ; pxor %xmm6,%xmm5
- DB 102,15,111,61,165,94,1,0 ; movdqa 0x15ea5(%rip),%xmm7 # 2c450 <_sk_overlay_sse2_8bit+0x132f>
+ DB 102,15,111,61,12,96,1,0 ; movdqa 0x1600c(%rip),%xmm7 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4
DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4
DB 102,15,114,245,13 ; pslld $0xd,%xmm5
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,68,15,111,21,145,94,1,0 ; movdqa 0x15e91(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,21,248,95,1,0 ; movdqa 0x15ff8(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21001,16 +21267,16 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 166b4 <_sk_load_f16_dst_sse41+0x177>
+ DB 117,13 ; jne 16b2d <_sk_load_f16_dst_sse41+0x177>
DB 243,15,126,228 ; movq %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 233,182,254,255,255 ; jmpq 1656a <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 1656a <_sk_load_f16_dst_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 169e3 <_sk_load_f16_dst_sse41+0x2d>
DB 243,65,15,126,108,193,16 ; movq 0x10(%r9,%rax,8),%xmm5
- DB 233,149,254,255,255 ; jmpq 1656a <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d>
PUBLIC _sk_gather_f16_sse41
_sk_gather_f16_sse41 LABEL PROC
@@ -21042,18 +21308,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,228,92,1,0 ; movdqa 0x15ce4(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,5,75,94,1,0 ; movdqa 0x15e4b(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,223,92,1,0 ; movdqa 0x15cdf(%rip),%xmm3 # 2c450 <_sk_overlay_sse2_8bit+0x132f>
+ DB 102,15,111,29,70,94,1,0 ; movdqa 0x15e46(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,203,92,1,0 ; movdqa 0x15ccb(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,21,50,94,1,0 ; movdqa 0x15e32(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21105,17 +21371,17 @@ _sk_store_f16_sse41 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,238,91,1,0 ; movdqa 0x15bee(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,21,85,93,1,0 ; movdqa 0x15d55(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,225,91,1,0 ; movdqa 0x15be1(%rip),%xmm9 # 2c480 <_sk_overlay_sse2_8bit+0x135f>
+ DB 102,68,15,111,13,72,93,1,0 ; movdqa 0x15d48(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,210,91,1,0 ; movdqa 0x15bd2(%rip),%xmm12 # 2c490 <_sk_overlay_sse2_8bit+0x136f>
+ DB 102,68,15,111,37,57,93,1,0 ; movdqa 0x15d39(%rip),%xmm12 # 2ca70 <_sk_overlay_sse2_8bit+0x1363>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -21159,7 +21425,7 @@ _sk_store_f16_sse41 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 169b4 <_sk_store_f16_sse41+0x152>
+ DB 117,21 ; jne 16e2d <_sk_store_f16_sse41+0x152>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -21167,13 +21433,13 @@ _sk_store_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 169b0 <_sk_store_f16_sse41+0x14e>
+ DB 116,240 ; je 16e29 <_sk_store_f16_sse41+0x14e>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 169b0 <_sk_store_f16_sse41+0x14e>
+ DB 114,227 ; jb 16e29 <_sk_store_f16_sse41+0x14e>
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 169b0 <_sk_store_f16_sse41+0x14e>
+ DB 235,213 ; jmp 16e29 <_sk_store_f16_sse41+0x14e>
PUBLIC _sk_load_u16_be_sse41
_sk_load_u16_be_sse41 LABEL PROC
@@ -21186,7 +21452,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,185,0,0,0 ; jne 16abb <_sk_load_u16_be_sse41+0xe0>
+ DB 15,133,185,0,0,0 ; jne 16f34 <_sk_load_u16_be_sse41+0xe0>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 243,65,15,111,76,65,16 ; movdqu 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -21202,7 +21468,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,178,87,1,0 ; movaps 0x157b2(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,5,25,89,1,0 ; movaps 0x15919(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21230,16 +21496,16 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 16ad4 <_sk_load_u16_be_sse41+0xf9>
+ DB 117,13 ; jne 16f4d <_sk_load_u16_be_sse41+0xf9>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,59,255,255,255 ; jmpq 16a0f <_sk_load_u16_be_sse41+0x34>
+ DB 233,59,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,38,255,255,255 ; jb 16a0f <_sk_load_u16_be_sse41+0x34>
+ DB 15,130,38,255,255,255 ; jb 16e88 <_sk_load_u16_be_sse41+0x34>
DB 243,65,15,126,76,65,16 ; movq 0x10(%r9,%rax,2),%xmm1
- DB 233,26,255,255,255 ; jmpq 16a0f <_sk_load_u16_be_sse41+0x34>
+ DB 233,26,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34>
PUBLIC _sk_load_rgb_u16_be_sse41
_sk_load_rgb_u16_be_sse41 LABEL PROC
@@ -21254,7 +21520,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,170,0,0,0 ; jne 16bca <_sk_load_rgb_u16_be_sse41+0xd5>
+ DB 15,133,170,0,0,0 ; jne 17043 <_sk_load_rgb_u16_be_sse41+0xd5>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -21274,7 +21540,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,129,86,1,0 ; movaps 0x15681(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,5,232,87,1,0 ; movaps 0x157e8(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21291,27 +21557,27 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,168,83,1,0 ; movaps 0x153a8(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,15,85,1,0 ; movaps 0x1550f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 16bef <_sk_load_rgb_u16_be_sse41+0xfa>
+ DB 117,13 ; jne 17068 <_sk_load_rgb_u16_be_sse41+0xfa>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,85,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,85,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 16c20 <_sk_load_rgb_u16_be_sse41+0x12b>
+ DB 114,24 ; jb 17099 <_sk_load_rgb_u16_be_sse41+0x12b>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,36,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,36,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,27,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,27,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
PUBLIC _sk_store_u16_be_sse41
_sk_store_u16_be_sse41 LABEL PROC
@@ -21323,7 +21589,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,81,88,1,0 ; movaps 0x15851(%rip),%xmm10 # 2c4a0 <_sk_overlay_sse2_8bit+0x137f>
+ DB 68,15,40,21,184,89,1,0 ; movaps 0x159b8(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -21360,7 +21626,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 16d1d <_sk_store_u16_be_sse41+0xf4>
+ DB 117,21 ; jne 17196 <_sk_store_u16_be_sse41+0xf4>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -21368,13 +21634,13 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 16d19 <_sk_store_u16_be_sse41+0xf0>
+ DB 116,240 ; je 17192 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 16d19 <_sk_store_u16_be_sse41+0xf0>
+ DB 114,227 ; jb 17192 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 16d19 <_sk_store_u16_be_sse41+0xf0>
+ DB 235,213 ; jmp 17192 <_sk_store_u16_be_sse41+0xf0>
PUBLIC _sk_load_f32_sse41
_sk_load_f32_sse41 LABEL PROC
@@ -21388,7 +21654,7 @@ _sk_load_f32_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 16daf <_sk_load_f32_sse41+0x6b>
+ DB 117,66 ; jne 17228 <_sk_load_f32_sse41+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -21408,17 +21674,17 @@ _sk_load_f32_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 16dc1 <_sk_load_f32_sse41+0x7d>
+ DB 117,8 ; jne 1723a <_sk_load_f32_sse41+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 16d7f <_sk_load_f32_sse41+0x3b>
+ DB 235,190 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 16dd5 <_sk_load_f32_sse41+0x91>
+ DB 114,8 ; jb 1724e <_sk_load_f32_sse41+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 16d7f <_sk_load_f32_sse41+0x3b>
+ DB 235,170 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 16d7f <_sk_load_f32_sse41+0x3b>
+ DB 235,165 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
PUBLIC _sk_load_f32_dst_sse41
_sk_load_f32_dst_sse41 LABEL PROC
@@ -21432,7 +21698,7 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 16e45 <_sk_load_f32_dst_sse41+0x6b>
+ DB 117,66 ; jne 172be <_sk_load_f32_dst_sse41+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -21452,17 +21718,17 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 16e57 <_sk_load_f32_dst_sse41+0x7d>
+ DB 117,8 ; jne 172d0 <_sk_load_f32_dst_sse41+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,190 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 16e6b <_sk_load_f32_dst_sse41+0x91>
+ DB 114,8 ; jb 172e4 <_sk_load_f32_dst_sse41+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,170 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,165 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
PUBLIC _sk_store_f32_sse41
_sk_store_f32_sse41 LABEL PROC
@@ -21489,7 +21755,7 @@ _sk_store_f32_sse41 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 16eed <_sk_store_f32_sse41+0x7d>
+ DB 117,29 ; jne 17366 <_sk_store_f32_sse41+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -21497,12 +21763,12 @@ _sk_store_f32_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 16ee9 <_sk_store_f32_sse41+0x79>
+ DB 116,246 ; je 17362 <_sk_store_f32_sse41+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 16ee9 <_sk_store_f32_sse41+0x79>
+ DB 114,234 ; jb 17362 <_sk_store_f32_sse41+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 16ee9 <_sk_store_f32_sse41+0x79>
+ DB 235,225 ; jmp 17362 <_sk_store_f32_sse41+0x79>
PUBLIC _sk_clamp_x_sse41
_sk_clamp_x_sse41 LABEL PROC
@@ -21582,7 +21848,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,119,69,1,0 ; mulss 0x14577(%rip),%xmm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,13,234,70,1,0 ; mulss 0x146ea(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -21611,7 +21877,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,5,69,1,0 ; mulss 0x14505(%rip),%xmm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,13,120,70,1,0 ; mulss 0x14678(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -21634,7 +21900,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,148,78,1,0 ; minps 0x14e94(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,93,5,251,79,1,0 ; minps 0x14ffb(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -21648,9 +21914,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,213,78,1,0 ; movaps 0x14ed5(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,5,60,80,1,0 ; movaps 0x1503c(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,89,78,1,0 ; movaps 0x14e59(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,192,79,1,0 ; movaps 0x14fc0(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -21665,10 +21931,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,120,83,1,0 ; mulps 0x15378(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x138f>
- DB 15,89,13,129,83,1,0 ; mulps 0x15381(%rip),%xmm1 # 2c4c0 <_sk_overlay_sse2_8bit+0x139f>
+ DB 15,89,5,223,84,1,0 ; mulps 0x154df(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383>
+ DB 15,89,13,232,84,1,0 ; mulps 0x154e8(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,135,83,1,0 ; mulps 0x15387(%rip),%xmm3 # 2c4d0 <_sk_overlay_sse2_8bit+0x13af>
+ DB 15,89,29,238,84,1,0 ; mulps 0x154ee(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -21965,9 +22231,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 175eb <_sk_evenly_spaced_gradient_sse41+0x1a>
+ DB 120,7 ; js 17a64 <_sk_evenly_spaced_gradient_sse41+0x1a>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 17600 <_sk_evenly_spaced_gradient_sse41+0x2f>
+ DB 235,21 ; jmp 17a79 <_sk_evenly_spaced_gradient_sse41+0x2f>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -22055,15 +22321,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,50,77,1,0 ; movaps 0x14d32(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x13bf>
+ DB 15,40,5,153,78,1,0 ; movaps 0x14e99(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,56,77,1,0 ; addps 0x14d38(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x13cf>
+ DB 15,88,5,159,78,1,0 ; addps 0x14e9f(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,62,77,1,0 ; addps 0x14d3e(%rip),%xmm0 # 2c500 <_sk_overlay_sse2_8bit+0x13df>
+ DB 15,88,5,165,78,1,0 ; addps 0x14ea5(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,68,77,1,0 ; addps 0x14d44(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x13ef>
+ DB 15,88,5,171,78,1,0 ; addps 0x14eab(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,74,77,1,0 ; addps 0x14d4a(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x13ff>
+ DB 15,88,5,177,78,1,0 ; addps 0x14eb1(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -22079,12 +22345,12 @@ _sk_gradient_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 17829 <_sk_gradient_sse41+0x46>
+ DB 114,50 ; jb 17ca2 <_sk_gradient_sse41+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,115,71,1,0 ; movaps 0x14773(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 15,40,21,218,72,1,0 ; movaps 0x148da(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -22092,7 +22358,7 @@ _sk_gradient_sse41 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 1780d <_sk_gradient_sse41+0x2a>
+ DB 117,228 ; jne 17c86 <_sk_gradient_sse41+0x2a>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -22218,26 +22484,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,180,74,1,0 ; movaps 0x14ab4(%rip),%xmm10 # 2c530 <_sk_overlay_sse2_8bit+0x140f>
+ DB 68,15,40,21,27,76,1,0 ; movaps 0x14c1b(%rip),%xmm10 # 2cb10 <_sk_overlay_sse2_8bit+0x1403>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,184,74,1,0 ; addps 0x14ab8(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0x141f>
+ DB 68,15,88,21,31,76,1,0 ; addps 0x14c1f(%rip),%xmm10 # 2cb20 <_sk_overlay_sse2_8bit+0x1413>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,188,74,1,0 ; addps 0x14abc(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0x142f>
+ DB 68,15,88,21,35,76,1,0 ; addps 0x14c23(%rip),%xmm10 # 2cb30 <_sk_overlay_sse2_8bit+0x1423>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,192,74,1,0 ; addps 0x14ac0(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0x143f>
+ DB 68,15,88,21,39,76,1,0 ; addps 0x14c27(%rip),%xmm10 # 2cb40 <_sk_overlay_sse2_8bit+0x1433>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,191,74,1,0 ; movaps 0x14abf(%rip),%xmm11 # 2c570 <_sk_overlay_sse2_8bit+0x144f>
+ DB 68,15,40,29,38,76,1,0 ; movaps 0x14c26(%rip),%xmm11 # 2cb50 <_sk_overlay_sse2_8bit+0x1443>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,152,68,1,0 ; movaps 0x14498(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,29,255,69,1,0 ; movaps 0x145ff(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,138,68,1,0 ; movaps 0x1448a(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,241,69,1,0 ; movaps 0x145f1(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -22267,7 +22533,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,51,74,1,0 ; mulps 0x14a33(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,154,75,1,0 ; mulps 0x14b9a(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22275,7 +22541,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,30,74,1,0 ; mulps 0x14a1e(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,133,75,1,0 ; mulps 0x14b85(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22284,8 +22550,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,214,72,1,0 ; xorps 0x148d6(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,190,67,1,0 ; mulps 0x143be(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,61,74,1,0 ; xorps 0x14a3d(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,37,69,1,0 ; mulps 0x14525(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22304,7 +22570,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,149,73,1,0 ; mulps 0x14995(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,252,74,1,0 ; mulps 0x14afc(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22312,7 +22578,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,128,73,1,0 ; mulps 0x14980(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,231,74,1,0 ; mulps 0x14ae7(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22321,8 +22587,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,56,72,1,0 ; xorps 0x14838(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,32,67,1,0 ; mulps 0x14320(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,159,73,1,0 ; xorps 0x1499f(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,135,68,1,0 ; mulps 0x14487(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22338,7 +22604,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,8,73,1,0 ; mulps 0x14908(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,111,74,1,0 ; mulps 0x14a6f(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -22346,7 +22612,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,212,71,1,0 ; xorps 0x147d4(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 15,87,5,59,73,1,0 ; xorps 0x1493b(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22383,7 +22649,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,90,66,1,0 ; movaps 0x1425a(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,193,67,1,0 ; movaps 0x143c1(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -22423,8 +22689,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,12,72,1,0 ; addps 0x1480c(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,212,65,1,0 ; movaps 0x141d4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,115,73,1,0 ; addps 0x14973(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,59,67,1,0 ; movaps 0x1433b(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22435,7 +22701,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,163,65,1,0 ; addps 0x141a3(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,5,10,67,1,0 ; addps 0x1430a(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22445,8 +22711,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,197,71,1,0 ; addps 0x147c5(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,141,65,1,0 ; movaps 0x1418d(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,44,73,1,0 ; addps 0x1492c(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,244,66,1,0 ; movaps 0x142f4(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22457,7 +22723,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,91,65,1,0 ; addps 0x1415b(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,13,194,66,1,0 ; addps 0x142c2(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22467,13 +22733,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,142,71,1,0 ; addps 0x1478e(%rip),%xmm0 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,70,65,1,0 ; movaps 0x14146(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,245,72,1,0 ; addps 0x148f5(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,173,66,1,0 ; movaps 0x142ad(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,130,71,1,0 ; mulps 0x14782(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,26,67,1,0 ; addps 0x1431a(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,233,72,1,0 ; mulps 0x148e9(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,129,68,1,0 ; addps 0x14481(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22484,16 +22750,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,57,71,1,0 ; addps 0x14739(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,1,65,1,0 ; movaps 0x14101(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,160,72,1,0 ; addps 0x148a0(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,104,66,1,0 ; movaps 0x14268(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,85,71,1,0 ; movaps 0x14755(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,188,72,1,0 ; movaps 0x148bc(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,89,71,1,0 ; addps 0x14759(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,192,72,1,0 ; addps 0x148c0(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,205,64,1,0 ; addps 0x140cd(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,52,66,1,0 ; addps 0x14234(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,81,71,1,0 ; addps 0x14751(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,184,72,1,0 ; addps 0x148b8(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22501,17 +22767,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,171,64,1,0 ; movaps 0x140ab(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,18,66,1,0 ; movaps 0x14212(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,7,71,1,0 ; movaps 0x14707(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,110,72,1,0 ; movaps 0x1486e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,11,71,1,0 ; addps 0x1470b(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,114,72,1,0 ; addps 0x14872(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,7,71,1,0 ; addps 0x14707(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,110,72,1,0 ; addps 0x1486e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22521,11 +22787,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,218,70,1,0 ; addps 0x146da(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,5,65,72,1,0 ; addps 0x14841(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,170,70,1,0 ; mulps 0x146aa(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,66,66,1,0 ; addps 0x14242(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,17,72,1,0 ; mulps 0x14811(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,169,67,1,0 ; addps 0x143a9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22536,13 +22802,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,112,70,1,0 ; addps 0x14670(%rip),%xmm1 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,40,64,1,0 ; movaps 0x14028(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,215,71,1,0 ; addps 0x147d7(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,143,65,1,0 ; movaps 0x1418f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,100,70,1,0 ; mulps 0x14664(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,252,65,1,0 ; addps 0x141fc(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,203,71,1,0 ; mulps 0x147cb(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,99,67,1,0 ; addps 0x14363(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22553,16 +22819,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,26,70,1,0 ; addps 0x1461a(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,226,63,1,0 ; movaps 0x13fe2(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,129,71,1,0 ; addps 0x14781(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,73,65,1,0 ; movaps 0x14149(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,54,70,1,0 ; movaps 0x14636(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,157,71,1,0 ; movaps 0x1479d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,58,70,1,0 ; addps 0x1463a(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,161,71,1,0 ; addps 0x147a1(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,174,63,1,0 ; addps 0x13fae(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,21,65,1,0 ; addps 0x14115(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,50,70,1,0 ; addps 0x14632(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,153,71,1,0 ; addps 0x14799(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22570,17 +22836,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,140,63,1,0 ; movaps 0x13f8c(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,243,64,1,0 ; movaps 0x140f3(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,231,69,1,0 ; movaps 0x145e7(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,78,71,1,0 ; movaps 0x1474e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,235,69,1,0 ; addps 0x145eb(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,82,71,1,0 ; addps 0x14752(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,231,69,1,0 ; addps 0x145e7(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,78,71,1,0 ; addps 0x1474e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22590,11 +22856,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,185,69,1,0 ; addps 0x145b9(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,13,32,71,1,0 ; addps 0x14720(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,137,69,1,0 ; mulps 0x14589(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,33,65,1,0 ; addps 0x14121(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,240,70,1,0 ; mulps 0x146f0(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,136,66,1,0 ; addps 0x14288(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22727,10 +22993,10 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,56,64,227 ; pmulld %xmm3,%xmm12
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,15,254,209 ; paddd %xmm1,%xmm2
- DB 102,15,111,37,241,67,1,0 ; movdqa 0x143f1(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,37,88,69,1,0 ; movdqa 0x14558(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
- DB 102,68,15,111,61,78,61,1,0 ; movdqa 0x13d4e(%rip),%xmm15 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,61,181,62,1,0 ; movdqa 0x13eb5(%rip),%xmm15 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,65,15,254,231 ; paddd %xmm15,%xmm4
DB 102,73,15,58,22,225,1 ; pextrq $0x1,%xmm4,%r9
@@ -22750,7 +23016,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,65,15,58,22,210,1 ; pextrd $0x1,%xmm2,%r10d
DB 102,65,15,58,22,211,2 ; pextrd $0x2,%xmm2,%r11d
DB 102,65,15,58,22,214,3 ; pextrd $0x3,%xmm2,%r14d
- DB 102,68,15,111,13,0,61,1,0 ; movdqa 0x13d00(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,13,103,62,1,0 ; movdqa 0x13e67(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,209 ; paddd %xmm9,%xmm2
DB 102,73,15,58,22,215,1 ; pextrq $0x1,%xmm2,%r15
DB 102,72,15,126,211 ; movq %xmm2,%rbx
@@ -22764,7 +23030,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 73,193,239,32 ; shr $0x20,%r15
DB 243,66,15,16,20,184 ; movss (%rax,%r15,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
- DB 15,40,45,21,67,1,0 ; movaps 0x14315(%rip),%xmm5 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,45,124,68,1,0 ; movaps 0x1447c(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,197 ; addps %xmm5,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 15,40,215 ; movaps %xmm7,%xmm2
@@ -22933,7 +23199,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,254,232 ; paddd %xmm0,%xmm13
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
- DB 102,15,111,45,214,63,1,0 ; movdqa 0x13fd6(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,45,61,65,1,0 ; movdqa 0x1413d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,213 ; pmulld %xmm5,%xmm2
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,254,207 ; paddd %xmm15,%xmm1
@@ -23039,7 +23305,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,69,15,58,22,225,1 ; pextrd $0x1,%xmm12,%r9d
DB 102,69,15,58,22,226,2 ; pextrd $0x2,%xmm12,%r10d
DB 102,69,15,58,22,227,3 ; pextrd $0x3,%xmm12,%r11d
- DB 102,15,111,21,58,55,1,0 ; movdqa 0x1373a(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,21,161,56,1,0 ; movdqa 0x138a1(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,68,15,254,226 ; paddd %xmm2,%xmm12
DB 102,76,15,58,22,225,1 ; pextrq $0x1,%xmm12,%rcx
DB 102,76,15,126,226 ; movq %xmm12,%rdx
@@ -23216,8 +23482,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,111,197 ; movdqa %xmm13,%xmm0
DB 102,68,15,127,108,36,48 ; movdqa %xmm13,0x30(%rsp)
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,56,64,5,130,58,1,0 ; pmulld 0x13a82(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
- DB 102,68,15,111,29,233,51,1,0 ; movdqa 0x133e9(%rip),%xmm11 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,56,64,5,233,59,1,0 ; pmulld 0x13be9(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,68,15,111,29,80,53,1,0 ; movdqa 0x13550(%rip),%xmm11 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,65,15,254,211 ; paddd %xmm11,%xmm2
DB 102,73,15,58,22,209,1 ; pextrq $0x1,%xmm2,%r9
@@ -23237,7 +23503,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
DB 102,65,15,58,22,195,2 ; pextrd $0x2,%xmm0,%r11d
DB 102,65,15,58,22,198,3 ; pextrd $0x3,%xmm0,%r14d
- DB 102,68,15,111,5,155,51,1,0 ; movdqa 0x1339b(%rip),%xmm8 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,5,2,53,1,0 ; movdqa 0x13502(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,73,15,58,22,199,1 ; pextrq $0x1,%xmm0,%r15
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -23251,7 +23517,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 73,193,239,32 ; shr $0x20,%r15
DB 243,66,15,16,4,184 ; movss (%rax,%r15,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
- DB 15,40,53,176,57,1,0 ; movaps 0x139b0(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,53,23,59,1,0 ; movaps 0x13b17(%rip),%xmm6 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,214 ; addps %xmm6,%xmm10
DB 68,15,41,148,36,176,0,0,0 ; movaps %xmm10,0xb0(%rsp)
DB 15,88,254 ; addps %xmm6,%xmm7
@@ -23264,7 +23530,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,68,15,111,214 ; movdqa %xmm6,%xmm10
DB 102,68,15,127,84,36,32 ; movdqa %xmm10,0x20(%rsp)
- DB 102,15,56,64,13,123,57,1,0 ; pmulld 0x1397b(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,56,64,13,226,58,1,0 ; pmulld 0x13ae2(%rip),%xmm1 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,73,15,58,22,231,1 ; pextrq $0x1,%xmm4,%r15
@@ -23322,11 +23588,11 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,5,79,56,1,0 ; movdqa 0x1384f(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,182,57,1,0 ; movdqa 0x139b6(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,200 ; pmulld %xmm0,%xmm1
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,5,168,49,1,0 ; movdqa 0x131a8(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,5,15,51,1,0 ; movdqa 0x1330f(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23428,7 +23694,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,68,15,111,108,36,48 ; movdqa 0x30(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,45,28,54,1,0 ; movdqa 0x1361c(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,45,131,55,1,0 ; movdqa 0x13783(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,205 ; pmulld %xmm5,%xmm1
DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,58,22,202,1 ; pextrd $0x1,%xmm1,%edx
@@ -23440,7 +23706,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,71,47,1,0 ; movdqa 0x12f47(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,29,174,48,1,0 ; movdqa 0x130ae(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
DB 102,72,15,126,210 ; movq %xmm2,%rdx
@@ -23488,7 +23754,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
DB 102,65,15,58,22,198,2 ; pextrd $0x2,%xmm0,%r14d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,254,5,117,46,1,0 ; paddd 0x12e75(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,220,47,1,0 ; paddd 0x12fdc(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
DB 137,211 ; mov %edx,%ebx
@@ -23517,10 +23783,10 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm4
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,254,197 ; paddd %xmm13,%xmm0
- DB 102,68,15,111,45,87,52,1,0 ; movdqa 0x13457(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,68,15,111,45,190,53,1,0 ; movdqa 0x135be(%rip),%xmm13 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,65,15,56,64,197 ; pmulld %xmm13,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,53,181,45,1,0 ; movdqa 0x12db5(%rip),%xmm6 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,53,28,47,1,0 ; movdqa 0x12f1c(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,202 ; movq %xmm1,%rdx
@@ -23538,7 +23804,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,61,117,45,1,0 ; movdqa 0x12d75(%rip),%xmm7 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,61,220,46,1,0 ; movdqa 0x12edc(%rip),%xmm7 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,199 ; paddd %xmm7,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23555,7 +23821,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
- DB 102,68,15,111,45,255,44,1,0 ; movdqa 0x12cff(%rip),%xmm13 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,45,102,46,1,0 ; movdqa 0x12e66(%rip),%xmm13 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,245 ; paddd %xmm13,%xmm6
DB 102,72,15,58,22,241,1 ; pextrq $0x1,%xmm6,%rcx
DB 102,72,15,126,242 ; movq %xmm6,%rdx
@@ -23634,7 +23900,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,111,76,36,48 ; movdqa 0x30(%rsp),%xmm9
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,254,194 ; paddd %xmm2,%xmm0
- DB 102,15,111,29,13,50,1,0 ; movdqa 0x1320d(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,116,51,1,0 ; movdqa 0x13374(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,195 ; pmulld %xmm3,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,69,15,111,213 ; movdqa %xmm13,%xmm10
@@ -23655,7 +23921,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,45,46,43,1,0 ; movdqa 0x12b2e(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,45,149,44,1,0 ; movdqa 0x12c95(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23743,7 +24009,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,225,1 ; pextrd $0x1,%xmm4,%r9d
DB 102,65,15,58,22,226,2 ; pextrd $0x2,%xmm4,%r10d
DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d
- DB 102,68,15,111,13,106,41,1,0 ; movdqa 0x1296a(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,13,209,42,1,0 ; movdqa 0x12ad1(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
DB 102,72,15,126,226 ; movq %xmm4,%rdx
@@ -23825,7 +24091,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,76,36,48 ; paddd 0x30(%rsp),%xmm1
DB 102,65,15,56,64,205 ; pmulld %xmm13,%xmm1
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,37,164,39,1,0 ; movdqa 0x127a4(%rip),%xmm12 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,37,11,41,1,0 ; movdqa 0x1290b(%rip),%xmm12 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23843,7 +24109,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d
DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d
DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d
- DB 102,15,111,29,99,39,1,0 ; movdqa 0x12763(%rip),%xmm3 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,29,202,40,1,0 ; movdqa 0x128ca(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,202 ; movq %xmm1,%rdx
@@ -23912,9 +24178,9 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,254,116,36,16 ; paddd 0x10(%rsp),%xmm14
DB 102,15,111,68,36,48 ; movdqa 0x30(%rsp),%xmm0
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
- DB 102,15,56,64,5,100,44,1,0 ; pmulld 0x12c64(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,56,64,5,203,45,1,0 ; pmulld 0x12dcb(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,5,200,37,1,0 ; paddd 0x125c8(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,5,47,39,1,0 ; paddd 0x1272f(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
DB 137,213 ; mov %edx,%ebp
@@ -23947,8 +24213,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
DB 102,68,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm14
- DB 102,68,15,56,64,53,173,43,1,0 ; pmulld 0x12bad(%rip),%xmm14 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
- DB 102,15,111,5,21,37,1,0 ; movdqa 0x12515(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,56,64,53,20,45,1,0 ; pmulld 0x12d14(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,5,124,38,1,0 ; movdqa 0x1267c(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -24029,7 +24295,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,144,35,1,0 ; movaps 0x12390(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,247,36,1,0 ; movaps 0x124f7(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 76,137,194 ; mov %r8,%rdx
DB 72,139,76,36,112 ; mov 0x70(%rsp),%rcx
DB 76,139,68,36,120 ; mov 0x78(%rsp),%r8
@@ -24077,13 +24343,13 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 19d0b <_sk_start_pipeline_sse2+0xeb>
+ DB 115,110 ; jae 1a184 <_sk_start_pipeline_sse2+0xeb>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,43 ; ja 19cea <_sk_start_pipeline_sse2+0xca>
+ DB 119,43 ; ja 1a163 <_sk_start_pipeline_sse2+0xca>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -24095,17 +24361,17 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 19cc6 <_sk_start_pipeline_sse2+0xa6>
+ DB 118,220 ; jbe 1a13f <_sk_start_pipeline_sse2+0xa6>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 19cff <_sk_start_pipeline_sse2+0xdf>
+ DB 116,13 ; je 1a178 <_sk_start_pipeline_sse2+0xdf>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 19caf <_sk_start_pipeline_sse2+0x8f>
+ DB 117,164 ; jne 1a128 <_sk_start_pipeline_sse2+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -24136,7 +24402,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,235,33,1,0 ; movaps 0x121eb(%rip),%xmm2 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,40,21,82,35,1,0 ; movaps 0x12352(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -24145,7 +24411,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,218,33,1,0 ; movaps 0x121da(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,65,35,1,0 ; movaps 0x12341(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -24163,14 +24429,14 @@ _sk_dither_sse2 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,168,33,1,0 ; movdqa 0x121a8(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,15,35,1,0 ; movdqa 0x1230f(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,148,33,1,0 ; movdqa 0x12194(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xe6f>
- DB 102,68,15,111,45,155,33,1,0 ; movdqa 0x1219b(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,37,251,34,1,0 ; movdqa 0x122fb(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63>
+ DB 102,68,15,111,45,2,35,1,0 ; movdqa 0x12302(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -24186,8 +24452,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,86,33,1,0 ; mulps 0x12156(%rip),%xmm8 # 2bfb0 <_sk_overlay_sse2_8bit+0xe8f>
- DB 68,15,88,5,94,33,1,0 ; addps 0x1215e(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0xe9f>
+ DB 68,15,89,5,189,34,1,0 ; mulps 0x122bd(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83>
+ DB 68,15,88,5,197,34,1,0 ; addps 0x122c5(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -24225,7 +24491,7 @@ _sk_uniform_color_sse2 LABEL PROC
PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,148,32,1,0 ; movaps 0x12094(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,251,33,1,0 ; movaps 0x121fb(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -24234,7 +24500,7 @@ _sk_black_color_sse2 LABEL PROC
PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,128,32,1,0 ; movaps 0x12080(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,5,231,33,1,0 ; movaps 0x121e7(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -24272,7 +24538,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,48,32,1,0 ; movaps 0x12030(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,151,33,1,0 ; movaps 0x12197(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24295,7 +24561,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,227,31,1,0 ; movaps 0x11fe3(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,74,33,1,0 ; movaps 0x1214a(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -24336,7 +24602,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,119,31,1,0 ; movaps 0x11f77(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,222,32,1,0 ; movaps 0x120de(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -24347,7 +24613,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,87,31,1,0 ; movaps 0x11f57(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,190,32,1,0 ; movaps 0x120be(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -24362,7 +24628,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,42,31,1,0 ; movaps 0x11f2a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,145,32,1,0 ; movaps 0x12091(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24380,7 +24646,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,238,30,1,0 ; movaps 0x11eee(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,85,32,1,0 ; movaps 0x12055(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -24404,7 +24670,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,178,30,1,0 ; movaps 0x11eb2(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,25,32,1,0 ; movaps 0x12019(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -24440,9 +24706,14 @@ _sk_multiply_sse2 LABEL PROC
PUBLIC _sk_plus__sse2
_sk_plus__sse2 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 68,15,40,5,154,31,1,0 ; movaps 0x11f9a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 65,15,93,208 ; minps %xmm8,%xmm2
DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 65,15,93,216 ; minps %xmm8,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24473,7 +24744,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,215,29,1,0 ; movaps 0x11dd7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,38,31,1,0 ; movaps 0x11f26(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -24519,7 +24790,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,50,29,1,0 ; movaps 0x11d32(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,129,30,1,0 ; movaps 0x11e81(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24551,7 +24822,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,199,28,1,0 ; movaps 0x11cc7(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,22,30,1,0 ; movaps 0x11e16(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24586,7 +24857,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,81,28,1,0 ; movaps 0x11c51(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,160,29,1,0 ; movaps 0x11da0(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24612,7 +24883,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,1,28,1,0 ; movaps 0x11c01(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,80,29,1,0 ; movaps 0x11d50(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24623,7 +24894,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,13,228,27,1,0 ; movaps 0x11be4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,51,29,1,0 ; movaps 0x11d33(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24716,7 +24987,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,140,26,1,0 ; movaps 0x11a8c(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,219,27,1,0 ; movaps 0x11bdb(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -24807,7 +25078,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,50,25,1,0 ; movaps 0x11932(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,29,129,26,1,0 ; movaps 0x11a81(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -24894,7 +25165,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,237,23,1,0 ; movaps 0x117ed(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,60,25,1,0 ; movaps 0x1193c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24984,7 +25255,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,151,22,1,0 ; movaps 0x11697(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,230,23,1,0 ; movaps 0x117e6(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24997,10 +25268,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,193,22,1,0 ; movaps 0x116c1(%rip),%xmm14 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,53,16,24,1,0 ; movaps 0x11810(%rip),%xmm14 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,193,22,1,0 ; movaps 0x116c1(%rip),%xmm10 # 2bfe0 <_sk_overlay_sse2_8bit+0xebf>
+ DB 68,15,40,21,16,24,1,0 ; movaps 0x11810(%rip),%xmm10 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -25145,7 +25416,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,77,20,1,0 ; movaps 0x1144d(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,156,21,1,0 ; movaps 0x1159c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -25193,12 +25464,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,10,20,1,0 ; movaps 0x1140a(%rip),%xmm15 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,61,89,21,1,0 ; movaps 0x11559(%rip),%xmm15 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,15,20,1,0 ; movaps 0x1140f(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,5,94,21,1,0 ; movaps 0x1155e(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,17,20,1,0 ; movaps 0x11411(%rip),%xmm14 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,53,96,21,1,0 ; movaps 0x11560(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -25376,14 +25647,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,94,17,1,0 ; movaps 0x1115e(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,5,173,18,1,0 ; movaps 0x112ad(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,96,17,1,0 ; movaps 0x11160(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,13,175,18,1,0 ; movaps 0x112af(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,95,17,1,0 ; movaps 0x1115f(%rip),%xmm12 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,37,174,18,1,0 ; movaps 0x112ae(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -25428,7 +25699,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,20,16,1,0 ; movaps 0x11014(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,99,17,1,0 ; movaps 0x11163(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -25529,14 +25800,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,28,15,1,0 ; movaps 0x10f1c(%rip),%xmm13 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,45,107,16,1,0 ; movaps 0x1106b(%rip),%xmm13 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,28,15,1,0 ; movaps 0x10f1c(%rip),%xmm14 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,53,107,16,1,0 ; movaps 0x1106b(%rip),%xmm14 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,24,15,1,0 ; movaps 0x10f18(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,29,103,16,1,0 ; movaps 0x11067(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -25544,7 +25815,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,84,14,1,0 ; movaps 0x10e54(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,163,15,1,0 ; movaps 0x10fa3(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -25680,15 +25951,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,214,12,1,0 ; movaps 0x10cd6(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,37,37,14,1,0 ; movaps 0x10e25(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,214,12,1,0 ; movaps 0x10cd6(%rip),%xmm13 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,45,37,14,1,0 ; movaps 0x10e25(%rip),%xmm13 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,210,12,1,0 ; movaps 0x10cd2(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
- DB 68,15,40,5,42,12,1,0 ; movaps 0x10c2a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,29,33,14,1,0 ; movaps 0x10e21(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,5,121,13,1,0 ; movaps 0x10d79(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -25828,10 +26099,10 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,228,0,0,0 ; jne 1b633 <_sk_srcover_rgba_8888_sse2+0x104>
+ DB 15,133,228,0,0,0 ; jne 1bac4 <_sk_srcover_rgba_8888_sse2+0x104>
DB 243,69,15,111,4,129 ; movdqu (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,53,192,10,1,0 ; movdqa 0x10ac0(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,53,15,12,1,0 ; movdqa 0x10c0f(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -25845,9 +26116,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,208,9,1,0 ; movaps 0x109d0(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,31,11,1,0 ; movaps 0x10b1f(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,164,10,1,0 ; movaps 0x10aa4(%rip),%xmm12 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,37,243,11,1,0 ; movaps 0x10bf3(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -25873,7 +26144,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,84 ; jne 1b66d <_sk_srcover_rgba_8888_sse2+0x13e>
+ DB 117,84 ; jne 1bafe <_sk_srcover_rgba_8888_sse2+0x13e>
DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -25884,32 +26155,32 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,90 ; je 1b69a <_sk_srcover_rgba_8888_sse2+0x16b>
+ DB 116,90 ; je 1bb2b <_sk_srcover_rgba_8888_sse2+0x16b>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1b662 <_sk_srcover_rgba_8888_sse2+0x133>
+ DB 116,23 ; je 1baf3 <_sk_srcover_rgba_8888_sse2+0x133>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,0,255,255,255 ; jne 1b555 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 15,133,0,255,255,255 ; jne 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,69,15,18,4,129 ; movlpd (%r9,%rax,4),%xmm8
- DB 233,232,254,255,255 ; jmpq 1b555 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,232,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,43 ; je 1b6a5 <_sk_srcover_rgba_8888_sse2+0x176>
+ DB 116,43 ; je 1bb36 <_sk_srcover_rgba_8888_sse2+0x176>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1b692 <_sk_srcover_rgba_8888_sse2+0x163>
+ DB 116,18 ; je 1bb23 <_sk_srcover_rgba_8888_sse2+0x163>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,153 ; jne 1b61f <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 117,153 ; jne 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,126,76,129,8 ; movd %xmm1,0x8(%r9,%rax,4)
DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4)
- DB 235,133 ; jmp 1b61f <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 235,133 ; jmp 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,69,15,110,4,129 ; movd (%r9,%rax,4),%xmm8
- DB 233,176,254,255,255 ; jmpq 1b555 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,176,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4)
- DB 233,111,255,255,255 ; jmpq 1b61f <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 233,111,255,255,255 ; jmpq 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -25923,7 +26194,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,160,8,1,0 ; movaps 0x108a0(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,239,9,1,0 ; movaps 0x109ef(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -25933,7 +26204,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,133,8,1,0 ; minps 0x10885(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,29,212,9,1,0 ; minps 0x109d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -25942,7 +26213,7 @@ _sk_clamp_a_sse2 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
- DB 15,93,61,113,8,1,0 ; minps 0x10871(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,61,192,9,1,0 ; minps 0x109c0(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -25971,7 +26242,7 @@ _sk_swap_rb_sse2 LABEL PROC
PUBLIC _sk_invert_sse2
_sk_invert_sse2 LABEL PROC
- DB 68,15,40,5,45,8,1,0 ; movaps 0x1082d(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,124,9,1,0 ; movaps 0x1097c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -26023,7 +26294,7 @@ _sk_premul_dst_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,183,7,1,0 ; movaps 0x107b7(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,6,9,1,0 ; movaps 0x10906(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -26035,20 +26306,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,130,8,1,0 ; movaps 0x10882(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,5,209,9,1,0 ; movaps 0x109d1(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,250,7,1,0 ; movaps 0x107fa(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,13,73,9,1,0 ; movaps 0x10949(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,106,8,1,0 ; movaps 0x1086a(%rip),%xmm10 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,21,185,9,1,0 ; movaps 0x109b9(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,106,8,1,0 ; movaps 0x1086a(%rip),%xmm11 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,29,185,9,1,0 ; movaps 0x109b9(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,110,8,1,0 ; movaps 0x1086e(%rip),%xmm12 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,37,189,9,1,0 ; movaps 0x109bd(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -26082,20 +26353,20 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
- DB 68,15,40,5,191,7,1,0 ; movaps 0x107bf(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,5,14,9,1,0 ; movaps 0x1090e(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,236 ; movaps %xmm4,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,220 ; movaps %xmm4,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,55,7,1,0 ; movaps 0x10737(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,13,134,8,1,0 ; movaps 0x10886(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,244 ; movaps %xmm4,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,167,7,1,0 ; movaps 0x107a7(%rip),%xmm10 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,21,246,8,1,0 ; movaps 0x108f6(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,167,7,1,0 ; movaps 0x107a7(%rip),%xmm11 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,29,246,8,1,0 ; movaps 0x108f6(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,171,7,1,0 ; movaps 0x107ab(%rip),%xmm12 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,37,250,8,1,0 ; movaps 0x108fa(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4
DB 68,15,84,236 ; andps %xmm4,%xmm13
DB 65,15,85,230 ; andnps %xmm14,%xmm4
@@ -26130,22 +26401,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,56,7,1,0 ; movaps 0x10738(%rip),%xmm8 # 2c0a0 <_sk_overlay_sse2_8bit+0xf7f>
+ DB 68,15,40,5,135,8,1,0 ; movaps 0x10887(%rip),%xmm8 # 2c680 <_sk_overlay_sse2_8bit+0xf73>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,56,7,1,0 ; movaps 0x10738(%rip),%xmm9 # 2c0b0 <_sk_overlay_sse2_8bit+0xf8f>
+ DB 68,15,40,13,135,8,1,0 ; movaps 0x10887(%rip),%xmm9 # 2c690 <_sk_overlay_sse2_8bit+0xf83>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,56,7,1,0 ; movaps 0x10738(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0xf9f>
+ DB 68,15,40,21,135,8,1,0 ; movaps 0x10887(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,56,7,1,0 ; movaps 0x10738(%rip),%xmm11 # 2c0d0 <_sk_overlay_sse2_8bit+0xfaf>
+ DB 68,15,40,29,135,8,1,0 ; movaps 0x10887(%rip),%xmm11 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,60,7,1,0 ; movaps 0x1073c(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0xfbf>
+ DB 68,15,40,37,139,8,1,0 ; movaps 0x1088b(%rip),%xmm12 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,56,7,1,0 ; movaps 0x10738(%rip),%xmm15 # 2c0f0 <_sk_overlay_sse2_8bit+0xfcf>
+ DB 68,15,40,61,135,8,1,0 ; movaps 0x10887(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -26185,15 +26456,17 @@ PUBLIC _sk_rgb_to_hsl_sse2
_sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,95,194 ; maxps %xmm2,%xmm0
DB 69,15,40,208 ; movaps %xmm8,%xmm10
- DB 69,15,95,209 ; maxps %xmm9,%xmm10
- DB 68,15,95,210 ; maxps %xmm2,%xmm10
+ DB 68,15,95,208 ; maxps %xmm0,%xmm10
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,93,194 ; minps %xmm2,%xmm0
DB 69,15,40,216 ; movaps %xmm8,%xmm11
- DB 69,15,93,217 ; minps %xmm9,%xmm11
- DB 68,15,93,218 ; minps %xmm2,%xmm11
+ DB 68,15,93,216 ; minps %xmm0,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,1,5,1,0 ; movaps 0x10501(%rip),%xmm13 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,45,74,6,1,0 ; movaps 0x1064a(%rip),%xmm13 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -26202,30 +26475,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,103,6,1,0 ; andps 0x10667(%rip),%xmm14 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 68,15,84,53,176,7,1,0 ; andps 0x107b0(%rip),%xmm14 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,90,6,1,0 ; movaps 0x1065a(%rip),%xmm12 # 2c110 <_sk_overlay_sse2_8bit+0xfef>
+ DB 68,15,40,37,163,7,1,0 ; movaps 0x107a3(%rip),%xmm12 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,86,6,1,0 ; addps 0x10656(%rip),%xmm8 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 68,15,88,5,159,7,1,0 ; addps 0x1079f(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,71,6,1,0 ; mulps 0x10647(%rip),%xmm0 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 15,89,5,144,7,1,0 ; mulps 0x10790(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,90,4,1,0 ; movaps 0x1045a(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,163,5,1,0 ; movaps 0x105a3(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -26248,7 +26521,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,5,4,1,0 ; movaps 0x10405(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,78,5,1,0 ; movaps 0x1054e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -26265,28 +26538,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,159,5,1,0 ; movaps 0x1059f(%rip),%xmm0 # 2c140 <_sk_overlay_sse2_8bit+0x101f>
+ DB 15,40,5,232,6,1,0 ; movaps 0x106e8(%rip),%xmm0 # 2c720 <_sk_overlay_sse2_8bit+0x1013>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,183,3,1,0 ; andps 0x103b7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,84,29,0,5,1,0 ; andps 0x10500(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,137,5,1,0 ; movaps 0x10589(%rip),%xmm13 # 2c150 <_sk_overlay_sse2_8bit+0x102f>
+ DB 68,15,40,45,210,6,1,0 ; movaps 0x106d2(%rip),%xmm13 # 2c730 <_sk_overlay_sse2_8bit+0x1023>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,73,5,1,0 ; movaps 0x10549(%rip),%xmm2 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 15,40,21,146,6,1,0 ; movaps 0x10692(%rip),%xmm2 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,9,5,1,0 ; movaps 0x10509(%rip),%xmm1 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 15,40,13,82,6,1,0 ; movaps 0x10652(%rip),%xmm1 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,31,5,1,0 ; movaps 0x1051f(%rip),%xmm5 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 15,40,45,104,6,1,0 ; movaps 0x10668(%rip),%xmm5 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -26309,7 +26582,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,20,3,1,0 ; andps 0x10314(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,84,29,93,4,1,0 ; andps 0x1045d(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -26339,12 +26612,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,141,4,1,0 ; addps 0x1048d(%rip),%xmm6 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 15,88,53,214,5,1,0 ; addps 0x105d6(%rip),%xmm6 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,136,2,1,0 ; andps 0x10288(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,84,29,209,3,1,0 ; andps 0x103d1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -26405,13 +26678,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,61 ; jne 1bded <_sk_scale_u8_sse2+0x55>
+ DB 117,61 ; jne 1c284 <_sk_scale_u8_sse2+0x55>
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,87,2,1,0 ; pand 0x10257(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,160,3,1,0 ; pand 0x103a0(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,155,3,1,0 ; mulps 0x1039b(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,228,4,1,0 ; mulps 0x104e4(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -26422,12 +26695,12 @@ _sk_scale_u8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,61 ; je 1be37 <_sk_scale_u8_sse2+0x9f>
+ DB 116,61 ; je 1c2ce <_sk_scale_u8_sse2+0x9f>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1be1c <_sk_scale_u8_sse2+0x84>
+ DB 116,23 ; je 1c2b3 <_sk_scale_u8_sse2+0x84>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,181 ; jne 1bdc0 <_sk_scale_u8_sse2+0x28>
+ DB 117,181 ; jne 1c257 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -26436,10 +26709,77 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 235,137 ; jmp 1bdc0 <_sk_scale_u8_sse2+0x28>
+ DB 235,137 ; jmp 1c257 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,122,255,255,255 ; jmpq 1bdc0 <_sk_scale_u8_sse2+0x28>
+ DB 233,122,255,255,255 ; jmpq 1c257 <_sk_scale_u8_sse2+0x28>
+
+PUBLIC _sk_scale_565_sse2
+_sk_scale_565_sse2 LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,173,0,0,0 ; jne 1c3a9 <_sk_scale_565_sse2+0xcc>
+ DB 243,71,15,126,20,89 ; movq (%r9,%r11,2),%xmm10
+ DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
+ DB 102,68,15,111,5,80,4,1,0 ; movdqa 0x10450(%rip),%xmm8 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,69,15,219,194 ; pand %xmm10,%xmm8
+ DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
+ DB 68,15,89,5,79,4,1,0 ; mulps 0x1044f(%rip),%xmm8 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,68,15,111,13,86,4,1,0 ; movdqa 0x10456(%rip),%xmm9 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,69,15,219,202 ; pand %xmm10,%xmm9
+ DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
+ DB 68,15,89,13,85,4,1,0 ; mulps 0x10455(%rip),%xmm9 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,21,92,4,1,0 ; pand 0x1045c(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
+ DB 68,15,89,21,96,4,1,0 ; mulps 0x10460(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,40,219 ; movaps %xmm3,%xmm11
+ DB 68,15,194,223,1 ; cmpltps %xmm7,%xmm11
+ DB 69,15,40,225 ; movaps %xmm9,%xmm12
+ DB 69,15,93,226 ; minps %xmm10,%xmm12
+ DB 69,15,40,232 ; movaps %xmm8,%xmm13
+ DB 69,15,93,236 ; minps %xmm12,%xmm13
+ DB 69,15,40,225 ; movaps %xmm9,%xmm12
+ DB 69,15,95,226 ; maxps %xmm10,%xmm12
+ DB 69,15,40,240 ; movaps %xmm8,%xmm14
+ DB 69,15,95,244 ; maxps %xmm12,%xmm14
+ DB 69,15,84,235 ; andps %xmm11,%xmm13
+ DB 69,15,85,222 ; andnps %xmm14,%xmm11
+ DB 69,15,86,221 ; orps %xmm13,%xmm11
+ DB 68,15,89,192 ; mulps %xmm0,%xmm8
+ DB 68,15,89,201 ; mulps %xmm1,%xmm9
+ DB 68,15,89,210 ; mulps %xmm2,%xmm10
+ DB 68,15,89,219 ; mulps %xmm3,%xmm11
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 65,15,40,201 ; movaps %xmm9,%xmm1
+ DB 65,15,40,210 ; movaps %xmm10,%xmm2
+ DB 65,15,40,219 ; movaps %xmm11,%xmm3
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,3 ; and $0x3,%r10b
+ DB 65,128,250,1 ; cmp $0x1,%r10b
+ DB 116,59 ; je 1c3f1 <_sk_scale_565_sse2+0x114>
+ DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
+ DB 65,128,250,2 ; cmp $0x2,%r10b
+ DB 116,27 ; je 1c3dc <_sk_scale_565_sse2+0xff>
+ DB 65,128,250,3 ; cmp $0x3,%r10b
+ DB 15,133,60,255,255,255 ; jne 1c307 <_sk_scale_565_sse2+0x2a>
+ DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10
+ DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8
+ DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
+ DB 242,69,15,16,208 ; movsd %xmm8,%xmm10
+ DB 233,22,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a>
+ DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
+ DB 102,68,15,110,208 ; movd %eax,%xmm10
+ DB 233,7,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -26470,13 +26810,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,81 ; jne 1bee7 <_sk_lerp_u8_sse2+0x69>
+ DB 117,81 ; jne 1c4a1 <_sk_lerp_u8_sse2+0x69>
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,113,1,1,0 ; pand 0x10171(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,151,1,1,0 ; pand 0x10197(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,181,2,1,0 ; mulps 0x102b5(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,219,2,1,0 ; mulps 0x102db(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -26494,12 +26834,12 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,64 ; je 1bf34 <_sk_lerp_u8_sse2+0xb6>
+ DB 116,64 ; je 1c4ee <_sk_lerp_u8_sse2+0xb6>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1bf16 <_sk_lerp_u8_sse2+0x98>
+ DB 116,23 ; je 1c4d0 <_sk_lerp_u8_sse2+0x98>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,161 ; jne 1bea6 <_sk_lerp_u8_sse2+0x28>
+ DB 117,161 ; jne 1c460 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -26508,10 +26848,10 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 233,114,255,255,255 ; jmpq 1bea6 <_sk_lerp_u8_sse2+0x28>
+ DB 233,114,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,99,255,255,255 ; jmpq 1bea6 <_sk_lerp_u8_sse2+0x28>
+ DB 233,99,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -26523,72 +26863,76 @@ _sk_lerp_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,156,0,0,0 ; jne 1bffe <_sk_lerp_565_sse2+0xbb>
- DB 243,71,15,126,12,89 ; movq (%r9,%r11,2),%xmm9
- DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
- DB 102,68,15,111,5,10,2,1,0 ; movdqa 0x1020a(%rip),%xmm8 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
- DB 102,69,15,219,193 ; pand %xmm9,%xmm8
- DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,9,2,1,0 ; mulps 0x10209(%rip),%xmm8 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,68,15,111,21,16,2,1,0 ; movdqa 0x10210(%rip),%xmm10 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
- DB 102,69,15,219,209 ; pand %xmm9,%xmm10
- DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,15,2,1,0 ; mulps 0x1020f(%rip),%xmm10 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,68,15,219,13,22,2,1,0 ; pand 0x10216(%rip),%xmm9 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,133,173,0,0,0 ; jne 1c5c9 <_sk_lerp_565_sse2+0xcc>
+ DB 243,71,15,126,4,89 ; movq (%r9,%r11,2),%xmm8
+ DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
+ DB 102,68,15,111,13,48,2,1,0 ; movdqa 0x10230(%rip),%xmm9 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,69,15,219,200 ; pand %xmm8,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,26,2,1,0 ; mulps 0x1021a(%rip),%xmm9 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 68,15,89,13,47,2,1,0 ; mulps 0x1022f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,68,15,111,21,54,2,1,0 ; movdqa 0x10236(%rip),%xmm10 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,69,15,219,208 ; pand %xmm8,%xmm10
+ DB 69,15,91,218 ; cvtdq2ps %xmm10,%xmm11
+ DB 68,15,89,29,53,2,1,0 ; mulps 0x10235(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,5,60,2,1,0 ; pand 0x1023c(%rip),%xmm8 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
+ DB 68,15,89,5,64,2,1,0 ; mulps 0x10240(%rip),%xmm8 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,40,211 ; movaps %xmm3,%xmm10
+ DB 68,15,194,215,1 ; cmpltps %xmm7,%xmm10
+ DB 69,15,40,227 ; movaps %xmm11,%xmm12
+ DB 15,92,205 ; subps %xmm5,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 69,15,93,216 ; minps %xmm8,%xmm11
+ DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 65,15,89,193 ; mulps %xmm9,%xmm0
+ DB 69,15,93,203 ; minps %xmm11,%xmm9
+ DB 69,15,95,224 ; maxps %xmm8,%xmm12
+ DB 69,15,95,236 ; maxps %xmm12,%xmm13
+ DB 69,15,84,202 ; andps %xmm10,%xmm9
+ DB 69,15,85,213 ; andnps %xmm13,%xmm10
+ DB 69,15,86,209 ; orps %xmm9,%xmm10
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,92,205 ; subps %xmm5,%xmm1
- DB 65,15,89,202 ; mulps %xmm10,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,92,214 ; subps %xmm6,%xmm2
- DB 65,15,89,209 ; mulps %xmm9,%xmm2
+ DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,92,223 ; subps %xmm7,%xmm3
- DB 68,15,89,195 ; mulps %xmm3,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,88,215 ; addps %xmm7,%xmm10
- DB 65,15,89,217 ; mulps %xmm9,%xmm3
+ DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,95,211 ; maxps %xmm3,%xmm10
- DB 69,15,95,194 ; maxps %xmm10,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1c046 <_sk_lerp_565_sse2+0x103>
- DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
+ DB 116,59 ; je 1c611 <_sk_lerp_565_sse2+0x114>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,27 ; je 1c031 <_sk_lerp_565_sse2+0xee>
+ DB 116,27 ; je 1c5fc <_sk_lerp_565_sse2+0xff>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,77,255,255,255 ; jne 1bf6d <_sk_lerp_565_sse2+0x2a>
+ DB 15,133,60,255,255,255 ; jne 1c527 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 102,69,15,112,200,69 ; pshufd $0x45,%xmm8,%xmm9
- DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8
- DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 242,69,15,16,200 ; movsd %xmm8,%xmm9
- DB 233,39,255,255,255 ; jmpq 1bf6d <_sk_lerp_565_sse2+0x2a>
+ DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
+ DB 102,71,15,110,12,89 ; movd (%r9,%r11,2),%xmm9
+ DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
+ DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
+ DB 233,22,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
- DB 102,68,15,110,200 ; movd %eax,%xmm9
- DB 233,24,255,255,255 ; jmpq 1bf6d <_sk_lerp_565_sse2+0x2a>
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 233,7,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,36,1,0,0 ; jne 1c187 <_sk_load_tables_sse2+0x132>
+ DB 15,133,36,1,0,0 ; jne 1c752 <_sk_load_tables_sse2+0x132>
DB 243,69,15,111,12,145 ; movdqu (%r9,%rdx,4),%xmm9
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,169,255,0,0 ; movdqa 0xffa9(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,111,5,190,255,0,0 ; movdqa 0xffbe(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -26644,7 +26988,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,242,255,0,0 ; mulps 0xfff2(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,7,0,1,0 ; mulps 0x10007(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -26653,18 +26997,18 @@ _sk_load_tables_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 1c1c1 <_sk_load_tables_sse2+0x16c>
+ DB 116,45 ; je 1c78c <_sk_load_tables_sse2+0x16c>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1c1b6 <_sk_load_tables_sse2+0x161>
+ DB 116,23 ; je 1c781 <_sk_load_tables_sse2+0x161>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,192,254,255,255 ; jne 1c069 <_sk_load_tables_sse2+0x14>
+ DB 15,133,192,254,255,255 ; jne 1c634 <_sk_load_tables_sse2+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,145 ; movlpd (%r9,%rdx,4),%xmm9
- DB 233,168,254,255,255 ; jmpq 1c069 <_sk_load_tables_sse2+0x14>
+ DB 233,168,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14>
DB 102,69,15,110,12,145 ; movd (%r9,%rdx,4),%xmm9
- DB 233,157,254,255,255 ; jmpq 1c069 <_sk_load_tables_sse2+0x14>
+ DB 233,157,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -26672,7 +27016,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,101,1,0,0 ; jne 1c347 <_sk_load_tables_u16_be_sse2+0x17b>
+ DB 15,133,101,1,0,0 ; jne 1c912 <_sk_load_tables_u16_be_sse2+0x17b>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 102,67,15,16,76,81,16 ; movupd 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -26684,7 +27028,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,199,255,0,0 ; movdqa 0xffc7(%rip),%xmm10 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,21,220,255,0,0 ; movdqa 0xffdc(%rip),%xmm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -26746,7 +27090,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,194,254,0,0 ; mulps 0xfec2(%rip),%xmm3 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 15,89,29,215,254,0,0 ; mulps 0xfed7(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -26754,17 +27098,17 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1c364 <_sk_load_tables_u16_be_sse2+0x198>
+ DB 117,17 ; jne 1c92f <_sk_load_tables_u16_be_sse2+0x198>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,139,254,255,255 ; jmpq 1c1ef <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,139,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,118,254,255,255 ; jb 1c1ef <_sk_load_tables_u16_be_sse2+0x23>
+ DB 15,130,118,254,255,255 ; jb 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
DB 242,67,15,16,76,81,16 ; movsd 0x10(%r9,%r10,2),%xmm1
- DB 233,106,254,255,255 ; jmpq 1c1ef <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,106,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -26772,7 +27116,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,84,1,0,0 ; jne 1c4eb <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ DB 15,133,84,1,0,0 ; jne 1cab6 <_sk_load_tables_rgb_u16_be_sse2+0x166>
DB 243,71,15,111,28,81 ; movdqu (%r9,%r10,2),%xmm11
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -26787,7 +27131,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,1,254,0,0 ; movdqa 0xfe01(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,5,22,254,0,0 ; movdqa 0xfe16(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -26843,7 +27187,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,140,250,0,0 ; movaps 0xfa8c(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,161,250,0,0 ; movaps 0xfaa1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -26852,21 +27196,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,71,15,196,92,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 1c511 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ DB 117,14 ; jne 1cadc <_sk_load_tables_rgb_u16_be_sse2+0x18c>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
- DB 233,172,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,172,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,71,15,110,84,81,6 ; movd 0x6(%r9,%r10,2),%xmm10
DB 102,71,15,196,84,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 1c542 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ DB 114,24 ; jb 1cb0d <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,123,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,123,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,114,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,114,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -26875,7 +27219,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,245,250,0,0 ; movaps 0xfaf5(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,10,251,0,0 ; movaps 0xfb0a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -26903,7 +27247,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,159,251,0,0 ; movaps 0xfb9f(%rip),%xmm10 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,21,180,251,0,0 ; movaps 0xfbb4(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27022,7 +27366,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,215,249,0,0 ; movaps 0xf9d7(%rip),%xmm10 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,21,236,249,0,0 ; movaps 0xf9ec(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27219,15 +27563,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,171,247,0,0 ; mulps 0xf7ab(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,179,247,0,0 ; andps 0xf7b3(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,219,244,0,0 ; orps 0xf4db(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,179,247,0,0 ; addps 0xf7b3(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,187,247,0,0 ; movaps 0xf7bb(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,192,247,0,0 ; mulps 0xf7c0(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,200,247,0,0 ; andps 0xf7c8(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,240,244,0,0 ; orps 0xf4f0(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,200,247,0,0 ; addps 0xf7c8(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,208,247,0,0 ; movaps 0xf7d0(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,187,247,0,0 ; addps 0xf7bb(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,195,247,0,0 ; movaps 0xf7c3(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,208,247,0,0 ; addps 0xf7d0(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,216,247,0,0 ; movaps 0xf7d8(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27235,22 +27579,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,157,244,0,0 ; movaps 0xf49d(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,178,244,0,0 ; movaps 0xf4b2(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,145,247,0,0 ; addps 0xf791(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,153,247,0,0 ; movaps 0xf799(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,166,247,0,0 ; addps 0xf7a6(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,153,247,0,0 ; movaps 0xf799(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,157,247,0,0 ; movaps 0xf79d(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,178,247,0,0 ; movaps 0xf7b2(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,157,247,0,0 ; mulps 0xf79d(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,178,247,0,0 ; mulps 0xf7b2(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27284,15 +27628,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,109,246,0,0 ; mulps 0xf66d(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,117,246,0,0 ; andps 0xf675(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,157,243,0,0 ; orps 0xf39d(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,117,246,0,0 ; addps 0xf675(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,125,246,0,0 ; movaps 0xf67d(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,130,246,0,0 ; mulps 0xf682(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,138,246,0,0 ; andps 0xf68a(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,178,243,0,0 ; orps 0xf3b2(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,138,246,0,0 ; addps 0xf68a(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,146,246,0,0 ; movaps 0xf692(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,125,246,0,0 ; addps 0xf67d(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,133,246,0,0 ; movaps 0xf685(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,146,246,0,0 ; addps 0xf692(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,154,246,0,0 ; movaps 0xf69a(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27300,22 +27644,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,95,243,0,0 ; movaps 0xf35f(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,116,243,0,0 ; movaps 0xf374(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,83,246,0,0 ; addps 0xf653(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,91,246,0,0 ; movaps 0xf65b(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,104,246,0,0 ; addps 0xf668(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,91,246,0,0 ; movaps 0xf65b(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,95,246,0,0 ; movaps 0xf65f(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,116,246,0,0 ; movaps 0xf674(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,95,246,0,0 ; mulps 0xf65f(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,116,246,0,0 ; mulps 0xf674(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27349,15 +27693,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,47,245,0,0 ; mulps 0xf52f(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,55,245,0,0 ; andps 0xf537(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,95,242,0,0 ; orps 0xf25f(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,55,245,0,0 ; addps 0xf537(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,63,245,0,0 ; movaps 0xf53f(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,68,245,0,0 ; mulps 0xf544(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,76,245,0,0 ; andps 0xf54c(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,116,242,0,0 ; orps 0xf274(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,76,245,0,0 ; addps 0xf54c(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,84,245,0,0 ; movaps 0xf554(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,63,245,0,0 ; addps 0xf53f(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,71,245,0,0 ; movaps 0xf547(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,84,245,0,0 ; addps 0xf554(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,92,245,0,0 ; movaps 0xf55c(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27365,22 +27709,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,33,242,0,0 ; movaps 0xf221(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,54,242,0,0 ; movaps 0xf236(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,21,245,0,0 ; addps 0xf515(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,29,245,0,0 ; movaps 0xf51d(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,42,245,0,0 ; addps 0xf52a(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,29,245,0,0 ; movaps 0xf51d(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,33,245,0,0 ; movaps 0xf521(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,54,245,0,0 ; movaps 0xf536(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,33,245,0,0 ; mulps 0xf521(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,54,245,0,0 ; mulps 0xf536(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27414,15 +27758,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,241,243,0,0 ; mulps 0xf3f1(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,249,243,0,0 ; andps 0xf3f9(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,33,241,0,0 ; orps 0xf121(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,249,243,0,0 ; addps 0xf3f9(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,1,244,0,0 ; movaps 0xf401(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,6,244,0,0 ; mulps 0xf406(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,14,244,0,0 ; andps 0xf40e(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,54,241,0,0 ; orps 0xf136(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,14,244,0,0 ; addps 0xf40e(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,22,244,0,0 ; movaps 0xf416(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,1,244,0,0 ; addps 0xf401(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,9,244,0,0 ; movaps 0xf409(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,22,244,0,0 ; addps 0xf416(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,30,244,0,0 ; movaps 0xf41e(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27430,22 +27774,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,227,240,0,0 ; movaps 0xf0e3(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,248,240,0,0 ; movaps 0xf0f8(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,215,243,0,0 ; addps 0xf3d7(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,223,243,0,0 ; movaps 0xf3df(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,236,243,0,0 ; addps 0xf3ec(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,223,243,0,0 ; movaps 0xf3df(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,227,243,0,0 ; movaps 0xf3e3(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,248,243,0,0 ; movaps 0xf3f8(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,227,243,0,0 ; mulps 0xf3e3(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,248,243,0,0 ; mulps 0xf3f8(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27469,19 +27813,19 @@ _sk_gamma_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,235,242,0,0 ; mulps 0xf2eb(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,21,244,242,0,0 ; andps 0xf2f4(%rip),%xmm2 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,40,53,28,240,0,0 ; movaps 0xf01c(%rip),%xmm14 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,89,5,0,243,0,0 ; mulps 0xf300(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,21,9,243,0,0 ; andps 0xf309(%rip),%xmm2 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,40,53,49,240,0,0 ; movaps 0xf031(%rip),%xmm14 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,86,214 ; orps %xmm14,%xmm2
- DB 68,15,40,37,240,242,0,0 ; movaps 0xf2f0(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
+ DB 68,15,40,37,5,243,0,0 ; movaps 0xf305(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
DB 65,15,88,196 ; addps %xmm12,%xmm0
- DB 68,15,40,29,244,242,0,0 ; movaps 0xf2f4(%rip),%xmm11 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,40,29,9,243,0,0 ; movaps 0xf309(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,21,242,242,0,0 ; movaps 0xf2f2(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
+ DB 68,15,40,21,7,243,0,0 ; movaps 0xf307(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 68,15,40,45,246,242,0,0 ; movaps 0xf2f6(%rip),%xmm13 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,40,45,11,243,0,0 ; movaps 0xf30b(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -27493,27 +27837,27 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
- DB 68,15,40,13,198,239,0,0 ; movaps 0xefc6(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,219,239,0,0 ; movaps 0xefdb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,84,225 ; andps %xmm9,%xmm4
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,194,242,0,0 ; movaps 0xf2c2(%rip),%xmm6 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
+ DB 15,40,53,215,242,0,0 ; movaps 0xf2d7(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,216,242,0,0 ; movaps 0xf2d8(%rip),%xmm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 15,40,61,237,242,0,0 ; movaps 0xf2ed(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,184,242,0,0 ; movaps 0xf2b8(%rip),%xmm4 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 15,40,37,205,242,0,0 ; movaps 0xf2cd(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,202,242,0,0 ; movaps 0xf2ca(%rip),%xmm15 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,61,223,242,0,0 ; movaps 0xf2df(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,38,242,0,0 ; mulps 0xf226(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,13,47,242,0,0 ; andps 0xf22f(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
+ DB 15,89,5,59,242,0,0 ; mulps 0xf23b(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,13,68,242,0,0 ; andps 0xf244(%rip),%xmm1 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,86,206 ; orps %xmm14,%xmm1
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
@@ -27543,9 +27887,9 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,181,241,0,0 ; mulps 0xf1b5(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,29,190,241,0,0 ; andps 0xf1be(%rip),%xmm3 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 15,86,29,231,238,0,0 ; orps 0xeee7(%rip),%xmm3 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,89,5,202,241,0,0 ; mulps 0xf1ca(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,29,211,241,0,0 ; andps 0xf1d3(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 15,86,29,252,238,0,0 ; orps 0xeefc(%rip),%xmm3 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
DB 65,15,92,195 ; subps %xmm11,%xmm0
@@ -27567,7 +27911,7 @@ _sk_gamma_sse2 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,244,241,0,0 ; movaps 0xf1f4(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,40,5,9,242,0,0 ; movaps 0xf209(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -27585,29 +27929,29 @@ _sk_gamma_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,198,241,0,0 ; mulps 0xf1c6(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x11af>
- DB 68,15,40,5,62,239,0,0 ; movaps 0xef3e(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 15,89,5,219,241,0,0 ; mulps 0xf1db(%rip),%xmm0 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3>
+ DB 68,15,40,5,83,239,0,0 ; movaps 0xef53(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,194,241,0,0 ; movaps 0xf1c2(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x11bf>
+ DB 68,15,40,13,215,241,0,0 ; movaps 0xf1d7(%rip),%xmm9 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,191,241,0,0 ; addps 0xf1bf(%rip),%xmm0 # 2c2f0 <_sk_overlay_sse2_8bit+0x11cf>
- DB 15,89,5,200,241,0,0 ; mulps 0xf1c8(%rip),%xmm0 # 2c300 <_sk_overlay_sse2_8bit+0x11df>
- DB 15,89,13,209,241,0,0 ; mulps 0xf1d1(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0x11ef>
+ DB 15,88,5,212,241,0,0 ; addps 0xf1d4(%rip),%xmm0 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3>
+ DB 15,89,5,221,241,0,0 ; mulps 0xf1dd(%rip),%xmm0 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3>
+ DB 15,89,13,230,241,0,0 ; mulps 0xf1e6(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,215,241,0,0 ; mulps 0xf1d7(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0x11ff>
+ DB 15,89,21,236,241,0,0 ; mulps 0xf1ec(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,204,241,0,0 ; movaps 0xf1cc(%rip),%xmm2 # 2c330 <_sk_overlay_sse2_8bit+0x120f>
+ DB 15,40,21,225,241,0,0 ; movaps 0xf1e1(%rip),%xmm2 # 2c910 <_sk_overlay_sse2_8bit+0x1203>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,203,241,0,0 ; movaps 0xf1cb(%rip),%xmm10 # 2c340 <_sk_overlay_sse2_8bit+0x121f>
+ DB 68,15,40,21,224,241,0,0 ; movaps 0xf1e0(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1213>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,207,241,0,0 ; movaps 0xf1cf(%rip),%xmm11 # 2c350 <_sk_overlay_sse2_8bit+0x122f>
+ DB 68,15,40,29,228,241,0,0 ; movaps 0xf1e4(%rip),%xmm11 # 2c930 <_sk_overlay_sse2_8bit+0x1223>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -27631,8 +27975,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,127,241,0,0 ; mulps 0xf17f(%rip),%xmm8 # 2c360 <_sk_overlay_sse2_8bit+0x123f>
- DB 15,89,21,136,241,0,0 ; mulps 0xf188(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0x124f>
+ DB 68,15,89,5,148,241,0,0 ; mulps 0xf194(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1233>
+ DB 15,89,21,157,241,0,0 ; mulps 0xf19d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -27646,13 +27990,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 1d236 <_sk_load_a8_sse2+0x46>
+ DB 117,46 ; jne 1d801 <_sk_load_a8_sse2+0x46>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,2,238,0,0 ; pand 0xee02(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,23,238,0,0 ; pand 0xee17(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,72,239,0,0 ; mulps 0xef48(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,93,239,0,0 ; mulps 0xef5d(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
@@ -27661,12 +28005,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d279 <_sk_load_a8_sse2+0x89>
+ DB 116,54 ; je 1d844 <_sk_load_a8_sse2+0x89>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d262 <_sk_load_a8_sse2+0x72>
+ DB 116,21 ; je 1d82d <_sk_load_a8_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 1d216 <_sk_load_a8_sse2+0x26>
+ DB 117,195 ; jne 1d7e1 <_sk_load_a8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -27675,10 +28019,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,157 ; jmp 1d216 <_sk_load_a8_sse2+0x26>
+ DB 235,157 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,146 ; jmp 1d216 <_sk_load_a8_sse2+0x26>
+ DB 235,146 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -27689,13 +28033,13 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 1d2ca <_sk_load_a8_dst_sse2+0x46>
+ DB 117,46 ; jne 1d895 <_sk_load_a8_dst_sse2+0x46>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,110,237,0,0 ; pand 0xed6e(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,131,237,0,0 ; pand 0xed83(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,180,238,0,0 ; mulps 0xeeb4(%rip),%xmm7 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,61,201,238,0,0 ; mulps 0xeec9(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
@@ -27704,12 +28048,12 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d30d <_sk_load_a8_dst_sse2+0x89>
+ DB 116,54 ; je 1d8d8 <_sk_load_a8_dst_sse2+0x89>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d2f6 <_sk_load_a8_dst_sse2+0x72>
+ DB 116,21 ; je 1d8c1 <_sk_load_a8_dst_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 1d2aa <_sk_load_a8_dst_sse2+0x26>
+ DB 117,195 ; jne 1d875 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -27718,10 +28062,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,157 ; jmp 1d2aa <_sk_load_a8_dst_sse2+0x26>
+ DB 235,157 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,146 ; jmp 1d2aa <_sk_load_a8_dst_sse2+0x26>
+ DB 235,146 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -27761,7 +28105,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,197,237,0,0 ; mulps 0xedc5(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,218,237,0,0 ; mulps 0xedda(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -27779,7 +28123,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,117,236,0,0 ; movaps 0xec75(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,138,236,0,0 ; movaps 0xec8a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -27787,7 +28131,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 1d410 <_sk_store_a8_sse2+0x54>
+ DB 117,17 ; jne 1d9db <_sk_store_a8_sse2+0x54>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -27798,24 +28142,24 @@ _sk_store_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1d462 <_sk_store_a8_sse2+0xa6>
+ DB 116,59 ; je 1da2d <_sk_store_a8_sse2+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,22 ; je 1d443 <_sk_store_a8_sse2+0x87>
+ DB 116,22 ; je 1da0e <_sk_store_a8_sse2+0x87>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,213 ; jne 1d408 <_sk_store_a8_sse2+0x4c>
+ DB 117,213 ; jne 1d9d3 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 67,136,68,25,2 ; mov %al,0x2(%r9,%r11,1)
- DB 102,68,15,219,5,212,235,0,0 ; pand 0xebd4(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,233,235,0,0 ; pand 0xebe9(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,25 ; mov %ax,(%r9,%r11,1)
- DB 235,166 ; jmp 1d408 <_sk_store_a8_sse2+0x4c>
+ DB 235,166 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 67,136,4,25 ; mov %al,(%r9,%r11,1)
- DB 235,151 ; jmp 1d408 <_sk_store_a8_sse2+0x4c>
+ DB 235,151 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -27826,27 +28170,27 @@ _sk_load_g8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 1d4ba <_sk_load_g8_sse2+0x49>
+ DB 117,49 ; jne 1da85 <_sk_load_g8_sse2+0x49>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,129,235,0,0 ; pand 0xeb81(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,150,235,0,0 ; pand 0xeb96(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,199,236,0,0 ; mulps 0xecc7(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,220,236,0,0 ; mulps 0xecdc(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,190,234,0,0 ; movaps 0xeabe(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,211,234,0,0 ; movaps 0xead3(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d4fd <_sk_load_g8_sse2+0x8c>
+ DB 116,54 ; je 1dac8 <_sk_load_g8_sse2+0x8c>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d4e6 <_sk_load_g8_sse2+0x75>
+ DB 116,21 ; je 1dab1 <_sk_load_g8_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1d497 <_sk_load_g8_sse2+0x26>
+ DB 117,192 ; jne 1da62 <_sk_load_g8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -27855,10 +28199,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,154 ; jmp 1d497 <_sk_load_g8_sse2+0x26>
+ DB 235,154 ; jmp 1da62 <_sk_load_g8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,143 ; jmp 1d497 <_sk_load_g8_sse2+0x26>
+ DB 235,143 ; jmp 1da62 <_sk_load_g8_sse2+0x26>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -27869,27 +28213,27 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 1d551 <_sk_load_g8_dst_sse2+0x49>
+ DB 117,49 ; jne 1db1c <_sk_load_g8_dst_sse2+0x49>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,234,234,0,0 ; pand 0xeaea(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,255,234,0,0 ; pand 0xeaff(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,48,236,0,0 ; mulps 0xec30(%rip),%xmm4 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,37,69,236,0,0 ; mulps 0xec45(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,39,234,0,0 ; movaps 0xea27(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,60,234,0,0 ; movaps 0xea3c(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d594 <_sk_load_g8_dst_sse2+0x8c>
+ DB 116,54 ; je 1db5f <_sk_load_g8_dst_sse2+0x8c>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d57d <_sk_load_g8_dst_sse2+0x75>
+ DB 116,21 ; je 1db48 <_sk_load_g8_dst_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1d52e <_sk_load_g8_dst_sse2+0x26>
+ DB 117,192 ; jne 1daf9 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -27898,10 +28242,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,154 ; jmp 1d52e <_sk_load_g8_dst_sse2+0x26>
+ DB 235,154 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,143 ; jmp 1d52e <_sk_load_g8_dst_sse2+0x26>
+ DB 235,143 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -27941,9 +28285,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,62,235,0,0 ; mulps 0xeb3e(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,83,235,0,0 ; mulps 0xeb53(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,53,233,0,0 ; movaps 0xe935(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,74,233,0,0 ; movaps 0xe94a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -27960,42 +28304,42 @@ _sk_load_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 1d6b3 <_sk_load_565_sse2+0x6e>
+ DB 117,83 ; jne 1dc7e <_sk_load_565_sse2+0x6e>
DB 243,67,15,126,20,89 ; movq (%r9,%r11,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,14,235,0,0 ; movdqa 0xeb0e(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,35,235,0,0 ; movdqa 0xeb23(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,16,235,0,0 ; mulps 0xeb10(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,24,235,0,0 ; movdqa 0xeb18(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,37,235,0,0 ; mulps 0xeb25(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,45,235,0,0 ; movdqa 0xeb2d(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,26,235,0,0 ; mulps 0xeb1a(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,34,235,0,0 ; pand 0xeb22(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,47,235,0,0 ; mulps 0xeb2f(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,55,235,0,0 ; pand 0xeb37(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,40,235,0,0 ; mulps 0xeb28(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,61,235,0,0 ; mulps 0xeb3d(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,191,232,0,0 ; movaps 0xe8bf(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,212,232,0,0 ; movaps 0xe8d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1d6f2 <_sk_load_565_sse2+0xad>
+ DB 116,50 ; je 1dcbd <_sk_load_565_sse2+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d6df <_sk_load_565_sse2+0x9a>
+ DB 116,21 ; je 1dcaa <_sk_load_565_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1d66a <_sk_load_565_sse2+0x25>
+ DB 117,154 ; jne 1dc35 <_sk_load_565_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,120,255,255,255 ; jmpq 1d66a <_sk_load_565_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,106,255,255,255 ; jmpq 1d66a <_sk_load_565_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -28007,42 +28351,42 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 1d76e <_sk_load_565_dst_sse2+0x6e>
+ DB 117,83 ; jne 1dd39 <_sk_load_565_dst_sse2+0x6e>
DB 243,67,15,126,52,89 ; movq (%r9,%r11,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,37,83,234,0,0 ; movdqa 0xea53(%rip),%xmm4 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,37,104,234,0,0 ; movdqa 0xea68(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,85,234,0,0 ; mulps 0xea55(%rip),%xmm4 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,45,93,234,0,0 ; movdqa 0xea5d(%rip),%xmm5 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,37,106,234,0,0 ; mulps 0xea6a(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,45,114,234,0,0 ; movdqa 0xea72(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,95,234,0,0 ; mulps 0xea5f(%rip),%xmm5 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,53,103,234,0,0 ; pand 0xea67(%rip),%xmm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,45,116,234,0,0 ; mulps 0xea74(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,53,124,234,0,0 ; pand 0xea7c(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,109,234,0,0 ; mulps 0xea6d(%rip),%xmm6 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,53,130,234,0,0 ; mulps 0xea82(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,4,232,0,0 ; movaps 0xe804(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,25,232,0,0 ; movaps 0xe819(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1d7ad <_sk_load_565_dst_sse2+0xad>
+ DB 116,50 ; je 1dd78 <_sk_load_565_dst_sse2+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d79a <_sk_load_565_dst_sse2+0x9a>
+ DB 116,21 ; je 1dd65 <_sk_load_565_dst_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1d725 <_sk_load_565_dst_sse2+0x25>
+ DB 117,154 ; jne 1dcf0 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,120,255,255,255 ; jmpq 1d725 <_sk_load_565_dst_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,106,255,255,255 ; jmpq 1d725 <_sk_load_565_dst_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -28075,19 +28419,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,63,233,0,0 ; movdqa 0xe93f(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,84,233,0,0 ; movdqa 0xe954(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,65,233,0,0 ; mulps 0xe941(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,73,233,0,0 ; movdqa 0xe949(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,86,233,0,0 ; mulps 0xe956(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,94,233,0,0 ; movdqa 0xe95e(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,75,233,0,0 ; mulps 0xe94b(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,83,233,0,0 ; pand 0xe953(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,96,233,0,0 ; mulps 0xe960(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,104,233,0,0 ; pand 0xe968(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,89,233,0,0 ; mulps 0xe959(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,110,233,0,0 ; mulps 0xe96e(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,240,230,0,0 ; movaps 0xe6f0(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,5,231,0,0 ; movaps 0xe705(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -28100,12 +28444,12 @@ _sk_store_565_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,239,234,0,0 ; movaps 0xeaef(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0x126f>
+ DB 68,15,40,5,4,235,0,0 ; movaps 0xeb04(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,228,234,0,0 ; movaps 0xeae4(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x127f>
+ DB 68,15,40,21,249,234,0,0 ; movaps 0xeaf9(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -28117,7 +28461,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1d8fe <_sk_store_565_sse2+0x7b>
+ DB 117,10 ; jne 1dec9 <_sk_store_565_sse2+0x7b>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28125,19 +28469,19 @@ _sk_store_565_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 1d936 <_sk_store_565_sse2+0xb3>
+ DB 116,38 ; je 1df01 <_sk_store_565_sse2+0xb3>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1d928 <_sk_store_565_sse2+0xa5>
+ DB 116,18 ; je 1def3 <_sk_store_565_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 1d8fa <_sk_store_565_sse2+0x77>
+ DB 117,222 ; jne 1dec5 <_sk_store_565_sse2+0x77>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 1d8fa <_sk_store_565_sse2+0x77>
+ DB 235,196 ; jmp 1dec5 <_sk_store_565_sse2+0x77>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 1d8fa <_sk_store_565_sse2+0x77>
+ DB 235,184 ; jmp 1dec5 <_sk_store_565_sse2+0x77>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -28149,45 +28493,45 @@ _sk_load_4444_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1d9bf <_sk_load_4444_sse2+0x7d>
+ DB 117,98 ; jne 1df8a <_sk_load_4444_sse2+0x7d>
DB 243,67,15,126,28,89 ; movq (%r9,%r11,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,65,234,0,0 ; movdqa 0xea41(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,86,234,0,0 ; movdqa 0xea56(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,67,234,0,0 ; mulps 0xea43(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,75,234,0,0 ; movdqa 0xea4b(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,88,234,0,0 ; mulps 0xea58(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,96,234,0,0 ; movdqa 0xea60(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,77,234,0,0 ; mulps 0xea4d(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,85,234,0,0 ; movdqa 0xea55(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,98,234,0,0 ; mulps 0xea62(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,106,234,0,0 ; movdqa 0xea6a(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,87,234,0,0 ; mulps 0xea57(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,95,234,0,0 ; pand 0xea5f(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,108,234,0,0 ; mulps 0xea6c(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,116,234,0,0 ; pand 0xea74(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,101,234,0,0 ; mulps 0xea65(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,122,234,0,0 ; mulps 0xea7a(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1d9fe <_sk_load_4444_sse2+0xbc>
+ DB 116,50 ; je 1dfc9 <_sk_load_4444_sse2+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d9eb <_sk_load_4444_sse2+0xa9>
+ DB 116,21 ; je 1dfb6 <_sk_load_4444_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 1d967 <_sk_load_4444_sse2+0x25>
+ DB 117,139 ; jne 1df32 <_sk_load_4444_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,105,255,255,255 ; jmpq 1d967 <_sk_load_4444_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,91,255,255,255 ; jmpq 1d967 <_sk_load_4444_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -28199,45 +28543,45 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1da89 <_sk_load_4444_dst_sse2+0x7d>
+ DB 117,98 ; jne 1e054 <_sk_load_4444_dst_sse2+0x7d>
DB 243,67,15,126,60,89 ; movq (%r9,%r11,2),%xmm7
DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
- DB 102,15,111,37,119,233,0,0 ; movdqa 0xe977(%rip),%xmm4 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,37,140,233,0,0 ; movdqa 0xe98c(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,121,233,0,0 ; mulps 0xe979(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,45,129,233,0,0 ; movdqa 0xe981(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,37,142,233,0,0 ; mulps 0xe98e(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,45,150,233,0,0 ; movdqa 0xe996(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,131,233,0,0 ; mulps 0xe983(%rip),%xmm5 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,53,139,233,0,0 ; movdqa 0xe98b(%rip),%xmm6 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,45,152,233,0,0 ; mulps 0xe998(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,53,160,233,0,0 ; movdqa 0xe9a0(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,141,233,0,0 ; mulps 0xe98d(%rip),%xmm6 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,61,149,233,0,0 ; pand 0xe995(%rip),%xmm7 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,53,162,233,0,0 ; mulps 0xe9a2(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,61,170,233,0,0 ; pand 0xe9aa(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,155,233,0,0 ; mulps 0xe99b(%rip),%xmm7 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,61,176,233,0,0 ; mulps 0xe9b0(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1dac8 <_sk_load_4444_dst_sse2+0xbc>
+ DB 116,50 ; je 1e093 <_sk_load_4444_dst_sse2+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1dab5 <_sk_load_4444_dst_sse2+0xa9>
+ DB 116,21 ; je 1e080 <_sk_load_4444_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 1da31 <_sk_load_4444_dst_sse2+0x25>
+ DB 117,139 ; jne 1dffc <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,252 ; movsd %xmm4,%xmm7
- DB 233,105,255,255,255 ; jmpq 1da31 <_sk_load_4444_dst_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,91,255,255,255 ; jmpq 1da31 <_sk_load_4444_dst_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -28270,21 +28614,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,84,232,0,0 ; movdqa 0xe854(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,105,232,0,0 ; movdqa 0xe869(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,86,232,0,0 ; mulps 0xe856(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,94,232,0,0 ; movdqa 0xe85e(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,107,232,0,0 ; mulps 0xe86b(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,115,232,0,0 ; movdqa 0xe873(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,96,232,0,0 ; mulps 0xe860(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,104,232,0,0 ; movdqa 0xe868(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,117,232,0,0 ; mulps 0xe875(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,125,232,0,0 ; movdqa 0xe87d(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,106,232,0,0 ; mulps 0xe86a(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,114,232,0,0 ; pand 0xe872(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,127,232,0,0 ; mulps 0xe87f(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,135,232,0,0 ; pand 0xe887(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,120,232,0,0 ; mulps 0xe878(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,141,232,0,0 ; mulps 0xe88d(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -28298,7 +28642,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,101,232,0,0 ; movaps 0xe865(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x130f>
+ DB 68,15,40,5,122,232,0,0 ; movaps 0xe87a(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28320,7 +28664,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1dc3c <_sk_store_4444_sse2+0x8f>
+ DB 117,10 ; jne 1e207 <_sk_store_4444_sse2+0x8f>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28328,19 +28672,19 @@ _sk_store_4444_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 1dc74 <_sk_store_4444_sse2+0xc7>
+ DB 116,38 ; je 1e23f <_sk_store_4444_sse2+0xc7>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1dc66 <_sk_store_4444_sse2+0xb9>
+ DB 116,18 ; je 1e231 <_sk_store_4444_sse2+0xb9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 1dc38 <_sk_store_4444_sse2+0x8b>
+ DB 117,222 ; jne 1e203 <_sk_store_4444_sse2+0x8b>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 1dc38 <_sk_store_4444_sse2+0x8b>
+ DB 235,196 ; jmp 1e203 <_sk_store_4444_sse2+0x8b>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 1dc38 <_sk_store_4444_sse2+0x8b>
+ DB 235,184 ; jmp 1e203 <_sk_store_4444_sse2+0x8b>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -28352,13 +28696,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1dcfe <_sk_load_8888_sse2+0x7e>
+ DB 117,98 ; jne 1e2c9 <_sk_load_8888_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,21,118,227,0,0 ; movdqa 0xe376(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,21,139,227,0,0 ; movdqa 0xe38b(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,178,228,0,0 ; movaps 0xe4b2(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,199,228,0,0 ; movaps 0xe4c7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28378,18 +28722,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1dd34 <_sk_load_8888_sse2+0xb4>
+ DB 116,41 ; je 1e2ff <_sk_load_8888_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1dd29 <_sk_load_8888_sse2+0xa9>
+ DB 116,19 ; je 1e2f4 <_sk_load_8888_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1dca2 <_sk_load_8888_sse2+0x22>
+ DB 117,134 ; jne 1e26d <_sk_load_8888_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1dca2 <_sk_load_8888_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1dca2 <_sk_load_8888_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -28401,13 +28745,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1ddbd <_sk_load_8888_dst_sse2+0x7e>
+ DB 117,98 ; jne 1e388 <_sk_load_8888_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,53,183,226,0,0 ; movdqa 0xe2b7(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,53,204,226,0,0 ; movdqa 0xe2cc(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,243,227,0,0 ; movaps 0xe3f3(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,8,228,0,0 ; movaps 0xe408(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -28427,18 +28771,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1ddf3 <_sk_load_8888_dst_sse2+0xb4>
+ DB 116,41 ; je 1e3be <_sk_load_8888_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1dde8 <_sk_load_8888_dst_sse2+0xa9>
+ DB 116,19 ; je 1e3b3 <_sk_load_8888_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1dd61 <_sk_load_8888_dst_sse2+0x22>
+ DB 117,134 ; jne 1e32c <_sk_load_8888_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1dd61 <_sk_load_8888_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1dd61 <_sk_load_8888_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -28470,11 +28814,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,160,225,0,0 ; movdqa 0xe1a0(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,21,181,225,0,0 ; movdqa 0xe1b5(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,220,226,0,0 ; movaps 0xe2dc(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,241,226,0,0 ; movaps 0xe2f1(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28502,7 +28846,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,92,225,0,0 ; movaps 0xe15c(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,113,225,0,0 ; movaps 0xe171(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28521,24 +28865,24 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1df54 <_sk_store_8888_sse2+0x7f>
+ DB 117,10 ; jne 1e51f <_sk_store_8888_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 1df82 <_sk_store_8888_sse2+0xad>
+ DB 116,33 ; je 1e54d <_sk_store_8888_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1df7a <_sk_store_8888_sse2+0xa5>
+ DB 116,19 ; je 1e545 <_sk_store_8888_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1df50 <_sk_store_8888_sse2+0x7b>
+ DB 117,227 ; jne 1e51b <_sk_store_8888_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 1df50 <_sk_store_8888_sse2+0x7b>
+ DB 235,206 ; jmp 1e51b <_sk_store_8888_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 1df50 <_sk_store_8888_sse2+0x7b>
+ DB 235,198 ; jmp 1e51b <_sk_store_8888_sse2+0x7b>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -28550,13 +28894,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e008 <_sk_load_bgra_sse2+0x7e>
+ DB 117,98 ; jne 1e5d3 <_sk_load_bgra_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,5,108,224,0,0 ; movdqa 0xe06c(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,129,224,0,0 ; movdqa 0xe081(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,168,225,0,0 ; movaps 0xe1a8(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,189,225,0,0 ; movaps 0xe1bd(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28576,18 +28920,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e03e <_sk_load_bgra_sse2+0xb4>
+ DB 116,41 ; je 1e609 <_sk_load_bgra_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e033 <_sk_load_bgra_sse2+0xa9>
+ DB 116,19 ; je 1e5fe <_sk_load_bgra_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1dfac <_sk_load_bgra_sse2+0x22>
+ DB 117,134 ; jne 1e577 <_sk_load_bgra_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1dfac <_sk_load_bgra_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1dfac <_sk_load_bgra_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -28599,13 +28943,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e0c7 <_sk_load_bgra_dst_sse2+0x7e>
+ DB 117,98 ; jne 1e692 <_sk_load_bgra_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,37,173,223,0,0 ; movdqa 0xdfad(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,194,223,0,0 ; movdqa 0xdfc2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 68,15,40,5,233,224,0,0 ; movaps 0xe0e9(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,254,224,0,0 ; movaps 0xe0fe(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -28625,18 +28969,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e0fd <_sk_load_bgra_dst_sse2+0xb4>
+ DB 116,41 ; je 1e6c8 <_sk_load_bgra_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e0f2 <_sk_load_bgra_dst_sse2+0xa9>
+ DB 116,19 ; je 1e6bd <_sk_load_bgra_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1e06b <_sk_load_bgra_dst_sse2+0x22>
+ DB 117,134 ; jne 1e636 <_sk_load_bgra_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e06b <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e06b <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -28668,11 +29012,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,5,150,222,0,0 ; movdqa 0xde96(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,171,222,0,0 ; movdqa 0xdeab(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,210,223,0,0 ; movaps 0xdfd2(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,231,223,0,0 ; movaps 0xdfe7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28700,7 +29044,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,82,222,0,0 ; movaps 0xde52(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,103,222,0,0 ; movaps 0xde67(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28719,24 +29063,24 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1e25e <_sk_store_bgra_sse2+0x7f>
+ DB 117,10 ; jne 1e829 <_sk_store_bgra_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 1e28c <_sk_store_bgra_sse2+0xad>
+ DB 116,33 ; je 1e857 <_sk_store_bgra_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e284 <_sk_store_bgra_sse2+0xa5>
+ DB 116,19 ; je 1e84f <_sk_store_bgra_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1e25a <_sk_store_bgra_sse2+0x7b>
+ DB 117,227 ; jne 1e825 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 1e25a <_sk_store_bgra_sse2+0x7b>
+ DB 235,206 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 1e25a <_sk_store_bgra_sse2+0x7b>
+ DB 235,198 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -28748,7 +29092,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 1e416 <_sk_load_f16_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1e9e1 <_sk_load_f16_sse2+0x182>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 102,65,15,16,76,193,16 ; movupd 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,192 ; movapd %xmm0,%xmm8
@@ -28760,7 +29104,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,74,225,0,0 ; movdqa 0xe14a(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,13,95,225,0,0 ; movdqa 0xe15f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -28768,11 +29112,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,63,225,0,0 ; movdqa 0xe13f(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,29,84,225,0,0 ; movdqa 0xe154(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,65,225,0,0 ; movdqa 0xe141(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,37,86,225,0,0 ; movdqa 0xe156(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,228,226,0,0 ; movdqa 0xe2e4(%rip),%xmm3 # 2c620 <_sk_overlay_sse2_8bit+0x14ff>
+ DB 102,15,111,29,249,226,0,0 ; movdqa 0xe2f9(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -28820,17 +29164,17 @@ _sk_load_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1e433 <_sk_load_f16_sse2+0x19f>
+ DB 117,17 ; jne 1e9fe <_sk_load_f16_sse2+0x19f>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,142,254,255,255 ; jmpq 1e2c1 <_sk_load_f16_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 1e2c1 <_sk_load_f16_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1e88c <_sk_load_f16_sse2+0x2d>
DB 242,65,15,16,76,193,16 ; movsd 0x10(%r9,%rax,8),%xmm1
- DB 233,109,254,255,255 ; jmpq 1e2c1 <_sk_load_f16_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -28842,7 +29186,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 1e5d6 <_sk_load_f16_dst_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1eba1 <_sk_load_f16_dst_sse2+0x182>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 102,65,15,16,108,193,16 ; movupd 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,196 ; movapd %xmm4,%xmm8
@@ -28854,7 +29198,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5
DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5
- DB 102,68,15,111,13,138,223,0,0 ; movdqa 0xdf8a(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,13,159,223,0,0 ; movdqa 0xdf9f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,219,225 ; pand %xmm9,%xmm4
DB 102,15,239,236 ; pxor %xmm4,%xmm5
@@ -28862,11 +29206,11 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,236 ; por %xmm4,%xmm13
- DB 102,68,15,111,29,127,223,0,0 ; movdqa 0xdf7f(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,29,148,223,0,0 ; movdqa 0xdf94(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,129,223,0,0 ; movdqa 0xdf81(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,37,150,223,0,0 ; movdqa 0xdf96(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,236 ; pxor %xmm12,%xmm5
- DB 102,15,111,61,36,225,0,0 ; movdqa 0xe124(%rip),%xmm7 # 2c620 <_sk_overlay_sse2_8bit+0x14ff>
+ DB 102,15,111,61,57,225,0,0 ; movdqa 0xe139(%rip),%xmm7 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4
DB 102,65,15,223,229 ; pandn %xmm13,%xmm4
@@ -28914,17 +29258,17 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1e5f3 <_sk_load_f16_dst_sse2+0x19f>
+ DB 117,17 ; jne 1ebbe <_sk_load_f16_dst_sse2+0x19f>
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 102,15,20,229 ; unpcklpd %xmm5,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
- DB 233,142,254,255,255 ; jmpq 1e481 <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 1e481 <_sk_load_f16_dst_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1ea4c <_sk_load_f16_dst_sse2+0x2d>
DB 242,65,15,16,108,193,16 ; movsd 0x10(%r9,%rax,8),%xmm5
- DB 233,109,254,255,255 ; jmpq 1e481 <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -28964,7 +29308,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,131,221,0,0 ; movdqa 0xdd83(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,13,152,221,0,0 ; movdqa 0xdd98(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -28972,11 +29316,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,120,221,0,0 ; movdqa 0xdd78(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,29,141,221,0,0 ; movdqa 0xdd8d(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,122,221,0,0 ; movdqa 0xdd7a(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,37,143,221,0,0 ; movdqa 0xdd8f(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,29,223,0,0 ; movdqa 0xdf1d(%rip),%xmm3 # 2c620 <_sk_overlay_sse2_8bit+0x14ff>
+ DB 102,15,111,29,50,223,0,0 ; movdqa 0xdf32(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29033,17 +29377,17 @@ _sk_store_f16_sse2 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,114,220,0,0 ; movdqa 0xdc72(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,21,135,220,0,0 ; movdqa 0xdc87(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,101,220,0,0 ; movdqa 0xdc65(%rip),%xmm9 # 2c480 <_sk_overlay_sse2_8bit+0x135f>
+ DB 102,68,15,111,13,122,220,0,0 ; movdqa 0xdc7a(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,86,220,0,0 ; movdqa 0xdc56(%rip),%xmm11 # 2c490 <_sk_overlay_sse2_8bit+0x136f>
+ DB 102,68,15,111,29,107,220,0,0 ; movdqa 0xdc6b(%rip),%xmm11 # 2ca70 <_sk_overlay_sse2_8bit+0x1363>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -29095,7 +29439,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 1e95c <_sk_store_f16_sse2+0x17e>
+ DB 117,21 ; jne 1ef27 <_sk_store_f16_sse2+0x17e>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -29103,13 +29447,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 1e958 <_sk_store_f16_sse2+0x17a>
+ DB 116,240 ; je 1ef23 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 1e958 <_sk_store_f16_sse2+0x17a>
+ DB 114,227 ; jb 1ef23 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 1e958 <_sk_store_f16_sse2+0x17a>
+ DB 235,213 ; jmp 1ef23 <_sk_store_f16_sse2+0x17a>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -29122,7 +29466,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,190,0,0,0 ; jne 1ea68 <_sk_load_u16_be_sse2+0xe5>
+ DB 15,133,190,0,0,0 ; jne 1f033 <_sk_load_u16_be_sse2+0xe5>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 102,65,15,16,76,65,16 ; movupd 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -29139,7 +29483,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,5,216,0,0 ; movaps 0xd805(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,5,26,216,0,0 ; movaps 0xd81a(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29167,17 +29511,17 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1ea85 <_sk_load_u16_be_sse2+0x102>
+ DB 117,17 ; jne 1f050 <_sk_load_u16_be_sse2+0x102>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,50,255,255,255 ; jmpq 1e9b7 <_sk_load_u16_be_sse2+0x34>
+ DB 233,50,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,29,255,255,255 ; jb 1e9b7 <_sk_load_u16_be_sse2+0x34>
+ DB 15,130,29,255,255,255 ; jb 1ef82 <_sk_load_u16_be_sse2+0x34>
DB 242,65,15,16,76,65,16 ; movsd 0x10(%r9,%rax,2),%xmm1
- DB 233,17,255,255,255 ; jmpq 1e9b7 <_sk_load_u16_be_sse2+0x34>
+ DB 233,17,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -29192,7 +29536,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,175,0,0,0 ; jne 1eb80 <_sk_load_rgb_u16_be_sse2+0xda>
+ DB 15,133,175,0,0,0 ; jne 1f14b <_sk_load_rgb_u16_be_sse2+0xda>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -29213,7 +29557,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,203,214,0,0 ; movaps 0xd6cb(%rip),%xmm9 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,13,224,214,0,0 ; movaps 0xd6e0(%rip),%xmm9 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29230,27 +29574,27 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,242,211,0,0 ; movaps 0xd3f2(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,7,212,0,0 ; movaps 0xd407(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 1eba5 <_sk_load_rgb_u16_be_sse2+0xff>
+ DB 117,13 ; jne 1f170 <_sk_load_rgb_u16_be_sse2+0xff>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,80,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,80,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 1ebd6 <_sk_load_rgb_u16_be_sse2+0x130>
+ DB 114,24 ; jb 1f1a1 <_sk_load_rgb_u16_be_sse2+0x130>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,31,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,31,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,22,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,22,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -29262,7 +29606,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,155,216,0,0 ; movaps 0xd89b(%rip),%xmm10 # 2c4a0 <_sk_overlay_sse2_8bit+0x137f>
+ DB 68,15,40,21,176,216,0,0 ; movaps 0xd8b0(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -29307,7 +29651,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 1ecff <_sk_store_u16_be_sse2+0x120>
+ DB 117,21 ; jne 1f2ca <_sk_store_u16_be_sse2+0x120>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -29315,13 +29659,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 1ecfb <_sk_store_u16_be_sse2+0x11c>
+ DB 116,240 ; je 1f2c6 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 1ecfb <_sk_store_u16_be_sse2+0x11c>
+ DB 114,227 ; jb 1f2c6 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 1ecfb <_sk_store_u16_be_sse2+0x11c>
+ DB 235,213 ; jmp 1f2c6 <_sk_store_u16_be_sse2+0x11c>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -29335,7 +29679,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1ed91 <_sk_load_f32_sse2+0x6b>
+ DB 117,66 ; jne 1f35c <_sk_load_f32_sse2+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -29355,17 +29699,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 1eda3 <_sk_load_f32_sse2+0x7d>
+ DB 117,8 ; jne 1f36e <_sk_load_f32_sse2+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b>
+ DB 235,190 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 1edb7 <_sk_load_f32_sse2+0x91>
+ DB 114,8 ; jb 1f382 <_sk_load_f32_sse2+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b>
+ DB 235,170 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b>
+ DB 235,165 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -29379,7 +29723,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1ee27 <_sk_load_f32_dst_sse2+0x6b>
+ DB 117,66 ; jne 1f3f2 <_sk_load_f32_dst_sse2+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -29399,17 +29743,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 1ee39 <_sk_load_f32_dst_sse2+0x7d>
+ DB 117,8 ; jne 1f404 <_sk_load_f32_dst_sse2+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,190 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 1ee4d <_sk_load_f32_dst_sse2+0x91>
+ DB 114,8 ; jb 1f418 <_sk_load_f32_dst_sse2+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,170 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,165 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -29436,7 +29780,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 1eecf <_sk_store_f32_sse2+0x7d>
+ DB 117,29 ; jne 1f49a <_sk_store_f32_sse2+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -29444,12 +29788,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 1eecb <_sk_store_f32_sse2+0x79>
+ DB 116,246 ; je 1f496 <_sk_store_f32_sse2+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 1eecb <_sk_store_f32_sse2+0x79>
+ DB 114,234 ; jb 1f496 <_sk_store_f32_sse2+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 1eecb <_sk_store_f32_sse2+0x79>
+ DB 235,225 ; jmp 1f496 <_sk_store_f32_sse2+0x79>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -29489,7 +29833,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,8,208,0,0 ; andps 0xd008(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,21,29,208,0,0 ; andps 0xd01d(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -29513,7 +29857,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,174,207,0,0 ; andps 0xcfae(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,21,195,207,0,0 ; andps 0xcfc3(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -29537,13 +29881,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,193 ; subps %xmm9,%xmm0
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,111,197,0,0 ; mulss 0xc56f(%rip),%xmm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,29,144,197,0,0 ; mulss 0xc590(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,52,207,0,0 ; andps 0xcf34(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,29,73,207,0,0 ; andps 0xcf49(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -29570,13 +29914,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,201 ; subps %xmm9,%xmm1
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,234,196,0,0 ; mulss 0xc4ea(%rip),%xmm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,29,11,197,0,0 ; mulss 0xc50b(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,175,206,0,0 ; andps 0xceaf(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,29,196,206,0,0 ; andps 0xcec4(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -29597,7 +29941,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,102,206,0,0 ; minps 0xce66(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,93,5,123,206,0,0 ; minps 0xce7b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -29608,7 +29952,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,68,206,0,0 ; andps 0xce44(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,13,89,206,0,0 ; andps 0xce59(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29616,14 +29960,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,144,206,0,0 ; movaps 0xce90(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,5,165,206,0,0 ; movaps 0xcea5(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,20,206,0,0 ; movaps 0xce14(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,41,206,0,0 ; movaps 0xce29(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,10,206,0,0 ; andps 0xce0a(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,13,31,206,0,0 ; andps 0xce1f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -29637,10 +29981,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,32,211,0,0 ; mulps 0xd320(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x138f>
- DB 15,89,13,41,211,0,0 ; mulps 0xd329(%rip),%xmm1 # 2c4c0 <_sk_overlay_sse2_8bit+0x139f>
+ DB 15,89,5,53,211,0,0 ; mulps 0xd335(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383>
+ DB 15,89,13,62,211,0,0 ; mulps 0xd33e(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,47,211,0,0 ; mulps 0xd32f(%rip),%xmm3 # 2c4d0 <_sk_overlay_sse2_8bit+0x13af>
+ DB 15,89,29,68,211,0,0 ; mulps 0xd344(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -29936,9 +30280,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 1f641 <_sk_evenly_spaced_gradient_sse2+0x18>
+ DB 120,7 ; js 1fc0c <_sk_evenly_spaced_gradient_sse2+0x18>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 1f656 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ DB 235,21 ; jmp 1fc21 <_sk_evenly_spaced_gradient_sse2+0x2d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -30034,15 +30378,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,254,204,0,0 ; movaps 0xccfe(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x13bf>
+ DB 15,40,5,19,205,0,0 ; movaps 0xcd13(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,4,205,0,0 ; addps 0xcd04(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x13cf>
+ DB 15,88,5,25,205,0,0 ; addps 0xcd19(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,10,205,0,0 ; addps 0xcd0a(%rip),%xmm0 # 2c500 <_sk_overlay_sse2_8bit+0x13df>
+ DB 15,88,5,31,205,0,0 ; addps 0xcd1f(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,16,205,0,0 ; addps 0xcd10(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x13ef>
+ DB 15,88,5,37,205,0,0 ; addps 0xcd25(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,22,205,0,0 ; addps 0xcd16(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x13ff>
+ DB 15,88,5,43,205,0,0 ; addps 0xcd2b(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -30058,12 +30402,12 @@ _sk_gradient_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 1f85d <_sk_gradient_sse2+0x46>
+ DB 114,50 ; jb 1fe28 <_sk_gradient_sse2+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,63,199,0,0 ; movaps 0xc73f(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 15,40,21,84,199,0,0 ; movaps 0xc754(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -30071,7 +30415,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 1f841 <_sk_gradient_sse2+0x2a>
+ DB 117,228 ; jne 1fe0c <_sk_gradient_sse2+0x2a>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,211 ; movq %xmm2,%r11
DB 69,137,217 ; mov %r11d,%r9d
@@ -30206,29 +30550,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,160,202,0,0 ; movaps 0xcaa0(%rip),%xmm13 # 2c530 <_sk_overlay_sse2_8bit+0x140f>
+ DB 68,15,40,45,181,202,0,0 ; movaps 0xcab5(%rip),%xmm13 # 2cb10 <_sk_overlay_sse2_8bit+0x1403>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,164,202,0,0 ; addps 0xcaa4(%rip),%xmm13 # 2c540 <_sk_overlay_sse2_8bit+0x141f>
+ DB 68,15,88,45,185,202,0,0 ; addps 0xcab9(%rip),%xmm13 # 2cb20 <_sk_overlay_sse2_8bit+0x1413>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,168,202,0,0 ; addps 0xcaa8(%rip),%xmm13 # 2c550 <_sk_overlay_sse2_8bit+0x142f>
+ DB 68,15,88,45,189,202,0,0 ; addps 0xcabd(%rip),%xmm13 # 2cb30 <_sk_overlay_sse2_8bit+0x1423>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,172,202,0,0 ; addps 0xcaac(%rip),%xmm13 # 2c560 <_sk_overlay_sse2_8bit+0x143f>
+ DB 68,15,88,45,193,202,0,0 ; addps 0xcac1(%rip),%xmm13 # 2cb40 <_sk_overlay_sse2_8bit+0x1433>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,171,202,0,0 ; movaps 0xcaab(%rip),%xmm10 # 2c570 <_sk_overlay_sse2_8bit+0x144f>
+ DB 68,15,40,21,192,202,0,0 ; movaps 0xcac0(%rip),%xmm10 # 2cb50 <_sk_overlay_sse2_8bit+0x1443>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,126,196,0,0 ; movaps 0xc47e(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,21,147,196,0,0 ; movaps 0xc493(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,109,196,0,0 ; movaps 0xc46d(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,130,196,0,0 ; movaps 0xc482(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -30259,7 +30603,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,20,202,0,0 ; mulps 0xca14(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,41,202,0,0 ; mulps 0xca29(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30267,7 +30611,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,255,201,0,0 ; mulps 0xc9ff(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,20,202,0,0 ; mulps 0xca14(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30276,8 +30620,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,183,200,0,0 ; xorps 0xc8b7(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,159,195,0,0 ; mulps 0xc39f(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,204,200,0,0 ; xorps 0xc8cc(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,180,195,0,0 ; mulps 0xc3b4(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30296,7 +30640,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,118,201,0,0 ; mulps 0xc976(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,139,201,0,0 ; mulps 0xc98b(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30304,7 +30648,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,97,201,0,0 ; mulps 0xc961(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,118,201,0,0 ; mulps 0xc976(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30313,8 +30657,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,25,200,0,0 ; xorps 0xc819(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,1,195,0,0 ; mulps 0xc301(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,46,200,0,0 ; xorps 0xc82e(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,22,195,0,0 ; mulps 0xc316(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30330,7 +30674,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,233,200,0,0 ; mulps 0xc8e9(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,254,200,0,0 ; mulps 0xc8fe(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -30338,7 +30682,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,181,199,0,0 ; xorps 0xc7b5(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 15,87,5,202,199,0,0 ; xorps 0xc7ca(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30375,7 +30719,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,59,194,0,0 ; movaps 0xc23b(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,80,194,0,0 ; movaps 0xc250(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -30383,7 +30727,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,38,194,0,0 ; movaps 0xc226(%rip),%xmm12 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,37,59,194,0,0 ; movaps 0xc23b(%rip),%xmm12 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -30426,8 +30770,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,191,199,0,0 ; addps 0xc7bf(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,135,193,0,0 ; movaps 0xc187(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,212,199,0,0 ; addps 0xc7d4(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,156,193,0,0 ; movaps 0xc19c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30438,7 +30782,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,86,193,0,0 ; addps 0xc156(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,5,107,193,0,0 ; addps 0xc16b(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30448,8 +30792,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,120,199,0,0 ; addps 0xc778(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,64,193,0,0 ; movaps 0xc140(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,141,199,0,0 ; addps 0xc78d(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,85,193,0,0 ; movaps 0xc155(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30460,7 +30804,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,14,193,0,0 ; addps 0xc10e(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,13,35,193,0,0 ; addps 0xc123(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30470,13 +30814,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,65,199,0,0 ; addps 0xc741(%rip),%xmm0 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,249,192,0,0 ; movaps 0xc0f9(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,86,199,0,0 ; addps 0xc756(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,14,193,0,0 ; movaps 0xc10e(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,53,199,0,0 ; mulps 0xc735(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,205,194,0,0 ; addps 0xc2cd(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,74,199,0,0 ; mulps 0xc74a(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,226,194,0,0 ; addps 0xc2e2(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30487,16 +30831,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,236,198,0,0 ; addps 0xc6ec(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,180,192,0,0 ; movaps 0xc0b4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,1,199,0,0 ; addps 0xc701(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,201,192,0,0 ; movaps 0xc0c9(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,8,199,0,0 ; movaps 0xc708(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,29,199,0,0 ; movaps 0xc71d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,12,199,0,0 ; addps 0xc70c(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,33,199,0,0 ; addps 0xc721(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,128,192,0,0 ; addps 0xc080(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,149,192,0,0 ; addps 0xc095(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,4,199,0,0 ; addps 0xc704(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,25,199,0,0 ; addps 0xc719(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30504,17 +30848,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,94,192,0,0 ; movaps 0xc05e(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,115,192,0,0 ; movaps 0xc073(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,186,198,0,0 ; movaps 0xc6ba(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,207,198,0,0 ; movaps 0xc6cf(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,190,198,0,0 ; addps 0xc6be(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,211,198,0,0 ; addps 0xc6d3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,186,198,0,0 ; addps 0xc6ba(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,207,198,0,0 ; addps 0xc6cf(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30524,11 +30868,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,141,198,0,0 ; addps 0xc68d(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,5,162,198,0,0 ; addps 0xc6a2(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,93,198,0,0 ; mulps 0xc65d(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,245,193,0,0 ; addps 0xc1f5(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,114,198,0,0 ; mulps 0xc672(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,10,194,0,0 ; addps 0xc20a(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30539,13 +30883,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,35,198,0,0 ; addps 0xc623(%rip),%xmm1 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,219,191,0,0 ; movaps 0xbfdb(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,56,198,0,0 ; addps 0xc638(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,240,191,0,0 ; movaps 0xbff0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,23,198,0,0 ; mulps 0xc617(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,175,193,0,0 ; addps 0xc1af(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,44,198,0,0 ; mulps 0xc62c(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,196,193,0,0 ; addps 0xc1c4(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30556,16 +30900,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,205,197,0,0 ; addps 0xc5cd(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,149,191,0,0 ; movaps 0xbf95(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,226,197,0,0 ; addps 0xc5e2(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,170,191,0,0 ; movaps 0xbfaa(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,233,197,0,0 ; movaps 0xc5e9(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,254,197,0,0 ; movaps 0xc5fe(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,237,197,0,0 ; addps 0xc5ed(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,2,198,0,0 ; addps 0xc602(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,97,191,0,0 ; addps 0xbf61(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,118,191,0,0 ; addps 0xbf76(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,229,197,0,0 ; addps 0xc5e5(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,250,197,0,0 ; addps 0xc5fa(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30573,17 +30917,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,63,191,0,0 ; movaps 0xbf3f(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,84,191,0,0 ; movaps 0xbf54(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,154,197,0,0 ; movaps 0xc59a(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,175,197,0,0 ; movaps 0xc5af(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,158,197,0,0 ; addps 0xc59e(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,179,197,0,0 ; addps 0xc5b3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,154,197,0,0 ; addps 0xc59a(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,175,197,0,0 ; addps 0xc5af(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30593,11 +30937,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,108,197,0,0 ; addps 0xc56c(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,13,129,197,0,0 ; addps 0xc581(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,60,197,0,0 ; mulps 0xc53c(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,212,192,0,0 ; addps 0xc0d4(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,81,197,0,0 ; mulps 0xc551(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,233,192,0,0 ; addps 0xc0e9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30732,7 +31076,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,65,15,111,198 ; movdqa %xmm14,%xmm0
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,45,136,195,0,0 ; movdqa 0xc388(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,45,157,195,0,0 ; movdqa 0xc39d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
@@ -30755,7 +31099,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,241 ; unpcklps %xmm1,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,140,188,0,0 ; paddd 0xbc8c(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,13,161,188,0,0 ; paddd 0xbca1(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -30772,7 +31116,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,253 ; unpcklps %xmm5,%xmm7
DB 15,20,249 ; unpcklps %xmm1,%xmm7
- DB 102,15,254,5,98,188,0,0 ; paddd 0xbc62(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,119,188,0,0 ; paddd 0xbc77(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -30789,7 +31133,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,200 ; unpcklps %xmm0,%xmm1
- DB 15,40,45,121,194,0,0 ; movaps 0xc279(%rip),%xmm5 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,45,142,194,0,0 ; movaps 0xc28e(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 15,88,229 ; addps %xmm5,%xmm4
DB 15,41,100,36,64 ; movaps %xmm4,0x40(%rsp)
DB 68,15,88,213 ; addps %xmm5,%xmm10
@@ -30804,7 +31148,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%rsp)
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,5,66,194,0,0 ; movdqa 0xc242(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,87,194,0,0 ; movdqa 0xc257(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -30826,7 +31170,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,227 ; unpcklps %xmm3,%xmm4
DB 15,20,229 ; unpcklps %xmm5,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 102,15,254,29,75,187,0,0 ; paddd 0xbb4b(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,29,96,187,0,0 ; paddd 0xbb60(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,218 ; movq %xmm3,%r10
@@ -30843,7 +31187,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
- DB 102,15,254,21,33,187,0,0 ; paddd 0xbb21(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,21,54,187,0,0 ; paddd 0xbb36(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -30905,7 +31249,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,193 ; unpcklps %xmm1,%xmm8
DB 68,15,20,199 ; unpcklps %xmm7,%xmm8
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,21,236,185,0,0 ; movdqa 0xb9ec(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,1,186,0,0 ; movdqa 0xba01(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
@@ -30923,7 +31267,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,111,45,189,185,0,0 ; movdqa 0xb9bd(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,45,210,185,0,0 ; movdqa 0xb9d2(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -30981,7 +31325,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 68,15,20,223 ; unpcklps %xmm7,%xmm11
DB 68,15,20,221 ; unpcklps %xmm5,%xmm11
- DB 102,15,111,45,184,184,0,0 ; movdqa 0xb8b8(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,45,205,184,0,0 ; movdqa 0xb8cd(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5
@@ -31028,7 +31372,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,5,91,190,0,0 ; movdqa 0xbe5b(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,112,190,0,0 ; movdqa 0xbe70(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -31050,7 +31394,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,202 ; unpcklps %xmm2,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,111,5,101,183,0,0 ; movdqa 0xb765(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,5,122,183,0,0 ; movdqa 0xb77a(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -31126,7 +31470,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
DB 15,20,240 ; unpcklps %xmm0,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,29,54,182,0,0 ; paddd 0xb636(%rip),%xmm3 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,29,75,182,0,0 ; paddd 0xb64b(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
DB 102,73,15,126,218 ; movq %xmm3,%r10
@@ -31177,7 +31521,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,51,181,0,0 ; paddd 0xb533(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,13,72,181,0,0 ; paddd 0xb548(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -31194,7 +31538,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
DB 68,15,20,242 ; unpcklps %xmm2,%xmm14
DB 68,15,20,241 ; unpcklps %xmm1,%xmm14
- DB 102,15,254,5,6,181,0,0 ; paddd 0xb506(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,27,181,0,0 ; paddd 0xb51b(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -31232,7 +31576,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,37,57,180,0,0 ; movdqa 0xb439(%rip),%xmm4 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,37,78,180,0,0 ; movdqa 0xb44e(%rip),%xmm4 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -31250,7 +31594,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,11,180,0,0 ; paddd 0xb40b(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,21,32,180,0,0 ; paddd 0xb420(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -31401,7 +31745,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,209 ; paddd %xmm1,%xmm2
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,254,218 ; paddd %xmm2,%xmm3
- DB 102,68,15,111,21,215,183,0,0 ; movdqa 0xb7d7(%rip),%xmm10 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,68,15,111,21,236,183,0,0 ; movdqa 0xb7ec(%rip),%xmm10 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,112,235,245 ; pshufd $0xf5,%xmm3,%xmm5
DB 102,65,15,244,218 ; pmuludq %xmm10,%xmm3
DB 102,15,112,227,232 ; pshufd $0xe8,%xmm3,%xmm4
@@ -31424,7 +31768,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,222 ; unpcklps %xmm6,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
- DB 102,15,254,45,217,176,0,0 ; paddd 0xb0d9(%rip),%xmm5 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,45,238,176,0,0 ; paddd 0xb0ee(%rip),%xmm5 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
DB 102,73,15,126,241 ; movq %xmm6,%r9
DB 102,73,15,126,234 ; movq %xmm5,%r10
@@ -31441,7 +31785,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,247 ; unpcklps %xmm7,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,37,175,176,0,0 ; paddd 0xb0af(%rip),%xmm4 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,37,196,176,0,0 ; paddd 0xb0c4(%rip),%xmm4 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,226 ; movq %xmm4,%r10
@@ -31458,7 +31802,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,239 ; unpcklps %xmm7,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,61,198,182,0,0 ; movaps 0xb6c6(%rip),%xmm7 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,61,219,182,0,0 ; movaps 0xb6db(%rip),%xmm7 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,199 ; addps %xmm7,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 68,15,88,207 ; addps %xmm7,%xmm9
@@ -31496,7 +31840,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,234 ; unpcklps %xmm2,%xmm13
DB 68,15,20,239 ; unpcklps %xmm7,%xmm13
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,254,21,134,175,0,0 ; paddd 0xaf86(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,21,155,175,0,0 ; paddd 0xaf9b(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -31513,7 +31857,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,70,15,16,12,139 ; movss (%rbx,%r9,4),%xmm9
DB 65,15,20,209 ; unpcklps %xmm9,%xmm2
DB 15,20,215 ; unpcklps %xmm7,%xmm2
- DB 102,15,254,5,91,175,0,0 ; paddd 0xaf5b(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,112,175,0,0 ; paddd 0xaf70(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -31554,7 +31898,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
DB 102,15,254,92,36,32 ; paddd 0x20(%rsp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,68,15,111,53,25,181,0,0 ; movdqa 0xb519(%rip),%xmm14 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,68,15,111,53,46,181,0,0 ; movdqa 0xb52e(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4
@@ -31575,7 +31919,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,228 ; unpcklps %xmm4,%xmm12
DB 68,15,20,229 ; unpcklps %xmm5,%xmm12
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,61,34,174,0,0 ; movdqa 0xae22(%rip),%xmm7 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,61,55,174,0,0 ; movdqa 0xae37(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,231 ; paddd %xmm7,%xmm4
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31593,7 +31937,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 15,20,244 ; unpcklps %xmm4,%xmm6
- DB 102,68,15,111,5,243,173,0,0 ; movdqa 0xadf3(%rip),%xmm8 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,5,8,174,0,0 ; movdqa 0xae08(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,216 ; paddd %xmm8,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -31707,7 +32051,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,68,15,111,108,36,32 ; movdqa 0x20(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,86,178,0,0 ; movdqa 0xb256(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,107,178,0,0 ; movdqa 0xb26b(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -31729,7 +32073,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,205 ; unpcklps %xmm5,%xmm9
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,93,171,0,0 ; movdqa 0xab5d(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,29,114,171,0,0 ; movdqa 0xab72(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31837,7 +32181,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
- DB 102,15,111,5,27,176,0,0 ; movdqa 0xb01b(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,48,176,0,0 ; movdqa 0xb030(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
DB 102,15,112,250,232 ; pshufd $0xe8,%xmm2,%xmm7
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
@@ -31858,7 +32202,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,203 ; unpcklps %xmm3,%xmm9
DB 102,15,111,215 ; movdqa %xmm7,%xmm2
- DB 102,15,111,5,38,169,0,0 ; movdqa 0xa926(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,5,59,169,0,0 ; movdqa 0xa93b(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -31876,7 +32220,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
DB 15,20,243 ; unpcklps %xmm3,%xmm6
DB 15,20,242 ; unpcklps %xmm2,%xmm6
- DB 102,68,15,111,45,247,168,0,0 ; movdqa 0xa8f7(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,45,12,169,0,0 ; movdqa 0xa90c(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,253 ; paddd %xmm13,%xmm7
DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -31896,7 +32240,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,250 ; unpcklps %xmm2,%xmm7
DB 102,68,15,254,220 ; paddd %xmm4,%xmm11
DB 102,65,15,112,219,245 ; pshufd $0xf5,%xmm11,%xmm3
- DB 102,15,111,37,13,175,0,0 ; movdqa 0xaf0d(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,37,34,175,0,0 ; movdqa 0xaf22(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,68,15,244,220 ; pmuludq %xmm4,%xmm11
DB 102,65,15,112,211,232 ; pshufd $0xe8,%xmm11,%xmm2
DB 102,15,244,220 ; pmuludq %xmm4,%xmm3
@@ -31997,7 +32341,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,202 ; movdqa %xmm10,%xmm1
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,67,173,0,0 ; movdqa 0xad43(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,88,173,0,0 ; movdqa 0xad58(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32019,7 +32363,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,212 ; unpcklps %xmm4,%xmm2
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
- DB 102,15,111,61,76,166,0,0 ; movdqa 0xa64c(%rip),%xmm7 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,61,97,166,0,0 ; movdqa 0xa661(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,223 ; paddd %xmm7,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32037,7 +32381,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,220 ; unpcklps %xmm4,%xmm3
- DB 102,68,15,111,13,29,166,0,0 ; movdqa 0xa61d(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,13,50,166,0,0 ; movdqa 0xa632(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32149,7 +32493,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,246 ; unpcklps %xmm6,%xmm14
DB 68,15,20,243 ; unpcklps %xmm3,%xmm14
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
- DB 102,68,15,111,21,13,164,0,0 ; movdqa 0xa40d(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,34,164,0,0 ; movdqa 0xa422(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,218 ; paddd %xmm10,%xmm3
DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
DB 102,73,15,126,241 ; movq %xmm6,%r9
@@ -32270,7 +32614,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,116,36,32 ; movdqa 0x20(%rsp),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,29,132,168,0,0 ; movdqa 0xa884(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,153,168,0,0 ; movdqa 0xa899(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -32292,7 +32636,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,68,15,111,5,140,161,0,0 ; movdqa 0xa18c(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,5,161,161,0,0 ; movdqa 0xa1a1(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -32398,7 +32742,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,60,36 ; paddd (%rsp),%xmm7
DB 102,15,254,247 ; paddd %xmm7,%xmm6
DB 102,15,112,206,245 ; pshufd $0xf5,%xmm6,%xmm1
- DB 102,15,111,21,79,166,0,0 ; movdqa 0xa64f(%rip),%xmm2 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,21,100,166,0,0 ; movdqa 0xa664(%rip),%xmm2 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,242 ; pmuludq %xmm2,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -32420,7 +32764,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,86,159,0,0 ; paddd 0x9f56(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,13,107,159,0,0 ; paddd 0x9f6b(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -32476,7 +32820,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,53,88,158,0,0 ; movdqa 0x9e58(%rip),%xmm6 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,53,109,158,0,0 ; movdqa 0x9e6d(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -32494,7 +32838,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,70,15,16,60,139 ; movss (%rbx,%r9,4),%xmm15
DB 65,15,20,207 ; unpcklps %xmm15,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,41,158,0,0 ; paddd 0x9e29(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,21,62,158,0,0 ; paddd 0x9e3e(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -32556,7 +32900,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,5,157,0,0 ; movaps 0x9d05(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,26,157,0,0 ; movaps 0x9d1a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,164,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm4
DB 15,40,172,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm5
DB 15,40,180,36,16,1,0,0 ; movaps 0x110(%rsp),%xmm6
@@ -32564,9 +32908,6 @@ _sk_clut_4D_sse2 LABEL PROC
DB 72,129,196,48,1,0,0 ; add $0x130,%rsp
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
- DB 144 ; nop
- DB 144 ; nop
- DB 144 ; nop
PUBLIC _sk_start_pipeline_hsw_8bit
_sk_start_pipeline_hsw_8bit LABEL PROC
@@ -32599,7 +32940,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 223a5 <_sk_start_pipeline_hsw_8bit+0x10d>
+ DB 15,131,138,0,0,0 ; jae 2296d <_sk_start_pipeline_hsw_8bit+0x10d>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,16 ; lea 0x10(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -32609,7 +32950,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
DB 72,57,157,248,254,255,255 ; cmp %rbx,-0x108(%rbp)
- DB 119,36 ; ja 22381 <_sk_start_pipeline_hsw_8bit+0xe9>
+ DB 119,36 ; ja 22949 <_sk_start_pipeline_hsw_8bit+0xe9>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -32618,17 +32959,17 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,32 ; add $0x20,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 2235d <_sk_start_pipeline_hsw_8bit+0xc5>
+ DB 118,220 ; jbe 22925 <_sk_start_pipeline_hsw_8bit+0xc5>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 22399 <_sk_start_pipeline_hsw_8bit+0x101>
+ DB 116,16 ; je 22961 <_sk_start_pipeline_hsw_8bit+0x101>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 22334 <_sk_start_pipeline_hsw_8bit+0x9c>
+ DB 117,143 ; jne 228fc <_sk_start_pipeline_hsw_8bit+0x9c>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -32666,7 +33007,7 @@ _sk_uniform_color_hsw_8bit LABEL PROC
PUBLIC _sk_set_rgb_hsw_8bit
_sk_set_rgb_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 197,250,16,37,161,145,0,0 ; vmovss 0x91a1(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,250,16,37,197,145,0,0 ; vmovss 0x91c5(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,218,89,40 ; vmulss (%rax),%xmm4,%xmm5
DB 196,225,250,44,205 ; vcvttss2si %xmm5,%rcx
DB 197,218,89,104,4 ; vmulss 0x4(%rax),%xmm4,%xmm5
@@ -32679,7 +33020,7 @@ _sk_set_rgb_hsw_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4
- DB 197,253,111,45,237,150,0,0 ; vmovdqa 0x96ed(%rip),%ymm5 # 2bb40 <_sk_overlay_sse2_8bit+0xa1f>
+ DB 197,253,111,45,5,151,0,0 ; vmovdqa 0x9705(%rip),%ymm5 # 2c120 <_sk_overlay_sse2_8bit+0xa13>
DB 197,245,219,205 ; vpand %ymm5,%ymm1,%ymm1
DB 197,253,219,197 ; vpand %ymm5,%ymm0,%ymm0
DB 197,221,235,192 ; vpor %ymm0,%ymm4,%ymm0
@@ -32689,10 +33030,10 @@ _sk_set_rgb_hsw_8bit LABEL PROC
PUBLIC _sk_premul_hsw_8bit
_sk_premul_hsw_8bit LABEL PROC
- DB 197,253,111,37,241,150,0,0 ; vmovdqa 0x96f1(%rip),%ymm4 # 2bb60 <_sk_overlay_sse2_8bit+0xa3f>
+ DB 197,253,111,37,9,151,0,0 ; vmovdqa 0x9709(%rip),%ymm4 # 2c140 <_sk_overlay_sse2_8bit+0xa33>
DB 196,226,125,0,236 ; vpshufb %ymm4,%ymm0,%ymm5
DB 196,226,117,0,228 ; vpshufb %ymm4,%ymm1,%ymm4
- DB 197,253,111,53,255,150,0,0 ; vmovdqa 0x96ff(%rip),%ymm6 # 2bb80 <_sk_overlay_sse2_8bit+0xa5f>
+ DB 197,253,111,53,23,151,0,0 ; vmovdqa 0x9717(%rip),%ymm6 # 2c160 <_sk_overlay_sse2_8bit+0xa53>
DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
DB 197,213,235,238 ; vpor %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -32730,7 +33071,7 @@ _sk_premul_hsw_8bit LABEL PROC
PUBLIC _sk_swap_rb_hsw_8bit
_sk_swap_rb_hsw_8bit LABEL PROC
- DB 197,253,111,37,119,150,0,0 ; vmovdqa 0x9677(%rip),%ymm4 # 2bba0 <_sk_overlay_sse2_8bit+0xa7f>
+ DB 197,253,111,37,143,150,0,0 ; vmovdqa 0x968f(%rip),%ymm4 # 2c180 <_sk_overlay_sse2_8bit+0xa73>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32755,7 +33096,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 22579 <_sk_load_8888_hsw_8bit+0x32>
+ DB 117,17 ; jne 22b41 <_sk_load_8888_hsw_8bit+0x32>
DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32765,14 +33106,14 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,231 ; ja 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 119,231 ; ja 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 226b0 <_sk_load_8888_hsw_8bit+0x169>
+ DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 22c78 <_sk_load_8888_hsw_8bit+0x169>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 235,203 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32780,7 +33121,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,162 ; jmp 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 235,162 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32793,7 +33134,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,83,255,255,255 ; jmpq 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 233,83,255,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32802,7 +33143,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,23,255,255,255 ; jmpq 2256f <_sk_load_8888_hsw_8bit+0x28>
+ DB 233,23,255,255,255 ; jmpq 22b37 <_sk_load_8888_hsw_8bit+0x28>
DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32816,7 +33157,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,199,254,255,255 ; jmpq 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 233,199,254,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 102,144 ; xchg %ax,%ax
DB 242,254 ; repnz (bad)
DB 255 ; (bad)
@@ -32867,7 +33208,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 2271e <_sk_load_8888_dst_hsw_8bit+0x32>
+ DB 117,17 ; jne 22ce6 <_sk_load_8888_dst_hsw_8bit+0x32>
DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32877,14 +33218,14 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,231 ; ja 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 119,231 ; ja 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 22854 <_sk_load_8888_dst_hsw_8bit+0x168>
+ DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 22e1c <_sk_load_8888_dst_hsw_8bit+0x168>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 235,203 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32892,7 +33233,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,162 ; jmp 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 235,162 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32905,7 +33246,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,83,255,255,255 ; jmpq 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 233,83,255,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32914,7 +33255,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,23,255,255,255 ; jmpq 22714 <_sk_load_8888_dst_hsw_8bit+0x28>
+ DB 233,23,255,255,255 ; jmpq 22cdc <_sk_load_8888_dst_hsw_8bit+0x28>
DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32928,7 +33269,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,199,254,255,255 ; jmpq 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 233,199,254,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 144 ; nop
DB 243,254 ; repz (bad)
DB 255 ; (bad)
@@ -32979,7 +33320,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 228c2 <_sk_store_8888_hsw_8bit+0x32>
+ DB 117,17 ; jne 22e8a <_sk_store_8888_hsw_8bit+0x32>
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
DB 196,161,126,127,76,130,32 ; vmovdqu %ymm1,0x20(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32987,17 +33328,17 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 119,239 ; ja 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 2298c <_sk_store_8888_hsw_8bit+0xfc>
+ DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 22f54 <_sk_store_8888_hsw_8bit+0xfc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,4,130 ; vmovd %xmm0,(%rdx,%r8,4)
- DB 235,211 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,211 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,163,121,22,68,130,8,2 ; vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
DB 196,161,121,214,4,130 ; vmovq %xmm0,(%rdx,%r8,4)
- DB 235,195 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,195 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,163,121,22,100,130,24,2 ; vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4)
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
@@ -33005,12 +33346,12 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,161,121,126,100,130,16 ; vmovd %xmm4,0x10(%rdx,%r8,4)
DB 196,161,122,127,4,130 ; vmovdqu %xmm0,(%rdx,%r8,4)
- DB 235,146 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,146 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,163,121,22,76,130,40,2 ; vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4)
DB 196,163,121,22,76,130,36,1 ; vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4)
DB 196,161,121,126,76,130,32 ; vmovd %xmm1,0x20(%rdx,%r8,4)
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
- DB 233,112,255,255,255 ; jmpq 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 233,112,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
DB 196,163,121,22,100,130,56,2 ; vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4)
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
@@ -33019,7 +33360,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,161,121,126,100,130,48 ; vmovd %xmm4,0x30(%rdx,%r8,4)
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
DB 196,161,122,127,76,130,32 ; vmovdqu %xmm1,0x20(%rdx,%r8,4)
- DB 233,53,255,255,255 ; jmpq 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 233,53,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 87 ; push %rdi
DB 255 ; (bad)
@@ -33032,7 +33373,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 229a1 <_sk_store_8888_hsw_8bit+0x111>
+ DB 125,255 ; jge 22f69 <_sk_store_8888_hsw_8bit+0x111>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -33043,7 +33384,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 229b9 <_sk_store_8888_hsw_8bit+0x129>
+ DB 235,255 ; jmp 22f81 <_sk_store_8888_hsw_8bit+0x129>
DB 255 ; (bad)
DB 255 ; (bad)
DB 222,255 ; fdivrp %st,%st(7)
@@ -33067,10 +33408,10 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 22a0c <_sk_load_bgra_hsw_8bit+0x44>
+ DB 117,35 ; jne 22fd4 <_sk_load_bgra_hsw_8bit+0x44>
DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
- DB 197,253,111,37,194,145,0,0 ; vmovdqa 0x91c2(%rip),%ymm4 # 2bbc0 <_sk_overlay_sse2_8bit+0xa9f>
+ DB 197,253,111,37,218,145,0,0 ; vmovdqa 0x91da(%rip),%ymm4 # 2c1a0 <_sk_overlay_sse2_8bit+0xa93>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33080,14 +33421,14 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,213 ; ja 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 119,213 ; ja 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 22b44 <_sk_load_bgra_hsw_8bit+0x17c>
+ DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 2310c <_sk_load_bgra_hsw_8bit+0x17c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0
- DB 235,185 ; jmp 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 235,185 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33095,7 +33436,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,144 ; jmp 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 235,144 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33108,7 +33449,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,65,255,255,255 ; jmpq 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 233,65,255,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33117,7 +33458,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,5,255,255,255 ; jmpq 229f0 <_sk_load_bgra_hsw_8bit+0x28>
+ DB 233,5,255,255,255 ; jmpq 22fb8 <_sk_load_bgra_hsw_8bit+0x28>
DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33131,7 +33472,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,181,254,255,255 ; jmpq 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 233,181,254,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 241 ; icebp
DB 254 ; (bad)
@@ -33180,10 +33521,10 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 22bc4 <_sk_load_bgra_dst_hsw_8bit+0x44>
+ DB 117,35 ; jne 2318c <_sk_load_bgra_dst_hsw_8bit+0x44>
DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
- DB 197,253,111,37,42,144,0,0 ; vmovdqa 0x902a(%rip),%ymm4 # 2bbe0 <_sk_overlay_sse2_8bit+0xabf>
+ DB 197,253,111,37,66,144,0,0 ; vmovdqa 0x9042(%rip),%ymm4 # 2c1c0 <_sk_overlay_sse2_8bit+0xab3>
DB 196,226,109,0,212 ; vpshufb %ymm4,%ymm2,%ymm2
DB 196,226,101,0,220 ; vpshufb %ymm4,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33193,14 +33534,14 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,213 ; ja 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 119,213 ; ja 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 22cfc <_sk_load_bgra_dst_hsw_8bit+0x17c>
+ DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 232c4 <_sk_load_bgra_dst_hsw_8bit+0x17c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2
- DB 235,185 ; jmp 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 235,185 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33208,7 +33549,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,144 ; jmp 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 235,144 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33221,7 +33562,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,65,255,255,255 ; jmpq 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 233,65,255,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33230,7 +33571,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,5,255,255,255 ; jmpq 22ba8 <_sk_load_bgra_dst_hsw_8bit+0x28>
+ DB 233,5,255,255,255 ; jmpq 23170 <_sk_load_bgra_dst_hsw_8bit+0x28>
DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33244,7 +33585,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,181,254,255,255 ; jmpq 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 233,181,254,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 241 ; icebp
DB 254 ; (bad)
@@ -33292,11 +33633,11 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 197,253,111,37,164,142,0,0 ; vmovdqa 0x8ea4(%rip),%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0xadf>
+ DB 197,253,111,37,188,142,0,0 ; vmovdqa 0x8ebc(%rip),%ymm4 # 2c1e0 <_sk_overlay_sse2_8bit+0xad3>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 22d7c <_sk_store_bgra_hsw_8bit+0x44>
+ DB 117,17 ; jne 23344 <_sk_store_bgra_hsw_8bit+0x44>
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
DB 196,161,126,127,108,130,32 ; vmovdqu %ymm5,0x20(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33304,17 +33645,17 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 119,239 ; ja 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 22e44 <_sk_store_bgra_hsw_8bit+0x10c>
+ DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 2340c <_sk_store_bgra_hsw_8bit+0x10c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,36,130 ; vmovd %xmm4,(%rdx,%r8,4)
- DB 235,211 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,211 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,163,121,22,100,130,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4)
DB 196,161,121,214,36,130 ; vmovq %xmm4,(%rdx,%r8,4)
- DB 235,195 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,195 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,163,121,22,108,130,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -33322,12 +33663,12 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,161,121,126,108,130,16 ; vmovd %xmm5,0x10(%rdx,%r8,4)
DB 196,161,122,127,36,130 ; vmovdqu %xmm4,(%rdx,%r8,4)
- DB 235,146 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,146 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,163,121,22,108,130,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4)
DB 196,163,121,22,108,130,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4)
DB 196,161,121,126,108,130,32 ; vmovd %xmm5,0x20(%rdx,%r8,4)
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
- DB 233,112,255,255,255 ; jmpq 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 233,112,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,163,121,22,116,130,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -33336,7 +33677,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,161,121,126,116,130,48 ; vmovd %xmm6,0x30(%rdx,%r8,4)
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
DB 196,161,122,127,108,130,32 ; vmovdqu %xmm5,0x20(%rdx,%r8,4)
- DB 233,53,255,255,255 ; jmpq 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 233,53,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 144 ; nop
DB 89 ; pop %rcx
DB 255 ; (bad)
@@ -33349,7 +33690,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,255 ; jg 22e59 <_sk_store_bgra_hsw_8bit+0x121>
+ DB 127,255 ; jg 23421 <_sk_store_bgra_hsw_8bit+0x121>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33385,7 +33726,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 22ec0 <_sk_load_a8_hsw_8bit+0x40>
+ DB 117,35 ; jne 23488 <_sk_load_a8_hsw_8bit+0x40>
DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0
DB 197,249,112,200,78 ; vpshufd $0x4e,%xmm0,%xmm1
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
@@ -33398,35 +33739,35 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 119,210 ; ja 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 22f9c <_sk_load_a8_hsw_8bit+0x11c>
+ DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 23564 <_sk_load_a8_hsw_8bit+0x11c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,179 ; jmp 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,179 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 235,150 ; jmp 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,150 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,105,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,105,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,60,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,60,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -33434,7 +33775,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,7,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,7,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 73,255 ; rex.WB (bad)
DB 255 ; (bad)
DB 255,96,255 ; jmpq *-0x1(%rax)
@@ -33444,7 +33785,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 22fb1 <_sk_load_a8_hsw_8bit+0x131>
+ DB 125,255 ; jge 23579 <_sk_load_a8_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33479,7 +33820,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 23018 <_sk_load_a8_dst_hsw_8bit+0x40>
+ DB 117,35 ; jne 235e0 <_sk_load_a8_dst_hsw_8bit+0x40>
DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2
DB 197,249,112,218,78 ; vpshufd $0x4e,%xmm2,%xmm3
DB 196,226,125,49,219 ; vpmovzxbd %xmm3,%ymm3
@@ -33492,35 +33833,35 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 119,210 ; ja 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 230f4 <_sk_load_a8_dst_hsw_8bit+0x11c>
+ DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 236bc <_sk_load_a8_dst_hsw_8bit+0x11c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,179 ; jmp 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,179 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 235,150 ; jmp 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,150 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,105,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,105,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,60,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,60,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -33528,7 +33869,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,7,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,7,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 73,255 ; rex.WB (bad)
DB 255 ; (bad)
DB 255,96,255 ; jmpq *-0x1(%rax)
@@ -33538,7 +33879,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 23109 <_sk_load_a8_dst_hsw_8bit+0x131>
+ DB 125,255 ; jge 236d1 <_sk_load_a8_dst_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33572,49 +33913,49 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 197,253,111,37,208,138,0,0 ; vmovdqa 0x8ad0(%rip),%ymm4 # 2bc20 <_sk_overlay_sse2_8bit+0xaff>
+ DB 197,253,111,37,232,138,0,0 ; vmovdqa 0x8ae8(%rip),%ymm4 # 2c200 <_sk_overlay_sse2_8bit+0xaf3>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5
- DB 197,249,111,53,205,148,0,0 ; vmovdqa 0x94cd(%rip),%xmm6 # 2c630 <_sk_overlay_sse2_8bit+0x150f>
+ DB 197,249,111,53,229,148,0,0 ; vmovdqa 0x94e5(%rip),%xmm6 # 2cc10 <_sk_overlay_sse2_8bit+0x1503>
DB 196,226,81,0,238 ; vpshufb %xmm6,%xmm5,%xmm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4
DB 196,226,89,0,230 ; vpshufb %xmm6,%xmm4,%xmm4
DB 197,217,108,229 ; vpunpcklqdq %xmm5,%xmm4,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 2318b <_sk_store_a8_hsw_8bit+0x5b>
+ DB 117,10 ; jne 23753 <_sk_store_a8_hsw_8bit+0x5b>
DB 196,161,122,127,36,2 ; vmovdqu %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 119,239 ; ja 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 2322c <_sk_store_a8_hsw_8bit+0xfc>
+ DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 237f4 <_sk_store_a8_hsw_8bit+0xfc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,163,121,20,36,2,0 ; vpextrb $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,210 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,210 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,2,2 ; vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1)
DB 196,163,121,21,36,2,0 ; vpextrw $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,193 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,193 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,6,6 ; vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1)
DB 196,163,121,20,100,2,5,5 ; vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1)
DB 196,163,121,20,100,2,4,4 ; vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1)
DB 196,161,121,126,36,2 ; vmovd %xmm4,(%rdx,%r8,1)
- DB 235,161 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,161 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,10,10 ; vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1)
DB 196,163,121,20,100,2,9,9 ; vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1)
DB 196,163,121,20,100,2,8,8 ; vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1)
- DB 235,32 ; jmp 23220 <_sk_store_a8_hsw_8bit+0xf0>
+ DB 235,32 ; jmp 237e8 <_sk_store_a8_hsw_8bit+0xf0>
DB 196,163,121,20,100,2,14,14 ; vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1)
DB 196,163,121,20,100,2,13,13 ; vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1)
DB 196,163,121,20,100,2,12,12 ; vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1)
DB 196,163,121,22,100,2,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1)
DB 196,161,121,214,36,2 ; vmovq %xmm4,(%rdx,%r8,1)
- DB 233,92,255,255,255 ; jmpq 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 233,92,255,255,255 ; jmpq 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 144 ; nop
DB 128,255,255 ; cmp $0xff,%bh
DB 255,145,255,255,255,137 ; callq *-0x76000001(%rcx)
@@ -33660,15 +34001,15 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,61 ; jne 232c2 <_sk_load_g8_hsw_8bit+0x5a>
+ DB 117,61 ; jne 2388a <_sk_load_g8_hsw_8bit+0x5a>
DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0
DB 196,226,125,49,200 ; vpmovzxbd %xmm0,%ymm1
DB 197,249,112,192,78 ; vpshufd $0x4e,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
- DB 196,226,125,88,37,125,132,0,0 ; vpbroadcastd 0x847d(%rip),%ymm4 # 2b720 <_sk_overlay_sse2_8bit+0x5ff>
+ DB 196,226,125,88,37,161,132,0,0 ; vpbroadcastd 0x84a1(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff>
DB 196,226,125,64,236 ; vpmulld %ymm4,%ymm0,%ymm5
DB 196,226,117,64,196 ; vpmulld %ymm4,%ymm1,%ymm0
- DB 196,226,125,88,13,110,132,0,0 ; vpbroadcastd 0x846e(%rip),%ymm1 # 2b724 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,88,13,146,132,0,0 ; vpbroadcastd 0x8492(%rip),%ymm1 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
DB 197,253,235,193 ; vpor %ymm1,%ymm0,%ymm0
DB 197,213,235,201 ; vpor %ymm1,%ymm5,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33677,35 +34018,35 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,184 ; ja 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 119,184 ; ja 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 233a4 <_sk_load_g8_hsw_8bit+0x13c>
+ DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 2396c <_sk_load_g8_hsw_8bit+0x13c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,153 ; jmp 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 235,153 ; jmp 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 233,121,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,121,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,76,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,76,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,31,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,31,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -33713,7 +34054,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,234,254,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,234,254,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 67,255 ; rex.XB (bad)
DB 255 ; (bad)
@@ -33725,7 +34066,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 233b9 <_sk_load_g8_hsw_8bit+0x151>
+ DB 122,255 ; jp 23981 <_sk_load_g8_hsw_8bit+0x151>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -33759,15 +34100,15 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,61 ; jne 2343a <_sk_load_g8_dst_hsw_8bit+0x5a>
+ DB 117,61 ; jne 23a02 <_sk_load_g8_dst_hsw_8bit+0x5a>
DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2
DB 196,226,125,49,218 ; vpmovzxbd %xmm2,%ymm3
DB 197,249,112,210,78 ; vpshufd $0x4e,%xmm2,%xmm2
DB 196,226,125,49,210 ; vpmovzxbd %xmm2,%ymm2
- DB 196,226,125,88,37,5,131,0,0 ; vpbroadcastd 0x8305(%rip),%ymm4 # 2b720 <_sk_overlay_sse2_8bit+0x5ff>
+ DB 196,226,125,88,37,41,131,0,0 ; vpbroadcastd 0x8329(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff>
DB 196,226,109,64,236 ; vpmulld %ymm4,%ymm2,%ymm5
DB 196,226,101,64,212 ; vpmulld %ymm4,%ymm3,%ymm2
- DB 196,226,125,88,29,246,130,0,0 ; vpbroadcastd 0x82f6(%rip),%ymm3 # 2b724 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,88,29,26,131,0,0 ; vpbroadcastd 0x831a(%rip),%ymm3 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
DB 197,237,235,211 ; vpor %ymm3,%ymm2,%ymm2
DB 197,213,235,219 ; vpor %ymm3,%ymm5,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33776,35 +34117,35 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,184 ; ja 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 119,184 ; ja 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 2351c <_sk_load_g8_dst_hsw_8bit+0x13c>
+ DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 23ae4 <_sk_load_g8_dst_hsw_8bit+0x13c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,153 ; jmp 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 235,153 ; jmp 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 233,121,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,121,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,76,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,76,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,31,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,31,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -33812,7 +34153,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,234,254,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,234,254,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 67,255 ; rex.XB (bad)
DB 255 ; (bad)
@@ -33824,7 +34165,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23531 <_sk_load_g8_dst_hsw_8bit+0x151>
+ DB 122,255 ; jp 23af9 <_sk_load_g8_dst_hsw_8bit+0x151>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -33859,10 +34200,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,222,0,0,0 ; jne 2365b <_sk_srcover_rgba_8888_hsw_8bit+0x103>
+ DB 15,133,222,0,0,0 ; jne 23c23 <_sk_srcover_rgba_8888_hsw_8bit+0x103>
DB 196,33,126,111,76,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%ymm9
DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11
- DB 197,253,111,53,174,134,0,0 ; vmovdqa 0x86ae(%rip),%ymm6 # 2bc40 <_sk_overlay_sse2_8bit+0xb1f>
+ DB 197,253,111,53,198,134,0,0 ; vmovdqa 0x86c6(%rip),%ymm6 # 2c220 <_sk_overlay_sse2_8bit+0xb13>
DB 196,226,117,0,254 ; vpshufb %ymm6,%ymm1,%ymm7
DB 196,226,125,0,246 ; vpshufb %ymm6,%ymm0,%ymm6
DB 196,66,125,48,195 ; vpmovzxbw %xmm11,%ymm8
@@ -33900,7 +34241,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 197,221,252,224 ; vpaddb %ymm0,%ymm4,%ymm4
DB 197,213,252,233 ; vpaddb %ymm1,%ymm5,%ymm5
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 23692 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
+ DB 117,72 ; jne 23c5a <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
DB 196,161,126,127,108,138,32 ; vmovdqu %ymm5,0x20(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33911,25 +34252,25 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,65,37,239,219 ; vpxor %ymm11,%ymm11,%ymm11
DB 254,200 ; dec %al
DB 60,14 ; cmp $0xe,%al
- DB 15,135,22,255,255,255 ; ja 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 15,135,22,255,255,255 ; ja 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 23868 <_sk_srcover_rgba_8888_hsw_8bit+0x310>
+ DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 23e30 <_sk_srcover_rgba_8888_hsw_8bit+0x310>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,33,121,110,28,138 ; vmovd (%rdx,%r9,4),%xmm11
- DB 233,248,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,248,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 65,128,224,15 ; and $0xf,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,14 ; cmp $0xe,%r8b
- DB 119,184 ; ja 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 119,184 ; ja 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 238a4 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
+ DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 23e6c <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,36,138 ; vmovd %xmm4,(%rdx,%r9,4)
- DB 235,156 ; jmp 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 235,156 ; jmp 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,161,121,110,100,138,8 ; vmovd 0x8(%rdx,%r9,4),%xmm4
DB 196,226,121,89,236 ; vpbroadcastq %xmm4,%xmm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -33937,7 +34278,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,162,121,53,52,138 ; vpmovzxdq (%rdx,%r9,4),%xmm6
DB 197,249,112,246,232 ; vpshufd $0xe8,%xmm6,%xmm6
DB 196,99,37,2,222,3 ; vpblendd $0x3,%ymm6,%ymm11,%ymm11
- DB 233,162,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,162,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,161,121,110,100,138,24 ; vmovd 0x18(%rdx,%r9,4),%xmm4
DB 196,226,125,89,236 ; vpbroadcastq %xmm4,%ymm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -33950,7 +34291,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,37,56,222,1 ; vinserti128 $0x1,%xmm6,%ymm11,%ymm11
DB 196,161,122,111,52,138 ; vmovdqu (%rdx,%r9,4),%xmm6
DB 196,67,77,2,219,240 ; vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- DB 233,82,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,82,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,161,121,110,100,138,40 ; vmovd 0x28(%rdx,%r9,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -33959,7 +34300,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,53,2,205,15 ; vpblendd $0xf,%ymm5,%ymm9,%ymm9
DB 196,161,121,110,108,138,32 ; vmovd 0x20(%rdx,%r9,4),%xmm5
DB 196,99,53,2,205,1 ; vpblendd $0x1,%ymm5,%ymm9,%ymm9
- DB 233,22,254,255,255 ; jmpq 23584 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
+ DB 233,22,254,255,255 ; jmpq 23b4c <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
DB 196,161,121,110,100,138,56 ; vmovd 0x38(%rdx,%r9,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -33973,10 +34314,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11
DB 196,161,122,111,116,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%xmm6
DB 196,67,77,2,201,240 ; vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- DB 233,198,253,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,198,253,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,163,121,22,100,138,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
DB 196,161,121,214,36,138 ; vmovq %xmm4,(%rdx,%r9,4)
- DB 233,128,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,128,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,163,121,22,108,138,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -33984,12 +34325,12 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,161,121,126,108,138,16 ; vmovd %xmm5,0x10(%rdx,%r9,4)
DB 196,161,122,127,36,138 ; vmovdqu %xmm4,(%rdx,%r9,4)
- DB 233,76,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,76,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,163,121,22,108,138,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4)
DB 196,163,121,22,108,138,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4)
DB 196,161,121,126,108,138,32 ; vmovd %xmm5,0x20(%rdx,%r9,4)
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
- DB 233,42,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,42,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,163,121,22,116,138,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -33998,7 +34339,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,161,121,126,116,138,48 ; vmovd %xmm6,0x30(%rdx,%r9,4)
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
DB 196,161,122,127,108,138,32 ; vmovdqu %xmm5,0x20(%rdx,%r9,4)
- DB 233,239,253,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,239,253,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 31 ; (bad)
DB 254 ; (bad)
DB 255 ; (bad)
@@ -34048,7 +34389,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 238c1 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
+ DB 126,255 ; jle 23e89 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
DB 255 ; (bad)
DB 255,119,255 ; pushq -0x1(%rdi)
DB 255 ; (bad)
@@ -34068,7 +34409,7 @@ PUBLIC _sk_scale_1_float_hsw_8bit
_sk_scale_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,206,124,0,0 ; vmulss 0x7cce(%rip),%xmm4,%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,218,89,37,242,124,0,0 ; vmulss 0x7cf2(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34078,7 +34419,7 @@ _sk_scale_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,37,61,131,0,0 ; vpand 0x833d(%rip),%ymm4,%ymm4 # 2bc60 <_sk_overlay_sse2_8bit+0xb3f>
+ DB 197,221,219,37,85,131,0,0 ; vpand 0x8355(%rip),%ymm4,%ymm4 # 2c240 <_sk_overlay_sse2_8bit+0xb33>
DB 197,221,213,249 ; vpmullw %ymm1,%ymm4,%ymm7
DB 197,93,213,198 ; vpmullw %ymm6,%ymm4,%ymm8
DB 197,93,213,200 ; vpmullw %ymm0,%ymm4,%ymm9
@@ -34110,12 +34451,12 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,191,0,0,0 ; jne 23a5b <_sk_scale_u8_hsw_8bit+0xe0>
+ DB 15,133,191,0,0,0 ; jne 24023 <_sk_scale_u8_hsw_8bit+0xe0>
DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,199,130,0,0 ; vmovdqa 0x82c7(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0xb5f>
+ DB 197,253,111,53,223,130,0,0 ; vmovdqa 0x82df(%rip),%ymm6 # 2c260 <_sk_overlay_sse2_8bit+0xb53>
DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4
DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34154,35 +34495,35 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,50,255,255,255 ; ja 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 15,135,50,255,255,255 ; ja 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 23b44 <_sk_scale_u8_hsw_8bit+0x1c9>
+ DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 2410c <_sk_scale_u8_hsw_8bit+0x1c9>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,16,255,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,16,255,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,240,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,240,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,195,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,195,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,150,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,150,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -34190,7 +34531,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,97,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,97,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 64,255 ; rex (bad)
DB 255 ; (bad)
@@ -34202,7 +34543,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23b59 <_sk_scale_u8_hsw_8bit+0x1de>
+ DB 122,255 ; jp 24121 <_sk_scale_u8_hsw_8bit+0x1de>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34230,7 +34571,7 @@ PUBLIC _sk_lerp_1_float_hsw_8bit
_sk_lerp_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,46,122,0,0 ; vmulss 0x7a2e(%rip),%xmm4,%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,218,89,37,82,122,0,0 ; vmulss 0x7a52(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34240,7 +34581,7 @@ _sk_lerp_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,61,221,128,0,0 ; vpand 0x80dd(%rip),%ymm4,%ymm7 # 2bca0 <_sk_overlay_sse2_8bit+0xb7f>
+ DB 197,221,219,61,245,128,0,0 ; vpand 0x80f5(%rip),%ymm4,%ymm7 # 2c280 <_sk_overlay_sse2_8bit+0xb73>
DB 197,69,213,193 ; vpmullw %ymm1,%ymm7,%ymm8
DB 197,69,213,206 ; vpmullw %ymm6,%ymm7,%ymm9
DB 197,69,213,208 ; vpmullw %ymm0,%ymm7,%ymm10
@@ -34303,12 +34644,12 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,106,1,0,0 ; jne 23e3b <_sk_lerp_u8_hsw_8bit+0x18b>
+ DB 15,133,106,1,0,0 ; jne 24403 <_sk_lerp_u8_hsw_8bit+0x18b>
DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,210,127,0,0 ; vmovdqa 0x7fd2(%rip),%ymm6 # 2bcc0 <_sk_overlay_sse2_8bit+0xb9f>
+ DB 197,253,111,53,234,127,0,0 ; vmovdqa 0x7fea(%rip),%ymm6 # 2c2a0 <_sk_overlay_sse2_8bit+0xb93>
DB 196,98,93,0,206 ; vpshufb %ymm6,%ymm4,%ymm9
DB 196,98,85,0,222 ; vpshufb %ymm6,%ymm5,%ymm11
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34382,35 +34723,35 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,135,254,255,255 ; ja 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 15,135,135,254,255,255 ; ja 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 23f24 <_sk_lerp_u8_hsw_8bit+0x274>
+ DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 244ec <_sk_lerp_u8_hsw_8bit+0x274>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,101,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,101,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,69,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,69,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,24,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,24,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,235,253,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,235,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -34418,7 +34759,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,182,253,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,182,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 64,255 ; rex (bad)
DB 255 ; (bad)
@@ -34430,7 +34771,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23f39 <_sk_lerp_u8_hsw_8bit+0x289>
+ DB 122,255 ; jp 24501 <_sk_lerp_u8_hsw_8bit+0x289>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34471,7 +34812,7 @@ _sk_move_dst_src_hsw_8bit LABEL PROC
PUBLIC _sk_black_color_hsw_8bit
_sk_black_color_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,161,119,0,0 ; vbroadcastss 0x77a1(%rip),%ymm0 # 2b724 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,24,5,197,119,0,0 ; vbroadcastss 0x77c5(%rip),%ymm0 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 255,224 ; jmpq *%rax
@@ -34491,7 +34832,7 @@ _sk_clear_hsw_8bit LABEL PROC
PUBLIC _sk_srcatop_hsw_8bit
_sk_srcatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,55,125,0,0 ; vmovdqa 0x7d37(%rip),%ymm8 # 2bce0 <_sk_overlay_sse2_8bit+0xbbf>
+ DB 197,125,111,5,79,125,0,0 ; vmovdqa 0x7d4f(%rip),%ymm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xbb3>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,232 ; vpshufb %ymm8,%ymm2,%ymm5
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -34566,7 +34907,7 @@ _sk_srcatop_hsw_8bit LABEL PROC
PUBLIC _sk_dstatop_hsw_8bit
_sk_dstatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,242,123,0,0 ; vmovdqa 0x7bf2(%rip),%ymm8 # 2bd00 <_sk_overlay_sse2_8bit+0xbdf>
+ DB 197,125,111,5,10,124,0,0 ; vmovdqa 0x7c0a(%rip),%ymm8 # 2c2e0 <_sk_overlay_sse2_8bit+0xbd3>
DB 196,194,117,0,224 ; vpshufb %ymm8,%ymm1,%ymm4
DB 196,194,125,0,232 ; vpshufb %ymm8,%ymm0,%ymm5
DB 196,98,125,48,210 ; vpmovzxbw %xmm2,%ymm10
@@ -34641,7 +34982,7 @@ _sk_dstatop_hsw_8bit LABEL PROC
PUBLIC _sk_srcin_hsw_8bit
_sk_srcin_hsw_8bit LABEL PROC
- DB 197,253,111,37,169,122,0,0 ; vmovdqa 0x7aa9(%rip),%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0xbff>
+ DB 197,253,111,37,193,122,0,0 ; vmovdqa 0x7ac1(%rip),%ymm4 # 2c300 <_sk_overlay_sse2_8bit+0xbf3>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34679,7 +35020,7 @@ _sk_srcin_hsw_8bit LABEL PROC
PUBLIC _sk_dstin_hsw_8bit
_sk_dstin_hsw_8bit LABEL PROC
- DB 197,253,111,37,31,122,0,0 ; vmovdqa 0x7a1f(%rip),%ymm4 # 2bd40 <_sk_overlay_sse2_8bit+0xc1f>
+ DB 197,253,111,37,55,122,0,0 ; vmovdqa 0x7a37(%rip),%ymm4 # 2c320 <_sk_overlay_sse2_8bit+0xc13>
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,125,48,226 ; vpmovzxbw %xmm2,%ymm4
@@ -34717,7 +35058,7 @@ _sk_dstin_hsw_8bit LABEL PROC
PUBLIC _sk_srcout_hsw_8bit
_sk_srcout_hsw_8bit LABEL PROC
- DB 197,253,111,37,147,121,0,0 ; vmovdqa 0x7993(%rip),%ymm4 # 2bd60 <_sk_overlay_sse2_8bit+0xc3f>
+ DB 197,253,111,37,171,121,0,0 ; vmovdqa 0x79ab(%rip),%ymm4 # 2c340 <_sk_overlay_sse2_8bit+0xc33>
DB 196,226,109,0,236 ; vpshufb %ymm4,%ymm2,%ymm5
DB 196,226,101,0,228 ; vpshufb %ymm4,%ymm3,%ymm4
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -34758,7 +35099,7 @@ _sk_srcout_hsw_8bit LABEL PROC
PUBLIC _sk_dstout_hsw_8bit
_sk_dstout_hsw_8bit LABEL PROC
- DB 197,253,111,37,253,120,0,0 ; vmovdqa 0x78fd(%rip),%ymm4 # 2bd80 <_sk_overlay_sse2_8bit+0xc5f>
+ DB 197,253,111,37,21,121,0,0 ; vmovdqa 0x7915(%rip),%ymm4 # 2c360 <_sk_overlay_sse2_8bit+0xc53>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -34799,7 +35140,7 @@ _sk_dstout_hsw_8bit LABEL PROC
PUBLIC _sk_srcover_hsw_8bit
_sk_srcover_hsw_8bit LABEL PROC
- DB 197,253,111,37,101,120,0,0 ; vmovdqa 0x7865(%rip),%ymm4 # 2bda0 <_sk_overlay_sse2_8bit+0xc7f>
+ DB 197,253,111,37,125,120,0,0 ; vmovdqa 0x787d(%rip),%ymm4 # 2c380 <_sk_overlay_sse2_8bit+0xc73>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,98,125,48,202 ; vpmovzxbw %xmm2,%ymm9
@@ -34841,7 +35182,7 @@ _sk_srcover_hsw_8bit LABEL PROC
PUBLIC _sk_dstover_hsw_8bit
_sk_dstover_hsw_8bit LABEL PROC
- DB 197,253,111,37,198,119,0,0 ; vmovdqa 0x77c6(%rip),%ymm4 # 2bdc0 <_sk_overlay_sse2_8bit+0xc9f>
+ DB 197,253,111,37,222,119,0,0 ; vmovdqa 0x77de(%rip),%ymm4 # 2c3a0 <_sk_overlay_sse2_8bit+0xc93>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,98,125,48,200 ; vpmovzxbw %xmm0,%ymm9
@@ -34921,7 +35262,7 @@ _sk_multiply_hsw_8bit LABEL PROC
DB 72,131,236,56 ; sub $0x38,%rsp
DB 197,253,111,243 ; vmovdqa %ymm3,%ymm6
DB 197,253,111,218 ; vmovdqa %ymm2,%ymm3
- DB 197,125,111,13,131,118,0,0 ; vmovdqa 0x7683(%rip),%ymm9 # 2bde0 <_sk_overlay_sse2_8bit+0xcbf>
+ DB 197,125,111,13,155,118,0,0 ; vmovdqa 0x769b(%rip),%ymm9 # 2c3c0 <_sk_overlay_sse2_8bit+0xcb3>
DB 196,194,101,0,225 ; vpshufb %ymm9,%ymm3,%ymm4
DB 196,194,77,0,233 ; vpshufb %ymm9,%ymm6,%ymm5
DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -35062,7 +35403,7 @@ _sk_screen_hsw_8bit LABEL PROC
PUBLIC _sk_xor__hsw_8bit
_sk_xor__hsw_8bit LABEL PROC
- DB 197,125,111,13,15,116,0,0 ; vmovdqa 0x740f(%rip),%ymm9 # 2be00 <_sk_overlay_sse2_8bit+0xcdf>
+ DB 197,125,111,13,39,116,0,0 ; vmovdqa 0x7427(%rip),%ymm9 # 2c3e0 <_sk_overlay_sse2_8bit+0xcd3>
DB 196,194,109,0,225 ; vpshufb %ymm9,%ymm2,%ymm4
DB 196,194,101,0,249 ; vpshufb %ymm9,%ymm3,%ymm7
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -35137,9 +35478,16 @@ _sk_xor__hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_plus__hsw_8bit
+_sk_plus__hsw_8bit LABEL PROC
+ DB 197,253,220,194 ; vpaddusb %ymm2,%ymm0,%ymm0
+ DB 197,245,220,203 ; vpaddusb %ymm3,%ymm1,%ymm1
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_darken_hsw_8bit
_sk_darken_hsw_8bit LABEL PROC
- DB 197,125,111,5,189,114,0,0 ; vmovdqa 0x72bd(%rip),%ymm8 # 2be20 <_sk_overlay_sse2_8bit+0xcff>
+ DB 197,125,111,5,201,114,0,0 ; vmovdqa 0x72c9(%rip),%ymm8 # 2c400 <_sk_overlay_sse2_8bit+0xcf3>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35212,7 +35560,7 @@ _sk_darken_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,86,106,0,0 ; vpbroadcastd 0x6a56(%rip),%ymm4 # 2b728 <_sk_overlay_sse2_8bit+0x607>
+ DB 196,226,125,88,37,110,106,0,0 ; vpbroadcastd 0x6a6e(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35220,7 +35568,7 @@ _sk_darken_hsw_8bit LABEL PROC
PUBLIC _sk_lighten_hsw_8bit
_sk_lighten_hsw_8bit LABEL PROC
- DB 197,125,111,5,86,113,0,0 ; vmovdqa 0x7156(%rip),%ymm8 # 2be40 <_sk_overlay_sse2_8bit+0xd1f>
+ DB 197,125,111,5,98,113,0,0 ; vmovdqa 0x7162(%rip),%ymm8 # 2c420 <_sk_overlay_sse2_8bit+0xd13>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35293,7 +35641,7 @@ _sk_lighten_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,207,104,0,0 ; vpbroadcastd 0x68cf(%rip),%ymm4 # 2b728 <_sk_overlay_sse2_8bit+0x607>
+ DB 196,226,125,88,37,231,104,0,0 ; vpbroadcastd 0x68e7(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35331,7 +35679,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
DB 196,227,77,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm6,%ymm7
DB 196,227,77,70,228,49 ; vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
DB 197,197,103,228 ; vpackuswb %ymm4,%ymm7,%ymm4
- DB 197,253,111,53,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm6 # 2be60 <_sk_overlay_sse2_8bit+0xd3f>
+ DB 197,253,111,53,100,111,0,0 ; vmovdqa 0x6f64(%rip),%ymm6 # 2c440 <_sk_overlay_sse2_8bit+0xd33>
DB 197,221,219,254 ; vpand %ymm6,%ymm4,%ymm7
DB 197,213,219,246 ; vpand %ymm6,%ymm5,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35345,7 +35693,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
PUBLIC _sk_difference_hsw_8bit
_sk_difference_hsw_8bit LABEL PROC
- DB 197,125,111,5,76,111,0,0 ; vmovdqa 0x6f4c(%rip),%ymm8 # 2be80 <_sk_overlay_sse2_8bit+0xd5f>
+ DB 197,125,111,5,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm8 # 2c460 <_sk_overlay_sse2_8bit+0xd53>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35412,7 +35760,7 @@ _sk_difference_hsw_8bit LABEL PROC
DB 197,197,103,237 ; vpackuswb %ymm5,%ymm7,%ymm5
DB 197,181,218,228 ; vpminub %ymm4,%ymm9,%ymm4
DB 197,165,218,237 ; vpminub %ymm5,%ymm11,%ymm5
- DB 197,253,111,53,22,110,0,0 ; vmovdqa 0x6e16(%rip),%ymm6 # 2bea0 <_sk_overlay_sse2_8bit+0xd7f>
+ DB 197,253,111,53,34,110,0,0 ; vmovdqa 0x6e22(%rip),%ymm6 # 2c480 <_sk_overlay_sse2_8bit+0xd73>
DB 197,213,219,254 ; vpand %ymm6,%ymm5,%ymm7
DB 197,221,219,246 ; vpand %ymm6,%ymm4,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35436,7 +35784,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,227,125,57,203,1 ; vextracti128 $0x1,%ymm1,%xmm3
DB 196,98,125,48,195 ; vpmovzxbw %xmm3,%ymm8
DB 197,126,127,132,36,64,1,0,0 ; vmovdqu %ymm8,0x140(%rsp)
- DB 197,253,111,29,204,109,0,0 ; vmovdqa 0x6dcc(%rip),%ymm3 # 2bec0 <_sk_overlay_sse2_8bit+0xd9f>
+ DB 197,253,111,29,216,109,0,0 ; vmovdqa 0x6dd8(%rip),%ymm3 # 2c4a0 <_sk_overlay_sse2_8bit+0xd93>
DB 196,226,125,0,227 ; vpshufb %ymm3,%ymm0,%ymm4
DB 196,226,117,0,203 ; vpshufb %ymm3,%ymm1,%ymm1
DB 197,125,111,251 ; vmovdqa %ymm3,%ymm15
@@ -35465,7 +35813,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,65,125,111,231 ; vmovdqa %ymm15,%ymm12
DB 196,194,93,0,220 ; vpshufb %ymm12,%ymm4,%ymm3
DB 196,226,125,48,211 ; vpmovzxbw %xmm3,%ymm2
- DB 196,226,125,121,5,78,109,0,0 ; vpbroadcastw 0x6d4e(%rip),%ymm0 # 2bee0 <_sk_overlay_sse2_8bit+0xdbf>
+ DB 196,226,125,121,5,90,109,0,0 ; vpbroadcastw 0x6d5a(%rip),%ymm0 # 2c4c0 <_sk_overlay_sse2_8bit+0xdb3>
DB 197,109,239,248 ; vpxor %ymm0,%ymm2,%ymm15
DB 197,133,213,207 ; vpmullw %ymm7,%ymm15,%ymm1
DB 197,254,127,140,36,160,1,0,0 ; vmovdqu %ymm1,0x1a0(%rsp)
@@ -35565,7 +35913,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,254,111,116,36,96 ; vmovdqu 0x60(%rsp),%ymm6
DB 197,205,253,180,36,128,0,0,0 ; vpaddw 0x80(%rsp),%ymm6,%ymm6
DB 196,193,53,253,252 ; vpaddw %ymm12,%ymm9,%ymm7
- DB 196,98,125,121,5,45,107,0,0 ; vpbroadcastw 0x6b2d(%rip),%ymm8 # 2bee2 <_sk_overlay_sse2_8bit+0xdc1>
+ DB 196,98,125,121,5,57,107,0,0 ; vpbroadcastw 0x6b39(%rip),%ymm8 # 2c4c2 <_sk_overlay_sse2_8bit+0xdb5>
DB 196,193,93,253,224 ; vpaddw %ymm8,%ymm4,%ymm4
DB 197,229,253,220 ; vpaddw %ymm4,%ymm3,%ymm3
DB 196,193,85,253,224 ; vpaddw %ymm8,%ymm5,%ymm4
@@ -35574,7 +35922,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,2,107,0,0 ; vpbroadcastw 0x6b02(%rip),%ymm4 # 2bee4 <_sk_overlay_sse2_8bit+0xdc3>
+ DB 196,226,125,121,37,14,107,0,0 ; vpbroadcastw 0x6b0e(%rip),%ymm4 # 2c4c4 <_sk_overlay_sse2_8bit+0xdb7>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,237,228,212 ; vpmulhuw %ymm4,%ymm2,%ymm2
@@ -35599,7 +35947,7 @@ PUBLIC _sk_overlay_hsw_8bit
_sk_overlay_hsw_8bit LABEL PROC
DB 72,129,236,24,2,0,0 ; sub $0x218,%rsp
DB 197,252,17,140,36,192,1,0,0 ; vmovups %ymm1,0x1c0(%rsp)
- DB 197,253,111,45,169,106,0,0 ; vmovdqa 0x6aa9(%rip),%ymm5 # 2bf00 <_sk_overlay_sse2_8bit+0xddf>
+ DB 197,253,111,45,181,106,0,0 ; vmovdqa 0x6ab5(%rip),%ymm5 # 2c4e0 <_sk_overlay_sse2_8bit+0xdd3>
DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4
DB 196,227,125,57,225,1 ; vextracti128 $0x1,%ymm4,%xmm1
DB 196,98,125,48,193 ; vpmovzxbw %xmm1,%ymm8
@@ -35634,7 +35982,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,93,117,251 ; vpcmpeqw %ymm3,%ymm4,%ymm15
DB 197,253,111,216 ; vmovdqa %ymm0,%ymm3
DB 196,226,125,48,227 ; vpmovzxbw %xmm3,%ymm4
- DB 196,226,125,121,5,3,106,0,0 ; vpbroadcastw 0x6a03(%rip),%ymm0 # 2bf20 <_sk_overlay_sse2_8bit+0xdff>
+ DB 196,226,125,121,5,15,106,0,0 ; vpbroadcastw 0x6a0f(%rip),%ymm0 # 2c500 <_sk_overlay_sse2_8bit+0xdf3>
DB 197,117,239,232 ; vpxor %ymm0,%ymm1,%ymm13
DB 197,21,213,212 ; vpmullw %ymm4,%ymm13,%ymm10
DB 197,126,127,148,36,64,1,0,0 ; vmovdqu %ymm10,0x140(%rsp)
@@ -35735,7 +36083,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,254,111,116,36,64 ; vmovdqu 0x40(%rsp),%ymm6
DB 197,205,253,116,36,96 ; vpaddw 0x60(%rsp),%ymm6,%ymm6
DB 196,193,29,253,253 ; vpaddw %ymm13,%ymm12,%ymm7
- DB 196,98,125,121,5,246,103,0,0 ; vpbroadcastw 0x67f6(%rip),%ymm8 # 2bf22 <_sk_overlay_sse2_8bit+0xe01>
+ DB 196,98,125,121,5,2,104,0,0 ; vpbroadcastw 0x6802(%rip),%ymm8 # 2c502 <_sk_overlay_sse2_8bit+0xdf5>
DB 196,193,109,253,208 ; vpaddw %ymm8,%ymm2,%ymm2
DB 197,229,253,210 ; vpaddw %ymm2,%ymm3,%ymm2
DB 196,193,85,253,216 ; vpaddw %ymm8,%ymm5,%ymm3
@@ -35744,7 +36092,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,203,103,0,0 ; vpbroadcastw 0x67cb(%rip),%ymm4 # 2bf24 <_sk_overlay_sse2_8bit+0xe03>
+ DB 196,226,125,121,37,215,103,0,0 ; vpbroadcastw 0x67d7(%rip),%ymm4 # 2c504 <_sk_overlay_sse2_8bit+0xdf7>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,229,228,220 ; vpmulhuw %ymm4,%ymm3,%ymm3
@@ -35798,7 +36146,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 258c7 <_sk_start_pipeline_sse41_8bit+0x10b>
+ DB 15,131,138,0,0,0 ; jae 25e9b <_sk_start_pipeline_sse41_8bit+0x10b>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -35808,7 +36156,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
- DB 119,36 ; ja 258a3 <_sk_start_pipeline_sse41_8bit+0xe7>
+ DB 119,36 ; ja 25e77 <_sk_start_pipeline_sse41_8bit+0xe7>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -35817,17 +36165,17 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,16 ; add $0x10,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 2587f <_sk_start_pipeline_sse41_8bit+0xc3>
+ DB 118,220 ; jbe 25e53 <_sk_start_pipeline_sse41_8bit+0xc3>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 258bb <_sk_start_pipeline_sse41_8bit+0xff>
+ DB 116,16 ; je 25e8f <_sk_start_pipeline_sse41_8bit+0xff>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 25856 <_sk_start_pipeline_sse41_8bit+0x9a>
+ DB 117,143 ; jne 25e2a <_sk_start_pipeline_sse41_8bit+0x9a>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -35865,7 +36213,7 @@ _sk_uniform_color_sse41_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse41_8bit
_sk_set_rgb_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,128,92,0,0 ; movss 0x5c80(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,16,37,152,92,0,0 ; movss 0x5c98(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx
@@ -35880,7 +36228,7 @@ _sk_set_rgb_sse41_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,196,108,0,0 ; movdqa 0x6cc4(%rip),%xmm5 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,45,208,108,0,0 ; movdqa 0x6cd0(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -35892,12 +36240,12 @@ PUBLIC _sk_premul_sse41_8bit
_sk_premul_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,176,108,0,0 ; movdqa 0x6cb0(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,5,188,108,0,0 ; movdqa 0x6cbc(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
- DB 102,15,111,5,134,108,0,0 ; movdqa 0x6c86(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,5,146,108,0,0 ; movdqa 0x6c92(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -35928,7 +36276,7 @@ _sk_premul_sse41_8bit LABEL PROC
PUBLIC _sk_swap_rb_sse41_8bit
_sk_swap_rb_sse41_8bit LABEL PROC
- DB 102,15,111,37,35,108,0,0 ; movdqa 0x6c23(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,37,47,108,0,0 ; movdqa 0x6c2f(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35953,7 +36301,7 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 25a8d <_sk_load_8888_sse41_8bit+0x32>
+ DB 117,17 ; jne 26061 <_sk_load_8888_sse41_8bit+0x32>
DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35963,24 +36311,24 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 25a89 <_sk_load_8888_sse41_8bit+0x2e>
+ DB 119,231 ; ja 2605d <_sk_load_8888_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 25af8 <_sk_load_8888_sse41_8bit+0x9d>
+ DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 260cc <_sk_load_8888_sse41_8bit+0x9d>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 25a89 <_sk_load_8888_sse41_8bit+0x2e>
+ DB 235,203 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,177 ; jmp 25a89 <_sk_load_8888_sse41_8bit+0x2e>
+ DB 235,177 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- DB 235,139 ; jmp 25a83 <_sk_load_8888_sse41_8bit+0x28>
+ DB 235,139 ; jmp 26057 <_sk_load_8888_sse41_8bit+0x28>
DB 190,255,255,255,210 ; mov $0xd2ffffff,%esi
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36010,7 +36358,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 25b46 <_sk_load_8888_dst_sse41_8bit+0x32>
+ DB 117,17 ; jne 2611a <_sk_load_8888_dst_sse41_8bit+0x32>
DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36020,24 +36368,24 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 119,231 ; ja 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 25bb4 <_sk_load_8888_dst_sse41_8bit+0xa0>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 26188 <_sk_load_8888_dst_sse41_8bit+0xa0>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 235,203 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,177 ; jmp 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 235,177 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- DB 235,139 ; jmp 25b3c <_sk_load_8888_dst_sse41_8bit+0x28>
+ DB 235,139 ; jmp 26110 <_sk_load_8888_dst_sse41_8bit+0x28>
DB 15,31,0 ; nopl (%rax)
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -36049,7 +36397,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,221 ; jmpq ffffffffde025bcc <_sk_overlay_sse2_8bit+0xffffffffddffaaab>
+ DB 233,255,255,255,221 ; jmpq ffffffffde0261a0 <_sk_overlay_sse2_8bit+0xffffffffddffaa93>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -36065,7 +36413,7 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 25c02 <_sk_store_8888_sse41_8bit+0x32>
+ DB 117,17 ; jne 261d6 <_sk_store_8888_sse41_8bit+0x32>
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36073,22 +36421,22 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 119,239 ; ja 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 25c60 <_sk_store_8888_sse41_8bit+0x90>
+ DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 26234 <_sk_store_8888_sse41_8bit+0x90>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4)
- DB 235,211 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,211 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 102,66,15,58,22,68,138,8,2 ; pextrd $0x2,%xmm0,0x8(%rdx,%r9,4)
DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4)
- DB 235,194 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,194 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 102,66,15,58,22,76,138,24,2 ; pextrd $0x2,%xmm1,0x18(%rdx,%r9,4)
DB 102,66,15,58,22,76,138,20,1 ; pextrd $0x1,%xmm1,0x14(%rdx,%r9,4)
DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4)
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
- DB 235,161 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,161 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 195 ; retq
DB 255 ; (bad)
@@ -36125,10 +36473,10 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 25cc0 <_sk_load_bgra_sse41_8bit+0x44>
+ DB 117,35 ; jne 26294 <_sk_load_bgra_sse41_8bit+0x44>
DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
- DB 102,15,111,37,174,105,0,0 ; movdqa 0x69ae(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,37,186,105,0,0 ; movdqa 0x69ba(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36138,24 +36486,24 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,213 ; ja 25caa <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 119,213 ; ja 2627e <_sk_load_bgra_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 25d30 <_sk_load_bgra_sse41_8bit+0xb4>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 26304 <_sk_load_bgra_sse41_8bit+0xb4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,185 ; jmp 25caa <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 235,185 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,159 ; jmp 25caa <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 235,159 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- DB 233,118,255,255,255 ; jmpq 25ca4 <_sk_load_bgra_sse41_8bit+0x28>
+ DB 233,118,255,255,255 ; jmpq 26278 <_sk_load_bgra_sse41_8bit+0x28>
DB 102,144 ; xchg %ax,%ax
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
@@ -36186,10 +36534,10 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 25d90 <_sk_load_bgra_dst_sse41_8bit+0x44>
+ DB 117,35 ; jne 26364 <_sk_load_bgra_dst_sse41_8bit+0x44>
DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
- DB 102,15,111,37,222,104,0,0 ; movdqa 0x68de(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,37,234,104,0,0 ; movdqa 0x68ea(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,212 ; pshufb %xmm4,%xmm2
DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36199,24 +36547,24 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,213 ; ja 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 119,213 ; ja 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 25e00 <_sk_load_bgra_dst_sse41_8bit+0xb4>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 263d4 <_sk_load_bgra_dst_sse41_8bit+0xb4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 235,185 ; jmp 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 235,185 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,159 ; jmp 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 235,159 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- DB 233,118,255,255,255 ; jmpq 25d74 <_sk_load_bgra_dst_sse41_8bit+0x28>
+ DB 233,118,255,255,255 ; jmpq 26348 <_sk_load_bgra_dst_sse41_8bit+0x28>
DB 102,144 ; xchg %ax,%ax
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
@@ -36246,13 +36594,13 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 102,15,111,53,32,104,0,0 ; movdqa 0x6820(%rip),%xmm6 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,53,44,104,0,0 ; movdqa 0x682c(%rip),%xmm6 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,56,0,238 ; pshufb %xmm6,%xmm5
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,230 ; pshufb %xmm6,%xmm4
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 25e68 <_sk_store_bgra_sse41_8bit+0x4c>
+ DB 117,17 ; jne 2643c <_sk_store_bgra_sse41_8bit+0x4c>
DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4)
DB 243,66,15,127,108,138,16 ; movdqu %xmm5,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36260,22 +36608,22 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 119,239 ; ja 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 25ec4 <_sk_store_bgra_sse41_8bit+0xa8>
+ DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 26498 <_sk_store_bgra_sse41_8bit+0xa8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,36,138 ; movd %xmm4,(%rdx,%r9,4)
- DB 235,211 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,211 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 102,66,15,58,22,100,138,8,2 ; pextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,36,138 ; movq %xmm4,(%rdx,%r9,4)
- DB 235,194 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,194 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 102,66,15,58,22,108,138,24,2 ; pextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
DB 102,66,15,58,22,108,138,20,1 ; pextrd $0x1,%xmm5,0x14(%rdx,%r9,4)
DB 102,66,15,126,108,138,16 ; movd %xmm5,0x10(%rdx,%r9,4)
DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4)
- DB 235,161 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,161 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 144 ; nop
DB 197,255,255 ; (bad)
DB 255,214 ; callq *%rsi
@@ -36308,9 +36656,9 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,42 ; jne 25f27 <_sk_load_a8_sse41_8bit+0x47>
+ DB 117,42 ; jne 264fb <_sk_load_a8_sse41_8bit+0x47>
DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1
- DB 102,15,219,13,36,96,0,0 ; pand 0x6024(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,13,48,96,0,0 ; pand 0x6030(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -36322,15 +36670,15 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,204 ; ja 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 119,204 ; ja 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 25fb8 <_sk_load_a8_sse41_8bit+0xd8>
+ DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 2658c <_sk_load_a8_sse41_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,173 ; jmp 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,173 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -36338,7 +36686,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 235,136 ; jmp 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,136 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -36349,7 +36697,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,77,255,255,255 ; jmpq 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 233,77,255,255,255 ; jmpq 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -36358,7 +36706,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf025fc8 <_sk_overlay_sse2_8bit+0xffffffffdeffaea7>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf02659c <_sk_overlay_sse2_8bit+0xffffffffdeffae8f>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -36379,9 +36727,9 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,42 ; jne 2601b <_sk_load_a8_dst_sse41_8bit+0x47>
+ DB 117,42 ; jne 265ef <_sk_load_a8_dst_sse41_8bit+0x47>
DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3
- DB 102,15,219,29,48,95,0,0 ; pand 0x5f30(%rip),%xmm3 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,29,60,95,0,0 ; pand 0x5f3c(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -36393,15 +36741,15 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,204 ; ja 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 119,204 ; ja 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 260ac <_sk_load_a8_dst_sse41_8bit+0xd8>
+ DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 26680 <_sk_load_a8_dst_sse41_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,173 ; jmp 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,173 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -36409,7 +36757,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 235,136 ; jmp 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,136 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -36420,7 +36768,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,77,255,255,255 ; jmpq 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 233,77,255,255,255 ; jmpq 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -36429,7 +36777,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf0260bc <_sk_overlay_sse2_8bit+0xffffffffdeffaf9b>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf026690 <_sk_overlay_sse2_8bit+0xffffffffdeffaf83>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -36449,39 +36797,39 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 102,15,111,45,136,101,0,0 ; movdqa 0x6588(%rip),%xmm5 # 2c670 <_sk_overlay_sse2_8bit+0x154f>
+ DB 102,15,111,45,148,101,0,0 ; movdqa 0x6594(%rip),%xmm5 # 2cc50 <_sk_overlay_sse2_8bit+0x1543>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,19 ; jne 26116 <_sk_store_a8_sse41_8bit+0x4e>
- DB 102,15,56,0,37,36,101,0,0 ; pshufb 0x6524(%rip),%xmm4 # 2c630 <_sk_overlay_sse2_8bit+0x150f>
+ DB 117,19 ; jne 266ea <_sk_store_a8_sse41_8bit+0x4e>
+ DB 102,15,56,0,37,48,101,0,0 ; pshufb 0x6530(%rip),%xmm4 # 2cc10 <_sk_overlay_sse2_8bit+0x1503>
DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,239 ; ja 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 119,239 ; ja 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 2618c <_sk_store_a8_sse41_8bit+0xc4>
+ DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 26760 <_sk_store_a8_sse41_8bit+0xc4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,58,20,36,2,0 ; pextrb $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,209 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,209 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 102,66,15,58,20,100,2,2,4 ; pextrb $0x4,%xmm4,0x2(%rdx,%r8,1)
- DB 102,15,56,0,37,237,93,0,0 ; pshufb 0x5ded(%rip),%xmm4 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f>
+ DB 102,15,56,0,37,249,93,0,0 ; pshufb 0x5df9(%rip),%xmm4 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
DB 102,66,15,58,21,36,2,0 ; pextrw $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,181 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,181 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 102,66,15,58,20,100,2,6,12 ; pextrb $0xc,%xmm4,0x6(%rdx,%r8,1)
DB 102,66,15,58,20,100,2,5,10 ; pextrb $0xa,%xmm4,0x5(%rdx,%r8,1)
DB 102,66,15,58,20,100,2,4,8 ; pextrb $0x8,%xmm4,0x4(%rdx,%r8,1)
- DB 102,15,56,0,37,207,93,0,0 ; pshufb 0x5dcf(%rip),%xmm4 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f>
+ DB 102,15,56,0,37,219,93,0,0 ; pshufb 0x5ddb(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1)
- DB 235,137 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,137 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 15,31,0 ; nopl (%rax)
DB 171 ; stos %eax,%es:(%rdi)
DB 255 ; (bad)
@@ -36515,16 +36863,16 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,66 ; jne 26207 <_sk_load_g8_sse41_8bit+0x5f>
+ DB 117,66 ; jne 267db <_sk_load_g8_sse41_8bit+0x5f>
DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1
- DB 102,15,219,13,92,93,0,0 ; pand 0x5d5c(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,13,104,93,0,0 ; pand 0x5d68(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
- DB 102,15,111,37,151,100,0,0 ; movdqa 0x6497(%rip),%xmm4 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,37,163,100,0,0 ; movdqa 0x64a3(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,56,64,204 ; pmulld %xmm4,%xmm1
DB 102,15,56,64,196 ; pmulld %xmm4,%xmm0
- DB 102,15,111,37,69,100,0,0 ; movdqa 0x6445(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,81,100,0,0 ; movdqa 0x6451(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36533,15 +36881,15 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,180 ; ja 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 119,180 ; ja 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 2629c <_sk_load_g8_sse41_8bit+0xf4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26870 <_sk_load_g8_sse41_8bit+0xf4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,149 ; jmp 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 235,149 ; jmp 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -36549,7 +36897,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 233,109,255,255,255 ; jmpq 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 233,109,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -36560,7 +36908,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,50,255,255,255 ; jmpq 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 233,50,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36569,7 +36917,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde0262ac <_sk_overlay_sse2_8bit+0xffffffffddffb18b>
+ DB 232,255,255,255,221 ; callq ffffffffde026880 <_sk_overlay_sse2_8bit+0xffffffffddffb173>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36590,16 +36938,16 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,66 ; jne 26317 <_sk_load_g8_dst_sse41_8bit+0x5f>
+ DB 117,66 ; jne 268eb <_sk_load_g8_dst_sse41_8bit+0x5f>
DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3
- DB 102,15,219,29,76,92,0,0 ; pand 0x5c4c(%rip),%xmm3 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,29,88,92,0,0 ; pand 0x5c58(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
- DB 102,15,111,37,135,99,0,0 ; movdqa 0x6387(%rip),%xmm4 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,37,147,99,0,0 ; movdqa 0x6393(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,56,64,220 ; pmulld %xmm4,%xmm3
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
- DB 102,15,111,37,53,99,0,0 ; movdqa 0x6335(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,65,99,0,0 ; movdqa 0x6341(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36608,15 +36956,15 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,180 ; ja 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 119,180 ; ja 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 263ac <_sk_load_g8_dst_sse41_8bit+0xf4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26980 <_sk_load_g8_dst_sse41_8bit+0xf4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,149 ; jmp 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 235,149 ; jmp 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -36624,7 +36972,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 233,109,255,255,255 ; jmpq 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 233,109,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -36635,7 +36983,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,50,255,255,255 ; jmpq 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 233,50,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36644,7 +36992,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde0263bc <_sk_overlay_sse2_8bit+0xffffffffddffb29b>
+ DB 232,255,255,255,221 ; callq ffffffffde026990 <_sk_overlay_sse2_8bit+0xffffffffddffb283>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36666,11 +37014,11 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,206,0,0,0 ; jne 264bb <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
+ DB 15,133,206,0,0,0 ; jne 26a8f <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
DB 243,70,15,111,68,138,16 ; movdqu 0x10(%rdx,%r9,4),%xmm8
DB 243,70,15,111,12,138 ; movdqu (%rdx,%r9,4),%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,75,98,0,0 ; movdqa 0x624b(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,87,98,0,0 ; movdqa 0x6257(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,244 ; pshufb %xmm4,%xmm6
DB 102,15,111,248 ; movdqa %xmm0,%xmm7
@@ -36704,7 +37052,7 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,68,15,248,204 ; psubb %xmm4,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,72 ; jne 264f2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
+ DB 117,72 ; jne 26ac6 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36715,43 +37063,43 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 254,200 ; dec %al
DB 60,6 ; cmp $0x6,%al
- DB 15,135,38,255,255,255 ; ja 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 15,135,38,255,255,255 ; ja 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 26598 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
+ DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 26b6c <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,110,12,138 ; movd (%rdx,%r9,4),%xmm9
- DB 233,8,255,255,255 ; jmpq 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 233,8,255,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,184 ; ja 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 119,184 ; ja 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 265b4 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
+ DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 26b88 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4)
- DB 235,156 ; jmp 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 235,156 ; jmp 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 243,66,15,126,36,138 ; movq (%rdx,%r9,4),%xmm4
DB 102,68,15,58,14,204,15 ; pblendw $0xf,%xmm4,%xmm9
- DB 233,192,254,255,255 ; jmpq 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 233,192,254,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,70,15,58,34,68,138,20,1 ; pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8
DB 102,70,15,58,34,68,138,16,0 ; pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8
- DB 233,150,254,255,255 ; jmpq 263f4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
+ DB 233,150,254,255,255 ; jmpq 269c8 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
DB 102,70,15,58,22,76,138,8,2 ; pextrd $0x2,%xmm9,0x8(%rdx,%r9,4)
DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4)
- DB 233,69,255,255,255 ; jmpq 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 233,69,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,70,15,58,22,68,138,24,2 ; pextrd $0x2,%xmm8,0x18(%rdx,%r9,4)
DB 102,70,15,58,22,68,138,20,1 ; pextrd $0x1,%xmm8,0x14(%rdx,%r9,4)
DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4)
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
- DB 233,33,255,255,255 ; jmpq 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 233,33,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,144 ; xchg %ax,%ax
DB 79,255 ; rex.WRXB (bad)
DB 255 ; (bad)
@@ -36790,7 +37138,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,214,79,0,0 ; mulss 0x4fd6(%rip),%xmm0 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,5,238,79,0,0 ; mulss 0x4fee(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,68,15,56,48,197 ; pmovzxbw %xmm5,%xmm8
@@ -36798,7 +37146,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,68,15,56,48,204 ; pmovzxbw %xmm4,%xmm9
DB 102,15,104,224 ; punpckhbw %xmm0,%xmm4
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 102,15,56,0,53,130,96,0,0 ; pshufb 0x6082(%rip),%xmm6 # 2c690 <_sk_overlay_sse2_8bit+0x156f>
+ DB 102,15,56,0,53,142,96,0,0 ; pshufb 0x608e(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0x1563>
DB 102,15,111,206 ; movdqa %xmm6,%xmm1
DB 102,65,15,213,201 ; pmullw %xmm9,%xmm1
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
@@ -36829,13 +37177,13 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,160,0,0,0 ; jne 2671f <_sk_scale_u8_sse41_8bit+0xc1>
+ DB 15,133,160,0,0,0 ; jne 26cf3 <_sk_scale_u8_sse41_8bit+0xc1>
DB 102,66,15,56,48,52,2 ; pmovzxbw (%rdx,%r8,1),%xmm6
- DB 102,15,219,53,162,88,0,0 ; pand 0x58a2(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,53,174,88,0,0 ; pand 0x58ae(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
- DB 102,15,56,0,61,0,96,0,0 ; pshufb 0x6000(%rip),%xmm7 # 2c6a0 <_sk_overlay_sse2_8bit+0x157f>
- DB 102,15,56,0,53,7,96,0,0 ; pshufb 0x6007(%rip),%xmm6 # 2c6b0 <_sk_overlay_sse2_8bit+0x158f>
+ DB 102,15,56,0,61,12,96,0,0 ; pshufb 0x600c(%rip),%xmm7 # 2cc80 <_sk_overlay_sse2_8bit+0x1573>
+ DB 102,15,56,0,53,19,96,0,0 ; pshufb 0x6013(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0x1583>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -36866,15 +37214,15 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,82,255,255,255 ; ja 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 15,135,82,255,255,255 ; ja 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 267bc <_sk_scale_u8_sse41_8bit+0x15e>
+ DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 26d90 <_sk_scale_u8_sse41_8bit+0x15e>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,48,255,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,48,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,2 ; pinsrw $0x2,%eax,%xmm6
@@ -36882,7 +37230,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,3 ; pblendw $0x3,%xmm4,%xmm6
- DB 233,8,255,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,8,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,6 ; pinsrw $0x6,%eax,%xmm6
@@ -36893,7 +37241,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,205,254,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,205,254,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 15,31,0 ; nopl (%rax)
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -36918,7 +37266,7 @@ PUBLIC _sk_lerp_1_float_sse41_8bit
_sk_lerp_1_float_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,214,77,0,0 ; mulss 0x4dd6(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,37,238,77,0,0 ; mulss 0x4dee(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -36929,7 +37277,7 @@ _sk_lerp_1_float_sse41_8bit LABEL PROC
DB 102,65,15,104,193 ; punpckhbw %xmm9,%xmm0
DB 102,68,15,56,48,217 ; pmovzxbw %xmm1,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,56,0,61,159,94,0,0 ; pshufb 0x5e9f(%rip),%xmm7 # 2c6c0 <_sk_overlay_sse2_8bit+0x159f>
+ DB 102,15,56,0,61,171,94,0,0 ; pshufb 0x5eab(%rip),%xmm7 # 2cca0 <_sk_overlay_sse2_8bit+0x1593>
DB 102,68,15,111,231 ; movdqa %xmm7,%xmm12
DB 102,69,15,213,227 ; pmullw %xmm11,%xmm12
DB 102,68,15,111,239 ; movdqa %xmm7,%xmm13
@@ -36988,13 +37336,13 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,46,1,0,0 ; jne 26a49 <_sk_lerp_u8_sse41_8bit+0x14f>
+ DB 15,133,46,1,0,0 ; jne 2701d <_sk_lerp_u8_sse41_8bit+0x14f>
DB 102,66,15,56,48,60,2 ; pmovzxbw (%rdx,%r8,1),%xmm7
- DB 102,15,219,61,6,86,0,0 ; pand 0x5606(%rip),%xmm7 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,61,18,86,0,0 ; pand 0x5612(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,100,93,0,0 ; pshufb 0x5d64(%rip),%xmm6 # 2c6a0 <_sk_overlay_sse2_8bit+0x157f>
- DB 102,15,56,0,61,107,93,0,0 ; pshufb 0x5d6b(%rip),%xmm7 # 2c6b0 <_sk_overlay_sse2_8bit+0x158f>
+ DB 102,15,56,0,53,112,93,0,0 ; pshufb 0x5d70(%rip),%xmm6 # 2cc80 <_sk_overlay_sse2_8bit+0x1573>
+ DB 102,15,56,0,61,119,93,0,0 ; pshufb 0x5d77(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0x1583>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -37054,15 +37402,15 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,196,254,255,255 ; ja 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 15,135,196,254,255,255 ; ja 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 26ae4 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 270b8 <_sk_lerp_u8_sse41_8bit+0x1ea>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,162,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,162,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,2 ; pinsrw $0x2,%eax,%xmm7
@@ -37070,7 +37418,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,3 ; pblendw $0x3,%xmm5,%xmm7
- DB 233,122,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,122,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,6 ; pinsrw $0x6,%eax,%xmm7
@@ -37081,7 +37429,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,15 ; pblendw $0xf,%xmm5,%xmm7
- DB 233,63,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,63,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 144 ; nop
DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
@@ -37089,7 +37437,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf026af4 <_sk_overlay_sse2_8bit+0xffffffffdeffb9d3>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf0270c8 <_sk_overlay_sse2_8bit+0xffffffffdeffb9bb>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -37117,7 +37465,7 @@ _sk_move_dst_src_sse41_8bit LABEL PROC
PUBLIC _sk_black_color_sse41_8bit
_sk_black_color_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,35,91,0,0 ; movaps 0x5b23(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 15,40,5,47,91,0,0 ; movaps 0x5b2f(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -37137,7 +37485,7 @@ _sk_clear_sse41_8bit LABEL PROC
PUBLIC _sk_srcatop_sse41_8bit
_sk_srcatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,21,15,91,0,0 ; movdqa 0x5b0f(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,21,27,91,0,0 ; movdqa 0x5b1b(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,195 ; pmovzxbw %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
@@ -37205,7 +37553,7 @@ _sk_srcatop_sse41_8bit LABEL PROC
PUBLIC _sk_dstatop_sse41_8bit
_sk_dstatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,29,212,89,0,0 ; movdqa 0x59d4(%rip),%xmm11 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,29,224,89,0,0 ; movdqa 0x59e0(%rip),%xmm11 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,69,15,56,0,235 ; pshufb %xmm11,%xmm13
DB 102,68,15,111,248 ; movdqa %xmm0,%xmm15
@@ -37275,7 +37623,7 @@ PUBLIC _sk_srcin_sse41_8bit
_sk_srcin_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,139,88,0,0 ; movdqa 0x588b(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,5,151,88,0,0 ; movdqa 0x5897(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
@@ -37308,7 +37656,7 @@ _sk_srcin_sse41_8bit LABEL PROC
PUBLIC _sk_dstin_sse41_8bit
_sk_dstin_sse41_8bit LABEL PROC
- DB 102,15,111,37,254,87,0,0 ; movdqa 0x57fe(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,10,88,0,0 ; movdqa 0x580a(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
@@ -37345,7 +37693,7 @@ PUBLIC _sk_srcout_sse41_8bit
_sk_srcout_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,97,87,0,0 ; movdqa 0x5761(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,5,109,87,0,0 ; movdqa 0x576d(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37381,7 +37729,7 @@ _sk_srcout_sse41_8bit LABEL PROC
PUBLIC _sk_dstout_sse41_8bit
_sk_dstout_sse41_8bit LABEL PROC
- DB 102,15,111,37,200,86,0,0 ; movdqa 0x56c8(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,212,86,0,0 ; movdqa 0x56d4(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,118,228 ; pcmpeqd %xmm4,%xmm4
@@ -37419,7 +37767,7 @@ _sk_dstout_sse41_8bit LABEL PROC
PUBLIC _sk_srcover_sse41_8bit
_sk_srcover_sse41_8bit LABEL PROC
- DB 102,15,111,53,39,86,0,0 ; movdqa 0x5627(%rip),%xmm6 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,53,51,86,0,0 ; movdqa 0x5633(%rip),%xmm6 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,68,15,56,0,222 ; pshufb %xmm6,%xmm11
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
@@ -37458,7 +37806,7 @@ _sk_srcover_sse41_8bit LABEL PROC
PUBLIC _sk_dstover_sse41_8bit
_sk_dstover_sse41_8bit LABEL PROC
- DB 102,68,15,111,5,119,85,0,0 ; movdqa 0x5577(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,5,131,85,0,0 ; movdqa 0x5583(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,209 ; movdqa %xmm1,%xmm10
DB 102,68,15,56,48,201 ; pmovzxbw %xmm1,%xmm9
DB 102,15,252,203 ; paddb %xmm3,%xmm1
@@ -37533,7 +37881,7 @@ _sk_multiply_sse41_8bit LABEL PROC
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,53,53,84,0,0 ; movdqa 0x5435(%rip),%xmm14 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,53,65,84,0,0 ; movdqa 0x5441(%rip),%xmm14 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,195 ; movdqa %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,65,15,56,0,238 ; pshufb %xmm14,%xmm5
@@ -37658,7 +38006,7 @@ _sk_screen_sse41_8bit LABEL PROC
PUBLIC _sk_xor__sse41_8bit
_sk_xor__sse41_8bit LABEL PROC
- DB 102,68,15,111,21,243,81,0,0 ; movdqa 0x51f3(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,21,255,81,0,0 ; movdqa 0x51ff(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,226 ; movdqa %xmm2,%xmm12
DB 102,68,15,56,48,194 ; pmovzxbw %xmm2,%xmm8
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
@@ -37726,10 +38074,17 @@ _sk_xor__sse41_8bit LABEL PROC
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_plus__sse41_8bit
+_sk_plus__sse41_8bit LABEL PROC
+ DB 102,15,220,194 ; paddusb %xmm2,%xmm0
+ DB 102,15,220,203 ; paddusb %xmm3,%xmm1
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_darken_sse41_8bit
_sk_darken_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37796,7 +38151,7 @@ _sk_darken_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37806,7 +38161,7 @@ _sk_darken_sse41_8bit LABEL PROC
PUBLIC _sk_lighten_sse41_8bit
_sk_lighten_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37873,7 +38228,7 @@ _sk_lighten_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37911,7 +38266,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,253 ; packuswb %xmm5,%xmm7
DB 102,15,103,230 ; packuswb %xmm6,%xmm4
- DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,204 ; psubb %xmm4,%xmm1
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,239 ; pand %xmm7,%xmm5
@@ -37924,7 +38279,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
PUBLIC _sk_difference_sse41_8bit
_sk_difference_sse41_8bit LABEL PROC
DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
- DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37962,7 +38317,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,254 ; packuswb %xmm6,%xmm7
- DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,236 ; pshufb %xmm4,%xmm5
DB 102,69,15,104,236 ; punpckhbw %xmm12,%xmm13
@@ -37987,7 +38342,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,103,241 ; packuswb %xmm1,%xmm6
DB 102,65,15,218,230 ; pminub %xmm14,%xmm4
DB 102,15,218,247 ; pminub %xmm7,%xmm6
- DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,248,198 ; psubb %xmm6,%xmm8
DB 102,15,219,241 ; pand %xmm1,%xmm6
DB 102,15,219,204 ; pand %xmm4,%xmm1
@@ -38014,7 +38369,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,69,15,56,48,221 ; pmovzxbw %xmm13,%xmm11
DB 102,68,15,127,156,36,176,0,0,0 ; movdqa %xmm11,0xb0(%rsp)
- DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,68,15,56,0,233 ; pshufb %xmm1,%xmm13
DB 102,69,15,56,48,205 ; pmovzxbw %xmm13,%xmm9
@@ -38063,7 +38418,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,65,15,56,58,242 ; pminuw %xmm10,%xmm6
DB 102,15,117,240 ; pcmpeqw %xmm0,%xmm6
DB 102,15,127,180,36,192,0,0,0 ; movdqa %xmm6,0xc0(%rsp)
- DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,192 ; pmullw %xmm8,%xmm0
@@ -38170,7 +38525,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,15,253,124,36,16 ; paddw 0x10(%rsp),%xmm7
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,68,15,253,219 ; paddw %xmm3,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38179,7 +38534,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,252 ; paddw %xmm4,%xmm7
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -38212,7 +38567,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,65,15,56,48,206 ; pmovzxbw %xmm14,%xmm1
DB 102,15,127,140,36,16,1,0,0 ; movdqa %xmm1,0x110(%rsp)
- DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,56,0,249 ; pshufb %xmm1,%xmm15
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,65,15,56,48,238 ; pmovzxbw %xmm14,%xmm5
@@ -38264,7 +38619,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,65,15,56,58,221 ; pminuw %xmm13,%xmm3
DB 102,15,117,216 ; pcmpeqw %xmm0,%xmm3
DB 102,15,127,156,36,176,0,0,0 ; movdqa %xmm3,0xb0(%rsp)
- DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
@@ -38373,7 +38728,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,68,15,253,132,36,128,0,0,0 ; paddw 0x80(%rsp),%xmm8
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,69,15,253,217 ; paddw %xmm9,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38382,7 +38737,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,68,15,253,195 ; paddw %xmm3,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -38435,7 +38790,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 283df <_sk_start_pipeline_sse2_8bit+0x10b>
+ DB 15,131,138,0,0,0 ; jae 289bf <_sk_start_pipeline_sse2_8bit+0x10b>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -38445,7 +38800,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
- DB 119,36 ; ja 283bb <_sk_start_pipeline_sse2_8bit+0xe7>
+ DB 119,36 ; ja 2899b <_sk_start_pipeline_sse2_8bit+0xe7>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -38454,17 +38809,17 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,16 ; add $0x10,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 28397 <_sk_start_pipeline_sse2_8bit+0xc3>
+ DB 118,220 ; jbe 28977 <_sk_start_pipeline_sse2_8bit+0xc3>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 283d3 <_sk_start_pipeline_sse2_8bit+0xff>
+ DB 116,16 ; je 289b3 <_sk_start_pipeline_sse2_8bit+0xff>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 2836e <_sk_start_pipeline_sse2_8bit+0x9a>
+ DB 117,143 ; jne 2894e <_sk_start_pipeline_sse2_8bit+0x9a>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -38502,7 +38857,7 @@ _sk_uniform_color_sse2_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse2_8bit
_sk_set_rgb_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,104,49,0,0 ; movss 0x3168(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,16,37,116,49,0,0 ; movss 0x3174(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx
@@ -38517,7 +38872,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -38540,7 +38895,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 242,15,112,192,95 ; pshuflw $0x5f,%xmm0,%xmm0
DB 243,15,112,248,95 ; pshufhw $0x5f,%xmm0,%xmm7
- DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -38615,7 +38970,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 28610 <_sk_load_8888_sse2_8bit+0x31>
+ DB 117,16 ; jne 28bf0 <_sk_load_8888_sse2_8bit+0x31>
DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1
DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38625,18 +38980,18 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 2860c <_sk_load_8888_sse2_8bit+0x2d>
+ DB 119,231 ; ja 28bec <_sk_load_8888_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 28680 <_sk_load_8888_sse2_8bit+0xa1>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 28c60 <_sk_load_8888_sse2_8bit+0xa1>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 2860c <_sk_load_8888_sse2_8bit+0x2d>
+ DB 235,203 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 235,183 ; jmp 2860c <_sk_load_8888_sse2_8bit+0x2d>
+ DB 235,183 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0
@@ -38645,7 +39000,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 235,134 ; jmp 28606 <_sk_load_8888_sse2_8bit+0x27>
+ DB 235,134 ; jmp 28be6 <_sk_load_8888_sse2_8bit+0x27>
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -38674,7 +39029,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 286cd <_sk_load_8888_dst_sse2_8bit+0x31>
+ DB 117,16 ; jne 28cad <_sk_load_8888_dst_sse2_8bit+0x31>
DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3
DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38684,18 +39039,18 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 119,231 ; ja 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 28740 <_sk_load_8888_dst_sse2_8bit+0xa4>
+ DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 28d20 <_sk_load_8888_dst_sse2_8bit+0xa4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 235,203 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2
- DB 235,183 ; jmp 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 235,183 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2
@@ -38704,7 +39059,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 235,134 ; jmp 286c3 <_sk_load_8888_dst_sse2_8bit+0x27>
+ DB 235,134 ; jmp 28ca3 <_sk_load_8888_dst_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -38737,7 +39092,7 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 2878e <_sk_store_8888_sse2_8bit+0x32>
+ DB 117,17 ; jne 28d6e <_sk_store_8888_sse2_8bit+0x32>
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38745,25 +39100,25 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 119,239 ; ja 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 287f4 <_sk_store_8888_sse2_8bit+0x98>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 28dd4 <_sk_store_8888_sse2_8bit+0x98>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4)
- DB 235,211 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,211 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4)
- DB 235,191 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,191 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4)
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4)
DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4)
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
- DB 235,152 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,152 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 102,144 ; xchg %ax,%ax
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -38797,7 +39152,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,92 ; jne 2888d <_sk_load_bgra_sse2_8bit+0x7d>
+ DB 117,92 ; jne 28e6d <_sk_load_bgra_sse2_8bit+0x7d>
DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1
DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -38824,18 +39179,18 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,155 ; ja 2883d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 119,155 ; ja 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28908 <_sk_load_bgra_sse2_8bit+0xf8>
+ DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ee8 <_sk_load_bgra_sse2_8bit+0xf8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0
- DB 233,124,255,255,255 ; jmpq 2883d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 233,124,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 233,101,255,255,255 ; jmpq 2883d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 233,101,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0
@@ -38844,7 +39199,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 233,49,255,255,255 ; jmpq 28837 <_sk_load_bgra_sse2_8bit+0x27>
+ DB 233,49,255,255,255 ; jmpq 28e17 <_sk_load_bgra_sse2_8bit+0x27>
DB 102,144 ; xchg %ax,%ax
DB 174 ; scas %es:(%rdi),%al
DB 255 ; (bad)
@@ -38879,7 +39234,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,92 ; jne 289a1 <_sk_load_bgra_dst_sse2_8bit+0x7d>
+ DB 117,92 ; jne 28f81 <_sk_load_bgra_dst_sse2_8bit+0x7d>
DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3
DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -38906,18 +39261,18 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,155 ; ja 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 119,155 ; ja 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28a1c <_sk_load_bgra_dst_sse2_8bit+0xf8>
+ DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ffc <_sk_load_bgra_dst_sse2_8bit+0xf8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2
- DB 233,124,255,255,255 ; jmpq 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 233,124,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2
- DB 233,101,255,255,255 ; jmpq 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 233,101,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2
@@ -38926,7 +39281,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 233,49,255,255,255 ; jmpq 2894b <_sk_load_bgra_dst_sse2_8bit+0x27>
+ DB 233,49,255,255,255 ; jmpq 28f2b <_sk_load_bgra_dst_sse2_8bit+0x27>
DB 102,144 ; xchg %ax,%ax
DB 174 ; scas %es:(%rdi),%al
DB 255 ; (bad)
@@ -38980,7 +39335,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 243,15,112,237,198 ; pshufhw $0xc6,%xmm5,%xmm5
DB 102,15,103,238 ; packuswb %xmm6,%xmm5
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 28abe <_sk_store_bgra_sse2_8bit+0x86>
+ DB 117,17 ; jne 2909e <_sk_store_bgra_sse2_8bit+0x86>
DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4)
DB 243,66,15,127,100,138,16 ; movdqu %xmm4,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38988,25 +39343,25 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 119,239 ; ja 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 28b24 <_sk_store_bgra_sse2_8bit+0xec>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 29104 <_sk_store_bgra_sse2_8bit+0xec>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,44,138 ; movd %xmm5,(%rdx,%r9,4)
- DB 235,211 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,211 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 102,15,112,229,78 ; pshufd $0x4e,%xmm5,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,44,138 ; movq %xmm5,(%rdx,%r9,4)
- DB 235,191 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,191 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
DB 102,66,15,126,116,138,24 ; movd %xmm6,0x18(%rdx,%r9,4)
DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
DB 102,66,15,126,116,138,20 ; movd %xmm6,0x14(%rdx,%r9,4)
DB 102,66,15,126,100,138,16 ; movd %xmm4,0x10(%rdx,%r9,4)
DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4)
- DB 235,152 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,152 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 102,144 ; xchg %ax,%ax
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -39039,10 +39394,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,48 ; jne 28b8d <_sk_load_a8_sse2_8bit+0x4d>
+ DB 117,48 ; jne 2916d <_sk_load_a8_sse2_8bit+0x4d>
DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,40,200 ; movapd %xmm0,%xmm1
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -39055,15 +39410,15 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 119,201 ; ja 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 28c18 <_sk_load_a8_sse2_8bit+0xd8>
+ DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 291f8 <_sk_load_a8_sse2_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,170 ; jmp 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 235,170 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39071,7 +39426,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,136 ; jmp 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 235,136 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39082,7 +39437,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,80,255,255,255 ; jmpq 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 233,80,255,255,255 ; jmpq 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 144 ; nop
DB 154 ; (bad)
DB 255 ; (bad)
@@ -39114,10 +39469,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,48 ; jne 28c81 <_sk_load_a8_dst_sse2_8bit+0x4d>
+ DB 117,48 ; jne 29261 <_sk_load_a8_dst_sse2_8bit+0x4d>
DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,40,218 ; movapd %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -39130,15 +39485,15 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 119,201 ; ja 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 28d0c <_sk_load_a8_dst_sse2_8bit+0xd8>
+ DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 292ec <_sk_load_a8_dst_sse2_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 235,170 ; jmp 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 235,170 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39146,7 +39501,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 235,136 ; jmp 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 235,136 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39157,7 +39512,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,80,255,255,255 ; jmpq 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 233,80,255,255,255 ; jmpq 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 144 ; nop
DB 154 ; (bad)
DB 255 ; (bad)
@@ -39199,8 +39554,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,26 ; jne 28d8d <_sk_store_a8_sse2_8bit+0x65>
- DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 117,26 ; jne 2936d <_sk_store_a8_sse2_8bit+0x65>
+ DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39209,24 +39564,24 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,235 ; ja 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 119,235 ; ja 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 28e28 <_sk_store_a8_sse2_8bit+0x100>
+ DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 29408 <_sk_store_a8_sse2_8bit+0x100>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 66,136,4,2 ; mov %al,(%rdx,%r8,1)
- DB 235,201 ; jmp 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 235,201 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,15,127,100,36,16 ; movdqa %xmm4,0x10(%rsp)
DB 138,68,36,20 ; mov 0x14(%rsp),%al
DB 66,136,68,2,2 ; mov %al,0x2(%rdx,%r8,1)
- DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,66,137,4,2 ; mov %ax,(%rdx,%r8,1)
- DB 235,163 ; jmp 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 235,163 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,15,127,100,36,64 ; movdqa %xmm4,0x40(%rsp)
DB 138,68,36,76 ; mov 0x4c(%rsp),%al
DB 66,136,68,2,6 ; mov %al,0x6(%rdx,%r8,1)
@@ -39236,10 +39591,10 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,100,36,32 ; movdqa %xmm4,0x20(%rsp)
DB 138,68,36,40 ; mov 0x28(%rsp),%al
DB 66,136,68,2,4 ; mov %al,0x4(%rdx,%r8,1)
- DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1)
- DB 233,95,255,255,255 ; jmpq 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 233,95,255,255,255 ; jmpq 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,144 ; xchg %ax,%ax
DB 134,255 ; xchg %bh,%bh
DB 255 ; (bad)
@@ -39271,15 +39626,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,116 ; jne 28ed5 <_sk_load_g8_sse2_8bit+0x91>
+ DB 117,116 ; jne 294b5 <_sk_load_g8_sse2_8bit+0x91>
DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,40,224 ; movapd %xmm0,%xmm4
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
@@ -39292,7 +39647,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,196 ; punpckldq %xmm4,%xmm0
- DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39301,15 +39656,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,133 ; ja 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 119,133 ; ja 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 28f68 <_sk_load_g8_sse2_8bit+0x124>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29548 <_sk_load_g8_sse2_8bit+0x124>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 233,99,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,99,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39317,7 +39672,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 233,62,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,62,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39328,7 +39683,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,6,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,6,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39361,15 +39716,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,116 ; jne 29015 <_sk_load_g8_dst_sse2_8bit+0x91>
+ DB 117,116 ; jne 295f5 <_sk_load_g8_dst_sse2_8bit+0x91>
DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,40,226 ; movapd %xmm2,%xmm4
DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2
- DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6
DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3
@@ -39382,7 +39737,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,212 ; punpckldq %xmm4,%xmm2
- DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39391,15 +39746,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,133 ; ja 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 119,133 ; ja 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 290a8 <_sk_load_g8_dst_sse2_8bit+0x124>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29688 <_sk_load_g8_dst_sse2_8bit+0x124>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,99,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,99,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39407,7 +39762,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,62,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,62,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39418,7 +39773,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,6,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,6,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39452,7 +39807,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne 291e6 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
+ DB 15,133,253,0,0,0 ; jne 297c6 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
DB 70,15,16,68,138,16 ; movups 0x10(%rdx,%r9,4),%xmm8
DB 102,70,15,16,12,138 ; movupd (%rdx,%r9,4),%xmm9
DB 77,133,192 ; test %r8,%r8
@@ -39501,7 +39856,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,68,15,248,207 ; psubb %xmm7,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,72 ; jne 2921d <_sk_srcover_rgba_8888_sse2_8bit+0x159>
+ DB 117,72 ; jne 297fd <_sk_srcover_rgba_8888_sse2_8bit+0x159>
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39512,29 +39867,29 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 254,200 ; dec %al
DB 60,6 ; cmp $0x6,%al
- DB 15,135,246,254,255,255 ; ja 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 15,135,246,254,255,255 ; ja 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 292d8 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
+ DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 298b8 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,70,15,16,12,138 ; movss (%rdx,%r9,4),%xmm9
- DB 233,216,254,255,255 ; jmpq 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 233,216,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,184 ; ja 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 119,184 ; ja 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 292f4 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
+ DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 298d4 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4)
- DB 235,156 ; jmp 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 235,156 ; jmp 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,70,15,18,12,138 ; movlpd (%rdx,%r9,4),%xmm9
- DB 233,151,254,255,255 ; jmpq 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 233,151,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 243,66,15,16,100,138,20 ; movss 0x14(%rdx,%r9,4),%xmm4
@@ -39543,23 +39898,23 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 68,15,40,196 ; movaps %xmm4,%xmm8
DB 243,66,15,16,100,138,16 ; movss 0x10(%rdx,%r9,4),%xmm4
DB 243,68,15,16,196 ; movss %xmm4,%xmm8
- DB 233,94,254,255,255 ; jmpq 290ef <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
+ DB 233,94,254,255,255 ; jmpq 296cf <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
DB 102,65,15,112,225,78 ; pshufd $0x4e,%xmm9,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4)
- DB 233,57,255,255,255 ; jmpq 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 233,57,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 102,65,15,112,224,78 ; pshufd $0x4e,%xmm8,%xmm4
DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4)
DB 102,65,15,112,224,229 ; pshufd $0xe5,%xmm8,%xmm4
DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4)
DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4)
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
- DB 233,13,255,255,255 ; jmpq 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 233,13,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 15,31,0 ; nopl (%rax)
DB 58,255 ; cmp %bh,%bh
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 292dd <_sk_srcover_rgba_8888_sse2_8bit+0x219>
+ DB 123,255 ; jnp 298bd <_sk_srcover_rgba_8888_sse2_8bit+0x219>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -39595,7 +39950,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,148,34,0,0 ; mulss 0x2294(%rip),%xmm0 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,5,160,34,0,0 ; mulss 0x22a0(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
@@ -39607,7 +39962,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6
DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6
DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6
- DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,65,15,213,248 ; pmullw %xmm8,%xmm7
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
@@ -39638,10 +39993,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,239,0,0,0 ; jne 294c1 <_sk_scale_u8_sse2_8bit+0x110>
+ DB 15,133,239,0,0,0 ; jne 29aa1 <_sk_scale_u8_sse2_8bit+0x110>
DB 243,66,15,126,36,2 ; movq (%rdx,%r8,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
- DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,40,236 ; movapd %xmm4,%xmm5
DB 102,65,15,105,232 ; punpckhwd %xmm8,%xmm5
@@ -39694,15 +40049,15 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,6,255,255,255 ; ja 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 15,135,6,255,255,255 ; ja 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29558 <_sk_scale_u8_sse2_8bit+0x1a7>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29b38 <_sk_scale_u8_sse2_8bit+0x1a7>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 233,228,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,228,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,2 ; pinsrw $0x2,%eax,%xmm4
@@ -39710,7 +40065,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 243,15,16,229 ; movss %xmm5,%xmm4
- DB 233,191,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,191,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,6 ; pinsrw $0x6,%eax,%xmm4
@@ -39721,7 +40076,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,135,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,135,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39748,7 +40103,7 @@ PUBLIC _sk_lerp_1_float_sse2_8bit
_sk_lerp_1_float_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,58,32,0,0 ; mulss 0x203a(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -39761,7 +40116,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,69,15,96,217 ; punpcklbw %xmm9,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
DB 102,15,213,225 ; pmullw %xmm1,%xmm4
@@ -39824,10 +40179,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,141,1,0,0 ; jne 29858 <_sk_lerp_u8_sse2_8bit+0x1ae>
+ DB 15,133,141,1,0,0 ; jne 29e38 <_sk_lerp_u8_sse2_8bit+0x1ae>
DB 243,66,15,126,44,2 ; movq (%rdx,%r8,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,40,229 ; movapd %xmm5,%xmm4
DB 102,65,15,105,224 ; punpckhwd %xmm8,%xmm4
@@ -39913,15 +40268,15 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,104,254,255,255 ; ja 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 15,135,104,254,255,255 ; ja 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 298ec <_sk_lerp_u8_sse2_8bit+0x242>
+ DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 29ecc <_sk_lerp_u8_sse2_8bit+0x242>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,232 ; movd %eax,%xmm5
- DB 233,70,254,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,70,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,2 ; pinsrw $0x2,%eax,%xmm5
@@ -39929,7 +40284,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 243,15,16,236 ; movss %xmm4,%xmm5
- DB 233,33,254,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,33,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,6 ; pinsrw $0x6,%eax,%xmm5
@@ -39940,7 +40295,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 242,15,16,236 ; movsd %xmm4,%xmm5
- DB 233,233,253,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,233,253,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 149 ; xchg %eax,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39979,7 +40334,7 @@ _sk_move_dst_src_sse2_8bit LABEL PROC
PUBLIC _sk_black_color_sse2_8bit
_sk_black_color_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -40750,6 +41105,13 @@ _sk_xor__sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_plus__sse2_8bit
+_sk_plus__sse2_8bit LABEL PROC
+ DB 102,15,220,194 ; paddusb %xmm2,%xmm0
+ DB 102,15,220,203 ; paddusb %xmm3,%xmm1
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_darken_sse2_8bit
_sk_darken_sse2_8bit LABEL PROC
DB 242,15,112,227,231 ; pshuflw $0xe7,%xmm3,%xmm4
@@ -40843,7 +41205,7 @@ _sk_darken_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,176,30,0,0 ; movdqa 0x1eb0(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,37,164,30,0,0 ; movdqa 0x1ea4(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -40949,7 +41311,7 @@ _sk_lighten_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,196,28,0,0 ; movdqa 0x1cc4(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,37,184,28,0,0 ; movdqa 0x1cb8(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -40997,7 +41359,7 @@ _sk_exclusion_sse2_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,103,244 ; packuswb %xmm4,%xmm6
DB 102,15,103,239 ; packuswb %xmm7,%xmm5
- DB 102,15,111,37,247,27,0,0 ; movdqa 0x1bf7(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,37,235,27,0,0 ; movdqa 0x1beb(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,205 ; psubb %xmm5,%xmm1
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,219,230 ; pand %xmm6,%xmm4
@@ -41094,7 +41456,7 @@ _sk_difference_sse2_8bit LABEL PROC
DB 102,65,15,103,244 ; packuswb %xmm12,%xmm6
DB 102,65,15,218,226 ; pminub %xmm10,%xmm4
DB 102,65,15,218,243 ; pminub %xmm11,%xmm6
- DB 102,15,111,45,52,26,0,0 ; movdqa 0x1a34(%rip),%xmm5 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,45,40,26,0,0 ; movdqa 0x1a28(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 102,15,219,236 ; pand %xmm4,%xmm5
@@ -41189,7 +41551,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
DB 102,69,15,217,211 ; psubusw %xmm11,%xmm10
DB 102,68,15,117,213 ; pcmpeqw %xmm5,%xmm10
- DB 102,15,111,45,199,16,0,0 ; movdqa 0x10c7(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,45,187,16,0,0 ; movdqa 0x10bb(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
DB 102,15,239,197 ; pxor %xmm5,%xmm0
DB 102,65,15,213,198 ; pmullw %xmm14,%xmm0
@@ -41293,7 +41655,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,253,188,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm15
DB 102,68,15,253,76,36,16 ; paddw 0x10(%rsp),%xmm9
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,69,22,0,0 ; movdqa 0x1645(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,57,22,0,0 ; movdqa 0x1639(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,15,253,208 ; paddw %xmm0,%xmm2
DB 102,68,15,253,210 ; paddw %xmm2,%xmm10
DB 102,68,15,253,248 ; paddw %xmm0,%xmm15
@@ -41302,7 +41664,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,69,15,253,193 ; paddw %xmm9,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,233 ; paddw %xmm1,%xmm5
- DB 102,15,111,5,40,22,0,0 ; movdqa 0x1628(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,28,22,0,0 ; movdqa 0x161c(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,192 ; pmulhuw %xmm0,%xmm8
DB 102,68,15,228,248 ; pmulhuw %xmm0,%xmm15
@@ -41405,7 +41767,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,217,234 ; psubusw %xmm2,%xmm5
DB 102,15,117,236 ; pcmpeqw %xmm4,%xmm5
DB 102,15,127,172,36,160,0,0,0 ; movdqa %xmm5,0xa0(%rsp)
- DB 102,15,111,53,92,12,0,0 ; movdqa 0xc5c(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,80,12,0,0 ; movdqa 0xc50(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,194 ; movdqa %xmm2,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,199 ; pmullw %xmm15,%xmm0
@@ -41513,7 +41875,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,68,15,253,92,36,112 ; paddw 0x70(%rsp),%xmm11
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
DB 102,15,253,116,36,16 ; paddw 0x10(%rsp),%xmm6
- DB 102,15,111,5,214,17,0,0 ; movdqa 0x11d6(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,202,17,0,0 ; movdqa 0x11ca(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,224 ; paddw %xmm0,%xmm12
DB 102,68,15,253,227 ; paddw %xmm3,%xmm12
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
@@ -41522,7 +41884,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,234 ; paddw %xmm2,%xmm5
DB 102,15,253,240 ; paddw %xmm0,%xmm6
DB 102,15,253,241 ; paddw %xmm1,%xmm6
- DB 102,15,111,5,186,17,0,0 ; movdqa 0x11ba(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,174,17,0,0 ; movdqa 0x11ae(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
@@ -41556,14 +41918,14 @@ ALIGN 4
DB 252 ; cld
DB 190,0,0,128,191 ; mov $0xbf800000,%esi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2b5f0 <.literal4+0x64>
+ DB 224,64 ; loopne 2bbdc <.literal4+0x64>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 2b5f9 <.literal4+0x6d>
+ DB 71,225,61 ; rex.RXB loope 2bbe5 <.literal4+0x6d>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2b603 <.literal4+0x77>
+ DB 127,67 ; jg 2bbef <.literal4+0x77>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi)
DB 10,215 ; or %bh,%dl
@@ -41596,7 +41958,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2b619 <.literal4+0x8d>
+ DB 224,7 ; loopne 2bc05 <.literal4+0x8d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -41607,8 +41969,8 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 2b62c <.literal4+0xa0>
- DB 119,115 ; ja 2b6a1 <.literal4+0x115>
+ DB 127,0 ; jg 2bc18 <.literal4+0xa0>
+ DB 119,115 ; ja 2bc8d <.literal4+0x115>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -41631,12 +41993,12 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2b6b7 <.literal4+0x12b>
+ DB 118,63 ; jbe 2bca3 <.literal4+0x12b>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2b6c6 <.literal4+0x13a>
+ DB 124,66 ; jl 2bcb2 <.literal4+0x13a>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -41646,9 +42008,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 2b6e9 <.literal4+0x15d>
+ DB 112,65 ; jo 2bcd5 <.literal4+0x15d>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2b6f3 <.literal4+0x167>
+ DB 127,71 ; jg 2bcdf <.literal4+0x167>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,89 ; ds pop %rcx
@@ -41675,15 +42037,15 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,0,0 ; addb $0x0,(%rax)
DB 0,191,0,0,192,191 ; add %bh,-0x40400000(%rdi)
- DB 114,28 ; jb 2b712 <.literal4+0x186>
+ DB 114,28 ; jb 2bcfe <.literal4+0x186>
DB 199 ; (bad)
DB 62,0,0 ; add %al,%ds:(%rax)
DB 192,63,85 ; sarb $0x55,(%rdi)
DB 85 ; push %rbp
DB 149 ; xchg %eax,%ebp
DB 191,57,142,99,61 ; mov $0x3d638e39,%edi
- DB 114,249 ; jb 2b6ff <.literal4+0x173>
- DB 127,63 ; jg 2b747 <_sk_overlay_sse2_8bit+0x626>
+ DB 114,249 ; jb 2bceb <.literal4+0x173>
+ DB 127,63 ; jg 2bd33 <_sk_overlay_sse2_8bit+0x626>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,4 ; add %al,0x4000000(%rax)
@@ -41719,16 +42081,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b768 <_sk_overlay_sse2_8bit+0xa000647>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bd48 <_sk_overlay_sse2_8bit+0xa00063b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b770 <_sk_overlay_sse2_8bit+0x1200064f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bd50 <_sk_overlay_sse2_8bit+0x12000643>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b778 <_sk_overlay_sse2_8bit+0x1a000657>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bd58 <_sk_overlay_sse2_8bit+0x1a00064b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b780 <_sk_overlay_sse2_8bit+0x300065f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bd60 <_sk_overlay_sse2_8bit+0x3000653>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41771,16 +42133,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b7c8 <_sk_overlay_sse2_8bit+0xa0006a7>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bda8 <_sk_overlay_sse2_8bit+0xa00069b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b7d0 <_sk_overlay_sse2_8bit+0x120006af>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bdb0 <_sk_overlay_sse2_8bit+0x120006a3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b7d8 <_sk_overlay_sse2_8bit+0x1a0006b7>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bdb8 <_sk_overlay_sse2_8bit+0x1a0006ab>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b7e0 <_sk_overlay_sse2_8bit+0x30006bf>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bdc0 <_sk_overlay_sse2_8bit+0x30006b3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41823,16 +42185,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b828 <_sk_overlay_sse2_8bit+0xa000707>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be08 <_sk_overlay_sse2_8bit+0xa0006fb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b830 <_sk_overlay_sse2_8bit+0x1200070f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be10 <_sk_overlay_sse2_8bit+0x12000703>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b838 <_sk_overlay_sse2_8bit+0x1a000717>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be18 <_sk_overlay_sse2_8bit+0x1a00070b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b840 <_sk_overlay_sse2_8bit+0x300071f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be20 <_sk_overlay_sse2_8bit+0x3000713>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41875,16 +42237,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b888 <_sk_overlay_sse2_8bit+0xa000767>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be68 <_sk_overlay_sse2_8bit+0xa00075b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b890 <_sk_overlay_sse2_8bit+0x1200076f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be70 <_sk_overlay_sse2_8bit+0x12000763>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b898 <_sk_overlay_sse2_8bit+0x1a000777>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be78 <_sk_overlay_sse2_8bit+0x1a00076b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b8a0 <_sk_overlay_sse2_8bit+0x300077f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be80 <_sk_overlay_sse2_8bit+0x3000773>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41927,16 +42289,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b8e8 <_sk_overlay_sse2_8bit+0xa0007c7>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bec8 <_sk_overlay_sse2_8bit+0xa0007bb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b8f0 <_sk_overlay_sse2_8bit+0x120007cf>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bed0 <_sk_overlay_sse2_8bit+0x120007c3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b8f8 <_sk_overlay_sse2_8bit+0x1a0007d7>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bed8 <_sk_overlay_sse2_8bit+0x1a0007cb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b900 <_sk_overlay_sse2_8bit+0x30007df>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bee0 <_sk_overlay_sse2_8bit+0x30007d3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41979,16 +42341,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b948 <_sk_overlay_sse2_8bit+0xa000827>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf28 <_sk_overlay_sse2_8bit+0xa00081b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b950 <_sk_overlay_sse2_8bit+0x1200082f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf30 <_sk_overlay_sse2_8bit+0x12000823>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b958 <_sk_overlay_sse2_8bit+0x1a000837>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf38 <_sk_overlay_sse2_8bit+0x1a00082b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b960 <_sk_overlay_sse2_8bit+0x300083f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bf40 <_sk_overlay_sse2_8bit+0x3000833>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42031,16 +42393,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b9a8 <_sk_overlay_sse2_8bit+0xa000887>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf88 <_sk_overlay_sse2_8bit+0xa00087b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b9b0 <_sk_overlay_sse2_8bit+0x1200088f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf90 <_sk_overlay_sse2_8bit+0x12000883>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b9b8 <_sk_overlay_sse2_8bit+0x1a000897>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf98 <_sk_overlay_sse2_8bit+0x1a00088b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b9c0 <_sk_overlay_sse2_8bit+0x300089f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bfa0 <_sk_overlay_sse2_8bit+0x3000893>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42083,16 +42445,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ba08 <_sk_overlay_sse2_8bit+0xa0008e7>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bfe8 <_sk_overlay_sse2_8bit+0xa0008db>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ba10 <_sk_overlay_sse2_8bit+0x120008ef>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bff0 <_sk_overlay_sse2_8bit+0x120008e3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ba18 <_sk_overlay_sse2_8bit+0x1a0008f7>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bff8 <_sk_overlay_sse2_8bit+0x1a0008eb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ba20 <_sk_overlay_sse2_8bit+0x30008ff>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c000 <_sk_overlay_sse2_8bit+0x30008f3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42929,11 +43291,11 @@ ALIGN 16
DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%rax)
DB 191,0,0,224,64 ; mov $0x40e00000,%edi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c028 <.literal16+0xf8>
+ DB 224,64 ; loopne 2c608 <.literal16+0xf8>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c02c <.literal16+0xfc>
+ DB 224,64 ; loopne 2c60c <.literal16+0xfc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c030 <.literal16+0x100>
+ DB 224,64 ; loopne 2c610 <.literal16+0x100>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -42953,13 +43315,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c051 <.literal16+0x121>
+ DB 71,225,61 ; rex.RXB loope 2c631 <.literal16+0x121>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c055 <.literal16+0x125>
+ DB 71,225,61 ; rex.RXB loope 2c635 <.literal16+0x125>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c059 <.literal16+0x129>
+ DB 71,225,61 ; rex.RXB loope 2c639 <.literal16+0x129>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c05d <.literal16+0x12d>
+ DB 71,225,61 ; rex.RXB loope 2c63d <.literal16+0x12d>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -42970,10 +43332,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c038 <_sk_overlay_sse2_8bit+0xa000f17>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c618 <_sk_overlay_sse2_8bit+0xa000f0b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302c040 <_sk_overlay_sse2_8bit+0x3000f1f>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302c620 <_sk_overlay_sse2_8bit+0x3000f13>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42988,11 +43350,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c09b <.literal16+0x16b>
+ DB 127,67 ; jg 2c67b <.literal16+0x16b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c09f <.literal16+0x16f>
+ DB 127,67 ; jg 2c67f <.literal16+0x16f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c0a3 <.literal16+0x173>
+ DB 127,67 ; jg 2c683 <.literal16+0x173>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
DB 145 ; xchg %eax,%ecx
@@ -43143,13 +43505,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2c1a9 <.literal16+0x279>
+ DB 224,7 ; loopne 2c789 <.literal16+0x279>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c1ad <.literal16+0x27d>
+ DB 224,7 ; loopne 2c78d <.literal16+0x27d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c1b1 <.literal16+0x281>
+ DB 224,7 ; loopne 2c791 <.literal16+0x281>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c1b5 <.literal16+0x285>
+ DB 224,7 ; loopne 2c795 <.literal16+0x285>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -43209,17 +43571,17 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 2c234 <.literal16+0x304>
+ DB 127,0 ; jg 2c814 <.literal16+0x304>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c238 <.literal16+0x308>
+ DB 127,0 ; jg 2c818 <.literal16+0x308>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c23c <.literal16+0x30c>
+ DB 127,0 ; jg 2c81c <.literal16+0x30c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c240 <.literal16+0x310>
- DB 119,115 ; ja 2c2b5 <.literal16+0x385>
+ DB 127,0 ; jg 2c820 <.literal16+0x310>
+ DB 119,115 ; ja 2c895 <.literal16+0x385>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -43230,7 +43592,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 2c219 <.literal16+0x2e9>
+ DB 117,191 ; jne 2c7f9 <.literal16+0x2e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -43242,7 +43604,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a6025a <_sk_overlay_sse2_8bit+0xffffffffe9a35139>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a6083a <_sk_overlay_sse2_8bit+0xffffffffe9a3512d>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -43332,16 +43694,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3a3 <.literal16+0x473>
+ DB 118,63 ; jbe 2c983 <.literal16+0x473>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3a7 <.literal16+0x477>
+ DB 118,63 ; jbe 2c987 <.literal16+0x477>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3ab <.literal16+0x47b>
+ DB 118,63 ; jbe 2c98b <.literal16+0x47b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3af <.literal16+0x47f>
+ DB 118,63 ; jbe 2c98f <.literal16+0x47f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -43362,13 +43724,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2c3e6 <.literal16+0x4b6>
+ DB 124,66 ; jl 2c9c6 <.literal16+0x4b6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c3ea <.literal16+0x4ba>
+ DB 124,66 ; jl 2c9ca <.literal16+0x4ba>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c3ee <.literal16+0x4be>
+ DB 124,66 ; jl 2c9ce <.literal16+0x4be>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c3f2 <.literal16+0x4c2>
+ DB 124,66 ; jl 2c9d2 <.literal16+0x4c2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -43414,13 +43776,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c475 <.literal16+0x545>
+ DB 112,65 ; jo 2ca55 <.literal16+0x545>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c479 <.literal16+0x549>
+ DB 112,65 ; jo 2ca59 <.literal16+0x549>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c47d <.literal16+0x54d>
+ DB 112,65 ; jo 2ca5d <.literal16+0x54d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c481 <.literal16+0x551>
+ DB 112,65 ; jo 2ca61 <.literal16+0x551>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -43459,13 +43821,13 @@ ALIGN 16
DB 64,254 ; rex (bad)
DB 255,0 ; incl (%rax)
DB 255 ; (bad)
- DB 127,71 ; jg 2c4eb <.literal16+0x5bb>
+ DB 127,71 ; jg 2cacb <.literal16+0x5bb>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2c4ef <.literal16+0x5bf>
+ DB 127,71 ; jg 2cacf <.literal16+0x5bf>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2c4f3 <.literal16+0x5c3>
+ DB 127,71 ; jg 2cad3 <.literal16+0x5c3>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2c4f7 <.literal16+0x5c7>
+ DB 127,71 ; jg 2cad7 <.literal16+0x5c7>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,208 ; ds (bad)
@@ -43495,10 +43857,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2d5fa <_sk_overlay_sse2_8bit+0x2dc024d9>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2dbda <_sk_overlay_sse2_8bit+0x2dc024cd>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 2c52c <.literal16+0x5fc>
+ DB 120,57 ; js 2cb0c <.literal16+0x5fc>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -43563,13 +43925,13 @@ ALIGN 16
DB 192,191,0,0,192,191,0 ; sarb $0x0,-0x40400000(%rdi)
DB 0,192 ; add %al,%al
DB 191,0,0,192,191 ; mov $0xbfc00000,%edi
- DB 114,28 ; jb 2c5de <.literal16+0x6ae>
+ DB 114,28 ; jb 2cbbe <.literal16+0x6ae>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2c5e2 <.literal16+0x6b2>
+ DB 62,114,28 ; jb,pt 2cbc2 <.literal16+0x6b2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2c5e6 <.literal16+0x6b6>
+ DB 62,114,28 ; jb,pt 2cbc6 <.literal16+0x6b6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2c5ea <.literal16+0x6ba>
+ DB 62,114,28 ; jb,pt 2cbca <.literal16+0x6ba>
DB 199 ; (bad)
DB 62,85 ; ds push %rbp
DB 85 ; push %rbp
@@ -43588,15 +43950,15 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665435 <_sk_overlay_sse2_8bit+0x3d63a314>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665a15 <_sk_overlay_sse2_8bit+0x3d63a308>
DB 57,142,99,61,114,249 ; cmp %ecx,-0x68dc29d(%rsi)
- DB 127,63 ; jg 2c643 <.literal16+0x713>
- DB 114,249 ; jb 2c5ff <.literal16+0x6cf>
- DB 127,63 ; jg 2c647 <.literal16+0x717>
- DB 114,249 ; jb 2c603 <.literal16+0x6d3>
- DB 127,63 ; jg 2c64b <.literal16+0x71b>
- DB 114,249 ; jb 2c607 <.literal16+0x6d7>
- DB 127,63 ; jg 2c64f <.literal16+0x71f>
+ DB 127,63 ; jg 2cc23 <.literal16+0x713>
+ DB 114,249 ; jb 2cbdf <.literal16+0x6cf>
+ DB 127,63 ; jg 2cc27 <.literal16+0x717>
+ DB 114,249 ; jb 2cbe3 <.literal16+0x6d3>
+ DB 127,63 ; jg 2cc2b <.literal16+0x71b>
+ DB 114,249 ; jb 2cbe7 <.literal16+0x6d7>
+ DB 127,63 ; jg 2cc2f <.literal16+0x71f>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 3,0 ; add (%rax),%eax
@@ -43703,14 +44065,14 @@ ALIGN 16
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,0 ; incl (%rax)
- DB 127,0 ; jg 2c6e2 <.literal16+0x7b2>
- DB 127,0 ; jg 2c6e4 <.literal16+0x7b4>
- DB 127,0 ; jg 2c6e6 <.literal16+0x7b6>
- DB 127,0 ; jg 2c6e8 <.literal16+0x7b8>
- DB 127,0 ; jg 2c6ea <.literal16+0x7ba>
- DB 127,0 ; jg 2c6ec <.literal16+0x7bc>
- DB 127,0 ; jg 2c6ee <.literal16+0x7be>
- DB 127,0 ; jg 2c6f0 <.literal16+0x7c0>
+ DB 127,0 ; jg 2ccc2 <.literal16+0x7b2>
+ DB 127,0 ; jg 2ccc4 <.literal16+0x7b4>
+ DB 127,0 ; jg 2ccc6 <.literal16+0x7b6>
+ DB 127,0 ; jg 2ccc8 <.literal16+0x7b8>
+ DB 127,0 ; jg 2ccca <.literal16+0x7ba>
+ DB 127,0 ; jg 2cccc <.literal16+0x7bc>
+ DB 127,0 ; jg 2ccce <.literal16+0x7be>
+ DB 127,0 ; jg 2ccd0 <.literal16+0x7c0>
DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax)
DB 129 ; .byte 0x81
DB 128 ; .byte 0x80
@@ -43805,7 +44167,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,2 ; movd (%edx),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,144,226,144,0,0 ; movaps 0x90e2(%eax),%xmm2
+ DB 15,40,144,98,146,0,0 ; movaps 0x9262(%eax),%xmm2
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -43820,7 +44182,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,41,82,32 ; movaps %xmm2,0x20(%edx)
DB 15,41,82,16 ; movaps %xmm2,0x10(%edx)
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,144,242,144,0,0 ; movaps 0x90f2(%eax),%xmm2
+ DB 15,40,144,114,146,0,0 ; movaps 0x9272(%eax),%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 86 ; push %esi
DB 82 ; push %edx
@@ -43851,16 +44213,16 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4
DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7
DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,111,177,133,144,0,0 ; movdqa 0x9085(%ecx),%xmm6
+ DB 102,15,111,177,5,146,0,0 ; movdqa 0x9205(%ecx),%xmm6
DB 102,15,111,207 ; movdqa %xmm7,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
- DB 102,15,111,129,165,144,0,0 ; movdqa 0x90a5(%ecx),%xmm0
+ DB 102,15,111,129,37,146,0,0 ; movdqa 0x9225(%ecx),%xmm0
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,219,197 ; pand %xmm5,%xmm0
- DB 102,15,219,185,149,144,0,0 ; pand 0x9095(%ecx),%xmm7
- DB 102,15,219,169,149,144,0,0 ; pand 0x9095(%ecx),%xmm5
+ DB 102,15,219,185,21,146,0,0 ; pand 0x9215(%ecx),%xmm7
+ DB 102,15,219,169,21,146,0,0 ; pand 0x9215(%ecx),%xmm5
DB 102,15,114,246,4 ; pslld $0x4,%xmm6
DB 102,15,254,192 ; paddd %xmm0,%xmm0
DB 102,15,235,198 ; por %xmm6,%xmm0
@@ -43875,8 +44237,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0
- DB 15,89,129,181,144,0,0 ; mulps 0x90b5(%ecx),%xmm0
- DB 15,88,129,197,144,0,0 ; addps 0x90c5(%ecx),%xmm0
+ DB 15,89,129,53,146,0,0 ; mulps 0x9235(%ecx),%xmm0
+ DB 15,88,129,69,146,0,0 ; addps 0x9245(%ecx),%xmm0
DB 243,15,16,14 ; movss (%esi),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -43940,7 +44302,7 @@ _sk_black_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,152,149,143,0,0 ; movaps 0x8f95(%eax),%xmm3
+ DB 15,40,152,21,145,0,0 ; movaps 0x9115(%eax),%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -43961,7 +44323,7 @@ _sk_white_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,128,117,143,0,0 ; movaps 0x8f75(%eax),%xmm0
+ DB 15,40,128,245,144,0,0 ; movaps 0x90f5(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -44043,7 +44405,7 @@ _sk_srcatop_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,170,214,142,0,0 ; movaps 0x8ed6(%edx),%xmm5
+ DB 15,40,170,86,144,0,0 ; movaps 0x9056(%edx),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
@@ -44080,7 +44442,7 @@ _sk_dstatop_sse2 LABEL PROC
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,40,162,135,142,0,0 ; movaps 0x8e87(%edx),%xmm4
+ DB 15,40,162,7,144,0,0 ; movaps 0x9007(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
@@ -44158,7 +44520,7 @@ _sk_srcout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,214,141,0,0 ; movaps 0x8dd6(%eax),%xmm4
+ DB 15,40,160,86,143,0,0 ; movaps 0x8f56(%eax),%xmm4
DB 15,92,98,64 ; subps 0x40(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
@@ -44182,7 +44544,7 @@ _sk_dstout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,174,141,0,0 ; movaps 0x8dae(%eax),%xmm4
+ DB 15,40,160,46,143,0,0 ; movaps 0x8f2e(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -44210,7 +44572,7 @@ _sk_srcover_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,119,141,0,0 ; movaps 0x8d77(%eax),%xmm4
+ DB 15,40,160,247,142,0,0 ; movaps 0x8ef7(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -44242,7 +44604,7 @@ _sk_dstover_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5
- DB 15,40,160,55,141,0,0 ; movaps 0x8d37(%eax),%xmm4
+ DB 15,40,160,183,142,0,0 ; movaps 0x8eb7(%eax),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
@@ -44294,7 +44656,7 @@ _sk_multiply_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,40,129,200,140,0,0 ; movaps 0x8cc8(%ecx),%xmm0
+ DB 15,40,129,72,142,0,0 ; movaps 0x8e48(%ecx),%xmm0
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -44347,17 +44709,24 @@ _sk_plus__sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 15,88,65,16 ; addps 0x10(%ecx),%xmm0
- DB 15,88,73,32 ; addps 0x20(%ecx),%xmm1
- DB 15,88,81,48 ; addps 0x30(%ecx),%xmm2
- DB 15,88,89,64 ; addps 0x40(%ecx),%xmm3
- DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 232,0,0,0,0 ; call 65e <_sk_plus__sse2+0xb>
+ DB 88 ; pop %eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
+ DB 15,40,160,178,141,0,0 ; movaps 0x8db2(%eax),%xmm4
+ DB 15,93,196 ; minps %xmm4,%xmm0
+ DB 15,88,74,32 ; addps 0x20(%edx),%xmm1
+ DB 15,93,204 ; minps %xmm4,%xmm1
+ DB 15,88,82,48 ; addps 0x30(%edx),%xmm2
+ DB 15,93,212 ; minps %xmm4,%xmm2
+ DB 15,88,90,64 ; addps 0x40(%edx),%xmm3
+ DB 15,93,220 ; minps %xmm4,%xmm3
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
DB 82 ; push %edx
- DB 81 ; push %ecx
- DB 255,16 ; call *(%eax)
+ DB 255,17 ; call *(%ecx)
DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -44408,12 +44777,12 @@ _sk_xor__sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 232,0,0,0,0 ; call 6f3 <_sk_xor__sse2+0xe>
+ DB 232,0,0,0,0 ; call 70c <_sk_xor__sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
- DB 15,40,154,157,139,0,0 ; movaps 0x8b9d(%edx),%xmm3
+ DB 15,40,154,20,141,0,0 ; movaps 0x8d14(%edx),%xmm3
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,89,198 ; mulps %xmm6,%xmm0
@@ -44447,7 +44816,7 @@ _sk_darken_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 75b <_sk_darken_sse2+0xe>
+ DB 232,0,0,0,0 ; call 774 <_sk_darken_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44473,7 +44842,7 @@ _sk_darken_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,95,209 ; maxps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,69,139,0,0 ; movaps 0x8b45(%edx),%xmm1
+ DB 15,40,138,188,140,0,0 ; movaps 0x8cbc(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -44494,7 +44863,7 @@ _sk_lighten_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 7db <_sk_lighten_sse2+0xe>
+ DB 232,0,0,0,0 ; call 7f4 <_sk_lighten_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44520,7 +44889,7 @@ _sk_lighten_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,93,209 ; minps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,213,138,0,0 ; movaps 0x8ad5(%edx),%xmm1
+ DB 15,40,138,76,140,0,0 ; movaps 0x8c4c(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -44542,7 +44911,7 @@ _sk_difference_sse2 LABEL PROC
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,225 ; movaps %xmm1,%xmm4
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 85e <_sk_difference_sse2+0x11>
+ DB 232,0,0,0,0 ; call 877 <_sk_difference_sse2+0x11>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44571,7 +44940,7 @@ _sk_difference_sse2 LABEL PROC
DB 15,93,214 ; minps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,146,98,138,0,0 ; movaps 0x8a62(%edx),%xmm2
+ DB 15,40,146,217,139,0,0 ; movaps 0x8bd9(%edx),%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -44591,7 +44960,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 8e4 <_sk_exclusion_sse2+0xe>
+ DB 232,0,0,0,0 ; call 8fd <_sk_exclusion_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44613,7 +44982,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,202 ; mulps %xmm2,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
DB 15,92,233 ; subps %xmm1,%xmm5
- DB 15,40,138,236,137,0,0 ; movaps 0x89ec(%edx),%xmm1
+ DB 15,40,138,99,139,0,0 ; movaps 0x8b63(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -44637,7 +45006,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 963 <_sk_colorburn_sse2+0x19>
+ DB 232,0,0,0,0 ; call 97c <_sk_colorburn_sse2+0x19>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
@@ -44652,7 +45021,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,93,198 ; minps %xmm6,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
- DB 15,40,177,125,137,0,0 ; movaps 0x897d(%ecx),%xmm6
+ DB 15,40,177,244,138,0,0 ; movaps 0x8af4(%ecx),%xmm6
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
@@ -44763,11 +45132,11 @@ _sk_colordodge_sse2 LABEL PROC
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
- DB 232,0,0,0,0 ; call aec <_sk_colordodge_sse2+0x16>
+ DB 232,0,0,0,0 ; call b05 <_sk_colordodge_sse2+0x16>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
- DB 15,40,145,4,136,0,0 ; movaps 0x8804(%ecx),%xmm2
+ DB 15,40,145,123,137,0,0 ; movaps 0x897b(%ecx),%xmm2
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,250 ; movaps %xmm2,%xmm7
@@ -44878,11 +45247,11 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
- DB 232,0,0,0,0 ; call c4d <_sk_hardlight_sse2+0x16>
+ DB 232,0,0,0,0 ; call c66 <_sk_hardlight_sse2+0x16>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
- DB 15,40,145,179,134,0,0 ; movaps 0x86b3(%ecx),%xmm2
+ DB 15,40,145,42,136,0,0 ; movaps 0x882a(%ecx),%xmm2
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,40,225 ; movaps %xmm1,%xmm4
@@ -44986,11 +45355,11 @@ _sk_overlay_sse2 LABEL PROC
DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 232,0,0,0,0 ; call d98 <_sk_overlay_sse2+0x1a>
+ DB 232,0,0,0,0 ; call db1 <_sk_overlay_sse2+0x1a>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
- DB 15,40,161,120,133,0,0 ; movaps 0x8578(%ecx),%xmm4
+ DB 15,40,161,239,134,0,0 ; movaps 0x86ef(%ecx),%xmm4
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
@@ -45113,20 +45482,20 @@ _sk_softlight_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,241 ; addps %xmm1,%xmm6
- DB 232,0,0,0,0 ; call f28 <_sk_softlight_sse2+0x52>
+ DB 232,0,0,0,0 ; call f41 <_sk_softlight_sse2+0x52>
DB 89 ; pop %ecx
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,137,8,132,0,0 ; movaps 0x8408(%ecx),%xmm1
+ DB 15,40,137,127,133,0,0 ; movaps 0x857f(%ecx),%xmm1
DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
DB 15,88,193 ; addps %xmm1,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,185,248,131,0,0 ; movaps 0x83f8(%ecx),%xmm7
+ DB 15,40,185,111,133,0,0 ; movaps 0x856f(%ecx),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,82,242 ; rsqrtps %xmm2,%xmm6
DB 15,83,206 ; rcpps %xmm6,%xmm1
DB 15,92,202 ; subps %xmm2,%xmm1
- DB 15,40,161,24,132,0,0 ; movaps 0x8418(%ecx),%xmm4
+ DB 15,40,161,143,133,0,0 ; movaps 0x858f(%ecx),%xmm4
DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
@@ -45320,7 +45689,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,93,200 ; minps %xmm0,%xmm1
DB 15,92,225 ; subps %xmm1,%xmm4
DB 15,41,101,168 ; movaps %xmm4,-0x58(%ebp)
- DB 232,0,0,0,0 ; call 11e9 <_sk_hue_sse2+0x4f>
+ DB 232,0,0,0,0 ; call 1202 <_sk_hue_sse2+0x4f>
DB 89 ; pop %ecx
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -45330,7 +45699,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 15,40,169,151,129,0,0 ; movaps 0x8197(%ecx),%xmm5
+ DB 15,40,169,14,131,0,0 ; movaps 0x830e(%ecx),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
@@ -45363,17 +45732,17 @@ _sk_hue_sse2 LABEL PROC
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,153,103,129,0,0 ; movaps 0x8167(%ecx),%xmm3
+ DB 15,40,153,222,130,0,0 ; movaps 0x82de(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,153,119,129,0,0 ; movaps 0x8177(%ecx),%xmm3
+ DB 15,40,153,238,130,0,0 ; movaps 0x82ee(%ecx),%xmm3
DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,137,151,129,0,0 ; movaps 0x8197(%ecx),%xmm1
+ DB 15,40,137,14,131,0,0 ; movaps 0x830e(%ecx),%xmm1
DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
@@ -45383,7 +45752,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
- DB 15,40,169,135,129,0,0 ; movaps 0x8187(%ecx),%xmm5
+ DB 15,40,169,254,130,0,0 ; movaps 0x82fe(%ecx),%xmm5
DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,207 ; addps %xmm7,%xmm1
DB 15,94,212 ; divps %xmm4,%xmm2
@@ -45572,19 +45941,19 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,221 ; mulps %xmm5,%xmm3
DB 15,40,211 ; movaps %xmm3,%xmm2
DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 232,0,0,0,0 ; call 153d <_sk_saturation_sse2+0xb0>
+ DB 232,0,0,0,0 ; call 1556 <_sk_saturation_sse2+0xb0>
DB 89 ; pop %ecx
- DB 15,40,153,83,126,0,0 ; movaps 0x7e53(%ecx),%xmm3
+ DB 15,40,153,202,127,0,0 ; movaps 0x7fca(%ecx),%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,153,99,126,0,0 ; movaps 0x7e63(%ecx),%xmm3
+ DB 15,40,153,218,127,0,0 ; movaps 0x7fda(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,129,131,126,0,0 ; movaps 0x7e83(%ecx),%xmm0
+ DB 15,40,129,250,127,0,0 ; movaps 0x7ffa(%ecx),%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -45596,7 +45965,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,129,115,126,0,0 ; movaps 0x7e73(%ecx),%xmm0
+ DB 15,40,129,234,127,0,0 ; movaps 0x7fea(%ecx),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
@@ -45748,21 +46117,21 @@ _sk_color_sse2 LABEL PROC
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
- DB 232,0,0,0,0 ; call 1798 <_sk_color_sse2+0x2a>
+ DB 232,0,0,0,0 ; call 17b1 <_sk_color_sse2+0x2a>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1
- DB 15,40,177,56,124,0,0 ; movaps 0x7c38(%ecx),%xmm6
+ DB 15,40,177,175,125,0,0 ; movaps 0x7daf(%ecx),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,153,72,124,0,0 ; movaps 0x7c48(%ecx),%xmm3
+ DB 15,40,153,191,125,0,0 ; movaps 0x7dbf(%ecx),%xmm3
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 15,40,129,104,124,0,0 ; movaps 0x7c68(%ecx),%xmm0
+ DB 15,40,129,223,125,0,0 ; movaps 0x7ddf(%ecx),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0
DB 15,89,208 ; mulps %xmm0,%xmm2
@@ -45772,7 +46141,7 @@ _sk_color_sse2 LABEL PROC
DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
DB 15,89,194 ; mulps %xmm2,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
- DB 15,40,137,88,124,0,0 ; movaps 0x7c58(%ecx),%xmm1
+ DB 15,40,137,207,125,0,0 ; movaps 0x7dcf(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
@@ -45926,21 +46295,21 @@ _sk_luminosity_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 129,236,184,0,0,0 ; sub $0xb8,%esp
DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 232,0,0,0,0 ; call 19fb <_sk_luminosity_sse2+0x11>
+ DB 232,0,0,0,0 ; call 1a14 <_sk_luminosity_sse2+0x11>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 15,40,161,21,122,0,0 ; movaps 0x7a15(%ecx),%xmm4
+ DB 15,40,161,140,123,0,0 ; movaps 0x7b8c(%ecx),%xmm4
DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,161,37,122,0,0 ; movaps 0x7a25(%ecx),%xmm4
+ DB 15,40,161,156,123,0,0 ; movaps 0x7b9c(%ecx),%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,161,69,122,0,0 ; movaps 0x7a45(%ecx),%xmm4
+ DB 15,40,161,188,123,0,0 ; movaps 0x7bbc(%ecx),%xmm4
DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -45950,7 +46319,7 @@ _sk_luminosity_sse2 LABEL PROC
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp)
DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,40,137,53,122,0,0 ; movaps 0x7a35(%ecx),%xmm1
+ DB 15,40,137,172,123,0,0 ; movaps 0x7bac(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,213 ; addps %xmm5,%xmm2
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
@@ -46110,7 +46479,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 131,236,44 ; sub $0x2c,%esp
DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 1c66 <_sk_srcover_rgba_8888_sse2+0x17>
+ DB 232,0,0,0,0 ; call 1c7f <_sk_srcover_rgba_8888_sse2+0x17>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -46122,9 +46491,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,49 ; mov (%ecx),%esi
- DB 15,133,224,0,0,0 ; jne 1d68 <_sk_srcover_rgba_8888_sse2+0x119>
+ DB 15,133,224,0,0,0 ; jne 1d81 <_sk_srcover_rgba_8888_sse2+0x119>
DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2
- DB 102,15,111,167,234,119,0,0 ; movdqa 0x77ea(%edi),%xmm4
+ DB 102,15,111,167,97,121,0,0 ; movdqa 0x7961(%edi),%xmm4
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
@@ -46135,9 +46504,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,219,252 ; pand %xmm4,%xmm7
DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,175,250,119,0,0 ; movaps 0x77fa(%edi),%xmm5
+ DB 15,40,175,113,121,0,0 ; movaps 0x7971(%edi),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,40,143,10,120,0,0 ; movaps 0x780a(%edi),%xmm1
+ DB 15,40,143,129,121,0,0 ; movaps 0x7981(%edi),%xmm1
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
@@ -46170,7 +46539,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
DB 133,219 ; test %ebx,%ebx
- DB 117,95 ; jne 1da3 <_sk_srcover_rgba_8888_sse2+0x154>
+ DB 117,95 ; jne 1dbc <_sk_srcover_rgba_8888_sse2+0x154>
DB 243,15,127,4,178 ; movdqu %xmm0,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -46191,33 +46560,33 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 136,69,243 ; mov %al,-0xd(%ebp)
DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,80 ; je 1dc7 <_sk_srcover_rgba_8888_sse2+0x178>
+ DB 116,80 ; je 1de0 <_sk_srcover_rgba_8888_sse2+0x178>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 116,21 ; je 1d99 <_sk_srcover_rgba_8888_sse2+0x14a>
+ DB 116,21 ; je 1db2 <_sk_srcover_rgba_8888_sse2+0x14a>
DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 15,133,255,254,255,255 ; jne 1c8d <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 15,133,255,254,255,255 ; jne 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e>
DB 102,15,110,84,178,8 ; movd 0x8(%edx,%esi,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,15,18,20,178 ; movlpd (%edx,%esi,4),%xmm2
- DB 233,234,254,255,255 ; jmp 1c8d <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 233,234,254,255,255 ; jmp 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e>
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,41 ; je 1dd4 <_sk_srcover_rgba_8888_sse2+0x185>
+ DB 116,41 ; je 1ded <_sk_srcover_rgba_8888_sse2+0x185>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 1dc0 <_sk_srcover_rgba_8888_sse2+0x171>
+ DB 116,16 ; je 1dd9 <_sk_srcover_rgba_8888_sse2+0x171>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,148 ; jne 1d49 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 117,148 ; jne 1d62 <_sk_srcover_rgba_8888_sse2+0xfa>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,15,126,76,178,8 ; movd %xmm1,0x8(%edx,%esi,4)
DB 102,15,214,4,178 ; movq %xmm0,(%edx,%esi,4)
- DB 235,130 ; jmp 1d49 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 235,130 ; jmp 1d62 <_sk_srcover_rgba_8888_sse2+0xfa>
DB 102,15,110,20,178 ; movd (%edx,%esi,4),%xmm2
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 233,185,254,255,255 ; jmp 1c8d <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 233,185,254,255,255 ; jmp 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e>
DB 102,15,126,4,178 ; movd %xmm0,(%edx,%esi,4)
- DB 233,107,255,255,255 ; jmp 1d49 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 233,107,255,255,255 ; jmp 1d62 <_sk_srcover_rgba_8888_sse2+0xfa>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -46244,10 +46613,10 @@ _sk_clamp_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e12 <_sk_clamp_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e2b <_sk_clamp_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,110,118,0,0 ; movaps 0x766e(%eax),%xmm4
+ DB 15,40,160,229,119,0,0 ; movaps 0x77e5(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,93,204 ; minps %xmm4,%xmm1
DB 15,93,212 ; minps %xmm4,%xmm2
@@ -46266,10 +46635,10 @@ _sk_clamp_a_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e45 <_sk_clamp_a_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e5e <_sk_clamp_a_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,93,152,75,118,0,0 ; minps 0x764b(%eax),%xmm3
+ DB 15,93,152,194,119,0,0 ; minps 0x77c2(%eax),%xmm3
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -46287,12 +46656,12 @@ _sk_clamp_a_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e75 <_sk_clamp_a_dst_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e8e <_sk_clamp_a_dst_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4
- DB 15,93,160,43,118,0,0 ; minps 0x762b(%eax),%xmm4
+ DB 15,93,160,162,119,0,0 ; minps 0x77a2(%eax),%xmm4
DB 15,41,98,64 ; movaps %xmm4,0x40(%edx)
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,93,236 ; minps %xmm4,%xmm5
@@ -46357,10 +46726,10 @@ _sk_invert_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1f20 <_sk_invert_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1f39 <_sk_invert_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,144,117,0,0 ; movaps 0x7590(%eax),%xmm4
+ DB 15,40,160,7,119,0,0 ; movaps 0x7707(%eax),%xmm4
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
@@ -46469,11 +46838,11 @@ _sk_unpremul_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 201e <_sk_unpremul_sse2+0xb>
+ DB 232,0,0,0,0 ; call 2037 <_sk_unpremul_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,40,168,162,116,0,0 ; movaps 0x74a2(%eax),%xmm5
+ DB 15,40,168,25,118,0,0 ; movaps 0x7619(%eax),%xmm5
DB 15,94,235 ; divps %xmm3,%xmm5
DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
DB 15,84,229 ; andps %xmm5,%xmm4
@@ -46498,23 +46867,23 @@ _sk_from_srgb_sse2 LABEL PROC
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 2068 <_sk_from_srgb_sse2+0x18>
+ DB 232,0,0,0,0 ; call 2081 <_sk_from_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,201 ; mulps %xmm1,%xmm1
- DB 15,40,160,120,116,0,0 ; movaps 0x7478(%eax),%xmm4
+ DB 15,40,160,239,117,0,0 ; movaps 0x75ef(%eax),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,176,136,116,0,0 ; movaps 0x7488(%eax),%xmm6
+ DB 15,40,176,255,117,0,0 ; movaps 0x75ff(%eax),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,176,104,116,0,0 ; movaps 0x7468(%eax),%xmm6
+ DB 15,40,176,223,117,0,0 ; movaps 0x75df(%eax),%xmm6
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,184,152,116,0,0 ; movaps 0x7498(%eax),%xmm7
+ DB 15,40,184,15,118,0,0 ; movaps 0x760f(%eax),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,184,168,116,0,0 ; movaps 0x74a8(%eax),%xmm7
+ DB 15,40,184,31,118,0,0 ; movaps 0x761f(%eax),%xmm7
DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -46566,24 +46935,24 @@ _sk_from_srgb_dst_sse2 LABEL PROC
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
- DB 232,0,0,0,0 ; call 2143 <_sk_from_srgb_dst_sse2+0x1b>
+ DB 232,0,0,0,0 ; call 215c <_sk_from_srgb_dst_sse2+0x1b>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,40,161,237,115,0,0 ; movaps 0x73ed(%ecx),%xmm4
+ DB 15,40,161,100,117,0,0 ; movaps 0x7564(%ecx),%xmm4
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,177,253,115,0,0 ; movaps 0x73fd(%ecx),%xmm6
+ DB 15,40,177,116,117,0,0 ; movaps 0x7574(%ecx),%xmm6
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,169,221,115,0,0 ; movaps 0x73dd(%ecx),%xmm5
+ DB 15,40,169,84,117,0,0 ; movaps 0x7554(%ecx),%xmm5
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,185,13,116,0,0 ; movaps 0x740d(%ecx),%xmm7
+ DB 15,40,185,132,117,0,0 ; movaps 0x7584(%ecx),%xmm7
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,153,29,116,0,0 ; movaps 0x741d(%ecx),%xmm3
+ DB 15,40,153,148,117,0,0 ; movaps 0x7594(%ecx),%xmm3
DB 15,194,203,1 ; cmpltps %xmm3,%xmm1
DB 15,84,209 ; andps %xmm1,%xmm2
DB 15,85,200 ; andnps %xmm0,%xmm1
@@ -46640,28 +47009,28 @@ _sk_to_srgb_sse2 LABEL PROC
DB 15,40,250 ; movaps %xmm2,%xmm7
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 222e <_sk_to_srgb_sse2+0x18>
+ DB 232,0,0,0,0 ; call 2247 <_sk_to_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,82,218 ; rsqrtps %xmm2,%xmm3
- DB 15,40,160,82,115,0,0 ; movaps 0x7352(%eax),%xmm4
+ DB 15,40,160,201,116,0,0 ; movaps 0x74c9(%eax),%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,128,98,115,0,0 ; movaps 0x7362(%eax),%xmm0
+ DB 15,40,128,217,116,0,0 ; movaps 0x74d9(%eax),%xmm0
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,40,128,114,115,0,0 ; movaps 0x7372(%eax),%xmm0
+ DB 15,40,128,233,116,0,0 ; movaps 0x74e9(%eax),%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,128,130,115,0,0 ; movaps 0x7382(%eax),%xmm0
+ DB 15,40,128,249,116,0,0 ; movaps 0x74f9(%eax),%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,83,195 ; rcpps %xmm3,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,168,66,115,0,0 ; movaps 0x7342(%eax),%xmm5
+ DB 15,40,168,185,116,0,0 ; movaps 0x74b9(%eax),%xmm5
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,152,146,115,0,0 ; movaps 0x7392(%eax),%xmm3
+ DB 15,40,152,9,117,0,0 ; movaps 0x7509(%eax),%xmm3
DB 15,194,211,1 ; cmpltps %xmm3,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -46716,60 +47085,62 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,249 ; movaps %xmm1,%xmm7
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 2325 <_sk_rgb_to_hsl_sse2+0x15>
+ DB 232,0,0,0,0 ; call 233e <_sk_rgb_to_hsl_sse2+0x15>
DB 88 ; pop %eax
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,95,207 ; maxps %xmm7,%xmm1
- DB 15,95,202 ; maxps %xmm2,%xmm1
+ DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 15,95,194 ; maxps %xmm2,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
- DB 15,93,223 ; minps %xmm7,%xmm3
- DB 15,93,218 ; minps %xmm2,%xmm3
- DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,95,216 ; maxps %xmm0,%xmm3
+ DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 15,93,194 ; minps %xmm2,%xmm0
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,93,200 ; minps %xmm0,%xmm1
+ DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
- DB 15,40,152,171,114,0,0 ; movaps 0x72ab(%eax),%xmm3
- DB 15,94,216 ; divps %xmm0,%xmm3
+ DB 15,40,136,34,116,0,0 ; movaps 0x7422(%eax),%xmm1
+ DB 15,94,200 ; divps %xmm0,%xmm1
DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,168,187,114,0,0 ; andps 0x72bb(%eax),%xmm5
+ DB 15,84,168,50,116,0,0 ; andps 0x7432(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0
- DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,194,247,0 ; cmpeqps %xmm7,%xmm6
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,89,211 ; mulps %xmm3,%xmm2
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,40,152,203,114,0,0 ; movaps 0x72cb(%eax),%xmm3
- DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,88,160,219,114,0,0 ; addps 0x72db(%eax),%xmm4
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,40,136,66,116,0,0 ; movaps 0x7442(%eax),%xmm1
+ DB 15,88,209 ; addps %xmm1,%xmm2
+ DB 15,88,160,82,116,0,0 ; addps 0x7452(%eax),%xmm4
DB 15,84,214 ; andps %xmm6,%xmm2
DB 15,85,244 ; andnps %xmm4,%xmm6
DB 15,86,242 ; orps %xmm2,%xmm6
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,198 ; andnps %xmm6,%xmm0
DB 15,86,197 ; orps %xmm5,%xmm0
- DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2
DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4
- DB 15,92,217 ; subps %xmm1,%xmm3
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,40,168,251,114,0,0 ; movaps 0x72fb(%eax),%xmm5
- DB 15,92,218 ; subps %xmm2,%xmm3
- DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 15,40,168,114,116,0,0 ; movaps 0x7472(%eax),%xmm5
+ DB 15,92,202 ; subps %xmm2,%xmm1
+ DB 15,40,211 ; movaps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,221 ; andps %xmm5,%xmm3
- DB 15,85,233 ; andnps %xmm1,%xmm5
- DB 15,86,235 ; orps %xmm3,%xmm5
+ DB 15,84,205 ; andps %xmm5,%xmm1
+ DB 15,85,235 ; andnps %xmm3,%xmm5
+ DB 15,86,233 ; orps %xmm1,%xmm5
DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,94,205 ; divps %xmm5,%xmm1
- DB 15,89,128,235,114,0,0 ; mulps 0x72eb(%eax),%xmm0
+ DB 15,89,128,98,116,0,0 ; mulps 0x7462(%eax),%xmm0
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -46790,9 +47161,9 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 129,236,200,0,0,0 ; sub $0xc8,%esp
DB 15,41,157,56,255,255,255 ; movaps %xmm3,-0xc8(%ebp)
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 241a <_sk_hsl_to_rgb_sse2+0x19>
+ DB 232,0,0,0,0 ; call 2439 <_sk_hsl_to_rgb_sse2+0x19>
DB 88 ; pop %eax
- DB 15,40,160,22,114,0,0 ; movaps 0x7216(%eax),%xmm4
+ DB 15,40,160,135,115,0,0 ; movaps 0x7387(%eax),%xmm4
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
@@ -46805,13 +47176,13 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,84,243 ; andps %xmm3,%xmm6
DB 15,85,217 ; andnps %xmm1,%xmm3
DB 15,86,222 ; orps %xmm6,%xmm3
- DB 15,40,168,38,114,0,0 ; movaps 0x7226(%eax),%xmm5
+ DB 15,40,168,151,115,0,0 ; movaps 0x7397(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,193,1 ; cmpltps %xmm1,%xmm0
- DB 15,40,176,54,114,0,0 ; movaps 0x7236(%eax),%xmm6
+ DB 15,40,176,167,115,0,0 ; movaps 0x73a7(%eax),%xmm6
DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,200 ; subps %xmm0,%xmm1
@@ -46821,19 +47192,19 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,184,70,114,0,0 ; movaps 0x7246(%eax),%xmm7
+ DB 15,40,184,183,115,0,0 ; movaps 0x73b7(%eax),%xmm7
DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp)
DB 15,194,253,2 ; cmpleps %xmm5,%xmm7
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,204 ; movaps %xmm4,%xmm1
DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
- DB 15,40,160,118,114,0,0 ; movaps 0x7276(%eax),%xmm4
+ DB 15,40,160,231,115,0,0 ; movaps 0x73e7(%eax),%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
- DB 15,40,176,86,114,0,0 ; movaps 0x7256(%eax),%xmm6
+ DB 15,40,176,199,115,0,0 ; movaps 0x73c7(%eax),%xmm6
DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,128,102,114,0,0 ; movaps 0x7266(%eax),%xmm0
+ DB 15,40,128,215,115,0,0 ; movaps 0x73d7(%eax),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
@@ -46859,18 +47230,18 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,136,54,114,0,0 ; andps 0x7236(%eax),%xmm1
+ DB 15,84,136,167,115,0,0 ; andps 0x73a7(%eax),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,128,70,114,0,0 ; movaps 0x7246(%eax),%xmm0
+ DB 15,40,128,183,115,0,0 ; movaps 0x73b7(%eax),%xmm0
DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,152,22,114,0,0 ; movaps 0x7216(%eax),%xmm3
+ DB 15,40,152,135,115,0,0 ; movaps 0x7387(%eax),%xmm3
DB 15,194,217,2 ; cmpleps %xmm1,%xmm3
- DB 15,40,160,118,114,0,0 ; movaps 0x7276(%eax),%xmm4
+ DB 15,40,160,231,115,0,0 ; movaps 0x73e7(%eax),%xmm4
DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,168,102,114,0,0 ; movaps 0x7266(%eax),%xmm5
+ DB 15,40,168,215,115,0,0 ; movaps 0x73d7(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
@@ -46890,7 +47261,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
DB 15,85,252 ; andnps %xmm4,%xmm7
DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,88,152,134,114,0,0 ; addps 0x7286(%eax),%xmm3
+ DB 15,88,152,247,115,0,0 ; addps 0x73f7(%eax),%xmm3
DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
@@ -46973,7 +47344,7 @@ _sk_scale_u8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 2694 <_sk_scale_u8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 26b3 <_sk_scale_u8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -46984,13 +47355,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,65 ; jne 26f0 <_sk_scale_u8_sse2+0x6a>
+ DB 117,65 ; jne 270f <_sk_scale_u8_sse2+0x6a>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,28,112,0,0 ; pand 0x701c(%edx),%xmm4
+ DB 102,15,219,162,141,113,0,0 ; pand 0x718d(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,44,112,0,0 ; mulps 0x702c(%edx),%xmm4
+ DB 15,89,162,157,113,0,0 ; mulps 0x719d(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
@@ -47009,12 +47380,12 @@ _sk_scale_u8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 272a <_sk_scale_u8_sse2+0xa4>
+ DB 116,50 ; je 2749 <_sk_scale_u8_sse2+0xa4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 2714 <_sk_scale_u8_sse2+0x8e>
+ DB 116,19 ; je 2733 <_sk_scale_u8_sse2+0x8e>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,182 ; jne 26bc <_sk_scale_u8_sse2+0x36>
+ DB 117,182 ; jne 26db <_sk_scale_u8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -47023,10 +47394,98 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,146 ; jmp 26bc <_sk_scale_u8_sse2+0x36>
+ DB 235,146 ; jmp 26db <_sk_scale_u8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,136 ; jmp 26bc <_sk_scale_u8_sse2+0x36>
+ DB 235,136 ; jmp 26db <_sk_scale_u8_sse2+0x36>
+
+PUBLIC _sk_scale_565_sse2
+_sk_scale_565_sse2 LABEL PROC
+ DB 85 ; push %ebp
+ DB 137,229 ; mov %esp,%ebp
+ DB 83 ; push %ebx
+ DB 87 ; push %edi
+ DB 86 ; push %esi
+ DB 131,236,44 ; sub $0x2c,%esp
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 232,0,0,0,0 ; call 276d <_sk_scale_565_sse2+0x1a>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 1,246 ; add %esi,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 133,219 ; test %ebx,%ebx
+ DB 139,57 ; mov (%ecx),%edi
+ DB 15,133,157,0,0,0 ; jne 282b <_sk_scale_565_sse2+0xd8>
+ DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
+ DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
+ DB 102,15,111,162,243,112,0,0 ; movdqa 0x70f3(%edx),%xmm4
+ DB 102,15,219,230 ; pand %xmm6,%xmm4
+ DB 15,91,212 ; cvtdq2ps %xmm4,%xmm2
+ DB 15,89,146,3,113,0,0 ; mulps 0x7103(%edx),%xmm2
+ DB 102,15,111,170,19,113,0,0 ; movdqa 0x7113(%edx),%xmm5
+ DB 102,15,219,238 ; pand %xmm6,%xmm5
+ DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
+ DB 15,89,170,35,113,0,0 ; mulps 0x7123(%edx),%xmm5
+ DB 102,15,219,178,51,113,0,0 ; pand 0x7133(%edx),%xmm6
+ DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
+ DB 15,89,178,67,113,0,0 ; mulps 0x7143(%edx),%xmm6
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,93,254 ; minps %xmm6,%xmm7
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 15,93,231 ; minps %xmm7,%xmm4
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,95,254 ; maxps %xmm6,%xmm7
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,95,199 ; maxps %xmm7,%xmm0
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,194,121,64,1 ; cmpltps 0x40(%ecx),%xmm7
+ DB 15,84,231 ; andps %xmm7,%xmm4
+ DB 15,85,248 ; andnps %xmm0,%xmm7
+ DB 15,86,252 ; orps %xmm4,%xmm7
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,89,109,216 ; mulps -0x28(%ebp),%xmm5
+ DB 15,89,117,200 ; mulps -0x38(%ebp),%xmm6
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,40,223 ; movaps %xmm7,%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,60 ; add $0x3c,%esp
+ DB 94 ; pop %esi
+ DB 95 ; pop %edi
+ DB 91 ; pop %ebx
+ DB 93 ; pop %ebp
+ DB 195 ; ret
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 2865 <_sk_scale_565_sse2+0x112>
+ DB 102,15,239,246 ; pxor %xmm6,%xmm6
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,23 ; je 2853 <_sk_scale_565_sse2+0x100>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 15,133,82,255,255,255 ; jne 2797 <_sk_scale_565_sse2+0x44>
+ DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
+ DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
+ DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4
+ DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
+ DB 242,15,16,244 ; movsd %xmm4,%xmm6
+ DB 233,50,255,255,255 ; jmp 2797 <_sk_scale_565_sse2+0x44>
+ DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
+ DB 102,15,110,246 ; movd %esi,%xmm6
+ DB 233,37,255,255,255 ; jmp 2797 <_sk_scale_565_sse2+0x44>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -47071,7 +47530,7 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 279c <_sk_lerp_u8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 28da <_sk_lerp_u8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -47082,13 +47541,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 281d <_sk_lerp_u8_sse2+0x8f>
+ DB 117,102 ; jne 295b <_sk_lerp_u8_sse2+0x8f>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,52,111,0,0 ; pand 0x6f34(%edx),%xmm4
+ DB 102,15,219,162,230,111,0,0 ; pand 0x6fe6(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,68,111,0,0 ; mulps 0x6f44(%edx),%xmm4
+ DB 15,89,162,246,111,0,0 ; mulps 0x6ff6(%edx),%xmm4
DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
DB 15,92,197 ; subps %xmm5,%xmm0
@@ -47118,12 +47577,12 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,53 ; je 285a <_sk_lerp_u8_sse2+0xcc>
+ DB 116,53 ; je 2998 <_sk_lerp_u8_sse2+0xcc>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 2841 <_sk_lerp_u8_sse2+0xb3>
+ DB 116,19 ; je 297f <_sk_lerp_u8_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,145 ; jne 27c4 <_sk_lerp_u8_sse2+0x36>
+ DB 117,145 ; jne 2902 <_sk_lerp_u8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -47132,10 +47591,10 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,106,255,255,255 ; jmp 27c4 <_sk_lerp_u8_sse2+0x36>
+ DB 233,106,255,255,255 ; jmp 2902 <_sk_lerp_u8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,93,255,255,255 ; jmp 27c4 <_sk_lerp_u8_sse2+0x36>
+ DB 233,93,255,255,255 ; jmp 2902 <_sk_lerp_u8_sse2+0x36>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -47144,8 +47603,12 @@ _sk_lerp_565_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 2875 <_sk_lerp_565_sse2+0xe>
+ DB 131,236,108 ; sub $0x6c,%esp
+ DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
+ DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
+ DB 15,41,77,152 ; movaps %xmm1,-0x68(%ebp)
+ DB 102,15,127,69,184 ; movdqa %xmm0,-0x48(%ebp)
+ DB 232,0,0,0,0 ; call 29c4 <_sk_lerp_565_sse2+0x1f>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -47157,49 +47620,62 @@ _sk_lerp_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,163,0,0,0 ; jne 2939 <_sk_lerp_565_sse2+0xd2>
- DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
- DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,162,123,110,0,0 ; movdqa 0x6e7b(%edx),%xmm4
- DB 102,15,219,230 ; pand %xmm6,%xmm4
- DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,139,110,0,0 ; mulps 0x6e8b(%edx),%xmm4
- DB 102,15,111,170,155,110,0,0 ; movdqa 0x6e9b(%edx),%xmm5
- DB 102,15,219,238 ; pand %xmm6,%xmm5
- DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,171,110,0,0 ; mulps 0x6eab(%edx),%xmm5
- DB 102,15,219,178,187,110,0,0 ; pand 0x6ebb(%edx),%xmm6
+ DB 15,133,211,0,0,0 ; jne 2ab8 <_sk_lerp_565_sse2+0x113>
+ DB 243,15,126,44,126 ; movq (%esi,%edi,2),%xmm5
+ DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
+ DB 102,15,111,162,28,111,0,0 ; movdqa 0x6f1c(%edx),%xmm4
+ DB 102,15,219,229 ; pand %xmm5,%xmm4
+ DB 15,91,204 ; cvtdq2ps %xmm4,%xmm1
+ DB 15,89,138,44,111,0,0 ; mulps 0x6f2c(%edx),%xmm1
+ DB 102,15,111,178,60,111,0,0 ; movdqa 0x6f3c(%edx),%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,203,110,0,0 ; mulps 0x6ecb(%edx),%xmm6
- DB 15,40,121,16 ; movaps 0x10(%ecx),%xmm7
- DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7
- DB 15,92,207 ; subps %xmm7,%xmm1
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,40,121,48 ; movaps 0x30(%ecx),%xmm7
- DB 15,92,215 ; subps %xmm7,%xmm2
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,40,121,64 ; movaps 0x40(%ecx),%xmm7
- DB 15,92,223 ; subps %xmm7,%xmm3
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,88,231 ; addps %xmm7,%xmm4
- DB 15,88,239 ; addps %xmm7,%xmm5
- DB 15,88,223 ; addps %xmm7,%xmm3
- DB 15,95,235 ; maxps %xmm3,%xmm5
- DB 15,95,229 ; maxps %xmm5,%xmm4
+ DB 15,89,178,76,111,0,0 ; mulps 0x6f4c(%edx),%xmm6
+ DB 102,15,219,170,92,111,0,0 ; pand 0x6f5c(%edx),%xmm5
+ DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
+ DB 15,89,146,108,111,0,0 ; mulps 0x6f6c(%edx),%xmm2
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,40,65,32 ; movaps 0x20(%ecx),%xmm0
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4
+ DB 15,92,224 ; subps %xmm0,%xmm4
+ DB 15,89,230 ; mulps %xmm6,%xmm4
+ DB 15,93,243 ; minps %xmm3,%xmm6
+ DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,40,65,16 ; movaps 0x10(%ecx),%xmm0
+ DB 15,40,109,184 ; movaps -0x48(%ebp),%xmm5
+ DB 15,92,232 ; subps %xmm0,%xmm5
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 15,93,206 ; minps %xmm6,%xmm1
+ DB 15,40,113,64 ; movaps 0x40(%ecx),%xmm6
+ DB 15,95,251 ; maxps %xmm3,%xmm7
+ DB 15,95,215 ; maxps %xmm7,%xmm2
+ DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
+ DB 15,84,207 ; andps %xmm7,%xmm1
+ DB 15,85,250 ; andnps %xmm2,%xmm7
+ DB 15,86,249 ; orps %xmm1,%xmm7
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,88,101,216 ; addps -0x28(%ebp),%xmm4
+ DB 15,40,65,48 ; movaps 0x30(%ecx),%xmm0
+ DB 15,40,85,136 ; movaps -0x78(%ebp),%xmm2
+ DB 15,92,208 ; subps %xmm0,%xmm2
+ DB 15,89,85,200 ; mulps -0x38(%ebp),%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 15,92,222 ; subps %xmm6,%xmm3
+ DB 15,89,223 ; mulps %xmm7,%xmm3
+ DB 15,88,222 ; addps %xmm6,%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,40,204 ; movaps %xmm4,%xmm1
DB 82 ; push %edx
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,28 ; add $0x1c,%esp
+ DB 131,196,124 ; add $0x7c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -47207,22 +47683,22 @@ _sk_lerp_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 2973 <_sk_lerp_565_sse2+0x10c>
- DB 102,15,239,246 ; pxor %xmm6,%xmm6
+ DB 116,50 ; je 2af2 <_sk_lerp_565_sse2+0x14d>
+ DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 2961 <_sk_lerp_565_sse2+0xfa>
+ DB 116,23 ; je 2ae0 <_sk_lerp_565_sse2+0x13b>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,76,255,255,255 ; jne 289f <_sk_lerp_565_sse2+0x38>
+ DB 15,133,28,255,255,255 ; jne 29ee <_sk_lerp_565_sse2+0x49>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
- DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
+ DB 102,15,112,236,69 ; pshufd $0x45,%xmm4,%xmm5
DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,44,255,255,255 ; jmp 289f <_sk_lerp_565_sse2+0x38>
+ DB 242,15,16,236 ; movsd %xmm4,%xmm5
+ DB 233,252,254,255,255 ; jmp 29ee <_sk_lerp_565_sse2+0x49>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
- DB 102,15,110,246 ; movd %esi,%xmm6
- DB 233,31,255,255,255 ; jmp 289f <_sk_lerp_565_sse2+0x38>
+ DB 102,15,110,238 ; movd %esi,%xmm5
+ DB 233,239,254,255,255 ; jmp 29ee <_sk_lerp_565_sse2+0x49>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
@@ -47232,7 +47708,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 298e <_sk_load_tables_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2b0d <_sk_load_tables_sse2+0xe>
DB 90 ; pop %edx
DB 139,117,12 ; mov 0xc(%ebp),%esi
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -47241,9 +47717,9 @@ _sk_load_tables_sse2 LABEL PROC
DB 133,192 ; test %eax,%eax
DB 139,54 ; mov (%esi),%esi
DB 139,30 ; mov (%esi),%ebx
- DB 15,133,19,1,0,0 ; jne 2ab9 <_sk_load_tables_sse2+0x139>
+ DB 15,133,19,1,0,0 ; jne 2c38 <_sk_load_tables_sse2+0x139>
DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3
- DB 102,15,111,146,194,109,0,0 ; movdqa 0x6dc2(%edx),%xmm2
+ DB 102,15,111,146,51,110,0,0 ; movdqa 0x6e33(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
@@ -47299,7 +47775,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,210,109,0,0 ; mulps 0x6dd2(%edx),%xmm3
+ DB 15,89,154,67,110,0,0 ; mulps 0x6e43(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,194 ; mov %eax,%edx
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -47315,18 +47791,18 @@ _sk_load_tables_sse2 LABEL PROC
DB 195 ; ret
DB 36,3 ; and $0x3,%al
DB 60,1 ; cmp $0x1,%al
- DB 116,37 ; je 2ae4 <_sk_load_tables_sse2+0x164>
+ DB 116,37 ; je 2c63 <_sk_load_tables_sse2+0x164>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 60,2 ; cmp $0x2,%al
- DB 116,19 ; je 2ada <_sk_load_tables_sse2+0x15a>
+ DB 116,19 ; je 2c59 <_sk_load_tables_sse2+0x15a>
DB 60,3 ; cmp $0x3,%al
- DB 15,133,220,254,255,255 ; jne 29ab <_sk_load_tables_sse2+0x2b>
+ DB 15,133,220,254,255,255 ; jne 2b2a <_sk_load_tables_sse2+0x2b>
DB 102,15,110,68,187,8 ; movd 0x8(%ebx,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,187 ; movlpd (%ebx,%edi,4),%xmm3
- DB 233,199,254,255,255 ; jmp 29ab <_sk_load_tables_sse2+0x2b>
+ DB 233,199,254,255,255 ; jmp 2b2a <_sk_load_tables_sse2+0x2b>
DB 102,15,110,28,187 ; movd (%ebx,%edi,4),%xmm3
- DB 233,189,254,255,255 ; jmp 29ab <_sk_load_tables_sse2+0x2b>
+ DB 233,189,254,255,255 ; jmp 2b2a <_sk_load_tables_sse2+0x2b>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -47336,7 +47812,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,44 ; sub $0x2c,%esp
- DB 232,0,0,0,0 ; call 2afc <_sk_load_tables_u16_be_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2c7b <_sk_load_tables_u16_be_sse2+0xe>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
@@ -47347,7 +47823,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 139,15 ; mov (%edi),%ecx
DB 190,255,0,255,0 ; mov $0xff00ff,%esi
- DB 15,133,166,1,0,0 ; jne 2cc2 <_sk_load_tables_u16_be_sse2+0x1d4>
+ DB 15,133,166,1,0,0 ; jne 2e41 <_sk_load_tables_u16_be_sse2+0x1d4>
DB 102,15,16,4,89 ; movupd (%ecx,%ebx,2),%xmm0
DB 243,15,111,76,89,16 ; movdqu 0x10(%ecx,%ebx,2),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
@@ -47444,7 +47920,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3
DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,116,108,0,0 ; mulps 0x6c74(%edx),%xmm3
+ DB 15,89,154,229,108,0,0 ; mulps 0x6ce5(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
@@ -47461,12 +47937,12 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 242,15,16,4,89 ; movsd (%ecx,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,248,1 ; cmp $0x1,%eax
- DB 15,132,83,254,255,255 ; je 2b27 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 15,132,83,254,255,255 ; je 2ca6 <_sk_load_tables_u16_be_sse2+0x39>
DB 102,15,22,68,89,8 ; movhpd 0x8(%ecx,%ebx,2),%xmm0
DB 131,248,3 ; cmp $0x3,%eax
- DB 15,130,68,254,255,255 ; jb 2b27 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 15,130,68,254,255,255 ; jb 2ca6 <_sk_load_tables_u16_be_sse2+0x39>
DB 243,15,126,76,89,16 ; movq 0x10(%ecx,%ebx,2),%xmm1
- DB 233,57,254,255,255 ; jmp 2b27 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 233,57,254,255,255 ; jmp 2ca6 <_sk_load_tables_u16_be_sse2+0x39>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -47476,7 +47952,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,28 ; sub $0x1c,%esp
- DB 232,0,0,0,0 ; call 2cfc <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2e7b <_sk_load_tables_rgb_u16_be_sse2+0xe>
DB 88 ; pop %eax
DB 137,69,240 ; mov %eax,-0x10(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -47487,7 +47963,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 139,56 ; mov (%eax),%edi
DB 139,7 ; mov (%edi),%eax
DB 190,255,0,255,0 ; mov $0xff00ff,%esi
- DB 15,133,141,1,0,0 ; jne 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ DB 15,133,141,1,0,0 ; jne 3029 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
DB 243,15,111,12,88 ; movdqu (%eax,%ebx,2),%xmm1
DB 243,15,111,92,88,8 ; movdqu 0x8(%eax,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -47581,7 +48057,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 141,65,8 ; lea 0x8(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 139,85,240 ; mov -0x10(%ebp),%edx
- DB 15,40,162,132,106,0,0 ; movaps 0x6a84(%edx),%xmm4
+ DB 15,40,162,245,106,0,0 ; movaps 0x6af5(%edx),%xmm4
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 80 ; push %eax
@@ -47597,20 +48073,20 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,15,196,76,88,4,2 ; pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 131,249,1 ; cmp $0x1,%ecx
- DB 117,13 ; jne 2ecc <_sk_load_tables_rgb_u16_be_sse2+0x1de>
+ DB 117,13 ; jne 304b <_sk_load_tables_rgb_u16_be_sse2+0x1de>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,115,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,115,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51>
DB 102,15,110,68,88,6 ; movd 0x6(%eax,%ebx,2),%xmm0
DB 102,15,196,68,88,10,2 ; pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 131,249,3 ; cmp $0x3,%ecx
- DB 114,18 ; jb 2ef4 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ DB 114,18 ; jb 3073 <_sk_load_tables_rgb_u16_be_sse2+0x206>
DB 102,15,110,92,88,12 ; movd 0xc(%eax,%ebx,2),%xmm3
DB 102,15,196,92,88,16,2 ; pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
- DB 233,75,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,75,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,66,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,66,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -47620,11 +48096,11 @@ _sk_byte_tables_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 2f0b <_sk_byte_tables_sse2+0xe>
+ DB 232,0,0,0,0 ; call 308a <_sk_byte_tables_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
- DB 15,40,162,133,104,0,0 ; movaps 0x6885(%edx),%xmm4
+ DB 15,40,162,246,104,0,0 ; movaps 0x68f6(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
@@ -47646,7 +48122,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
DB 139,65,4 ; mov 0x4(%ecx),%eax
DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0
- DB 15,40,170,149,104,0,0 ; movaps 0x6895(%edx),%xmm5
+ DB 15,40,170,6,105,0,0 ; movaps 0x6906(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -47769,12 +48245,12 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 15,182,60,31 ; movzbl (%edi,%ebx,1),%edi
DB 193,231,8 ; shl $0x8,%edi
DB 9,215 ; or %edx,%edi
- DB 232,0,0,0,0 ; call 310b <_sk_byte_tables_rgb_sse2+0x65>
+ DB 232,0,0,0,0 ; call 328a <_sk_byte_tables_rgb_sse2+0x65>
DB 90 ; pop %edx
DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0
DB 139,121,4 ; mov 0x4(%ecx),%edi
DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0
- DB 15,40,170,165,102,0,0 ; movaps 0x66a5(%edx),%xmm5
+ DB 15,40,170,22,103,0,0 ; movaps 0x6716(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -48000,7 +48476,7 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 33da <_sk_parametric_r_sse2+0x18>
+ DB 232,0,0,0,0 ; call 3559 <_sk_parametric_r_sse2+0x18>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48020,15 +48496,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,230,99,0,0 ; mulps 0x63e6(%edx),%xmm5
- DB 15,84,178,246,99,0,0 ; andps 0x63f6(%edx),%xmm6
- DB 15,86,178,6,100,0,0 ; orps 0x6406(%edx),%xmm6
- DB 15,88,170,22,100,0,0 ; addps 0x6416(%edx),%xmm5
- DB 15,40,186,38,100,0,0 ; movaps 0x6426(%edx),%xmm7
+ DB 15,89,170,87,100,0,0 ; mulps 0x6457(%edx),%xmm5
+ DB 15,84,178,103,100,0,0 ; andps 0x6467(%edx),%xmm6
+ DB 15,86,178,119,100,0,0 ; orps 0x6477(%edx),%xmm6
+ DB 15,88,170,135,100,0,0 ; addps 0x6487(%edx),%xmm5
+ DB 15,40,186,151,100,0,0 ; movaps 0x6497(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,54,100,0,0 ; addps 0x6436(%edx),%xmm6
- DB 15,40,186,70,100,0,0 ; movaps 0x6446(%edx),%xmm7
+ DB 15,88,178,167,100,0,0 ; addps 0x64a7(%edx),%xmm6
+ DB 15,40,186,183,100,0,0 ; movaps 0x64b7(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48038,21 +48514,21 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,86,100,0,0 ; movaps 0x6456(%edx),%xmm6
+ DB 15,40,178,199,100,0,0 ; movaps 0x64c7(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,102,100,0,0 ; addps 0x6466(%edx),%xmm5
- DB 15,40,186,118,100,0,0 ; movaps 0x6476(%edx),%xmm7
+ DB 15,88,170,215,100,0,0 ; addps 0x64d7(%edx),%xmm5
+ DB 15,40,186,231,100,0,0 ; movaps 0x64e7(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,134,100,0,0 ; movaps 0x6486(%edx),%xmm7
+ DB 15,40,186,247,100,0,0 ; movaps 0x64f7(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,150,100,0,0 ; movaps 0x6496(%edx),%xmm0
+ DB 15,40,130,7,101,0,0 ; movaps 0x6507(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,166,100,0,0 ; mulps 0x64a6(%edx),%xmm0
+ DB 15,89,130,23,101,0,0 ; mulps 0x6517(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48084,7 +48560,7 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 3511 <_sk_parametric_g_sse2+0x15>
+ DB 232,0,0,0,0 ; call 3690 <_sk_parametric_g_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48104,15 +48580,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,127,99,0,0 ; mulps 0x637f(%edx),%xmm5
- DB 15,84,178,143,99,0,0 ; andps 0x638f(%edx),%xmm6
- DB 15,86,178,159,99,0,0 ; orps 0x639f(%edx),%xmm6
- DB 15,88,170,175,99,0,0 ; addps 0x63af(%edx),%xmm5
- DB 15,40,186,191,99,0,0 ; movaps 0x63bf(%edx),%xmm7
+ DB 15,89,170,240,99,0,0 ; mulps 0x63f0(%edx),%xmm5
+ DB 15,84,178,0,100,0,0 ; andps 0x6400(%edx),%xmm6
+ DB 15,86,178,16,100,0,0 ; orps 0x6410(%edx),%xmm6
+ DB 15,88,170,32,100,0,0 ; addps 0x6420(%edx),%xmm5
+ DB 15,40,186,48,100,0,0 ; movaps 0x6430(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,207,99,0,0 ; addps 0x63cf(%edx),%xmm6
- DB 15,40,186,223,99,0,0 ; movaps 0x63df(%edx),%xmm7
+ DB 15,88,178,64,100,0,0 ; addps 0x6440(%edx),%xmm6
+ DB 15,40,186,80,100,0,0 ; movaps 0x6450(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48122,21 +48598,21 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,239,99,0,0 ; movaps 0x63ef(%edx),%xmm6
+ DB 15,40,178,96,100,0,0 ; movaps 0x6460(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,255,99,0,0 ; addps 0x63ff(%edx),%xmm5
- DB 15,40,186,15,100,0,0 ; movaps 0x640f(%edx),%xmm7
+ DB 15,88,170,112,100,0,0 ; addps 0x6470(%edx),%xmm5
+ DB 15,40,186,128,100,0,0 ; movaps 0x6480(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,31,100,0,0 ; movaps 0x641f(%edx),%xmm7
+ DB 15,40,186,144,100,0,0 ; movaps 0x6490(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,47,100,0,0 ; movaps 0x642f(%edx),%xmm0
+ DB 15,40,130,160,100,0,0 ; movaps 0x64a0(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,63,100,0,0 ; mulps 0x643f(%edx),%xmm0
+ DB 15,89,130,176,100,0,0 ; mulps 0x64b0(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48167,7 +48643,7 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 3645 <_sk_parametric_b_sse2+0x15>
+ DB 232,0,0,0,0 ; call 37c4 <_sk_parametric_b_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48187,15 +48663,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,27,99,0,0 ; mulps 0x631b(%edx),%xmm5
- DB 15,84,178,43,99,0,0 ; andps 0x632b(%edx),%xmm6
- DB 15,86,178,59,99,0,0 ; orps 0x633b(%edx),%xmm6
- DB 15,88,170,75,99,0,0 ; addps 0x634b(%edx),%xmm5
- DB 15,40,186,91,99,0,0 ; movaps 0x635b(%edx),%xmm7
+ DB 15,89,170,140,99,0,0 ; mulps 0x638c(%edx),%xmm5
+ DB 15,84,178,156,99,0,0 ; andps 0x639c(%edx),%xmm6
+ DB 15,86,178,172,99,0,0 ; orps 0x63ac(%edx),%xmm6
+ DB 15,88,170,188,99,0,0 ; addps 0x63bc(%edx),%xmm5
+ DB 15,40,186,204,99,0,0 ; movaps 0x63cc(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,107,99,0,0 ; addps 0x636b(%edx),%xmm6
- DB 15,40,186,123,99,0,0 ; movaps 0x637b(%edx),%xmm7
+ DB 15,88,178,220,99,0,0 ; addps 0x63dc(%edx),%xmm6
+ DB 15,40,186,236,99,0,0 ; movaps 0x63ec(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48205,21 +48681,21 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,139,99,0,0 ; movaps 0x638b(%edx),%xmm6
+ DB 15,40,178,252,99,0,0 ; movaps 0x63fc(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,155,99,0,0 ; addps 0x639b(%edx),%xmm5
- DB 15,40,186,171,99,0,0 ; movaps 0x63ab(%edx),%xmm7
+ DB 15,88,170,12,100,0,0 ; addps 0x640c(%edx),%xmm5
+ DB 15,40,186,28,100,0,0 ; movaps 0x641c(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,187,99,0,0 ; movaps 0x63bb(%edx),%xmm7
+ DB 15,40,186,44,100,0,0 ; movaps 0x642c(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,203,99,0,0 ; movaps 0x63cb(%edx),%xmm0
+ DB 15,40,130,60,100,0,0 ; movaps 0x643c(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,219,99,0,0 ; mulps 0x63db(%edx),%xmm0
+ DB 15,89,130,76,100,0,0 ; mulps 0x644c(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48250,7 +48726,7 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 3779 <_sk_parametric_a_sse2+0x15>
+ DB 232,0,0,0,0 ; call 38f8 <_sk_parametric_a_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48270,15 +48746,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,183,98,0,0 ; mulps 0x62b7(%edx),%xmm5
- DB 15,84,178,199,98,0,0 ; andps 0x62c7(%edx),%xmm6
- DB 15,86,178,215,98,0,0 ; orps 0x62d7(%edx),%xmm6
- DB 15,88,170,231,98,0,0 ; addps 0x62e7(%edx),%xmm5
- DB 15,40,186,247,98,0,0 ; movaps 0x62f7(%edx),%xmm7
+ DB 15,89,170,40,99,0,0 ; mulps 0x6328(%edx),%xmm5
+ DB 15,84,178,56,99,0,0 ; andps 0x6338(%edx),%xmm6
+ DB 15,86,178,72,99,0,0 ; orps 0x6348(%edx),%xmm6
+ DB 15,88,170,88,99,0,0 ; addps 0x6358(%edx),%xmm5
+ DB 15,40,186,104,99,0,0 ; movaps 0x6368(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,7,99,0,0 ; addps 0x6307(%edx),%xmm6
- DB 15,40,186,23,99,0,0 ; movaps 0x6317(%edx),%xmm7
+ DB 15,88,178,120,99,0,0 ; addps 0x6378(%edx),%xmm6
+ DB 15,40,186,136,99,0,0 ; movaps 0x6388(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48288,21 +48764,21 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,39,99,0,0 ; movaps 0x6327(%edx),%xmm6
+ DB 15,40,178,152,99,0,0 ; movaps 0x6398(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,55,99,0,0 ; addps 0x6337(%edx),%xmm5
- DB 15,40,186,71,99,0,0 ; movaps 0x6347(%edx),%xmm7
+ DB 15,88,170,168,99,0,0 ; addps 0x63a8(%edx),%xmm5
+ DB 15,40,186,184,99,0,0 ; movaps 0x63b8(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,87,99,0,0 ; movaps 0x6357(%edx),%xmm7
+ DB 15,40,186,200,99,0,0 ; movaps 0x63c8(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,103,99,0,0 ; movaps 0x6367(%edx),%xmm0
+ DB 15,40,130,216,99,0,0 ; movaps 0x63d8(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,119,99,0,0 ; mulps 0x6377(%edx),%xmm0
+ DB 15,89,130,232,99,0,0 ; mulps 0x63e8(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48332,18 +48808,18 @@ _sk_gamma_sse2 LABEL PROC
DB 131,236,40 ; sub $0x28,%esp
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 232,0,0,0,0 ; call 38aa <_sk_gamma_sse2+0x12>
+ DB 232,0,0,0,0 ; call 3a29 <_sk_gamma_sse2+0x12>
DB 88 ; pop %eax
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0
- DB 15,84,152,102,98,0,0 ; andps 0x6266(%eax),%xmm3
- DB 15,86,152,118,98,0,0 ; orps 0x6276(%eax),%xmm3
- DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0
+ DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0
+ DB 15,84,152,215,98,0,0 ; andps 0x62d7(%eax),%xmm3
+ DB 15,86,152,231,98,0,0 ; orps 0x62e7(%eax),%xmm3
+ DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,89,160,150,98,0,0 ; mulps 0x6296(%eax),%xmm4
+ DB 15,89,160,7,99,0,0 ; mulps 0x6307(%eax),%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,88,152,166,98,0,0 ; addps 0x62a6(%eax),%xmm3
- DB 15,40,160,182,98,0,0 ; movaps 0x62b6(%eax),%xmm4
+ DB 15,88,152,23,99,0,0 ; addps 0x6317(%eax),%xmm3
+ DB 15,40,160,39,99,0,0 ; movaps 0x6327(%eax),%xmm4
DB 15,94,227 ; divps %xmm3,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 139,77,12 ; mov 0xc(%ebp),%ecx
@@ -48356,30 +48832,30 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,227,1 ; cmpltps %xmm3,%xmm4
- DB 15,84,160,198,98,0,0 ; andps 0x62c6(%eax),%xmm4
+ DB 15,84,160,55,99,0,0 ; andps 0x6337(%eax),%xmm4
DB 15,92,220 ; subps %xmm4,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0
- DB 15,40,176,246,98,0,0 ; movaps 0x62f6(%eax),%xmm6
+ DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0
+ DB 15,40,176,103,99,0,0 ; movaps 0x6367(%eax),%xmm6
DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,40,168,230,98,0,0 ; movaps 0x62e6(%eax),%xmm5
+ DB 15,40,168,87,99,0,0 ; movaps 0x6357(%eax),%xmm5
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,40,152,6,99,0,0 ; movaps 0x6306(%eax),%xmm3
+ DB 15,40,152,119,99,0,0 ; movaps 0x6377(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,94,230 ; divps %xmm6,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0
- DB 15,84,136,102,98,0,0 ; andps 0x6266(%eax),%xmm1
- DB 15,86,136,118,98,0,0 ; orps 0x6276(%eax),%xmm1
- DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0
+ DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0
+ DB 15,84,136,215,98,0,0 ; andps 0x62d7(%eax),%xmm1
+ DB 15,86,136,231,98,0,0 ; orps 0x62e7(%eax),%xmm1
+ DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,89,176,150,98,0,0 ; mulps 0x6296(%eax),%xmm6
+ DB 15,89,176,7,99,0,0 ; mulps 0x6307(%eax),%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,136,166,98,0,0 ; addps 0x62a6(%eax),%xmm1
- DB 15,40,176,182,98,0,0 ; movaps 0x62b6(%eax),%xmm6
+ DB 15,88,136,23,99,0,0 ; addps 0x6317(%eax),%xmm1
+ DB 15,40,176,39,99,0,0 ; movaps 0x6327(%eax),%xmm6
DB 15,94,241 ; divps %xmm1,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -48387,12 +48863,12 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,241,1 ; cmpltps %xmm1,%xmm6
- DB 15,84,176,198,98,0,0 ; andps 0x62c6(%eax),%xmm6
+ DB 15,84,176,55,99,0,0 ; andps 0x6337(%eax),%xmm6
DB 15,92,206 ; subps %xmm6,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0
- DB 15,40,184,246,98,0,0 ; movaps 0x62f6(%eax),%xmm7
+ DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0
+ DB 15,40,184,103,99,0,0 ; movaps 0x6367(%eax),%xmm7
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
@@ -48400,15 +48876,15 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,207 ; divps %xmm7,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0
- DB 15,84,144,102,98,0,0 ; andps 0x6266(%eax),%xmm2
- DB 15,86,144,118,98,0,0 ; orps 0x6276(%eax),%xmm2
- DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0
- DB 15,40,176,150,98,0,0 ; movaps 0x6296(%eax),%xmm6
+ DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0
+ DB 15,84,144,215,98,0,0 ; andps 0x62d7(%eax),%xmm2
+ DB 15,86,144,231,98,0,0 ; orps 0x62e7(%eax),%xmm2
+ DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0
+ DB 15,40,176,7,99,0,0 ; movaps 0x6307(%eax),%xmm6
DB 15,89,242 ; mulps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,144,166,98,0,0 ; addps 0x62a6(%eax),%xmm2
- DB 15,40,176,182,98,0,0 ; movaps 0x62b6(%eax),%xmm6
+ DB 15,88,144,23,99,0,0 ; addps 0x6317(%eax),%xmm2
+ DB 15,40,176,39,99,0,0 ; movaps 0x6327(%eax),%xmm6
DB 15,94,242 ; divps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
@@ -48416,18 +48892,18 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,242,1 ; cmpltps %xmm2,%xmm6
- DB 15,84,176,198,98,0,0 ; andps 0x62c6(%eax),%xmm6
+ DB 15,84,176,55,99,0,0 ; andps 0x6337(%eax),%xmm6
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0
+ DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0
DB 15,89,238 ; mulps %xmm6,%xmm5
DB 15,92,197 ; subps %xmm5,%xmm0
- DB 15,40,144,246,98,0,0 ; movaps 0x62f6(%eax),%xmm2
+ DB 15,40,144,103,99,0,0 ; movaps 0x6367(%eax),%xmm2
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,94,218 ; divps %xmm2,%xmm3
DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,40,128,22,99,0,0 ; movaps 0x6316(%eax),%xmm0
+ DB 15,40,128,135,99,0,0 ; movaps 0x6387(%eax),%xmm0
DB 15,89,224 ; mulps %xmm0,%xmm4
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,89,216 ; mulps %xmm0,%xmm3
@@ -48452,31 +48928,31 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 3a92 <_sk_lab_to_xyz_sse2+0x15>
+ DB 232,0,0,0,0 ; call 3c11 <_sk_lab_to_xyz_sse2+0x15>
DB 88 ; pop %eax
- DB 15,89,144,62,97,0,0 ; mulps 0x613e(%eax),%xmm2
- DB 15,40,160,78,97,0,0 ; movaps 0x614e(%eax),%xmm4
+ DB 15,89,144,175,97,0,0 ; mulps 0x61af(%eax),%xmm2
+ DB 15,40,160,191,97,0,0 ; movaps 0x61bf(%eax),%xmm4
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,168,94,97,0,0 ; movaps 0x615e(%eax),%xmm5
+ DB 15,40,168,207,97,0,0 ; movaps 0x61cf(%eax),%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,144,110,97,0,0 ; addps 0x616e(%eax),%xmm2
- DB 15,89,144,126,97,0,0 ; mulps 0x617e(%eax),%xmm2
- DB 15,89,136,142,97,0,0 ; mulps 0x618e(%eax),%xmm1
+ DB 15,88,144,223,97,0,0 ; addps 0x61df(%eax),%xmm2
+ DB 15,89,144,239,97,0,0 ; mulps 0x61ef(%eax),%xmm2
+ DB 15,89,136,255,97,0,0 ; mulps 0x61ff(%eax),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,89,152,158,97,0,0 ; mulps 0x619e(%eax),%xmm3
+ DB 15,89,152,15,98,0,0 ; mulps 0x620f(%eax),%xmm3
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,152,174,97,0,0 ; movaps 0x61ae(%eax),%xmm3
+ DB 15,40,152,31,98,0,0 ; movaps 0x621f(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,194,224,1 ; cmpltps %xmm0,%xmm4
- DB 15,40,176,190,97,0,0 ; movaps 0x61be(%eax),%xmm6
+ DB 15,40,176,47,98,0,0 ; movaps 0x622f(%eax),%xmm6
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,184,206,97,0,0 ; movaps 0x61ce(%eax),%xmm7
+ DB 15,40,184,63,98,0,0 ; movaps 0x623f(%eax),%xmm7
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,85,225 ; andnps %xmm1,%xmm4
@@ -48501,8 +48977,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,85,221 ; andnps %xmm5,%xmm3
DB 15,86,216 ; orps %xmm0,%xmm3
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,160,222,97,0,0 ; mulps 0x61de(%eax),%xmm4
- DB 15,89,152,238,97,0,0 ; mulps 0x61ee(%eax),%xmm3
+ DB 15,89,160,79,98,0,0 ; mulps 0x624f(%eax),%xmm4
+ DB 15,89,152,95,98,0,0 ; mulps 0x625f(%eax),%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -48523,7 +48999,7 @@ _sk_load_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3b82 <_sk_load_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3d01 <_sk_load_a8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48534,13 +49010,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,60 ; jne 3bd9 <_sk_load_a8_sse2+0x65>
+ DB 117,60 ; jne 3d58 <_sk_load_a8_sse2+0x65>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,14,97,0,0 ; pand 0x610e(%edx),%xmm0
+ DB 102,15,219,130,127,97,0,0 ; pand 0x617f(%edx),%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,154,30,97,0,0 ; mulps 0x611e(%edx),%xmm3
+ DB 15,89,154,143,97,0,0 ; mulps 0x618f(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -48557,12 +49033,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3c13 <_sk_load_a8_sse2+0x9f>
+ DB 116,50 ; je 3d92 <_sk_load_a8_sse2+0x9f>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3bfd <_sk_load_a8_sse2+0x89>
+ DB 116,19 ; je 3d7c <_sk_load_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,187 ; jne 3baa <_sk_load_a8_sse2+0x36>
+ DB 117,187 ; jne 3d29 <_sk_load_a8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -48571,10 +49047,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,151 ; jmp 3baa <_sk_load_a8_sse2+0x36>
+ DB 235,151 ; jmp 3d29 <_sk_load_a8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,141 ; jmp 3baa <_sk_load_a8_sse2+0x36>
+ DB 235,141 ; jmp 3d29 <_sk_load_a8_sse2+0x36>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -48597,15 +49073,15 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,127,97,32 ; movdqa %xmm4,0x20(%ecx)
DB 102,15,127,97,16 ; movdqa %xmm4,0x10(%ecx)
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 3c56 <_sk_load_a8_dst_sse2+0x39>
+ DB 232,0,0,0,0 ; call 3dd5 <_sk_load_a8_dst_sse2+0x39>
DB 90 ; pop %edx
- DB 117,54 ; jne 3c8f <_sk_load_a8_dst_sse2+0x72>
+ DB 117,54 ; jne 3e0e <_sk_load_a8_dst_sse2+0x72>
DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,90,96,0,0 ; pand 0x605a(%edx),%xmm4
+ DB 102,15,219,162,203,96,0,0 ; pand 0x60cb(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,106,96,0,0 ; mulps 0x606a(%edx),%xmm4
+ DB 15,89,162,219,96,0,0 ; mulps 0x60db(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -48620,11 +49096,11 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 3cc5 <_sk_load_a8_dst_sse2+0xa8>
+ DB 116,46 ; je 3e44 <_sk_load_a8_dst_sse2+0xa8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3caf <_sk_load_a8_dst_sse2+0x92>
+ DB 116,19 ; je 3e2e <_sk_load_a8_dst_sse2+0x92>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,197 ; jne 3c66 <_sk_load_a8_dst_sse2+0x49>
+ DB 117,197 ; jne 3de5 <_sk_load_a8_dst_sse2+0x49>
DB 15,182,92,55,2 ; movzbl 0x2(%edi,%esi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -48633,10 +49109,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,161 ; jmp 3c66 <_sk_load_a8_dst_sse2+0x49>
+ DB 235,161 ; jmp 3de5 <_sk_load_a8_dst_sse2+0x49>
DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,151 ; jmp 3c66 <_sk_load_a8_dst_sse2+0x49>
+ DB 235,151 ; jmp 3de5 <_sk_load_a8_dst_sse2+0x49>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -48675,13 +49151,13 @@ _sk_gather_a8_sse2 LABEL PROC
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
- DB 232,0,0,0,0 ; call 3d54 <_sk_gather_a8_sse2+0x85>
+ DB 232,0,0,0,0 ; call 3ed3 <_sk_gather_a8_sse2+0x85>
DB 89 ; pop %ecx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,153,124,95,0,0 ; mulps 0x5f7c(%ecx),%xmm3
+ DB 15,89,153,237,95,0,0 ; mulps 0x5fed(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -48704,7 +49180,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 3d98 <_sk_store_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3f17 <_sk_store_a8_sse2+0xe>
DB 94 ; pop %esi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48713,7 +49189,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 15,175,81,4 ; imul 0x4(%ecx),%edx
DB 3,23 ; add (%edi),%edx
DB 139,89,8 ; mov 0x8(%ecx),%ebx
- DB 15,40,166,72,95,0,0 ; movaps 0x5f48(%esi),%xmm4
+ DB 15,40,166,185,95,0,0 ; movaps 0x5fb9(%esi),%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
@@ -48722,7 +49198,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,26 ; jne 3ded <_sk_store_a8_sse2+0x63>
+ DB 117,26 ; jne 3f6c <_sk_store_a8_sse2+0x63>
DB 102,15,126,230 ; movd %xmm4,%esi
DB 137,52,58 ; mov %esi,(%edx,%edi,1)
DB 141,80,8 ; lea 0x8(%eax),%edx
@@ -48740,26 +49216,26 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,57 ; je 3e36 <_sk_store_a8_sse2+0xac>
+ DB 116,57 ; je 3fb5 <_sk_store_a8_sse2+0xac>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,17 ; je 3e13 <_sk_store_a8_sse2+0x89>
+ DB 116,17 ; je 3f92 <_sk_store_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,211 ; jne 3dda <_sk_store_a8_sse2+0x50>
+ DB 117,211 ; jne 3f59 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,200 ; movdqa %xmm4,-0x38(%ebp)
DB 138,93,208 ; mov -0x30(%ebp),%bl
DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
- DB 102,15,219,166,88,95,0,0 ; pand 0x5f58(%esi),%xmm4
+ DB 102,15,219,166,201,95,0,0 ; pand 0x5fc9(%esi),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,230 ; movd %xmm4,%esi
DB 102,137,52,58 ; mov %si,(%edx,%edi,1)
- DB 235,164 ; jmp 3dda <_sk_store_a8_sse2+0x50>
+ DB 235,164 ; jmp 3f59 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp)
DB 138,93,216 ; mov -0x28(%ebp),%bl
DB 136,28,58 ; mov %bl,(%edx,%edi,1)
- DB 235,151 ; jmp 3dda <_sk_store_a8_sse2+0x50>
+ DB 235,151 ; jmp 3f59 <_sk_store_a8_sse2+0x50>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -48769,7 +49245,7 @@ _sk_load_g8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3e51 <_sk_load_g8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3fd0 <_sk_load_g8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48780,16 +49256,16 @@ _sk_load_g8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,63 ; jne 3eab <_sk_load_g8_sse2+0x68>
+ DB 117,63 ; jne 402a <_sk_load_g8_sse2+0x68>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,175,94,0,0 ; pand 0x5eaf(%edx),%xmm0
+ DB 102,15,219,130,32,95,0,0 ; pand 0x5f20(%edx),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,191,94,0,0 ; mulps 0x5ebf(%edx),%xmm0
+ DB 15,89,130,48,95,0,0 ; mulps 0x5f30(%edx),%xmm0
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,207,94,0,0 ; movaps 0x5ecf(%edx),%xmm3
+ DB 15,40,154,64,95,0,0 ; movaps 0x5f40(%edx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 86 ; push %esi
@@ -48803,12 +49279,12 @@ _sk_load_g8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3ee5 <_sk_load_g8_sse2+0xa2>
+ DB 116,50 ; je 4064 <_sk_load_g8_sse2+0xa2>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3ecf <_sk_load_g8_sse2+0x8c>
+ DB 116,19 ; je 404e <_sk_load_g8_sse2+0x8c>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,184 ; jne 3e79 <_sk_load_g8_sse2+0x36>
+ DB 117,184 ; jne 3ff8 <_sk_load_g8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -48817,10 +49293,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,148 ; jmp 3e79 <_sk_load_g8_sse2+0x36>
+ DB 235,148 ; jmp 3ff8 <_sk_load_g8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,138 ; jmp 3e79 <_sk_load_g8_sse2+0x36>
+ DB 235,138 ; jmp 3ff8 <_sk_load_g8_sse2+0x36>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -48830,7 +49306,7 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3efd <_sk_load_g8_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 407c <_sk_load_g8_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48841,17 +49317,17 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,73 ; jne 3f61 <_sk_load_g8_dst_sse2+0x72>
+ DB 117,73 ; jne 40e0 <_sk_load_g8_dst_sse2+0x72>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,51,94,0,0 ; pand 0x5e33(%edx),%xmm4
+ DB 102,15,219,162,164,94,0,0 ; pand 0x5ea4(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,67,94,0,0 ; mulps 0x5e43(%edx),%xmm4
+ DB 15,89,162,180,94,0,0 ; mulps 0x5eb4(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx)
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,162,83,94,0,0 ; movaps 0x5e53(%edx),%xmm4
+ DB 15,40,162,196,94,0,0 ; movaps 0x5ec4(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -48866,12 +49342,12 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3f9b <_sk_load_g8_dst_sse2+0xac>
+ DB 116,50 ; je 411a <_sk_load_g8_dst_sse2+0xac>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3f85 <_sk_load_g8_dst_sse2+0x96>
+ DB 116,19 ; je 4104 <_sk_load_g8_dst_sse2+0x96>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,174 ; jne 3f25 <_sk_load_g8_dst_sse2+0x36>
+ DB 117,174 ; jne 40a4 <_sk_load_g8_dst_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -48880,10 +49356,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,138 ; jmp 3f25 <_sk_load_g8_dst_sse2+0x36>
+ DB 235,138 ; jmp 40a4 <_sk_load_g8_dst_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,128 ; jmp 3f25 <_sk_load_g8_dst_sse2+0x36>
+ DB 235,128 ; jmp 40a4 <_sk_load_g8_dst_sse2+0x36>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -48921,17 +49397,17 @@ _sk_gather_g8_sse2 LABEL PROC
DB 193,226,8 ; shl $0x8,%edx
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
- DB 232,0,0,0,0 ; call 4025 <_sk_gather_g8_sse2+0x80>
+ DB 232,0,0,0,0 ; call 41a4 <_sk_gather_g8_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,59,93,0,0 ; mulps 0x5d3b(%ecx),%xmm0
+ DB 15,89,129,172,93,0,0 ; mulps 0x5dac(%ecx),%xmm0
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,75,93,0,0 ; movaps 0x5d4b(%ecx),%xmm3
+ DB 15,40,153,188,93,0,0 ; movaps 0x5dbc(%ecx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 82 ; push %edx
@@ -48951,7 +49427,7 @@ _sk_load_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4070 <_sk_load_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 41ef <_sk_load_565_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48963,23 +49439,23 @@ _sk_load_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,97 ; jne 40ee <_sk_load_565_sse2+0x8c>
+ DB 117,97 ; jne 426d <_sk_load_565_sse2+0x8c>
DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,16,93,0,0 ; movdqa 0x5d10(%edx),%xmm0
+ DB 102,15,111,130,129,93,0,0 ; movdqa 0x5d81(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,32,93,0,0 ; mulps 0x5d20(%edx),%xmm0
- DB 102,15,111,138,48,93,0,0 ; movdqa 0x5d30(%edx),%xmm1
+ DB 15,89,130,145,93,0,0 ; mulps 0x5d91(%edx),%xmm0
+ DB 102,15,111,138,161,93,0,0 ; movdqa 0x5da1(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,64,93,0,0 ; mulps 0x5d40(%edx),%xmm1
- DB 102,15,219,146,80,93,0,0 ; pand 0x5d50(%edx),%xmm2
+ DB 15,89,138,177,93,0,0 ; mulps 0x5db1(%edx),%xmm1
+ DB 102,15,219,146,193,93,0,0 ; pand 0x5dc1(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,96,93,0,0 ; mulps 0x5d60(%edx),%xmm2
+ DB 15,89,146,209,93,0,0 ; mulps 0x5dd1(%edx),%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,112,93,0,0 ; movaps 0x5d70(%edx),%xmm3
+ DB 15,40,154,225,93,0,0 ; movaps 0x5de1(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -48991,22 +49467,22 @@ _sk_load_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 4124 <_sk_load_565_sse2+0xc2>
+ DB 116,46 ; je 42a3 <_sk_load_565_sse2+0xc2>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 4112 <_sk_load_565_sse2+0xb0>
+ DB 116,19 ; je 4291 <_sk_load_565_sse2+0xb0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,146 ; jne 4096 <_sk_load_565_sse2+0x34>
+ DB 117,146 ; jne 4215 <_sk_load_565_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,114,255,255,255 ; jmp 4096 <_sk_load_565_sse2+0x34>
+ DB 233,114,255,255,255 ; jmp 4215 <_sk_load_565_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,214 ; movd %esi,%xmm2
- DB 233,101,255,255,255 ; jmp 4096 <_sk_load_565_sse2+0x34>
+ DB 233,101,255,255,255 ; jmp 4215 <_sk_load_565_sse2+0x34>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -49016,7 +49492,7 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 413f <_sk_load_565_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 42be <_sk_load_565_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49028,24 +49504,24 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,113 ; jne 41cd <_sk_load_565_dst_sse2+0x9c>
+ DB 117,113 ; jne 434c <_sk_load_565_dst_sse2+0x9c>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,177,92,0,0 ; movdqa 0x5cb1(%edx),%xmm5
+ DB 102,15,111,170,34,93,0,0 ; movdqa 0x5d22(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,193,92,0,0 ; mulps 0x5cc1(%edx),%xmm5
+ DB 15,89,170,50,93,0,0 ; mulps 0x5d32(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,209,92,0,0 ; movdqa 0x5cd1(%edx),%xmm5
+ DB 102,15,111,170,66,93,0,0 ; movdqa 0x5d42(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,225,92,0,0 ; mulps 0x5ce1(%edx),%xmm5
+ DB 15,89,170,82,93,0,0 ; mulps 0x5d52(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,219,162,241,92,0,0 ; pand 0x5cf1(%edx),%xmm4
+ DB 102,15,219,162,98,93,0,0 ; pand 0x5d62(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,1,93,0,0 ; mulps 0x5d01(%edx),%xmm4
+ DB 15,89,162,114,93,0,0 ; mulps 0x5d72(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
- DB 15,40,162,17,93,0,0 ; movaps 0x5d11(%edx),%xmm4
+ DB 15,40,162,130,93,0,0 ; movaps 0x5d82(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49060,22 +49536,22 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 4203 <_sk_load_565_dst_sse2+0xd2>
+ DB 116,46 ; je 4382 <_sk_load_565_dst_sse2+0xd2>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 41f1 <_sk_load_565_dst_sse2+0xc0>
+ DB 116,19 ; je 4370 <_sk_load_565_dst_sse2+0xc0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,130 ; jne 4165 <_sk_load_565_dst_sse2+0x34>
+ DB 117,130 ; jne 42e4 <_sk_load_565_dst_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,98,255,255,255 ; jmp 4165 <_sk_load_565_dst_sse2+0x34>
+ DB 233,98,255,255,255 ; jmp 42e4 <_sk_load_565_dst_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,85,255,255,255 ; jmp 4165 <_sk_load_565_dst_sse2+0x34>
+ DB 233,85,255,255,255 ; jmp 42e4 <_sk_load_565_dst_sse2+0x34>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -49108,25 +49584,25 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
- DB 232,0,0,0,0 ; call 428b <_sk_gather_565_sse2+0x7b>
+ DB 232,0,0,0,0 ; call 440a <_sk_gather_565_sse2+0x7b>
DB 90 ; pop %edx
DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,213,91,0,0 ; movdqa 0x5bd5(%edx),%xmm0
+ DB 102,15,111,130,70,92,0,0 ; movdqa 0x5c46(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,229,91,0,0 ; mulps 0x5be5(%edx),%xmm0
- DB 102,15,111,138,245,91,0,0 ; movdqa 0x5bf5(%edx),%xmm1
+ DB 15,89,130,86,92,0,0 ; mulps 0x5c56(%edx),%xmm0
+ DB 102,15,111,138,102,92,0,0 ; movdqa 0x5c66(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,5,92,0,0 ; mulps 0x5c05(%edx),%xmm1
- DB 102,15,219,146,21,92,0,0 ; pand 0x5c15(%edx),%xmm2
+ DB 15,89,138,118,92,0,0 ; mulps 0x5c76(%edx),%xmm1
+ DB 102,15,219,146,134,92,0,0 ; pand 0x5c86(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,37,92,0,0 ; mulps 0x5c25(%edx),%xmm2
+ DB 15,89,146,150,92,0,0 ; mulps 0x5c96(%edx),%xmm2
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,53,92,0,0 ; movaps 0x5c35(%edx),%xmm3
+ DB 15,40,154,166,92,0,0 ; movaps 0x5ca6(%edx),%xmm3
DB 81 ; push %ecx
DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
@@ -49142,7 +49618,7 @@ _sk_store_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 42fe <_sk_store_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 447d <_sk_store_565_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49152,8 +49628,8 @@ _sk_store_565_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,210,91,0,0 ; movaps 0x5bd2(%edi),%xmm4
- DB 15,40,175,226,91,0,0 ; movaps 0x5be2(%edi),%xmm5
+ DB 15,40,167,67,92,0,0 ; movaps 0x5c43(%edi),%xmm4
+ DB 15,40,175,83,92,0,0 ; movaps 0x5c53(%edi),%xmm5
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,89,244 ; mulps %xmm4,%xmm6
@@ -49173,7 +49649,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 4392 <_sk_store_565_sse2+0xa2>
+ DB 117,34 ; jne 4511 <_sk_store_565_sse2+0xa2>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -49193,20 +49669,20 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 43c8 <_sk_store_565_sse2+0xd8>
+ DB 116,37 ; je 4547 <_sk_store_565_sse2+0xd8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 43b7 <_sk_store_565_sse2+0xc7>
+ DB 116,15 ; je 4536 <_sk_store_565_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 437f <_sk_store_565_sse2+0x8f>
+ DB 117,210 ; jne 44fe <_sk_store_565_sse2+0x8f>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 437f <_sk_store_565_sse2+0x8f>
+ DB 235,183 ; jmp 44fe <_sk_store_565_sse2+0x8f>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 437f <_sk_store_565_sse2+0x8f>
+ DB 235,173 ; jmp 44fe <_sk_store_565_sse2+0x8f>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -49216,7 +49692,7 @@ _sk_load_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 43e0 <_sk_load_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 455f <_sk_load_4444_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49228,24 +49704,24 @@ _sk_load_4444_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,112 ; jne 446d <_sk_load_4444_sse2+0x9b>
+ DB 117,112 ; jne 45ec <_sk_load_4444_sse2+0x9b>
DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,16,91,0,0 ; movdqa 0x5b10(%edx),%xmm0
+ DB 102,15,111,130,129,91,0,0 ; movdqa 0x5b81(%edx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,32,91,0,0 ; mulps 0x5b20(%edx),%xmm0
- DB 102,15,111,138,48,91,0,0 ; movdqa 0x5b30(%edx),%xmm1
+ DB 15,89,130,145,91,0,0 ; mulps 0x5b91(%edx),%xmm0
+ DB 102,15,111,138,161,91,0,0 ; movdqa 0x5ba1(%edx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,64,91,0,0 ; mulps 0x5b40(%edx),%xmm1
- DB 102,15,111,146,80,91,0,0 ; movdqa 0x5b50(%edx),%xmm2
+ DB 15,89,138,177,91,0,0 ; mulps 0x5bb1(%edx),%xmm1
+ DB 102,15,111,146,193,91,0,0 ; movdqa 0x5bc1(%edx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,96,91,0,0 ; mulps 0x5b60(%edx),%xmm2
- DB 102,15,219,154,112,91,0,0 ; pand 0x5b70(%edx),%xmm3
+ DB 15,89,146,209,91,0,0 ; mulps 0x5bd1(%edx),%xmm2
+ DB 102,15,219,154,225,91,0,0 ; pand 0x5be1(%edx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,128,91,0,0 ; mulps 0x5b80(%edx),%xmm3
+ DB 15,89,154,241,91,0,0 ; mulps 0x5bf1(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 82 ; push %edx
@@ -49259,22 +49735,22 @@ _sk_load_4444_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 44a3 <_sk_load_4444_sse2+0xd1>
+ DB 116,46 ; je 4622 <_sk_load_4444_sse2+0xd1>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 4491 <_sk_load_4444_sse2+0xbf>
+ DB 116,19 ; je 4610 <_sk_load_4444_sse2+0xbf>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,131 ; jne 4406 <_sk_load_4444_sse2+0x34>
+ DB 117,131 ; jne 4585 <_sk_load_4444_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,99,255,255,255 ; jmp 4406 <_sk_load_4444_sse2+0x34>
+ DB 233,99,255,255,255 ; jmp 4585 <_sk_load_4444_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,222 ; movd %esi,%xmm3
- DB 233,86,255,255,255 ; jmp 4406 <_sk_load_4444_sse2+0x34>
+ DB 233,86,255,255,255 ; jmp 4585 <_sk_load_4444_sse2+0x34>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -49284,7 +49760,7 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 44be <_sk_load_4444_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 463d <_sk_load_4444_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49296,27 +49772,27 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,128,0,0,0 ; jne 455f <_sk_load_4444_dst_sse2+0xaf>
+ DB 15,133,128,0,0,0 ; jne 46de <_sk_load_4444_dst_sse2+0xaf>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,178,90,0,0 ; movdqa 0x5ab2(%edx),%xmm5
+ DB 102,15,111,170,35,91,0,0 ; movdqa 0x5b23(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,194,90,0,0 ; mulps 0x5ac2(%edx),%xmm5
+ DB 15,89,170,51,91,0,0 ; mulps 0x5b33(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,210,90,0,0 ; movdqa 0x5ad2(%edx),%xmm5
+ DB 102,15,111,170,67,91,0,0 ; movdqa 0x5b43(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,226,90,0,0 ; mulps 0x5ae2(%edx),%xmm5
+ DB 15,89,170,83,91,0,0 ; mulps 0x5b53(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,111,170,242,90,0,0 ; movdqa 0x5af2(%edx),%xmm5
+ DB 102,15,111,170,99,91,0,0 ; movdqa 0x5b63(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,2,91,0,0 ; mulps 0x5b02(%edx),%xmm5
+ DB 15,89,170,115,91,0,0 ; mulps 0x5b73(%edx),%xmm5
DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
- DB 102,15,219,162,18,91,0,0 ; pand 0x5b12(%edx),%xmm4
+ DB 102,15,219,162,131,91,0,0 ; pand 0x5b83(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,34,91,0,0 ; mulps 0x5b22(%edx),%xmm4
+ DB 15,89,162,147,91,0,0 ; mulps 0x5b93(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49331,22 +49807,22 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 4599 <_sk_load_4444_dst_sse2+0xe9>
+ DB 116,50 ; je 4718 <_sk_load_4444_dst_sse2+0xe9>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 4587 <_sk_load_4444_dst_sse2+0xd7>
+ DB 116,23 ; je 4706 <_sk_load_4444_dst_sse2+0xd7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,111,255,255,255 ; jne 44e8 <_sk_load_4444_dst_sse2+0x38>
+ DB 15,133,111,255,255,255 ; jne 4667 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,79,255,255,255 ; jmp 44e8 <_sk_load_4444_dst_sse2+0x38>
+ DB 233,79,255,255,255 ; jmp 4667 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,66,255,255,255 ; jmp 44e8 <_sk_load_4444_dst_sse2+0x38>
+ DB 233,66,255,255,255 ; jmp 4667 <_sk_load_4444_dst_sse2+0x38>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -49380,25 +49856,25 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
DB 102,15,196,217,3 ; pinsrw $0x3,%ecx,%xmm3
- DB 232,0,0,0,0 ; call 4626 <_sk_gather_4444_sse2+0x80>
+ DB 232,0,0,0,0 ; call 47a5 <_sk_gather_4444_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,129,202,89,0,0 ; movdqa 0x59ca(%ecx),%xmm0
+ DB 102,15,111,129,59,90,0,0 ; movdqa 0x5a3b(%ecx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,218,89,0,0 ; mulps 0x59da(%ecx),%xmm0
- DB 102,15,111,137,234,89,0,0 ; movdqa 0x59ea(%ecx),%xmm1
+ DB 15,89,129,75,90,0,0 ; mulps 0x5a4b(%ecx),%xmm0
+ DB 102,15,111,137,91,90,0,0 ; movdqa 0x5a5b(%ecx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,137,250,89,0,0 ; mulps 0x59fa(%ecx),%xmm1
- DB 102,15,111,145,10,90,0,0 ; movdqa 0x5a0a(%ecx),%xmm2
+ DB 15,89,137,107,90,0,0 ; mulps 0x5a6b(%ecx),%xmm1
+ DB 102,15,111,145,123,90,0,0 ; movdqa 0x5a7b(%ecx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,145,26,90,0,0 ; mulps 0x5a1a(%ecx),%xmm2
- DB 102,15,219,153,42,90,0,0 ; pand 0x5a2a(%ecx),%xmm3
+ DB 15,89,145,139,90,0,0 ; mulps 0x5a8b(%ecx),%xmm2
+ DB 102,15,219,153,155,90,0,0 ; pand 0x5a9b(%ecx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,153,58,90,0,0 ; mulps 0x5a3a(%ecx),%xmm3
+ DB 15,89,153,171,90,0,0 ; mulps 0x5aab(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 81 ; push %ecx
@@ -49416,7 +49892,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 46a3 <_sk_store_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4822 <_sk_store_4444_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49426,7 +49902,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,205,89,0,0 ; movaps 0x59cd(%edi),%xmm4
+ DB 15,40,167,62,90,0,0 ; movaps 0x5a3e(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -49452,7 +49928,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 4746 <_sk_store_4444_sse2+0xb1>
+ DB 117,34 ; jne 48c5 <_sk_store_4444_sse2+0xb1>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -49472,20 +49948,20 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 477c <_sk_store_4444_sse2+0xe7>
+ DB 116,37 ; je 48fb <_sk_store_4444_sse2+0xe7>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 476b <_sk_store_4444_sse2+0xd6>
+ DB 116,15 ; je 48ea <_sk_store_4444_sse2+0xd6>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 4733 <_sk_store_4444_sse2+0x9e>
+ DB 117,210 ; jne 48b2 <_sk_store_4444_sse2+0x9e>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 4733 <_sk_store_4444_sse2+0x9e>
+ DB 235,183 ; jmp 48b2 <_sk_store_4444_sse2+0x9e>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 4733 <_sk_store_4444_sse2+0x9e>
+ DB 235,173 ; jmp 48b2 <_sk_store_4444_sse2+0x9e>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -49495,7 +49971,7 @@ _sk_load_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4794 <_sk_load_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4913 <_sk_load_8888_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49507,13 +49983,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 4818 <_sk_load_8888_sse2+0x92>
+ DB 117,102 ; jne 4997 <_sk_load_8888_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,146,236,88,0,0 ; movdqa 0x58ec(%edx),%xmm2
+ DB 102,15,111,146,93,89,0,0 ; movdqa 0x595d(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,252,88,0,0 ; movaps 0x58fc(%edx),%xmm4
+ DB 15,40,162,109,89,0,0 ; movaps 0x596d(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49541,18 +50017,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 4843 <_sk_load_8888_sse2+0xbd>
+ DB 116,35 ; je 49c2 <_sk_load_8888_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4839 <_sk_load_8888_sse2+0xb3>
+ DB 116,16 ; je 49b8 <_sk_load_8888_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 47b7 <_sk_load_8888_sse2+0x31>
+ DB 117,137 ; jne 4936 <_sk_load_8888_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 47b7 <_sk_load_8888_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 4936 <_sk_load_8888_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 47b7 <_sk_load_8888_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 4936 <_sk_load_8888_sse2+0x31>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -49562,7 +50038,7 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 485b <_sk_load_8888_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 49da <_sk_load_8888_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49574,13 +50050,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 48ef <_sk_load_8888_dst_sse2+0xa2>
+ DB 117,118 ; jne 4a6e <_sk_load_8888_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,69,88,0,0 ; movdqa 0x5845(%edx),%xmm5
+ DB 102,15,111,170,182,88,0,0 ; movdqa 0x58b6(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,85,88,0,0 ; movaps 0x5855(%edx),%xmm7
+ DB 15,40,186,198,88,0,0 ; movaps 0x58c6(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -49612,18 +50088,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 491e <_sk_load_8888_dst_sse2+0xd1>
+ DB 116,39 ; je 4a9d <_sk_load_8888_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 4914 <_sk_load_8888_dst_sse2+0xc7>
+ DB 116,20 ; je 4a93 <_sk_load_8888_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 487e <_sk_load_8888_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 49fd <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 487e <_sk_load_8888_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 49fd <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 487e <_sk_load_8888_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 49fd <_sk_load_8888_dst_sse2+0x31>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -49655,16 +50131,16 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 499e <_sk_gather_8888_sse2+0x76>
+ DB 232,0,0,0,0 ; call 4b1d <_sk_gather_8888_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,145,34,87,0,0 ; movdqa 0x5722(%ecx),%xmm2
+ DB 102,15,111,145,147,87,0,0 ; movdqa 0x5793(%ecx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,161,50,87,0,0 ; movaps 0x5732(%ecx),%xmm4
+ DB 15,40,161,163,87,0,0 ; movaps 0x57a3(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49696,7 +50172,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4a19 <_sk_store_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4b98 <_sk_store_8888_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49706,7 +50182,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,199,86,0,0 ; movaps 0x56c7(%edi),%xmm4
+ DB 15,40,167,56,87,0,0 ; movaps 0x5738(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -49726,7 +50202,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 4a96 <_sk_store_8888_sse2+0x8b>
+ DB 117,24 ; jne 4c15 <_sk_store_8888_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49741,17 +50217,17 @@ _sk_store_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 4aba <_sk_store_8888_sse2+0xaf>
+ DB 116,28 ; je 4c39 <_sk_store_8888_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4ab3 <_sk_store_8888_sse2+0xa8>
+ DB 116,16 ; je 4c32 <_sk_store_8888_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 4a83 <_sk_store_8888_sse2+0x78>
+ DB 117,219 ; jne 4c02 <_sk_store_8888_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 4a83 <_sk_store_8888_sse2+0x78>
+ DB 235,201 ; jmp 4c02 <_sk_store_8888_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 4a83 <_sk_store_8888_sse2+0x78>
+ DB 235,194 ; jmp 4c02 <_sk_store_8888_sse2+0x78>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -49761,7 +50237,7 @@ _sk_load_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4acf <_sk_load_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4c4e <_sk_load_bgra_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49773,13 +50249,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 4b53 <_sk_load_bgra_sse2+0x92>
+ DB 117,102 ; jne 4cd2 <_sk_load_bgra_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,130,33,86,0,0 ; movdqa 0x5621(%edx),%xmm0
+ DB 102,15,111,130,146,86,0,0 ; movdqa 0x5692(%edx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,162,49,86,0,0 ; movaps 0x5631(%edx),%xmm4
+ DB 15,40,162,162,86,0,0 ; movaps 0x56a2(%edx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49807,18 +50283,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 4b7e <_sk_load_bgra_sse2+0xbd>
+ DB 116,35 ; je 4cfd <_sk_load_bgra_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4b74 <_sk_load_bgra_sse2+0xb3>
+ DB 116,16 ; je 4cf3 <_sk_load_bgra_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 4af2 <_sk_load_bgra_sse2+0x31>
+ DB 117,137 ; jne 4c71 <_sk_load_bgra_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 4af2 <_sk_load_bgra_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 4c71 <_sk_load_bgra_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 4af2 <_sk_load_bgra_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 4c71 <_sk_load_bgra_sse2+0x31>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -49828,7 +50304,7 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4b96 <_sk_load_bgra_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4d15 <_sk_load_bgra_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49840,13 +50316,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 4c2a <_sk_load_bgra_dst_sse2+0xa2>
+ DB 117,118 ; jne 4da9 <_sk_load_bgra_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,122,85,0,0 ; movdqa 0x557a(%edx),%xmm5
+ DB 102,15,111,170,235,85,0,0 ; movdqa 0x55eb(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,138,85,0,0 ; movaps 0x558a(%edx),%xmm7
+ DB 15,40,186,251,85,0,0 ; movaps 0x55fb(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -49878,18 +50354,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 4c59 <_sk_load_bgra_dst_sse2+0xd1>
+ DB 116,39 ; je 4dd8 <_sk_load_bgra_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 4c4f <_sk_load_bgra_dst_sse2+0xc7>
+ DB 116,20 ; je 4dce <_sk_load_bgra_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 4bb9 <_sk_load_bgra_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 4d38 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 4bb9 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 4d38 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 4bb9 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 4d38 <_sk_load_bgra_dst_sse2+0x31>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -49921,16 +50397,16 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 4cd9 <_sk_gather_bgra_sse2+0x76>
+ DB 232,0,0,0,0 ; call 4e58 <_sk_gather_bgra_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,129,87,84,0,0 ; movdqa 0x5457(%ecx),%xmm0
+ DB 102,15,111,129,200,84,0,0 ; movdqa 0x54c8(%ecx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,161,103,84,0,0 ; movaps 0x5467(%ecx),%xmm4
+ DB 15,40,161,216,84,0,0 ; movaps 0x54d8(%ecx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49962,7 +50438,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4d54 <_sk_store_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4ed3 <_sk_store_bgra_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49972,7 +50448,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,252,83,0,0 ; movaps 0x53fc(%edi),%xmm4
+ DB 15,40,167,109,84,0,0 ; movaps 0x546d(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -49992,7 +50468,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 4dd1 <_sk_store_bgra_sse2+0x8b>
+ DB 117,24 ; jne 4f50 <_sk_store_bgra_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -50007,17 +50483,17 @@ _sk_store_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 4df5 <_sk_store_bgra_sse2+0xaf>
+ DB 116,28 ; je 4f74 <_sk_store_bgra_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4dee <_sk_store_bgra_sse2+0xa8>
+ DB 116,16 ; je 4f6d <_sk_store_bgra_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 4dbe <_sk_store_bgra_sse2+0x78>
+ DB 117,219 ; jne 4f3d <_sk_store_bgra_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 4dbe <_sk_store_bgra_sse2+0x78>
+ DB 235,201 ; jmp 4f3d <_sk_store_bgra_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 4dbe <_sk_store_bgra_sse2+0x78>
+ DB 235,194 ; jmp 4f3d <_sk_store_bgra_sse2+0x78>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -50027,7 +50503,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,92 ; sub $0x5c,%esp
- DB 232,0,0,0,0 ; call 4e0a <_sk_load_f16_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4f89 <_sk_load_f16_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50039,7 +50515,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,160,1,0,0 ; jne 4fcc <_sk_load_f16_sse2+0x1d0>
+ DB 15,133,160,1,0,0 ; jne 514b <_sk_load_f16_sse2+0x1d0>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
@@ -50067,7 +50543,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,154,86,83,0,0 ; movdqa 0x5356(%edx),%xmm3
+ DB 102,15,111,154,199,83,0,0 ; movdqa 0x53c7(%edx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -50100,15 +50576,15 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,154,102,83,0,0 ; movdqa 0x5366(%edx),%xmm3
+ DB 102,15,111,154,215,83,0,0 ; movdqa 0x53d7(%edx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,154,118,83,0,0 ; movdqa 0x5376(%edx),%xmm3
+ DB 102,15,111,154,231,83,0,0 ; movdqa 0x53e7(%edx),%xmm3
DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,154,134,83,0,0 ; movdqa 0x5386(%edx),%xmm3
+ DB 102,15,111,154,247,83,0,0 ; movdqa 0x53f7(%edx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -50140,12 +50616,12 @@ _sk_load_f16_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,89,254,255,255 ; je 4e37 <_sk_load_f16_sse2+0x3b>
+ DB 15,132,89,254,255,255 ; je 4fb6 <_sk_load_f16_sse2+0x3b>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,74,254,255,255 ; jb 4e37 <_sk_load_f16_sse2+0x3b>
+ DB 15,130,74,254,255,255 ; jb 4fb6 <_sk_load_f16_sse2+0x3b>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,63,254,255,255 ; jmp 4e37 <_sk_load_f16_sse2+0x3b>
+ DB 233,63,254,255,255 ; jmp 4fb6 <_sk_load_f16_sse2+0x3b>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -50159,7 +50635,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 15,41,149,120,255,255,255 ; movaps %xmm2,-0x88(%ebp)
DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp)
DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
- DB 232,0,0,0,0 ; call 5020 <_sk_load_f16_dst_sse2+0x28>
+ DB 232,0,0,0,0 ; call 519f <_sk_load_f16_dst_sse2+0x28>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50171,7 +50647,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,206,1,0,0 ; jne 5210 <_sk_load_f16_dst_sse2+0x218>
+ DB 15,133,206,1,0,0 ; jne 538f <_sk_load_f16_dst_sse2+0x218>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -50199,7 +50675,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
- DB 102,15,111,154,128,81,0,0 ; movdqa 0x5180(%edx),%xmm3
+ DB 102,15,111,154,241,81,0,0 ; movdqa 0x51f1(%edx),%xmm3
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,239,226 ; pxor %xmm2,%xmm4
@@ -50207,13 +50683,13 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,15,111,146,160,81,0,0 ; movdqa 0x51a0(%edx),%xmm2
+ DB 102,15,111,146,17,82,0,0 ; movdqa 0x5211(%edx),%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
DB 102,15,239,226 ; pxor %xmm2,%xmm4
- DB 102,15,111,178,176,81,0,0 ; movdqa 0x51b0(%edx),%xmm6
+ DB 102,15,111,178,33,82,0,0 ; movdqa 0x5221(%edx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7
- DB 102,15,111,146,144,81,0,0 ; movdqa 0x5190(%edx),%xmm2
+ DB 102,15,111,146,1,82,0,0 ; movdqa 0x5201(%edx),%xmm2
DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp)
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,223,249 ; pandn %xmm1,%xmm7
@@ -50281,12 +50757,12 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,43,254,255,255 ; je 504d <_sk_load_f16_dst_sse2+0x55>
+ DB 15,132,43,254,255,255 ; je 51cc <_sk_load_f16_dst_sse2+0x55>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,28,254,255,255 ; jb 504d <_sk_load_f16_dst_sse2+0x55>
+ DB 15,130,28,254,255,255 ; jb 51cc <_sk_load_f16_dst_sse2+0x55>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,17,254,255,255 ; jmp 504d <_sk_load_f16_dst_sse2+0x55>
+ DB 233,17,254,255,255 ; jmp 51cc <_sk_load_f16_dst_sse2+0x55>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -50322,7 +50798,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,194 ; movd %xmm0,%edx
DB 102,15,110,68,209,4 ; movd 0x4(%ecx,%edx,8),%xmm0
DB 102,15,110,60,209 ; movd (%ecx,%edx,8),%xmm7
- DB 232,0,0,0,0 ; call 52ca <_sk_gather_f16_sse2+0x8e>
+ DB 232,0,0,0,0 ; call 5449 <_sk_gather_f16_sse2+0x8e>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
@@ -50355,7 +50831,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,153,22,79,0,0 ; movdqa 0x4f16(%ecx),%xmm3
+ DB 102,15,111,153,135,79,0,0 ; movdqa 0x4f87(%ecx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -50388,15 +50864,15 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,153,38,79,0,0 ; movdqa 0x4f26(%ecx),%xmm3
+ DB 102,15,111,153,151,79,0,0 ; movdqa 0x4f97(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,153,54,79,0,0 ; movdqa 0x4f36(%ecx),%xmm3
+ DB 102,15,111,153,167,79,0,0 ; movdqa 0x4fa7(%ecx),%xmm3
DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,153,70,79,0,0 ; movdqa 0x4f46(%ecx),%xmm3
+ DB 102,15,111,153,183,79,0,0 ; movdqa 0x4fb7(%ecx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -50433,20 +50909,20 @@ _sk_store_f16_sse2 LABEL PROC
DB 131,236,80 ; sub $0x50,%esp
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 548d <_sk_store_f16_sse2+0x15>
+ DB 232,0,0,0,0 ; call 560c <_sk_store_f16_sse2+0x15>
DB 88 ; pop %eax
- DB 102,15,111,176,147,77,0,0 ; movdqa 0x4d93(%eax),%xmm6
+ DB 102,15,111,176,4,78,0,0 ; movdqa 0x4e04(%eax),%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,219,214 ; pand %xmm6,%xmm2
DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,239,234 ; pxor %xmm2,%xmm5
- DB 102,15,111,160,163,77,0,0 ; movdqa 0x4da3(%eax),%xmm4
+ DB 102,15,111,160,20,78,0,0 ; movdqa 0x4e14(%eax),%xmm4
DB 102,15,114,210,16 ; psrld $0x10,%xmm2
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
DB 102,15,114,213,13 ; psrld $0xd,%xmm5
- DB 102,15,111,184,179,77,0,0 ; movdqa 0x4db3(%eax),%xmm7
+ DB 102,15,111,184,36,78,0,0 ; movdqa 0x4e24(%eax),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp)
DB 102,15,254,213 ; paddd %xmm5,%xmm2
@@ -50508,7 +50984,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 3,55 ; add (%edi),%esi
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,53 ; jne 55ff <_sk_store_f16_sse2+0x187>
+ DB 117,53 ; jne 577e <_sk_store_f16_sse2+0x187>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,98,197 ; punpckldq %xmm5,%xmm0
DB 243,15,127,4,214 ; movdqu %xmm0,(%esi,%edx,8)
@@ -50531,13 +51007,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,98,213 ; punpckldq %xmm5,%xmm2
DB 102,15,214,20,214 ; movq %xmm2,(%esi,%edx,8)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,208 ; je 55e1 <_sk_store_f16_sse2+0x169>
+ DB 116,208 ; je 5760 <_sk_store_f16_sse2+0x169>
DB 102,15,23,84,214,8 ; movhpd %xmm2,0x8(%esi,%edx,8)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,197 ; jb 55e1 <_sk_store_f16_sse2+0x169>
+ DB 114,197 ; jb 5760 <_sk_store_f16_sse2+0x169>
DB 102,15,106,205 ; punpckhdq %xmm5,%xmm1
DB 102,15,214,76,214,16 ; movq %xmm1,0x10(%esi,%edx,8)
- DB 235,185 ; jmp 55e1 <_sk_store_f16_sse2+0x169>
+ DB 235,185 ; jmp 5760 <_sk_store_f16_sse2+0x169>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -50558,9 +51034,9 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 193,230,2 ; shl $0x2,%esi
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 5653 <_sk_load_u16_be_sse2+0x2b>
+ DB 232,0,0,0,0 ; call 57d2 <_sk_load_u16_be_sse2+0x2b>
DB 90 ; pop %edx
- DB 15,133,11,1,0,0 ; jne 5765 <_sk_load_u16_be_sse2+0x13d>
+ DB 15,133,11,1,0,0 ; jne 58e4 <_sk_load_u16_be_sse2+0x13d>
DB 102,15,16,4,119 ; movupd (%edi,%esi,2),%xmm0
DB 243,15,111,76,119,16 ; movdqu 0x10(%edi,%esi,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -50581,7 +51057,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,253,75,0,0 ; movaps 0x4bfd(%edx),%xmm4
+ DB 15,40,162,110,76,0,0 ; movaps 0x4c6e(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -50631,12 +51107,12 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 242,15,16,4,119 ; movsd (%edi,%esi,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,238,254,255,255 ; je 5665 <_sk_load_u16_be_sse2+0x3d>
+ DB 15,132,238,254,255,255 ; je 57e4 <_sk_load_u16_be_sse2+0x3d>
DB 102,15,22,68,119,8 ; movhpd 0x8(%edi,%esi,2),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,223,254,255,255 ; jb 5665 <_sk_load_u16_be_sse2+0x3d>
+ DB 15,130,223,254,255,255 ; jb 57e4 <_sk_load_u16_be_sse2+0x3d>
DB 243,15,126,76,119,16 ; movq 0x10(%edi,%esi,2),%xmm1
- DB 233,212,254,255,255 ; jmp 5665 <_sk_load_u16_be_sse2+0x3d>
+ DB 233,212,254,255,255 ; jmp 57e4 <_sk_load_u16_be_sse2+0x3d>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -50656,9 +51132,9 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 3,50 ; add (%edx),%esi
DB 107,25,3 ; imul $0x3,(%ecx),%ebx
DB 133,255 ; test %edi,%edi
- DB 232,0,0,0,0 ; call 57ba <_sk_load_rgb_u16_be_sse2+0x29>
+ DB 232,0,0,0,0 ; call 5939 <_sk_load_rgb_u16_be_sse2+0x29>
DB 90 ; pop %edx
- DB 15,133,240,0,0,0 ; jne 58b1 <_sk_load_rgb_u16_be_sse2+0x120>
+ DB 15,133,240,0,0,0 ; jne 5a30 <_sk_load_rgb_u16_be_sse2+0x120>
DB 243,15,111,20,94 ; movdqu (%esi,%ebx,2),%xmm2
DB 243,15,111,92,94,8 ; movdqu 0x8(%esi,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -50683,7 +51159,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,170,166,74,0,0 ; movaps 0x4aa6(%edx),%xmm5
+ DB 15,40,170,23,75,0,0 ; movaps 0x4b17(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -50709,7 +51185,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,182,74,0,0 ; movaps 0x4ab6(%edx),%xmm3
+ DB 15,40,154,39,75,0,0 ; movaps 0x4b27(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -50723,20 +51199,20 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,196,84,94,4,2 ; pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,13 ; jne 58d3 <_sk_load_rgb_u16_be_sse2+0x142>
+ DB 117,13 ; jne 5a52 <_sk_load_rgb_u16_be_sse2+0x142>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,16,255,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,16,255,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,110,68,94,6 ; movd 0x6(%esi,%ebx,2),%xmm0
DB 102,15,196,68,94,10,2 ; pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,18 ; jb 58fb <_sk_load_rgb_u16_be_sse2+0x16a>
+ DB 114,18 ; jb 5a7a <_sk_load_rgb_u16_be_sse2+0x16a>
DB 102,15,110,92,94,12 ; movd 0xc(%esi,%ebx,2),%xmm3
DB 102,15,196,92,94,16,2 ; pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- DB 233,232,254,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,232,254,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,223,254,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,223,254,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -50746,9 +51222,9 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,16 ; sub $0x10,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
- DB 232,0,0,0,0 ; call 5915 <_sk_store_u16_be_sse2+0x11>
+ DB 232,0,0,0,0 ; call 5a94 <_sk_store_u16_be_sse2+0x11>
DB 88 ; pop %eax
- DB 15,40,176,107,73,0,0 ; movaps 0x496b(%eax),%xmm6
+ DB 15,40,176,220,73,0,0 ; movaps 0x49dc(%eax),%xmm6
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,89,230 ; mulps %xmm6,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
@@ -50801,7 +51277,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 193,226,2 ; shl $0x2,%edx
DB 133,255 ; test %edi,%edi
- DB 117,45 ; jne 5a17 <_sk_store_u16_be_sse2+0x113>
+ DB 117,45 ; jne 5b96 <_sk_store_u16_be_sse2+0x113>
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,98,221 ; punpckldq %xmm5,%xmm3
DB 243,15,127,28,86 ; movdqu %xmm3,(%esi,%edx,2)
@@ -50822,13 +51298,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,15,98,245 ; punpckldq %xmm5,%xmm6
DB 102,15,214,52,86 ; movq %xmm6,(%esi,%edx,2)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,216 ; je 5a01 <_sk_store_u16_be_sse2+0xfd>
+ DB 116,216 ; je 5b80 <_sk_store_u16_be_sse2+0xfd>
DB 102,15,23,116,86,8 ; movhpd %xmm6,0x8(%esi,%edx,2)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,205 ; jb 5a01 <_sk_store_u16_be_sse2+0xfd>
+ DB 114,205 ; jb 5b80 <_sk_store_u16_be_sse2+0xfd>
DB 102,15,106,229 ; punpckhdq %xmm5,%xmm4
DB 102,15,214,100,86,16 ; movq %xmm4,0x10(%esi,%edx,2)
- DB 235,193 ; jmp 5a01 <_sk_store_u16_be_sse2+0xfd>
+ DB 235,193 ; jmp 5b80 <_sk_store_u16_be_sse2+0xfd>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -50849,7 +51325,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 15,16,36,23 ; movups (%edi,%edx,1),%xmm4
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,71 ; jne 5ab7 <_sk_load_f32_sse2+0x77>
+ DB 117,71 ; jne 5c36 <_sk_load_f32_sse2+0x77>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,68,178,48 ; movups 0x30(%edx,%esi,4),%xmm0
@@ -50877,17 +51353,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 5ac7 <_sk_load_f32_sse2+0x87>
+ DB 117,8 ; jne 5c46 <_sk_load_f32_sse2+0x87>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 235,184 ; jmp 5a7f <_sk_load_f32_sse2+0x3f>
+ DB 235,184 ; jmp 5bfe <_sk_load_f32_sse2+0x3f>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 5ad8 <_sk_load_f32_sse2+0x98>
+ DB 114,7 ; jb 5c57 <_sk_load_f32_sse2+0x98>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,167 ; jmp 5a7f <_sk_load_f32_sse2+0x3f>
+ DB 235,167 ; jmp 5bfe <_sk_load_f32_sse2+0x3f>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,162 ; jmp 5a7f <_sk_load_f32_sse2+0x3f>
+ DB 235,162 ; jmp 5bfe <_sk_load_f32_sse2+0x3f>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -50911,7 +51387,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 15,16,52,23 ; movups (%edi,%edx,1),%xmm6
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,97 ; jne 5b79 <_sk_load_f32_dst_sse2+0x9c>
+ DB 117,97 ; jne 5cf8 <_sk_load_f32_dst_sse2+0x9c>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,84,178,48 ; movups 0x30(%edx,%esi,4),%xmm2
@@ -50945,17 +51421,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 5b89 <_sk_load_f32_dst_sse2+0xac>
+ DB 117,8 ; jne 5d08 <_sk_load_f32_dst_sse2+0xac>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,158 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,158 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 5b9a <_sk_load_f32_dst_sse2+0xbd>
+ DB 114,7 ; jb 5d19 <_sk_load_f32_dst_sse2+0xbd>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,141 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,141 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,136 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,136 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -50991,7 +51467,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 102,15,20,239 ; unpcklpd %xmm7,%xmm5
DB 133,255 ; test %edi,%edi
- DB 117,40 ; jne 5c25 <_sk_store_f32_sse2+0x86>
+ DB 117,40 ; jne 5da4 <_sk_store_f32_sse2+0x86>
DB 102,15,21,247 ; unpckhpd %xmm7,%xmm6
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
@@ -51008,12 +51484,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 93 ; pop %ebp
DB 195 ; ret
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,232 ; je 5c12 <_sk_store_f32_sse2+0x73>
+ DB 116,232 ; je 5d91 <_sk_store_f32_sse2+0x73>
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,222 ; jb 5c12 <_sk_store_f32_sse2+0x73>
+ DB 114,222 ; jb 5d91 <_sk_store_f32_sse2+0x73>
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
- DB 235,214 ; jmp 5c12 <_sk_store_f32_sse2+0x73>
+ DB 235,214 ; jmp 5d91 <_sk_store_f32_sse2+0x73>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -51068,7 +51544,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5cb9 <_sk_repeat_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5e38 <_sk_repeat_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51079,7 +51555,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,215,69,0,0 ; andps 0x45d7(%ecx),%xmm6
+ DB 15,84,177,72,70,0,0 ; andps 0x4648(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51104,7 +51580,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5d1f <_sk_repeat_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5e9e <_sk_repeat_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51115,7 +51591,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,129,69,0,0 ; andps 0x4581(%ecx),%xmm6
+ DB 15,84,177,242,69,0,0 ; andps 0x45f2(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51140,7 +51616,7 @@ _sk_mirror_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5d85 <_sk_mirror_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5f04 <_sk_mirror_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51149,13 +51625,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 243,15,89,177,171,74,0,0 ; mulss 0x4aab(%ecx),%xmm6
+ DB 243,15,89,177,28,75,0,0 ; mulss 0x4b1c(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,43,69,0,0 ; andps 0x452b(%ecx),%xmm6
+ DB 15,84,177,156,69,0,0 ; andps 0x459c(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51184,7 +51660,7 @@ _sk_mirror_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5e0a <_sk_mirror_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5f89 <_sk_mirror_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51193,13 +51669,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 243,15,89,177,42,74,0,0 ; mulss 0x4a2a(%ecx),%xmm6
+ DB 243,15,89,177,155,74,0,0 ; mulss 0x4a9b(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,182,68,0,0 ; andps 0x44b6(%ecx),%xmm6
+ DB 15,84,177,39,69,0,0 ; andps 0x4527(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51228,12 +51704,12 @@ _sk_clamp_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5e8f <_sk_clamp_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 600e <_sk_clamp_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,93,160,65,68,0,0 ; minps 0x4441(%eax),%xmm4
+ DB 15,93,160,178,68,0,0 ; minps 0x44b2(%eax),%xmm4
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -51249,14 +51725,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5ebf <_sk_repeat_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 603e <_sk_repeat_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 243,15,91,224 ; cvttps2dq %xmm0,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,84,168,33,68,0,0 ; andps 0x4421(%eax),%xmm5
+ DB 15,84,168,146,68,0,0 ; andps 0x4492(%eax),%xmm5
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -51273,17 +51749,17 @@ _sk_mirror_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5efa <_sk_mirror_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6079 <_sk_mirror_x_1_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,161,246,67,0,0 ; movaps 0x43f6(%ecx),%xmm4
+ DB 15,40,161,103,68,0,0 ; movaps 0x4467(%ecx),%xmm4
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,169,6,68,0,0 ; movaps 0x4406(%ecx),%xmm5
+ DB 15,40,169,119,68,0,0 ; movaps 0x4477(%ecx),%xmm5
DB 15,89,232 ; mulps %xmm0,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,169,22,68,0,0 ; andps 0x4416(%ecx),%xmm5
+ DB 15,84,169,135,68,0,0 ; andps 0x4487(%ecx),%xmm5
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,88,246 ; addps %xmm6,%xmm6
@@ -51306,13 +51782,13 @@ _sk_luminance_to_alpha_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 5f58 <_sk_luminance_to_alpha_sse2+0xe>
+ DB 232,0,0,0,0 ; call 60d7 <_sk_luminance_to_alpha_sse2+0xe>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,128,200,67,0,0 ; mulps 0x43c8(%eax),%xmm0
- DB 15,89,136,216,67,0,0 ; mulps 0x43d8(%eax),%xmm1
+ DB 15,89,128,57,68,0,0 ; mulps 0x4439(%eax),%xmm0
+ DB 15,89,136,73,68,0,0 ; mulps 0x4449(%eax),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,152,232,67,0,0 ; mulps 0x43e8(%eax),%xmm3
+ DB 15,89,152,89,68,0,0 ; mulps 0x4459(%eax),%xmm3
DB 15,88,217 ; addps %xmm1,%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -51686,7 +52162,7 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 63f5 <_sk_evenly_spaced_gradient_sse2+0x12>
+ DB 232,0,0,0,0 ; call 6574 <_sk_evenly_spaced_gradient_sse2+0x12>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -51697,12 +52173,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 78 ; dec %esi
DB 102,15,110,206 ; movd %esi,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
- DB 102,15,111,146,91,63,0,0 ; movdqa 0x3f5b(%edx),%xmm2
+ DB 102,15,111,146,204,63,0,0 ; movdqa 0x3fcc(%edx),%xmm2
DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,235,146,107,63,0,0 ; por 0x3f6b(%edx),%xmm2
+ DB 102,15,235,146,220,63,0,0 ; por 0x3fdc(%edx),%xmm2
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
- DB 102,15,235,138,123,63,0,0 ; por 0x3f7b(%edx),%xmm1
- DB 15,88,138,139,63,0,0 ; addps 0x3f8b(%edx),%xmm1
+ DB 102,15,235,138,236,63,0,0 ; por 0x3fec(%edx),%xmm1
+ DB 15,88,138,252,63,0,0 ; addps 0x3ffc(%edx),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -51807,18 +52283,18 @@ _sk_gauss_a_to_rgba_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 65ab <_sk_gauss_a_to_rgba_sse2+0xb>
+ DB 232,0,0,0,0 ; call 672a <_sk_gauss_a_to_rgba_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,128,229,61,0,0 ; movaps 0x3de5(%eax),%xmm0
+ DB 15,40,128,86,62,0,0 ; movaps 0x3e56(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,245,61,0,0 ; addps 0x3df5(%eax),%xmm0
+ DB 15,88,128,102,62,0,0 ; addps 0x3e66(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,5,62,0,0 ; addps 0x3e05(%eax),%xmm0
+ DB 15,88,128,118,62,0,0 ; addps 0x3e76(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,21,62,0,0 ; addps 0x3e15(%eax),%xmm0
+ DB 15,88,128,134,62,0,0 ; addps 0x3e86(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,37,62,0,0 ; addps 0x3e25(%eax),%xmm0
+ DB 15,88,128,150,62,0,0 ; addps 0x3e96(%eax),%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,200 ; movaps %xmm0,%xmm1
@@ -51839,7 +52315,7 @@ _sk_gradient_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 6606 <_sk_gradient_sse2+0xe>
+ DB 232,0,0,0,0 ; call 6785 <_sk_gradient_sse2+0xe>
DB 95 ; pop %edi
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
@@ -51848,12 +52324,12 @@ _sk_gradient_sse2 LABEL PROC
DB 139,17 ; mov (%ecx),%edx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,250,2 ; cmp $0x2,%edx
- DB 114,43 ; jb 6648 <_sk_gradient_sse2+0x50>
+ DB 114,43 ; jb 67c7 <_sk_gradient_sse2+0x50>
DB 139,113,36 ; mov 0x24(%ecx),%esi
DB 74 ; dec %edx
DB 131,198,4 ; add $0x4,%esi
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,151,218,61,0,0 ; movaps 0x3dda(%edi),%xmm2
+ DB 15,40,151,75,62,0,0 ; movaps 0x3e4b(%edi),%xmm2
DB 243,15,16,30 ; movss (%esi),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -51861,7 +52337,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 131,198,4 ; add $0x4,%esi
DB 74 ; dec %edx
- DB 117,231 ; jne 662f <_sk_gradient_sse2+0x37>
+ DB 117,231 ; jne 67ae <_sk_gradient_sse2+0x37>
DB 102,15,126,202 ; movd %xmm1,%edx
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,214 ; movd %xmm2,%esi
@@ -52009,7 +52485,7 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 6842 <_sk_xy_to_unit_angle_sse2+0x18>
+ DB 232,0,0,0,0 ; call 69c1 <_sk_xy_to_unit_angle_sse2+0x18>
DB 88 ; pop %eax
DB 15,87,237 ; xorps %xmm5,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
@@ -52024,30 +52500,30 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,94,247 ; divps %xmm7,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,40,128,174,59,0,0 ; movaps 0x3bae(%eax),%xmm0
+ DB 15,40,128,31,60,0,0 ; movaps 0x3c1f(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,190,59,0,0 ; addps 0x3bbe(%eax),%xmm0
+ DB 15,88,128,47,60,0,0 ; addps 0x3c2f(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,206,59,0,0 ; addps 0x3bce(%eax),%xmm0
+ DB 15,88,128,63,60,0,0 ; addps 0x3c3f(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,222,59,0,0 ; addps 0x3bde(%eax),%xmm0
+ DB 15,88,128,79,60,0,0 ; addps 0x3c4f(%eax),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,40,176,238,59,0,0 ; movaps 0x3bee(%eax),%xmm6
+ DB 15,40,176,95,60,0,0 ; movaps 0x3c5f(%eax),%xmm6
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,84,245 ; andps %xmm5,%xmm6
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,86,238 ; orps %xmm6,%xmm5
DB 15,194,204,1 ; cmpltps %xmm4,%xmm1
- DB 15,40,128,254,59,0,0 ; movaps 0x3bfe(%eax),%xmm0
+ DB 15,40,128,111,60,0,0 ; movaps 0x3c6f(%eax),%xmm0
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,205 ; andnps %xmm5,%xmm1
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
- DB 15,40,168,14,60,0,0 ; movaps 0x3c0e(%eax),%xmm5
+ DB 15,40,168,127,60,0,0 ; movaps 0x3c7f(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,193 ; andnps %xmm1,%xmm0
@@ -52104,15 +52580,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 695f <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ DB 232,0,0,0,0 ; call 6ade <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,1,59,0,0 ; mulps 0x3b01(%edx),%xmm4
- DB 15,89,130,17,59,0,0 ; mulps 0x3b11(%edx),%xmm0
+ DB 15,89,162,114,59,0,0 ; mulps 0x3b72(%edx),%xmm4
+ DB 15,89,130,130,59,0,0 ; mulps 0x3b82(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -52120,11 +52596,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,33,59,0,0 ; xorps 0x3b21(%edx),%xmm4
+ DB 15,87,162,146,59,0,0 ; xorps 0x3b92(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,49,59,0,0 ; mulps 0x3b31(%edx),%xmm5
+ DB 15,89,170,162,59,0,0 ; mulps 0x3ba2(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,95,196 ; maxps %xmm4,%xmm0
@@ -52153,15 +52629,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 69fd <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ DB 232,0,0,0,0 ; call 6b7c <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,163,58,0,0 ; mulps 0x3aa3(%edx),%xmm4
- DB 15,89,130,179,58,0,0 ; mulps 0x3ab3(%edx),%xmm0
+ DB 15,89,162,20,59,0,0 ; mulps 0x3b14(%edx),%xmm4
+ DB 15,89,130,36,59,0,0 ; mulps 0x3b24(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -52169,11 +52645,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,195,58,0,0 ; xorps 0x3ac3(%edx),%xmm4
+ DB 15,87,162,52,59,0,0 ; xorps 0x3b34(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,211,58,0,0 ; mulps 0x3ad3(%edx),%xmm5
+ DB 15,89,170,68,59,0,0 ; mulps 0x3b44(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
@@ -52191,7 +52667,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 6a75 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6bf4 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -52200,7 +52676,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,169,107,58,0,0 ; mulps 0x3a6b(%ecx),%xmm5
+ DB 15,89,169,220,58,0,0 ; mulps 0x3adc(%ecx),%xmm5
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
@@ -52208,7 +52684,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,228 ; mulss %xmm4,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,129,123,58,0,0 ; xorps 0x3a7b(%ecx),%xmm0
+ DB 15,87,129,236,58,0,0 ; xorps 0x3aec(%ecx),%xmm0
DB 15,94,197 ; divps %xmm5,%xmm0
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
@@ -52276,16 +52752,16 @@ _sk_save_xy_sse2 LABEL PROC
DB 131,236,24 ; sub $0x18,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 6b52 <_sk_save_xy_sse2+0x12>
+ DB 232,0,0,0,0 ; call 6cd1 <_sk_save_xy_sse2+0x12>
DB 88 ; pop %eax
- DB 15,40,160,174,57,0,0 ; movaps 0x39ae(%eax),%xmm4
+ DB 15,40,160,31,58,0,0 ; movaps 0x3a1f(%eax),%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,236 ; addps %xmm4,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,144,190,57,0,0 ; movaps 0x39be(%eax),%xmm2
+ DB 15,40,144,47,58,0,0 ; movaps 0x3a2f(%eax),%xmm2
DB 15,84,250 ; andps %xmm2,%xmm7
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,238 ; subps %xmm6,%xmm5
@@ -52356,15 +52832,15 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6c34 <_sk_bilinear_nx_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6db3 <_sk_bilinear_nx_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,236,56,0,0 ; addps 0x38ec(%eax),%xmm0
- DB 15,40,168,252,56,0,0 ; movaps 0x38fc(%eax),%xmm5
+ DB 15,88,128,93,57,0,0 ; addps 0x395d(%eax),%xmm0
+ DB 15,40,168,109,57,0,0 ; movaps 0x396d(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52383,14 +52859,14 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6c77 <_sk_bilinear_px_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6df6 <_sk_bilinear_px_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,201,56,0,0 ; addps 0x38c9(%eax),%xmm0
+ DB 15,88,128,58,57,0,0 ; addps 0x393a(%eax),%xmm0
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52408,15 +52884,15 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6cb0 <_sk_bilinear_ny_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e2f <_sk_bilinear_ny_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,160,56,0,0 ; addps 0x38a0(%eax),%xmm1
- DB 15,40,168,176,56,0,0 ; movaps 0x38b0(%eax),%xmm5
+ DB 15,88,136,17,57,0,0 ; addps 0x3911(%eax),%xmm1
+ DB 15,40,168,33,57,0,0 ; movaps 0x3921(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52435,14 +52911,14 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6cf4 <_sk_bilinear_py_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e73 <_sk_bilinear_py_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,124,56,0,0 ; addps 0x387c(%eax),%xmm1
+ DB 15,88,136,237,56,0,0 ; addps 0x38ed(%eax),%xmm1
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52460,20 +52936,20 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6d2e <_sk_bicubic_n3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6ead <_sk_bicubic_n3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,82,56,0,0 ; addps 0x3852(%eax),%xmm0
- DB 15,40,168,98,56,0,0 ; movaps 0x3862(%eax),%xmm5
+ DB 15,88,128,195,56,0,0 ; addps 0x38c3(%eax),%xmm0
+ DB 15,40,168,211,56,0,0 ; movaps 0x38d3(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,114,56,0,0 ; mulps 0x3872(%eax),%xmm5
- DB 15,88,168,130,56,0,0 ; addps 0x3882(%eax),%xmm5
+ DB 15,89,168,227,56,0,0 ; mulps 0x38e3(%eax),%xmm5
+ DB 15,88,168,243,56,0,0 ; addps 0x38f3(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52492,23 +52968,23 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6d88 <_sk_bicubic_n1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6f07 <_sk_bicubic_n1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,56,56,0,0 ; addps 0x3838(%eax),%xmm0
- DB 15,40,168,72,56,0,0 ; movaps 0x3848(%eax),%xmm5
+ DB 15,88,128,169,56,0,0 ; addps 0x38a9(%eax),%xmm0
+ DB 15,40,168,185,56,0,0 ; movaps 0x38b9(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,88,56,0,0 ; movaps 0x3858(%eax),%xmm4
+ DB 15,40,160,201,56,0,0 ; movaps 0x38c9(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,104,56,0,0 ; addps 0x3868(%eax),%xmm4
+ DB 15,88,160,217,56,0,0 ; addps 0x38d9(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,120,56,0,0 ; addps 0x3878(%eax),%xmm4
+ DB 15,88,160,233,56,0,0 ; addps 0x38e9(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,136,56,0,0 ; addps 0x3888(%eax),%xmm4
+ DB 15,88,160,249,56,0,0 ; addps 0x38f9(%eax),%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52526,22 +53002,22 @@ _sk_bicubic_p1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6df0 <_sk_bicubic_p1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6f6f <_sk_bicubic_p1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,48,56,0,0 ; movaps 0x3830(%eax),%xmm4
+ DB 15,40,160,161,56,0,0 ; movaps 0x38a1(%eax),%xmm4
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,110,64 ; movups 0x40(%esi),%xmm5
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,176,64,56,0,0 ; movaps 0x3840(%eax),%xmm6
+ DB 15,40,176,177,56,0,0 ; movaps 0x38b1(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,80,56,0,0 ; addps 0x3850(%eax),%xmm6
+ DB 15,88,176,193,56,0,0 ; addps 0x38c1(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,96,56,0,0 ; addps 0x3860(%eax),%xmm6
+ DB 15,88,176,209,56,0,0 ; addps 0x38d1(%eax),%xmm6
DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52559,18 +53035,18 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6e4d <_sk_bicubic_p3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6fcc <_sk_bicubic_p3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,19,56,0,0 ; addps 0x3813(%eax),%xmm0
+ DB 15,88,128,132,56,0,0 ; addps 0x3884(%eax),%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,35,56,0,0 ; mulps 0x3823(%eax),%xmm4
- DB 15,88,160,51,56,0,0 ; addps 0x3833(%eax),%xmm4
+ DB 15,89,160,148,56,0,0 ; mulps 0x3894(%eax),%xmm4
+ DB 15,88,160,164,56,0,0 ; addps 0x38a4(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52589,20 +53065,20 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6e9d <_sk_bicubic_n3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 701c <_sk_bicubic_n3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,243,55,0,0 ; addps 0x37f3(%eax),%xmm1
- DB 15,40,168,3,56,0,0 ; movaps 0x3803(%eax),%xmm5
+ DB 15,88,136,100,56,0,0 ; addps 0x3864(%eax),%xmm1
+ DB 15,40,168,116,56,0,0 ; movaps 0x3874(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,19,56,0,0 ; mulps 0x3813(%eax),%xmm5
- DB 15,88,168,35,56,0,0 ; addps 0x3823(%eax),%xmm5
+ DB 15,89,168,132,56,0,0 ; mulps 0x3884(%eax),%xmm5
+ DB 15,88,168,148,56,0,0 ; addps 0x3894(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52621,23 +53097,23 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6ef8 <_sk_bicubic_n1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 7077 <_sk_bicubic_n1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,216,55,0,0 ; addps 0x37d8(%eax),%xmm1
- DB 15,40,168,232,55,0,0 ; movaps 0x37e8(%eax),%xmm5
+ DB 15,88,136,73,56,0,0 ; addps 0x3849(%eax),%xmm1
+ DB 15,40,168,89,56,0,0 ; movaps 0x3859(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,248,55,0,0 ; movaps 0x37f8(%eax),%xmm4
+ DB 15,40,160,105,56,0,0 ; movaps 0x3869(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,8,56,0,0 ; addps 0x3808(%eax),%xmm4
+ DB 15,88,160,121,56,0,0 ; addps 0x3879(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,24,56,0,0 ; addps 0x3818(%eax),%xmm4
+ DB 15,88,160,137,56,0,0 ; addps 0x3889(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,40,56,0,0 ; addps 0x3828(%eax),%xmm4
+ DB 15,88,160,153,56,0,0 ; addps 0x3899(%eax),%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52655,22 +53131,22 @@ _sk_bicubic_p1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6f61 <_sk_bicubic_p1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 70e0 <_sk_bicubic_p1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,207,55,0,0 ; movaps 0x37cf(%eax),%xmm4
+ DB 15,40,160,64,56,0,0 ; movaps 0x3840(%eax),%xmm4
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,110,96 ; movups 0x60(%esi),%xmm5
DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,176,223,55,0,0 ; movaps 0x37df(%eax),%xmm6
+ DB 15,40,176,80,56,0,0 ; movaps 0x3850(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,239,55,0,0 ; addps 0x37ef(%eax),%xmm6
+ DB 15,88,176,96,56,0,0 ; addps 0x3860(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,255,55,0,0 ; addps 0x37ff(%eax),%xmm6
+ DB 15,88,176,112,56,0,0 ; addps 0x3870(%eax),%xmm6
DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52688,18 +53164,18 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6fbf <_sk_bicubic_p3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 713e <_sk_bicubic_p3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,177,55,0,0 ; addps 0x37b1(%eax),%xmm1
+ DB 15,88,136,34,56,0,0 ; addps 0x3822(%eax),%xmm1
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,193,55,0,0 ; mulps 0x37c1(%eax),%xmm4
- DB 15,88,160,209,55,0,0 ; addps 0x37d1(%eax),%xmm4
+ DB 15,89,160,50,56,0,0 ; mulps 0x3832(%eax),%xmm4
+ DB 15,88,160,66,56,0,0 ; addps 0x3842(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52840,7 +53316,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,98,233 ; punpckldq %xmm1,%xmm5
DB 102,15,127,173,104,255,255,255 ; movdqa %xmm5,-0x98(%ebp)
- DB 232,0,0,0,0 ; call 71b3 <_sk_clut_3D_sse2+0xff>
+ DB 232,0,0,0,0 ; call 7332 <_sk_clut_3D_sse2+0xff>
DB 90 ; pop %edx
DB 243,15,91,196 ; cvttps2dq %xmm4,%xmm0
DB 102,15,127,133,232,254,255,255 ; movdqa %xmm0,-0x118(%ebp)
@@ -52849,7 +53325,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,254,202 ; paddd %xmm2,%xmm1
- DB 102,15,111,130,253,53,0,0 ; movdqa 0x35fd(%edx),%xmm0
+ DB 102,15,111,130,110,54,0,0 ; movdqa 0x366e(%edx),%xmm0
DB 102,15,127,133,88,255,255,255 ; movdqa %xmm0,-0xa8(%ebp)
DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
@@ -52873,7 +53349,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
- DB 102,15,111,130,13,54,0,0 ; movdqa 0x360d(%edx),%xmm0
+ DB 102,15,111,130,126,54,0,0 ; movdqa 0x367e(%edx),%xmm0
DB 102,15,127,133,72,255,255,255 ; movdqa %xmm0,-0xb8(%ebp)
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,224 ; paddd %xmm0,%xmm4
@@ -52891,7 +53367,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
DB 15,20,252 ; unpcklps %xmm4,%xmm7
DB 15,20,248 ; unpcklps %xmm0,%xmm7
- DB 102,15,111,130,29,54,0,0 ; movdqa 0x361d(%edx),%xmm0
+ DB 102,15,111,130,142,54,0,0 ; movdqa 0x368e(%edx),%xmm0
DB 102,15,127,69,216 ; movdqa %xmm0,-0x28(%ebp)
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0
@@ -52908,7 +53384,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
DB 15,20,232 ; unpcklps %xmm0,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,130,237,53,0,0 ; movaps 0x35ed(%edx),%xmm0
+ DB 15,40,130,94,54,0,0 ; movaps 0x365e(%edx),%xmm0
DB 15,88,240 ; addps %xmm0,%xmm6
DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
DB 15,40,141,56,255,255,255 ; movaps -0xc8(%ebp),%xmm1
@@ -53519,7 +53995,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,98,209 ; punpckldq %xmm1,%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
- DB 232,0,0,0,0 ; call 7d29 <_sk_clut_4D_sse2+0x179>
+ DB 232,0,0,0,0 ; call 7ea8 <_sk_clut_4D_sse2+0x179>
DB 89 ; pop %ecx
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,41,165,120,254,255,255 ; movaps %xmm4,-0x188(%ebp)
@@ -53532,7 +54008,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,15,254,206 ; paddd %xmm6,%xmm1
- DB 102,15,111,153,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm3
+ DB 102,15,111,153,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm3
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
@@ -53555,7 +54031,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 102,15,111,153,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm3
+ DB 102,15,111,153,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
@@ -53573,7 +54049,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 15,20,213 ; unpcklps %xmm5,%xmm2
DB 15,41,149,136,254,255,255 ; movaps %xmm2,-0x178(%ebp)
- DB 102,15,254,137,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm1
+ DB 102,15,254,137,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm1
DB 102,15,112,233,229 ; pshufd $0xe5,%xmm1,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
@@ -53589,7 +54065,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,207 ; unpcklps %xmm7,%xmm1
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,41,141,152,254,255,255 ; movaps %xmm1,-0x168(%ebp)
- DB 15,40,185,183,42,0,0 ; movaps 0x2ab7(%ecx),%xmm7
+ DB 15,40,185,40,43,0,0 ; movaps 0x2b28(%ecx),%xmm7
DB 15,88,231 ; addps %xmm7,%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,40,141,232,254,255,255 ; movaps -0x118(%ebp),%xmm1
@@ -53610,7 +54086,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp)
DB 102,15,254,241 ; paddd %xmm1,%xmm6
DB 102,15,112,254,245 ; pshufd $0xf5,%xmm6,%xmm7
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,241 ; pmuludq %xmm1,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,249 ; pmuludq %xmm1,%xmm7
@@ -53647,7 +54123,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,217 ; unpcklps %xmm1,%xmm3
- DB 102,15,111,177,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm6
+ DB 102,15,111,177,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -53695,7 +54171,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,254,77,168 ; paddd -0x58(%ebp),%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0
+ DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -53717,7 +54193,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,129,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm0
+ DB 102,15,111,129,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm0
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
@@ -53753,7 +54229,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,184 ; paddd -0x48(%ebp),%xmm0
DB 102,15,112,216,245 ; pshufd $0xf5,%xmm0,%xmm3
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,217 ; pmuludq %xmm1,%xmm3
@@ -53789,7 +54265,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,224 ; unpcklps %xmm0,%xmm4
DB 15,20,227 ; unpcklps %xmm3,%xmm4
- DB 102,15,111,153,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm3
+ DB 102,15,111,153,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
@@ -53853,7 +54329,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2
+ DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -53875,7 +54351,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,214 ; unpcklps %xmm6,%xmm2
DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,145,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm2
+ DB 102,15,111,145,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm2
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
@@ -53908,7 +54384,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,254,109,184 ; paddd -0x48(%ebp),%xmm5
DB 102,15,112,245,245 ; pshufd $0xf5,%xmm5,%xmm6
- DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0
+ DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0
DB 102,15,244,232 ; pmuludq %xmm0,%xmm5
DB 102,15,112,253,232 ; pshufd $0xe8,%xmm5,%xmm7
DB 102,15,244,240 ; pmuludq %xmm0,%xmm6
@@ -53944,7 +54420,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,111,153,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm3
+ DB 102,15,111,153,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm3
DB 102,15,254,251 ; paddd %xmm3,%xmm7
DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
@@ -53978,7 +54454,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,177,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm6
+ DB 102,15,111,177,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm6
DB 102,15,244,198 ; pmuludq %xmm6,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,206 ; pmuludq %xmm6,%xmm1
@@ -54000,7 +54476,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,254,137,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm1
+ DB 102,15,254,137,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -54034,7 +54510,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,254,85,184 ; paddd -0x48(%ebp),%xmm2
DB 102,15,112,194,245 ; pshufd $0xf5,%xmm2,%xmm0
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
@@ -54055,7 +54531,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,200 ; unpcklps %xmm0,%xmm1
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
- DB 102,15,254,129,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm0
+ DB 102,15,254,129,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm0
DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
@@ -54070,7 +54546,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,208 ; unpcklps %xmm0,%xmm2
DB 15,20,214 ; unpcklps %xmm6,%xmm2
- DB 102,15,254,161,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm4
+ DB 102,15,254,161,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm4
DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,196,78 ; pshufd $0x4e,%xmm4,%xmm0
@@ -54138,7 +54614,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,69,168 ; movdqa -0x58(%ebp),%xmm0
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,112,224,245 ; pshufd $0xf5,%xmm0,%xmm4
- DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2
+ DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,216,232 ; pshufd $0xe8,%xmm0,%xmm3
DB 102,15,244,226 ; pmuludq %xmm2,%xmm4
@@ -54161,7 +54637,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,145,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm2
+ DB 102,15,111,145,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm2
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -54177,7 +54653,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,236 ; unpcklps %xmm4,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,254,153,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm3
+ DB 102,15,254,153,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm3
DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
@@ -54229,7 +54705,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,223 ; unpcklps %xmm7,%xmm3
- DB 102,15,254,161,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm4
+ DB 102,15,254,161,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm4
DB 102,15,112,212,229 ; pshufd $0xe5,%xmm4,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,212,78 ; pshufd $0x4e,%xmm4,%xmm2
@@ -54262,7 +54738,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,133,56,255,255,255 ; movdqa %xmm0,-0xc8(%ebp)
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,208,245 ; pshufd $0xf5,%xmm0,%xmm2
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,240,232 ; pshufd $0xe8,%xmm0,%xmm6
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
@@ -54284,7 +54760,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,194 ; unpcklps %xmm2,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,214 ; movdqa %xmm6,%xmm2
- DB 102,15,111,153,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm3
+ DB 102,15,111,153,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -54300,7 +54776,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,239 ; unpcklps %xmm7,%xmm5
- DB 102,15,254,177,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm6
+ DB 102,15,254,177,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm6
DB 102,15,112,214,229 ; pshufd $0xe5,%xmm6,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,214,78 ; pshufd $0x4e,%xmm6,%xmm2
@@ -54353,7 +54829,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
- DB 102,15,254,185,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm7
+ DB 102,15,254,185,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm7
DB 102,15,112,199,229 ; pshufd $0xe5,%xmm7,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,199,78 ; pshufd $0x4e,%xmm7,%xmm0
@@ -54403,7 +54879,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,153,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm3
+ DB 102,15,111,153,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm3
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -54425,7 +54901,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,111,177,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm6
+ DB 102,15,111,177,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm6
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -54441,7 +54917,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,203 ; unpcklps %xmm3,%xmm1
- DB 102,15,111,185,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm7
+ DB 102,15,111,185,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -54460,7 +54936,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,221 ; movdqa %xmm5,%xmm3
DB 102,15,254,93,184 ; paddd -0x48(%ebp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0
+ DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -54529,7 +55005,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2
+ DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -54552,7 +55028,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,137,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm1
+ DB 102,15,254,137,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm1
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
@@ -54568,7 +55044,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,217 ; unpcklps %xmm1,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
- DB 102,15,254,129,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm0
+ DB 102,15,254,129,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -54605,7 +55081,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,177,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm6
+ DB 102,15,111,177,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm6
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,229 ; pshufd $0xe5,%xmm6,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -54621,7 +55097,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,52,178 ; movss (%edx,%esi,4),%xmm6
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,145,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm2
+ DB 102,15,254,145,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm2
DB 102,15,112,242,229 ; pshufd $0xe5,%xmm2,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
@@ -54691,7 +55167,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 139,117,12 ; mov 0xc(%ebp),%esi
DB 141,86,8 ; lea 0x8(%esi),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,247,42,0,0 ; movaps 0x2af7(%ecx),%xmm3
+ DB 15,40,153,104,43,0,0 ; movaps 0x2b68(%ecx),%xmm3
DB 82 ; push %edx
DB 80 ; push %eax
DB 255,86,4 ; call *0x4(%esi)
@@ -54852,16 +55328,22 @@ ALIGN 16
DB 63 ; aas
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
- DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%eax)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
+ DB 63 ; aas
+ DB 0,0 ; add %al,(%eax)
+ DB 128,63,0 ; cmpb $0x0,(%edi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
DB 191,0,0,128,191 ; mov $0xbf800000,%edi
DB 0,0 ; add %al,(%eax)
- DB 128,191,0,0,224,64,0 ; cmpb $0x0,0x40e00000(%edi)
+ DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%edi)
DB 0,224 ; add %ah,%al
DB 64 ; inc %eax
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 938c <.literal16+0x1fc>
+ DB 224,64 ; loopne 9518 <.literal16+0x208>
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 9390 <.literal16+0x200>
+ DB 224,64 ; loopne 951c <.literal16+0x20c>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,64 ; loopne 9520 <.literal16+0x210>
DB 154,153,153,62,154,153,153 ; lcall $0x9999,$0x9a3e9999
DB 62,154,153,153,62,154,153,153 ; ds lcall $0x9999,$0x9a3e9999
DB 62,61,10,23,63,61 ; ds cmp $0x3d3f170a,%eax
@@ -54872,16 +55354,16 @@ ALIGN 16
DB 63 ; aas
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93b1 <.literal16+0x221>
+ DB 225,61 ; loope 9541 <.literal16+0x231>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93b5 <.literal16+0x225>
+ DB 225,61 ; loope 9545 <.literal16+0x235>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93b9 <.literal16+0x229>
+ DB 225,61 ; loope 9549 <.literal16+0x239>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93bd <.literal16+0x22d>
+ DB 225,61 ; loope 954d <.literal16+0x23d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54898,16 +55380,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 93f1 <.literal16+0x261>
+ DB 225,61 ; loope 9581 <.literal16+0x271>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93f5 <.literal16+0x265>
+ DB 225,61 ; loope 9585 <.literal16+0x275>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93f9 <.literal16+0x269>
+ DB 225,61 ; loope 9589 <.literal16+0x279>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93fd <.literal16+0x26d>
+ DB 225,61 ; loope 958d <.literal16+0x27d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54924,16 +55406,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 9431 <.literal16+0x2a1>
+ DB 225,61 ; loope 95c1 <.literal16+0x2b1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9435 <.literal16+0x2a5>
+ DB 225,61 ; loope 95c5 <.literal16+0x2b5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9439 <.literal16+0x2a9>
+ DB 225,61 ; loope 95c9 <.literal16+0x2b9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 943d <.literal16+0x2ad>
+ DB 225,61 ; loope 95cd <.literal16+0x2bd>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54950,16 +55432,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 9471 <.literal16+0x2e1>
+ DB 225,61 ; loope 9601 <.literal16+0x2f1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9475 <.literal16+0x2e5>
+ DB 225,61 ; loope 9605 <.literal16+0x2f5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9479 <.literal16+0x2e9>
+ DB 225,61 ; loope 9609 <.literal16+0x2f9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 947d <.literal16+0x2ed>
+ DB 225,61 ; loope 960d <.literal16+0x2fd>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54981,11 +55463,11 @@ ALIGN 16
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%eax)
DB 67 ; inc %ebx
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 94bb <.literal16+0x32b>
+ DB 127,67 ; jg 964b <.literal16+0x33b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 94bf <.literal16+0x32f>
+ DB 127,67 ; jg 964f <.literal16+0x33f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 94c3 <.literal16+0x333>
+ DB 127,67 ; jg 9653 <.literal16+0x343>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55235,7 +55717,53 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax)
DB 128,59,129 ; cmpb $0x81,(%ebx)
- DB 128,128,59,255,0,0,0 ; addb $0x0,0xff3b(%eax)
+ DB 128,128,59,0,248,0,0 ; addb $0x0,0xf8003b(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 224,7 ; loopne 9889 <.literal16+0x579>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,7 ; loopne 988d <.literal16+0x57d>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,7 ; loopne 9891 <.literal16+0x581>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,7 ; loopne 9895 <.literal16+0x585>
+ DB 0,0 ; add %al,(%eax)
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 31 ; pop %ds
+ DB 0,0 ; add %al,(%eax)
+ DB 0,31 ; add %bl,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,31 ; add %bl,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,31 ; add %bl,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,8 ; add %cl,(%eax)
+ DB 33,4,61,8,33,4,61 ; and %eax,0x3d042108(,%edi,1)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 4,61 ; add $0x3d,%al
+ DB 8,33 ; or %ah,(%ecx)
+ DB 4,61 ; add $0x3d,%al
+ DB 255,0 ; incl (%eax)
+ DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -55259,13 +55787,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9719 <.literal16+0x589>
+ DB 224,7 ; loopne 9909 <.literal16+0x5f9>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 971d <.literal16+0x58d>
+ DB 224,7 ; loopne 990d <.literal16+0x5fd>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9721 <.literal16+0x591>
+ DB 224,7 ; loopne 9911 <.literal16+0x601>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9725 <.literal16+0x595>
+ DB 224,7 ; loopne 9915 <.literal16+0x605>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -55314,11 +55842,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97db <.literal16+0x64b>
+ DB 127,67 ; jg 99cb <.literal16+0x6bb>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97df <.literal16+0x64f>
+ DB 127,67 ; jg 99cf <.literal16+0x6bf>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97e3 <.literal16+0x653>
+ DB 127,67 ; jg 99d3 <.literal16+0x6c3>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax)
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%eax)
@@ -55333,16 +55861,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 97d4 <.literal16+0x644>
+ DB 127,0 ; jg 99c4 <.literal16+0x6b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97d8 <.literal16+0x648>
+ DB 127,0 ; jg 99c8 <.literal16+0x6b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97dc <.literal16+0x64c>
+ DB 127,0 ; jg 99cc <.literal16+0x6bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97e0 <.literal16+0x650>
+ DB 127,0 ; jg 99d0 <.literal16+0x6c0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55351,7 +55879,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9865 <.literal16+0x6d5>
+ DB 119,115 ; ja 9a55 <.literal16+0x745>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55362,7 +55890,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 97c9 <.literal16+0x639>
+ DB 117,191 ; jne 99b9 <.literal16+0x6a9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55378,7 +55906,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d806 <_sk_clut_4D_sse2+0xe9a35c56>
+ DB 233,220,63,163,233 ; jmp e9a3d9f6 <_sk_clut_4D_sse2+0xe9a35cc7>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55433,16 +55961,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 98a4 <.literal16+0x714>
+ DB 127,0 ; jg 9a94 <.literal16+0x784>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 98a8 <.literal16+0x718>
+ DB 127,0 ; jg 9a98 <.literal16+0x788>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 98ac <.literal16+0x71c>
+ DB 127,0 ; jg 9a9c <.literal16+0x78c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 98b0 <.literal16+0x720>
+ DB 127,0 ; jg 9aa0 <.literal16+0x790>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55451,7 +55979,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9935 <.literal16+0x7a5>
+ DB 119,115 ; ja 9b25 <.literal16+0x815>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55462,7 +55990,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9899 <.literal16+0x709>
+ DB 117,191 ; jne 9a89 <.literal16+0x779>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55478,7 +56006,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d8d6 <_sk_clut_4D_sse2+0xe9a35d26>
+ DB 233,220,63,163,233 ; jmp e9a3dac6 <_sk_clut_4D_sse2+0xe9a35d97>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55533,16 +56061,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9974 <.literal16+0x7e4>
+ DB 127,0 ; jg 9b64 <.literal16+0x854>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9978 <.literal16+0x7e8>
+ DB 127,0 ; jg 9b68 <.literal16+0x858>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 997c <.literal16+0x7ec>
+ DB 127,0 ; jg 9b6c <.literal16+0x85c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9980 <.literal16+0x7f0>
+ DB 127,0 ; jg 9b70 <.literal16+0x860>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55551,7 +56079,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9a05 <.literal16+0x875>
+ DB 119,115 ; ja 9bf5 <.literal16+0x8e5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55562,7 +56090,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9969 <.literal16+0x7d9>
+ DB 117,191 ; jne 9b59 <.literal16+0x849>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55578,7 +56106,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d9a6 <_sk_clut_4D_sse2+0xe9a35df6>
+ DB 233,220,63,163,233 ; jmp e9a3db96 <_sk_clut_4D_sse2+0xe9a35e67>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55633,16 +56161,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9a44 <.literal16+0x8b4>
+ DB 127,0 ; jg 9c34 <.literal16+0x924>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a48 <.literal16+0x8b8>
+ DB 127,0 ; jg 9c38 <.literal16+0x928>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a4c <.literal16+0x8bc>
+ DB 127,0 ; jg 9c3c <.literal16+0x92c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a50 <.literal16+0x8c0>
+ DB 127,0 ; jg 9c40 <.literal16+0x930>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55651,7 +56179,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9ad5 <.literal16+0x945>
+ DB 119,115 ; ja 9cc5 <.literal16+0x9b5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55662,7 +56190,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9a39 <.literal16+0x8a9>
+ DB 117,191 ; jne 9c29 <.literal16+0x919>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55678,7 +56206,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3da76 <_sk_clut_4D_sse2+0xe9a35ec6>
+ DB 233,220,63,163,233 ; jmp e9a3dc66 <_sk_clut_4D_sse2+0xe9a35f37>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55733,16 +56261,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9b14 <.literal16+0x984>
+ DB 127,0 ; jg 9d04 <.literal16+0x9f4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9b18 <.literal16+0x988>
+ DB 127,0 ; jg 9d08 <.literal16+0x9f8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9b1c <.literal16+0x98c>
+ DB 127,0 ; jg 9d0c <.literal16+0x9fc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9b20 <.literal16+0x990>
+ DB 127,0 ; jg 9d10 <.literal16+0xa00>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55751,7 +56279,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9ba5 <.literal16+0xa15>
+ DB 119,115 ; ja 9d95 <.literal16+0xa85>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55762,7 +56290,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9b09 <.literal16+0x979>
+ DB 117,191 ; jne 9cf9 <.literal16+0x9e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55778,7 +56306,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3db46 <_sk_clut_4D_sse2+0xe9a35f96>
+ DB 233,220,63,163,233 ; jmp e9a3dd36 <_sk_clut_4D_sse2+0xe9a36007>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55829,13 +56357,13 @@ ALIGN 16
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
- DB 127,67 ; jg 9c27 <.literal16+0xa97>
+ DB 127,67 ; jg 9e17 <.literal16+0xb07>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c2b <.literal16+0xa9b>
+ DB 127,67 ; jg 9e1b <.literal16+0xb0b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c2f <.literal16+0xa9f>
+ DB 127,67 ; jg 9e1f <.literal16+0xb0f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c33 <.literal16+0xaa3>
+ DB 127,67 ; jg 9e23 <.literal16+0xb13>
DB 0,0 ; add %al,(%eax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%eax)
@@ -55886,16 +56414,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%ebx)
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cb3 <.literal16+0xb23>
+ DB 118,63 ; jbe 9ea3 <.literal16+0xb93>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cb7 <.literal16+0xb27>
+ DB 118,63 ; jbe 9ea7 <.literal16+0xb97>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cbb <.literal16+0xb2b>
+ DB 118,63 ; jbe 9eab <.literal16+0xb9b>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cbf <.literal16+0xb2f>
+ DB 118,63 ; jbe 9eaf <.literal16+0xb9f>
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
@@ -55924,11 +56452,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%ebx)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9d2b <.literal16+0xb9b>
+ DB 127,67 ; jg 9f1b <.literal16+0xc0b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9d2f <.literal16+0xb9f>
+ DB 127,67 ; jg 9f1f <.literal16+0xc0f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9d33 <.literal16+0xba3>
+ DB 127,67 ; jg 9f23 <.literal16+0xc13>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 0,0 ; add %al,(%eax)
@@ -55990,13 +56518,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9da9 <.literal16+0xc19>
+ DB 224,7 ; loopne 9f99 <.literal16+0xc89>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9dad <.literal16+0xc1d>
+ DB 224,7 ; loopne 9f9d <.literal16+0xc8d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9db1 <.literal16+0xc21>
+ DB 224,7 ; loopne 9fa1 <.literal16+0xc91>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9db5 <.literal16+0xc25>
+ DB 224,7 ; loopne 9fa5 <.literal16+0xc95>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -56042,13 +56570,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9e19 <.literal16+0xc89>
+ DB 224,7 ; loopne a009 <.literal16+0xcf9>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e1d <.literal16+0xc8d>
+ DB 224,7 ; loopne a00d <.literal16+0xcfd>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e21 <.literal16+0xc91>
+ DB 224,7 ; loopne a011 <.literal16+0xd01>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e25 <.literal16+0xc95>
+ DB 224,7 ; loopne a015 <.literal16+0xd05>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -56094,13 +56622,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9e89 <.literal16+0xcf9>
+ DB 224,7 ; loopne a079 <.literal16+0xd69>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e8d <.literal16+0xcfd>
+ DB 224,7 ; loopne a07d <.literal16+0xd6d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e91 <.literal16+0xd01>
+ DB 224,7 ; loopne a081 <.literal16+0xd71>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e95 <.literal16+0xd05>
+ DB 224,7 ; loopne a085 <.literal16+0xd75>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -56142,13 +56670,13 @@ ALIGN 16
DB 248 ; clc
DB 65 ; inc %ecx
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f26 <.literal16+0xd96>
+ DB 124,66 ; jl a116 <.literal16+0xe06>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f2a <.literal16+0xd9a>
+ DB 124,66 ; jl a11a <.literal16+0xe0a>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f2e <.literal16+0xd9e>
+ DB 124,66 ; jl a11e <.literal16+0xe0e>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f32 <.literal16+0xda2>
+ DB 124,66 ; jl a122 <.literal16+0xe12>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%eax)
DB 0,240 ; add %dh,%al
@@ -56282,13 +56810,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%eax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0b5 <.literal16+0xf25>
+ DB 112,65 ; jo a2a5 <.literal16+0xf95>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0b9 <.literal16+0xf29>
+ DB 112,65 ; jo a2a9 <.literal16+0xf99>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0bd <.literal16+0xf2d>
+ DB 112,65 ; jo a2ad <.literal16+0xf9d>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0c1 <.literal16+0xf31>
+ DB 112,65 ; jo a2b1 <.literal16+0xfa1>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -56319,11 +56847,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a12b <.literal16+0xf9b>
+ DB 127,67 ; jg a31b <.literal16+0x100b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a12f <.literal16+0xf9f>
+ DB 127,67 ; jg a31f <.literal16+0x100f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a133 <.literal16+0xfa3>
+ DB 127,67 ; jg a323 <.literal16+0x1013>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -56354,11 +56882,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a19b <.literal16+0x100b>
+ DB 127,67 ; jg a38b <.literal16+0x107b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a19f <.literal16+0x100f>
+ DB 127,67 ; jg a38f <.literal16+0x107f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a1a3 <.literal16+0x1013>
+ DB 127,67 ; jg a393 <.literal16+0x1083>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
DB 0,0 ; add %al,(%eax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
@@ -56457,13 +56985,13 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 255 ; (bad)
- DB 127,71 ; jg a2cb <.literal16+0x113b>
+ DB 127,71 ; jg a4bb <.literal16+0x11ab>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a2cf <.literal16+0x113f>
+ DB 127,71 ; jg a4bf <.literal16+0x11af>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a2d3 <.literal16+0x1143>
+ DB 127,71 ; jg a4c3 <.literal16+0x11b3>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a2d7 <.literal16+0x1147>
+ DB 127,71 ; jg a4c7 <.literal16+0x11b7>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -56571,7 +57099,7 @@ ALIGN 16
DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js a3dc <.literal16+0x124c>
+ DB 120,57 ; js a5cc <.literal16+0x12bc>
DB 64 ; inc %eax
DB 18,120,57 ; adc 0x39(%eax),%bh
DB 64 ; inc %eax
@@ -56764,11 +57292,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt a5c2 <.literal16+0x1432>
+ DB 62,114,28 ; jb,pt a7b2 <.literal16+0x14a2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a5c6 <.literal16+0x1436>
+ DB 62,114,28 ; jb,pt a7b6 <.literal16+0x14a6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a5ca <.literal16+0x143a>
+ DB 62,114,28 ; jb,pt a7ba <.literal16+0x14aa>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56847,13 +57375,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb a68e <.literal16+0x14fe>
+ DB 114,28 ; jb a87e <.literal16+0x156e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a692 <.literal16+0x1502>
+ DB 62,114,28 ; jb,pt a882 <.literal16+0x1572>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a696 <.literal16+0x1506>
+ DB 62,114,28 ; jb,pt a886 <.literal16+0x1576>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a69a <.literal16+0x150a>
+ DB 62,114,28 ; jb,pt a88a <.literal16+0x157a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56874,11 +57402,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt a6d2 <.literal16+0x1542>
+ DB 62,114,28 ; jb,pt a8c2 <.literal16+0x15b2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a6d6 <.literal16+0x1546>
+ DB 62,114,28 ; jb,pt a8c6 <.literal16+0x15b6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a6da <.literal16+0x154a>
+ DB 62,114,28 ; jb,pt a8ca <.literal16+0x15ba>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56957,13 +57485,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb a79e <.literal16+0x160e>
+ DB 114,28 ; jb a98e <.literal16+0x167e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a7a2 <.literal16+0x1612>
+ DB 62,114,28 ; jb,pt a992 <.literal16+0x1682>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a7a6 <.literal16+0x1616>
+ DB 62,114,28 ; jb,pt a996 <.literal16+0x1686>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a7aa <.literal16+0x161a>
+ DB 62,114,28 ; jb,pt a99a <.literal16+0x168a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56973,14 +57501,14 @@ ALIGN 16
DB 170 ; stos %al,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
DB 190,171,170,170,190 ; mov $0xbeaaaaab,%esi
- DB 114,249 ; jb a79b <.literal16+0x160b>
- DB 127,63 ; jg a7e3 <.literal16+0x1653>
- DB 114,249 ; jb a79f <.literal16+0x160f>
- DB 127,63 ; jg a7e7 <.literal16+0x1657>
- DB 114,249 ; jb a7a3 <.literal16+0x1613>
- DB 127,63 ; jg a7eb <.literal16+0x165b>
- DB 114,249 ; jb a7a7 <.literal16+0x1617>
- DB 127,63 ; jg a7ef <.literal16+0x165f>
+ DB 114,249 ; jb a98b <.literal16+0x167b>
+ DB 127,63 ; jg a9d3 <.literal16+0x16c3>
+ DB 114,249 ; jb a98f <.literal16+0x167f>
+ DB 127,63 ; jg a9d7 <.literal16+0x16c7>
+ DB 114,249 ; jb a993 <.literal16+0x1683>
+ DB 127,63 ; jg a9db <.literal16+0x16cb>
+ DB 114,249 ; jb a997 <.literal16+0x1687>
+ DB 127,63 ; jg a9df <.literal16+0x16cf>
DB 3,0 ; add (%eax),%eax
DB 0,0 ; add %al,(%eax)
DB 3,0 ; add (%eax),%eax
@@ -57005,14 +57533,14 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 2,0 ; add (%eax),%al
DB 0,0 ; add %al,(%eax)
- DB 114,249 ; jb a7db <.literal16+0x164b>
- DB 127,63 ; jg a823 <.literal16+0x1693>
- DB 114,249 ; jb a7df <.literal16+0x164f>
- DB 127,63 ; jg a827 <.literal16+0x1697>
- DB 114,249 ; jb a7e3 <.literal16+0x1653>
- DB 127,63 ; jg a82b <.literal16+0x169b>
- DB 114,249 ; jb a7e7 <.literal16+0x1657>
- DB 127,63 ; jg a82f <.literal16+0x169f>
+ DB 114,249 ; jb a9cb <.literal16+0x16bb>
+ DB 127,63 ; jg aa13 <.literal16+0x1703>
+ DB 114,249 ; jb a9cf <.literal16+0x16bf>
+ DB 127,63 ; jg aa17 <.literal16+0x1707>
+ DB 114,249 ; jb a9d3 <.literal16+0x16c3>
+ DB 127,63 ; jg aa1b <.literal16+0x170b>
+ DB 114,249 ; jb a9d7 <.literal16+0x16c7>
+ DB 127,63 ; jg aa1f <.literal16+0x170f>
DB 3,0 ; add (%eax),%eax
DB 0,0 ; add %al,(%eax)
DB 3,0 ; add (%eax),%eax
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 23b756e9ed..29651cab7d 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -329,7 +329,7 @@ BLEND_MODE(dstover) { return mad(s, inv(da), d); }
BLEND_MODE(modulate) { return s*d; }
BLEND_MODE(multiply) { return s*inv(da) + d*inv(sa) + s*d; }
-BLEND_MODE(plus_) { return s + d; }
+BLEND_MODE(plus_) { return min(s + d, 1.0f); } // We can clamp to either 1 or sa.
BLEND_MODE(screen) { return s + d - s*d; }
BLEND_MODE(xor_) { return s*inv(da) + d*inv(sa); }
#undef BLEND_MODE
@@ -631,8 +631,8 @@ STAGE(to_srgb) {
}
STAGE(rgb_to_hsl) {
- F mx = max(max(r,g), b),
- mn = min(min(r,g), b),
+ F mx = max(r,g,b),
+ mn = min(r,g,b),
d = mx - mn,
d_rcp = 1.0f / d;
@@ -673,6 +673,12 @@ STAGE(hsl_to_rgb) {
b = if_then_else(s == 0, l, hue_to_rgb(h - (1/3.0f)));
}
+// Derive alpha's coverage from rgb coverage and the values of src and dst alpha.
+SI F alpha_coverage_from_rgb_coverage(F a, F da, F cr, F cg, F cb) {
+ return if_then_else(a < da, min(cr,cg,cb)
+ , max(cr,cg,cb));
+}
+
STAGE(scale_1_float) {
auto c = *(const float*)ctx;
@@ -692,6 +698,19 @@ STAGE(scale_u8) {
b = b * c;
a = a * c;
}
+STAGE(scale_565) {
+ auto ptr = ptr_at_xy<const uint16_t>(ctx, x,y);
+
+ F cr,cg,cb;
+ from_565(load<U16>(ptr, tail), &cr, &cg, &cb);
+
+ F ca = alpha_coverage_from_rgb_coverage(a,da, cr,cg,cb);
+
+ r = r * cr;
+ g = g * cg;
+ b = b * cb;
+ a = a * ca;
+}
SI F lerp(F from, F to, F t) {
return mad(to-from, t, from);
@@ -722,10 +741,12 @@ STAGE(lerp_565) {
F cr,cg,cb;
from_565(load<U16>(ptr, tail), &cr, &cg, &cb);
+ F ca = alpha_coverage_from_rgb_coverage(a,da, cr,cg,cb);
+
r = lerp(dr, r, cr);
g = lerp(dg, g, cg);
b = lerp(db, b, cb);
- a = max(lerp(da, a, cr), lerp(da, a, cg), lerp(da, a, cb));
+ a = lerp(da, a, ca);
}
STAGE(load_tables) {
diff --git a/src/jumper/SkJumper_stages_8bit.cpp b/src/jumper/SkJumper_stages_8bit.cpp
index 5ee3417ece..3e119010e4 100644
--- a/src/jumper/SkJumper_stages_8bit.cpp
+++ b/src/jumper/SkJumper_stages_8bit.cpp
@@ -157,6 +157,20 @@ SI V min(V a, V b) {
return if_then_else(a.u8x4 > b.u8x4, b.u8x4, a.u8x4);
}
+SI V saturated_add(V a, V b) {
+ R a_lo, a_hi,
+ b_lo, b_hi;
+ split(a.u8x4, &a_lo, &a_hi);
+ split(b.u8x4, &b_lo, &b_hi);
+#if defined(__AVX2__)
+ return join(_mm256_adds_epu8(a_lo, b_lo),
+ _mm256_adds_epu8(a_hi, b_hi));
+#else
+ return join(_mm_adds_epu8(a_lo, b_lo),
+ _mm_adds_epu8(a_hi, b_hi));
+#endif
+}
+
struct Params {
size_t x,y,tail;
};
@@ -385,6 +399,7 @@ STAGE(modulate) { src = src*dst; }
STAGE(multiply) { src = src*inv(alpha(dst)) + dst*inv(alpha(src)) + src*dst; }
STAGE(screen) { src = src + inv(src)*dst; }
STAGE(xor_) { src = src*inv(alpha(dst)) + dst*inv(alpha(src)); }
+STAGE(plus_) { src = saturated_add(src, dst); }
SI V srcover_alpha(V src, V dst, V rgb) {
V a = src + (dst - dst*alpha(src));
@@ -443,8 +458,6 @@ STAGE(overlay) {
// Missing blendmode specializations:
//
-// plus - tricky due to clamping vs. partial coverage (especially with LCD masks).
-//
// colorburn |
// colordodge > these involve division, which makes them (much) slower than the float stages.
// softlight |