aboutsummaryrefslogtreecommitdiffhomepage
path: root/src
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-08-09 18:23:25 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-08-10 14:34:35 +0000
commitc2f876bb8d8991e428467c1d7d24152eea629770 (patch)
tree5f94199f289e68b418dfc6cafc9516e81141454d /src
parentf4874bc5c14242dc482882252f8a8d482aa11508 (diff)
Replace interp() with clut_{3,4}D stages.
I tried to follow exactly the same strategy as a start. (Though I did fix the off-by-one dimensions.) It does rather look like we only need 3D and 4D now that I've looked at the call sites. Looks like about a 20% speedup. Change-Id: I8b1af64750ad1750716ee1ab0767e64591c7206a Reviewed-on: https://skia-review.googlesource.com/32842 Commit-Queue: Mike Klein <mtklein@google.com> Reviewed-by: Brian Osman <brianosman@google.com>
Diffstat (limited to 'src')
-rw-r--r--src/core/SkColorLookUpTable.cpp56
-rw-r--r--src/core/SkColorLookUpTable.h7
-rw-r--r--src/core/SkColorSpaceXform_A2B.cpp33
-rw-r--r--src/core/SkRasterPipeline.h3
-rw-r--r--src/jumper/SkJumper.h5
-rw-r--r--src/jumper/SkJumper_generated.S16251
-rw-r--r--src/jumper/SkJumper_generated_win.S13053
-rw-r--r--src/jumper/SkJumper_stages.cpp52
8 files changed, 24830 insertions, 4630 deletions
diff --git a/src/core/SkColorLookUpTable.cpp b/src/core/SkColorLookUpTable.cpp
index c558afb0e1..f376621e7f 100644
--- a/src/core/SkColorLookUpTable.cpp
+++ b/src/core/SkColorLookUpTable.cpp
@@ -18,59 +18,3 @@ SkColorLookUpTable::SkColorLookUpTable(uint8_t inputChannels, const uint8_t limi
SkASSERT(fLimits[i] > 1);
}
}
-
-// Our general strategy is to recursively interpolate each dimension,
-// accumulating the index to sample at, and our current pixel stride to help accumulate the index.
-template <int dim>
-static Sk4f interp_dimension(const float* table, const uint8_t* limits,
- const float* src, int index, int stride) {
- // We'd logically like to sample this dimension at x.
- int limit = limits[dim];
- float x = src[dim] * (limit - 1);
-
- // We can't index an array by a float (darn) so we have to snap to nearby integers lo and hi.
- int lo = (int)(x ),
- hi = (int)(x + 0.9999f);
-
- // Recursively sample at lo and hi.
- Sk4f L = interp_dimension<dim-1>(table,limits,src, stride*lo + index, stride*limit),
- H = interp_dimension<dim-1>(table,limits,src, stride*hi + index, stride*limit);
-
- // Linearly interpolate those colors based on their distance to x.
- float t = (x - lo);
- return (1 - t)*L + t*H;
-}
-
-// Bottom out our recursion at 0 dimensions, i.e. just return the color at index.
-template <>
-Sk4f interp_dimension<-1>(const float* table, const uint8_t* limits,
- const float* src, int index, int stride) {
- return {
- table[3*index+0],
- table[3*index+1],
- table[3*index+2],
- 0.0f,
- };
-}
-
-template <int dim>
-static Sk4f interp_dimension(const float* table, const uint8_t* limits, const float* src) {
- // Start our accumulated index and stride off at their identity values, 0 and 1.
- return interp_dimension<dim>(table, limits, src, 0,1);
-}
-
-void SkColorLookUpTable::interp(float* dst, const float* src) const {
- Sk4f rgb;
- switch (fInputChannels-1) {
- case 0: rgb = interp_dimension<0>(this->table(), fLimits, src); break;
- case 1: rgb = interp_dimension<1>(this->table(), fLimits, src); break;
- case 2: rgb = interp_dimension<2>(this->table(), fLimits, src); break;
- case 3: rgb = interp_dimension<3>(this->table(), fLimits, src); break;
- default: SkDEBUGFAIL("oops"); return;
- }
-
- rgb = Sk4f::Max(0, Sk4f::Min(rgb, 1));
- dst[0] = rgb[0];
- dst[1] = rgb[1];
- dst[2] = rgb[2];
-}
diff --git a/src/core/SkColorLookUpTable.h b/src/core/SkColorLookUpTable.h
index 743f110ba9..f7d62452e7 100644
--- a/src/core/SkColorLookUpTable.h
+++ b/src/core/SkColorLookUpTable.h
@@ -21,11 +21,6 @@ public:
SkColorLookUpTable(uint8_t inputChannels, const uint8_t limits[]);
- // This always does the appropriate multilinear interpolation.
- // We used to do tetrahedral for 3D tables, but found that was slower!
- // src must point to fInputChannels values, one per channel.
- void interp(float dst[3], const float src[]) const;
-
int inputChannels() const { return fInputChannels; }
int outputChannels() const { return kOutputChannels; }
@@ -41,11 +36,11 @@ public:
void* operator new(size_t, void* p) { return p; }
void operator delete(void* p) { sk_free(p); }
-private:
const float* table() const {
return SkTAddOffset<const float>(this, sizeof(SkColorLookUpTable));
}
+private:
uint8_t fInputChannels;
uint8_t fLimits[kMaxColorChannels];
};
diff --git a/src/core/SkColorSpaceXform_A2B.cpp b/src/core/SkColorSpaceXform_A2B.cpp
index c20ad4325e..e2434d640a 100644
--- a/src/core/SkColorSpaceXform_A2B.cpp
+++ b/src/core/SkColorSpaceXform_A2B.cpp
@@ -189,27 +189,24 @@ SkColorSpaceXform_A2B::SkColorSpaceXform_A2B(SkColorSpace_A2B* srcSpace,
case SkColorSpace_A2B::Element::Type::kCLUT: {
SkCSXformPrintf("CLUT (%d -> %d) stage added\n", e.colorLUT().inputChannels(),
e.colorLUT().outputChannels());
- struct CallbackCtx : SkJumper_CallbackCtx {
+
+ struct Ctx : SkJumper_ColorLookupTableCtx {
sk_sp<const SkColorLookUpTable> clut;
- // clut->interp() can't always safely alias its arguments,
- // so we allocate a second buffer to hold our results.
- float results[4*SkJumper_kMaxStride];
};
- auto cb = fAlloc.make<CallbackCtx>();
- cb->clut = sk_ref_sp(&e.colorLUT());
- cb->read_from = cb->results;
- cb->fn = [](SkJumper_CallbackCtx* ctx, int active_pixels) {
- auto c = (CallbackCtx*)ctx;
- for (int i = 0; i < active_pixels; i++) {
- // Look up red, green, and blue for this pixel using 3-4 values from rgba.
- c->clut->interp(c->results+4*i, c->rgba+4*i);
+ auto ctx = fAlloc.make<Ctx>();
+ ctx->clut = sk_ref_sp(&e.colorLUT());
+ ctx->table = ctx->clut->table();
+ for (int i = 0; i < ctx->clut->inputChannels(); i++) {
+ ctx->limits[i] = ctx->clut->gridPoints(i);
+ }
- // If we used 3 inputs (rgb) preserve the fourth as alpha.
- // If we used 4 inputs (cmyk) force alpha to 1.
- c->results[4*i+3] = (3 == c->clut->inputChannels()) ? c->rgba[4*i+3] : 1.0f;
- }
- };
- fElementsPipeline.append(SkRasterPipeline::callback, cb);
+ switch (e.colorLUT().inputChannels()) {
+ case 3: fElementsPipeline.append(SkRasterPipeline::clut_3D, ctx); break;
+ case 4: fElementsPipeline.append(SkRasterPipeline::clut_4D, ctx); break;
+ default: SkDEBUGFAIL("need to handle 1 or 2 channel color lookup tables.");
+ }
+ fElementsPipeline.append(SkRasterPipeline::clamp_0);
+ fElementsPipeline.append(SkRasterPipeline::clamp_1);
break;
}
case SkColorSpace_A2B::Element::Type::kMatrix:
diff --git a/src/core/SkRasterPipeline.h b/src/core/SkRasterPipeline.h
index 5af5efca75..adb0ed0187 100644
--- a/src/core/SkRasterPipeline.h
+++ b/src/core/SkRasterPipeline.h
@@ -91,7 +91,8 @@ struct SkJumper_Engine;
M(xy_to_2pt_conical_linear) \
M(mask_2pt_conical_degenerates) M(apply_vector_mask) \
M(byte_tables) M(byte_tables_rgb) \
- M(rgb_to_hsl) M(hsl_to_rgb)
+ M(rgb_to_hsl) M(hsl_to_rgb) \
+ M(clut_3D) M(clut_4D)
class SkRasterPipeline {
public:
diff --git a/src/jumper/SkJumper.h b/src/jumper/SkJumper.h
index a22bb22da1..d4e8ef4f37 100644
--- a/src/jumper/SkJumper.h
+++ b/src/jumper/SkJumper.h
@@ -121,4 +121,9 @@ struct SkJumper_UniformColorCtx {
uint32_t rgba;
};
+struct SkJumper_ColorLookupTableCtx {
+ const float* table;
+ int limits[4];
+};
+
#endif//SkJumper_DEFINED
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index 05483651db..f3ea32388a 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -5654,6 +5654,1712 @@ _sk_callback_aarch64:
.long 0xa9445ff8 // ldp x24, x23, [sp, #64]
.long 0x910203ff // add sp, sp, #0x80
.long 0xd61f00a0 // br x5
+
+HIDDEN _sk_clut_3D_aarch64
+.globl _sk_clut_3D_aarch64
+FUNCTION(_sk_clut_3D_aarch64)
+_sk_clut_3D_aarch64:
+ .long 0xd104c3ff // sub sp, sp, #0x130
+ .long 0xa90213e3 // stp x3, x4, [sp, #32]
+ .long 0xaa0103e3 // mov x3, x1
+ .long 0x91002069 // add x9, x3, #0x8
+ .long 0x6d093bef // stp d15, d14, [sp, #144]
+ .long 0x6d0a33ed // stp d13, d12, [sp, #160]
+ .long 0x6d0b2beb // stp d11, d10, [sp, #176]
+ .long 0x6d0c23e9 // stp d9, d8, [sp, #192]
+ .long 0xa90d6ffc // stp x28, x27, [sp, #208]
+ .long 0xa90e67fa // stp x26, x25, [sp, #224]
+ .long 0xa90f5ff8 // stp x24, x23, [sp, #240]
+ .long 0xa91057f6 // stp x22, x21, [sp, #256]
+ .long 0xa9114ff4 // stp x20, x19, [sp, #272]
+ .long 0xa9127bfd // stp x29, x30, [sp, #288]
+ .long 0xad031fe6 // stp q6, q7, [sp, #96]
+ .long 0xad0217e4 // stp q4, q5, [sp, #64]
+ .long 0x3d800fe3 // str q3, [sp, #48]
+ .long 0xf9000fe2 // str x2, [sp, #24]
+ .long 0xaa0303e4 // mov x4, x3
+ .long 0xf90047e9 // str x9, [sp, #136]
+ .long 0xf8410489 // ldr x9, [x4], #16
+ .long 0x52a7efed // mov w13, #0x3f7f0000
+ .long 0x729f2e4d // movk w13, #0xf972
+ .long 0x4e040dbd // dup v29.4s, w13
+ .long 0x2941ad2c // ldp w12, w11, [x9, #12]
+ .long 0xb940092a // ldr w10, [x9, #8]
+ .long 0x4f000432 // movi v18.4s, #0x1
+ .long 0xf9400129 // ldr x9, [x9]
+ .long 0x5100056d // sub w13, w11, #0x1
+ .long 0x4e040d7f // dup v31.4s, w11
+ .long 0x1e27017e // fmov s30, w11
+ .long 0x5100058b // sub w11, w12, #0x1
+ .long 0x1e270188 // fmov s8, w12
+ .long 0x5100054a // sub w10, w10, #0x1
+ .long 0x4ebe9d1e // mul v30.4s, v8.4s, v30.4s
+ .long 0x4e040da8 // dup v8.4s, w13
+ .long 0x4e040d69 // dup v9.4s, w11
+ .long 0x4e040d4a // dup v10.4s, w10
+ .long 0x4e21d908 // scvtf v8.4s, v8.4s
+ .long 0x4e21d929 // scvtf v9.4s, v9.4s
+ .long 0x4e21d94b // scvtf v11.4s, v10.4s
+ .long 0x6e22dd08 // fmul v8.4s, v8.4s, v2.4s
+ .long 0x6e21dd2a // fmul v10.4s, v9.4s, v1.4s
+ .long 0x6e20dd6b // fmul v11.4s, v11.4s, v0.4s
+ .long 0x4ea1b90c // fcvtzs v12.4s, v8.4s
+ .long 0x4ea1b949 // fcvtzs v9.4s, v10.4s
+ .long 0x4e3dd56d // fadd v13.4s, v11.4s, v29.4s
+ .long 0x4e3dd542 // fadd v2.4s, v10.4s, v29.4s
+ .long 0x4eac1d86 // mov v6.16b, v12.16b
+ .long 0x4e21d98e // scvtf v14.4s, v12.4s
+ .long 0x4ea1b9ad // fcvtzs v13.4s, v13.4s
+ .long 0x4ebf952c // mla v12.4s, v9.4s, v31.4s
+ .long 0x4f000470 // movi v16.4s, #0x3
+ .long 0x4f000454 // movi v20.4s, #0x2
+ .long 0x4eb21e55 // mov v21.16b, v18.16b
+ .long 0x4e3dd500 // fadd v0.4s, v8.4s, v29.4s
+ .long 0x4ea1b85d // fcvtzs v29.4s, v2.4s
+ .long 0x4eac1d81 // mov v1.16b, v12.16b
+ .long 0x6f9e01ac // mla v12.4s, v13.4s, v30.s[0]
+ .long 0x4eb41e96 // mov v22.16b, v20.16b
+ .long 0x4ebf97a6 // mla v6.4s, v29.4s, v31.4s
+ .long 0x4eb09595 // mla v21.4s, v12.4s, v16.4s
+ .long 0x4eb21e5b // mov v27.16b, v18.16b
+ .long 0x4ea1b805 // fcvtzs v5.4s, v0.4s
+ .long 0x4ea61cc2 // mov v2.16b, v6.16b
+ .long 0x6f9e01a6 // mla v6.4s, v13.4s, v30.s[0]
+ .long 0x4eb09596 // mla v22.4s, v12.4s, v16.4s
+ .long 0x1e2602ac // fmov w12, s21
+ .long 0x4ea1b967 // fcvtzs v7.4s, v11.4s
+ .long 0x4ea51ca0 // mov v0.16b, v5.16b
+ .long 0x4ebf97a5 // mla v5.4s, v29.4s, v31.4s
+ .long 0x4eb094db // mla v27.4s, v6.4s, v16.4s
+ .long 0x8b2c4933 // add x19, x9, w12, uxtw #2
+ .long 0x1e2602cc // fmov w12, s22
+ .long 0x4e21d8ef // scvtf v15.4s, v7.4s
+ .long 0x4ebf9520 // mla v0.4s, v9.4s, v31.4s
+ .long 0x4ea51ca3 // mov v3.16b, v5.16b
+ .long 0x6f9e01a5 // mla v5.4s, v13.4s, v30.s[0]
+ .long 0x4eb09d9f // mul v31.4s, v12.4s, v16.4s
+ .long 0x8b2c4937 // add x23, x9, w12, uxtw #2
+ .long 0x1e26037b // fmov w27, s27
+ .long 0x4eb21e53 // mov v19.16b, v18.16b
+ .long 0x4eb21e57 // mov v23.16b, v18.16b
+ .long 0x4eb21e59 // mov v25.16b, v18.16b
+ .long 0x4eafd56b // fsub v11.4s, v11.4s, v15.4s
+ .long 0x4e21d92f // scvtf v15.4s, v9.4s
+ .long 0x4eaed51d // fsub v29.4s, v8.4s, v14.4s
+ .long 0x4ea01c04 // mov v4.16b, v0.16b
+ .long 0x4eb21e49 // mov v9.16b, v18.16b
+ .long 0x0e1c3ff1 // mov w17, v31.s[3]
+ .long 0x0e1c3ea7 // mov w7, v21.s[3]
+ .long 0x4eb21e48 // mov v8.16b, v18.16b
+ .long 0x4eb094b2 // mla v18.4s, v5.4s, v16.4s
+ .long 0x0e0c3ed4 // mov w20, v22.s[1]
+ .long 0x0e143ed5 // mov w21, v22.s[2]
+ .long 0x0e1c3ed6 // mov w22, v22.s[3]
+ .long 0x0e0c3f78 // mov w24, v27.s[1]
+ .long 0x0e143f79 // mov w25, v27.s[2]
+ .long 0x0e1c3f7a // mov w26, v27.s[3]
+ .long 0x0d40827b // ld1 {v27.s}[0], [x19]
+ .long 0x0d4082f6 // ld1 {v22.s}[0], [x23]
+ .long 0x8b3b4937 // add x23, x9, w27, uxtw #2
+ .long 0x0e0c3ea6 // mov w6, v21.s[1]
+ .long 0x0e143ea5 // mov w5, v21.s[2]
+ .long 0x6f9e00e1 // mla v1.4s, v7.4s, v30.s[0]
+ .long 0x6f9e00e2 // mla v2.4s, v7.4s, v30.s[0]
+ .long 0x6f9e00e3 // mla v3.4s, v7.4s, v30.s[0]
+ .long 0xbc715935 // ldr s21, [x9, w17, uxtw #2]
+ .long 0x6f9e00e4 // mla v4.4s, v7.4s, v30.s[0]
+ .long 0xbc675927 // ldr s7, [x9, w7, uxtw #2]
+ .long 0x0e0c3e47 // mov w7, v18.s[1]
+ .long 0x0e143e53 // mov w19, v18.s[2]
+ .long 0xbc75592c // ldr s12, [x9, w21, uxtw #2]
+ .long 0x0e1c3e51 // mov w17, v18.s[3]
+ .long 0x1e260255 // fmov w21, s18
+ .long 0x0d4082f2 // ld1 {v18.s}[0], [x23]
+ .long 0x4eb41e9c // mov v28.16b, v20.16b
+ .long 0x4eb094dc // mla v28.4s, v6.4s, v16.4s
+ .long 0x8b264926 // add x6, x9, w6, uxtw #2
+ .long 0x4eb41e91 // mov v17.16b, v20.16b
+ .long 0x4eb41e98 // mov v24.16b, v20.16b
+ .long 0x4eb41e9a // mov v26.16b, v20.16b
+ .long 0x4eafd54a // fsub v10.4s, v10.4s, v15.4s
+ .long 0x6f9e01a0 // mla v0.4s, v13.4s, v30.s[0]
+ .long 0x0e0c3feb // mov w11, v31.s[1]
+ .long 0x0e143fe1 // mov w1, v31.s[2]
+ .long 0x1e2603ef // fmov w15, s31
+ .long 0x4eb41e9f // mov v31.16b, v20.16b
+ .long 0x1e26038a // fmov w10, s28
+ .long 0x4eb41e8f // mov v15.16b, v20.16b
+ .long 0x4eb094b4 // mla v20.4s, v5.4s, v16.4s
+ .long 0x0d4090db // ld1 {v27.s}[1], [x6]
+ .long 0x8b344926 // add x6, x9, w20, uxtw #2
+ .long 0x8b384934 // add x20, x9, w24, uxtw #2
+ .long 0x4eb09cc6 // mul v6.4s, v6.4s, v16.4s
+ .long 0x4eb09433 // mla v19.4s, v1.4s, v16.4s
+ .long 0x4eb09431 // mla v17.4s, v1.4s, v16.4s
+ .long 0x4eb09c2d // mul v13.4s, v1.4s, v16.4s
+ .long 0x4eb09457 // mla v23.4s, v2.4s, v16.4s
+ .long 0x4eb09458 // mla v24.4s, v2.4s, v16.4s
+ .long 0x4eb09c41 // mul v1.4s, v2.4s, v16.4s
+ .long 0x4eb09409 // mla v9.4s, v0.4s, v16.4s
+ .long 0x4eb0941f // mla v31.4s, v0.4s, v16.4s
+ .long 0x4eb09c1e // mul v30.4s, v0.4s, v16.4s
+ .long 0x4eb09499 // mla v25.4s, v4.4s, v16.4s
+ .long 0x4eb0949a // mla v26.4s, v4.4s, v16.4s
+ .long 0x4eb09c80 // mul v0.4s, v4.4s, v16.4s
+ .long 0xbc795922 // ldr s2, [x9, w25, uxtw #2]
+ .long 0x1e260282 // fmov w2, s20
+ .long 0x8b2a492a // add x10, x9, w10, uxtw #2
+ .long 0x0d409292 // ld1 {v18.s}[1], [x20]
+ .long 0xbc735924 // ldr s4, [x9, w19, uxtw #2]
+ .long 0x8b354933 // add x19, x9, w21, uxtw #2
+ .long 0x0e0c3ccd // mov w13, v6.s[1]
+ .long 0x0e143ccc // mov w12, v6.s[2]
+ .long 0x0e1c3cd0 // mov w16, v6.s[3]
+ .long 0x1e2600ce // fmov w14, s6
+ .long 0x0e143f9e // mov w30, v28.s[2]
+ .long 0xbc655926 // ldr s6, [x9, w5, uxtw #2]
+ .long 0x0e0c3e99 // mov w25, v20.s[1]
+ .long 0x0e143e9b // mov w27, v20.s[2]
+ .long 0x0e1c3e85 // mov w5, v20.s[3]
+ .long 0x0d4090d6 // ld1 {v22.s}[1], [x6]
+ .long 0x0e0c3e66 // mov w6, v19.s[1]
+ .long 0x0d408154 // ld1 {v20.s}[0], [x10]
+ .long 0x0e143e6a // mov w10, v19.s[2]
+ .long 0x0e1c3e74 // mov w20, v19.s[3]
+ .long 0x1e260277 // fmov w23, s19
+ .long 0x0d408273 // ld1 {v19.s}[0], [x19]
+ .long 0x8b224922 // add x2, x9, w2, uxtw #2
+ .long 0x0e0c3f9c // mov w28, v28.s[1]
+ .long 0x0e1c3f88 // mov w8, v28.s[3]
+ .long 0x4eb09468 // mla v8.4s, v3.4s, v16.4s
+ .long 0x4eb0946f // mla v15.4s, v3.4s, v16.4s
+ .long 0x4eb09c7c // mul v28.4s, v3.4s, v16.4s
+ .long 0xbc7e5923 // ldr s3, [x9, w30, uxtw #2]
+ .long 0x0e0c3e33 // mov w19, v17.s[1]
+ .long 0x0e143e35 // mov w21, v17.s[2]
+ .long 0x0e1c3e38 // mov w24, v17.s[3]
+ .long 0x1e26023e // fmov w30, s17
+ .long 0x0d408051 // ld1 {v17.s}[0], [x2]
+ .long 0x6e140452 // mov v18.s[2], v2.s[0]
+ .long 0xbc7b5922 // ldr s2, [x9, w27, uxtw #2]
+ .long 0x8b3c493b // add x27, x9, w28, uxtw #2
+ .long 0x8b274927 // add x7, x9, w7, uxtw #2
+ .long 0x0d409374 // ld1 {v20.s}[1], [x27]
+ .long 0x0d4090f3 // ld1 {v19.s}[1], [x7]
+ .long 0x8b374927 // add x7, x9, w23, uxtw #2
+ .long 0x8b394937 // add x23, x9, w25, uxtw #2
+ .long 0x0d4092f1 // ld1 {v17.s}[1], [x23]
+ .long 0x6e140474 // mov v20.s[2], v3.s[0]
+ .long 0x0e0c3c22 // mov w2, v1.s[1]
+ .long 0xbc6a5923 // ldr s3, [x9, w10, uxtw #2]
+ .long 0x0e143c2a // mov w10, v1.s[2]
+ .long 0x0e1c3c37 // mov w23, v1.s[3]
+ .long 0x1e260039 // fmov w25, s1
+ .long 0x0d4080e1 // ld1 {v1.s}[0], [x7]
+ .long 0x8b3e4927 // add x7, x9, w30, uxtw #2
+ .long 0x6e140451 // mov v17.s[2], v2.s[0]
+ .long 0x0d4080e2 // ld1 {v2.s}[0], [x7]
+ .long 0x8b334933 // add x19, x9, w19, uxtw #2
+ .long 0x1e2602fc // fmov w28, s23
+ .long 0x4eb09cae // mul v14.4s, v5.4s, v16.4s
+ .long 0x0d409262 // ld1 {v2.s}[1], [x19]
+ .long 0x8b394933 // add x19, x9, w25, uxtw #2
+ .long 0x8b264926 // add x6, x9, w6, uxtw #2
+ .long 0x0d408270 // ld1 {v16.s}[0], [x19]
+ .long 0x8b3c4933 // add x19, x9, w28, uxtw #2
+ .long 0x0e0c3ee7 // mov w7, v23.s[1]
+ .long 0x0d4090c1 // ld1 {v1.s}[1], [x6]
+ .long 0x0e143ee6 // mov w6, v23.s[2]
+ .long 0x0e1c3efb // mov w27, v23.s[3]
+ .long 0x0d408277 // ld1 {v23.s}[0], [x19]
+ .long 0x8b224922 // add x2, x9, w2, uxtw #2
+ .long 0x1e260319 // fmov w25, s24
+ .long 0x0d409050 // ld1 {v16.s}[1], [x2]
+ .long 0x8b274922 // add x2, x9, w7, uxtw #2
+ .long 0x6e140461 // mov v1.s[2], v3.s[0]
+ .long 0xbc765923 // ldr s3, [x9, w22, uxtw #2]
+ .long 0xbc6a5925 // ldr s5, [x9, w10, uxtw #2]
+ .long 0x0d409057 // ld1 {v23.s}[1], [x2]
+ .long 0x8b394922 // add x2, x9, w25, uxtw #2
+ .long 0x6e140493 // mov v19.s[2], v4.s[0]
+ .long 0xbc755924 // ldr s4, [x9, w21, uxtw #2]
+ .long 0x0e0c3f15 // mov w21, v24.s[1]
+ .long 0x0e143f16 // mov w22, v24.s[2]
+ .long 0x0e1c3f0a // mov w10, v24.s[3]
+ .long 0x0d408058 // ld1 {v24.s}[0], [x2]
+ .long 0x6e140596 // mov v22.s[2], v12.s[0]
+ .long 0x1e26013e // fmov w30, s9
+ .long 0x6e1c0476 // mov v22.s[3], v3.s[0]
+ .long 0xbc665923 // ldr s3, [x9, w6, uxtw #2]
+ .long 0x6e1404b0 // mov v16.s[2], v5.s[0]
+ .long 0x8b354933 // add x19, x9, w21, uxtw #2
+ .long 0xbc685925 // ldr s5, [x9, w8, uxtw #2]
+ .long 0x8b3e4928 // add x8, x9, w30, uxtw #2
+ .long 0x0e0c3fe2 // mov w2, v31.s[1]
+ .long 0x0e143fe7 // mov w7, v31.s[2]
+ .long 0x0d409278 // ld1 {v24.s}[1], [x19]
+ .long 0x0e1c3ff3 // mov w19, v31.s[3]
+ .long 0x1e2603f5 // fmov w21, s31
+ .long 0x0d40811f // ld1 {v31.s}[0], [x8]
+ .long 0x0e0c3d26 // mov w6, v9.s[1]
+ .long 0x6e140477 // mov v23.s[2], v3.s[0]
+ .long 0xbc765923 // ldr s3, [x9, w22, uxtw #2]
+ .long 0x8b264926 // add x6, x9, w6, uxtw #2
+ .long 0x6e140482 // mov v2.s[2], v4.s[0]
+ .long 0xbc7a5924 // ldr s4, [x9, w26, uxtw #2]
+ .long 0x0d4090df // ld1 {v31.s}[1], [x6]
+ .long 0x8b354926 // add x6, x9, w21, uxtw #2
+ .long 0x0d4080cc // ld1 {v12.s}[0], [x6]
+ .long 0x0e143d3a // mov w26, v9.s[2]
+ .long 0x6e140478 // mov v24.s[2], v3.s[0]
+ .long 0xbc7a5923 // ldr s3, [x9, w26, uxtw #2]
+ .long 0x1e26011a // fmov w26, s8
+ .long 0x6e1c0492 // mov v18.s[3], v4.s[0]
+ .long 0xbc675924 // ldr s4, [x9, w7, uxtw #2]
+ .long 0x8b3a4927 // add x7, x9, w26, uxtw #2
+ .long 0x8b224922 // add x2, x9, w2, uxtw #2
+ .long 0x1e2601f5 // fmov w21, s15
+ .long 0x0e0c3d16 // mov w22, v8.s[1]
+ .long 0x0e143d08 // mov w8, v8.s[2]
+ .long 0x0e1c3d19 // mov w25, v8.s[3]
+ .long 0x0d40904c // ld1 {v12.s}[1], [x2]
+ .long 0x0d4080e8 // ld1 {v8.s}[0], [x7]
+ .long 0x8b354927 // add x7, x9, w21, uxtw #2
+ .long 0x0e1c3d3c // mov w28, v9.s[3]
+ .long 0x0d4080e9 // ld1 {v9.s}[0], [x7]
+ .long 0x0e0c3de6 // mov w6, v15.s[1]
+ .long 0x6e14047f // mov v31.s[2], v3.s[0]
+ .long 0xbc685923 // ldr s3, [x9, w8, uxtw #2]
+ .long 0x0e143de8 // mov w8, v15.s[2]
+ .long 0x6e14048c // mov v12.s[2], v4.s[0]
+ .long 0xbc685924 // ldr s4, [x9, w8, uxtw #2]
+ .long 0x8b264928 // add x8, x9, w6, uxtw #2
+ .long 0x8b364935 // add x21, x9, w22, uxtw #2
+ .long 0x0d409109 // ld1 {v9.s}[1], [x8]
+ .long 0x0d4092a8 // ld1 {v8.s}[1], [x21]
+ .long 0x6e1c04b4 // mov v20.s[3], v5.s[0]
+ .long 0xbc785925 // ldr s5, [x9, w24, uxtw #2]
+ .long 0x6e140489 // mov v9.s[2], v4.s[0]
+ .long 0xbc655924 // ldr s4, [x9, w5, uxtw #2]
+ .long 0x6e140468 // mov v8.s[2], v3.s[0]
+ .long 0xbc715923 // ldr s3, [x9, w17, uxtw #2]
+ .long 0x8b2f492f // add x15, x9, w15, uxtw #2
+ .long 0x6e1c0491 // mov v17.s[3], v4.s[0]
+ .long 0xbc775924 // ldr s4, [x9, w23, uxtw #2]
+ .long 0x6e1c0473 // mov v19.s[3], v3.s[0]
+ .long 0xbc745923 // ldr s3, [x9, w20, uxtw #2]
+ .long 0x1e260337 // fmov w23, s25
+ .long 0x6e1c0490 // mov v16.s[3], v4.s[0]
+ .long 0xbc6a5924 // ldr s4, [x9, w10, uxtw #2]
+ .long 0x8b37492a // add x10, x9, w23, uxtw #2
+ .long 0x0e0c3da8 // mov w8, v13.s[1]
+ .long 0x0e143db1 // mov w17, v13.s[2]
+ .long 0x0e1c3da5 // mov w5, v13.s[3]
+ .long 0x1e2601a6 // fmov w6, s13
+ .long 0x0d4081ed // ld1 {v13.s}[0], [x15]
+ .long 0x6e1c0461 // mov v1.s[3], v3.s[0]
+ .long 0xbc705923 // ldr s3, [x9, w16, uxtw #2]
+ .long 0x0e0c3f2f // mov w15, v25.s[1]
+ .long 0x0e143f30 // mov w16, v25.s[2]
+ .long 0x0e1c3f34 // mov w20, v25.s[3]
+ .long 0x0d408159 // ld1 {v25.s}[0], [x10]
+ .long 0x6e1c04a2 // mov v2.s[3], v5.s[0]
+ .long 0xbc7b5925 // ldr s5, [x9, w27, uxtw #2]
+ .long 0x1e26035b // fmov w27, s26
+ .long 0x8b2f492f // add x15, x9, w15, uxtw #2
+ .long 0x0d4091f9 // ld1 {v25.s}[1], [x15]
+ .long 0x8b3b492f // add x15, x9, w27, uxtw #2
+ .long 0x6e1c04b7 // mov v23.s[3], v5.s[0]
+ .long 0xbc705925 // ldr s5, [x9, w16, uxtw #2]
+ .long 0x6e1c0498 // mov v24.s[3], v4.s[0]
+ .long 0x0d4081e4 // ld1 {v4.s}[0], [x15]
+ .long 0x0e0c3f57 // mov w23, v26.s[1]
+ .long 0x0e143f4a // mov w10, v26.s[2]
+ .long 0x8b374930 // add x16, x9, w23, uxtw #2
+ .long 0x6e1404b9 // mov v25.s[2], v5.s[0]
+ .long 0xbc6a5925 // ldr s5, [x9, w10, uxtw #2]
+ .long 0x0d409204 // ld1 {v4.s}[1], [x16]
+ .long 0x6e1404db // mov v27.s[2], v6.s[0]
+ .long 0xbc7c5926 // ldr s6, [x9, w28, uxtw #2]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x6e1404a4 // mov v4.s[2], v5.s[0]
+ .long 0xbc735925 // ldr s5, [x9, w19, uxtw #2]
+ .long 0x6e1c04df // mov v31.s[3], v6.s[0]
+ .long 0x0d4081c6 // ld1 {v6.s}[0], [x14]
+ .long 0x8b2b492b // add x11, x9, w11, uxtw #2
+ .long 0x6e1c04ac // mov v12.s[3], v5.s[0]
+ .long 0xbc795925 // ldr s5, [x9, w25, uxtw #2]
+ .long 0x0e1c3de2 // mov w2, v15.s[3]
+ .long 0x0d40916d // ld1 {v13.s}[1], [x11]
+ .long 0x6e1c04fb // mov v27.s[3], v7.s[0]
+ .long 0x0e1c3f58 // mov w24, v26.s[3]
+ .long 0xbc625927 // ldr s7, [x9, w2, uxtw #2]
+ .long 0x6e1c04a8 // mov v8.s[3], v5.s[0]
+ .long 0xbc745925 // ldr s5, [x9, w20, uxtw #2]
+ .long 0x0e0c3c02 // mov w2, v0.s[1]
+ .long 0x0e143c0b // mov w11, v0.s[2]
+ .long 0x0e1c3c14 // mov w20, v0.s[3]
+ .long 0x1e26001c // fmov w28, s0
+ .long 0xbc785920 // ldr s0, [x9, w24, uxtw #2]
+ .long 0x8b2d492d // add x13, x9, w13, uxtw #2
+ .long 0x1e2601da // fmov w26, s14
+ .long 0x8b214921 // add x1, x9, w1, uxtw #2
+ .long 0x0d4091a6 // ld1 {v6.s}[1], [x13]
+ .long 0x4d40802d // ld1 {v13.s}[2], [x1]
+ .long 0x8b3a4921 // add x1, x9, w26, uxtw #2
+ .long 0x6e1c04e9 // mov v9.s[3], v7.s[0]
+ .long 0x0d408027 // ld1 {v7.s}[0], [x1]
+ .long 0x6e1c0404 // mov v4.s[3], v0.s[0]
+ .long 0x4ea1d760 // fsub v0.4s, v27.4s, v1.4s
+ .long 0x8b2c492c // add x12, x9, w12, uxtw #2
+ .long 0x0e0c3dc7 // mov w7, v14.s[1]
+ .long 0x4e20cd61 // fmla v1.4s, v11.4s, v0.4s
+ .long 0x4d408186 // ld1 {v6.s}[2], [x12]
+ .long 0x8b26492c // add x12, x9, w6, uxtw #2
+ .long 0x4ea2d6c0 // fsub v0.4s, v22.4s, v2.4s
+ .long 0x4e20cd62 // fmla v2.4s, v11.4s, v0.4s
+ .long 0x0d408180 // ld1 {v0.s}[0], [x12]
+ .long 0x8b27492c // add x12, x9, w7, uxtw #2
+ .long 0x0d409187 // ld1 {v7.s}[1], [x12]
+ .long 0x1e2603d7 // fmov w23, s30
+ .long 0x0e143dd5 // mov w21, v14.s[2]
+ .long 0x8b37492c // add x12, x9, w23, uxtw #2
+ .long 0x4eb7d652 // fsub v18.4s, v18.4s, v23.4s
+ .long 0x0e1c3dd6 // mov w22, v14.s[3]
+ .long 0x4e32cd77 // fmla v23.4s, v11.4s, v18.4s
+ .long 0x0d408192 // ld1 {v18.s}[0], [x12]
+ .long 0x8b35492c // add x12, x9, w21, uxtw #2
+ .long 0x6e1c04b9 // mov v25.s[3], v5.s[0]
+ .long 0xbc765925 // ldr s5, [x9, w22, uxtw #2]
+ .long 0x4d408187 // ld1 {v7.s}[2], [x12]
+ .long 0x1e26039b // fmov w27, s28
+ .long 0x8b3b492c // add x12, x9, w27, uxtw #2
+ .long 0x8b3c492d // add x13, x9, w28, uxtw #2
+ .long 0x4ea9d631 // fsub v17.4s, v17.4s, v9.4s
+ .long 0x6e1c04a7 // mov v7.s[3], v5.s[0]
+ .long 0x0d408185 // ld1 {v5.s}[0], [x12]
+ .long 0x4e31cd69 // fmla v9.4s, v11.4s, v17.4s
+ .long 0x0d4081b1 // ld1 {v17.s}[0], [x13]
+ .long 0x0e0c3fcf // mov w15, v30.s[1]
+ .long 0x0e0c3f8e // mov w14, v28.s[1]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x8b31492c // add x12, x9, w17, uxtw #2
+ .long 0x8b2f492f // add x15, x9, w15, uxtw #2
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x8b224931 // add x17, x9, w2, uxtw #2
+ .long 0x0d409100 // ld1 {v0.s}[1], [x8]
+ .long 0x0d4091f2 // ld1 {v18.s}[1], [x15]
+ .long 0x0d4091c5 // ld1 {v5.s}[1], [x14]
+ .long 0x0d409231 // ld1 {v17.s}[1], [x17]
+ .long 0x0e143fca // mov w10, v30.s[2]
+ .long 0x0e1c3fd0 // mov w16, v30.s[3]
+ .long 0x0e143f93 // mov w19, v28.s[2]
+ .long 0x0e1c3f99 // mov w25, v28.s[3]
+ .long 0x4eb8d694 // fsub v20.4s, v20.4s, v24.4s
+ .long 0x4ea8d673 // fsub v19.4s, v19.4s, v8.4s
+ .long 0x6e1c06ad // mov v13.s[3], v21.s[0]
+ .long 0xbc655935 // ldr s21, [x9, w5, uxtw #2]
+ .long 0x6e1c0466 // mov v6.s[3], v3.s[0]
+ .long 0xbc705923 // ldr s3, [x9, w16, uxtw #2]
+ .long 0x4e34cd78 // fmla v24.4s, v11.4s, v20.4s
+ .long 0xbc795934 // ldr s20, [x9, w25, uxtw #2]
+ .long 0x4e33cd68 // fmla v8.4s, v11.4s, v19.4s
+ .long 0xbc745933 // ldr s19, [x9, w20, uxtw #2]
+ .long 0x8b2a492a // add x10, x9, w10, uxtw #2
+ .long 0x8b334930 // add x16, x9, w19, uxtw #2
+ .long 0x8b2b4929 // add x9, x9, w11, uxtw #2
+ .long 0x4d408180 // ld1 {v0.s}[2], [x12]
+ .long 0x4d408152 // ld1 {v18.s}[2], [x10]
+ .long 0x4d408205 // ld1 {v5.s}[2], [x16]
+ .long 0x4d408131 // ld1 {v17.s}[2], [x9]
+ .long 0x6e1c06a0 // mov v0.s[3], v21.s[0]
+ .long 0x4eb9d7f6 // fsub v22.4s, v31.4s, v25.4s
+ .long 0x4eb0d4c6 // fsub v6.4s, v6.4s, v16.4s
+ .long 0x6e1c0472 // mov v18.s[3], v3.s[0]
+ .long 0x6e1c0685 // mov v5.s[3], v20.s[0]
+ .long 0x4ea0d5a3 // fsub v3.4s, v13.4s, v0.4s
+ .long 0x6e1c0671 // mov v17.s[3], v19.s[0]
+ .long 0x4ea4d59a // fsub v26.4s, v12.4s, v4.4s
+ .long 0x4e36cd79 // fmla v25.4s, v11.4s, v22.4s
+ .long 0x4e26cd70 // fmla v16.4s, v11.4s, v6.4s
+ .long 0x4ea5d4e6 // fsub v6.4s, v7.4s, v5.4s
+ .long 0x4e23cd60 // fmla v0.4s, v11.4s, v3.4s
+ .long 0x4eb1d643 // fsub v3.4s, v18.4s, v17.4s
+ .long 0x4ea1d6f5 // fsub v21.4s, v23.4s, v1.4s
+ .long 0x4e3acd64 // fmla v4.4s, v11.4s, v26.4s
+ .long 0x4eb9d507 // fsub v7.4s, v8.4s, v25.4s
+ .long 0x4e26cd65 // fmla v5.4s, v11.4s, v6.4s
+ .long 0x4e23cd71 // fmla v17.4s, v11.4s, v3.4s
+ .long 0x4ea2d717 // fsub v23.4s, v24.4s, v2.4s
+ .long 0x4e35cd41 // fmla v1.4s, v10.4s, v21.4s
+ .long 0x4ea4d533 // fsub v19.4s, v9.4s, v4.4s
+ .long 0x4e27cd59 // fmla v25.4s, v10.4s, v7.4s
+ .long 0x4ea0d606 // fsub v6.4s, v16.4s, v0.4s
+ .long 0x4eb1d4a5 // fsub v5.4s, v5.4s, v17.4s
+ .long 0x4e37cd42 // fmla v2.4s, v10.4s, v23.4s
+ .long 0x4e33cd44 // fmla v4.4s, v10.4s, v19.4s
+ .long 0x4ea1d723 // fsub v3.4s, v25.4s, v1.4s
+ .long 0x4e26cd40 // fmla v0.4s, v10.4s, v6.4s
+ .long 0x4e25cd51 // fmla v17.4s, v10.4s, v5.4s
+ .long 0x4ea2d484 // fsub v4.4s, v4.4s, v2.4s
+ .long 0x4e23cfa1 // fmla v1.4s, v29.4s, v3.4s
+ .long 0x4ea0d623 // fsub v3.4s, v17.4s, v0.4s
+ .long 0xf9400465 // ldr x5, [x3, #8]
+ .long 0x4e23cfa0 // fmla v0.4s, v29.4s, v3.4s
+ .long 0x4e24cfa2 // fmla v2.4s, v29.4s, v4.4s
+ .long 0xaa0403e1 // mov x1, x4
+ .long 0xa9418fe2 // ldp x2, x3, [sp, #24]
+ .long 0xf94017e4 // ldr x4, [sp, #40]
+ .long 0xad4193e3 // ldp q3, q4, [sp, #48]
+ .long 0xad429be5 // ldp q5, q6, [sp, #80]
+ .long 0x3dc01fe7 // ldr q7, [sp, #112]
+ .long 0xa9527bfd // ldp x29, x30, [sp, #288]
+ .long 0xa9514ff4 // ldp x20, x19, [sp, #272]
+ .long 0xa95057f6 // ldp x22, x21, [sp, #256]
+ .long 0xa94f5ff8 // ldp x24, x23, [sp, #240]
+ .long 0xa94e67fa // ldp x26, x25, [sp, #224]
+ .long 0xa94d6ffc // ldp x28, x27, [sp, #208]
+ .long 0x6d4c23e9 // ldp d9, d8, [sp, #192]
+ .long 0x6d4b2beb // ldp d11, d10, [sp, #176]
+ .long 0x6d4a33ed // ldp d13, d12, [sp, #160]
+ .long 0x6d493bef // ldp d15, d14, [sp, #144]
+ .long 0x9104c3ff // add sp, sp, #0x130
+ .long 0xd61f00a0 // br x5
+
+HIDDEN _sk_clut_4D_aarch64
+.globl _sk_clut_4D_aarch64
+FUNCTION(_sk_clut_4D_aarch64)
+_sk_clut_4D_aarch64:
+ .long 0x6db63bef // stp d15, d14, [sp, #-160]!
+ .long 0x6d0133ed // stp d13, d12, [sp, #16]
+ .long 0x6d022beb // stp d11, d10, [sp, #32]
+ .long 0x6d0323e9 // stp d9, d8, [sp, #48]
+ .long 0xa9046ffc // stp x28, x27, [sp, #64]
+ .long 0xa90567fa // stp x26, x25, [sp, #80]
+ .long 0xa9065ff8 // stp x24, x23, [sp, #96]
+ .long 0xa90757f6 // stp x22, x21, [sp, #112]
+ .long 0xa9084ff4 // stp x20, x19, [sp, #128]
+ .long 0xa9097bfd // stp x29, x30, [sp, #144]
+ .long 0xd11143ff // sub sp, sp, #0x450
+ .long 0x91002029 // add x9, x1, #0x8
+ .long 0x3d810be7 // str q7, [sp, #1056]
+ .long 0x3d8107e6 // str q6, [sp, #1040]
+ .long 0xad1f97e4 // stp q4, q5, [sp, #1008]
+ .long 0xf901f7e4 // str x4, [sp, #1000]
+ .long 0xf901f3e3 // str x3, [sp, #992]
+ .long 0xf901efe2 // str x2, [sp, #984]
+ .long 0xf901ebe1 // str x1, [sp, #976]
+ .long 0xf90227e9 // str x9, [sp, #1096]
+ .long 0xf8410429 // ldr x9, [x1], #16
+ .long 0x52a7efe8 // mov w8, #0x3f7f0000
+ .long 0x729f2e48 // movk w8, #0xf972
+ .long 0x4ea01c04 // mov v4.16b, v0.16b
+ .long 0xf901e7e1 // str x1, [sp, #968]
+ .long 0x29422d2a // ldp w10, w11, [x9, #16]
+ .long 0x4e040d00 // dup v0.4s, w8
+ .long 0x29413128 // ldp w8, w12, [x9, #8]
+ .long 0x4f00047f // movi v31.4s, #0x3
+ .long 0x5100056d // sub w13, w11, #0x1
+ .long 0x4e040d72 // dup v18.4s, w11
+ .long 0x1e270165 // fmov s5, w11
+ .long 0x5100054b // sub w11, w10, #0x1
+ .long 0x1e270146 // fmov s6, w10
+ .long 0x4ea59cd1 // mul v17.4s, v6.4s, v5.4s
+ .long 0x5100058a // sub w10, w12, #0x1
+ .long 0x1e270185 // fmov s5, w12
+ .long 0x51000508 // sub w8, w8, #0x1
+ .long 0x4e040da6 // dup v6.4s, w13
+ .long 0x4e040d67 // dup v7.4s, w11
+ .long 0x4e040d50 // dup v16.4s, w10
+ .long 0x4eb19cb8 // mul v24.4s, v5.4s, v17.4s
+ .long 0x4e040d05 // dup v5.4s, w8
+ .long 0x4e21d8c6 // scvtf v6.4s, v6.4s
+ .long 0x4e21d8e7 // scvtf v7.4s, v7.4s
+ .long 0x4e21da10 // scvtf v16.4s, v16.4s
+ .long 0x4e21d8a5 // scvtf v5.4s, v5.4s
+ .long 0x6e23dcc3 // fmul v3.4s, v6.4s, v3.4s
+ .long 0x6e22dce6 // fmul v6.4s, v7.4s, v2.4s
+ .long 0xad1d0fe6 // stp q6, q3, [sp, #928]
+ .long 0x6e21de10 // fmul v16.4s, v16.4s, v1.4s
+ .long 0x6e24dca1 // fmul v1.4s, v5.4s, v4.4s
+ .long 0x4ea1b864 // fcvtzs v4.4s, v3.4s
+ .long 0x4e20d462 // fadd v2.4s, v3.4s, v0.4s
+ .long 0x4e20d4c3 // fadd v3.4s, v6.4s, v0.4s
+ .long 0x4e20d61d // fadd v29.4s, v16.4s, v0.4s
+ .long 0x4e20d420 // fadd v0.4s, v1.4s, v0.4s
+ .long 0x4ea1b859 // fcvtzs v25.4s, v2.4s
+ .long 0x4ea1b865 // fcvtzs v5.4s, v3.4s
+ .long 0x4ea1b8c7 // fcvtzs v7.4s, v6.4s
+ .long 0xad1c43e4 // stp q4, q16, [sp, #896]
+ .long 0x4ea41c82 // mov v2.16b, v4.16b
+ .long 0x4ea41c83 // mov v3.16b, v4.16b
+ .long 0x4ea1bba4 // fcvtzs v4.4s, v29.4s
+ .long 0x4ea1b81d // fcvtzs v29.4s, v0.4s
+ .long 0x4eb91f20 // mov v0.16b, v25.16b
+ .long 0x4eb294b9 // mla v25.4s, v5.4s, v18.4s
+ .long 0x4ea1ba06 // fcvtzs v6.4s, v16.4s
+ .long 0x4eb294e3 // mla v3.4s, v7.4s, v18.4s
+ .long 0x4eb294a2 // mla v2.4s, v5.4s, v18.4s
+ .long 0x4eb294e0 // mla v0.4s, v7.4s, v18.4s
+ .long 0x4eb91f25 // mov v5.16b, v25.16b
+ .long 0x4ea31c76 // mov v22.16b, v3.16b
+ .long 0x4ea21c54 // mov v20.16b, v2.16b
+ .long 0x4ea01c09 // mov v9.16b, v0.16b
+ .long 0x6f910080 // mla v0.4s, v4.4s, v17.s[0]
+ .long 0x6f9100c5 // mla v5.4s, v6.4s, v17.s[0]
+ .long 0x6f910083 // mla v3.4s, v4.4s, v17.s[0]
+ .long 0x6f910082 // mla v2.4s, v4.4s, v17.s[0]
+ .long 0x6f910099 // mla v25.4s, v4.4s, v17.s[0]
+ .long 0x6f9100d6 // mla v22.4s, v6.4s, v17.s[0]
+ .long 0x6f9100d4 // mla v20.4s, v6.4s, v17.s[0]
+ .long 0x6f9100c9 // mla v9.4s, v6.4s, v17.s[0]
+ .long 0x4ea01c0a // mov v10.16b, v0.16b
+ .long 0x6f9803a0 // mla v0.4s, v29.4s, v24.s[0]
+ .long 0x4ea51cac // mov v12.16b, v5.16b
+ .long 0x6f9803a5 // mla v5.4s, v29.4s, v24.s[0]
+ .long 0xad1b1fe6 // stp q6, q7, [sp, #864]
+ .long 0x4ea31c72 // mov v18.16b, v3.16b
+ .long 0x4ea21c47 // mov v7.16b, v2.16b
+ .long 0x4eb91f24 // mov v4.16b, v25.16b
+ .long 0x4eb61ece // mov v14.16b, v22.16b
+ .long 0x4eb41e8d // mov v13.16b, v20.16b
+ .long 0x3d8093e0 // str q0, [sp, #576]
+ .long 0x3d808be5 // str q5, [sp, #544]
+ .long 0x4ea91d25 // mov v5.16b, v9.16b
+ .long 0x4ea1b820 // fcvtzs v0.4s, v1.4s
+ .long 0x6f9803a3 // mla v3.4s, v29.4s, v24.s[0]
+ .long 0x6f980012 // mla v18.4s, v0.4s, v24.s[0]
+ .long 0x6f980007 // mla v7.4s, v0.4s, v24.s[0]
+ .long 0x6f980004 // mla v4.4s, v0.4s, v24.s[0]
+ .long 0x6f98000e // mla v14.4s, v0.4s, v24.s[0]
+ .long 0x6f98000d // mla v13.4s, v0.4s, v24.s[0]
+ .long 0x6f98000a // mla v10.4s, v0.4s, v24.s[0]
+ .long 0x6f98000c // mla v12.4s, v0.4s, v24.s[0]
+ .long 0x6f980005 // mla v5.4s, v0.4s, v24.s[0]
+ .long 0x4e21d800 // scvtf v0.4s, v0.4s
+ .long 0x4ea0d43a // fsub v26.4s, v1.4s, v0.4s
+ .long 0x4ebf9c61 // mul v1.4s, v3.4s, v31.4s
+ .long 0x0e0c3c28 // mov w8, v1.s[1]
+ .long 0x4f000433 // movi v19.4s, #0x1
+ .long 0xb90333e8 // str w8, [sp, #816]
+ .long 0x0e143c28 // mov w8, v1.s[2]
+ .long 0x3d8033e5 // str q5, [sp, #192]
+ .long 0x4eb31e65 // mov v5.16b, v19.16b
+ .long 0xb90343e8 // str w8, [sp, #832]
+ .long 0x0e1c3c28 // mov w8, v1.s[3]
+ .long 0x4ebf9465 // mla v5.4s, v3.4s, v31.4s
+ .long 0xb90353e8 // str w8, [sp, #848]
+ .long 0x1e260028 // fmov w8, s1
+ .long 0x4f000455 // movi v21.4s, #0x2
+ .long 0xb9031be8 // str w8, [sp, #792]
+ .long 0x0e0c3ca8 // mov w8, v5.s[1]
+ .long 0x4eb51ea0 // mov v0.16b, v21.16b
+ .long 0xb901dfe8 // str w8, [sp, #476]
+ .long 0x0e143ca8 // mov w8, v5.s[2]
+ .long 0x4ebf9460 // mla v0.4s, v3.4s, v31.4s
+ .long 0xb901f7e8 // str w8, [sp, #500]
+ .long 0x0e1c3ca8 // mov w8, v5.s[3]
+ .long 0xb901dbe8 // str w8, [sp, #472]
+ .long 0x0e143c08 // mov w8, v0.s[2]
+ .long 0x6f9803a2 // mla v2.4s, v29.4s, v24.s[0]
+ .long 0x0e0c3c1e // mov w30, v0.s[1]
+ .long 0xb901f3e8 // str w8, [sp, #496]
+ .long 0x0e1c3c08 // mov w8, v0.s[3]
+ .long 0x1e260011 // fmov w17, s0
+ .long 0x4eb51ea0 // mov v0.16b, v21.16b
+ .long 0x4ebf9440 // mla v0.4s, v2.4s, v31.4s
+ .long 0x0e0c3c0a // mov w10, v0.s[1]
+ .long 0x4eb31e61 // mov v1.16b, v19.16b
+ .long 0xb901e3ea // str w10, [sp, #480]
+ .long 0x0e143c0a // mov w10, v0.s[2]
+ .long 0x6f9803b9 // mla v25.4s, v29.4s, v24.s[0]
+ .long 0x4ebf9441 // mla v1.4s, v2.4s, v31.4s
+ .long 0x4ebf9c42 // mul v2.4s, v2.4s, v31.4s
+ .long 0xb901e7ea // str w10, [sp, #484]
+ .long 0x0e1c3c0a // mov w10, v0.s[3]
+ .long 0xb90197e8 // str w8, [sp, #404]
+ .long 0x0e0c3c48 // mov w8, v2.s[1]
+ .long 0xb9019bea // str w10, [sp, #408]
+ .long 0x1e26000a // fmov w10, s0
+ .long 0x4ebf9f20 // mul v0.4s, v25.4s, v31.4s
+ .long 0xb90317e8 // str w8, [sp, #788]
+ .long 0x0e143c48 // mov w8, v2.s[2]
+ .long 0xb901ebea // str w10, [sp, #488]
+ .long 0x0e0c3c0a // mov w10, v0.s[1]
+ .long 0x6f9803b6 // mla v22.4s, v29.4s, v24.s[0]
+ .long 0xb9031fe8 // str w8, [sp, #796]
+ .long 0x0e1c3c48 // mov w8, v2.s[3]
+ .long 0xb902afea // str w10, [sp, #684]
+ .long 0x0e143c0a // mov w10, v0.s[2]
+ .long 0x3d80bff6 // str q22, [sp, #752]
+ .long 0xb90323e8 // str w8, [sp, #800]
+ .long 0x1e260048 // fmov w8, s2
+ .long 0xb902efea // str w10, [sp, #748]
+ .long 0x0e1c3c0a // mov w10, v0.s[3]
+ .long 0xb90313e8 // str w8, [sp, #784]
+ .long 0x0e143c28 // mov w8, v1.s[2]
+ .long 0xb9030fea // str w10, [sp, #780]
+ .long 0x1e26000a // fmov w10, s0
+ .long 0x3dc0bfe0 // ldr q0, [sp, #752]
+ .long 0x6f9803b4 // mla v20.4s, v29.4s, v24.s[0]
+ .long 0xb901efe8 // str w8, [sp, #492]
+ .long 0x0e1c3c28 // mov w8, v1.s[3]
+ .long 0x3d80a7f4 // str q20, [sp, #656]
+ .long 0x6f9803a9 // mla v9.4s, v29.4s, v24.s[0]
+ .long 0x3d80afe7 // str q7, [sp, #688]
+ .long 0x4eb31e7b // mov v27.16b, v19.16b
+ .long 0x1e2600a4 // fmov w4, s5
+ .long 0x4eb31e65 // mov v5.16b, v19.16b
+ .long 0x0e0c3c35 // mov w21, v1.s[1]
+ .long 0xb90433e8 // str w8, [sp, #1072]
+ .long 0x1e260028 // fmov w8, s1
+ .long 0x4eb31e67 // mov v7.16b, v19.16b
+ .long 0x4eb31e7c // mov v28.16b, v19.16b
+ .long 0x4eb31e71 // mov v17.16b, v19.16b
+ .long 0x4eb31e74 // mov v20.16b, v19.16b
+ .long 0xad0dcff3 // stp q19, q19, [sp, #432]
+ .long 0x4eb31e68 // mov v8.16b, v19.16b
+ .long 0x3d806bf3 // str q19, [sp, #416]
+ .long 0x4eb31e76 // mov v22.16b, v19.16b
+ .long 0x4eb31e6f // mov v15.16b, v19.16b
+ .long 0x4eb31e7d // mov v29.16b, v19.16b
+ .long 0x4ebf9733 // mla v19.4s, v25.4s, v31.4s
+ .long 0x4eb51ea1 // mov v1.16b, v21.16b
+ .long 0x3d80b7f2 // str q18, [sp, #720]
+ .long 0x3d809be4 // str q4, [sp, #608]
+ .long 0x4ea11c22 // mov v2.16b, v1.16b
+ .long 0x4ea11c23 // mov v3.16b, v1.16b
+ .long 0x4ea11c38 // mov v24.16b, v1.16b
+ .long 0x4ea11c24 // mov v4.16b, v1.16b
+ .long 0x4ea11c26 // mov v6.16b, v1.16b
+ .long 0xad0687e1 // stp q1, q1, [sp, #208]
+ .long 0x4ea11c3e // mov v30.16b, v1.16b
+ .long 0x4ea11c2b // mov v11.16b, v1.16b
+ .long 0x4ea11c30 // mov v16.16b, v1.16b
+ .long 0x4ea11c32 // mov v18.16b, v1.16b
+ .long 0x4ea11c37 // mov v23.16b, v1.16b
+ .long 0x4ebf9721 // mla v1.4s, v25.4s, v31.4s
+ .long 0xb9027fea // str w10, [sp, #636]
+ .long 0x0e1c3e6a // mov w10, v19.s[3]
+ .long 0xb90173ea // str w10, [sp, #368]
+ .long 0x0e1c3c2a // mov w10, v1.s[3]
+ .long 0x4ebf9405 // mla v5.4s, v0.4s, v31.4s
+ .long 0x4ebf9402 // mla v2.4s, v0.4s, v31.4s
+ .long 0x4ebf9c00 // mul v0.4s, v0.4s, v31.4s
+ .long 0xb90153ea // str w10, [sp, #336]
+ .long 0x0e0c3c0a // mov w10, v0.s[1]
+ .long 0xb9028bea // str w10, [sp, #648]
+ .long 0x0e143c0a // mov w10, v0.s[2]
+ .long 0xb902abea // str w10, [sp, #680]
+ .long 0x0e1c3c0a // mov w10, v0.s[3]
+ .long 0xb902cfea // str w10, [sp, #716]
+ .long 0x1e26000a // fmov w10, s0
+ .long 0x3dc0b7e0 // ldr q0, [sp, #720]
+ .long 0x0e1c3cab // mov w11, v5.s[3]
+ .long 0xb90163eb // str w11, [sp, #352]
+ .long 0x0e0c3c4b // mov w11, v2.s[1]
+ .long 0xb900b3eb // str w11, [sp, #176]
+ .long 0x0e143c4b // mov w11, v2.s[2]
+ .long 0xb9019feb // str w11, [sp, #412]
+ .long 0x0e1c3c4b // mov w11, v2.s[3]
+ .long 0x4ebf9407 // mla v7.4s, v0.4s, v31.4s
+ .long 0x4ebf9403 // mla v3.4s, v0.4s, v31.4s
+ .long 0x4ebf9c00 // mul v0.4s, v0.4s, v31.4s
+ .long 0xb90183eb // str w11, [sp, #384]
+ .long 0x0e0c3c0b // mov w11, v0.s[1]
+ .long 0xb902cbeb // str w11, [sp, #712]
+ .long 0x0e143c0b // mov w11, v0.s[2]
+ .long 0xb902d3eb // str w11, [sp, #720]
+ .long 0x0e1c3c0b // mov w11, v0.s[3]
+ .long 0xb902f3eb // str w11, [sp, #752]
+ .long 0x1e26000b // fmov w11, s0
+ .long 0x3dc0a7e0 // ldr q0, [sp, #656]
+ .long 0x0e1c3c70 // mov w16, v3.s[3]
+ .long 0xb9010bf0 // str w16, [sp, #264]
+ .long 0xb9028feb // str w11, [sp, #652]
+ .long 0x4ebf9411 // mla v17.4s, v0.4s, v31.4s
+ .long 0x4ebf9404 // mla v4.4s, v0.4s, v31.4s
+ .long 0x4ebf9c00 // mul v0.4s, v0.4s, v31.4s
+ .long 0x0e0c3c10 // mov w16, v0.s[1]
+ .long 0xb9025ff0 // str w16, [sp, #604]
+ .long 0x0e143c10 // mov w16, v0.s[2]
+ .long 0xb9027bf0 // str w16, [sp, #632]
+ .long 0x0e1c3c10 // mov w16, v0.s[3]
+ .long 0xb90287f0 // str w16, [sp, #644]
+ .long 0x1e260010 // fmov w16, s0
+ .long 0xb9021bf0 // str w16, [sp, #536]
+ .long 0x0e0c3e30 // mov w16, v17.s[1]
+ .long 0xb90093f0 // str w16, [sp, #144]
+ .long 0x0e143e30 // mov w16, v17.s[2]
+ .long 0x3dc0afe0 // ldr q0, [sp, #688]
+ .long 0xb9010ff0 // str w16, [sp, #268]
+ .long 0x0e1c3e30 // mov w16, v17.s[3]
+ .long 0xb90133f0 // str w16, [sp, #304]
+ .long 0x0e0c3c90 // mov w16, v4.s[1]
+ .long 0xb9006ff0 // str w16, [sp, #108]
+ .long 0x0e143c90 // mov w16, v4.s[2]
+ .long 0xb90107f0 // str w16, [sp, #260]
+ .long 0x0e1c3c90 // mov w16, v4.s[3]
+ .long 0x4ebf9414 // mla v20.4s, v0.4s, v31.4s
+ .long 0x4ebf9406 // mla v6.4s, v0.4s, v31.4s
+ .long 0x4ebf9c00 // mul v0.4s, v0.4s, v31.4s
+ .long 0xb90117f0 // str w16, [sp, #276]
+ .long 0x0e0c3c10 // mov w16, v0.s[1]
+ .long 0xb90283f0 // str w16, [sp, #640]
+ .long 0x0e143c10 // mov w16, v0.s[2]
+ .long 0xb90293f0 // str w16, [sp, #656]
+ .long 0x0e1c3c10 // mov w16, v0.s[3]
+ .long 0xb902b3f0 // str w16, [sp, #688]
+ .long 0x1e260010 // fmov w16, s0
+ .long 0xb9023bf0 // str w16, [sp, #568]
+ .long 0x0e143e90 // mov w16, v20.s[2]
+ .long 0xb9006bf0 // str w16, [sp, #104]
+ .long 0x0e1c3e90 // mov w16, v20.s[3]
+ .long 0x3dc093e0 // ldr q0, [sp, #576]
+ .long 0xb9012bf0 // str w16, [sp, #296]
+ .long 0x0e0c3cd0 // mov w16, v6.s[1]
+ .long 0xb9011bf0 // str w16, [sp, #280]
+ .long 0x0e143cd0 // mov w16, v6.s[2]
+ .long 0xb90123f0 // str w16, [sp, #288]
+ .long 0x0e1c3cd0 // mov w16, v6.s[3]
+ .long 0xb90113f0 // str w16, [sp, #272]
+ .long 0x1e2600d0 // fmov w16, s6
+ .long 0x4ebf9416 // mla v22.4s, v0.4s, v31.4s
+ .long 0x4ebf9410 // mla v16.4s, v0.4s, v31.4s
+ .long 0x4ebf9c00 // mul v0.4s, v0.4s, v31.4s
+ .long 0xb90057f0 // str w16, [sp, #84]
+ .long 0x0e0c3c10 // mov w16, v0.s[1]
+ .long 0xb90217f0 // str w16, [sp, #532]
+ .long 0x0e143c10 // mov w16, v0.s[2]
+ .long 0xb9021ff0 // str w16, [sp, #540]
+ .long 0x0e1c3c10 // mov w16, v0.s[3]
+ .long 0xb90243f0 // str w16, [sp, #576]
+ .long 0x1e260010 // fmov w16, s0
+ .long 0xb90203f0 // str w16, [sp, #512]
+ .long 0x0e0c3ed0 // mov w16, v22.s[1]
+ .long 0xb90067f0 // str w16, [sp, #100]
+ .long 0x0e143ed0 // mov w16, v22.s[2]
+ .long 0xb90103f0 // str w16, [sp, #256]
+ .long 0x0e1c3ed0 // mov w16, v22.s[3]
+ .long 0x3dc08be0 // ldr q0, [sp, #544]
+ .long 0xb9014bf0 // str w16, [sp, #328]
+ .long 0x0e0c3e10 // mov w16, v16.s[1]
+ .long 0xb900aff0 // str w16, [sp, #172]
+ .long 0x0e143e10 // mov w16, v16.s[2]
+ .long 0xb900b7f0 // str w16, [sp, #180]
+ .long 0x0e1c3e10 // mov w16, v16.s[3]
+ .long 0xb90127f0 // str w16, [sp, #292]
+ .long 0x1e260210 // fmov w16, s16
+ .long 0x4ebf940f // mla v15.4s, v0.4s, v31.4s
+ .long 0x4ebf9412 // mla v18.4s, v0.4s, v31.4s
+ .long 0x4ebf9c00 // mul v0.4s, v0.4s, v31.4s
+ .long 0xb900f7f0 // str w16, [sp, #244]
+ .long 0x0e0c3c10 // mov w16, v0.s[1]
+ .long 0xb9020bf0 // str w16, [sp, #520]
+ .long 0x0e143c10 // mov w16, v0.s[2]
+ .long 0xb9020ff0 // str w16, [sp, #524]
+ .long 0x0e1c3c10 // mov w16, v0.s[3]
+ .long 0xb90213f0 // str w16, [sp, #528]
+ .long 0x1e260010 // fmov w16, s0
+ .long 0xb901fff0 // str w16, [sp, #508]
+ .long 0x0e0c3df0 // mov w16, v15.s[1]
+ .long 0xb90087f0 // str w16, [sp, #132]
+ .long 0x0e143df0 // mov w16, v15.s[2]
+ .long 0xb900abf0 // str w16, [sp, #168]
+ .long 0x0e1c3df0 // mov w16, v15.s[3]
+ .long 0xb9014ff0 // str w16, [sp, #332]
+ .long 0x1e2601f0 // fmov w16, s15
+ .long 0x3dc09be0 // ldr q0, [sp, #608]
+ .long 0xb9005ff0 // str w16, [sp, #92]
+ .long 0x0e0c3e50 // mov w16, v18.s[1]
+ .long 0xb9007ff0 // str w16, [sp, #124]
+ .long 0x0e143e50 // mov w16, v18.s[2]
+ .long 0xb9008ff0 // str w16, [sp, #140]
+ .long 0x0e1c3e50 // mov w16, v18.s[3]
+ .long 0x0e1c3ceb // mov w11, v7.s[3]
+ .long 0xb9012ff0 // str w16, [sp, #300]
+ .long 0x1e260250 // fmov w16, s18
+ .long 0x4ebf941d // mla v29.4s, v0.4s, v31.4s
+ .long 0x4ebf9417 // mla v23.4s, v0.4s, v31.4s
+ .long 0x4ebf9c00 // mul v0.4s, v0.4s, v31.4s
+ .long 0xb9023fea // str w10, [sp, #572]
+ .long 0xb9011feb // str w11, [sp, #284]
+ .long 0xb90063f0 // str w16, [sp, #96]
+ .long 0x0e0c3c10 // mov w16, v0.s[1]
+ .long 0xf9400129 // ldr x9, [x9]
+ .long 0xb90207f0 // str w16, [sp, #516]
+ .long 0x0e143c10 // mov w16, v0.s[2]
+ .long 0xb90223f0 // str w16, [sp, #544]
+ .long 0x0e1c3c10 // mov w16, v0.s[3]
+ .long 0xb90263f0 // str w16, [sp, #608]
+ .long 0x1e260010 // fmov w16, s0
+ .long 0xb901fbf0 // str w16, [sp, #504]
+ .long 0x0e0c3fb0 // mov w16, v29.s[1]
+ .long 0xb90073f0 // str w16, [sp, #112]
+ .long 0x0e143fb0 // mov w16, v29.s[2]
+ .long 0xb9007bf0 // str w16, [sp, #120]
+ .long 0x0e1c3fb0 // mov w16, v29.s[3]
+ .long 0x8b244924 // add x4, x9, w4, uxtw #2
+ .long 0xb900fff0 // str w16, [sp, #252]
+ .long 0x0d408080 // ld1 {v0.s}[0], [x4]
+ .long 0x0e0c3ee4 // mov w4, v23.s[1]
+ .long 0xb9008be4 // str w4, [sp, #136]
+ .long 0x0e143ee4 // mov w4, v23.s[2]
+ .long 0xb90083e4 // str w4, [sp, #128]
+ .long 0x0e1c3ee4 // mov w4, v23.s[3]
+ .long 0xb900fbe4 // str w4, [sp, #248]
+ .long 0x1e2602e4 // fmov w4, s23
+ .long 0x8b314931 // add x17, x9, w17, uxtw #2
+ .long 0xb90077e4 // str w4, [sp, #116]
+ .long 0x0e0c3c2c // mov w12, v1.s[1]
+ .long 0x0e143c36 // mov w22, v1.s[2]
+ .long 0x1e260034 // fmov w20, s1
+ .long 0x0d408221 // ld1 {v1.s}[0], [x17]
+ .long 0xb941dff1 // ldr w17, [sp, #476]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0e0c3cf9 // mov w25, v7.s[1]
+ .long 0x0e143ce5 // mov w5, v7.s[2]
+ .long 0x8b314931 // add x17, x9, w17, uxtw #2
+ .long 0x0d409220 // ld1 {v0.s}[1], [x17]
+ .long 0x1e2600eb // fmov w11, s7
+ .long 0x0e0c3e78 // mov w24, v19.s[1]
+ .long 0x0e143e67 // mov w7, v19.s[2]
+ .long 0x4ea01c17 // mov v23.16b, v0.16b
+ .long 0x0d408100 // ld1 {v0.s}[0], [x8]
+ .long 0x8b3e4928 // add x8, x9, w30, uxtw #2
+ .long 0x0d409101 // ld1 {v1.s}[1], [x8]
+ .long 0x8b354928 // add x8, x9, w21, uxtw #2
+ .long 0x0d409100 // ld1 {v0.s}[1], [x8]
+ .long 0xb941f7e8 // ldr w8, [sp, #500]
+ .long 0x1e26026d // fmov w13, s19
+ .long 0x4ea11c33 // mov v19.16b, v1.16b
+ .long 0x4ebf9dc1 // mul v1.4s, v14.4s, v31.4s
+ .long 0xbc685926 // ldr s6, [x9, w8, uxtw #2]
+ .long 0xb941f3e8 // ldr w8, [sp, #496]
+ .long 0x0e0c3c31 // mov w17, v1.s[1]
+ .long 0x4ebf95db // mla v27.4s, v14.4s, v31.4s
+ .long 0x0e0c3e86 // mov w6, v20.s[1]
+ .long 0xbc685927 // ldr s7, [x9, w8, uxtw #2]
+ .long 0xb941efe8 // ldr w8, [sp, #492]
+ .long 0x1e260297 // fmov w23, s20
+ .long 0x4ebf95d5 // mla v21.4s, v14.4s, v31.4s
+ .long 0x3dc03bf4 // ldr q20, [sp, #224]
+ .long 0xbc685930 // ldr s16, [x9, w8, uxtw #2]
+ .long 0xb941ebe8 // ldr w8, [sp, #488]
+ .long 0xb901eff1 // str w17, [sp, #492]
+ .long 0x0e143c31 // mov w17, v1.s[2]
+ .long 0xb901f3f1 // str w17, [sp, #496]
+ .long 0x0e1c3c31 // mov w17, v1.s[3]
+ .long 0xb901f7f1 // str w17, [sp, #500]
+ .long 0x1e260031 // fmov w17, s1
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0xb901ebf1 // str w17, [sp, #488]
+ .long 0x0d40810f // ld1 {v15.s}[0], [x8]
+ .long 0x8b2d4928 // add x8, x9, w13, uxtw #2
+ .long 0x0e0c3f6d // mov w13, v27.s[1]
+ .long 0xb90043ed // str w13, [sp, #64]
+ .long 0x0e143f6d // mov w13, v27.s[2]
+ .long 0xb90047ed // str w13, [sp, #68]
+ .long 0x0e1c3f6d // mov w13, v27.s[3]
+ .long 0xb900e3ed // str w13, [sp, #224]
+ .long 0x1e26036d // fmov w13, s27
+ .long 0x4ea01c12 // mov v18.16b, v0.16b
+ .long 0xb9002fed // str w13, [sp, #44]
+ .long 0x0e0c3ead // mov w13, v21.s[1]
+ .long 0x6e140612 // mov v18.s[2], v16.s[0]
+ .long 0x0d408110 // ld1 {v16.s}[0], [x8]
+ .long 0xb9004bed // str w13, [sp, #72]
+ .long 0x0e143ead // mov w13, v21.s[2]
+ .long 0xb90053ed // str w13, [sp, #80]
+ .long 0x0e1c3ead // mov w13, v21.s[3]
+ .long 0x1e26004f // fmov w15, s2
+ .long 0x0e0c3c7a // mov w26, v3.s[1]
+ .long 0x0e143c73 // mov w19, v3.s[2]
+ .long 0x1e260061 // fmov w1, s3
+ .long 0x4ebf95bc // mla v28.4s, v13.4s, v31.4s
+ .long 0x4ebf95b8 // mla v24.4s, v13.4s, v31.4s
+ .long 0x4ebf9da2 // mul v2.4s, v13.4s, v31.4s
+ .long 0xad4637e3 // ldp q3, q13, [sp, #192]
+ .long 0xb900d3ed // str w13, [sp, #208]
+ .long 0x1e2602ad // fmov w13, s21
+ .long 0x8b344928 // add x8, x9, w20, uxtw #2
+ .long 0xb90037ed // str w13, [sp, #52]
+ .long 0x1e26009b // fmov w27, s4
+ .long 0x4ebf9528 // mla v8.4s, v9.4s, v31.4s
+ .long 0x4ebf953e // mla v30.4s, v9.4s, v31.4s
+ .long 0x4ebf9d24 // mul v4.4s, v9.4s, v31.4s
+ .long 0x4eb21e49 // mov v9.16b, v18.16b
+ .long 0x0d408112 // ld1 {v18.s}[0], [x8]
+ .long 0x0e0c3c48 // mov w8, v2.s[1]
+ .long 0xb9004fe8 // str w8, [sp, #76]
+ .long 0x0e143c48 // mov w8, v2.s[2]
+ .long 0xb9005be8 // str w8, [sp, #88]
+ .long 0x0e1c3c48 // mov w8, v2.s[3]
+ .long 0xb900c3e8 // str w8, [sp, #192]
+ .long 0x1e260048 // fmov w8, s2
+ .long 0x1e2602dc // fmov w28, s22
+ .long 0x1e2603b0 // fmov w16, s29
+ .long 0xad4d77f6 // ldp q22, q29, [sp, #416]
+ .long 0xb9003fe8 // str w8, [sp, #60]
+ .long 0xb941e3e8 // ldr w8, [sp, #480]
+ .long 0x1e2600a3 // fmov w3, s5
+ .long 0x6e1404d7 // mov v23.s[2], v6.s[0]
+ .long 0x8b234931 // add x17, x9, w3, uxtw #2
+ .long 0x0e0c3cae // mov w14, v5.s[1]
+ .long 0x0e143caa // mov w10, v5.s[2]
+ .long 0x4ebf9556 // mla v22.4s, v10.4s, v31.4s
+ .long 0x4ebf954b // mla v11.4s, v10.4s, v31.4s
+ .long 0x4ebf9d45 // mul v5.4s, v10.4s, v31.4s
+ .long 0x4eb71eea // mov v10.16b, v23.16b
+ .long 0x0d408237 // ld1 {v23.s}[0], [x17]
+ .long 0x8b284931 // add x17, x9, w8, uxtw #2
+ .long 0xb941e7e8 // ldr w8, [sp, #484]
+ .long 0x8b2c492c // add x12, x9, w12, uxtw #2
+ .long 0x0d40922f // ld1 {v15.s}[1], [x17]
+ .long 0x8b384931 // add x17, x9, w24, uxtw #2
+ .long 0x0d409192 // ld1 {v18.s}[1], [x12]
+ .long 0x8b2e492c // add x12, x9, w14, uxtw #2
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0x0e0c3f88 // mov w8, v28.s[1]
+ .long 0x6e1404f3 // mov v19.s[2], v7.s[0]
+ .long 0x0d409230 // ld1 {v16.s}[1], [x17]
+ .long 0x0d409197 // ld1 {v23.s}[1], [x12]
+ .long 0xbc675922 // ldr s2, [x9, w7, uxtw #2]
+ .long 0xbc765926 // ldr s6, [x9, w22, uxtw #2]
+ .long 0xbc6a5927 // ldr s7, [x9, w10, uxtw #2]
+ .long 0xb90033e8 // str w8, [sp, #48]
+ .long 0x0e143f88 // mov w8, v28.s[2]
+ .long 0xb9003be8 // str w8, [sp, #56]
+ .long 0x0e1c3f88 // mov w8, v28.s[3]
+ .long 0xb900bbe8 // str w8, [sp, #184]
+ .long 0x1e260388 // fmov w8, s28
+ .long 0x8b2f492a // add x10, x9, w15, uxtw #2
+ .long 0xb90023e8 // str w8, [sp, #32]
+ .long 0x0e0c3f08 // mov w8, v24.s[1]
+ .long 0x6e1404f7 // mov v23.s[2], v7.s[0]
+ .long 0x0d408147 // ld1 {v7.s}[0], [x10]
+ .long 0xb90027e8 // str w8, [sp, #36]
+ .long 0x0e143f08 // mov w8, v24.s[2]
+ .long 0xb9002be8 // str w8, [sp, #40]
+ .long 0x0e1c3f08 // mov w8, v24.s[3]
+ .long 0x6e140450 // mov v16.s[2], v2.s[0]
+ .long 0x6e1404d2 // mov v18.s[2], v6.s[0]
+ .long 0x8b2b492a // add x10, x9, w11, uxtw #2
+ .long 0xb900bfe8 // str w8, [sp, #188]
+ .long 0x0e0c3c88 // mov w8, v4.s[1]
+ .long 0x4eb01e19 // mov v25.16b, v16.16b
+ .long 0x4eb21e50 // mov v16.16b, v18.16b
+ .long 0x0d408152 // ld1 {v18.s}[0], [x10]
+ .long 0xb901dfe8 // str w8, [sp, #476]
+ .long 0x0e143c88 // mov w8, v4.s[2]
+ .long 0xb901e3e8 // str w8, [sp, #480]
+ .long 0x0e1c3c88 // mov w8, v4.s[3]
+ .long 0xb901e7e8 // str w8, [sp, #484]
+ .long 0x1e260088 // fmov w8, s4
+ .long 0x1e260222 // fmov w2, s17
+ .long 0x3dc073f1 // ldr q17, [sp, #448]
+ .long 0xb901b3e8 // str w8, [sp, #432]
+ .long 0xb940b3e8 // ldr w8, [sp, #176]
+ .long 0x8b21492a // add x10, x9, w1, uxtw #2
+ .long 0x4ebf959d // mla v29.4s, v12.4s, v31.4s
+ .long 0x4ebf958d // mla v13.4s, v12.4s, v31.4s
+ .long 0x4ebf9d80 // mul v0.4s, v12.4s, v31.4s
+ .long 0x4ebf9471 // mla v17.4s, v3.4s, v31.4s
+ .long 0x4ebf9474 // mla v20.4s, v3.4s, v31.4s
+ .long 0x4ebf9c63 // mul v3.4s, v3.4s, v31.4s
+ .long 0x4eb31e7f // mov v31.16b, v19.16b
+ .long 0x0d408153 // ld1 {v19.s}[0], [x10]
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0xb9419fe8 // ldr w8, [sp, #412]
+ .long 0x6e14042f // mov v15.s[2], v1.s[0]
+ .long 0x0d409147 // ld1 {v7.s}[1], [x10]
+ .long 0x8b39492a // add x10, x9, w25, uxtw #2
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb941dbe8 // ldr w8, [sp, #472]
+ .long 0x0d409152 // ld1 {v18.s}[1], [x10]
+ .long 0x8b3a492a // add x10, x9, w26, uxtw #2
+ .long 0x0d409153 // ld1 {v19.s}[1], [x10]
+ .long 0xbc685926 // ldr s6, [x9, w8, uxtw #2]
+ .long 0x0e1c3d08 // mov w8, v8.s[3]
+ .long 0xbc655922 // ldr s2, [x9, w5, uxtw #2]
+ .long 0xbc735924 // ldr s4, [x9, w19, uxtw #2]
+ .long 0x6e1c04ca // mov v10.s[3], v6.s[0]
+ .long 0x3d8007ea // str q10, [sp, #16]
+ .long 0x8b22492a // add x10, x9, w2, uxtw #2
+ .long 0xb900b3e8 // str w8, [sp, #176]
+ .long 0x0e1c3fc8 // mov w8, v30.s[3]
+ .long 0x0d408146 // ld1 {v6.s}[0], [x10]
+ .long 0x8b3b492a // add x10, x9, w27, uxtw #2
+ .long 0xb900a7e8 // str w8, [sp, #164]
+ .long 0x0e0c3ca8 // mov w8, v5.s[1]
+ .long 0x0d40815b // ld1 {v27.s}[0], [x10]
+ .long 0xb901a3e8 // str w8, [sp, #416]
+ .long 0x0e143ca8 // mov w8, v5.s[2]
+ .long 0xb901c3e8 // str w8, [sp, #448]
+ .long 0x0e1c3ca8 // mov w8, v5.s[3]
+ .long 0xb901dbe8 // str w8, [sp, #472]
+ .long 0x1e2600a8 // fmov w8, s5
+ .long 0xb9019fe8 // str w8, [sp, #412]
+ .long 0xb94093e8 // ldr w8, [sp, #144]
+ .long 0x8b37492a // add x10, x9, w23, uxtw #2
+ .long 0x0d408155 // ld1 {v21.s}[0], [x10]
+ .long 0x6e140427 // mov v7.s[2], v1.s[0]
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0xb9406fe8 // ldr w8, [sp, #108]
+ .long 0x0d409146 // ld1 {v6.s}[1], [x10]
+ .long 0x6e140452 // mov v18.s[2], v2.s[0]
+ .long 0x6e140493 // mov v19.s[2], v4.s[0]
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0xb94197e8 // ldr w8, [sp, #404]
+ .long 0x0d40915b // ld1 {v27.s}[1], [x10]
+ .long 0x8b26492a // add x10, x9, w6, uxtw #2
+ .long 0x0d409155 // ld1 {v21.s}[1], [x10]
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb9410fe8 // ldr w8, [sp, #268]
+ .long 0x1e26030b // fmov w11, s24
+ .long 0x8b304930 // add x16, x9, w16, uxtw #2
+ .long 0x6e1c043f // mov v31.s[3], v1.s[0]
+ .long 0xbc685922 // ldr s2, [x9, w8, uxtw #2]
+ .long 0xb94107e8 // ldr w8, [sp, #260]
+ .long 0x4eb61ec1 // mov v1.16b, v22.16b
+ .long 0x0e0c3c25 // mov w5, v1.s[1]
+ .long 0x6e140446 // mov v6.s[2], v2.s[0]
+ .long 0xbc685924 // ldr s4, [x9, w8, uxtw #2]
+ .long 0xb9406be8 // ldr w8, [sp, #104]
+ .long 0x4ea61cd8 // mov v24.16b, v6.16b
+ .long 0x0e143c37 // mov w23, v1.s[2]
+ .long 0x1e26003e // fmov w30, s1
+ .long 0xbc685925 // ldr s5, [x9, w8, uxtw #2]
+ .long 0xb94057e8 // ldr w8, [sp, #84]
+ .long 0x6e14049b // mov v27.s[2], v4.s[0]
+ .long 0x0e0c3fc2 // mov w2, v30.s[1]
+ .long 0x6e1404b5 // mov v21.s[2], v5.s[0]
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0x0e1c3c28 // mov w8, v1.s[3]
+ .long 0xb9006be8 // str w8, [sp, #104]
+ .long 0x0e1c3d68 // mov w8, v11.s[3]
+ .long 0x0d408156 // ld1 {v22.s}[0], [x10]
+ .long 0xb9006fe8 // str w8, [sp, #108]
+ .long 0xb9411be8 // ldr w8, [sp, #280]
+ .long 0x8b3c492a // add x10, x9, w28, uxtw #2
+ .long 0x0d408146 // ld1 {v6.s}[0], [x10]
+ .long 0x0e143fdb // mov w27, v30.s[2]
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0xb94067e8 // ldr w8, [sp, #100]
+ .long 0x0d409156 // ld1 {v22.s}[1], [x10]
+ .long 0x1e2603c1 // fmov w1, s30
+ .long 0x4ebf1ffe // mov v30.16b, v31.16b
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0xb94123e8 // ldr w8, [sp, #288]
+ .long 0x0d409146 // ld1 {v6.s}[1], [x10]
+ .long 0x0e0c3d63 // mov w3, v11.s[1]
+ .long 0x0e143d7c // mov w28, v11.s[2]
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb94433e8 // ldr w8, [sp, #1072]
+ .long 0x1e260171 // fmov w17, s11
+ .long 0x8b2b492b // add x11, x9, w11, uxtw #2
+ .long 0x6e140436 // mov v22.s[2], v1.s[0]
+ .long 0xbc685922 // ldr s2, [x9, w8, uxtw #2]
+ .long 0xb9419be8 // ldr w8, [sp, #408]
+ .long 0x1e260113 // fmov w19, s8
+ .long 0x0e0c3d1a // mov w26, v8.s[1]
+ .long 0x6e1c0449 // mov v9.s[3], v2.s[0]
+ .long 0xbc685924 // ldr s4, [x9, w8, uxtw #2]
+ .long 0xb94103e8 // ldr w8, [sp, #256]
+ .long 0x0e143d19 // mov w25, v8.s[2]
+ .long 0x6e1c048f // mov v15.s[3], v4.s[0]
+ .long 0xbc685925 // ldr s5, [x9, w8, uxtw #2]
+ .long 0xb940f7e8 // ldr w8, [sp, #244]
+ .long 0x3d8027e9 // str q9, [sp, #144]
+ .long 0x6e1404a6 // mov v6.s[2], v5.s[0]
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0x0e0c3c08 // mov w8, v0.s[1]
+ .long 0xb90123e8 // str w8, [sp, #288]
+ .long 0x0e143c08 // mov w8, v0.s[2]
+ .long 0xb90197e8 // str w8, [sp, #404]
+ .long 0x0e1c3c08 // mov w8, v0.s[3]
+ .long 0xb9019be8 // str w8, [sp, #408]
+ .long 0x1e260008 // fmov w8, s0
+ .long 0xb90103e8 // str w8, [sp, #256]
+ .long 0xb9405fe8 // ldr w8, [sp, #92]
+ .long 0x3d810fe6 // str q6, [sp, #1072]
+ .long 0x4ebd1fa0 // mov v0.16b, v29.16b
+ .long 0x0d408149 // ld1 {v9.s}[0], [x10]
+ .long 0x8b28492a // add x10, x9, w8, uxtw #2
+ .long 0x0e1c3c08 // mov w8, v0.s[3]
+ .long 0xb9005fe8 // str w8, [sp, #92]
+ .long 0x0d40815d // ld1 {v29.s}[0], [x10]
+ .long 0xb94063ea // ldr w10, [sp, #96]
+ .long 0x0e0c3c15 // mov w21, v0.s[1]
+ .long 0x0e143c04 // mov w4, v0.s[2]
+ .long 0x1e260008 // fmov w8, s0
+ .long 0x4ead1da0 // mov v0.16b, v13.16b
+ .long 0x0e1c3c0c // mov w12, v0.s[3]
+ .long 0x8b2a4926 // add x6, x9, w10, uxtw #2
+ .long 0xb90067ec // str w12, [sp, #100]
+ .long 0x0e0c3c6c // mov w12, v3.s[1]
+ .long 0x0d4080cc // ld1 {v12.s}[0], [x6]
+ .long 0xb90107ec // str w12, [sp, #260]
+ .long 0x0e143c6c // mov w12, v3.s[2]
+ .long 0xb9010fec // str w12, [sp, #268]
+ .long 0x0e1c3c6c // mov w12, v3.s[3]
+ .long 0xb9011bec // str w12, [sp, #280]
+ .long 0x1e26006c // fmov w12, s3
+ .long 0xb900f7ec // str w12, [sp, #244]
+ .long 0xb940afec // ldr w12, [sp, #172]
+ .long 0x0d40821f // ld1 {v31.s}[0], [x16]
+ .long 0x0e0c3c07 // mov w7, v0.s[1]
+ .long 0x0e143c0a // mov w10, v0.s[2]
+ .long 0x8b2c4930 // add x16, x9, w12, uxtw #2
+ .long 0xb94087ec // ldr w12, [sp, #132]
+ .long 0x0d409209 // ld1 {v9.s}[1], [x16]
+ .long 0x1e260014 // fmov w20, s0
+ .long 0x4eb11e20 // mov v0.16b, v17.16b
+ .long 0x8b2c4930 // add x16, x9, w12, uxtw #2
+ .long 0xb9407fec // ldr w12, [sp, #124]
+ .long 0x0d40921d // ld1 {v29.s}[1], [x16]
+ .long 0x0e0c3c16 // mov w22, v0.s[1]
+ .long 0x0e1c3c06 // mov w6, v0.s[3]
+ .long 0x8b2c4930 // add x16, x9, w12, uxtw #2
+ .long 0xb94073ec // ldr w12, [sp, #112]
+ .long 0x0d40920c // ld1 {v12.s}[1], [x16]
+ .long 0x1e26000d // fmov w13, s0
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x8b2c4930 // add x16, x9, w12, uxtw #2
+ .long 0xb940b7ec // ldr w12, [sp, #180]
+ .long 0x0d40921f // ld1 {v31.s}[1], [x16]
+ .long 0xbc6c5921 // ldr s1, [x9, w12, uxtw #2]
+ .long 0xb940abec // ldr w12, [sp, #168]
+ .long 0x6e140429 // mov v9.s[2], v1.s[0]
+ .long 0xbc6c5922 // ldr s2, [x9, w12, uxtw #2]
+ .long 0xb9408fec // ldr w12, [sp, #140]
+ .long 0x6e14045d // mov v29.s[2], v2.s[0]
+ .long 0xbc6c5923 // ldr s3, [x9, w12, uxtw #2]
+ .long 0xb9407bec // ldr w12, [sp, #120]
+ .long 0x6e14046c // mov v12.s[2], v3.s[0]
+ .long 0xbc6c5924 // ldr s4, [x9, w12, uxtw #2]
+ .long 0xb94077ec // ldr w12, [sp, #116]
+ .long 0x6e14049f // mov v31.s[2], v4.s[0]
+ .long 0x8b2c4930 // add x16, x9, w12, uxtw #2
+ .long 0x0e143c0c // mov w12, v0.s[2]
+ .long 0x4eb41e80 // mov v0.16b, v20.16b
+ .long 0x0e1c3c0e // mov w14, v0.s[3]
+ .long 0x0d40820b // ld1 {v11.s}[0], [x16]
+ .long 0xb900b7ee // str w14, [sp, #180]
+ .long 0xb94083ee // ldr w14, [sp, #128]
+ .long 0x0e0c3c18 // mov w24, v0.s[1]
+ .long 0x0e143c10 // mov w16, v0.s[2]
+ .long 0x1e26000f // fmov w15, s0
+ .long 0xbc6e5921 // ldr s1, [x9, w14, uxtw #2]
+ .long 0xb9408bee // ldr w14, [sp, #136]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4091cb // ld1 {v11.s}[1], [x14]
+ .long 0xb94173ee // ldr w14, [sp, #368]
+ .long 0x6e14042b // mov v11.s[2], v1.s[0]
+ .long 0xbc6e5922 // ldr s2, [x9, w14, uxtw #2]
+ .long 0xb9402fee // ldr w14, [sp, #44]
+ .long 0x6e1c0459 // mov v25.s[3], v2.s[0]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4081c5 // ld1 {v5.s}[0], [x14]
+ .long 0xb94043ee // ldr w14, [sp, #64]
+ .long 0x3d805ff9 // str q25, [sp, #368]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4091c5 // ld1 {v5.s}[1], [x14]
+ .long 0xb94153ee // ldr w14, [sp, #336]
+ .long 0xbc6e5921 // ldr s1, [x9, w14, uxtw #2]
+ .long 0xb94047ee // ldr w14, [sp, #68]
+ .long 0x6e1c0430 // mov v16.s[3], v1.s[0]
+ .long 0xbc6e5922 // ldr s2, [x9, w14, uxtw #2]
+ .long 0xb94037ee // ldr w14, [sp, #52]
+ .long 0x6e140445 // mov v5.s[2], v2.s[0]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4081c4 // ld1 {v4.s}[0], [x14]
+ .long 0xb9404bee // ldr w14, [sp, #72]
+ .long 0x3d8057f0 // str q16, [sp, #336]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4091c4 // ld1 {v4.s}[1], [x14]
+ .long 0xb94053ee // ldr w14, [sp, #80]
+ .long 0xbc6e5921 // ldr s1, [x9, w14, uxtw #2]
+ .long 0xb94163ee // ldr w14, [sp, #352]
+ .long 0x6e140424 // mov v4.s[2], v1.s[0]
+ .long 0xbc6e5922 // ldr s2, [x9, w14, uxtw #2]
+ .long 0xb9403fee // ldr w14, [sp, #60]
+ .long 0x6e1c0457 // mov v23.s[3], v2.s[0]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4081ca // ld1 {v10.s}[0], [x14]
+ .long 0xb9404fee // ldr w14, [sp, #76]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4091ca // ld1 {v10.s}[1], [x14]
+ .long 0xb94183ee // ldr w14, [sp, #384]
+ .long 0xbc6e5921 // ldr s1, [x9, w14, uxtw #2]
+ .long 0xb9411fee // ldr w14, [sp, #284]
+ .long 0x6e1c0427 // mov v7.s[3], v1.s[0]
+ .long 0xbc6e5922 // ldr s2, [x9, w14, uxtw #2]
+ .long 0xb9410bee // ldr w14, [sp, #264]
+ .long 0x6e1c0452 // mov v18.s[3], v2.s[0]
+ .long 0xbc6e5920 // ldr s0, [x9, w14, uxtw #2]
+ .long 0xb9405bee // ldr w14, [sp, #88]
+ .long 0x6e1c0413 // mov v19.s[3], v0.s[0]
+ .long 0xbc6e5926 // ldr s6, [x9, w14, uxtw #2]
+ .long 0xb94023ee // ldr w14, [sp, #32]
+ .long 0x3d8063e7 // str q7, [sp, #384]
+ .long 0x0d40816e // ld1 {v14.s}[0], [x11]
+ .long 0xb94033eb // ldr w11, [sp, #48]
+ .long 0x8b2e492e // add x14, x9, w14, uxtw #2
+ .long 0x0d4081cd // ld1 {v13.s}[0], [x14]
+ .long 0x6e1404ca // mov v10.s[2], v6.s[0]
+ .long 0x8b2b492b // add x11, x9, w11, uxtw #2
+ .long 0x0d40916d // ld1 {v13.s}[1], [x11]
+ .long 0xb94027eb // ldr w11, [sp, #36]
+ .long 0x8b2b492b // add x11, x9, w11, uxtw #2
+ .long 0x0d40916e // ld1 {v14.s}[1], [x11]
+ .long 0xb9403beb // ldr w11, [sp, #56]
+ .long 0xbc6b5921 // ldr s1, [x9, w11, uxtw #2]
+ .long 0xb9402beb // ldr w11, [sp, #40]
+ .long 0x6e14042d // mov v13.s[2], v1.s[0]
+ .long 0xbc6b5922 // ldr s2, [x9, w11, uxtw #2]
+ .long 0xb94133eb // ldr w11, [sp, #304]
+ .long 0x6e14044e // mov v14.s[2], v2.s[0]
+ .long 0xbc6b5920 // ldr s0, [x9, w11, uxtw #2]
+ .long 0xb94117eb // ldr w11, [sp, #276]
+ .long 0x6e1c0418 // mov v24.s[3], v0.s[0]
+ .long 0xbc6b5926 // ldr s6, [x9, w11, uxtw #2]
+ .long 0x3d804ff8 // str q24, [sp, #304]
+ .long 0x8b33492b // add x11, x9, w19, uxtw #2
+ .long 0x6e1c04db // mov v27.s[3], v6.s[0]
+ .long 0x3d805bfb // str q27, [sp, #352]
+ .long 0x0d40817c // ld1 {v28.s}[0], [x11]
+ .long 0x8b21492b // add x11, x9, w1, uxtw #2
+ .long 0x0d40817b // ld1 {v27.s}[0], [x11]
+ .long 0x8b3a492b // add x11, x9, w26, uxtw #2
+ .long 0x0d40917c // ld1 {v28.s}[1], [x11]
+ .long 0x8b22492b // add x11, x9, w2, uxtw #2
+ .long 0x0d40917b // ld1 {v27.s}[1], [x11]
+ .long 0xb9412beb // ldr w11, [sp, #296]
+ .long 0xbc795920 // ldr s0, [x9, w25, uxtw #2]
+ .long 0xbc7b5926 // ldr s6, [x9, w27, uxtw #2]
+ .long 0xf941e7e1 // ldr x1, [sp, #968]
+ .long 0xbc6b5921 // ldr s1, [x9, w11, uxtw #2]
+ .long 0xb94113eb // ldr w11, [sp, #272]
+ .long 0x6e14041c // mov v28.s[2], v0.s[0]
+ .long 0x6e1404db // mov v27.s[2], v6.s[0]
+ .long 0x6e1c0435 // mov v21.s[3], v1.s[0]
+ .long 0xbc6b5922 // ldr s2, [x9, w11, uxtw #2]
+ .long 0x8b3e492b // add x11, x9, w30, uxtw #2
+ .long 0x0d408179 // ld1 {v25.s}[0], [x11]
+ .long 0x8b31492b // add x11, x9, w17, uxtw #2
+ .long 0x0d408178 // ld1 {v24.s}[0], [x11]
+ .long 0x8b25492b // add x11, x9, w5, uxtw #2
+ .long 0x0d409179 // ld1 {v25.s}[1], [x11]
+ .long 0x8b23492b // add x11, x9, w3, uxtw #2
+ .long 0x0d409178 // ld1 {v24.s}[1], [x11]
+ .long 0xb9414beb // ldr w11, [sp, #328]
+ .long 0xbc775921 // ldr s1, [x9, w23, uxtw #2]
+ .long 0x6e1c0456 // mov v22.s[3], v2.s[0]
+ .long 0xbc7c5922 // ldr s2, [x9, w28, uxtw #2]
+ .long 0xbc6b5920 // ldr s0, [x9, w11, uxtw #2]
+ .long 0xb94127eb // ldr w11, [sp, #292]
+ .long 0x6e140439 // mov v25.s[2], v1.s[0]
+ .long 0x3dc10fe1 // ldr q1, [sp, #1072]
+ .long 0x6e140458 // mov v24.s[2], v2.s[0]
+ .long 0xbc6b5926 // ldr s6, [x9, w11, uxtw #2]
+ .long 0x4eb6d5e8 // fsub v8.4s, v15.4s, v22.4s
+ .long 0x6e1c0401 // mov v1.s[3], v0.s[0]
+ .long 0x3d810fe1 // str q1, [sp, #1072]
+ .long 0x6e1c04c9 // mov v9.s[3], v6.s[0]
+ .long 0x0d408106 // ld1 {v6.s}[0], [x8]
+ .long 0x8b344928 // add x8, x9, w20, uxtw #2
+ .long 0x0d408107 // ld1 {v7.s}[0], [x8]
+ .long 0x8b354928 // add x8, x9, w21, uxtw #2
+ .long 0x0d409106 // ld1 {v6.s}[1], [x8]
+ .long 0x8b274928 // add x8, x9, w7, uxtw #2
+ .long 0x0d409107 // ld1 {v7.s}[1], [x8]
+ .long 0xb9414fe8 // ldr w8, [sp, #332]
+ .long 0xbc645921 // ldr s1, [x9, w4, uxtw #2]
+ .long 0xbc6a5922 // ldr s2, [x9, w10, uxtw #2]
+ .long 0x4e28cf56 // fmla v22.4s, v26.4s, v8.4s
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb9412fe8 // ldr w8, [sp, #300]
+ .long 0x6e140426 // mov v6.s[2], v1.s[0]
+ .long 0x6e140447 // mov v7.s[2], v2.s[0]
+ .long 0x6e1c041d // mov v29.s[3], v0.s[0]
+ .long 0xbc685930 // ldr s16, [x9, w8, uxtw #2]
+ .long 0xb940ffe8 // ldr w8, [sp, #252]
+ .long 0xf941efe2 // ldr x2, [sp, #984]
+ .long 0xf941f3e3 // ldr x3, [sp, #992]
+ .long 0x6e1c060c // mov v12.s[3], v16.s[0]
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb940fbe8 // ldr w8, [sp, #248]
+ .long 0xf941f7e4 // ldr x4, [sp, #1000]
+ .long 0x6e1c043f // mov v31.s[3], v1.s[0]
+ .long 0xbc685922 // ldr s2, [x9, w8, uxtw #2]
+ .long 0xb940e3e8 // ldr w8, [sp, #224]
+ .long 0x6e1c044b // mov v11.s[3], v2.s[0]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb940d3e8 // ldr w8, [sp, #208]
+ .long 0x6e1c0405 // mov v5.s[3], v0.s[0]
+ .long 0xbc685930 // ldr s16, [x9, w8, uxtw #2]
+ .long 0xb940c3e8 // ldr w8, [sp, #192]
+ .long 0x6e1c0604 // mov v4.s[3], v16.s[0]
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb940bbe8 // ldr w8, [sp, #184]
+ .long 0xbc6c5930 // ldr s16, [x9, w12, uxtw #2]
+ .long 0x6e1c042a // mov v10.s[3], v1.s[0]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0x8b2d4928 // add x8, x9, w13, uxtw #2
+ .long 0x0d408103 // ld1 {v3.s}[0], [x8]
+ .long 0x8b364928 // add x8, x9, w22, uxtw #2
+ .long 0x6e1c040d // mov v13.s[3], v0.s[0]
+ .long 0xbc705921 // ldr s1, [x9, w16, uxtw #2]
+ .long 0x0d409103 // ld1 {v3.s}[1], [x8]
+ .long 0xb940bfe8 // ldr w8, [sp, #188]
+ .long 0x6e140603 // mov v3.s[2], v16.s[0]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0x8b2f4928 // add x8, x9, w15, uxtw #2
+ .long 0x0d408102 // ld1 {v2.s}[0], [x8]
+ .long 0x8b384928 // add x8, x9, w24, uxtw #2
+ .long 0x6e1c040e // mov v14.s[3], v0.s[0]
+ .long 0x0d409102 // ld1 {v2.s}[1], [x8]
+ .long 0xb940b3e8 // ldr w8, [sp, #176]
+ .long 0x6e140422 // mov v2.s[2], v1.s[0]
+ .long 0xbc685930 // ldr s16, [x9, w8, uxtw #2]
+ .long 0xb940a7e8 // ldr w8, [sp, #164]
+ .long 0x6e1c061c // mov v28.s[3], v16.s[0]
+ .long 0xbc685931 // ldr s17, [x9, w8, uxtw #2]
+ .long 0xb9406be8 // ldr w8, [sp, #104]
+ .long 0x6e1c063b // mov v27.s[3], v17.s[0]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb9431be8 // ldr w8, [sp, #792]
+ .long 0x6e1c0419 // mov v25.s[3], v0.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408114 // ld1 {v20.s}[0], [x8]
+ .long 0xb9406fe8 // ldr w8, [sp, #108]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb9405fe8 // ldr w8, [sp, #92]
+ .long 0x6e1c0418 // mov v24.s[3], v0.s[0]
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb94333e8 // ldr w8, [sp, #816]
+ .long 0x6e1c0426 // mov v6.s[3], v1.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409114 // ld1 {v20.s}[1], [x8]
+ .long 0xb94343e8 // ldr w8, [sp, #832]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408114 // ld1 {v20.s}[2], [x8]
+ .long 0xb94313e8 // ldr w8, [sp, #784]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408111 // ld1 {v17.s}[0], [x8]
+ .long 0xb94067e8 // ldr w8, [sp, #100]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb94353e8 // ldr w8, [sp, #848]
+ .long 0x6e1c0407 // mov v7.s[3], v0.s[0]
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb94317e8 // ldr w8, [sp, #788]
+ .long 0x3dc007e0 // ldr q0, [sp, #16]
+ .long 0x6e1c0434 // mov v20.s[3], v1.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409111 // ld1 {v17.s}[1], [x8]
+ .long 0xb9431fe8 // ldr w8, [sp, #796]
+ .long 0x4eb2d400 // fsub v0.4s, v0.4s, v18.4s
+ .long 0x4e20cf52 // fmla v18.4s, v26.4s, v0.4s
+ .long 0x4eb3d7c0 // fsub v0.4s, v30.4s, v19.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408111 // ld1 {v17.s}[2], [x8]
+ .long 0xb94323e8 // ldr w8, [sp, #800]
+ .long 0x4e20cf53 // fmla v19.4s, v26.4s, v0.4s
+ .long 0x3dc027e0 // ldr q0, [sp, #144]
+ .long 0xbc685921 // ldr s1, [x9, w8, uxtw #2]
+ .long 0xb9427fe8 // ldr w8, [sp, #636]
+ .long 0x3d80cbf2 // str q18, [sp, #800]
+ .long 0x3d80d7f3 // str q19, [sp, #848]
+ .long 0x4eb5d400 // fsub v0.4s, v0.4s, v21.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408110 // ld1 {v16.s}[0], [x8]
+ .long 0xb942afe8 // ldr w8, [sp, #684]
+ .long 0x4e20cf55 // fmla v21.4s, v26.4s, v0.4s
+ .long 0x3d80d3f5 // str q21, [sp, #832]
+ .long 0xbc665920 // ldr s0, [x9, w6, uxtw #2]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409110 // ld1 {v16.s}[1], [x8]
+ .long 0xb942efe8 // ldr w8, [sp, #748]
+ .long 0x3d80cff6 // str q22, [sp, #816]
+ .long 0x6e1c0403 // mov v3.s[3], v0.s[0]
+ .long 0x6e1c0431 // mov v17.s[3], v1.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408110 // ld1 {v16.s}[2], [x8]
+ .long 0xb9423fe8 // ldr w8, [sp, #572]
+ .long 0x3dc063e1 // ldr q1, [sp, #384]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408108 // ld1 {v8.s}[0], [x8]
+ .long 0xb940b7e8 // ldr w8, [sp, #180]
+ .long 0x4ea4d42f // fsub v15.4s, v1.4s, v4.4s
+ .long 0x4e2fcf44 // fmla v4.4s, v26.4s, v15.4s
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb9430fe8 // ldr w8, [sp, #780]
+ .long 0x6e1c0402 // mov v2.s[3], v0.s[0]
+ .long 0xbc685932 // ldr s18, [x9, w8, uxtw #2]
+ .long 0xb9428be8 // ldr w8, [sp, #648]
+ .long 0x3dc05fe0 // ldr q0, [sp, #368]
+ .long 0x6e1c0650 // mov v16.s[3], v18.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409108 // ld1 {v8.s}[1], [x8]
+ .long 0xb942abe8 // ldr w8, [sp, #680]
+ .long 0x4ebfd400 // fsub v0.4s, v0.4s, v31.4s
+ .long 0x4e20cf5f // fmla v31.4s, v26.4s, v0.4s
+ .long 0x3dc057e0 // ldr q0, [sp, #336]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408108 // ld1 {v8.s}[2], [x8]
+ .long 0xb942cfe8 // ldr w8, [sp, #716]
+ .long 0x4eabd400 // fsub v0.4s, v0.4s, v11.4s
+ .long 0x4e20cf4b // fmla v11.4s, v26.4s, v0.4s
+ .long 0x4ea5d6e0 // fsub v0.4s, v23.4s, v5.4s
+ .long 0xbc685932 // ldr s18, [x9, w8, uxtw #2]
+ .long 0xb9428fe8 // ldr w8, [sp, #652]
+ .long 0x4e20cf45 // fmla v5.4s, v26.4s, v0.4s
+ .long 0x6e1c0648 // mov v8.s[3], v18.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d40811e // ld1 {v30.s}[0], [x8]
+ .long 0xb9421be8 // ldr w8, [sp, #536]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408112 // ld1 {v18.s}[0], [x8]
+ .long 0xb942cbe8 // ldr w8, [sp, #712]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d40911e // ld1 {v30.s}[1], [x8]
+ .long 0xb9425fe8 // ldr w8, [sp, #604]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409112 // ld1 {v18.s}[1], [x8]
+ .long 0xb942d3e8 // ldr w8, [sp, #720]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d40811e // ld1 {v30.s}[2], [x8]
+ .long 0xb9427be8 // ldr w8, [sp, #632]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408112 // ld1 {v18.s}[2], [x8]
+ .long 0xb942f3e8 // ldr w8, [sp, #752]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb94287e8 // ldr w8, [sp, #644]
+ .long 0x6e1c041e // mov v30.s[3], v0.s[0]
+ .long 0xbc685933 // ldr s19, [x9, w8, uxtw #2]
+ .long 0xb9423be8 // ldr w8, [sp, #568]
+ .long 0x3dc04fe0 // ldr q0, [sp, #304]
+ .long 0x4ebed694 // fsub v20.4s, v20.4s, v30.4s
+ .long 0x6e1c0672 // mov v18.s[3], v19.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408113 // ld1 {v19.s}[0], [x8]
+ .long 0xb94203e8 // ldr w8, [sp, #512]
+ .long 0x4eadd400 // fsub v0.4s, v0.4s, v13.4s
+ .long 0x4e20cf4d // fmla v13.4s, v26.4s, v0.4s
+ .long 0x3dc05be0 // ldr q0, [sp, #352]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d40810f // ld1 {v15.s}[0], [x8]
+ .long 0xb94283e8 // ldr w8, [sp, #640]
+ .long 0x4eaed400 // fsub v0.4s, v0.4s, v14.4s
+ .long 0x4e20cf4e // fmla v14.4s, v26.4s, v0.4s
+ .long 0x4e34cf5e // fmla v30.4s, v26.4s, v20.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409113 // ld1 {v19.s}[1], [x8]
+ .long 0xb94217e8 // ldr w8, [sp, #532]
+ .long 0x4eaad652 // fsub v18.4s, v18.4s, v10.4s
+ .long 0x4e32cf4a // fmla v10.4s, v26.4s, v18.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d40910f // ld1 {v15.s}[1], [x8]
+ .long 0xb94293e8 // ldr w8, [sp, #656]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408113 // ld1 {v19.s}[2], [x8]
+ .long 0xb9421fe8 // ldr w8, [sp, #540]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d40810f // ld1 {v15.s}[2], [x8]
+ .long 0xb941ffe8 // ldr w8, [sp, #508]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408101 // ld1 {v1.s}[0], [x8]
+ .long 0xb942b3e8 // ldr w8, [sp, #688]
+ .long 0xbc685920 // ldr s0, [x9, w8, uxtw #2]
+ .long 0xb94243e8 // ldr w8, [sp, #576]
+ .long 0x6e1c0413 // mov v19.s[3], v0.s[0]
+ .long 0xbc685935 // ldr s21, [x9, w8, uxtw #2]
+ .long 0xb9420be8 // ldr w8, [sp, #520]
+ .long 0x3dc10fe0 // ldr q0, [sp, #1072]
+ .long 0x4eb3d631 // fsub v17.4s, v17.4s, v19.4s
+ .long 0x6e1c06af // mov v15.s[3], v21.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409101 // ld1 {v1.s}[1], [x8]
+ .long 0xb9420fe8 // ldr w8, [sp, #524]
+ .long 0x4eb9d400 // fsub v0.4s, v0.4s, v25.4s
+ .long 0x4e20cf59 // fmla v25.4s, v26.4s, v0.4s
+ .long 0x4eb8d520 // fsub v0.4s, v9.4s, v24.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408101 // ld1 {v1.s}[2], [x8]
+ .long 0xb94213e8 // ldr w8, [sp, #528]
+ .long 0x4e20cf58 // fmla v24.4s, v26.4s, v0.4s
+ .long 0x4ea6d7a0 // fsub v0.4s, v29.4s, v6.4s
+ .long 0x4e20cf46 // fmla v6.4s, v26.4s, v0.4s
+ .long 0xbc685935 // ldr s21, [x9, w8, uxtw #2]
+ .long 0xb941fbe8 // ldr w8, [sp, #504]
+ .long 0x4ea7d589 // fsub v9.4s, v12.4s, v7.4s
+ .long 0x4e29cf47 // fmla v7.4s, v26.4s, v9.4s
+ .long 0x6e1c06a1 // mov v1.s[3], v21.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408115 // ld1 {v21.s}[0], [x8]
+ .long 0xb94207e8 // ldr w8, [sp, #516]
+ .long 0x4e31cf53 // fmla v19.4s, v26.4s, v17.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409115 // ld1 {v21.s}[1], [x8]
+ .long 0xb941ebe8 // ldr w8, [sp, #488]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408100 // ld1 {v0.s}[0], [x8]
+ .long 0xb941b3e8 // ldr w8, [sp, #432]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d40811d // ld1 {v29.s}[0], [x8]
+ .long 0xb941efe8 // ldr w8, [sp, #492]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409100 // ld1 {v0.s}[1], [x8]
+ .long 0xb941dfe8 // ldr w8, [sp, #476]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d40911d // ld1 {v29.s}[1], [x8]
+ .long 0xb94223e8 // ldr w8, [sp, #544]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408115 // ld1 {v21.s}[2], [x8]
+ .long 0xb941f3e8 // ldr w8, [sp, #496]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408100 // ld1 {v0.s}[2], [x8]
+ .long 0xb941e3e8 // ldr w8, [sp, #480]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d40811d // ld1 {v29.s}[2], [x8]
+ .long 0xb94263e8 // ldr w8, [sp, #608]
+ .long 0xbc68592c // ldr s12, [x9, w8, uxtw #2]
+ .long 0xb941f7e8 // ldr w8, [sp, #500]
+ .long 0x6e1c0595 // mov v21.s[3], v12.s[0]
+ .long 0xbc685936 // ldr s22, [x9, w8, uxtw #2]
+ .long 0xb941e7e8 // ldr w8, [sp, #484]
+ .long 0x4eb5d610 // fsub v16.4s, v16.4s, v21.4s
+ .long 0x4e30cf55 // fmla v21.4s, v26.4s, v16.4s
+ .long 0x6e1c06c0 // mov v0.s[3], v22.s[0]
+ .long 0xbc685937 // ldr s23, [x9, w8, uxtw #2]
+ .long 0xb9419fe8 // ldr w8, [sp, #412]
+ .long 0x4ea3d796 // fsub v22.4s, v28.4s, v3.4s
+ .long 0x4e36cf43 // fmla v3.4s, v26.4s, v22.4s
+ .long 0x4ea2d776 // fsub v22.4s, v27.4s, v2.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4e36cf42 // fmla v2.4s, v26.4s, v22.4s
+ .long 0x0d408116 // ld1 {v22.s}[0], [x8]
+ .long 0xb94103e8 // ldr w8, [sp, #256]
+ .long 0x6e1c06fd // mov v29.s[3], v23.s[0]
+ .long 0x4ea0d510 // fsub v16.4s, v8.4s, v0.4s
+ .long 0x4e30cf40 // fmla v0.4s, v26.4s, v16.4s
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408117 // ld1 {v23.s}[0], [x8]
+ .long 0xb941a3e8 // ldr w8, [sp, #416]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409116 // ld1 {v22.s}[1], [x8]
+ .long 0xb94123e8 // ldr w8, [sp, #288]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409117 // ld1 {v23.s}[1], [x8]
+ .long 0xb941c3e8 // ldr w8, [sp, #448]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408116 // ld1 {v22.s}[2], [x8]
+ .long 0xb94197e8 // ldr w8, [sp, #404]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408117 // ld1 {v23.s}[2], [x8]
+ .long 0xb941dbe8 // ldr w8, [sp, #472]
+ .long 0xbc68593b // ldr s27, [x9, w8, uxtw #2]
+ .long 0xb9419be8 // ldr w8, [sp, #408]
+ .long 0x6e1c0776 // mov v22.s[3], v27.s[0]
+ .long 0xbc68593c // ldr s28, [x9, w8, uxtw #2]
+ .long 0xb940f7e8 // ldr w8, [sp, #244]
+ .long 0x4eb6d5f0 // fsub v16.4s, v15.4s, v22.4s
+ .long 0x4e30cf56 // fmla v22.4s, v26.4s, v16.4s
+ .long 0x6e1c0797 // mov v23.s[3], v28.s[0]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d408109 // ld1 {v9.s}[0], [x8]
+ .long 0xb94107e8 // ldr w8, [sp, #260]
+ .long 0x4eb7d421 // fsub v1.4s, v1.4s, v23.4s
+ .long 0x4e21cf57 // fmla v23.4s, v26.4s, v1.4s
+ .long 0x3dc0e7f0 // ldr q16, [sp, #912]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x0d409109 // ld1 {v9.s}[1], [x8]
+ .long 0xb9410fe8 // ldr w8, [sp, #268]
+ .long 0x8b284928 // add x8, x9, w8, uxtw #2
+ .long 0x4d408109 // ld1 {v9.s}[2], [x8]
+ .long 0xb9411be8 // ldr w8, [sp, #280]
+ .long 0xbc685934 // ldr s20, [x9, w8, uxtw #2]
+ .long 0xf941ebe8 // ldr x8, [sp, #976]
+ .long 0x6e1c0689 // mov v9.s[3], v20.s[0]
+ .long 0x4ea9d7a1 // fsub v1.4s, v29.4s, v9.4s
+ .long 0x4e21cf49 // fmla v9.4s, v26.4s, v1.4s
+ .long 0x3dc0dbe1 // ldr q1, [sp, #864]
+ .long 0xf9400505 // ldr x5, [x8, #8]
+ .long 0x4e21d821 // scvtf v1.4s, v1.4s
+ .long 0x4ea1d601 // fsub v1.4s, v16.4s, v1.4s
+ .long 0x3dc0cbf0 // ldr q16, [sp, #800]
+ .long 0x4ea5d610 // fsub v16.4s, v16.4s, v5.4s
+ .long 0x4e30cc25 // fmla v5.4s, v1.4s, v16.4s
+ .long 0x3dc0d7f0 // ldr q16, [sp, #848]
+ .long 0x4ea4d610 // fsub v16.4s, v16.4s, v4.4s
+ .long 0x4e30cc24 // fmla v4.4s, v1.4s, v16.4s
+ .long 0x3dc0d3f0 // ldr q16, [sp, #832]
+ .long 0x4eadd610 // fsub v16.4s, v16.4s, v13.4s
+ .long 0x4e30cc2d // fmla v13.4s, v1.4s, v16.4s
+ .long 0x3dc0cff0 // ldr q16, [sp, #816]
+ .long 0x4eaed610 // fsub v16.4s, v16.4s, v14.4s
+ .long 0x4e30cc2e // fmla v14.4s, v1.4s, v16.4s
+ .long 0x4ea6d7f0 // fsub v16.4s, v31.4s, v6.4s
+ .long 0x4e30cc26 // fmla v6.4s, v1.4s, v16.4s
+ .long 0x4ea7d570 // fsub v16.4s, v11.4s, v7.4s
+ .long 0x4e30cc27 // fmla v7.4s, v1.4s, v16.4s
+ .long 0x4ea3d730 // fsub v16.4s, v25.4s, v3.4s
+ .long 0x4e30cc23 // fmla v3.4s, v1.4s, v16.4s
+ .long 0x4ea2d710 // fsub v16.4s, v24.4s, v2.4s
+ .long 0x4e30cc22 // fmla v2.4s, v1.4s, v16.4s
+ .long 0x4eaad670 // fsub v16.4s, v19.4s, v10.4s
+ .long 0x4e30cc2a // fmla v10.4s, v1.4s, v16.4s
+ .long 0x4ea0d7d0 // fsub v16.4s, v30.4s, v0.4s
+ .long 0x4e30cc20 // fmla v0.4s, v1.4s, v16.4s
+ .long 0x4eb7d6b0 // fsub v16.4s, v21.4s, v23.4s
+ .long 0x4e30cc37 // fmla v23.4s, v1.4s, v16.4s
+ .long 0x4ea9d6d0 // fsub v16.4s, v22.4s, v9.4s
+ .long 0x4e30cc29 // fmla v9.4s, v1.4s, v16.4s
+ .long 0x3dc0dfe1 // ldr q1, [sp, #880]
+ .long 0x3dc0ebf0 // ldr q16, [sp, #928]
+ .long 0x4ea3d4c6 // fsub v6.4s, v6.4s, v3.4s
+ .long 0x4e21d821 // scvtf v1.4s, v1.4s
+ .long 0x4ea1d601 // fsub v1.4s, v16.4s, v1.4s
+ .long 0x4e26cc23 // fmla v3.4s, v1.4s, v6.4s
+ .long 0x4ea2d4e6 // fsub v6.4s, v7.4s, v2.4s
+ .long 0x4ea5d5b0 // fsub v16.4s, v13.4s, v5.4s
+ .long 0x4e26cc22 // fmla v2.4s, v1.4s, v6.4s
+ .long 0x4ea0d546 // fsub v6.4s, v10.4s, v0.4s
+ .long 0x4e30cc25 // fmla v5.4s, v1.4s, v16.4s
+ .long 0x4ea4d5d0 // fsub v16.4s, v14.4s, v4.4s
+ .long 0x4e26cc20 // fmla v0.4s, v1.4s, v6.4s
+ .long 0x4ea9d6e6 // fsub v6.4s, v23.4s, v9.4s
+ .long 0x4e30cc24 // fmla v4.4s, v1.4s, v16.4s
+ .long 0x4e26cc29 // fmla v9.4s, v1.4s, v6.4s
+ .long 0x3dc0e3e1 // ldr q1, [sp, #896]
+ .long 0x3dc0efe6 // ldr q6, [sp, #944]
+ .long 0x4ea5d463 // fsub v3.4s, v3.4s, v5.4s
+ .long 0x4ea4d442 // fsub v2.4s, v2.4s, v4.4s
+ .long 0x4e21d821 // scvtf v1.4s, v1.4s
+ .long 0x4ea1d4c1 // fsub v1.4s, v6.4s, v1.4s
+ .long 0x4e23cc25 // fmla v5.4s, v1.4s, v3.4s
+ .long 0x4e22cc24 // fmla v4.4s, v1.4s, v2.4s
+ .long 0x4ea0d522 // fsub v2.4s, v9.4s, v0.4s
+ .long 0x4e22cc20 // fmla v0.4s, v1.4s, v2.4s
+ .long 0x4ea51ca1 // mov v1.16b, v5.16b
+ .long 0x4ea41c82 // mov v2.16b, v4.16b
+ .long 0xad5f97e4 // ldp q4, q5, [sp, #1008]
+ .long 0x3dc107e6 // ldr q6, [sp, #1040]
+ .long 0x3dc10be7 // ldr q7, [sp, #1056]
+ .long 0x4f03f603 // fmov v3.4s, #1.000000000000000000e+00
+ .long 0x911143ff // add sp, sp, #0x450
+ .long 0xa9497bfd // ldp x29, x30, [sp, #144]
+ .long 0xa9484ff4 // ldp x20, x19, [sp, #128]
+ .long 0xa94757f6 // ldp x22, x21, [sp, #112]
+ .long 0xa9465ff8 // ldp x24, x23, [sp, #96]
+ .long 0xa94567fa // ldp x26, x25, [sp, #80]
+ .long 0xa9446ffc // ldp x28, x27, [sp, #64]
+ .long 0x6d4323e9 // ldp d9, d8, [sp, #48]
+ .long 0x6d422beb // ldp d11, d10, [sp, #32]
+ .long 0x6d4133ed // ldp d13, d12, [sp, #16]
+ .long 0x6cca3bef // ldp d15, d14, [sp], #160
+ .long 0xd61f00a0 // br x5
#elif defined(__arm__)
BALIGN4
@@ -13336,6 +15042,1480 @@ _sk_callback_vfp4:
.long 0xe5942004 // ldr r2, [r4, #4]
.long 0xe8bd4c70 // pop {r4, r5, r6, sl, fp, lr}
.long 0xe12fff12 // bx r2
+
+HIDDEN _sk_clut_3D_vfp4
+.globl _sk_clut_3D_vfp4
+FUNCTION(_sk_clut_3D_vfp4)
+_sk_clut_3D_vfp4:
+ .long 0xe92d4830 // push {r4, r5, fp, lr}
+ .long 0xed2d8b10 // vpush {d8-d15}
+ .long 0xe24dd090 // sub sp, sp, #144
+ .long 0xe28db050 // add fp, sp, #80
+ .long 0xe2812004 // add r2, r1, #4
+ .long 0xe1a0c001 // mov ip, r1
+ .long 0xf280c053 // vmov.i32 q6, #3
+ .long 0xec8b6b04 // vstmia fp, {d6-d7}
+ .long 0xe58d208c // str r2, [sp, #140]
+ .long 0xe49c2008 // ldr r2, [ip], #8
+ .long 0xe8924008 // ldm r2, {r3, lr}
+ .long 0xe5924008 // ldr r4, [r2, #8]
+ .long 0xe592200c // ldr r2, [r2, #12]
+ .long 0xe2445001 // sub r5, r4, #1
+ .long 0xee0e4b90 // vmov.32 d30[0], r4
+ .long 0xeea05b90 // vdup.32 q8, r5
+ .long 0xe24e5001 // sub r5, lr, #1
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xee0c2b90 // vmov.32 d28[0], r2
+ .long 0xe28de060 // add lr, sp, #96
+ .long 0xf22e89fc // vmul.i32 q4, q15, q14
+ .long 0xf3006dd2 // vmul.f32 q3, q8, q1
+ .long 0xeea05b90 // vdup.32 q8, r5
+ .long 0xf3fb2660 // vcvt.f32.s32 q9, q8
+ .long 0xe2425001 // sub r5, r2, #1
+ .long 0xeea02b90 // vdup.32 q8, r2
+ .long 0xeea65b90 // vdup.32 q11, r5
+ .long 0xf3fb8666 // vcvt.f32.s32 q12, q11
+ .long 0xf3fba746 // vcvt.s32.f32 q13, q3
+ .long 0xf3426dd0 // vmul.f32 q11, q9, q0
+ .long 0xf3488dd4 // vmul.f32 q12, q12, q2
+ .long 0xf26a29f0 // vmul.i32 q9, q13, q8
+ .long 0xf3bb2766 // vcvt.s32.f32 q1, q11
+ .long 0xecce8b04 // vstmia lr, {d24-d25}
+ .long 0xe28de070 // add lr, sp, #112
+ .long 0xf3fba66a // vcvt.f32.s32 q13, q13
+ .long 0xf262e9dc // vmul.i32 q15, q9, q6
+ .long 0xf3fb2768 // vcvt.s32.f32 q9, q12
+ .long 0xf3e24848 // vmul.i32 q10, q1, d8[0]
+ .long 0xecceeb04 // vstmia lr, {d30-d31}
+ .long 0xe28de040 // add lr, sp, #64
+ .long 0xf262e9cc // vmla.i32 q15, q9, q6
+ .long 0xf22201f2 // vorr q0, q9, q9
+ .long 0xf2c02052 // vmov.i32 q9, #2
+ .long 0xf3bb2642 // vcvt.f32.s32 q1, q1
+ .long 0xec8e0b04 // vstmia lr, {d0-d1}
+ .long 0xe28de030 // add lr, sp, #48
+ .long 0xf22ea1fe // vorr q5, q15, q15
+ .long 0xf224a9cc // vmla.i32 q5, q10, q6
+ .long 0xf26a8862 // vadd.i32 q12, q5, q9
+ .long 0xee394b90 // vmov.32 r4, d25[1]
+ .long 0xee385b90 // vmov.32 r5, d24[1]
+ .long 0xee182b90 // vmov.32 r2, d24[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd45a00 // vldr s11, [r4]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee194b90 // vmov.32 r4, d25[0]
+ .long 0xf2c08052 // vmov.i32 q12, #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed945a00 // vldr s10, [r4]
+ .long 0xedd54a00 // vldr s9, [r5]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xe28f2ffb // add r2, pc, #1004
+ .long 0xf4622acf // vld1.64 {d18-d19}, [r2]
+ .long 0xf246cde2 // vadd.f32 q14, q11, q9
+ .long 0xf222e1f2 // vorr q7, q9, q9
+ .long 0xf3fbc76c // vcvt.s32.f32 q14, q14
+ .long 0xec8eeb04 // vstmia lr, {d14-d15}
+ .long 0xe28de020 // add lr, sp, #32
+ .long 0xf3ec28c8 // vmul.i32 q9, q14, d8[0]
+ .long 0xf2c0c053 // vmov.i32 q14, #3
+ .long 0xf262e9cc // vmla.i32 q15, q9, q6
+ .long 0xecce2b04 // vstmia lr, {d18-d19}
+ .long 0xe28de010 // add lr, sp, #16
+ .long 0xf22e88e8 // vadd.i32 q4, q15, q12
+ .long 0xf2668dc2 // vsub.f32 q12, q11, q1
+ .long 0xee394b10 // vmov.32 r4, d9[1]
+ .long 0xf2062d4e // vadd.f32 q1, q3, q7
+ .long 0xee385b10 // vmov.32 r5, d8[1]
+ .long 0xee182b10 // vmov.32 r2, d8[0]
+ .long 0xf26461f4 // vorr q11, q10, q10
+ .long 0xf3bb2742 // vcvt.s32.f32 q1, q1
+ .long 0xf2620970 // vmul.i32 q8, q1, q8
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd4da00 // vldr s27, [r4]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee194b10 // vmov.32 r4, d9[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed94da00 // vldr s26, [r4]
+ .long 0xedd5ca00 // vldr s25, [r5]
+ .long 0xed92ca00 // vldr s24, [r2]
+ .long 0xf22c8d44 // vsub.f32 q4, q6, q2
+ .long 0xf220c9fc // vmul.i32 q6, q8, q14
+ .long 0xf2084c78 // vfma.f32 q2, q4, q12
+ .long 0xf2c00053 // vmov.i32 q8, #3
+ .long 0xec8dcb04 // vstmia sp, {d12-d13}
+ .long 0xf220c96c // vmla.i32 q6, q0, q14
+ .long 0xf22ce15c // vorr q7, q6, q6
+ .long 0xf224e9ec // vmla.i32 q7, q10, q14
+ .long 0xf2c0c052 // vmov.i32 q14, #2
+ .long 0xf222c9e0 // vmla.i32 q6, q9, q8
+ .long 0xf22e886c // vadd.i32 q4, q7, q14
+ .long 0xf2c02051 // vmov.i32 q9, #1
+ .long 0xf2660d6a // vsub.f32 q8, q3, q13
+ .long 0xee394b10 // vmov.32 r4, d9[1]
+ .long 0xee182b10 // vmov.32 r2, d8[0]
+ .long 0xf26aa862 // vadd.i32 q13, q5, q9
+ .long 0xee385b10 // vmov.32 r5, d8[1]
+ .long 0xf2c02051 // vmov.i32 q9, #1
+ .long 0xf26841f8 // vorr q10, q12, q12
+ .long 0xf22661f6 // vorr q3, q11, q11
+ .long 0xf2c06051 // vmov.i32 q11, #1
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd43a00 // vldr s7, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee194b10 // vmov.32 r4, d9[0]
+ .long 0xf22c886c // vadd.i32 q4, q6, q14
+ .long 0xf2c0c053 // vmov.i32 q14, #3
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed943a00 // vldr s6, [r4]
+ .long 0xee394b10 // vmov.32 r4, d9[1]
+ .long 0xedd52a00 // vldr s5, [r5]
+ .long 0xee385b10 // vmov.32 r5, d8[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee182b10 // vmov.32 r2, d8[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd41a00 // vldr s3, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee194b10 // vmov.32 r4, d9[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed941a00 // vldr s2, [r4]
+ .long 0xee3b4b90 // vmov.32 r4, d27[1]
+ .long 0xedd50a00 // vldr s1, [r5]
+ .long 0xee3a5b90 // vmov.32 r5, d26[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xe28de060 // add lr, sp, #96
+ .long 0xf2200d42 // vsub.f32 q0, q0, q1
+ .long 0xee1a2b90 // vmov.32 r2, d26[0]
+ .long 0xf2002c78 // vfma.f32 q1, q0, q12
+ .long 0xf2220d44 // vsub.f32 q0, q1, q2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd43a00 // vldr s7, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1b4b90 // vmov.32 r4, d27[0]
+ .long 0xf26ea8e2 // vadd.i32 q13, q15, q9
+ .long 0xf2004c70 // vfma.f32 q2, q0, q8
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xf2c02051 // vmov.i32 q9, #1
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed943a00 // vldr s6, [r4]
+ .long 0xee3b4b90 // vmov.32 r4, d27[1]
+ .long 0xedd52a00 // vldr s5, [r5]
+ .long 0xee3a5b90 // vmov.32 r5, d26[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee1a2b90 // vmov.32 r2, d26[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd41a00 // vldr s3, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1b4b90 // vmov.32 r4, d27[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed941a00 // vldr s2, [r4]
+ .long 0xedd50a00 // vldr s1, [r5]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xf260ad42 // vsub.f32 q13, q0, q1
+ .long 0xf20a2cf4 // vfma.f32 q1, q13, q10
+ .long 0xf26ea862 // vadd.i32 q13, q7, q9
+ .long 0xee3b4b90 // vmov.32 r4, d27[1]
+ .long 0xee1a2b90 // vmov.32 r2, d26[0]
+ .long 0xee3a5b90 // vmov.32 r5, d26[1]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd49a00 // vldr s19, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1b4b90 // vmov.32 r4, d27[0]
+ .long 0xf26ca862 // vadd.i32 q13, q6, q9
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed949a00 // vldr s18, [r4]
+ .long 0xee3b4b90 // vmov.32 r4, d27[1]
+ .long 0xedd58a00 // vldr s17, [r5]
+ .long 0xee3a5b90 // vmov.32 r5, d26[1]
+ .long 0xed928a00 // vldr s16, [r2]
+ .long 0xee1a2b90 // vmov.32 r2, d26[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd41a00 // vldr s3, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1b4b90 // vmov.32 r4, d27[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed941a00 // vldr s2, [r4]
+ .long 0xedd50a00 // vldr s1, [r5]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xf260ad48 // vsub.f32 q13, q0, q4
+ .long 0xf20a8cf4 // vfma.f32 q4, q13, q10
+ .long 0xf268ad42 // vsub.f32 q13, q4, q1
+ .long 0xf20a2cf0 // vfma.f32 q1, q13, q8
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de030 // add lr, sp, #48
+ .long 0xecde2b04 // vldmia lr, {d18-d19}
+ .long 0xe28de070 // add lr, sp, #112
+ .long 0xf2408de2 // vadd.f32 q12, q8, q9
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de020 // add lr, sp, #32
+ .long 0xf2c02053 // vmov.i32 q9, #3
+ .long 0xf3fba768 // vcvt.s32.f32 q13, q12
+ .long 0xf26a09e2 // vmla.i32 q8, q13, q9
+ .long 0xf26081f0 // vorr q12, q8, q8
+ .long 0xf2668962 // vmla.i32 q12, q3, q9
+ .long 0xecde2b04 // vldmia lr, {d18-d19}
+ .long 0xe28de070 // add lr, sp, #112
+ .long 0xf26209ec // vmla.i32 q8, q9, q14
+ .long 0xf22808e6 // vadd.i32 q0, q12, q11
+ .long 0xee314b10 // vmov.32 r4, d1[1]
+ .long 0xee305b10 // vmov.32 r5, d0[1]
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd49a00 // vldr s19, [r4]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee114b10 // vmov.32 r4, d1[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed949a00 // vldr s18, [r4]
+ .long 0xedd58a00 // vldr s17, [r5]
+ .long 0xed928a00 // vldr s16, [r2]
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xf26008e6 // vadd.i32 q8, q8, q11
+ .long 0xe28de010 // add lr, sp, #16
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd41a00 // vldr s3, [r4]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed941a00 // vldr s2, [r4]
+ .long 0xedd50a00 // vldr s1, [r5]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xf2600d48 // vsub.f32 q8, q0, q4
+ .long 0xf2800051 // vmov.i32 q0, #1
+ .long 0xf2008cf4 // vfma.f32 q4, q8, q10
+ .long 0xecdd0b04 // vldmia sp, {d16-d17}
+ .long 0xf26a09ec // vmla.i32 q8, q13, q14
+ .long 0xf260a1f0 // vorr q13, q8, q8
+ .long 0xf266a96c // vmla.i32 q13, q3, q14
+ .long 0xf26061f0 // vorr q11, q8, q8
+ .long 0xf26269ec // vmla.i32 q11, q9, q14
+ .long 0xecdecb04 // vldmia lr, {d28-d29}
+ .long 0xe28de070 // add lr, sp, #112
+ .long 0xf26a08c0 // vadd.i32 q8, q13, q0
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd47a00 // vldr s15, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xf26608c0 // vadd.i32 q8, q11, q0
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed947a00 // vldr s14, [r4]
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xedd56a00 // vldr s13, [r5]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd41a00 // vldr s3, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed941a00 // vldr s2, [r4]
+ .long 0xee3b4b10 // vmov.32 r4, d11[1]
+ .long 0xedd50a00 // vldr s1, [r5]
+ .long 0xee3a5b10 // vmov.32 r5, d10[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xee1a2b10 // vmov.32 r2, d10[0]
+ .long 0xf2600d46 // vsub.f32 q8, q0, q3
+ .long 0xf2006cf4 // vfma.f32 q3, q8, q10
+ .long 0xf2660d48 // vsub.f32 q8, q3, q4
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd41a00 // vldr s3, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1b4b10 // vmov.32 r4, d11[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xf2008cfc // vfma.f32 q4, q8, q14
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed941a00 // vldr s2, [r4]
+ .long 0xee3f4b90 // vmov.32 r4, d31[1]
+ .long 0xedd50a00 // vldr s1, [r5]
+ .long 0xee3e5b90 // vmov.32 r5, d30[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xee1e2b90 // vmov.32 r2, d30[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd47a00 // vldr s15, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1f4b90 // vmov.32 r4, d31[0]
+ .long 0xf26ce1fc // vorr q15, q14, q14
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed947a00 // vldr s14, [r4]
+ .long 0xee3f4b10 // vmov.32 r4, d15[1]
+ .long 0xedd56a00 // vldr s13, [r5]
+ .long 0xee3e5b10 // vmov.32 r5, d14[1]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xee1e2b10 // vmov.32 r2, d14[0]
+ .long 0xf2660d40 // vsub.f32 q8, q3, q0
+ .long 0xf2000cf4 // vfma.f32 q0, q8, q10
+ .long 0xea000003 // b 7148 <sk_clut_3D_vfp4+0x500>
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd47a00 // vldr s15, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1f4b10 // vmov.32 r4, d15[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed947a00 // vldr s14, [r4]
+ .long 0xee3d4b10 // vmov.32 r4, d13[1]
+ .long 0xedd56a00 // vldr s13, [r5]
+ .long 0xee3c5b10 // vmov.32 r5, d12[1]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xee1c2b10 // vmov.32 r2, d12[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd4ba00 // vldr s23, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1d4b10 // vmov.32 r4, d13[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed94ba00 // vldr s22, [r4]
+ .long 0xee394b90 // vmov.32 r4, d25[1]
+ .long 0xedd5aa00 // vldr s21, [r5]
+ .long 0xee385b90 // vmov.32 r5, d24[1]
+ .long 0xed92aa00 // vldr s20, [r2]
+ .long 0xee182b90 // vmov.32 r2, d24[0]
+ .long 0xf26a0d46 // vsub.f32 q8, q5, q3
+ .long 0xf2006cf4 // vfma.f32 q3, q8, q10
+ .long 0xf2660d40 // vsub.f32 q8, q3, q0
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd4ba00 // vldr s23, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee194b90 // vmov.32 r4, d25[0]
+ .long 0xf2000cfc // vfma.f32 q0, q8, q14
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xf26021f0 // vorr q9, q8, q8
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed94ba00 // vldr s22, [r4]
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xedd5aa00 // vldr s21, [r5]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xed92aa00 // vldr s20, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd47a00 // vldr s15, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed947a00 // vldr s14, [r4]
+ .long 0xee3b4b90 // vmov.32 r4, d27[1]
+ .long 0xedd56a00 // vldr s13, [r5]
+ .long 0xee3a5b90 // vmov.32 r5, d26[1]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xee1a2b90 // vmov.32 r2, d26[0]
+ .long 0xf2660d4a // vsub.f32 q8, q3, q5
+ .long 0xf200acf4 // vfma.f32 q5, q8, q10
+ .long 0xf26601f6 // vorr q8, q11, q11
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd47a00 // vldr s15, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee1b4b90 // vmov.32 r4, d27[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed947a00 // vldr s14, [r4]
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xedd56a00 // vldr s13, [r5]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd4da00 // vldr s27, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed94da00 // vldr s26, [r4]
+ .long 0xedd5ca00 // vldr s25, [r5]
+ .long 0xed92ca00 // vldr s24, [r2]
+ .long 0xf26c0d46 // vsub.f32 q8, q6, q3
+ .long 0xf2006cf4 // vfma.f32 q3, q8, q10
+ .long 0xf2660d4a // vsub.f32 q8, q3, q5
+ .long 0xf200acfc // vfma.f32 q5, q8, q14
+ .long 0xf2c0c052 // vmov.i32 q14, #2
+ .long 0xf26808ec // vadd.i32 q8, q12, q14
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd47a00 // vldr s15, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xf26208ec // vadd.i32 q8, q9, q14
+ .long 0xf2c02052 // vmov.i32 q9, #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed947a00 // vldr s14, [r4]
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xedd56a00 // vldr s13, [r5]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xedd4da00 // vldr s27, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed94da00 // vldr s26, [r4]
+ .long 0xedd5ca00 // vldr s25, [r5]
+ .long 0xed92ca00 // vldr s24, [r2]
+ .long 0xf26c0d46 // vsub.f32 q8, q6, q3
+ .long 0xf2006cf4 // vfma.f32 q3, q8, q10
+ .long 0xf26a08e2 // vadd.i32 q8, q13, q9
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd4da00 // vldr s27, [r4]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xf26608e2 // vadd.i32 q8, q11, q9
+ .long 0xee10eb90 // vmov.32 lr, d16[0]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xed94da00 // vldr s26, [r4]
+ .long 0xee114b90 // vmov.32 r4, d17[0]
+ .long 0xedd5ca00 // vldr s25, [r5]
+ .long 0xee305b90 // vmov.32 r5, d16[1]
+ .long 0xed92ca00 // vldr s24, [r2]
+ .long 0xee312b90 // vmov.32 r2, d17[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd2fa00 // vldr s31, [r2]
+ .long 0xe0832104 // add r2, r3, r4, lsl #2
+ .long 0xed92fa00 // vldr s30, [r2]
+ .long 0xe083210e // add r2, r3, lr, lsl #2
+ .long 0xe28d3040 // add r3, sp, #64
+ .long 0xedd5ea00 // vldr s29, [r5]
+ .long 0xecd32b04 // vldmia r3, {d18-d19}
+ .long 0xe28d3060 // add r3, sp, #96
+ .long 0xed92ea00 // vldr s28, [r2]
+ .long 0xf3fb2662 // vcvt.f32.s32 q9, q9
+ .long 0xe5912004 // ldr r2, [r1, #4]
+ .long 0xe1a0100c // mov r1, ip
+ .long 0xf26e0d4c // vsub.f32 q8, q7, q6
+ .long 0xf200ccf4 // vfma.f32 q6, q8, q10
+ .long 0xf2684d42 // vsub.f32 q10, q4, q1
+ .long 0xf26c0d46 // vsub.f32 q8, q6, q3
+ .long 0xf2006cfe // vfma.f32 q3, q8, q15
+ .long 0xecd30b04 // vldmia r3, {d16-d17}
+ .long 0xe28d3050 // add r3, sp, #80
+ .long 0xf2600de2 // vsub.f32 q8, q8, q9
+ .long 0xf26a2d40 // vsub.f32 q9, q5, q0
+ .long 0xf2042cf0 // vfma.f32 q1, q10, q8
+ .long 0xf2666d44 // vsub.f32 q11, q3, q2
+ .long 0xec936b04 // vldmia r3, {d6-d7}
+ .long 0xf2020cf0 // vfma.f32 q0, q9, q8
+ .long 0xf2064cf0 // vfma.f32 q2, q11, q8
+ .long 0xe28dd090 // add sp, sp, #144
+ .long 0xecbd8b10 // vpop {d8-d15}
+ .long 0xe8bd4830 // pop {r4, r5, fp, lr}
+ .long 0xe12fff12 // bx r2
+
+HIDDEN _sk_clut_4D_vfp4
+.globl _sk_clut_4D_vfp4
+FUNCTION(_sk_clut_4D_vfp4)
+_sk_clut_4D_vfp4:
+ .long 0xe92d41f0 // push {r4, r5, r6, r7, r8, lr}
+ .long 0xed2d8b10 // vpush {d8-d15}
+ .long 0xe24ddf5a // sub sp, sp, #360
+ .long 0xe2812004 // add r2, r1, #4
+ .long 0xe58d2164 // str r2, [sp, #356]
+ .long 0xe1a0c001 // mov ip, r1
+ .long 0xe28d70a0 // add r7, sp, #160
+ .long 0xe49c2008 // ldr r2, [ip], #8
+ .long 0xf2c04052 // vmov.i32 q10, #2
+ .long 0xe8924008 // ldm r2, {r3, lr}
+ .long 0xe592500c // ldr r5, [r2, #12]
+ .long 0xe5924008 // ldr r4, [r2, #8]
+ .long 0xe2456001 // sub r6, r5, #1
+ .long 0xe5922010 // ldr r2, [r2, #16]
+ .long 0xee065b90 // vmov.32 d22[0], r5
+ .long 0xe28d50c0 // add r5, sp, #192
+ .long 0xeea06b90 // vdup.32 q8, r6
+ .long 0xe24e6001 // sub r6, lr, #1
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xe28dee15 // add lr, sp, #336
+ .long 0xeeaa6b90 // vdup.32 q13, r6
+ .long 0xf3fba66a // vcvt.f32.s32 q13, q13
+ .long 0xf3402dd4 // vmul.f32 q9, q8, q2
+ .long 0xee002b90 // vmov.32 d16[0], r2
+ .long 0xf226a9f0 // vmul.i32 q5, q11, q8
+ .long 0xecc72b04 // vstmia r7, {d18-d19}
+ .long 0xf3fb8762 // vcvt.s32.f32 q12, q9
+ .long 0xeea22b90 // vdup.32 q9, r2
+ .long 0xe2422001 // sub r2, r2, #1
+ .long 0xeeae2b90 // vdup.32 q15, r2
+ .long 0xe2442001 // sub r2, r4, #1
+ .long 0xf3fbe66e // vcvt.f32.s32 q15, q15
+ .long 0xf26869f2 // vmul.i32 q11, q12, q9
+ .long 0xecc58b04 // vstmia r5, {d24-d25}
+ .long 0xe28d5d05 // add r5, sp, #320
+ .long 0xf34e0dd6 // vmul.f32 q8, q15, q3
+ .long 0xee084b90 // vmov.32 d24[0], r4
+ .long 0xf22849da // vmul.i32 q2, q12, q5
+ .long 0xeea82b90 // vdup.32 q12, r2
+ .long 0xecc52b04 // vstmia r5, {d18-d19}
+ .long 0xf3fb8668 // vcvt.f32.s32 q12, q12
+ .long 0xf2c02053 // vmov.i32 q9, #3
+ .long 0xf22689f2 // vmul.i32 q4, q11, q9
+ .long 0xf3082dd2 // vmul.f32 q1, q12, q1
+ .long 0xf3fb8760 // vcvt.s32.f32 q12, q8
+ .long 0xf34a6dd0 // vmul.f32 q11, q13, q0
+ .long 0xf3bb6742 // vcvt.s32.f32 q3, q1
+ .long 0xec8e8b04 // vstmia lr, {d8-d9}
+ .long 0xe28dee13 // add lr, sp, #304
+ .long 0xf22889e2 // vmla.i32 q4, q12, q9
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xe28dee12 // add lr, sp, #288
+ .long 0xf3e6084a // vmul.i32 q8, q3, d10[0]
+ .long 0xecce8b04 // vstmia lr, {d24-d25}
+ .long 0xe28de0e0 // add lr, sp, #224
+ .long 0xf3fbe766 // vcvt.s32.f32 q15, q11
+ .long 0xf2280158 // vorr q0, q4, q4
+ .long 0xf2c08052 // vmov.i32 q12, #2
+ .long 0xf22009e2 // vmla.i32 q0, q8, q9
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xe28dee11 // add lr, sp, #272
+ .long 0xf3eec8c4 // vmul.i32 q14, q15, d4[0]
+ .long 0xf2600150 // vorr q8, q0, q0
+ .long 0xf220c150 // vorr q6, q0, q0
+ .long 0xf3fbe66e // vcvt.f32.s32 q15, q15
+ .long 0xf26c09e2 // vmla.i32 q8, q14, q9
+ .long 0xf26088e8 // vadd.i32 q12, q8, q12
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xe28de0f0 // add lr, sp, #240
+ .long 0xee395b90 // vmov.32 r5, d25[1]
+ .long 0xee386b90 // vmov.32 r6, d24[1]
+ .long 0xee182b90 // vmov.32 r2, d24[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xedd5fa00 // vldr s31, [r5]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee195b90 // vmov.32 r5, d25[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed95fa00 // vldr s30, [r5]
+ .long 0xedd6ea00 // vldr s29, [r6]
+ .long 0xed92ea00 // vldr s28, [r2]
+ .long 0xe28f2ffb // add r2, pc, #1004
+ .long 0xf4620acf // vld1.64 {d16-d17}, [r2]
+ .long 0xf2060de0 // vadd.f32 q0, q11, q8
+ .long 0xf260a1f0 // vorr q13, q8, q8
+ .long 0xf3bb0740 // vcvt.s32.f32 q0, q0
+ .long 0xf3e00844 // vmul.i32 q8, q0, d4[0]
+ .long 0xf220c9e2 // vmla.i32 q6, q8, q9
+ .long 0xf22c0864 // vadd.i32 q0, q6, q10
+ .long 0xec8ecb04 // vstmia lr, {d12-d13}
+ .long 0xf226cdee // vsub.f32 q6, q11, q15
+ .long 0xe28de0d0 // add lr, sp, #208
+ .long 0xee315b10 // vmov.32 r5, d1[1]
+ .long 0xf242ed6a // vadd.f32 q15, q1, q13
+ .long 0xee306b10 // vmov.32 r6, d0[1]
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xf3fbe76e // vcvt.s32.f32 q15, q15
+ .long 0xf3ee68ca // vmul.i32 q11, q15, d10[0]
+ .long 0xf22689e2 // vmla.i32 q4, q11, q9
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee115b10 // vmov.32 r5, d1[0]
+ .long 0xf266e1f6 // vorr q15, q11, q11
+ .long 0xf2688158 // vorr q12, q4, q4
+ .long 0xf26c89e2 // vmla.i32 q12, q14, q9
+ .long 0xf22089e2 // vmla.i32 q4, q8, q9
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xecceab04 // vstmia lr, {d26-d27}
+ .long 0xe28de030 // add lr, sp, #48
+ .long 0xf2240d4e // vsub.f32 q0, q2, q7
+ .long 0xecceeb04 // vstmia lr, {d30-d31}
+ .long 0xe28dec01 // add lr, sp, #256
+ .long 0xf22848e4 // vadd.i32 q2, q12, q10
+ .long 0xecce8b04 // vstmia lr, {d24-d25}
+ .long 0xe28de0b0 // add lr, sp, #176
+ .long 0xee355b10 // vmov.32 r5, d5[1]
+ .long 0xf200ec5c // vfma.f32 q7, q0, q6
+ .long 0xee142b10 // vmov.32 r2, d4[0]
+ .long 0xee346b10 // vmov.32 r6, d4[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee155b10 // vmov.32 r5, d5[0]
+ .long 0xf2284864 // vadd.i32 q2, q4, q10
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xee355b10 // vmov.32 r5, d5[1]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xee346b10 // vmov.32 r6, d4[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xec8e8b04 // vstmia lr, {d8-d9}
+ .long 0xe28de0a0 // add lr, sp, #160
+ .long 0xee142b10 // vmov.32 r2, d4[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd5ba00 // vldr s23, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee155b10 // vmov.32 r5, d5[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed95ba00 // vldr s22, [r5]
+ .long 0xedd6aa00 // vldr s21, [r6]
+ .long 0xed92aa00 // vldr s20, [r2]
+ .long 0xf22a4d40 // vsub.f32 q2, q5, q0
+ .long 0xf2040c5c // vfma.f32 q0, q2, q6
+ .long 0xf3bb4646 // vcvt.f32.s32 q2, q3
+ .long 0xf2806052 // vmov.i32 q3, #2
+ .long 0xf2624d44 // vsub.f32 q10, q1, q2
+ .long 0xf2200d4e // vsub.f32 q0, q0, q7
+ .long 0xeccd4b04 // vstmia sp, {d20-d21}
+ .long 0xf200ec74 // vfma.f32 q7, q0, q10
+ .long 0xec9e8b04 // vldmia lr, {d8-d9}
+ .long 0xe28ded05 // add lr, sp, #320
+ .long 0xf2080d6a // vadd.f32 q0, q4, q13
+ .long 0xecde4b04 // vldmia lr, {d20-d21}
+ .long 0xe28ded05 // add lr, sp, #320
+ .long 0xf2c0a052 // vmov.i32 q13, #2
+ .long 0xf3bb0740 // vcvt.s32.f32 q0, q0
+ .long 0xf2604974 // vmul.i32 q10, q0, q10
+ .long 0xf224a9f2 // vmul.i32 q5, q10, q9
+ .long 0xec8eab04 // vstmia lr, {d10-d11}
+ .long 0xe28dee12 // add lr, sp, #288
+ .long 0xecde4b04 // vldmia lr, {d20-d21}
+ .long 0xe28de0e0 // add lr, sp, #224
+ .long 0xf224a9e2 // vmla.i32 q5, q10, q9
+ .long 0xecde4b04 // vldmia lr, {d20-d21}
+ .long 0xe28de020 // add lr, sp, #32
+ .long 0xeccecb04 // vstmia lr, {d28-d29}
+ .long 0xe28de090 // add lr, sp, #144
+ .long 0xf26a615a // vorr q11, q5, q5
+ .long 0xf26469e2 // vmla.i32 q11, q10, q9
+ .long 0xf22ea9e2 // vmla.i32 q5, q15, q9
+ .long 0xf26641f6 // vorr q10, q11, q11
+ .long 0xf26c49e2 // vmla.i32 q10, q14, q9
+ .long 0xf26681f6 // vorr q12, q11, q11
+ .long 0xf26089e2 // vmla.i32 q12, q8, q9
+ .long 0xf22408ea // vadd.i32 q0, q10, q13
+ .long 0xf26461f4 // vorr q11, q10, q10
+ .long 0xee315b10 // vmov.32 r5, d1[1]
+ .long 0xecce6b04 // vstmia lr, {d22-d23}
+ .long 0xe28de010 // add lr, sp, #16
+ .long 0xee306b10 // vmov.32 r6, d0[1]
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xee115b10 // vmov.32 r5, d1[0]
+ .long 0xf22808ea // vadd.i32 q0, q12, q13
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xf268a1f8 // vorr q13, q12, q12
+ .long 0xf26a815a // vorr q12, q5, q5
+ .long 0xf26c89e2 // vmla.i32 q12, q14, q9
+ .long 0xf220a9e2 // vmla.i32 q5, q8, q9
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee315b10 // vmov.32 r5, d1[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b10 // vmov.32 r6, d0[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xe28de080 // add lr, sp, #128
+ .long 0xecceab04 // vstmia lr, {d26-d27}
+ .long 0xe28de070 // add lr, sp, #112
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b10 // vmov.32 r5, d1[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xecce8b04 // vstmia lr, {d24-d25}
+ .long 0xe28de0c0 // add lr, sp, #192
+ .long 0xf2240d42 // vsub.f32 q0, q2, q1
+ .long 0xecddeb04 // vldmia sp, {d30-d31}
+ .long 0xf22848c6 // vadd.i32 q2, q12, q3
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0c0 // add lr, sp, #192
+ .long 0xee355b10 // vmov.32 r5, d5[1]
+ .long 0xf2002c5c // vfma.f32 q1, q0, q6
+ .long 0xee142b10 // vmov.32 r2, d4[0]
+ .long 0xee346b10 // vmov.32 r6, d4[1]
+ .long 0xf3fbc660 // vcvt.f32.s32 q14, q8
+ .long 0xf2680d6c // vsub.f32 q8, q4, q14
+ .long 0xf2808051 // vmov.i32 q4, #1
+ .long 0xf26041f0 // vorr q10, q8, q8
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee155b10 // vmov.32 r5, d5[0]
+ .long 0xf22a4846 // vadd.i32 q2, q5, q3
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xee355b10 // vmov.32 r5, d5[1]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xee346b10 // vmov.32 r6, d4[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xee142b10 // vmov.32 r2, d4[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd57a00 // vldr s15, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee155b10 // vmov.32 r5, d5[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed957a00 // vldr s14, [r5]
+ .long 0xedd66a00 // vldr s13, [r6]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xecce4b04 // vstmia lr, {d20-d21}
+ .long 0xe28de0a0 // add lr, sp, #160
+ .long 0xf2264d40 // vsub.f32 q2, q3, q0
+ .long 0xf2040c5c // vfma.f32 q0, q2, q6
+ .long 0xf2200d42 // vsub.f32 q0, q0, q1
+ .long 0xf2002c7e // vfma.f32 q1, q0, q15
+ .long 0xf2220d4e // vsub.f32 q0, q1, q7
+ .long 0xf200ec70 // vfma.f32 q7, q0, q8
+ .long 0xec8eeb04 // vstmia lr, {d14-d15}
+ .long 0xe28dee11 // add lr, sp, #272
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0f0 // add lr, sp, #240
+ .long 0xf260c8c8 // vadd.i32 q14, q8, q4
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28dec01 // add lr, sp, #256
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd5fa00 // vldr s31, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xf260c8c8 // vadd.i32 q14, q8, q4
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0b0 // add lr, sp, #176
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed95fa00 // vldr s30, [r5]
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xedd6ea00 // vldr s29, [r6]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xed92ea00 // vldr s28, [r2]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xf260cd4e // vsub.f32 q14, q0, q7
+ .long 0xf20cecdc // vfma.f32 q7, q14, q6
+ .long 0xf260c8c8 // vadd.i32 q14, q8, q4
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28dee13 // add lr, sp, #304
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xf260c8c8 // vadd.i32 q14, q8, q4
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0d0 // add lr, sp, #208
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf262cd40 // vsub.f32 q14, q1, q0
+ .long 0xf20c0cdc // vfma.f32 q0, q14, q6
+ .long 0xf260cd4e // vsub.f32 q14, q0, q7
+ .long 0xf20cecfe // vfma.f32 q7, q14, q15
+ .long 0xea000003 // b 7918 <sk_clut_4D_vfp4+0x548>
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0x3f7ff972 // .word 0x3f7ff972
+ .long 0xf266c8c8 // vadd.i32 q14, q11, q4
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xf26ac8c8 // vadd.i32 q14, q13, q4
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf262cd40 // vsub.f32 q14, q1, q0
+ .long 0xf20c0cdc // vfma.f32 q0, q14, q6
+ .long 0xf268c8c8 // vadd.i32 q14, q12, q4
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xf26ac848 // vadd.i32 q14, q5, q4
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd57a00 // vldr s15, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed957a00 // vldr s14, [r5]
+ .long 0xedd66a00 // vldr s13, [r6]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xf266cd42 // vsub.f32 q14, q3, q1
+ .long 0xf20c2cdc // vfma.f32 q1, q14, q6
+ .long 0xf262cd40 // vsub.f32 q14, q1, q0
+ .long 0xf20c0cfe // vfma.f32 q0, q14, q15
+ .long 0xf260cd4e // vsub.f32 q14, q0, q7
+ .long 0xf20cecf4 // vfma.f32 q7, q14, q10
+ .long 0xecde4b04 // vldmia lr, {d20-d21}
+ .long 0xe28dee15 // add lr, sp, #336
+ .long 0xf2408de4 // vadd.f32 q12, q8, q10
+ .long 0xecde4b04 // vldmia lr, {d20-d21}
+ .long 0xe28de0e0 // add lr, sp, #224
+ .long 0xec9e4b04 // vldmia lr, {d4-d5}
+ .long 0xe28de020 // add lr, sp, #32
+ .long 0xf3fbc768 // vcvt.s32.f32 q14, q12
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de060 // add lr, sp, #96
+ .long 0xf26c49e2 // vmla.i32 q10, q14, q9
+ .long 0xf26461f4 // vorr q11, q10, q10
+ .long 0xf2646962 // vmla.i32 q11, q2, q9
+ .long 0xf266a1f6 // vorr q13, q11, q11
+ .long 0xf260a9e2 // vmla.i32 q13, q8, q9
+ .long 0xf26681f6 // vorr q12, q11, q11
+ .long 0xf22a08c8 // vadd.i32 q0, q13, q4
+ .long 0xecceab04 // vstmia lr, {d26-d27}
+ .long 0xe28de010 // add lr, sp, #16
+ .long 0xee315b10 // vmov.32 r5, d1[1]
+ .long 0xecde6b04 // vldmia lr, {d22-d23}
+ .long 0xe28de050 // add lr, sp, #80
+ .long 0xf26689e2 // vmla.i32 q12, q11, q9
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xee306b10 // vmov.32 r6, d0[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd57a00 // vldr s15, [r5]
+ .long 0xee115b10 // vmov.32 r5, d1[0]
+ .long 0xf22808c8 // vadd.i32 q0, q12, q4
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed957a00 // vldr s14, [r5]
+ .long 0xee315b10 // vmov.32 r5, d1[1]
+ .long 0xedd66a00 // vldr s13, [r6]
+ .long 0xee306b10 // vmov.32 r6, d0[1]
+ .long 0xed926a00 // vldr s12, [r2]
+ .long 0xecce8b04 // vstmia lr, {d24-d25}
+ .long 0xe28de030 // add lr, sp, #48
+ .long 0xf26081f0 // vorr q12, q8, q8
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xecdeab04 // vldmia lr, {d26-d27}
+ .long 0xe28de040 // add lr, sp, #64
+ .long 0xf26a49e2 // vmla.i32 q10, q13, q9
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b10 // vmov.32 r5, d1[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf2220d46 // vsub.f32 q0, q1, q3
+ .long 0xf2006c5c // vfma.f32 q3, q0, q6
+ .long 0xf22401f4 // vorr q0, q10, q10
+ .long 0xf22009e2 // vmla.i32 q0, q8, q9
+ .long 0xf26649e2 // vmla.i32 q10, q11, q9
+ .long 0xec8e0b04 // vstmia lr, {d0-d1}
+ .long 0xf2200848 // vadd.i32 q0, q0, q4
+ .long 0xe28dee15 // add lr, sp, #336
+ .long 0xee315b10 // vmov.32 r5, d1[1]
+ .long 0xf26408c8 // vadd.i32 q8, q10, q4
+ .long 0xee306b10 // vmov.32 r6, d0[1]
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee115b10 // vmov.32 r5, d1[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xecce4b04 // vstmia lr, {d20-d21}
+ .long 0xe28ded05 // add lr, sp, #320
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xf2600d42 // vsub.f32 q8, q0, q1
+ .long 0xf2002cdc // vfma.f32 q1, q8, q6
+ .long 0xf2620d46 // vsub.f32 q8, q1, q3
+ .long 0xf2006cfe // vfma.f32 q3, q8, q15
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0e0 // add lr, sp, #224
+ .long 0xf26c09e2 // vmla.i32 q8, q14, q9
+ .long 0xf260c1f0 // vorr q14, q8, q8
+ .long 0xf264c962 // vmla.i32 q14, q2, q9
+ .long 0xf22021f0 // vorr q1, q8, q8
+ .long 0xf22a29e2 // vmla.i32 q1, q13, q9
+ .long 0xf26c01fc // vorr q8, q14, q14
+ .long 0xf26809e2 // vmla.i32 q8, q12, q9
+ .long 0xf266c9e2 // vmla.i32 q14, q11, q9
+ .long 0xf22008c8 // vadd.i32 q0, q8, q4
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xe28de0d0 // add lr, sp, #208
+ .long 0xf2624152 // vorr q10, q1, q1
+ .long 0xee315b10 // vmov.32 r5, d1[1]
+ .long 0xf26649e2 // vmla.i32 q10, q11, q9
+ .long 0xee306b10 // vmov.32 r6, d0[1]
+ .long 0xf26c08c8 // vadd.i32 q8, q14, q4
+ .long 0xee102b10 // vmov.32 r2, d0[0]
+ .long 0xf26ca15c // vorr q13, q6, q6
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xee115b10 // vmov.32 r5, d1[0]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xf2600d44 // vsub.f32 q8, q0, q2
+ .long 0xf2004cdc // vfma.f32 q2, q8, q6
+ .long 0xf2620152 // vorr q8, q1, q1
+ .long 0xf26809e2 // vmla.i32 q8, q12, q9
+ .long 0xecce0b04 // vstmia lr, {d16-d17}
+ .long 0xf26008c8 // vadd.i32 q8, q8, q4
+ .long 0xe28ded05 // add lr, sp, #320
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xf26408c8 // vadd.i32 q8, q10, q4
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xecce4b04 // vstmia lr, {d20-d21}
+ .long 0xe28de0c0 // add lr, sp, #192
+ .long 0xf26e41fe // vorr q10, q15, q15
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xecde6b04 // vldmia lr, {d22-d23}
+ .long 0xe28dee11 // add lr, sp, #272
+ .long 0xf26621f6 // vorr q9, q11, q11
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xf2600d42 // vsub.f32 q8, q0, q1
+ .long 0xf2002cdc // vfma.f32 q1, q8, q6
+ .long 0xf2620d44 // vsub.f32 q8, q1, q2
+ .long 0xf2004cfe // vfma.f32 q2, q8, q15
+ .long 0xf2640d46 // vsub.f32 q8, q2, q3
+ .long 0xf2006cf6 // vfma.f32 q3, q8, q11
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0f0 // add lr, sp, #240
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd51a00 // vldr s3, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28dec01 // add lr, sp, #256
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed951a00 // vldr s2, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd60a00 // vldr s1, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed920a00 // vldr s0, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf2620d40 // vsub.f32 q8, q1, q0
+ .long 0xf2000cdc // vfma.f32 q0, q8, q6
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0b0 // add lr, sp, #176
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de090 // add lr, sp, #144
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xf2640d42 // vsub.f32 q8, q2, q1
+ .long 0xf2002cdc // vfma.f32 q1, q8, q6
+ .long 0xf2620d40 // vsub.f32 q8, q1, q0
+ .long 0xf2000cfe // vfma.f32 q0, q8, q15
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de080 // add lr, sp, #128
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd59a00 // vldr s19, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de070 // add lr, sp, #112
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed959a00 // vldr s18, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd68a00 // vldr s17, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed928a00 // vldr s16, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf2620d48 // vsub.f32 q8, q1, q4
+ .long 0xf2008cdc // vfma.f32 q4, q8, q6
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de060 // add lr, sp, #96
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee3b5b10 // vmov.32 r5, d11[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee3a6b10 // vmov.32 r6, d10[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee1a2b10 // vmov.32 r2, d10[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1b5b10 // vmov.32 r5, d11[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xf2640d42 // vsub.f32 q8, q2, q1
+ .long 0xf2002cdc // vfma.f32 q1, q8, q6
+ .long 0xf2620d48 // vsub.f32 q8, q1, q4
+ .long 0xf2008cf4 // vfma.f32 q4, q8, q10
+ .long 0xf2680d40 // vsub.f32 q8, q4, q0
+ .long 0xf2000cf2 // vfma.f32 q0, q8, q9
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de050 // add lr, sp, #80
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xf260e1f0 // vorr q15, q8, q8
+ .long 0xecde6b04 // vldmia lr, {d22-d23}
+ .long 0xe28de040 // add lr, sp, #64
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd59a00 // vldr s19, [r5]
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed959a00 // vldr s18, [r5]
+ .long 0xee375b90 // vmov.32 r5, d23[1]
+ .long 0xedd68a00 // vldr s17, [r6]
+ .long 0xee366b90 // vmov.32 r6, d22[1]
+ .long 0xed928a00 // vldr s16, [r2]
+ .long 0xee162b90 // vmov.32 r2, d22[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee175b90 // vmov.32 r5, d23[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf2620d48 // vsub.f32 q8, q1, q4
+ .long 0xf2008cdc // vfma.f32 q4, q8, q6
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28dee15 // add lr, sp, #336
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xf26081f0 // vorr q12, q8, q8
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0e0 // add lr, sp, #224
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xf2640d42 // vsub.f32 q8, q2, q1
+ .long 0xf2002cdc // vfma.f32 q1, q8, q6
+ .long 0xf2620d48 // vsub.f32 q8, q1, q4
+ .long 0xf2008cf4 // vfma.f32 q4, q8, q10
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0d0 // add lr, sp, #208
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xedd5ba00 // vldr s23, [r5]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed95ba00 // vldr s22, [r5]
+ .long 0xee3d5b90 // vmov.32 r5, d29[1]
+ .long 0xedd6aa00 // vldr s21, [r6]
+ .long 0xee3c6b90 // vmov.32 r6, d28[1]
+ .long 0xed92aa00 // vldr s20, [r2]
+ .long 0xee1c2b90 // vmov.32 r2, d28[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee1d5b90 // vmov.32 r5, d29[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf2620d4a // vsub.f32 q8, q1, q5
+ .long 0xf200acdc // vfma.f32 q5, q8, q6
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28ded05 // add lr, sp, #320
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28dee15 // add lr, sp, #336
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xf2640d42 // vsub.f32 q8, q2, q1
+ .long 0xf2002cfa // vfma.f32 q1, q8, q13
+ .long 0xf2620d4a // vsub.f32 q8, q1, q5
+ .long 0xf200acf4 // vfma.f32 q5, q8, q10
+ .long 0xf26a0d48 // vsub.f32 q8, q5, q4
+ .long 0xf2008cf2 // vfma.f32 q4, q8, q9
+ .long 0xf2c02052 // vmov.i32 q9, #2
+ .long 0xf26e08e2 // vadd.i32 q8, q15, q9
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd5ba00 // vldr s23, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xf26608e2 // vadd.i32 q8, q11, q9
+ .long 0xf2c02052 // vmov.i32 q9, #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed95ba00 // vldr s22, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd6aa00 // vldr s21, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed92aa00 // vldr s20, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf2620d4a // vsub.f32 q8, q1, q5
+ .long 0xf200acfa // vfma.f32 q5, q8, q13
+ .long 0xf26808e2 // vadd.i32 q8, q12, q9
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0e0 // add lr, sp, #224
+ .long 0xf26008e2 // vadd.i32 q8, q8, q9
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd55a00 // vldr s11, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xf2640d42 // vsub.f32 q8, q2, q1
+ .long 0xf2002cfa // vfma.f32 q1, q8, q13
+ .long 0xf2620d4a // vsub.f32 q8, q1, q5
+ .long 0xf200acf4 // vfma.f32 q5, q8, q10
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28de0d0 // add lr, sp, #208
+ .long 0xf26008e2 // vadd.i32 q8, q8, q9
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd5da00 // vldr s27, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xf26c08e2 // vadd.i32 q8, q14, q9
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed95da00 // vldr s26, [r5]
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xedd6ca00 // vldr s25, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed92ca00 // vldr s24, [r2]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xf2620d4c // vsub.f32 q8, q1, q6
+ .long 0xf200ccfa // vfma.f32 q6, q8, q13
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xe28ded05 // add lr, sp, #320
+ .long 0xf26008e2 // vadd.i32 q8, q8, q9
+ .long 0xee315b90 // vmov.32 r5, d17[1]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xedd53a00 // vldr s7, [r5]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xecde0b04 // vldmia lr, {d16-d17}
+ .long 0xf26008e2 // vadd.i32 q8, q8, q9
+ .long 0xee314b90 // vmov.32 r4, d17[1]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xed953a00 // vldr s6, [r5]
+ .long 0xee115b90 // vmov.32 r5, d17[0]
+ .long 0xedd62a00 // vldr s5, [r6]
+ .long 0xee306b90 // vmov.32 r6, d16[1]
+ .long 0xed922a00 // vldr s4, [r2]
+ .long 0xe0834104 // add r4, r3, r4, lsl #2
+ .long 0xee102b90 // vmov.32 r2, d16[0]
+ .long 0xedd45a00 // vldr s11, [r4]
+ .long 0xe0835105 // add r5, r3, r5, lsl #2
+ .long 0xe0836106 // add r6, r3, r6, lsl #2
+ .long 0xed955a00 // vldr s10, [r5]
+ .long 0xe0832102 // add r2, r3, r2, lsl #2
+ .long 0xedd64a00 // vldr s9, [r6]
+ .long 0xe28d3e12 // add r3, sp, #288
+ .long 0xed924a00 // vldr s8, [r2]
+ .long 0xecd32b04 // vldmia r3, {d18-d19}
+ .long 0xe28d30c0 // add r3, sp, #192
+ .long 0xf2640d42 // vsub.f32 q8, q2, q1
+ .long 0xf3fb2662 // vcvt.f32.s32 q9, q9
+ .long 0xf2002cfa // vfma.f32 q1, q8, q13
+ .long 0xf2620d4c // vsub.f32 q8, q1, q6
+ .long 0xf200ccf4 // vfma.f32 q6, q8, q10
+ .long 0xecd34b04 // vldmia r3, {d20-d21}
+ .long 0xe28d3e13 // add r3, sp, #304
+ .long 0xf26c0d4a // vsub.f32 q8, q6, q5
+ .long 0xf200acf4 // vfma.f32 q5, q8, q10
+ .long 0xecd30b04 // vldmia r3, {d16-d17}
+ .long 0xe28d30a0 // add r3, sp, #160
+ .long 0xf2600de2 // vsub.f32 q8, q8, q9
+ .long 0xecd38b04 // vldmia r3, {d24-d25}
+ .long 0xe28f2038 // add r2, pc, #56
+ .long 0xf2664d4e // vsub.f32 q10, q3, q7
+ .long 0xf4226acf // vld1.64 {d6-d7}, [r2]
+ .long 0xf2682d40 // vsub.f32 q9, q4, q0
+ .long 0xe5912004 // ldr r2, [r1, #4]
+ .long 0xe1a0100c // mov r1, ip
+ .long 0xf26a6d68 // vsub.f32 q11, q5, q12
+ .long 0xf204ecf0 // vfma.f32 q7, q10, q8
+ .long 0xf2020cf0 // vfma.f32 q0, q9, q8
+ .long 0xf2468cf0 // vfma.f32 q12, q11, q8
+ .long 0xf22e215e // vorr q1, q7, q7
+ .long 0xf22841f8 // vorr q2, q12, q12
+ .long 0xe28ddf5a // add sp, sp, #360
+ .long 0xecbd8b10 // vpop {d8-d15}
+ .long 0xe8bd41f0 // pop {r4, r5, r6, r7, r8, lr}
+ .long 0xe12fff12 // bx r2
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
#elif defined(__x86_64__)
BALIGN32
@@ -13419,7 +16599,7 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,82,90,0,0 // vbroadcastss 0x5a52(%rip),%ymm1 # 5b1c <_sk_callback_hsw+0x142>
+ .byte 196,226,125,24,13,94,103,0,0 // vbroadcastss 0x675e(%rip),%ymm1 # 6828 <_sk_clut_4D_hsw+0x89e>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -13427,7 +16607,7 @@ _sk_seed_shader_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,50,90,0,0 // vbroadcastss 0x5a32(%rip),%ymm2 # 5b20 <_sk_callback_hsw+0x146>
+ .byte 196,226,125,24,21,62,103,0,0 // vbroadcastss 0x673e(%rip),%ymm2 # 682c <_sk_clut_4D_hsw+0x8a2>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -13446,13 +16626,13 @@ _sk_dither_hsw:
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,249,89,0,0 // vpbroadcastd 0x59f9(%rip),%ymm10 # 5b24 <_sk_callback_hsw+0x14a>
+ .byte 196,98,125,88,21,5,103,0,0 // vpbroadcastd 0x6705(%rip),%ymm10 # 6830 <_sk_clut_4D_hsw+0x8a6>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,222,89,0,0 // vpbroadcastd 0x59de(%rip),%ymm12 # 5b28 <_sk_callback_hsw+0x14e>
- .byte 196,98,125,88,45,217,89,0,0 // vpbroadcastd 0x59d9(%rip),%ymm13 # 5b2c <_sk_callback_hsw+0x152>
+ .byte 196,98,125,88,37,234,102,0,0 // vpbroadcastd 0x66ea(%rip),%ymm12 # 6834 <_sk_clut_4D_hsw+0x8aa>
+ .byte 196,98,125,88,45,229,102,0,0 // vpbroadcastd 0x66e5(%rip),%ymm13 # 6838 <_sk_clut_4D_hsw+0x8ae>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -13467,8 +16647,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,139,89,0,0 // vbroadcastss 0x598b(%rip),%ymm9 # 5b30 <_sk_callback_hsw+0x156>
- .byte 196,98,125,24,21,134,89,0,0 // vbroadcastss 0x5986(%rip),%ymm10 # 5b34 <_sk_callback_hsw+0x15a>
+ .byte 196,98,125,24,13,151,102,0,0 // vbroadcastss 0x6697(%rip),%ymm9 # 683c <_sk_clut_4D_hsw+0x8b2>
+ .byte 196,98,125,24,21,146,102,0,0 // vbroadcastss 0x6692(%rip),%ymm10 # 6840 <_sk_clut_4D_hsw+0x8b6>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -13502,7 +16682,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,38,89,0,0 // vbroadcastss 0x5926(%rip),%ymm3 # 5b38 <_sk_callback_hsw+0x15e>
+ .byte 196,226,125,24,29,50,102,0,0 // vbroadcastss 0x6632(%rip),%ymm3 # 6844 <_sk_clut_4D_hsw+0x8ba>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -13513,7 +16693,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,17,89,0,0 // vbroadcastss 0x5911(%rip),%ymm0 # 5b3c <_sk_callback_hsw+0x162>
+ .byte 196,226,125,24,5,29,102,0,0 // vbroadcastss 0x661d(%rip),%ymm0 # 6848 <_sk_clut_4D_hsw+0x8be>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -13559,7 +16739,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,180,88,0,0 // vbroadcastss 0x58b4(%rip),%ymm8 # 5b40 <_sk_callback_hsw+0x166>
+ .byte 196,98,125,24,5,192,101,0,0 // vbroadcastss 0x65c0(%rip),%ymm8 # 684c <_sk_clut_4D_hsw+0x8c2>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -13575,7 +16755,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,135,88,0,0 // vbroadcastss 0x5887(%rip),%ymm8 # 5b44 <_sk_callback_hsw+0x16a>
+ .byte 196,98,125,24,5,147,101,0,0 // vbroadcastss 0x6593(%rip),%ymm8 # 6850 <_sk_clut_4D_hsw+0x8c6>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -13614,7 +16794,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,46,88,0,0 // vbroadcastss 0x582e(%rip),%ymm8 # 5b48 <_sk_callback_hsw+0x16e>
+ .byte 196,98,125,24,5,58,101,0,0 // vbroadcastss 0x653a(%rip),%ymm8 # 6854 <_sk_clut_4D_hsw+0x8ca>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -13627,7 +16807,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,17,88,0,0 // vbroadcastss 0x5811(%rip),%ymm0 # 5b4c <_sk_callback_hsw+0x172>
+ .byte 196,226,125,24,5,29,101,0,0 // vbroadcastss 0x651d(%rip),%ymm0 # 6858 <_sk_clut_4D_hsw+0x8ce>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -13640,7 +16820,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,244,87,0,0 // vbroadcastss 0x57f4(%rip),%ymm8 # 5b50 <_sk_callback_hsw+0x176>
+ .byte 196,98,125,24,5,0,101,0,0 // vbroadcastss 0x6500(%rip),%ymm8 # 685c <_sk_clut_4D_hsw+0x8d2>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -13653,7 +16833,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,211,87,0,0 // vbroadcastss 0x57d3(%rip),%ymm8 # 5b54 <_sk_callback_hsw+0x17a>
+ .byte 196,98,125,24,5,223,100,0,0 // vbroadcastss 0x64df(%rip),%ymm8 # 6860 <_sk_clut_4D_hsw+0x8d6>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -13677,7 +16857,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,158,87,0,0 // vbroadcastss 0x579e(%rip),%ymm8 # 5b58 <_sk_callback_hsw+0x17e>
+ .byte 196,98,125,24,5,170,100,0,0 // vbroadcastss 0x64aa(%rip),%ymm8 # 6864 <_sk_clut_4D_hsw+0x8da>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13725,7 +16905,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,25,87,0,0 // vbroadcastss 0x5719(%rip),%ymm8 # 5b5c <_sk_callback_hsw+0x182>
+ .byte 196,98,125,24,5,37,100,0,0 // vbroadcastss 0x6425(%rip),%ymm8 # 6868 <_sk_clut_4D_hsw+0x8de>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13759,7 +16939,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,161,86,0,0 // vbroadcastss 0x56a1(%rip),%ymm8 # 5b60 <_sk_callback_hsw+0x186>
+ .byte 196,98,125,24,5,173,99,0,0 // vbroadcastss 0x63ad(%rip),%ymm8 # 686c <_sk_clut_4D_hsw+0x8e2>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13784,7 +16964,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,80,86,0,0 // vbroadcastss 0x5650(%rip),%ymm8 # 5b64 <_sk_callback_hsw+0x18a>
+ .byte 196,98,125,24,5,92,99,0,0 // vbroadcastss 0x635c(%rip),%ymm8 # 6870 <_sk_clut_4D_hsw+0x8e6>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13812,7 +16992,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,243,85,0,0 // vbroadcastss 0x55f3(%rip),%ymm8 # 5b68 <_sk_callback_hsw+0x18e>
+ .byte 196,98,125,24,5,255,98,0,0 // vbroadcastss 0x62ff(%rip),%ymm8 # 6874 <_sk_clut_4D_hsw+0x8ea>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13834,7 +17014,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,177,85,0,0 // vbroadcastss 0x55b1(%rip),%ymm8 # 5b6c <_sk_callback_hsw+0x192>
+ .byte 196,98,125,24,5,189,98,0,0 // vbroadcastss 0x62bd(%rip),%ymm8 # 6878 <_sk_clut_4D_hsw+0x8ee>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13844,7 +17024,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,159,85,0,0 // vbroadcastss 0x559f(%rip),%ymm8 # 5b70 <_sk_callback_hsw+0x196>
+ .byte 196,98,125,24,5,171,98,0,0 // vbroadcastss 0x62ab(%rip),%ymm8 # 687c <_sk_clut_4D_hsw+0x8f2>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -13902,7 +17082,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,170,84,0,0 // vbroadcastss 0x54aa(%rip),%ymm9 # 5b74 <_sk_callback_hsw+0x19a>
+ .byte 196,98,125,24,13,182,97,0,0 // vbroadcastss 0x61b6(%rip),%ymm9 # 6880 <_sk_clut_4D_hsw+0x8f6>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -13955,7 +17135,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,203,83,0,0 // vbroadcastss 0x53cb(%rip),%ymm8 # 5b78 <_sk_callback_hsw+0x19e>
+ .byte 196,98,125,24,5,215,96,0,0 // vbroadcastss 0x60d7(%rip),%ymm8 # 6884 <_sk_clut_4D_hsw+0x8fa>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -14006,7 +17186,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,3,83,0,0 // vbroadcastss 0x5303(%rip),%ymm8 # 5b7c <_sk_callback_hsw+0x1a2>
+ .byte 196,98,125,24,5,15,96,0,0 // vbroadcastss 0x600f(%rip),%ymm8 # 6888 <_sk_clut_4D_hsw+0x8fe>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -14067,10 +17247,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,14,82,0,0 // vbroadcastss 0x520e(%rip),%ymm11 # 5b84 <_sk_callback_hsw+0x1aa>
+ .byte 196,98,125,24,29,26,95,0,0 // vbroadcastss 0x5f1a(%rip),%ymm11 # 6890 <_sk_clut_4D_hsw+0x906>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,255,81,0,0 // vbroadcastss 0x51ff(%rip),%ymm12 # 5b88 <_sk_callback_hsw+0x1ae>
+ .byte 196,98,125,24,37,11,95,0,0 // vbroadcastss 0x5f0b(%rip),%ymm12 # 6894 <_sk_clut_4D_hsw+0x90a>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -14080,7 +17260,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,194,81,0,0 // vbroadcastss 0x51c2(%rip),%ymm8 # 5b80 <_sk_callback_hsw+0x1a6>
+ .byte 196,98,125,24,5,206,94,0,0 // vbroadcastss 0x5ece(%rip),%ymm8 # 688c <_sk_clut_4D_hsw+0x902>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -14193,11 +17373,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,198,79,0,0 // vbroadcastss 0x4fc6(%rip),%ymm14 # 5b8c <_sk_callback_hsw+0x1b2>
- .byte 196,98,125,24,61,193,79,0,0 // vbroadcastss 0x4fc1(%rip),%ymm15 # 5b90 <_sk_callback_hsw+0x1b6>
+ .byte 196,98,125,24,53,210,92,0,0 // vbroadcastss 0x5cd2(%rip),%ymm14 # 6898 <_sk_clut_4D_hsw+0x90e>
+ .byte 196,98,125,24,61,205,92,0,0 // vbroadcastss 0x5ccd(%rip),%ymm15 # 689c <_sk_clut_4D_hsw+0x912>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,178,79,0,0 // vbroadcastss 0x4fb2(%rip),%ymm0 # 5b94 <_sk_callback_hsw+0x1ba>
+ .byte 196,226,125,24,5,190,92,0,0 // vbroadcastss 0x5cbe(%rip),%ymm0 # 68a0 <_sk_clut_4D_hsw+0x916>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -14252,7 +17432,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,159,78,0,0 // vbroadcastss 0x4e9f(%rip),%ymm1 # 5b98 <_sk_callback_hsw+0x1be>
+ .byte 196,226,125,24,13,171,91,0,0 // vbroadcastss 0x5bab(%rip),%ymm1 # 68a4 <_sk_clut_4D_hsw+0x91a>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -14306,11 +17486,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,182,77,0,0 // vbroadcastss 0x4db6(%rip),%ymm14 # 5b9c <_sk_callback_hsw+0x1c2>
- .byte 196,98,125,24,61,177,77,0,0 // vbroadcastss 0x4db1(%rip),%ymm15 # 5ba0 <_sk_callback_hsw+0x1c6>
+ .byte 196,98,125,24,53,194,90,0,0 // vbroadcastss 0x5ac2(%rip),%ymm14 # 68a8 <_sk_clut_4D_hsw+0x91e>
+ .byte 196,98,125,24,61,189,90,0,0 // vbroadcastss 0x5abd(%rip),%ymm15 # 68ac <_sk_clut_4D_hsw+0x922>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,162,77,0,0 // vbroadcastss 0x4da2(%rip),%ymm0 # 5ba4 <_sk_callback_hsw+0x1ca>
+ .byte 196,226,125,24,5,174,90,0,0 // vbroadcastss 0x5aae(%rip),%ymm0 # 68b0 <_sk_clut_4D_hsw+0x926>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -14365,7 +17545,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,143,76,0,0 // vbroadcastss 0x4c8f(%rip),%ymm1 # 5ba8 <_sk_callback_hsw+0x1ce>
+ .byte 196,226,125,24,13,155,89,0,0 // vbroadcastss 0x599b(%rip),%ymm1 # 68b4 <_sk_clut_4D_hsw+0x92a>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -14393,11 +17573,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,40,76,0,0 // vbroadcastss 0x4c28(%rip),%ymm13 # 5bac <_sk_callback_hsw+0x1d2>
- .byte 196,98,125,24,53,35,76,0,0 // vbroadcastss 0x4c23(%rip),%ymm14 # 5bb0 <_sk_callback_hsw+0x1d6>
+ .byte 196,98,125,24,45,52,89,0,0 // vbroadcastss 0x5934(%rip),%ymm13 # 68b8 <_sk_clut_4D_hsw+0x92e>
+ .byte 196,98,125,24,53,47,89,0,0 // vbroadcastss 0x592f(%rip),%ymm14 # 68bc <_sk_clut_4D_hsw+0x932>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,20,76,0,0 // vbroadcastss 0x4c14(%rip),%ymm15 # 5bb4 <_sk_callback_hsw+0x1da>
+ .byte 196,98,125,24,61,32,89,0,0 // vbroadcastss 0x5920(%rip),%ymm15 # 68c0 <_sk_clut_4D_hsw+0x936>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -14453,7 +17633,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,246,74,0,0 // vbroadcastss 0x4af6(%rip),%ymm0 # 5bb8 <_sk_callback_hsw+0x1de>
+ .byte 196,226,125,24,5,2,88,0,0 // vbroadcastss 0x5802(%rip),%ymm0 # 68c4 <_sk_clut_4D_hsw+0x93a>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -14481,11 +17661,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,143,74,0,0 // vbroadcastss 0x4a8f(%rip),%ymm13 # 5bbc <_sk_callback_hsw+0x1e2>
- .byte 196,98,125,24,53,138,74,0,0 // vbroadcastss 0x4a8a(%rip),%ymm14 # 5bc0 <_sk_callback_hsw+0x1e6>
+ .byte 196,98,125,24,45,155,87,0,0 // vbroadcastss 0x579b(%rip),%ymm13 # 68c8 <_sk_clut_4D_hsw+0x93e>
+ .byte 196,98,125,24,53,150,87,0,0 // vbroadcastss 0x5796(%rip),%ymm14 # 68cc <_sk_clut_4D_hsw+0x942>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,123,74,0,0 // vbroadcastss 0x4a7b(%rip),%ymm15 # 5bc4 <_sk_callback_hsw+0x1ea>
+ .byte 196,98,125,24,61,135,87,0,0 // vbroadcastss 0x5787(%rip),%ymm15 # 68d0 <_sk_clut_4D_hsw+0x946>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -14541,7 +17721,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,93,73,0,0 // vbroadcastss 0x495d(%rip),%ymm0 # 5bc8 <_sk_callback_hsw+0x1ee>
+ .byte 196,226,125,24,5,105,86,0,0 // vbroadcastss 0x5669(%rip),%ymm0 # 68d4 <_sk_clut_4D_hsw+0x94a>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -14574,17 +17754,17 @@ _sk_srcover_rgba_8888_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,178,0,0,0 // jne 1386 <_sk_srcover_rgba_8888_hsw+0xd9>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,32,77,0,0 // vandps 0x4d20(%rip),%ymm7,%ymm4 # 6000 <_sk_callback_hsw+0x626>
+ .byte 197,196,84,37,96,90,0,0 // vandps 0x5a60(%rip),%ymm7,%ymm4 # 6d40 <_sk_clut_4D_hsw+0xdb6>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,51,77,0,0 // vpshufb 0x4d33(%rip),%ymm7,%ymm5 # 6020 <_sk_callback_hsw+0x646>
+ .byte 196,226,69,0,45,115,90,0,0 // vpshufb 0x5a73(%rip),%ymm7,%ymm5 # 6d60 <_sk_clut_4D_hsw+0xdd6>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,70,77,0,0 // vpshufb 0x4d46(%rip),%ymm7,%ymm6 # 6040 <_sk_callback_hsw+0x666>
+ .byte 196,226,69,0,53,134,90,0,0 // vpshufb 0x5a86(%rip),%ymm7,%ymm6 # 6d80 <_sk_clut_4D_hsw+0xdf6>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,188,72,0,0 // vbroadcastss 0x48bc(%rip),%ymm8 # 5bcc <_sk_callback_hsw+0x1f2>
+ .byte 196,98,125,24,5,200,85,0,0 // vbroadcastss 0x55c8(%rip),%ymm8 # 68d8 <_sk_clut_4D_hsw+0x94e>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,179,72,0,0 // vbroadcastss 0x48b3(%rip),%ymm9 # 5bd0 <_sk_callback_hsw+0x1f6>
+ .byte 196,98,125,24,13,191,85,0,0 // vbroadcastss 0x55bf(%rip),%ymm9 # 68dc <_sk_clut_4D_hsw+0x952>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -14644,7 +17824,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,217,71,0,0 // vbroadcastss 0x47d9(%rip),%ymm8 # 5bd4 <_sk_callback_hsw+0x1fa>
+ .byte 196,98,125,24,5,229,84,0,0 // vbroadcastss 0x54e5(%rip),%ymm8 # 68e0 <_sk_clut_4D_hsw+0x956>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -14656,7 +17836,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,188,71,0,0 // vbroadcastss 0x47bc(%rip),%ymm8 # 5bd8 <_sk_callback_hsw+0x1fe>
+ .byte 196,98,125,24,5,200,84,0,0 // vbroadcastss 0x54c8(%rip),%ymm8 # 68e4 <_sk_clut_4D_hsw+0x95a>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -14668,7 +17848,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,162,71,0,0 // vbroadcastss 0x47a2(%rip),%ymm8 # 5bdc <_sk_callback_hsw+0x202>
+ .byte 196,98,125,24,5,174,84,0,0 // vbroadcastss 0x54ae(%rip),%ymm8 # 68e8 <_sk_clut_4D_hsw+0x95e>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -14701,7 +17881,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,97,71,0,0 // vbroadcastss 0x4761(%rip),%ymm8 # 5be0 <_sk_callback_hsw+0x206>
+ .byte 196,98,125,24,5,109,84,0,0 // vbroadcastss 0x546d(%rip),%ymm8 # 68ec <_sk_clut_4D_hsw+0x962>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -14757,7 +17937,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,245,70,0,0 // vbroadcastss 0x46f5(%rip),%ymm10 # 5be4 <_sk_callback_hsw+0x20a>
+ .byte 196,98,125,24,21,1,84,0,0 // vbroadcastss 0x5401(%rip),%ymm10 # 68f0 <_sk_clut_4D_hsw+0x966>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -14770,16 +17950,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,214,70,0,0 // vbroadcastss 0x46d6(%rip),%ymm8 # 5be8 <_sk_callback_hsw+0x20e>
+ .byte 196,98,125,24,5,226,83,0,0 // vbroadcastss 0x53e2(%rip),%ymm8 # 68f4 <_sk_clut_4D_hsw+0x96a>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,200,70,0,0 // vbroadcastss 0x46c8(%rip),%ymm11 # 5bec <_sk_callback_hsw+0x212>
- .byte 196,98,125,24,37,195,70,0,0 // vbroadcastss 0x46c3(%rip),%ymm12 # 5bf0 <_sk_callback_hsw+0x216>
+ .byte 196,98,125,24,29,212,83,0,0 // vbroadcastss 0x53d4(%rip),%ymm11 # 68f8 <_sk_clut_4D_hsw+0x96e>
+ .byte 196,98,125,24,37,207,83,0,0 // vbroadcastss 0x53cf(%rip),%ymm12 # 68fc <_sk_clut_4D_hsw+0x972>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,180,70,0,0 // vbroadcastss 0x46b4(%rip),%ymm14 # 5bf4 <_sk_callback_hsw+0x21a>
+ .byte 196,98,125,24,53,192,83,0,0 // vbroadcastss 0x53c0(%rip),%ymm14 # 6900 <_sk_clut_4D_hsw+0x976>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,170,70,0,0 // vbroadcastss 0x46aa(%rip),%ymm10 # 5bf8 <_sk_callback_hsw+0x21e>
+ .byte 196,98,125,24,21,182,83,0,0 // vbroadcastss 0x53b6(%rip),%ymm10 # 6904 <_sk_clut_4D_hsw+0x97a>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -14802,16 +17982,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,82,70,0,0 // vbroadcastss 0x4652(%rip),%ymm8 # 5bfc <_sk_callback_hsw+0x222>
+ .byte 196,98,125,24,5,94,83,0,0 // vbroadcastss 0x535e(%rip),%ymm8 # 6908 <_sk_clut_4D_hsw+0x97e>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,68,70,0,0 // vbroadcastss 0x4644(%rip),%ymm11 # 5c00 <_sk_callback_hsw+0x226>
- .byte 196,98,125,24,37,63,70,0,0 // vbroadcastss 0x463f(%rip),%ymm12 # 5c04 <_sk_callback_hsw+0x22a>
+ .byte 196,98,125,24,29,80,83,0,0 // vbroadcastss 0x5350(%rip),%ymm11 # 690c <_sk_clut_4D_hsw+0x982>
+ .byte 196,98,125,24,37,75,83,0,0 // vbroadcastss 0x534b(%rip),%ymm12 # 6910 <_sk_clut_4D_hsw+0x986>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,48,70,0,0 // vbroadcastss 0x4630(%rip),%ymm14 # 5c08 <_sk_callback_hsw+0x22e>
+ .byte 196,98,125,24,53,60,83,0,0 // vbroadcastss 0x533c(%rip),%ymm14 # 6914 <_sk_clut_4D_hsw+0x98a>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,38,70,0,0 // vbroadcastss 0x4626(%rip),%ymm10 # 5c0c <_sk_callback_hsw+0x232>
+ .byte 196,98,125,24,21,50,83,0,0 // vbroadcastss 0x5332(%rip),%ymm10 # 6918 <_sk_clut_4D_hsw+0x98e>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -14835,19 +18015,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,202,69,0,0 // vbroadcastss 0x45ca(%rip),%ymm8 # 5c10 <_sk_callback_hsw+0x236>
+ .byte 196,98,125,24,5,214,82,0,0 // vbroadcastss 0x52d6(%rip),%ymm8 # 691c <_sk_clut_4D_hsw+0x992>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,192,69,0,0 // vbroadcastss 0x45c0(%rip),%ymm11 # 5c14 <_sk_callback_hsw+0x23a>
- .byte 196,98,125,24,37,187,69,0,0 // vbroadcastss 0x45bb(%rip),%ymm12 # 5c18 <_sk_callback_hsw+0x23e>
+ .byte 196,98,125,24,29,204,82,0,0 // vbroadcastss 0x52cc(%rip),%ymm11 # 6920 <_sk_clut_4D_hsw+0x996>
+ .byte 196,98,125,24,37,199,82,0,0 // vbroadcastss 0x52c7(%rip),%ymm12 # 6924 <_sk_clut_4D_hsw+0x99a>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,172,69,0,0 // vbroadcastss 0x45ac(%rip),%ymm14 # 5c1c <_sk_callback_hsw+0x242>
+ .byte 196,98,125,24,53,184,82,0,0 // vbroadcastss 0x52b8(%rip),%ymm14 # 6928 <_sk_clut_4D_hsw+0x99e>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,162,69,0,0 // vbroadcastss 0x45a2(%rip),%ymm15 # 5c20 <_sk_callback_hsw+0x246>
+ .byte 196,98,125,24,61,174,82,0,0 // vbroadcastss 0x52ae(%rip),%ymm15 # 692c <_sk_clut_4D_hsw+0x9a2>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,142,69,0,0 // vbroadcastss 0x458e(%rip),%ymm13 # 5c24 <_sk_callback_hsw+0x24a>
+ .byte 196,98,125,24,45,154,82,0,0 // vbroadcastss 0x529a(%rip),%ymm13 # 6930 <_sk_clut_4D_hsw+0x9a6>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -14881,26 +18061,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,3,69,0,0 // vbroadcastss 0x4503(%rip),%ymm11 # 5c28 <_sk_callback_hsw+0x24e>
+ .byte 196,98,125,24,29,15,82,0,0 // vbroadcastss 0x520f(%rip),%ymm11 # 6934 <_sk_clut_4D_hsw+0x9aa>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,240,68,0,0 // vbroadcastss 0x44f0(%rip),%ymm14 # 5c2c <_sk_callback_hsw+0x252>
+ .byte 196,98,125,24,53,252,81,0,0 // vbroadcastss 0x51fc(%rip),%ymm14 # 6938 <_sk_clut_4D_hsw+0x9ae>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,215,68,0,0 // vbroadcastss 0x44d7(%rip),%ymm14 # 5c34 <_sk_callback_hsw+0x25a>
+ .byte 196,98,125,24,53,227,81,0,0 // vbroadcastss 0x51e3(%rip),%ymm14 # 6940 <_sk_clut_4D_hsw+0x9b6>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,197,68,0,0 // vbroadcastss 0x44c5(%rip),%ymm14 # 5c30 <_sk_callback_hsw+0x256>
+ .byte 196,98,125,24,53,209,81,0,0 // vbroadcastss 0x51d1(%rip),%ymm14 # 693c <_sk_clut_4D_hsw+0x9b2>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,168,68,0,0 // vbroadcastss 0x44a8(%rip),%ymm11 # 5c3c <_sk_callback_hsw+0x262>
+ .byte 196,98,125,24,29,180,81,0,0 // vbroadcastss 0x51b4(%rip),%ymm11 # 6948 <_sk_clut_4D_hsw+0x9be>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -14910,7 +18090,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,107,68,0,0 // vbroadcastss 0x446b(%rip),%ymm8 # 5c38 <_sk_callback_hsw+0x25e>
+ .byte 196,98,125,24,5,119,81,0,0 // vbroadcastss 0x5177(%rip),%ymm8 # 6944 <_sk_clut_4D_hsw+0x9ba>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14927,30 +18107,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,56,68,0,0 // vbroadcastss 0x4438(%rip),%ymm8 # 5c40 <_sk_callback_hsw+0x266>
+ .byte 196,98,125,24,5,68,81,0,0 // vbroadcastss 0x5144(%rip),%ymm8 # 694c <_sk_clut_4D_hsw+0x9c2>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,27,68,0,0 // vbroadcastss 0x441b(%rip),%ymm9 # 5c44 <_sk_callback_hsw+0x26a>
+ .byte 196,98,125,24,13,39,81,0,0 // vbroadcastss 0x5127(%rip),%ymm9 # 6950 <_sk_clut_4D_hsw+0x9c6>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,17,68,0,0 // vbroadcastss 0x4411(%rip),%ymm11 # 5c48 <_sk_callback_hsw+0x26e>
+ .byte 196,98,125,24,29,29,81,0,0 // vbroadcastss 0x511d(%rip),%ymm11 # 6954 <_sk_clut_4D_hsw+0x9ca>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,251,67,0,0 // vbroadcastss 0x43fb(%rip),%ymm13 # 5c50 <_sk_callback_hsw+0x276>
+ .byte 196,98,125,24,45,7,81,0,0 // vbroadcastss 0x5107(%rip),%ymm13 # 695c <_sk_clut_4D_hsw+0x9d2>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,241,67,0,0 // vbroadcastss 0x43f1(%rip),%ymm14 # 5c54 <_sk_callback_hsw+0x27a>
+ .byte 196,98,125,24,53,253,80,0,0 // vbroadcastss 0x50fd(%rip),%ymm14 # 6960 <_sk_clut_4D_hsw+0x9d6>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,215,67,0,0 // vbroadcastss 0x43d7(%rip),%ymm3 # 5c4c <_sk_callback_hsw+0x272>
+ .byte 196,226,125,24,29,227,80,0,0 // vbroadcastss 0x50e3(%rip),%ymm3 # 6958 <_sk_clut_4D_hsw+0x9ce>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,194,67,0,0 // vbroadcastss 0x43c2(%rip),%ymm12 # 5c58 <_sk_callback_hsw+0x27e>
+ .byte 196,98,125,24,37,206,80,0,0 // vbroadcastss 0x50ce(%rip),%ymm12 # 6964 <_sk_clut_4D_hsw+0x9da>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -14966,7 +18146,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,110,67,0,0 // vbroadcastss 0x436e(%rip),%ymm0 # 5c5c <_sk_callback_hsw+0x282>
+ .byte 196,226,125,24,5,122,80,0,0 // vbroadcastss 0x507a(%rip),%ymm0 # 6968 <_sk_clut_4D_hsw+0x9de>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -15021,10 +18201,10 @@ _sk_scale_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,59 // jne 19df <_sk_scale_u8_hsw+0x54>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,78,73,0,0 // vpand 0x494e(%rip),%xmm8,%xmm8 # 6300 <_sk_callback_hsw+0x926>
+ .byte 197,57,219,5,142,86,0,0 // vpand 0x568e(%rip),%xmm8,%xmm8 # 7040 <_sk_clut_4D_hsw+0x10b6>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,155,66,0,0 // vbroadcastss 0x429b(%rip),%ymm9 # 5c60 <_sk_callback_hsw+0x286>
+ .byte 196,98,125,24,13,167,79,0,0 // vbroadcastss 0x4fa7(%rip),%ymm9 # 696c <_sk_clut_4D_hsw+0x9e2>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -15118,10 +18298,10 @@ _sk_lerp_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,79 // jne 1b2b <_sk_lerp_u8_hsw+0x68>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,38,72,0,0 // vpand 0x4826(%rip),%xmm8,%xmm8 # 6310 <_sk_callback_hsw+0x936>
+ .byte 197,57,219,5,102,85,0,0 // vpand 0x5566(%rip),%xmm8,%xmm8 # 7050 <_sk_clut_4D_hsw+0x10c6>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,103,65,0,0 // vbroadcastss 0x4167(%rip),%ymm9 # 5c64 <_sk_callback_hsw+0x28a>
+ .byte 196,98,125,24,13,115,78,0,0 // vbroadcastss 0x4e73(%rip),%ymm9 # 6970 <_sk_clut_4D_hsw+0x9e6>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -15204,20 +18384,20 @@ _sk_lerp_565_hsw:
.byte 15,133,170,0,0,0 // jne 1caa <_sk_lerp_565_hsw+0xca>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,84,64,0,0 // vpbroadcastd 0x4054(%rip),%ymm9 # 5c68 <_sk_callback_hsw+0x28e>
+ .byte 196,98,125,88,13,96,77,0,0 // vpbroadcastd 0x4d60(%rip),%ymm9 # 6974 <_sk_clut_4D_hsw+0x9ea>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,69,64,0,0 // vbroadcastss 0x4045(%rip),%ymm10 # 5c6c <_sk_callback_hsw+0x292>
+ .byte 196,98,125,24,21,81,77,0,0 // vbroadcastss 0x4d51(%rip),%ymm10 # 6978 <_sk_clut_4D_hsw+0x9ee>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,59,64,0,0 // vpbroadcastd 0x403b(%rip),%ymm10 # 5c70 <_sk_callback_hsw+0x296>
+ .byte 196,98,125,88,21,71,77,0,0 // vpbroadcastd 0x4d47(%rip),%ymm10 # 697c <_sk_clut_4D_hsw+0x9f2>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,44,64,0,0 // vbroadcastss 0x402c(%rip),%ymm11 # 5c74 <_sk_callback_hsw+0x29a>
+ .byte 196,98,125,24,29,56,77,0,0 // vbroadcastss 0x4d38(%rip),%ymm11 # 6980 <_sk_clut_4D_hsw+0x9f6>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,34,64,0,0 // vpbroadcastd 0x4022(%rip),%ymm11 # 5c78 <_sk_callback_hsw+0x29e>
+ .byte 196,98,125,88,29,46,77,0,0 // vpbroadcastd 0x4d2e(%rip),%ymm11 # 6984 <_sk_clut_4D_hsw+0x9fa>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,19,64,0,0 // vbroadcastss 0x4013(%rip),%ymm11 # 5c7c <_sk_callback_hsw+0x2a2>
+ .byte 196,98,125,24,29,31,77,0,0 // vbroadcastss 0x4d1f(%rip),%ymm11 # 6988 <_sk_clut_4D_hsw+0x9fe>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -15290,21 +18470,21 @@ _sk_load_tables_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,105 // jne 1dce <_sk_load_tables_hsw+0x7e>
.byte 196,193,124,16,26 // vmovups (%r10),%ymm3
- .byte 197,228,84,13,238,66,0,0 // vandps 0x42ee(%rip),%ymm3,%ymm1 # 6060 <_sk_callback_hsw+0x686>
+ .byte 197,228,84,13,46,80,0,0 // vandps 0x502e(%rip),%ymm3,%ymm1 # 6da0 <_sk_clut_4D_hsw+0xe16>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 72,139,72,8 // mov 0x8(%rax),%rcx
.byte 76,139,80,16 // mov 0x10(%rax),%r10
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,238,66,0,0 // vpshufb 0x42ee(%rip),%ymm3,%ymm2 # 6080 <_sk_callback_hsw+0x6a6>
+ .byte 196,226,101,0,21,46,80,0,0 // vpshufb 0x502e(%rip),%ymm3,%ymm2 # 6dc0 <_sk_clut_4D_hsw+0xe36>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,246,66,0,0 // vpshufb 0x42f6(%rip),%ymm3,%ymm9 # 60a0 <_sk_callback_hsw+0x6c6>
+ .byte 196,98,101,0,13,54,80,0,0 // vpshufb 0x5036(%rip),%ymm3,%ymm9 # 6de0 <_sk_clut_4D_hsw+0xe56>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,190,62,0,0 // vbroadcastss 0x3ebe(%rip),%ymm8 # 5c80 <_sk_callback_hsw+0x2a6>
+ .byte 196,98,125,24,5,202,75,0,0 // vbroadcastss 0x4bca(%rip),%ymm8 # 698c <_sk_clut_4D_hsw+0xa02>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -15343,7 +18523,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,194,68,0,0 // vmovdqa 0x44c2(%rip),%xmm10 # 6320 <_sk_callback_hsw+0x946>
+ .byte 197,121,111,21,2,82,0,0 // vmovdqa 0x5202(%rip),%xmm10 # 7060 <_sk_clut_4D_hsw+0x10d6>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -15365,7 +18545,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,183,61,0,0 // vbroadcastss 0x3db7(%rip),%ymm8 # 5c84 <_sk_callback_hsw+0x2aa>
+ .byte 196,98,125,24,5,195,74,0,0 // vbroadcastss 0x4ac3(%rip),%ymm8 # 6990 <_sk_clut_4D_hsw+0xa06>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15425,7 +18605,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,98,67,0,0 // vmovdqa 0x4362(%rip),%xmm9 # 6330 <_sk_callback_hsw+0x956>
+ .byte 197,121,111,13,162,80,0,0 // vmovdqa 0x50a2(%rip),%xmm9 # 7070 <_sk_clut_4D_hsw+0x10e6>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -15442,7 +18622,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
.byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,101,60,0,0 // vbroadcastss 0x3c65(%rip),%ymm3 # 5c88 <_sk_callback_hsw+0x2ae>
+ .byte 196,226,125,24,29,113,73,0,0 // vbroadcastss 0x4971(%rip),%ymm3 # 6994 <_sk_clut_4D_hsw+0xa0a>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
@@ -15483,7 +18663,7 @@ HIDDEN _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,173,59,0,0 // vbroadcastss 0x3bad(%rip),%ymm8 # 5c8c <_sk_callback_hsw+0x2b2>
+ .byte 196,98,125,24,5,185,72,0,0 // vbroadcastss 0x48b9(%rip),%ymm8 # 6998 <_sk_clut_4D_hsw+0xa0e>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -15605,7 +18785,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,82,57,0,0 // vbroadcastss 0x3952(%rip),%ymm8 # 5c90 <_sk_callback_hsw+0x2b6>
+ .byte 196,98,125,24,5,94,70,0,0 // vbroadcastss 0x465e(%rip),%ymm8 # 699c <_sk_clut_4D_hsw+0xa12>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -15721,7 +18901,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,62,55,0,0 // vbroadcastss 0x373e(%rip),%ymm8 # 5c94 <_sk_callback_hsw+0x2ba>
+ .byte 196,98,125,24,5,74,68,0,0 // vbroadcastss 0x444a(%rip),%ymm8 # 69a0 <_sk_clut_4D_hsw+0xa16>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -15820,33 +19000,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,24,54,0,0 // vbroadcastss 0x3618(%rip),%ymm12 # 5c98 <_sk_callback_hsw+0x2be>
- .byte 196,98,125,24,45,19,54,0,0 // vbroadcastss 0x3613(%rip),%ymm13 # 5c9c <_sk_callback_hsw+0x2c2>
+ .byte 196,98,125,24,37,36,67,0,0 // vbroadcastss 0x4324(%rip),%ymm12 # 69a4 <_sk_clut_4D_hsw+0xa1a>
+ .byte 196,98,125,24,45,31,67,0,0 // vbroadcastss 0x431f(%rip),%ymm13 # 69a8 <_sk_clut_4D_hsw+0xa1e>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,9,54,0,0 // vbroadcastss 0x3609(%rip),%ymm13 # 5ca0 <_sk_callback_hsw+0x2c6>
+ .byte 196,98,125,24,45,21,67,0,0 // vbroadcastss 0x4315(%rip),%ymm13 # 69ac <_sk_clut_4D_hsw+0xa22>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,255,53,0,0 // vbroadcastss 0x35ff(%rip),%ymm13 # 5ca4 <_sk_callback_hsw+0x2ca>
+ .byte 196,98,125,24,45,11,67,0,0 // vbroadcastss 0x430b(%rip),%ymm13 # 69b0 <_sk_clut_4D_hsw+0xa26>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,245,53,0,0 // vbroadcastss 0x35f5(%rip),%ymm11 # 5ca8 <_sk_callback_hsw+0x2ce>
+ .byte 196,98,125,24,29,1,67,0,0 // vbroadcastss 0x4301(%rip),%ymm11 # 69b4 <_sk_clut_4D_hsw+0xa2a>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,235,53,0,0 // vbroadcastss 0x35eb(%rip),%ymm12 # 5cac <_sk_callback_hsw+0x2d2>
+ .byte 196,98,125,24,37,247,66,0,0 // vbroadcastss 0x42f7(%rip),%ymm12 # 69b8 <_sk_clut_4D_hsw+0xa2e>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,225,53,0,0 // vbroadcastss 0x35e1(%rip),%ymm12 # 5cb0 <_sk_callback_hsw+0x2d6>
+ .byte 196,98,125,24,37,237,66,0,0 // vbroadcastss 0x42ed(%rip),%ymm12 # 69bc <_sk_clut_4D_hsw+0xa32>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,194,53,0,0 // vbroadcastss 0x35c2(%rip),%ymm11 # 5cb4 <_sk_callback_hsw+0x2da>
+ .byte 196,98,125,24,29,206,66,0,0 // vbroadcastss 0x42ce(%rip),%ymm11 # 69c0 <_sk_clut_4D_hsw+0xa36>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,184,53,0,0 // vbroadcastss 0x35b8(%rip),%ymm11 # 5cb8 <_sk_callback_hsw+0x2de>
+ .byte 196,98,125,24,29,196,66,0,0 // vbroadcastss 0x42c4(%rip),%ymm11 # 69c4 <_sk_clut_4D_hsw+0xa3a>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,174,53,0,0 // vbroadcastss 0x35ae(%rip),%ymm0 # 5cbc <_sk_callback_hsw+0x2e2>
+ .byte 196,226,125,24,5,186,66,0,0 // vbroadcastss 0x42ba(%rip),%ymm0 # 69c8 <_sk_clut_4D_hsw+0xa3e>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,164,53,0,0 // vbroadcastss 0x35a4(%rip),%ymm10 # 5cc0 <_sk_callback_hsw+0x2e6>
+ .byte 196,98,125,24,21,176,66,0,0 // vbroadcastss 0x42b0(%rip),%ymm10 # 69cc <_sk_clut_4D_hsw+0xa42>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,151,53,0,0 // vbroadcastss 0x3597(%rip),%ymm10 # 5cc4 <_sk_callback_hsw+0x2ea>
+ .byte 196,98,125,24,21,163,66,0,0 // vbroadcastss 0x42a3(%rip),%ymm10 # 69d0 <_sk_clut_4D_hsw+0xa46>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15854,7 +19034,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,110,53,0,0 // vbroadcastss 0x356e(%rip),%ymm8 # 5cc8 <_sk_callback_hsw+0x2ee>
+ .byte 196,98,125,24,5,122,66,0,0 // vbroadcastss 0x427a(%rip),%ymm8 # 69d4 <_sk_clut_4D_hsw+0xa4a>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15874,33 +19054,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,38,53,0,0 // vbroadcastss 0x3526(%rip),%ymm12 # 5ccc <_sk_callback_hsw+0x2f2>
- .byte 196,98,125,24,45,33,53,0,0 // vbroadcastss 0x3521(%rip),%ymm13 # 5cd0 <_sk_callback_hsw+0x2f6>
+ .byte 196,98,125,24,37,50,66,0,0 // vbroadcastss 0x4232(%rip),%ymm12 # 69d8 <_sk_clut_4D_hsw+0xa4e>
+ .byte 196,98,125,24,45,45,66,0,0 // vbroadcastss 0x422d(%rip),%ymm13 # 69dc <_sk_clut_4D_hsw+0xa52>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,23,53,0,0 // vbroadcastss 0x3517(%rip),%ymm13 # 5cd4 <_sk_callback_hsw+0x2fa>
+ .byte 196,98,125,24,45,35,66,0,0 // vbroadcastss 0x4223(%rip),%ymm13 # 69e0 <_sk_clut_4D_hsw+0xa56>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,13,53,0,0 // vbroadcastss 0x350d(%rip),%ymm13 # 5cd8 <_sk_callback_hsw+0x2fe>
+ .byte 196,98,125,24,45,25,66,0,0 // vbroadcastss 0x4219(%rip),%ymm13 # 69e4 <_sk_clut_4D_hsw+0xa5a>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,3,53,0,0 // vbroadcastss 0x3503(%rip),%ymm11 # 5cdc <_sk_callback_hsw+0x302>
+ .byte 196,98,125,24,29,15,66,0,0 // vbroadcastss 0x420f(%rip),%ymm11 # 69e8 <_sk_clut_4D_hsw+0xa5e>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,249,52,0,0 // vbroadcastss 0x34f9(%rip),%ymm12 # 5ce0 <_sk_callback_hsw+0x306>
+ .byte 196,98,125,24,37,5,66,0,0 // vbroadcastss 0x4205(%rip),%ymm12 # 69ec <_sk_clut_4D_hsw+0xa62>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,239,52,0,0 // vbroadcastss 0x34ef(%rip),%ymm12 # 5ce4 <_sk_callback_hsw+0x30a>
+ .byte 196,98,125,24,37,251,65,0,0 // vbroadcastss 0x41fb(%rip),%ymm12 # 69f0 <_sk_clut_4D_hsw+0xa66>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,208,52,0,0 // vbroadcastss 0x34d0(%rip),%ymm11 # 5ce8 <_sk_callback_hsw+0x30e>
+ .byte 196,98,125,24,29,220,65,0,0 // vbroadcastss 0x41dc(%rip),%ymm11 # 69f4 <_sk_clut_4D_hsw+0xa6a>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,198,52,0,0 // vbroadcastss 0x34c6(%rip),%ymm11 # 5cec <_sk_callback_hsw+0x312>
+ .byte 196,98,125,24,29,210,65,0,0 // vbroadcastss 0x41d2(%rip),%ymm11 # 69f8 <_sk_clut_4D_hsw+0xa6e>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,188,52,0,0 // vbroadcastss 0x34bc(%rip),%ymm1 # 5cf0 <_sk_callback_hsw+0x316>
+ .byte 196,226,125,24,13,200,65,0,0 // vbroadcastss 0x41c8(%rip),%ymm1 # 69fc <_sk_clut_4D_hsw+0xa72>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,178,52,0,0 // vbroadcastss 0x34b2(%rip),%ymm10 # 5cf4 <_sk_callback_hsw+0x31a>
+ .byte 196,98,125,24,21,190,65,0,0 // vbroadcastss 0x41be(%rip),%ymm10 # 6a00 <_sk_clut_4D_hsw+0xa76>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,165,52,0,0 // vbroadcastss 0x34a5(%rip),%ymm10 # 5cf8 <_sk_callback_hsw+0x31e>
+ .byte 196,98,125,24,21,177,65,0,0 // vbroadcastss 0x41b1(%rip),%ymm10 # 6a04 <_sk_clut_4D_hsw+0xa7a>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15908,7 +19088,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,124,52,0,0 // vbroadcastss 0x347c(%rip),%ymm8 # 5cfc <_sk_callback_hsw+0x322>
+ .byte 196,98,125,24,5,136,65,0,0 // vbroadcastss 0x4188(%rip),%ymm8 # 6a08 <_sk_clut_4D_hsw+0xa7e>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15928,33 +19108,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,52,52,0,0 // vbroadcastss 0x3434(%rip),%ymm12 # 5d00 <_sk_callback_hsw+0x326>
- .byte 196,98,125,24,45,47,52,0,0 // vbroadcastss 0x342f(%rip),%ymm13 # 5d04 <_sk_callback_hsw+0x32a>
+ .byte 196,98,125,24,37,64,65,0,0 // vbroadcastss 0x4140(%rip),%ymm12 # 6a0c <_sk_clut_4D_hsw+0xa82>
+ .byte 196,98,125,24,45,59,65,0,0 // vbroadcastss 0x413b(%rip),%ymm13 # 6a10 <_sk_clut_4D_hsw+0xa86>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,37,52,0,0 // vbroadcastss 0x3425(%rip),%ymm13 # 5d08 <_sk_callback_hsw+0x32e>
+ .byte 196,98,125,24,45,49,65,0,0 // vbroadcastss 0x4131(%rip),%ymm13 # 6a14 <_sk_clut_4D_hsw+0xa8a>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,27,52,0,0 // vbroadcastss 0x341b(%rip),%ymm13 # 5d0c <_sk_callback_hsw+0x332>
+ .byte 196,98,125,24,45,39,65,0,0 // vbroadcastss 0x4127(%rip),%ymm13 # 6a18 <_sk_clut_4D_hsw+0xa8e>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,17,52,0,0 // vbroadcastss 0x3411(%rip),%ymm11 # 5d10 <_sk_callback_hsw+0x336>
+ .byte 196,98,125,24,29,29,65,0,0 // vbroadcastss 0x411d(%rip),%ymm11 # 6a1c <_sk_clut_4D_hsw+0xa92>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,7,52,0,0 // vbroadcastss 0x3407(%rip),%ymm12 # 5d14 <_sk_callback_hsw+0x33a>
+ .byte 196,98,125,24,37,19,65,0,0 // vbroadcastss 0x4113(%rip),%ymm12 # 6a20 <_sk_clut_4D_hsw+0xa96>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,253,51,0,0 // vbroadcastss 0x33fd(%rip),%ymm12 # 5d18 <_sk_callback_hsw+0x33e>
+ .byte 196,98,125,24,37,9,65,0,0 // vbroadcastss 0x4109(%rip),%ymm12 # 6a24 <_sk_clut_4D_hsw+0xa9a>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,222,51,0,0 // vbroadcastss 0x33de(%rip),%ymm11 # 5d1c <_sk_callback_hsw+0x342>
+ .byte 196,98,125,24,29,234,64,0,0 // vbroadcastss 0x40ea(%rip),%ymm11 # 6a28 <_sk_clut_4D_hsw+0xa9e>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,212,51,0,0 // vbroadcastss 0x33d4(%rip),%ymm11 # 5d20 <_sk_callback_hsw+0x346>
+ .byte 196,98,125,24,29,224,64,0,0 // vbroadcastss 0x40e0(%rip),%ymm11 # 6a2c <_sk_clut_4D_hsw+0xaa2>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,202,51,0,0 // vbroadcastss 0x33ca(%rip),%ymm2 # 5d24 <_sk_callback_hsw+0x34a>
+ .byte 196,226,125,24,21,214,64,0,0 // vbroadcastss 0x40d6(%rip),%ymm2 # 6a30 <_sk_clut_4D_hsw+0xaa6>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,192,51,0,0 // vbroadcastss 0x33c0(%rip),%ymm10 # 5d28 <_sk_callback_hsw+0x34e>
+ .byte 196,98,125,24,21,204,64,0,0 // vbroadcastss 0x40cc(%rip),%ymm10 # 6a34 <_sk_clut_4D_hsw+0xaaa>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,179,51,0,0 // vbroadcastss 0x33b3(%rip),%ymm10 # 5d2c <_sk_callback_hsw+0x352>
+ .byte 196,98,125,24,21,191,64,0,0 // vbroadcastss 0x40bf(%rip),%ymm10 # 6a38 <_sk_clut_4D_hsw+0xaae>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15962,7 +19142,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,138,51,0,0 // vbroadcastss 0x338a(%rip),%ymm8 # 5d30 <_sk_callback_hsw+0x356>
+ .byte 196,98,125,24,5,150,64,0,0 // vbroadcastss 0x4096(%rip),%ymm8 # 6a3c <_sk_clut_4D_hsw+0xab2>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15982,33 +19162,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,66,51,0,0 // vbroadcastss 0x3342(%rip),%ymm12 # 5d34 <_sk_callback_hsw+0x35a>
- .byte 196,98,125,24,45,61,51,0,0 // vbroadcastss 0x333d(%rip),%ymm13 # 5d38 <_sk_callback_hsw+0x35e>
+ .byte 196,98,125,24,37,78,64,0,0 // vbroadcastss 0x404e(%rip),%ymm12 # 6a40 <_sk_clut_4D_hsw+0xab6>
+ .byte 196,98,125,24,45,73,64,0,0 // vbroadcastss 0x4049(%rip),%ymm13 # 6a44 <_sk_clut_4D_hsw+0xaba>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,51,51,0,0 // vbroadcastss 0x3333(%rip),%ymm13 # 5d3c <_sk_callback_hsw+0x362>
+ .byte 196,98,125,24,45,63,64,0,0 // vbroadcastss 0x403f(%rip),%ymm13 # 6a48 <_sk_clut_4D_hsw+0xabe>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,41,51,0,0 // vbroadcastss 0x3329(%rip),%ymm13 # 5d40 <_sk_callback_hsw+0x366>
+ .byte 196,98,125,24,45,53,64,0,0 // vbroadcastss 0x4035(%rip),%ymm13 # 6a4c <_sk_clut_4D_hsw+0xac2>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,31,51,0,0 // vbroadcastss 0x331f(%rip),%ymm11 # 5d44 <_sk_callback_hsw+0x36a>
+ .byte 196,98,125,24,29,43,64,0,0 // vbroadcastss 0x402b(%rip),%ymm11 # 6a50 <_sk_clut_4D_hsw+0xac6>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,21,51,0,0 // vbroadcastss 0x3315(%rip),%ymm12 # 5d48 <_sk_callback_hsw+0x36e>
+ .byte 196,98,125,24,37,33,64,0,0 // vbroadcastss 0x4021(%rip),%ymm12 # 6a54 <_sk_clut_4D_hsw+0xaca>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,11,51,0,0 // vbroadcastss 0x330b(%rip),%ymm12 # 5d4c <_sk_callback_hsw+0x372>
+ .byte 196,98,125,24,37,23,64,0,0 // vbroadcastss 0x4017(%rip),%ymm12 # 6a58 <_sk_clut_4D_hsw+0xace>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,236,50,0,0 // vbroadcastss 0x32ec(%rip),%ymm11 # 5d50 <_sk_callback_hsw+0x376>
+ .byte 196,98,125,24,29,248,63,0,0 // vbroadcastss 0x3ff8(%rip),%ymm11 # 6a5c <_sk_clut_4D_hsw+0xad2>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,226,50,0,0 // vbroadcastss 0x32e2(%rip),%ymm11 # 5d54 <_sk_callback_hsw+0x37a>
+ .byte 196,98,125,24,29,238,63,0,0 // vbroadcastss 0x3fee(%rip),%ymm11 # 6a60 <_sk_clut_4D_hsw+0xad6>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,216,50,0,0 // vbroadcastss 0x32d8(%rip),%ymm3 # 5d58 <_sk_callback_hsw+0x37e>
+ .byte 196,226,125,24,29,228,63,0,0 // vbroadcastss 0x3fe4(%rip),%ymm3 # 6a64 <_sk_clut_4D_hsw+0xada>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,206,50,0,0 // vbroadcastss 0x32ce(%rip),%ymm10 # 5d5c <_sk_callback_hsw+0x382>
+ .byte 196,98,125,24,21,218,63,0,0 // vbroadcastss 0x3fda(%rip),%ymm10 # 6a68 <_sk_clut_4D_hsw+0xade>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,193,50,0,0 // vbroadcastss 0x32c1(%rip),%ymm10 # 5d60 <_sk_callback_hsw+0x386>
+ .byte 196,98,125,24,21,205,63,0,0 // vbroadcastss 0x3fcd(%rip),%ymm10 # 6a6c <_sk_clut_4D_hsw+0xae2>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -16016,7 +19196,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,152,50,0,0 // vbroadcastss 0x3298(%rip),%ymm8 # 5d64 <_sk_callback_hsw+0x38a>
+ .byte 196,98,125,24,5,164,63,0,0 // vbroadcastss 0x3fa4(%rip),%ymm8 # 6a70 <_sk_clut_4D_hsw+0xae6>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16035,35 +19215,35 @@ _sk_gamma_hsw:
.byte 197,252,40,241 // vmovaps %ymm1,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
- .byte 196,98,125,24,29,91,50,0,0 // vbroadcastss 0x325b(%rip),%ymm11 # 5d68 <_sk_callback_hsw+0x38e>
- .byte 196,226,125,24,45,86,50,0,0 // vbroadcastss 0x3256(%rip),%ymm5 # 5d6c <_sk_callback_hsw+0x392>
+ .byte 196,98,125,24,29,103,63,0,0 // vbroadcastss 0x3f67(%rip),%ymm11 # 6a74 <_sk_clut_4D_hsw+0xaea>
+ .byte 196,226,125,24,45,98,63,0,0 // vbroadcastss 0x3f62(%rip),%ymm5 # 6a78 <_sk_clut_4D_hsw+0xaee>
.byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
- .byte 196,226,125,24,37,77,50,0,0 // vbroadcastss 0x324d(%rip),%ymm4 # 5d70 <_sk_callback_hsw+0x396>
+ .byte 196,226,125,24,37,89,63,0,0 // vbroadcastss 0x3f59(%rip),%ymm4 # 6a7c <_sk_clut_4D_hsw+0xaf2>
.byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
- .byte 196,98,125,24,45,68,50,0,0 // vbroadcastss 0x3244(%rip),%ymm13 # 5d74 <_sk_callback_hsw+0x39a>
+ .byte 196,98,125,24,45,80,63,0,0 // vbroadcastss 0x3f50(%rip),%ymm13 # 6a80 <_sk_clut_4D_hsw+0xaf6>
.byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
- .byte 196,98,125,24,13,58,50,0,0 // vbroadcastss 0x323a(%rip),%ymm9 # 5d78 <_sk_callback_hsw+0x39e>
+ .byte 196,98,125,24,13,70,63,0,0 // vbroadcastss 0x3f46(%rip),%ymm9 # 6a84 <_sk_clut_4D_hsw+0xafa>
.byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
.byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
.byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
.byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
.byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
- .byte 196,98,125,24,29,30,50,0,0 // vbroadcastss 0x321e(%rip),%ymm11 # 5d7c <_sk_callback_hsw+0x3a2>
+ .byte 196,98,125,24,29,42,63,0,0 // vbroadcastss 0x3f2a(%rip),%ymm11 # 6a88 <_sk_clut_4D_hsw+0xafe>
.byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
- .byte 196,98,125,24,45,20,50,0,0 // vbroadcastss 0x3214(%rip),%ymm13 # 5d80 <_sk_callback_hsw+0x3a6>
+ .byte 196,98,125,24,45,32,63,0,0 // vbroadcastss 0x3f20(%rip),%ymm13 # 6a8c <_sk_clut_4D_hsw+0xb02>
.byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
.byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
.byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
.byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
.byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
- .byte 196,226,125,24,21,240,49,0,0 // vbroadcastss 0x31f0(%rip),%ymm2 # 5d84 <_sk_callback_hsw+0x3aa>
+ .byte 196,226,125,24,21,252,62,0,0 // vbroadcastss 0x3efc(%rip),%ymm2 # 6a90 <_sk_clut_4D_hsw+0xb06>
.byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
- .byte 196,226,125,24,29,231,49,0,0 // vbroadcastss 0x31e7(%rip),%ymm3 # 5d88 <_sk_callback_hsw+0x3ae>
+ .byte 196,226,125,24,29,243,62,0,0 // vbroadcastss 0x3ef3(%rip),%ymm3 # 6a94 <_sk_clut_4D_hsw+0xb0a>
.byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
- .byte 196,226,125,24,13,221,49,0,0 // vbroadcastss 0x31dd(%rip),%ymm1 # 5d8c <_sk_callback_hsw+0x3b2>
+ .byte 196,226,125,24,13,233,62,0,0 // vbroadcastss 0x3ee9(%rip),%ymm1 # 6a98 <_sk_clut_4D_hsw+0xb0e>
.byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,5,211,49,0,0 // vbroadcastss 0x31d3(%rip),%ymm0 # 5d90 <_sk_callback_hsw+0x3b6>
+ .byte 196,226,125,24,5,223,62,0,0 // vbroadcastss 0x3edf(%rip),%ymm0 # 6a9c <_sk_clut_4D_hsw+0xb12>
.byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
@@ -16094,7 +19274,7 @@ _sk_gamma_hsw:
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
.byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
.byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
- .byte 196,226,125,24,13,68,49,0,0 // vbroadcastss 0x3144(%rip),%ymm1 # 5d94 <_sk_callback_hsw+0x3ba>
+ .byte 196,226,125,24,13,80,62,0,0 // vbroadcastss 0x3e50(%rip),%ymm1 # 6aa0 <_sk_clut_4D_hsw+0xb16>
.byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
.byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
.byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
@@ -16114,26 +19294,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,2,49,0,0 // vbroadcastss 0x3102(%rip),%ymm8 # 5d98 <_sk_callback_hsw+0x3be>
- .byte 196,98,125,24,13,253,48,0,0 // vbroadcastss 0x30fd(%rip),%ymm9 # 5d9c <_sk_callback_hsw+0x3c2>
- .byte 196,98,125,24,21,248,48,0,0 // vbroadcastss 0x30f8(%rip),%ymm10 # 5da0 <_sk_callback_hsw+0x3c6>
+ .byte 196,98,125,24,5,14,62,0,0 // vbroadcastss 0x3e0e(%rip),%ymm8 # 6aa4 <_sk_clut_4D_hsw+0xb1a>
+ .byte 196,98,125,24,13,9,62,0,0 // vbroadcastss 0x3e09(%rip),%ymm9 # 6aa8 <_sk_clut_4D_hsw+0xb1e>
+ .byte 196,98,125,24,21,4,62,0,0 // vbroadcastss 0x3e04(%rip),%ymm10 # 6aac <_sk_clut_4D_hsw+0xb22>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,233,48,0,0 // vbroadcastss 0x30e9(%rip),%ymm9 # 5da4 <_sk_callback_hsw+0x3ca>
+ .byte 196,98,125,24,13,245,61,0,0 // vbroadcastss 0x3df5(%rip),%ymm9 # 6ab0 <_sk_clut_4D_hsw+0xb26>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,223,48,0,0 // vbroadcastss 0x30df(%rip),%ymm0 # 5da8 <_sk_callback_hsw+0x3ce>
+ .byte 196,226,125,24,5,235,61,0,0 // vbroadcastss 0x3deb(%rip),%ymm0 # 6ab4 <_sk_clut_4D_hsw+0xb2a>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,214,48,0,0 // vbroadcastss 0x30d6(%rip),%ymm8 # 5dac <_sk_callback_hsw+0x3d2>
+ .byte 196,98,125,24,5,226,61,0,0 // vbroadcastss 0x3de2(%rip),%ymm8 # 6ab8 <_sk_clut_4D_hsw+0xb2e>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,204,48,0,0 // vbroadcastss 0x30cc(%rip),%ymm9 # 5db0 <_sk_callback_hsw+0x3d6>
+ .byte 196,98,125,24,13,216,61,0,0 // vbroadcastss 0x3dd8(%rip),%ymm9 # 6abc <_sk_clut_4D_hsw+0xb32>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,185,48,0,0 // vbroadcastss 0x30b9(%rip),%ymm2 # 5db4 <_sk_callback_hsw+0x3da>
+ .byte 196,226,125,24,21,197,61,0,0 // vbroadcastss 0x3dc5(%rip),%ymm2 # 6ac0 <_sk_clut_4D_hsw+0xb36>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,175,48,0,0 // vbroadcastss 0x30af(%rip),%ymm11 # 5db8 <_sk_callback_hsw+0x3de>
+ .byte 196,98,125,24,29,187,61,0,0 // vbroadcastss 0x3dbb(%rip),%ymm11 # 6ac4 <_sk_clut_4D_hsw+0xb3a>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,165,48,0,0 // vbroadcastss 0x30a5(%rip),%ymm12 # 5dbc <_sk_callback_hsw+0x3e2>
+ .byte 196,98,125,24,37,177,61,0,0 // vbroadcastss 0x3db1(%rip),%ymm12 # 6ac8 <_sk_clut_4D_hsw+0xb3e>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -16148,9 +19328,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,90,48,0,0 // vbroadcastss 0x305a(%rip),%ymm0 # 5dc0 <_sk_callback_hsw+0x3e6>
+ .byte 196,226,125,24,5,102,61,0,0 // vbroadcastss 0x3d66(%rip),%ymm0 # 6acc <_sk_clut_4D_hsw+0xb42>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,81,48,0,0 // vbroadcastss 0x3051(%rip),%ymm8 # 5dc4 <_sk_callback_hsw+0x3ea>
+ .byte 196,98,125,24,5,93,61,0,0 // vbroadcastss 0x3d5d(%rip),%ymm8 # 6ad0 <_sk_clut_4D_hsw+0xb46>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16169,10 +19349,10 @@ _sk_load_a8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,53 // jne 2dca <_sk_load_a8_hsw+0x4e>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,157,53,0,0 // vpand 0x359d(%rip),%xmm0,%xmm0 # 6340 <_sk_callback_hsw+0x966>
+ .byte 197,249,219,5,221,66,0,0 // vpand 0x42dd(%rip),%xmm0,%xmm0 # 7080 <_sk_clut_4D_hsw+0x10f6>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,19,48,0,0 // vbroadcastss 0x3013(%rip),%ymm1 # 5dc8 <_sk_callback_hsw+0x3ee>
+ .byte 196,226,125,24,13,31,61,0,0 // vbroadcastss 0x3d1f(%rip),%ymm1 # 6ad4 <_sk_clut_4D_hsw+0xb4a>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -16247,10 +19427,10 @@ _sk_load_a8_dst_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,53 // jne 2eca <_sk_load_a8_dst_hsw+0x4e>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,173,52,0,0 // vpand 0x34ad(%rip),%xmm4,%xmm4 # 6350 <_sk_callback_hsw+0x976>
+ .byte 197,217,219,37,237,65,0,0 // vpand 0x41ed(%rip),%xmm4,%xmm4 # 7090 <_sk_clut_4D_hsw+0x1106>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,23,47,0,0 // vbroadcastss 0x2f17(%rip),%ymm5 # 5dcc <_sk_callback_hsw+0x3f2>
+ .byte 196,226,125,24,45,35,60,0,0 // vbroadcastss 0x3c23(%rip),%ymm5 # 6ad8 <_sk_clut_4D_hsw+0xb4e>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -16351,7 +19531,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,158,45,0,0 // vbroadcastss 0x2d9e(%rip),%ymm1 # 5dd0 <_sk_callback_hsw+0x3f6>
+ .byte 196,226,125,24,13,170,58,0,0 // vbroadcastss 0x3aaa(%rip),%ymm1 # 6adc <_sk_clut_4D_hsw+0xb52>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -16370,7 +19550,7 @@ _sk_store_a8_hsw:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,113,45,0,0 // vbroadcastss 0x2d71(%rip),%ymm8 # 5dd4 <_sk_callback_hsw+0x3fa>
+ .byte 196,98,125,24,5,125,58,0,0 // vbroadcastss 0x3a7d(%rip),%ymm8 # 6ae0 <_sk_clut_4D_hsw+0xb56>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -16396,13 +19576,13 @@ _sk_store_a8_hsw:
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
.byte 235,201 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,144,50,0,0 // vpshufb 0x3290(%rip),%xmm8,%xmm8 # 6360 <_sk_callback_hsw+0x986>
+ .byte 196,98,57,0,5,208,63,0,0 // vpshufb 0x3fd0(%rip),%xmm8,%xmm8 # 70a0 <_sk_clut_4D_hsw+0x1116>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
.byte 235,175 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,118,50,0,0 // vpshufb 0x3276(%rip),%xmm8,%xmm8 # 6370 <_sk_callback_hsw+0x996>
+ .byte 196,98,57,0,5,182,63,0,0 // vpshufb 0x3fb6(%rip),%xmm8,%xmm8 # 70b0 <_sk_clut_4D_hsw+0x1126>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
.byte 235,134 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 102,144 // xchg %ax,%ax
@@ -16440,13 +19620,13 @@ _sk_load_g8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,58 // jne 3173 <_sk_load_g8_hsw+0x53>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,57,50,0,0 // vpand 0x3239(%rip),%xmm0,%xmm0 # 6380 <_sk_callback_hsw+0x9a6>
+ .byte 197,249,219,5,121,63,0,0 // vpand 0x3f79(%rip),%xmm0,%xmm0 # 70c0 <_sk_clut_4D_hsw+0x1136>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,127,44,0,0 // vbroadcastss 0x2c7f(%rip),%ymm1 # 5dd8 <_sk_callback_hsw+0x3fe>
+ .byte 196,226,125,24,13,139,57,0,0 // vbroadcastss 0x398b(%rip),%ymm1 # 6ae4 <_sk_clut_4D_hsw+0xb5a>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,116,44,0,0 // vbroadcastss 0x2c74(%rip),%ymm3 # 5ddc <_sk_callback_hsw+0x402>
+ .byte 196,226,125,24,29,128,57,0,0 // vbroadcastss 0x3980(%rip),%ymm3 # 6ae8 <_sk_clut_4D_hsw+0xb5e>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -16519,13 +19699,13 @@ _sk_load_g8_dst_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,58 // jne 327b <_sk_load_g8_dst_hsw+0x53>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,65,49,0,0 // vpand 0x3141(%rip),%xmm4,%xmm4 # 6390 <_sk_callback_hsw+0x9b6>
+ .byte 197,217,219,37,129,62,0,0 // vpand 0x3e81(%rip),%xmm4,%xmm4 # 70d0 <_sk_clut_4D_hsw+0x1146>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,127,43,0,0 // vbroadcastss 0x2b7f(%rip),%ymm5 # 5de0 <_sk_callback_hsw+0x406>
+ .byte 196,226,125,24,45,139,56,0,0 // vbroadcastss 0x388b(%rip),%ymm5 # 6aec <_sk_clut_4D_hsw+0xb62>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,116,43,0,0 // vbroadcastss 0x2b74(%rip),%ymm7 # 5de4 <_sk_callback_hsw+0x40a>
+ .byte 196,226,125,24,61,128,56,0,0 // vbroadcastss 0x3880(%rip),%ymm7 # 6af0 <_sk_clut_4D_hsw+0xb66>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -16624,10 +19804,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,2,42,0,0 // vbroadcastss 0x2a02(%rip),%ymm1 # 5de8 <_sk_callback_hsw+0x40e>
+ .byte 196,226,125,24,13,14,55,0,0 // vbroadcastss 0x370e(%rip),%ymm1 # 6af4 <_sk_clut_4D_hsw+0xb6a>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,247,41,0,0 // vbroadcastss 0x29f7(%rip),%ymm3 # 5dec <_sk_callback_hsw+0x412>
+ .byte 196,226,125,24,29,3,55,0,0 // vbroadcastss 0x3703(%rip),%ymm3 # 6af8 <_sk_clut_4D_hsw+0xb6e>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -16648,23 +19828,23 @@ _sk_load_565_hsw:
.byte 117,115 // jne 348e <_sk_load_565_hsw+0x8f>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,193,41,0,0 // vpbroadcastd 0x29c1(%rip),%ymm0 # 5df0 <_sk_callback_hsw+0x416>
+ .byte 196,226,125,88,5,205,54,0,0 // vpbroadcastd 0x36cd(%rip),%ymm0 # 6afc <_sk_clut_4D_hsw+0xb72>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,180,41,0,0 // vbroadcastss 0x29b4(%rip),%ymm1 # 5df4 <_sk_callback_hsw+0x41a>
+ .byte 196,226,125,24,13,192,54,0,0 // vbroadcastss 0x36c0(%rip),%ymm1 # 6b00 <_sk_clut_4D_hsw+0xb76>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,171,41,0,0 // vpbroadcastd 0x29ab(%rip),%ymm1 # 5df8 <_sk_callback_hsw+0x41e>
+ .byte 196,226,125,88,13,183,54,0,0 // vpbroadcastd 0x36b7(%rip),%ymm1 # 6b04 <_sk_clut_4D_hsw+0xb7a>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,158,41,0,0 // vbroadcastss 0x299e(%rip),%ymm3 # 5dfc <_sk_callback_hsw+0x422>
+ .byte 196,226,125,24,29,170,54,0,0 // vbroadcastss 0x36aa(%rip),%ymm3 # 6b08 <_sk_clut_4D_hsw+0xb7e>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,149,41,0,0 // vpbroadcastd 0x2995(%rip),%ymm3 # 5e00 <_sk_callback_hsw+0x426>
+ .byte 196,226,125,88,29,161,54,0,0 // vpbroadcastd 0x36a1(%rip),%ymm3 # 6b0c <_sk_clut_4D_hsw+0xb82>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,136,41,0,0 // vbroadcastss 0x2988(%rip),%ymm3 # 5e04 <_sk_callback_hsw+0x42a>
+ .byte 196,226,125,24,29,148,54,0,0 // vbroadcastss 0x3694(%rip),%ymm3 # 6b10 <_sk_clut_4D_hsw+0xb86>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,125,41,0,0 // vbroadcastss 0x297d(%rip),%ymm3 # 5e08 <_sk_callback_hsw+0x42e>
+ .byte 196,226,125,24,29,137,54,0,0 // vbroadcastss 0x3689(%rip),%ymm3 # 6b14 <_sk_clut_4D_hsw+0xb8a>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -16729,23 +19909,23 @@ _sk_load_565_dst_hsw:
.byte 117,115 // jne 35bf <_sk_load_565_dst_hsw+0x8f>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,172,40,0,0 // vpbroadcastd 0x28ac(%rip),%ymm4 # 5e0c <_sk_callback_hsw+0x432>
+ .byte 196,226,125,88,37,184,53,0,0 // vpbroadcastd 0x35b8(%rip),%ymm4 # 6b18 <_sk_clut_4D_hsw+0xb8e>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,159,40,0,0 // vbroadcastss 0x289f(%rip),%ymm5 # 5e10 <_sk_callback_hsw+0x436>
+ .byte 196,226,125,24,45,171,53,0,0 // vbroadcastss 0x35ab(%rip),%ymm5 # 6b1c <_sk_clut_4D_hsw+0xb92>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,150,40,0,0 // vpbroadcastd 0x2896(%rip),%ymm5 # 5e14 <_sk_callback_hsw+0x43a>
+ .byte 196,226,125,88,45,162,53,0,0 // vpbroadcastd 0x35a2(%rip),%ymm5 # 6b20 <_sk_clut_4D_hsw+0xb96>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,137,40,0,0 // vbroadcastss 0x2889(%rip),%ymm7 # 5e18 <_sk_callback_hsw+0x43e>
+ .byte 196,226,125,24,61,149,53,0,0 // vbroadcastss 0x3595(%rip),%ymm7 # 6b24 <_sk_clut_4D_hsw+0xb9a>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,128,40,0,0 // vpbroadcastd 0x2880(%rip),%ymm7 # 5e1c <_sk_callback_hsw+0x442>
+ .byte 196,226,125,88,61,140,53,0,0 // vpbroadcastd 0x358c(%rip),%ymm7 # 6b28 <_sk_clut_4D_hsw+0xb9e>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,115,40,0,0 // vbroadcastss 0x2873(%rip),%ymm7 # 5e20 <_sk_callback_hsw+0x446>
+ .byte 196,226,125,24,61,127,53,0,0 // vbroadcastss 0x357f(%rip),%ymm7 # 6b2c <_sk_clut_4D_hsw+0xba2>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,104,40,0,0 // vbroadcastss 0x2868(%rip),%ymm7 # 5e24 <_sk_callback_hsw+0x44a>
+ .byte 196,226,125,24,61,116,53,0,0 // vbroadcastss 0x3574(%rip),%ymm7 # 6b30 <_sk_clut_4D_hsw+0xba6>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -16836,23 +20016,23 @@ _sk_gather_565_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,23,39,0,0 // vpbroadcastd 0x2717(%rip),%ymm0 # 5e28 <_sk_callback_hsw+0x44e>
+ .byte 196,226,125,88,5,35,52,0,0 // vpbroadcastd 0x3423(%rip),%ymm0 # 6b34 <_sk_clut_4D_hsw+0xbaa>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,10,39,0,0 // vbroadcastss 0x270a(%rip),%ymm1 # 5e2c <_sk_callback_hsw+0x452>
+ .byte 196,226,125,24,13,22,52,0,0 // vbroadcastss 0x3416(%rip),%ymm1 # 6b38 <_sk_clut_4D_hsw+0xbae>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,1,39,0,0 // vpbroadcastd 0x2701(%rip),%ymm1 # 5e30 <_sk_callback_hsw+0x456>
+ .byte 196,226,125,88,13,13,52,0,0 // vpbroadcastd 0x340d(%rip),%ymm1 # 6b3c <_sk_clut_4D_hsw+0xbb2>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,244,38,0,0 // vbroadcastss 0x26f4(%rip),%ymm3 # 5e34 <_sk_callback_hsw+0x45a>
+ .byte 196,226,125,24,29,0,52,0,0 // vbroadcastss 0x3400(%rip),%ymm3 # 6b40 <_sk_clut_4D_hsw+0xbb6>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,235,38,0,0 // vpbroadcastd 0x26eb(%rip),%ymm3 # 5e38 <_sk_callback_hsw+0x45e>
+ .byte 196,226,125,88,29,247,51,0,0 // vpbroadcastd 0x33f7(%rip),%ymm3 # 6b44 <_sk_clut_4D_hsw+0xbba>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,222,38,0,0 // vbroadcastss 0x26de(%rip),%ymm3 # 5e3c <_sk_callback_hsw+0x462>
+ .byte 196,226,125,24,29,234,51,0,0 // vbroadcastss 0x33ea(%rip),%ymm3 # 6b48 <_sk_clut_4D_hsw+0xbbe>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,211,38,0,0 // vbroadcastss 0x26d3(%rip),%ymm3 # 5e40 <_sk_callback_hsw+0x466>
+ .byte 196,226,125,24,29,223,51,0,0 // vbroadcastss 0x33df(%rip),%ymm3 # 6b4c <_sk_clut_4D_hsw+0xbc2>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_hsw
@@ -16867,11 +20047,11 @@ _sk_store_565_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,181,38,0,0 // vbroadcastss 0x26b5(%rip),%ymm8 # 5e44 <_sk_callback_hsw+0x46a>
+ .byte 196,98,125,24,5,193,51,0,0 // vbroadcastss 0x33c1(%rip),%ymm8 # 6b50 <_sk_clut_4D_hsw+0xbc6>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,160,38,0,0 // vbroadcastss 0x26a0(%rip),%ymm10 # 5e48 <_sk_callback_hsw+0x46e>
+ .byte 196,98,125,24,21,172,51,0,0 // vbroadcastss 0x33ac(%rip),%ymm10 # 6b54 <_sk_clut_4D_hsw+0xbca>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -16924,7 +20104,7 @@ _sk_store_565_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe100385c <_sk_callback_hsw+0xffffffffe0ffde82>
+ .byte 232,255,255,255,224 // callq ffffffffe100385c <_sk_clut_4D_hsw+0xffffffffe0ffd8d2>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -16945,25 +20125,25 @@ _sk_load_4444_hsw:
.byte 15,133,139,0,0,0 // jne 390b <_sk_load_4444_hsw+0xab>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,184,37,0,0 // vpbroadcastd 0x25b8(%rip),%ymm0 # 5e4c <_sk_callback_hsw+0x472>
+ .byte 196,226,125,88,5,196,50,0,0 // vpbroadcastd 0x32c4(%rip),%ymm0 # 6b58 <_sk_clut_4D_hsw+0xbce>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,171,37,0,0 // vbroadcastss 0x25ab(%rip),%ymm1 # 5e50 <_sk_callback_hsw+0x476>
+ .byte 196,226,125,24,13,183,50,0,0 // vbroadcastss 0x32b7(%rip),%ymm1 # 6b5c <_sk_clut_4D_hsw+0xbd2>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,162,37,0,0 // vpbroadcastd 0x25a2(%rip),%ymm1 # 5e54 <_sk_callback_hsw+0x47a>
+ .byte 196,226,125,88,13,174,50,0,0 // vpbroadcastd 0x32ae(%rip),%ymm1 # 6b60 <_sk_clut_4D_hsw+0xbd6>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,149,37,0,0 // vbroadcastss 0x2595(%rip),%ymm2 # 5e58 <_sk_callback_hsw+0x47e>
+ .byte 196,226,125,24,21,161,50,0,0 // vbroadcastss 0x32a1(%rip),%ymm2 # 6b64 <_sk_clut_4D_hsw+0xbda>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,140,37,0,0 // vpbroadcastd 0x258c(%rip),%ymm2 # 5e5c <_sk_callback_hsw+0x482>
+ .byte 196,226,125,88,21,152,50,0,0 // vpbroadcastd 0x3298(%rip),%ymm2 # 6b68 <_sk_clut_4D_hsw+0xbde>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,127,37,0,0 // vbroadcastss 0x257f(%rip),%ymm8 # 5e60 <_sk_callback_hsw+0x486>
+ .byte 196,98,125,24,5,139,50,0,0 // vbroadcastss 0x328b(%rip),%ymm8 # 6b6c <_sk_clut_4D_hsw+0xbe2>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,117,37,0,0 // vpbroadcastd 0x2575(%rip),%ymm8 # 5e64 <_sk_callback_hsw+0x48a>
+ .byte 196,98,125,88,5,129,50,0,0 // vpbroadcastd 0x3281(%rip),%ymm8 # 6b70 <_sk_clut_4D_hsw+0xbe6>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,103,37,0,0 // vbroadcastss 0x2567(%rip),%ymm8 # 5e68 <_sk_callback_hsw+0x48e>
+ .byte 196,98,125,24,5,115,50,0,0 // vbroadcastss 0x3273(%rip),%ymm8 # 6b74 <_sk_clut_4D_hsw+0xbea>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -17031,25 +20211,25 @@ _sk_load_4444_dst_hsw:
.byte 15,133,139,0,0,0 // jne 3a57 <_sk_load_4444_dst_hsw+0xab>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,140,36,0,0 // vpbroadcastd 0x248c(%rip),%ymm4 # 5e6c <_sk_callback_hsw+0x492>
+ .byte 196,226,125,88,37,152,49,0,0 // vpbroadcastd 0x3198(%rip),%ymm4 # 6b78 <_sk_clut_4D_hsw+0xbee>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,127,36,0,0 // vbroadcastss 0x247f(%rip),%ymm5 # 5e70 <_sk_callback_hsw+0x496>
+ .byte 196,226,125,24,45,139,49,0,0 // vbroadcastss 0x318b(%rip),%ymm5 # 6b7c <_sk_clut_4D_hsw+0xbf2>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,118,36,0,0 // vpbroadcastd 0x2476(%rip),%ymm5 # 5e74 <_sk_callback_hsw+0x49a>
+ .byte 196,226,125,88,45,130,49,0,0 // vpbroadcastd 0x3182(%rip),%ymm5 # 6b80 <_sk_clut_4D_hsw+0xbf6>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,105,36,0,0 // vbroadcastss 0x2469(%rip),%ymm6 # 5e78 <_sk_callback_hsw+0x49e>
+ .byte 196,226,125,24,53,117,49,0,0 // vbroadcastss 0x3175(%rip),%ymm6 # 6b84 <_sk_clut_4D_hsw+0xbfa>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,96,36,0,0 // vpbroadcastd 0x2460(%rip),%ymm6 # 5e7c <_sk_callback_hsw+0x4a2>
+ .byte 196,226,125,88,53,108,49,0,0 // vpbroadcastd 0x316c(%rip),%ymm6 # 6b88 <_sk_clut_4D_hsw+0xbfe>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,83,36,0,0 // vbroadcastss 0x2453(%rip),%ymm8 # 5e80 <_sk_callback_hsw+0x4a6>
+ .byte 196,98,125,24,5,95,49,0,0 // vbroadcastss 0x315f(%rip),%ymm8 # 6b8c <_sk_clut_4D_hsw+0xc02>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,73,36,0,0 // vpbroadcastd 0x2449(%rip),%ymm8 # 5e84 <_sk_callback_hsw+0x4aa>
+ .byte 196,98,125,88,5,85,49,0,0 // vpbroadcastd 0x3155(%rip),%ymm8 # 6b90 <_sk_clut_4D_hsw+0xc06>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,59,36,0,0 // vbroadcastss 0x243b(%rip),%ymm8 # 5e88 <_sk_callback_hsw+0x4ae>
+ .byte 196,98,125,24,5,71,49,0,0 // vbroadcastss 0x3147(%rip),%ymm8 # 6b94 <_sk_clut_4D_hsw+0xc0a>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -17142,25 +20322,25 @@ _sk_gather_4444_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,227,34,0,0 // vpbroadcastd 0x22e3(%rip),%ymm0 # 5e8c <_sk_callback_hsw+0x4b2>
+ .byte 196,226,125,88,5,239,47,0,0 // vpbroadcastd 0x2fef(%rip),%ymm0 # 6b98 <_sk_clut_4D_hsw+0xc0e>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,214,34,0,0 // vbroadcastss 0x22d6(%rip),%ymm1 # 5e90 <_sk_callback_hsw+0x4b6>
+ .byte 196,226,125,24,13,226,47,0,0 // vbroadcastss 0x2fe2(%rip),%ymm1 # 6b9c <_sk_clut_4D_hsw+0xc12>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,205,34,0,0 // vpbroadcastd 0x22cd(%rip),%ymm1 # 5e94 <_sk_callback_hsw+0x4ba>
+ .byte 196,226,125,88,13,217,47,0,0 // vpbroadcastd 0x2fd9(%rip),%ymm1 # 6ba0 <_sk_clut_4D_hsw+0xc16>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,192,34,0,0 // vbroadcastss 0x22c0(%rip),%ymm2 # 5e98 <_sk_callback_hsw+0x4be>
+ .byte 196,226,125,24,21,204,47,0,0 // vbroadcastss 0x2fcc(%rip),%ymm2 # 6ba4 <_sk_clut_4D_hsw+0xc1a>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,183,34,0,0 // vpbroadcastd 0x22b7(%rip),%ymm2 # 5e9c <_sk_callback_hsw+0x4c2>
+ .byte 196,226,125,88,21,195,47,0,0 // vpbroadcastd 0x2fc3(%rip),%ymm2 # 6ba8 <_sk_clut_4D_hsw+0xc1e>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,170,34,0,0 // vbroadcastss 0x22aa(%rip),%ymm8 # 5ea0 <_sk_callback_hsw+0x4c6>
+ .byte 196,98,125,24,5,182,47,0,0 // vbroadcastss 0x2fb6(%rip),%ymm8 # 6bac <_sk_clut_4D_hsw+0xc22>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,160,34,0,0 // vpbroadcastd 0x22a0(%rip),%ymm8 # 5ea4 <_sk_callback_hsw+0x4ca>
+ .byte 196,98,125,88,5,172,47,0,0 // vpbroadcastd 0x2fac(%rip),%ymm8 # 6bb0 <_sk_clut_4D_hsw+0xc26>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,146,34,0,0 // vbroadcastss 0x2292(%rip),%ymm8 # 5ea8 <_sk_callback_hsw+0x4ce>
+ .byte 196,98,125,24,5,158,47,0,0 // vbroadcastss 0x2f9e(%rip),%ymm8 # 6bb4 <_sk_clut_4D_hsw+0xc2a>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -17177,7 +20357,7 @@ _sk_store_4444_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,109,34,0,0 // vbroadcastss 0x226d(%rip),%ymm8 # 5eac <_sk_callback_hsw+0x4d2>
+ .byte 196,98,125,24,5,121,47,0,0 // vbroadcastss 0x2f79(%rip),%ymm8 # 6bb8 <_sk_clut_4D_hsw+0xc2e>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -17237,7 +20417,7 @@ _sk_store_4444_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe1003d18 <_sk_callback_hsw+0xffffffffe0ffe33e>
+ .byte 232,255,255,255,224 // callq ffffffffe1003d18 <_sk_clut_4D_hsw+0xffffffffe0ffdd8e>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -17258,14 +20438,14 @@ _sk_load_8888_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,87 // jne 3d96 <_sk_load_8888_hsw+0x7a>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,228,84,5,117,35,0,0 // vandps 0x2375(%rip),%ymm3,%ymm0 # 60c0 <_sk_callback_hsw+0x6e6>
+ .byte 197,228,84,5,181,48,0,0 // vandps 0x30b5(%rip),%ymm3,%ymm0 # 6e00 <_sk_clut_4D_hsw+0xe76>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,88,33,0,0 // vbroadcastss 0x2158(%rip),%ymm8 # 5eb0 <_sk_callback_hsw+0x4d6>
+ .byte 196,98,125,24,5,100,46,0,0 // vbroadcastss 0x2e64(%rip),%ymm8 # 6bbc <_sk_clut_4D_hsw+0xc32>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,122,35,0,0 // vpshufb 0x237a(%rip),%ymm3,%ymm1 # 60e0 <_sk_callback_hsw+0x706>
+ .byte 196,226,101,0,13,186,48,0,0 // vpshufb 0x30ba(%rip),%ymm3,%ymm1 # 6e20 <_sk_clut_4D_hsw+0xe96>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,136,35,0,0 // vpshufb 0x2388(%rip),%ymm3,%ymm2 # 6100 <_sk_callback_hsw+0x726>
+ .byte 196,226,101,0,21,200,48,0,0 // vpshufb 0x30c8(%rip),%ymm3,%ymm2 # 6e40 <_sk_clut_4D_hsw+0xeb6>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17300,14 +20480,14 @@ _sk_load_8888_dst_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,87 // jne 3e36 <_sk_load_8888_dst_hsw+0x7a>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,53,35,0,0 // vandps 0x2335(%rip),%ymm7,%ymm4 # 6120 <_sk_callback_hsw+0x746>
+ .byte 197,196,84,37,117,48,0,0 // vandps 0x3075(%rip),%ymm7,%ymm4 # 6e60 <_sk_clut_4D_hsw+0xed6>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,188,32,0,0 // vbroadcastss 0x20bc(%rip),%ymm8 # 5eb4 <_sk_callback_hsw+0x4da>
+ .byte 196,98,125,24,5,200,45,0,0 // vbroadcastss 0x2dc8(%rip),%ymm8 # 6bc0 <_sk_clut_4D_hsw+0xc36>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,58,35,0,0 // vpshufb 0x233a(%rip),%ymm7,%ymm5 # 6140 <_sk_callback_hsw+0x766>
+ .byte 196,226,69,0,45,122,48,0,0 // vpshufb 0x307a(%rip),%ymm7,%ymm5 # 6e80 <_sk_clut_4D_hsw+0xef6>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,72,35,0,0 // vpshufb 0x2348(%rip),%ymm7,%ymm6 # 6160 <_sk_callback_hsw+0x786>
+ .byte 196,226,69,0,53,136,48,0,0 // vpshufb 0x3088(%rip),%ymm7,%ymm6 # 6ea0 <_sk_clut_4D_hsw+0xf16>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -17339,14 +20519,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,246,34,0,0 // vpand 0x22f6(%rip),%ymm3,%ymm0 # 6180 <_sk_callback_hsw+0x7a6>
+ .byte 197,229,219,5,54,48,0,0 // vpand 0x3036(%rip),%ymm3,%ymm0 # 6ec0 <_sk_clut_4D_hsw+0xf36>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,33,32,0,0 // vbroadcastss 0x2021(%rip),%ymm8 # 5eb8 <_sk_callback_hsw+0x4de>
+ .byte 196,98,125,24,5,45,45,0,0 // vbroadcastss 0x2d2d(%rip),%ymm8 # 6bc4 <_sk_clut_4D_hsw+0xc3a>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,251,34,0,0 // vpshufb 0x22fb(%rip),%ymm3,%ymm1 # 61a0 <_sk_callback_hsw+0x7c6>
+ .byte 196,226,101,0,13,59,48,0,0 // vpshufb 0x303b(%rip),%ymm3,%ymm1 # 6ee0 <_sk_clut_4D_hsw+0xf56>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,9,35,0,0 // vpshufb 0x2309(%rip),%ymm3,%ymm2 # 61c0 <_sk_callback_hsw+0x7e6>
+ .byte 196,226,101,0,21,73,48,0,0 // vpshufb 0x3049(%rip),%ymm3,%ymm2 # 6f00 <_sk_clut_4D_hsw+0xf76>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17368,7 +20548,7 @@ _sk_store_8888_hsw:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,195,31,0,0 // vbroadcastss 0x1fc3(%rip),%ymm8 # 5ebc <_sk_callback_hsw+0x4e2>
+ .byte 196,98,125,24,5,207,44,0,0 // vbroadcastss 0x2ccf(%rip),%ymm8 # 6bc8 <_sk_clut_4D_hsw+0xc3e>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -17415,14 +20595,14 @@ _sk_load_bgra_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,87 // jne 3ff2 <_sk_load_bgra_hsw+0x7a>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,228,84,5,57,34,0,0 // vandps 0x2239(%rip),%ymm3,%ymm0 # 61e0 <_sk_callback_hsw+0x806>
+ .byte 197,228,84,5,121,47,0,0 // vandps 0x2f79(%rip),%ymm3,%ymm0 # 6f20 <_sk_clut_4D_hsw+0xf96>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,12,31,0,0 // vbroadcastss 0x1f0c(%rip),%ymm8 # 5ec0 <_sk_callback_hsw+0x4e6>
+ .byte 196,98,125,24,5,24,44,0,0 // vbroadcastss 0x2c18(%rip),%ymm8 # 6bcc <_sk_clut_4D_hsw+0xc42>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,62,34,0,0 // vpshufb 0x223e(%rip),%ymm3,%ymm0 # 6200 <_sk_callback_hsw+0x826>
+ .byte 196,226,101,0,5,126,47,0,0 // vpshufb 0x2f7e(%rip),%ymm3,%ymm0 # 6f40 <_sk_clut_4D_hsw+0xfb6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,76,34,0,0 // vpshufb 0x224c(%rip),%ymm3,%ymm0 # 6220 <_sk_callback_hsw+0x846>
+ .byte 196,226,101,0,5,140,47,0,0 // vpshufb 0x2f8c(%rip),%ymm3,%ymm0 # 6f60 <_sk_clut_4D_hsw+0xfd6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17457,14 +20637,14 @@ _sk_load_bgra_dst_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,87 // jne 4092 <_sk_load_bgra_dst_hsw+0x7a>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,249,33,0,0 // vandps 0x21f9(%rip),%ymm7,%ymm4 # 6240 <_sk_callback_hsw+0x866>
+ .byte 197,196,84,37,57,47,0,0 // vandps 0x2f39(%rip),%ymm7,%ymm4 # 6f80 <_sk_clut_4D_hsw+0xff6>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,112,30,0,0 // vbroadcastss 0x1e70(%rip),%ymm8 # 5ec4 <_sk_callback_hsw+0x4ea>
+ .byte 196,98,125,24,5,124,43,0,0 // vbroadcastss 0x2b7c(%rip),%ymm8 # 6bd0 <_sk_clut_4D_hsw+0xc46>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,254,33,0,0 // vpshufb 0x21fe(%rip),%ymm7,%ymm4 # 6260 <_sk_callback_hsw+0x886>
+ .byte 196,226,69,0,37,62,47,0,0 // vpshufb 0x2f3e(%rip),%ymm7,%ymm4 # 6fa0 <_sk_clut_4D_hsw+0x1016>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,12,34,0,0 // vpshufb 0x220c(%rip),%ymm7,%ymm4 # 6280 <_sk_callback_hsw+0x8a6>
+ .byte 196,226,69,0,37,76,47,0,0 // vpshufb 0x2f4c(%rip),%ymm7,%ymm4 # 6fc0 <_sk_clut_4D_hsw+0x1036>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -17496,14 +20676,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,186,33,0,0 // vpand 0x21ba(%rip),%ymm3,%ymm0 # 62a0 <_sk_callback_hsw+0x8c6>
+ .byte 197,229,219,5,250,46,0,0 // vpand 0x2efa(%rip),%ymm3,%ymm0 # 6fe0 <_sk_clut_4D_hsw+0x1056>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,213,29,0,0 // vbroadcastss 0x1dd5(%rip),%ymm8 # 5ec8 <_sk_callback_hsw+0x4ee>
+ .byte 196,98,125,24,5,225,42,0,0 // vbroadcastss 0x2ae1(%rip),%ymm8 # 6bd4 <_sk_clut_4D_hsw+0xc4a>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,191,33,0,0 // vpshufb 0x21bf(%rip),%ymm3,%ymm0 # 62c0 <_sk_callback_hsw+0x8e6>
+ .byte 196,226,101,0,5,255,46,0,0 // vpshufb 0x2eff(%rip),%ymm3,%ymm0 # 7000 <_sk_clut_4D_hsw+0x1076>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,205,33,0,0 // vpshufb 0x21cd(%rip),%ymm3,%ymm0 # 62e0 <_sk_callback_hsw+0x906>
+ .byte 196,226,101,0,5,13,47,0,0 // vpshufb 0x2f0d(%rip),%ymm3,%ymm0 # 7020 <_sk_clut_4D_hsw+0x1096>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17525,7 +20705,7 @@ _sk_store_bgra_hsw:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,119,29,0,0 // vbroadcastss 0x1d77(%rip),%ymm8 # 5ecc <_sk_callback_hsw+0x4f2>
+ .byte 196,98,125,24,5,131,42,0,0 // vbroadcastss 0x2a83(%rip),%ymm8 # 6bd8 <_sk_clut_4D_hsw+0xc4e>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -17799,7 +20979,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,39,25,0,0 // vbroadcastss 0x1927(%rip),%ymm10 # 5ed0 <_sk_callback_hsw+0x4f6>
+ .byte 196,98,125,24,21,51,38,0,0 // vbroadcastss 0x2633(%rip),%ymm10 # 6bdc <_sk_clut_4D_hsw+0xc52>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -17890,7 +21070,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,159,23,0,0 // vbroadcastss 0x179f(%rip),%ymm10 # 5ed4 <_sk_callback_hsw+0x4fa>
+ .byte 196,98,125,24,21,171,36,0,0 // vbroadcastss 0x24ab(%rip),%ymm10 # 6be0 <_sk_clut_4D_hsw+0xc56>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -17907,7 +21087,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,83,23,0,0 // vbroadcastss 0x1753(%rip),%ymm3 # 5ed8 <_sk_callback_hsw+0x4fe>
+ .byte 196,226,125,24,29,95,36,0,0 // vbroadcastss 0x245f(%rip),%ymm3 # 6be4 <_sk_clut_4D_hsw+0xc5a>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
@@ -17955,7 +21135,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,127,22,0,0 // vbroadcastss 0x167f(%rip),%ymm8 # 5edc <_sk_callback_hsw+0x502>
+ .byte 196,98,125,24,5,139,35,0,0 // vbroadcastss 0x238b(%rip),%ymm8 # 6be8 <_sk_clut_4D_hsw+0xc5e>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -18258,7 +21438,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,251,17,0,0 // vmulss 0x11fb(%rip),%xmm9,%xmm0 # 5ee0 <_sk_callback_hsw+0x506>
+ .byte 197,178,89,5,7,31,0,0 // vmulss 0x1f07(%rip),%xmm9,%xmm0 # 6bec <_sk_clut_4D_hsw+0xc62>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -18285,7 +21465,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,155,17,0,0 // vmulss 0x119b(%rip),%xmm9,%xmm1 # 5ee4 <_sk_callback_hsw+0x50a>
+ .byte 197,178,89,13,167,30,0,0 // vmulss 0x1ea7(%rip),%xmm9,%xmm1 # 6bf0 <_sk_clut_4D_hsw+0xc66>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -18307,7 +21487,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,80,17,0,0 // vbroadcastss 0x1150(%rip),%ymm8 # 5ee8 <_sk_callback_hsw+0x50e>
+ .byte 196,98,125,24,5,92,30,0,0 // vbroadcastss 0x1e5c(%rip),%ymm8 # 6bf4 <_sk_clut_4D_hsw+0xc6a>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18325,9 +21505,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,51,17,0,0 // vbroadcastss 0x1133(%rip),%ymm8 # 5eec <_sk_callback_hsw+0x512>
+ .byte 196,98,125,24,5,63,30,0,0 // vbroadcastss 0x1e3f(%rip),%ymm8 # 6bf8 <_sk_clut_4D_hsw+0xc6e>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,41,17,0,0 // vbroadcastss 0x1129(%rip),%ymm9 # 5ef0 <_sk_callback_hsw+0x516>
+ .byte 196,98,125,24,13,53,30,0,0 // vbroadcastss 0x1e35(%rip),%ymm9 # 6bfc <_sk_clut_4D_hsw+0xc72>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -18343,11 +21523,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,249,16,0,0 // vbroadcastss 0x10f9(%rip),%ymm3 # 5ef4 <_sk_callback_hsw+0x51a>
- .byte 196,98,125,24,5,244,16,0,0 // vbroadcastss 0x10f4(%rip),%ymm8 # 5ef8 <_sk_callback_hsw+0x51e>
+ .byte 196,226,125,24,29,5,30,0,0 // vbroadcastss 0x1e05(%rip),%ymm3 # 6c00 <_sk_clut_4D_hsw+0xc76>
+ .byte 196,98,125,24,5,0,30,0,0 // vbroadcastss 0x1e00(%rip),%ymm8 # 6c04 <_sk_clut_4D_hsw+0xc7a>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,229,16,0,0 // vbroadcastss 0x10e5(%rip),%ymm3 # 5efc <_sk_callback_hsw+0x522>
+ .byte 196,226,125,24,29,241,29,0,0 // vbroadcastss 0x1df1(%rip),%ymm3 # 6c08 <_sk_clut_4D_hsw+0xc7e>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -18613,14 +21793,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,237,12,0,0 // vbroadcastss 0xced(%rip),%ymm0 # 5f00 <_sk_callback_hsw+0x526>
- .byte 196,226,125,24,13,232,12,0,0 // vbroadcastss 0xce8(%rip),%ymm1 # 5f04 <_sk_callback_hsw+0x52a>
+ .byte 196,226,125,24,5,249,25,0,0 // vbroadcastss 0x19f9(%rip),%ymm0 # 6c0c <_sk_clut_4D_hsw+0xc82>
+ .byte 196,226,125,24,13,244,25,0,0 // vbroadcastss 0x19f4(%rip),%ymm1 # 6c10 <_sk_clut_4D_hsw+0xc86>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,222,12,0,0 // vbroadcastss 0xcde(%rip),%ymm0 # 5f08 <_sk_callback_hsw+0x52e>
+ .byte 196,226,125,24,5,234,25,0,0 // vbroadcastss 0x19ea(%rip),%ymm0 # 6c14 <_sk_clut_4D_hsw+0xc8a>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,212,12,0,0 // vbroadcastss 0xcd4(%rip),%ymm1 # 5f0c <_sk_callback_hsw+0x532>
+ .byte 196,226,125,24,13,224,25,0,0 // vbroadcastss 0x19e0(%rip),%ymm1 # 6c18 <_sk_clut_4D_hsw+0xc8e>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,202,12,0,0 // vbroadcastss 0xcca(%rip),%ymm0 # 5f10 <_sk_callback_hsw+0x536>
+ .byte 196,226,125,24,5,214,25,0,0 // vbroadcastss 0x19d6(%rip),%ymm0 # 6c1c <_sk_clut_4D_hsw+0xc92>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -18639,7 +21819,7 @@ _sk_gradient_hsw:
.byte 76,139,80,72 // mov 0x48(%rax),%r10
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,187,1,0,0,0 // mov $0x1,%r11d
- .byte 196,226,125,24,21,147,12,0,0 // vbroadcastss 0xc93(%rip),%ymm2 # 5f14 <_sk_callback_hsw+0x53a>
+ .byte 196,226,125,24,21,159,25,0,0 // vbroadcastss 0x199f(%rip),%ymm2 # 6c20 <_sk_clut_4D_hsw+0xc96>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -18734,24 +21914,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,18,11,0,0 // vbroadcastss 0xb12(%rip),%ymm13 # 5f18 <_sk_callback_hsw+0x53e>
- .byte 196,98,125,24,53,13,11,0,0 // vbroadcastss 0xb0d(%rip),%ymm14 # 5f1c <_sk_callback_hsw+0x542>
+ .byte 196,98,125,24,45,30,24,0,0 // vbroadcastss 0x181e(%rip),%ymm13 # 6c24 <_sk_clut_4D_hsw+0xc9a>
+ .byte 196,98,125,24,53,25,24,0,0 // vbroadcastss 0x1819(%rip),%ymm14 # 6c28 <_sk_clut_4D_hsw+0xc9e>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,3,11,0,0 // vbroadcastss 0xb03(%rip),%ymm13 # 5f20 <_sk_callback_hsw+0x546>
+ .byte 196,98,125,24,45,15,24,0,0 // vbroadcastss 0x180f(%rip),%ymm13 # 6c2c <_sk_clut_4D_hsw+0xca2>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,249,10,0,0 // vbroadcastss 0xaf9(%rip),%ymm14 # 5f24 <_sk_callback_hsw+0x54a>
+ .byte 196,98,125,24,53,5,24,0,0 // vbroadcastss 0x1805(%rip),%ymm14 # 6c30 <_sk_clut_4D_hsw+0xca6>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,228,10,0,0 // vbroadcastss 0xae4(%rip),%ymm10 # 5f28 <_sk_callback_hsw+0x54e>
+ .byte 196,98,125,24,21,240,23,0,0 // vbroadcastss 0x17f0(%rip),%ymm10 # 6c34 <_sk_clut_4D_hsw+0xcaa>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,206,10,0,0 // vbroadcastss 0xace(%rip),%ymm10 # 5f2c <_sk_callback_hsw+0x552>
+ .byte 196,98,125,24,21,218,23,0,0 // vbroadcastss 0x17da(%rip),%ymm10 # 6c38 <_sk_clut_4D_hsw+0xcae>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,184,10,0,0 // vbroadcastss 0xab8(%rip),%ymm10 # 5f30 <_sk_callback_hsw+0x556>
+ .byte 196,98,125,24,21,196,23,0,0 // vbroadcastss 0x17c4(%rip),%ymm10 # 6c3c <_sk_clut_4D_hsw+0xcb2>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -18779,23 +21959,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,108,10,0,0 // vbroadcastss 0xa6c(%rip),%ymm11 # 5f34 <_sk_callback_hsw+0x55a>
+ .byte 196,98,125,24,29,120,23,0,0 // vbroadcastss 0x1778(%rip),%ymm11 # 6c40 <_sk_clut_4D_hsw+0xcb6>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,75,10,0,0 // vbroadcastss 0xa4b(%rip),%ymm9 # 5f38 <_sk_callback_hsw+0x55e>
+ .byte 196,98,125,24,13,87,23,0,0 // vbroadcastss 0x1757(%rip),%ymm9 # 6c44 <_sk_clut_4D_hsw+0xcba>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,46,10,0,0 // vbroadcastss 0xa2e(%rip),%ymm9 # 5f3c <_sk_callback_hsw+0x562>
+ .byte 196,98,125,24,13,58,23,0,0 // vbroadcastss 0x173a(%rip),%ymm9 # 6c48 <_sk_clut_4D_hsw+0xcbe>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,31,10,0,0 // vbroadcastss 0xa1f(%rip),%ymm11 # 5f40 <_sk_callback_hsw+0x566>
+ .byte 196,98,125,24,29,43,23,0,0 // vbroadcastss 0x172b(%rip),%ymm11 # 6c4c <_sk_clut_4D_hsw+0xcc2>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -18814,23 +21994,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,228,9,0,0 // vbroadcastss 0x9e4(%rip),%ymm11 # 5f44 <_sk_callback_hsw+0x56a>
+ .byte 196,98,125,24,29,240,22,0,0 // vbroadcastss 0x16f0(%rip),%ymm11 # 6c50 <_sk_clut_4D_hsw+0xcc6>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,195,9,0,0 // vbroadcastss 0x9c3(%rip),%ymm9 # 5f48 <_sk_callback_hsw+0x56e>
+ .byte 196,98,125,24,13,207,22,0,0 // vbroadcastss 0x16cf(%rip),%ymm9 # 6c54 <_sk_clut_4D_hsw+0xcca>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,166,9,0,0 // vbroadcastss 0x9a6(%rip),%ymm9 # 5f4c <_sk_callback_hsw+0x572>
+ .byte 196,98,125,24,13,178,22,0,0 // vbroadcastss 0x16b2(%rip),%ymm9 # 6c58 <_sk_clut_4D_hsw+0xcce>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,151,9,0,0 // vbroadcastss 0x997(%rip),%ymm11 # 5f50 <_sk_callback_hsw+0x576>
+ .byte 196,98,125,24,29,163,22,0,0 // vbroadcastss 0x16a3(%rip),%ymm11 # 6c5c <_sk_clut_4D_hsw+0xcd2>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -18848,14 +22028,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,98,9,0,0 // vbroadcastss 0x962(%rip),%ymm10 # 5f54 <_sk_callback_hsw+0x57a>
+ .byte 196,98,125,24,21,110,22,0,0 // vbroadcastss 0x166e(%rip),%ymm10 # 6c60 <_sk_clut_4D_hsw+0xcd6>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,65,9,0,0 // vbroadcastss 0x941(%rip),%ymm8 # 5f58 <_sk_callback_hsw+0x57e>
+ .byte 196,98,125,24,5,77,22,0,0 // vbroadcastss 0x164d(%rip),%ymm8 # 6c64 <_sk_clut_4D_hsw+0xcda>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18895,7 +22075,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,225,8,0,0 // vbroadcastss 0x8e1(%rip),%ymm8 # 5f5c <_sk_callback_hsw+0x582>
+ .byte 196,98,125,24,5,237,21,0,0 // vbroadcastss 0x15ed(%rip),%ymm8 # 6c68 <_sk_clut_4D_hsw+0xcde>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -18929,9 +22109,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,117,8,0,0 // vbroadcastss 0x875(%rip),%ymm0 # 5f60 <_sk_callback_hsw+0x586>
+ .byte 196,226,125,24,5,129,21,0,0 // vbroadcastss 0x1581(%rip),%ymm0 # 6c6c <_sk_clut_4D_hsw+0xce2>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,108,8,0,0 // vbroadcastss 0x86c(%rip),%ymm8 # 5f64 <_sk_callback_hsw+0x58a>
+ .byte 196,98,125,24,5,120,21,0,0 // vbroadcastss 0x1578(%rip),%ymm8 # 6c70 <_sk_clut_4D_hsw+0xce6>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18942,7 +22122,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,84,8,0,0 // vbroadcastss 0x854(%rip),%ymm0 # 5f68 <_sk_callback_hsw+0x58e>
+ .byte 196,226,125,24,5,96,21,0,0 // vbroadcastss 0x1560(%rip),%ymm0 # 6c74 <_sk_clut_4D_hsw+0xcea>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18954,9 +22134,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,56,8,0,0 // vbroadcastss 0x838(%rip),%ymm1 # 5f6c <_sk_callback_hsw+0x592>
+ .byte 196,226,125,24,13,68,21,0,0 // vbroadcastss 0x1544(%rip),%ymm1 # 6c78 <_sk_clut_4D_hsw+0xcee>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,46,8,0,0 // vbroadcastss 0x82e(%rip),%ymm8 # 5f70 <_sk_callback_hsw+0x596>
+ .byte 196,98,125,24,5,58,21,0,0 // vbroadcastss 0x153a(%rip),%ymm8 # 6c7c <_sk_clut_4D_hsw+0xcf2>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18967,7 +22147,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,22,8,0,0 // vbroadcastss 0x816(%rip),%ymm1 # 5f74 <_sk_callback_hsw+0x59a>
+ .byte 196,226,125,24,13,34,21,0,0 // vbroadcastss 0x1522(%rip),%ymm1 # 6c80 <_sk_clut_4D_hsw+0xcf6>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18979,13 +22159,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,249,7,0,0 // vbroadcastss 0x7f9(%rip),%ymm0 # 5f78 <_sk_callback_hsw+0x59e>
+ .byte 196,226,125,24,5,5,21,0,0 // vbroadcastss 0x1505(%rip),%ymm0 # 6c84 <_sk_clut_4D_hsw+0xcfa>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,240,7,0,0 // vbroadcastss 0x7f0(%rip),%ymm8 # 5f7c <_sk_callback_hsw+0x5a2>
+ .byte 196,98,125,24,5,252,20,0,0 // vbroadcastss 0x14fc(%rip),%ymm8 # 6c88 <_sk_clut_4D_hsw+0xcfe>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,225,7,0,0 // vbroadcastss 0x7e1(%rip),%ymm10 # 5f80 <_sk_callback_hsw+0x5a6>
- .byte 196,98,125,24,29,220,7,0,0 // vbroadcastss 0x7dc(%rip),%ymm11 # 5f84 <_sk_callback_hsw+0x5aa>
+ .byte 196,98,125,24,21,237,20,0,0 // vbroadcastss 0x14ed(%rip),%ymm10 # 6c8c <_sk_clut_4D_hsw+0xd02>
+ .byte 196,98,125,24,29,232,20,0,0 // vbroadcastss 0x14e8(%rip),%ymm11 # 6c90 <_sk_clut_4D_hsw+0xd06>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18997,16 +22177,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,191,7,0,0 // vbroadcastss 0x7bf(%rip),%ymm0 # 5f88 <_sk_callback_hsw+0x5ae>
+ .byte 196,226,125,24,5,203,20,0,0 // vbroadcastss 0x14cb(%rip),%ymm0 # 6c94 <_sk_clut_4D_hsw+0xd0a>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,182,7,0,0 // vbroadcastss 0x7b6(%rip),%ymm8 # 5f8c <_sk_callback_hsw+0x5b2>
+ .byte 196,98,125,24,5,194,20,0,0 // vbroadcastss 0x14c2(%rip),%ymm8 # 6c98 <_sk_clut_4D_hsw+0xd0e>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,172,7,0,0 // vbroadcastss 0x7ac(%rip),%ymm9 # 5f90 <_sk_callback_hsw+0x5b6>
- .byte 196,98,125,24,21,167,7,0,0 // vbroadcastss 0x7a7(%rip),%ymm10 # 5f94 <_sk_callback_hsw+0x5ba>
+ .byte 196,98,125,24,13,184,20,0,0 // vbroadcastss 0x14b8(%rip),%ymm9 # 6c9c <_sk_clut_4D_hsw+0xd12>
+ .byte 196,98,125,24,21,179,20,0,0 // vbroadcastss 0x14b3(%rip),%ymm10 # 6ca0 <_sk_clut_4D_hsw+0xd16>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,157,7,0,0 // vbroadcastss 0x79d(%rip),%ymm9 # 5f98 <_sk_callback_hsw+0x5be>
+ .byte 196,98,125,24,13,169,20,0,0 // vbroadcastss 0x14a9(%rip),%ymm9 # 6ca4 <_sk_clut_4D_hsw+0xd1a>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,147,7,0,0 // vbroadcastss 0x793(%rip),%ymm10 # 5f9c <_sk_callback_hsw+0x5c2>
+ .byte 196,98,125,24,21,159,20,0,0 // vbroadcastss 0x149f(%rip),%ymm10 # 6ca8 <_sk_clut_4D_hsw+0xd1e>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -19017,14 +22197,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm8 # 5fa0 <_sk_callback_hsw+0x5c6>
+ .byte 196,98,125,24,5,135,20,0,0 // vbroadcastss 0x1487(%rip),%ymm8 # 6cac <_sk_clut_4D_hsw+0xd22>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,109,7,0,0 // vbroadcastss 0x76d(%rip),%ymm10 # 5fa4 <_sk_callback_hsw+0x5ca>
- .byte 196,98,125,24,29,104,7,0,0 // vbroadcastss 0x768(%rip),%ymm11 # 5fa8 <_sk_callback_hsw+0x5ce>
+ .byte 196,98,125,24,21,121,20,0,0 // vbroadcastss 0x1479(%rip),%ymm10 # 6cb0 <_sk_clut_4D_hsw+0xd26>
+ .byte 196,98,125,24,29,116,20,0,0 // vbroadcastss 0x1474(%rip),%ymm11 # 6cb4 <_sk_clut_4D_hsw+0xd2a>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,89,7,0,0 // vbroadcastss 0x759(%rip),%ymm8 # 5fac <_sk_callback_hsw+0x5d2>
+ .byte 196,98,125,24,5,101,20,0,0 // vbroadcastss 0x1465(%rip),%ymm8 # 6cb8 <_sk_clut_4D_hsw+0xd2e>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -19035,12 +22215,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm0 # 5fb0 <_sk_callback_hsw+0x5d6>
+ .byte 196,226,125,24,5,77,20,0,0 // vbroadcastss 0x144d(%rip),%ymm0 # 6cbc <_sk_clut_4D_hsw+0xd32>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm10 # 5fb4 <_sk_callback_hsw+0x5da>
- .byte 196,98,125,24,29,41,7,0,0 // vbroadcastss 0x729(%rip),%ymm11 # 5fb8 <_sk_callback_hsw+0x5de>
+ .byte 196,98,125,24,21,58,20,0,0 // vbroadcastss 0x143a(%rip),%ymm10 # 6cc0 <_sk_clut_4D_hsw+0xd36>
+ .byte 196,98,125,24,29,53,20,0,0 // vbroadcastss 0x1435(%rip),%ymm11 # 6cc4 <_sk_clut_4D_hsw+0xd3a>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -19052,13 +22232,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,12,7,0,0 // vbroadcastss 0x70c(%rip),%ymm1 # 5fbc <_sk_callback_hsw+0x5e2>
+ .byte 196,226,125,24,13,24,20,0,0 // vbroadcastss 0x1418(%rip),%ymm1 # 6cc8 <_sk_clut_4D_hsw+0xd3e>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,2,7,0,0 // vbroadcastss 0x702(%rip),%ymm8 # 5fc0 <_sk_callback_hsw+0x5e6>
+ .byte 196,98,125,24,5,14,20,0,0 // vbroadcastss 0x140e(%rip),%ymm8 # 6ccc <_sk_clut_4D_hsw+0xd42>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm10 # 5fc4 <_sk_callback_hsw+0x5ea>
- .byte 196,98,125,24,29,238,6,0,0 // vbroadcastss 0x6ee(%rip),%ymm11 # 5fc8 <_sk_callback_hsw+0x5ee>
+ .byte 196,98,125,24,21,255,19,0,0 // vbroadcastss 0x13ff(%rip),%ymm10 # 6cd0 <_sk_clut_4D_hsw+0xd46>
+ .byte 196,98,125,24,29,250,19,0,0 // vbroadcastss 0x13fa(%rip),%ymm11 # 6cd4 <_sk_clut_4D_hsw+0xd4a>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -19070,16 +22250,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,209,6,0,0 // vbroadcastss 0x6d1(%rip),%ymm1 # 5fcc <_sk_callback_hsw+0x5f2>
+ .byte 196,226,125,24,13,221,19,0,0 // vbroadcastss 0x13dd(%rip),%ymm1 # 6cd8 <_sk_clut_4D_hsw+0xd4e>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,199,6,0,0 // vbroadcastss 0x6c7(%rip),%ymm8 # 5fd0 <_sk_callback_hsw+0x5f6>
+ .byte 196,98,125,24,5,211,19,0,0 // vbroadcastss 0x13d3(%rip),%ymm8 # 6cdc <_sk_clut_4D_hsw+0xd52>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,189,6,0,0 // vbroadcastss 0x6bd(%rip),%ymm9 # 5fd4 <_sk_callback_hsw+0x5fa>
- .byte 196,98,125,24,21,184,6,0,0 // vbroadcastss 0x6b8(%rip),%ymm10 # 5fd8 <_sk_callback_hsw+0x5fe>
+ .byte 196,98,125,24,13,201,19,0,0 // vbroadcastss 0x13c9(%rip),%ymm9 # 6ce0 <_sk_clut_4D_hsw+0xd56>
+ .byte 196,98,125,24,21,196,19,0,0 // vbroadcastss 0x13c4(%rip),%ymm10 # 6ce4 <_sk_clut_4D_hsw+0xd5a>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,174,6,0,0 // vbroadcastss 0x6ae(%rip),%ymm9 # 5fdc <_sk_callback_hsw+0x602>
+ .byte 196,98,125,24,13,186,19,0,0 // vbroadcastss 0x13ba(%rip),%ymm9 # 6ce8 <_sk_clut_4D_hsw+0xd5e>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,164,6,0,0 // vbroadcastss 0x6a4(%rip),%ymm10 # 5fe0 <_sk_callback_hsw+0x606>
+ .byte 196,98,125,24,21,176,19,0,0 // vbroadcastss 0x13b0(%rip),%ymm10 # 6cec <_sk_clut_4D_hsw+0xd62>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -19090,14 +22270,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,140,6,0,0 // vbroadcastss 0x68c(%rip),%ymm8 # 5fe4 <_sk_callback_hsw+0x60a>
+ .byte 196,98,125,24,5,152,19,0,0 // vbroadcastss 0x1398(%rip),%ymm8 # 6cf0 <_sk_clut_4D_hsw+0xd66>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,125,6,0,0 // vbroadcastss 0x67d(%rip),%ymm10 # 5fe8 <_sk_callback_hsw+0x60e>
- .byte 196,98,125,24,29,120,6,0,0 // vbroadcastss 0x678(%rip),%ymm11 # 5fec <_sk_callback_hsw+0x612>
+ .byte 196,98,125,24,21,137,19,0,0 // vbroadcastss 0x1389(%rip),%ymm10 # 6cf4 <_sk_clut_4D_hsw+0xd6a>
+ .byte 196,98,125,24,29,132,19,0,0 // vbroadcastss 0x1384(%rip),%ymm11 # 6cf8 <_sk_clut_4D_hsw+0xd6e>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,105,6,0,0 // vbroadcastss 0x669(%rip),%ymm8 # 5ff0 <_sk_callback_hsw+0x616>
+ .byte 196,98,125,24,5,117,19,0,0 // vbroadcastss 0x1375(%rip),%ymm8 # 6cfc <_sk_clut_4D_hsw+0xd72>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -19108,12 +22288,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,81,6,0,0 // vbroadcastss 0x651(%rip),%ymm1 # 5ff4 <_sk_callback_hsw+0x61a>
+ .byte 196,226,125,24,13,93,19,0,0 // vbroadcastss 0x135d(%rip),%ymm1 # 6d00 <_sk_clut_4D_hsw+0xd76>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,61,6,0,0 // vbroadcastss 0x63d(%rip),%ymm10 # 5ff8 <_sk_callback_hsw+0x61e>
- .byte 196,98,125,24,29,56,6,0,0 // vbroadcastss 0x638(%rip),%ymm11 # 5ffc <_sk_callback_hsw+0x622>
+ .byte 196,98,125,24,21,73,19,0,0 // vbroadcastss 0x1349(%rip),%ymm10 # 6d04 <_sk_clut_4D_hsw+0xd7a>
+ .byte 196,98,125,24,29,68,19,0,0 // vbroadcastss 0x1344(%rip),%ymm11 # 6d08 <_sk_clut_4D_hsw+0xd7e>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -19202,6 +22382,634 @@ _sk_callback_hsw:
.byte 93 // pop %rbp
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_clut_3D_hsw
+.globl _sk_clut_3D_hsw
+FUNCTION(_sk_clut_3D_hsw)
+_sk_clut_3D_hsw:
+ .byte 72,129,236,216,1,0,0 // sub $0x1d8,%rsp
+ .byte 197,252,17,188,36,160,1,0,0 // vmovups %ymm7,0x1a0(%rsp)
+ .byte 197,254,127,180,36,128,1,0,0 // vmovdqu %ymm6,0x180(%rsp)
+ .byte 197,252,17,172,36,96,1,0,0 // vmovups %ymm5,0x160(%rsp)
+ .byte 197,252,17,164,36,64,1,0,0 // vmovups %ymm4,0x140(%rsp)
+ .byte 197,252,17,156,36,32,1,0,0 // vmovups %ymm3,0x120(%rsp)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,16 // mov 0x10(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,218 // vmovd %r10d,%xmm3
+ .byte 196,226,125,88,219 // vpbroadcastd %xmm3,%ymm3
+ .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,252,17,84,36,224 // vmovups %ymm2,-0x20(%rsp)
+ .byte 197,254,91,234 // vcvttps2dq %ymm2,%ymm5
+ .byte 196,193,121,110,209 // vmovd %r9d,%xmm2
+ .byte 196,193,121,110,217 // vmovd %r9d,%xmm3
+ .byte 196,226,125,88,219 // vpbroadcastd %xmm3,%ymm3
+ .byte 197,254,127,92,36,128 // vmovdqu %ymm3,-0x80(%rsp)
+ .byte 68,139,72,12 // mov 0xc(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,226 // vmovd %r10d,%xmm4
+ .byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4
+ .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
+ .byte 197,220,89,201 // vmulps %ymm1,%ymm4,%ymm1
+ .byte 197,252,17,76,36,192 // vmovups %ymm1,-0x40(%rsp)
+ .byte 197,254,91,201 // vcvttps2dq %ymm1,%ymm1
+ .byte 197,254,127,140,36,0,1,0,0 // vmovdqu %ymm1,0x100(%rsp)
+ .byte 196,226,117,64,203 // vpmulld %ymm3,%ymm1,%ymm1
+ .byte 197,254,127,76,36,96 // vmovdqu %ymm1,0x60(%rsp)
+ .byte 197,117,254,229 // vpaddd %ymm5,%ymm1,%ymm12
+ .byte 197,125,111,205 // vmovdqa %ymm5,%ymm9
+ .byte 197,126,127,140,36,224,0,0,0 // vmovdqu %ymm9,0xe0(%rsp)
+ .byte 196,193,121,110,201 // vmovd %r9d,%xmm1
+ .byte 196,226,117,64,202 // vpmulld %ymm2,%ymm1,%ymm1
+ .byte 196,226,125,88,233 // vpbroadcastd %xmm1,%ymm5
+ .byte 68,139,72,8 // mov 0x8(%rax),%r9d
+ .byte 65,255,201 // dec %r9d
+ .byte 196,193,121,110,201 // vmovd %r9d,%xmm1
+ .byte 196,226,125,88,201 // vpbroadcastd %xmm1,%ymm1
+ .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
+ .byte 197,244,89,192 // vmulps %ymm0,%ymm1,%ymm0
+ .byte 197,254,91,208 // vcvttps2dq %ymm0,%ymm2
+ .byte 196,226,109,64,205 // vpmulld %ymm5,%ymm2,%ymm1
+ .byte 197,254,127,76,36,160 // vmovdqu %ymm1,-0x60(%rsp)
+ .byte 72,139,0 // mov (%rax),%rax
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 196,226,125,88,61,245,16,0,0 // vpbroadcastd 0x10f5(%rip),%ymm7 # 6d10 <_sk_clut_4D_hsw+0xd86>
+ .byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
+ .byte 196,98,125,88,21,225,16,0,0 // vpbroadcastd 0x10e1(%rip),%ymm10 # 6d14 <_sk_clut_4D_hsw+0xd8a>
+ .byte 196,193,117,254,242 // vpaddd %ymm10,%ymm1,%ymm6
+ .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
+ .byte 196,226,37,146,28,176 // vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
+ .byte 196,98,125,88,29,204,16,0,0 // vpbroadcastd 0x10cc(%rip),%ymm11 # 6d18 <_sk_clut_4D_hsw+0xd8e>
+ .byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,226,77,146,36,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
+ .byte 196,98,125,24,45,168,16,0,0 // vbroadcastss 0x10a8(%rip),%ymm13 # 6d0c <_sk_clut_4D_hsw+0xd82>
+ .byte 196,193,124,88,245 // vaddps %ymm13,%ymm0,%ymm6
+ .byte 197,254,91,246 // vcvttps2dq %ymm6,%ymm6
+ .byte 196,226,77,64,205 // vpmulld %ymm5,%ymm6,%ymm1
+ .byte 197,254,127,12,36 // vmovdqu %ymm1,(%rsp)
+ .byte 196,193,117,254,236 // vpaddd %ymm12,%ymm1,%ymm5
+ .byte 196,226,85,64,239 // vpmulld %ymm7,%ymm5,%ymm5
+ .byte 196,65,29,118,228 // vpcmpeqd %ymm12,%ymm12,%ymm12
+ .byte 196,98,29,146,60,168 // vgatherdps %ymm12,(%rax,%ymm5,4),%ymm15
+ .byte 196,65,85,254,226 // vpaddd %ymm10,%ymm5,%ymm12
+ .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
+ .byte 196,162,13,146,12,160 // vgatherdps %ymm14,(%rax,%ymm12,4),%ymm1
+ .byte 196,193,85,254,235 // vpaddd %ymm11,%ymm5,%ymm5
+ .byte 196,65,29,118,228 // vpcmpeqd %ymm12,%ymm12,%ymm12
+ .byte 196,226,29,146,52,168 // vgatherdps %ymm12,(%rax,%ymm5,4),%ymm6
+ .byte 197,252,91,234 // vcvtdq2ps %ymm2,%ymm5
+ .byte 197,124,92,245 // vsubps %ymm5,%ymm0,%ymm14
+ .byte 196,193,4,92,192 // vsubps %ymm8,%ymm15,%ymm0
+ .byte 196,194,13,168,192 // vfmadd213ps %ymm8,%ymm14,%ymm0
+ .byte 197,252,17,132,36,192,0,0,0 // vmovups %ymm0,0xc0(%rsp)
+ .byte 197,244,92,195 // vsubps %ymm3,%ymm1,%ymm0
+ .byte 196,226,13,168,195 // vfmadd213ps %ymm3,%ymm14,%ymm0
+ .byte 197,252,17,132,36,160,0,0,0 // vmovups %ymm0,0xa0(%rsp)
+ .byte 197,204,92,196 // vsubps %ymm4,%ymm6,%ymm0
+ .byte 196,226,13,168,196 // vfmadd213ps %ymm4,%ymm14,%ymm0
+ .byte 197,252,17,132,36,128,0,0,0 // vmovups %ymm0,0x80(%rsp)
+ .byte 197,148,88,68,36,192 // vaddps -0x40(%rsp),%ymm13,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 196,226,125,64,68,36,128 // vpmulld -0x80(%rsp),%ymm0,%ymm0
+ .byte 197,254,127,68,36,32 // vmovdqu %ymm0,0x20(%rsp)
+ .byte 196,193,125,254,193 // vpaddd %ymm9,%ymm0,%ymm0
+ .byte 197,126,111,76,36,160 // vmovdqu -0x60(%rsp),%ymm9
+ .byte 196,193,125,254,201 // vpaddd %ymm9,%ymm0,%ymm1
+ .byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,36,136 // vgatherdps %ymm3,(%rax,%ymm1,4),%ymm4
+ .byte 196,193,117,254,218 // vpaddd %ymm10,%ymm1,%ymm3
+ .byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
+ .byte 196,226,85,146,52,152 // vgatherdps %ymm5,(%rax,%ymm3,4),%ymm6
+ .byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,20,136 // vgatherdps %ymm3,(%rax,%ymm1,4),%ymm2
+ .byte 197,126,111,36,36 // vmovdqu (%rsp),%ymm12
+ .byte 197,157,254,192 // vpaddd %ymm0,%ymm12,%ymm0
+ .byte 196,226,125,64,199 // vpmulld %ymm7,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,28,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm3
+ .byte 196,193,125,254,202 // vpaddd %ymm10,%ymm0,%ymm1
+ .byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
+ .byte 196,98,85,146,4,136 // vgatherdps %ymm5,(%rax,%ymm1,4),%ymm8
+ .byte 196,193,125,254,195 // vpaddd %ymm11,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,44,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm5
+ .byte 197,228,92,196 // vsubps %ymm4,%ymm3,%ymm0
+ .byte 196,226,13,168,196 // vfmadd213ps %ymm4,%ymm14,%ymm0
+ .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
+ .byte 197,188,92,198 // vsubps %ymm6,%ymm8,%ymm0
+ .byte 196,226,13,168,198 // vfmadd213ps %ymm6,%ymm14,%ymm0
+ .byte 197,252,17,68,36,64 // vmovups %ymm0,0x40(%rsp)
+ .byte 197,84,92,250 // vsubps %ymm2,%ymm5,%ymm15
+ .byte 196,98,13,168,250 // vfmadd213ps %ymm2,%ymm14,%ymm15
+ .byte 197,148,88,68,36,224 // vaddps -0x20(%rsp),%ymm13,%ymm0
+ .byte 197,126,91,232 // vcvttps2dq %ymm0,%ymm13
+ .byte 197,149,254,68,36,96 // vpaddd 0x60(%rsp),%ymm13,%ymm0
+ .byte 197,181,254,200 // vpaddd %ymm0,%ymm9,%ymm1
+ .byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,44,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm5
+ .byte 196,193,117,254,210 // vpaddd %ymm10,%ymm1,%ymm2
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,226,77,146,28,144 // vgatherdps %ymm6,(%rax,%ymm2,4),%ymm3
+ .byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,52,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm6
+ .byte 197,157,254,192 // vpaddd %ymm0,%ymm12,%ymm0
+ .byte 196,226,125,64,199 // vpmulld %ymm7,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,20,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ .byte 196,193,125,254,202 // vpaddd %ymm10,%ymm0,%ymm1
+ .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
+ .byte 196,226,53,146,36,136 // vgatherdps %ymm9,(%rax,%ymm1,4),%ymm4
+ .byte 196,193,125,254,195 // vpaddd %ymm11,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,98,117,146,4,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm8
+ .byte 197,236,92,205 // vsubps %ymm5,%ymm2,%ymm1
+ .byte 196,226,13,168,205 // vfmadd213ps %ymm5,%ymm14,%ymm1
+ .byte 197,92,92,203 // vsubps %ymm3,%ymm4,%ymm9
+ .byte 196,98,13,168,203 // vfmadd213ps %ymm3,%ymm14,%ymm9
+ .byte 197,188,92,198 // vsubps %ymm6,%ymm8,%ymm0
+ .byte 196,226,13,168,198 // vfmadd213ps %ymm6,%ymm14,%ymm0
+ .byte 197,149,254,84,36,32 // vpaddd 0x20(%rsp),%ymm13,%ymm2
+ .byte 197,237,254,92,36,160 // vpaddd -0x60(%rsp),%ymm2,%ymm3
+ .byte 196,226,101,64,223 // vpmulld %ymm7,%ymm3,%ymm3
+ .byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
+ .byte 196,226,93,146,44,152 // vgatherdps %ymm4,(%rax,%ymm3,4),%ymm5
+ .byte 196,193,101,254,226 // vpaddd %ymm10,%ymm3,%ymm4
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,98,77,146,4,160 // vgatherdps %ymm6,(%rax,%ymm4,4),%ymm8
+ .byte 196,193,101,254,219 // vpaddd %ymm11,%ymm3,%ymm3
+ .byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
+ .byte 196,226,93,146,52,152 // vgatherdps %ymm4,(%rax,%ymm3,4),%ymm6
+ .byte 197,157,254,210 // vpaddd %ymm2,%ymm12,%ymm2
+ .byte 196,226,109,64,215 // vpmulld %ymm7,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,36,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm4
+ .byte 196,193,109,254,218 // vpaddd %ymm10,%ymm2,%ymm3
+ .byte 197,197,118,255 // vpcmpeqd %ymm7,%ymm7,%ymm7
+ .byte 196,98,69,146,20,152 // vgatherdps %ymm7,(%rax,%ymm3,4),%ymm10
+ .byte 196,193,109,254,211 // vpaddd %ymm11,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,60,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm7
+ .byte 197,220,92,213 // vsubps %ymm5,%ymm4,%ymm2
+ .byte 196,226,13,168,213 // vfmadd213ps %ymm5,%ymm14,%ymm2
+ .byte 196,193,44,92,216 // vsubps %ymm8,%ymm10,%ymm3
+ .byte 196,194,13,168,216 // vfmadd213ps %ymm8,%ymm14,%ymm3
+ .byte 197,196,92,230 // vsubps %ymm6,%ymm7,%ymm4
+ .byte 196,226,13,168,230 // vfmadd213ps %ymm6,%ymm14,%ymm4
+ .byte 197,252,91,172,36,0,1,0,0 // vcvtdq2ps 0x100(%rsp),%ymm5
+ .byte 197,252,16,116,36,192 // vmovups -0x40(%rsp),%ymm6
+ .byte 197,204,92,237 // vsubps %ymm5,%ymm6,%ymm5
+ .byte 197,252,16,188,36,192,0,0,0 // vmovups 0xc0(%rsp),%ymm7
+ .byte 197,252,16,116,36,128 // vmovups -0x80(%rsp),%ymm6
+ .byte 197,204,92,247 // vsubps %ymm7,%ymm6,%ymm6
+ .byte 196,226,85,168,247 // vfmadd213ps %ymm7,%ymm5,%ymm6
+ .byte 197,124,16,132,36,160,0,0,0 // vmovups 0xa0(%rsp),%ymm8
+ .byte 197,252,16,124,36,64 // vmovups 0x40(%rsp),%ymm7
+ .byte 196,193,68,92,248 // vsubps %ymm8,%ymm7,%ymm7
+ .byte 196,194,85,168,248 // vfmadd213ps %ymm8,%ymm5,%ymm7
+ .byte 197,124,16,148,36,128,0,0,0 // vmovups 0x80(%rsp),%ymm10
+ .byte 196,65,4,92,194 // vsubps %ymm10,%ymm15,%ymm8
+ .byte 196,66,85,168,194 // vfmadd213ps %ymm10,%ymm5,%ymm8
+ .byte 197,236,92,209 // vsubps %ymm1,%ymm2,%ymm2
+ .byte 196,226,85,168,209 // vfmadd213ps %ymm1,%ymm5,%ymm2
+ .byte 196,193,100,92,201 // vsubps %ymm9,%ymm3,%ymm1
+ .byte 196,194,85,168,201 // vfmadd213ps %ymm9,%ymm5,%ymm1
+ .byte 197,220,92,216 // vsubps %ymm0,%ymm4,%ymm3
+ .byte 196,226,85,168,216 // vfmadd213ps %ymm0,%ymm5,%ymm3
+ .byte 197,252,91,132,36,224,0,0,0 // vcvtdq2ps 0xe0(%rsp),%ymm0
+ .byte 197,252,16,100,36,224 // vmovups -0x20(%rsp),%ymm4
+ .byte 197,220,92,224 // vsubps %ymm0,%ymm4,%ymm4
+ .byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
+ .byte 196,226,93,168,198 // vfmadd213ps %ymm6,%ymm4,%ymm0
+ .byte 197,244,92,207 // vsubps %ymm7,%ymm1,%ymm1
+ .byte 196,226,93,168,207 // vfmadd213ps %ymm7,%ymm4,%ymm1
+ .byte 196,193,100,92,208 // vsubps %ymm8,%ymm3,%ymm2
+ .byte 196,194,93,168,208 // vfmadd213ps %ymm8,%ymm4,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,16,156,36,32,1,0,0 // vmovups 0x120(%rsp),%ymm3
+ .byte 197,252,16,164,36,64,1,0,0 // vmovups 0x140(%rsp),%ymm4
+ .byte 197,252,16,172,36,96,1,0,0 // vmovups 0x160(%rsp),%ymm5
+ .byte 197,252,16,180,36,128,1,0,0 // vmovups 0x180(%rsp),%ymm6
+ .byte 197,252,16,188,36,160,1,0,0 // vmovups 0x1a0(%rsp),%ymm7
+ .byte 72,129,196,216,1,0,0 // add $0x1d8,%rsp
+ .byte 255,224 // jmpq *%rax
+
+HIDDEN _sk_clut_4D_hsw
+.globl _sk_clut_4D_hsw
+FUNCTION(_sk_clut_4D_hsw)
+_sk_clut_4D_hsw:
+ .byte 72,129,236,184,3,0,0 // sub $0x3b8,%rsp
+ .byte 197,252,17,188,36,128,3,0,0 // vmovups %ymm7,0x380(%rsp)
+ .byte 197,252,17,180,36,96,3,0,0 // vmovups %ymm6,0x360(%rsp)
+ .byte 197,252,17,172,36,64,3,0,0 // vmovups %ymm5,0x340(%rsp)
+ .byte 197,252,17,164,36,32,3,0,0 // vmovups %ymm4,0x320(%rsp)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,20 // mov 0x14(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,226 // vmovd %r10d,%xmm4
+ .byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4
+ .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
+ .byte 197,220,89,219 // vmulps %ymm3,%ymm4,%ymm3
+ .byte 197,252,17,156,36,160,0,0,0 // vmovups %ymm3,0xa0(%rsp)
+ .byte 197,254,91,243 // vcvttps2dq %ymm3,%ymm6
+ .byte 197,254,127,180,36,128,0,0,0 // vmovdqu %ymm6,0x80(%rsp)
+ .byte 196,193,121,110,225 // vmovd %r9d,%xmm4
+ .byte 196,193,121,110,217 // vmovd %r9d,%xmm3
+ .byte 196,226,125,88,219 // vpbroadcastd %xmm3,%ymm3
+ .byte 197,254,127,92,36,192 // vmovdqu %ymm3,-0x40(%rsp)
+ .byte 68,139,72,16 // mov 0x10(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,234 // vmovd %r10d,%xmm5
+ .byte 196,226,125,88,237 // vpbroadcastd %xmm5,%ymm5
+ .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
+ .byte 197,212,89,210 // vmulps %ymm2,%ymm5,%ymm2
+ .byte 197,252,17,84,36,96 // vmovups %ymm2,0x60(%rsp)
+ .byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2
+ .byte 197,254,127,148,36,0,3,0,0 // vmovdqu %ymm2,0x300(%rsp)
+ .byte 196,226,109,64,211 // vpmulld %ymm3,%ymm2,%ymm2
+ .byte 197,254,127,84,36,224 // vmovdqu %ymm2,-0x20(%rsp)
+ .byte 197,237,254,222 // vpaddd %ymm6,%ymm2,%ymm3
+ .byte 197,254,127,28,36 // vmovdqu %ymm3,(%rsp)
+ .byte 196,193,121,110,233 // vmovd %r9d,%xmm5
+ .byte 196,226,85,64,236 // vpmulld %ymm4,%ymm5,%ymm5
+ .byte 196,226,125,88,253 // vpbroadcastd %xmm5,%ymm7
+ .byte 197,254,127,124,36,32 // vmovdqu %ymm7,0x20(%rsp)
+ .byte 68,139,72,12 // mov 0xc(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,242 // vmovd %r10d,%xmm6
+ .byte 196,226,125,88,246 // vpbroadcastd %xmm6,%ymm6
+ .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
+ .byte 197,204,89,225 // vmulps %ymm1,%ymm6,%ymm4
+ .byte 196,193,121,110,201 // vmovd %r9d,%xmm1
+ .byte 196,226,117,64,205 // vpmulld %ymm5,%ymm1,%ymm1
+ .byte 68,139,72,8 // mov 0x8(%rax),%r9d
+ .byte 65,255,201 // dec %r9d
+ .byte 196,193,121,110,233 // vmovd %r9d,%xmm5
+ .byte 196,226,125,88,237 // vpbroadcastd %xmm5,%ymm5
+ .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
+ .byte 197,212,89,232 // vmulps %ymm0,%ymm5,%ymm5
+ .byte 197,254,91,196 // vcvttps2dq %ymm4,%ymm0
+ .byte 197,254,127,132,36,224,2,0,0 // vmovdqu %ymm0,0x2e0(%rsp)
+ .byte 197,252,17,164,36,96,2,0,0 // vmovups %ymm4,0x260(%rsp)
+ .byte 196,226,125,88,201 // vpbroadcastd %xmm1,%ymm1
+ .byte 72,139,0 // mov (%rax),%rax
+ .byte 196,226,125,64,199 // vpmulld %ymm7,%ymm0,%ymm0
+ .byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp)
+ .byte 197,253,254,243 // vpaddd %ymm3,%ymm0,%ymm6
+ .byte 197,126,91,245 // vcvttps2dq %ymm5,%ymm14
+ .byte 196,98,13,64,233 // vpmulld %ymm1,%ymm14,%ymm13
+ .byte 197,149,254,198 // vpaddd %ymm6,%ymm13,%ymm0
+ .byte 196,98,125,88,21,78,12,0,0 // vpbroadcastd 0xc4e(%rip),%ymm10 # 6d20 <_sk_clut_4D_hsw+0xd96>
+ .byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
+ .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
+ .byte 196,98,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
+ .byte 196,98,125,88,29,57,12,0,0 // vpbroadcastd 0xc39(%rip),%ymm11 # 6d24 <_sk_clut_4D_hsw+0xd9a>
+ .byte 196,65,125,254,195 // vpaddd %ymm11,%ymm0,%ymm8
+ .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
+ .byte 196,162,53,146,20,128 // vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
+ .byte 196,98,125,88,37,36,12,0,0 // vpbroadcastd 0xc24(%rip),%ymm12 # 6d28 <_sk_clut_4D_hsw+0xd9e>
+ .byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
+ .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
+ .byte 196,226,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
+ .byte 196,98,125,24,13,255,11,0,0 // vbroadcastss 0xbff(%rip),%ymm9 # 6d1c <_sk_clut_4D_hsw+0xd92>
+ .byte 196,65,84,88,193 // vaddps %ymm9,%ymm5,%ymm8
+ .byte 196,65,126,91,192 // vcvttps2dq %ymm8,%ymm8
+ .byte 196,226,61,64,193 // vpmulld %ymm1,%ymm8,%ymm0
+ .byte 197,254,127,68,36,64 // vmovdqu %ymm0,0x40(%rsp)
+ .byte 197,253,254,206 // vpaddd %ymm6,%ymm0,%ymm1
+ .byte 196,194,117,64,202 // vpmulld %ymm10,%ymm1,%ymm1
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
+ .byte 196,193,117,254,243 // vpaddd %ymm11,%ymm1,%ymm6
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,4,176 // vgatherdps %ymm3,(%rax,%ymm6,4),%ymm0
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,52,136 // vgatherdps %ymm3,(%rax,%ymm1,4),%ymm6
+ .byte 196,193,124,91,206 // vcvtdq2ps %ymm14,%ymm1
+ .byte 197,84,92,241 // vsubps %ymm1,%ymm5,%ymm14
+ .byte 196,193,60,92,207 // vsubps %ymm15,%ymm8,%ymm1
+ .byte 196,194,13,168,207 // vfmadd213ps %ymm15,%ymm14,%ymm1
+ .byte 197,252,17,140,36,192,2,0,0 // vmovups %ymm1,0x2c0(%rsp)
+ .byte 197,252,92,194 // vsubps %ymm2,%ymm0,%ymm0
+ .byte 196,226,13,168,194 // vfmadd213ps %ymm2,%ymm14,%ymm0
+ .byte 197,252,17,132,36,160,2,0,0 // vmovups %ymm0,0x2a0(%rsp)
+ .byte 197,204,92,199 // vsubps %ymm7,%ymm6,%ymm0
+ .byte 196,226,13,168,199 // vfmadd213ps %ymm7,%ymm14,%ymm0
+ .byte 197,252,17,132,36,128,2,0,0 // vmovups %ymm0,0x280(%rsp)
+ .byte 197,124,17,76,36,160 // vmovups %ymm9,-0x60(%rsp)
+ .byte 196,193,92,88,193 // vaddps %ymm9,%ymm4,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 196,226,125,64,76,36,32 // vpmulld 0x20(%rsp),%ymm0,%ymm1
+ .byte 197,245,254,4,36 // vpaddd (%rsp),%ymm1,%ymm0
+ .byte 197,125,111,249 // vmovdqa %ymm1,%ymm15
+ .byte 196,193,125,254,205 // vpaddd %ymm13,%ymm0,%ymm1
+ .byte 196,194,117,64,202 // vpmulld %ymm10,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,28,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ .byte 196,193,117,254,211 // vpaddd %ymm11,%ymm1,%ymm2
+ .byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
+ .byte 196,226,85,146,52,144 // vgatherdps %ymm5,(%rax,%ymm2,4),%ymm6
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,44,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm5
+ .byte 197,254,111,100,36,64 // vmovdqu 0x40(%rsp),%ymm4
+ .byte 197,221,254,192 // vpaddd %ymm0,%ymm4,%ymm0
+ .byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,20,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ .byte 196,193,125,254,203 // vpaddd %ymm11,%ymm0,%ymm1
+ .byte 197,197,118,255 // vpcmpeqd %ymm7,%ymm7,%ymm7
+ .byte 196,98,69,146,4,136 // vgatherdps %ymm7,(%rax,%ymm1,4),%ymm8
+ .byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,60,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm7
+ .byte 197,236,92,195 // vsubps %ymm3,%ymm2,%ymm0
+ .byte 196,226,13,168,195 // vfmadd213ps %ymm3,%ymm14,%ymm0
+ .byte 197,252,17,68,36,32 // vmovups %ymm0,0x20(%rsp)
+ .byte 197,188,92,198 // vsubps %ymm6,%ymm8,%ymm0
+ .byte 196,226,13,168,198 // vfmadd213ps %ymm6,%ymm14,%ymm0
+ .byte 197,252,17,4,36 // vmovups %ymm0,(%rsp)
+ .byte 197,196,92,197 // vsubps %ymm5,%ymm7,%ymm0
+ .byte 196,226,13,168,197 // vfmadd213ps %ymm5,%ymm14,%ymm0
+ .byte 197,252,17,132,36,64,2,0,0 // vmovups %ymm0,0x240(%rsp)
+ .byte 197,180,88,68,36,96 // vaddps 0x60(%rsp),%ymm9,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 196,226,125,64,68,36,192 // vpmulld -0x40(%rsp),%ymm0,%ymm0
+ .byte 197,254,127,132,36,128,1,0,0 // vmovdqu %ymm0,0x180(%rsp)
+ .byte 197,253,254,132,36,128,0,0,0 // vpaddd 0x80(%rsp),%ymm0,%ymm0
+ .byte 197,253,254,76,36,128 // vpaddd -0x80(%rsp),%ymm0,%ymm1
+ .byte 196,193,117,254,213 // vpaddd %ymm13,%ymm1,%ymm2
+ .byte 196,65,125,111,205 // vmovdqa %ymm13,%ymm9
+ .byte 196,194,109,64,210 // vpmulld %ymm10,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,44,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm5
+ .byte 196,193,109,254,219 // vpaddd %ymm11,%ymm2,%ymm3
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,226,77,146,60,152 // vgatherdps %ymm6,(%rax,%ymm3,4),%ymm7
+ .byte 196,193,109,254,212 // vpaddd %ymm12,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,52,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm6
+ .byte 197,221,254,201 // vpaddd %ymm1,%ymm4,%ymm1
+ .byte 196,194,117,64,202 // vpmulld %ymm10,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,28,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ .byte 196,193,117,254,211 // vpaddd %ymm11,%ymm1,%ymm2
+ .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
+ .byte 196,98,61,146,44,144 // vgatherdps %ymm8,(%rax,%ymm2,4),%ymm13
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,98,109,146,4,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm8
+ .byte 197,228,92,205 // vsubps %ymm5,%ymm3,%ymm1
+ .byte 196,226,13,168,205 // vfmadd213ps %ymm5,%ymm14,%ymm1
+ .byte 197,252,17,76,36,192 // vmovups %ymm1,-0x40(%rsp)
+ .byte 197,148,92,207 // vsubps %ymm7,%ymm13,%ymm1
+ .byte 196,226,13,168,207 // vfmadd213ps %ymm7,%ymm14,%ymm1
+ .byte 197,252,17,140,36,32,2,0,0 // vmovups %ymm1,0x220(%rsp)
+ .byte 197,188,92,206 // vsubps %ymm6,%ymm8,%ymm1
+ .byte 196,226,13,168,206 // vfmadd213ps %ymm6,%ymm14,%ymm1
+ .byte 197,252,17,140,36,0,2,0,0 // vmovups %ymm1,0x200(%rsp)
+ .byte 197,126,127,188,36,0,1,0,0 // vmovdqu %ymm15,0x100(%rsp)
+ .byte 197,133,254,192 // vpaddd %ymm0,%ymm15,%ymm0
+ .byte 196,193,125,254,201 // vpaddd %ymm9,%ymm0,%ymm1
+ .byte 196,194,117,64,202 // vpmulld %ymm10,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,28,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ .byte 196,193,117,254,211 // vpaddd %ymm11,%ymm1,%ymm2
+ .byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
+ .byte 196,226,85,146,52,144 // vgatherdps %ymm5,(%rax,%ymm2,4),%ymm6
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,44,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm5
+ .byte 197,221,254,192 // vpaddd %ymm0,%ymm4,%ymm0
+ .byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,20,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ .byte 196,193,125,254,203 // vpaddd %ymm11,%ymm0,%ymm1
+ .byte 197,197,118,255 // vpcmpeqd %ymm7,%ymm7,%ymm7
+ .byte 196,98,69,146,4,136 // vgatherdps %ymm7,(%rax,%ymm1,4),%ymm8
+ .byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,60,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm7
+ .byte 197,236,92,195 // vsubps %ymm3,%ymm2,%ymm0
+ .byte 196,226,13,168,195 // vfmadd213ps %ymm3,%ymm14,%ymm0
+ .byte 197,252,17,132,36,224,1,0,0 // vmovups %ymm0,0x1e0(%rsp)
+ .byte 197,188,92,198 // vsubps %ymm6,%ymm8,%ymm0
+ .byte 196,226,13,168,198 // vfmadd213ps %ymm6,%ymm14,%ymm0
+ .byte 197,252,17,132,36,192,1,0,0 // vmovups %ymm0,0x1c0(%rsp)
+ .byte 197,196,92,197 // vsubps %ymm5,%ymm7,%ymm0
+ .byte 196,226,13,168,197 // vfmadd213ps %ymm5,%ymm14,%ymm0
+ .byte 197,252,17,132,36,160,1,0,0 // vmovups %ymm0,0x1a0(%rsp)
+ .byte 197,252,16,68,36,160 // vmovups -0x60(%rsp),%ymm0
+ .byte 197,252,88,132,36,160,0,0,0 // vaddps 0xa0(%rsp),%ymm0,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 197,254,127,132,36,32,1,0,0 // vmovdqu %ymm0,0x120(%rsp)
+ .byte 197,125,254,68,36,224 // vpaddd -0x20(%rsp),%ymm0,%ymm8
+ .byte 197,189,254,76,36,128 // vpaddd -0x80(%rsp),%ymm8,%ymm1
+ .byte 197,181,254,209 // vpaddd %ymm1,%ymm9,%ymm2
+ .byte 197,125,127,207 // vmovdqa %ymm9,%ymm7
+ .byte 196,194,109,64,210 // vpmulld %ymm10,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,36,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm4
+ .byte 196,193,109,254,219 // vpaddd %ymm11,%ymm2,%ymm3
+ .byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
+ .byte 196,98,85,146,44,152 // vgatherdps %ymm5,(%rax,%ymm3,4),%ymm13
+ .byte 196,193,109,254,212 // vpaddd %ymm12,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,44,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm5
+ .byte 197,126,111,76,36,64 // vmovdqu 0x40(%rsp),%ymm9
+ .byte 197,181,254,201 // vpaddd %ymm1,%ymm9,%ymm1
+ .byte 196,194,117,64,202 // vpmulld %ymm10,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,28,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ .byte 196,193,117,254,211 // vpaddd %ymm11,%ymm1,%ymm2
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,226,77,146,4,144 // vgatherdps %ymm6,(%rax,%ymm2,4),%ymm0
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,52,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm6
+ .byte 197,228,92,204 // vsubps %ymm4,%ymm3,%ymm1
+ .byte 196,226,13,168,204 // vfmadd213ps %ymm4,%ymm14,%ymm1
+ .byte 197,252,17,76,36,224 // vmovups %ymm1,-0x20(%rsp)
+ .byte 196,193,124,92,197 // vsubps %ymm13,%ymm0,%ymm0
+ .byte 196,194,13,168,197 // vfmadd213ps %ymm13,%ymm14,%ymm0
+ .byte 197,252,17,68,36,160 // vmovups %ymm0,-0x60(%rsp)
+ .byte 197,204,92,197 // vsubps %ymm5,%ymm6,%ymm0
+ .byte 196,226,13,168,197 // vfmadd213ps %ymm5,%ymm14,%ymm0
+ .byte 197,252,17,132,36,96,1,0,0 // vmovups %ymm0,0x160(%rsp)
+ .byte 196,193,5,254,192 // vpaddd %ymm8,%ymm15,%ymm0
+ .byte 197,253,254,207 // vpaddd %ymm7,%ymm0,%ymm1
+ .byte 197,125,111,255 // vmovdqa %ymm7,%ymm15
+ .byte 196,194,117,64,202 // vpmulld %ymm10,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,28,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ .byte 196,193,117,254,211 // vpaddd %ymm11,%ymm1,%ymm2
+ .byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
+ .byte 196,226,85,146,52,144 // vgatherdps %ymm5,(%rax,%ymm2,4),%ymm6
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,226,109,146,60,136 // vgatherdps %ymm2,(%rax,%ymm1,4),%ymm7
+ .byte 197,181,254,192 // vpaddd %ymm0,%ymm9,%ymm0
+ .byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,20,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ .byte 196,193,125,254,203 // vpaddd %ymm11,%ymm0,%ymm1
+ .byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
+ .byte 196,98,85,146,44,136 // vgatherdps %ymm5,(%rax,%ymm1,4),%ymm13
+ .byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,36,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm4
+ .byte 197,236,92,195 // vsubps %ymm3,%ymm2,%ymm0
+ .byte 196,226,13,168,195 // vfmadd213ps %ymm3,%ymm14,%ymm0
+ .byte 197,252,17,132,36,64,1,0,0 // vmovups %ymm0,0x140(%rsp)
+ .byte 197,148,92,198 // vsubps %ymm6,%ymm13,%ymm0
+ .byte 196,226,13,168,198 // vfmadd213ps %ymm6,%ymm14,%ymm0
+ .byte 197,252,17,132,36,192,0,0,0 // vmovups %ymm0,0xc0(%rsp)
+ .byte 197,220,92,199 // vsubps %ymm7,%ymm4,%ymm0
+ .byte 196,226,13,168,199 // vfmadd213ps %ymm7,%ymm14,%ymm0
+ .byte 197,252,17,132,36,224,0,0,0 // vmovups %ymm0,0xe0(%rsp)
+ .byte 197,254,111,132,36,32,1,0,0 // vmovdqu 0x120(%rsp),%ymm0
+ .byte 197,253,254,172,36,128,1,0,0 // vpaddd 0x180(%rsp),%ymm0,%ymm5
+ .byte 197,213,254,68,36,128 // vpaddd -0x80(%rsp),%ymm5,%ymm0
+ .byte 196,193,125,254,207 // vpaddd %ymm15,%ymm0,%ymm1
+ .byte 196,194,117,64,202 // vpmulld %ymm10,%ymm1,%ymm1
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,226,77,146,60,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm7
+ .byte 196,193,117,254,243 // vpaddd %ymm11,%ymm1,%ymm6
+ .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
+ .byte 196,98,61,146,44,176 // vgatherdps %ymm8,(%rax,%ymm6,4),%ymm13
+ .byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,226,77,146,20,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm2
+ .byte 197,181,254,192 // vpaddd %ymm0,%ymm9,%ymm0
+ .byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,52,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm6
+ .byte 196,193,125,254,203 // vpaddd %ymm11,%ymm0,%ymm1
+ .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
+ .byte 196,226,61,146,28,136 // vgatherdps %ymm8,(%rax,%ymm1,4),%ymm3
+ .byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
+ .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
+ .byte 196,226,117,146,36,128 // vgatherdps %ymm1,(%rax,%ymm0,4),%ymm4
+ .byte 197,204,92,199 // vsubps %ymm7,%ymm6,%ymm0
+ .byte 196,226,13,168,199 // vfmadd213ps %ymm7,%ymm14,%ymm0
+ .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
+ .byte 196,193,100,92,205 // vsubps %ymm13,%ymm3,%ymm1
+ .byte 196,194,13,168,205 // vfmadd213ps %ymm13,%ymm14,%ymm1
+ .byte 197,92,92,194 // vsubps %ymm2,%ymm4,%ymm8
+ .byte 196,98,13,168,194 // vfmadd213ps %ymm2,%ymm14,%ymm8
+ .byte 197,213,254,148,36,0,1,0,0 // vpaddd 0x100(%rsp),%ymm5,%ymm2
+ .byte 196,193,109,254,223 // vpaddd %ymm15,%ymm2,%ymm3
+ .byte 196,194,101,64,218 // vpmulld %ymm10,%ymm3,%ymm3
+ .byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
+ .byte 196,226,93,146,44,152 // vgatherdps %ymm4,(%rax,%ymm3,4),%ymm5
+ .byte 196,193,101,254,227 // vpaddd %ymm11,%ymm3,%ymm4
+ .byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
+ .byte 196,226,77,146,60,160 // vgatherdps %ymm6,(%rax,%ymm4,4),%ymm7
+ .byte 196,193,101,254,220 // vpaddd %ymm12,%ymm3,%ymm3
+ .byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
+ .byte 196,226,93,146,52,152 // vgatherdps %ymm4,(%rax,%ymm3,4),%ymm6
+ .byte 197,181,254,210 // vpaddd %ymm2,%ymm9,%ymm2
+ .byte 196,194,109,64,210 // vpmulld %ymm10,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,226,101,146,36,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm4
+ .byte 196,193,109,254,219 // vpaddd %ymm11,%ymm2,%ymm3
+ .byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
+ .byte 196,98,45,146,28,152 // vgatherdps %ymm10,(%rax,%ymm3,4),%ymm11
+ .byte 196,193,109,254,212 // vpaddd %ymm12,%ymm2,%ymm2
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,98,101,146,20,144 // vgatherdps %ymm3,(%rax,%ymm2,4),%ymm10
+ .byte 197,220,92,213 // vsubps %ymm5,%ymm4,%ymm2
+ .byte 196,226,13,168,213 // vfmadd213ps %ymm5,%ymm14,%ymm2
+ .byte 197,164,92,223 // vsubps %ymm7,%ymm11,%ymm3
+ .byte 196,226,13,168,223 // vfmadd213ps %ymm7,%ymm14,%ymm3
+ .byte 197,172,92,230 // vsubps %ymm6,%ymm10,%ymm4
+ .byte 196,226,13,168,230 // vfmadd213ps %ymm6,%ymm14,%ymm4
+ .byte 197,252,91,172,36,224,2,0,0 // vcvtdq2ps 0x2e0(%rsp),%ymm5
+ .byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6
+ .byte 197,204,92,237 // vsubps %ymm5,%ymm6,%ymm5
+ .byte 197,252,16,188,36,192,2,0,0 // vmovups 0x2c0(%rsp),%ymm7
+ .byte 197,252,16,116,36,32 // vmovups 0x20(%rsp),%ymm6
+ .byte 197,204,92,247 // vsubps %ymm7,%ymm6,%ymm6
+ .byte 196,226,85,168,247 // vfmadd213ps %ymm7,%ymm5,%ymm6
+ .byte 197,124,16,148,36,160,2,0,0 // vmovups 0x2a0(%rsp),%ymm10
+ .byte 197,252,16,60,36 // vmovups (%rsp),%ymm7
+ .byte 196,193,68,92,250 // vsubps %ymm10,%ymm7,%ymm7
+ .byte 196,194,85,168,250 // vfmadd213ps %ymm10,%ymm5,%ymm7
+ .byte 197,124,16,156,36,128,2,0,0 // vmovups 0x280(%rsp),%ymm11
+ .byte 197,124,16,148,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm10
+ .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
+ .byte 196,66,85,168,211 // vfmadd213ps %ymm11,%ymm5,%ymm10
+ .byte 197,124,16,100,36,192 // vmovups -0x40(%rsp),%ymm12
+ .byte 197,124,16,156,36,224,1,0,0 // vmovups 0x1e0(%rsp),%ymm11
+ .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
+ .byte 196,66,85,168,220 // vfmadd213ps %ymm12,%ymm5,%ymm11
+ .byte 197,124,16,172,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm13
+ .byte 197,124,16,164,36,192,1,0,0 // vmovups 0x1c0(%rsp),%ymm12
+ .byte 196,65,28,92,229 // vsubps %ymm13,%ymm12,%ymm12
+ .byte 196,66,85,168,229 // vfmadd213ps %ymm13,%ymm5,%ymm12
+ .byte 197,124,16,180,36,0,2,0,0 // vmovups 0x200(%rsp),%ymm14
+ .byte 197,124,16,172,36,160,1,0,0 // vmovups 0x1a0(%rsp),%ymm13
+ .byte 196,65,20,92,238 // vsubps %ymm14,%ymm13,%ymm13
+ .byte 196,66,85,168,238 // vfmadd213ps %ymm14,%ymm5,%ymm13
+ .byte 197,252,16,68,36,224 // vmovups -0x20(%rsp),%ymm0
+ .byte 197,124,16,180,36,64,1,0,0 // vmovups 0x140(%rsp),%ymm14
+ .byte 197,12,92,240 // vsubps %ymm0,%ymm14,%ymm14
+ .byte 196,98,85,168,240 // vfmadd213ps %ymm0,%ymm5,%ymm14
+ .byte 197,252,16,68,36,160 // vmovups -0x60(%rsp),%ymm0
+ .byte 197,124,16,140,36,192,0,0,0 // vmovups 0xc0(%rsp),%ymm9
+ .byte 197,52,92,248 // vsubps %ymm0,%ymm9,%ymm15
+ .byte 196,98,85,168,248 // vfmadd213ps %ymm0,%ymm5,%ymm15
+ .byte 197,252,16,132,36,96,1,0,0 // vmovups 0x160(%rsp),%ymm0
+ .byte 197,124,16,140,36,224,0,0,0 // vmovups 0xe0(%rsp),%ymm9
+ .byte 197,52,92,200 // vsubps %ymm0,%ymm9,%ymm9
+ .byte 196,98,85,168,200 // vfmadd213ps %ymm0,%ymm5,%ymm9
+ .byte 197,252,16,68,36,128 // vmovups -0x80(%rsp),%ymm0
+ .byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
+ .byte 196,226,85,168,208 // vfmadd213ps %ymm0,%ymm5,%ymm2
+ .byte 197,228,92,217 // vsubps %ymm1,%ymm3,%ymm3
+ .byte 196,226,85,168,217 // vfmadd213ps %ymm1,%ymm5,%ymm3
+ .byte 196,193,92,92,200 // vsubps %ymm8,%ymm4,%ymm1
+ .byte 196,194,85,168,200 // vfmadd213ps %ymm8,%ymm5,%ymm1
+ .byte 197,252,91,132,36,0,3,0,0 // vcvtdq2ps 0x300(%rsp),%ymm0
+ .byte 197,252,16,100,36,96 // vmovups 0x60(%rsp),%ymm4
+ .byte 197,220,92,192 // vsubps %ymm0,%ymm4,%ymm0
+ .byte 197,164,92,230 // vsubps %ymm6,%ymm11,%ymm4
+ .byte 196,226,125,168,230 // vfmadd213ps %ymm6,%ymm0,%ymm4
+ .byte 197,156,92,239 // vsubps %ymm7,%ymm12,%ymm5
+ .byte 196,226,125,168,239 // vfmadd213ps %ymm7,%ymm0,%ymm5
+ .byte 196,193,20,92,242 // vsubps %ymm10,%ymm13,%ymm6
+ .byte 196,194,125,168,242 // vfmadd213ps %ymm10,%ymm0,%ymm6
+ .byte 196,193,108,92,214 // vsubps %ymm14,%ymm2,%ymm2
+ .byte 196,194,125,168,214 // vfmadd213ps %ymm14,%ymm0,%ymm2
+ .byte 196,193,100,92,223 // vsubps %ymm15,%ymm3,%ymm3
+ .byte 196,194,125,168,223 // vfmadd213ps %ymm15,%ymm0,%ymm3
+ .byte 196,193,116,92,249 // vsubps %ymm9,%ymm1,%ymm7
+ .byte 196,194,125,168,249 // vfmadd213ps %ymm9,%ymm0,%ymm7
+ .byte 197,252,91,132,36,128,0,0,0 // vcvtdq2ps 0x80(%rsp),%ymm0
+ .byte 197,252,16,140,36,160,0,0,0 // vmovups 0xa0(%rsp),%ymm1
+ .byte 197,116,92,192 // vsubps %ymm0,%ymm1,%ymm8
+ .byte 197,236,92,196 // vsubps %ymm4,%ymm2,%ymm0
+ .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
+ .byte 197,228,92,205 // vsubps %ymm5,%ymm3,%ymm1
+ .byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
+ .byte 197,196,92,214 // vsubps %ymm6,%ymm7,%ymm2
+ .byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 196,226,125,24,29,49,5,0,0 // vbroadcastss 0x531(%rip),%ymm3 # 6d2c <_sk_clut_4D_hsw+0xda2>
+ .byte 197,252,16,164,36,32,3,0,0 // vmovups 0x320(%rsp),%ymm4
+ .byte 197,252,16,172,36,64,3,0,0 // vmovups 0x340(%rsp),%ymm5
+ .byte 197,252,16,180,36,96,3,0,0 // vmovups 0x360(%rsp),%ymm6
+ .byte 197,252,16,188,36,128,3,0,0 // vmovups 0x380(%rsp),%ymm7
+ .byte 72,129,196,184,3,0,0 // add $0x3b8,%rsp
+ .byte 255,224 // jmpq *%rax
+
BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
@@ -19245,25 +23053,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5bd5 <.literal4+0xb9>
+ .byte 71,225,61 // rex.RXB loope 68e1 <.literal4+0xb9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5be5 <.literal4+0xc9>
+ .byte 71,225,61 // rex.RXB loope 68f1 <.literal4+0xc9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5bf5 <.literal4+0xd9>
+ .byte 71,225,61 // rex.RXB loope 6901 <.literal4+0xd9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5c05 <.literal4+0xe9>
+ .byte 71,225,61 // rex.RXB loope 6911 <.literal4+0xe9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -19326,7 +23134,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5c79 <.literal4+0x15d>
+ .byte 224,7 // loopne 6985 <.literal4+0x15d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19342,10 +23150,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 5ca0 <.literal4+0x184>
+ .byte 127,0 // jg 69ac <.literal4+0x184>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5d19 <.literal4+0x1fd>
+ .byte 119,115 // ja 6a25 <.literal4+0x1fd>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19359,10 +23167,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5cd4 <.literal4+0x1b8>
+ .byte 127,0 // jg 69e0 <.literal4+0x1b8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5d4d <.literal4+0x231>
+ .byte 119,115 // ja 6a59 <.literal4+0x231>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19376,10 +23184,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5d08 <.literal4+0x1ec>
+ .byte 127,0 // jg 6a14 <.literal4+0x1ec>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5d81 <.literal4+0x265>
+ .byte 119,115 // ja 6a8d <.literal4+0x265>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19393,10 +23201,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5d3c <.literal4+0x220>
+ .byte 127,0 // jg 6a48 <.literal4+0x220>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5db5 <.literal4+0x299>
+ .byte 119,115 // ja 6ac1 <.literal4+0x299>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19410,10 +23218,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5d70 <.literal4+0x254>
+ .byte 127,0 // jg 6a7c <.literal4+0x254>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5de9 <.literal4+0x2cd>
+ .byte 119,115 // ja 6af5 <.literal4+0x2cd>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19426,7 +23234,7 @@ BALIGN4
.byte 0,75,0 // add %cl,0x0(%rbx)
.byte 0,200 // add %cl,%al
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 5de3 <.literal4+0x2c7>
+ .byte 127,67 // jg 6aef <.literal4+0x2c7>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -19438,7 +23246,7 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5e03 <.literal4+0x2e7>
+ .byte 118,63 // jbe 6b0f <.literal4+0x2e7>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
@@ -19460,7 +23268,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5e1d <.literal4+0x301>
+ .byte 224,7 // loopne 6b29 <.literal4+0x301>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19472,7 +23280,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5e39 <.literal4+0x31d>
+ .byte 224,7 // loopne 6b45 <.literal4+0x31d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19483,7 +23291,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 5e8e <.literal4+0x372>
+ .byte 124,66 // jl 6b9a <.literal4+0x372>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -19509,7 +23317,7 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 5ef1 <.literal4+0x3d5>
+ .byte 112,65 // jo 6bfd <.literal4+0x3d5>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
@@ -19523,7 +23331,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 5f27 <.literal4+0x40b>
+ .byte 127,71 // jg 6c33 <.literal4+0x40b>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -19630,6 +23438,25 @@ BALIGN4
.byte 170 // stos %al,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
.byte 190,114,28,199,62 // mov $0x3ec71c72,%esi
+ .byte 114,249 // jb 6d07 <.literal4+0x4df>
+ .byte 127,63 // jg 6d4f <_sk_clut_4D_hsw+0xdc5>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 114,249 // jb 6d17 <.literal4+0x4ef>
+ .byte 127,63 // jg 6d5f <_sk_clut_4D_hsw+0xdd5>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128 // .byte 0x80
+ .byte 63 // (bad)
BALIGN32
.byte 255,0 // incl (%rax)
@@ -19650,16 +23477,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006028 <_sk_callback_hsw+0xa00064e>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006d68 <_sk_clut_4D_hsw+0xa000dde>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006030 <_sk_callback_hsw+0x12000656>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006d70 <_sk_clut_4D_hsw+0x12000de6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006038 <_sk_callback_hsw+0x1a00065e>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006d78 <_sk_clut_4D_hsw+0x1a000dee>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006040 <_sk_callback_hsw+0x3000666>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006d80 <_sk_clut_4D_hsw+0x3000df6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19702,16 +23529,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006088 <_sk_callback_hsw+0xa0006ae>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006dc8 <_sk_clut_4D_hsw+0xa000e3e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006090 <_sk_callback_hsw+0x120006b6>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006dd0 <_sk_clut_4D_hsw+0x12000e46>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006098 <_sk_callback_hsw+0x1a0006be>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006dd8 <_sk_clut_4D_hsw+0x1a000e4e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30060a0 <_sk_callback_hsw+0x30006c6>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006de0 <_sk_clut_4D_hsw+0x3000e56>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19754,16 +23581,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_hsw+0xa00070e>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006e28 <_sk_clut_4D_hsw+0xa000e9e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120060f0 <_sk_callback_hsw+0x12000716>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006e30 <_sk_clut_4D_hsw+0x12000ea6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0060f8 <_sk_callback_hsw+0x1a00071e>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006e38 <_sk_clut_4D_hsw+0x1a000eae>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006100 <_sk_callback_hsw+0x3000726>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006e40 <_sk_clut_4D_hsw+0x3000eb6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19806,16 +23633,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006148 <_sk_callback_hsw+0xa00076e>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006e88 <_sk_clut_4D_hsw+0xa000efe>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006150 <_sk_callback_hsw+0x12000776>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006e90 <_sk_clut_4D_hsw+0x12000f06>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006158 <_sk_callback_hsw+0x1a00077e>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006e98 <_sk_clut_4D_hsw+0x1a000f0e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006160 <_sk_callback_hsw+0x3000786>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006ea0 <_sk_clut_4D_hsw+0x3000f16>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19858,16 +23685,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0061a8 <_sk_callback_hsw+0xa0007ce>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006ee8 <_sk_clut_4D_hsw+0xa000f5e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120061b0 <_sk_callback_hsw+0x120007d6>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006ef0 <_sk_clut_4D_hsw+0x12000f66>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0061b8 <_sk_callback_hsw+0x1a0007de>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006ef8 <_sk_clut_4D_hsw+0x1a000f6e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30061c0 <_sk_callback_hsw+0x30007e6>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006f00 <_sk_clut_4D_hsw+0x3000f76>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19910,16 +23737,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006208 <_sk_callback_hsw+0xa00082e>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006f48 <_sk_clut_4D_hsw+0xa000fbe>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006210 <_sk_callback_hsw+0x12000836>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006f50 <_sk_clut_4D_hsw+0x12000fc6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006218 <_sk_callback_hsw+0x1a00083e>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006f58 <_sk_clut_4D_hsw+0x1a000fce>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006220 <_sk_callback_hsw+0x3000846>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006f60 <_sk_clut_4D_hsw+0x3000fd6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19962,16 +23789,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006268 <_sk_callback_hsw+0xa00088e>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006fa8 <_sk_clut_4D_hsw+0xa00101e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006270 <_sk_callback_hsw+0x12000896>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006fb0 <_sk_clut_4D_hsw+0x12001026>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006278 <_sk_callback_hsw+0x1a00089e>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006fb8 <_sk_clut_4D_hsw+0x1a00102e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006280 <_sk_callback_hsw+0x30008a6>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006fc0 <_sk_clut_4D_hsw+0x3001036>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -20014,16 +23841,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0062c8 <_sk_callback_hsw+0xa0008ee>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a007008 <_sk_clut_4D_hsw+0xa00107e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120062d0 <_sk_callback_hsw+0x120008f6>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12007010 <_sk_clut_4D_hsw+0x12001086>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0062d8 <_sk_callback_hsw+0x1a0008fe>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a007018 <_sk_clut_4D_hsw+0x1a00108e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30062e0 <_sk_callback_hsw+0x3000906>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3007020 <_sk_clut_4D_hsw+0x3001096>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -20213,7 +24040,7 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,228,122,0,0 // vbroadcastss 0x7ae4(%rip),%ymm1 # 7bb4 <_sk_callback_avx+0x144>
+ .byte 196,226,125,24,13,236,172,0,0 // vbroadcastss 0xacec(%rip),%ymm1 # adbc <_sk_clut_4D_avx+0x2125>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -20222,7 +24049,7 @@ _sk_seed_shader_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,190,122,0,0 // vbroadcastss 0x7abe(%rip),%ymm2 # 7bb8 <_sk_callback_avx+0x148>
+ .byte 196,226,125,24,21,198,172,0,0 // vbroadcastss 0xacc6(%rip),%ymm2 # adc0 <_sk_clut_4D_avx+0x2129>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -20246,7 +24073,7 @@ _sk_dither_avx:
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,103,122,0,0 // vbroadcastss 0x7a67(%rip),%ymm11 # 7bbc <_sk_callback_avx+0x14c>
+ .byte 196,98,125,24,29,111,172,0,0 // vbroadcastss 0xac6f(%rip),%ymm11 # adc4 <_sk_clut_4D_avx+0x212d>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -20257,8 +24084,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,40,122,0,0 // vbroadcastss 0x7a28(%rip),%ymm12 # 7bc0 <_sk_callback_avx+0x150>
- .byte 196,98,125,24,45,35,122,0,0 // vbroadcastss 0x7a23(%rip),%ymm13 # 7bc4 <_sk_callback_avx+0x154>
+ .byte 196,98,125,24,37,48,172,0,0 // vbroadcastss 0xac30(%rip),%ymm12 # adc8 <_sk_clut_4D_avx+0x2131>
+ .byte 196,98,125,24,45,43,172,0,0 // vbroadcastss 0xac2b(%rip),%ymm13 # adcc <_sk_clut_4D_avx+0x2135>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -20285,9 +24112,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,142,121,0,0 // vbroadcastss 0x798e(%rip),%ymm9 # 7bc8 <_sk_callback_avx+0x158>
+ .byte 196,98,125,24,13,150,171,0,0 // vbroadcastss 0xab96(%rip),%ymm9 # add0 <_sk_clut_4D_avx+0x2139>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,132,121,0,0 // vbroadcastss 0x7984(%rip),%ymm9 # 7bcc <_sk_callback_avx+0x15c>
+ .byte 196,98,125,24,13,140,171,0,0 // vbroadcastss 0xab8c(%rip),%ymm9 # add4 <_sk_clut_4D_avx+0x213d>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -20321,7 +24148,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,36,121,0,0 // vbroadcastss 0x7924(%rip),%ymm3 # 7bd0 <_sk_callback_avx+0x160>
+ .byte 196,226,125,24,29,44,171,0,0 // vbroadcastss 0xab2c(%rip),%ymm3 # add8 <_sk_clut_4D_avx+0x2141>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -20332,7 +24159,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,15,121,0,0 // vbroadcastss 0x790f(%rip),%ymm0 # 7bd4 <_sk_callback_avx+0x164>
+ .byte 196,226,125,24,5,23,171,0,0 // vbroadcastss 0xab17(%rip),%ymm0 # addc <_sk_clut_4D_avx+0x2145>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -20378,7 +24205,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,178,120,0,0 // vbroadcastss 0x78b2(%rip),%ymm8 # 7bd8 <_sk_callback_avx+0x168>
+ .byte 196,98,125,24,5,186,170,0,0 // vbroadcastss 0xaaba(%rip),%ymm8 # ade0 <_sk_clut_4D_avx+0x2149>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -20399,7 +24226,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,116,120,0,0 // vbroadcastss 0x7874(%rip),%ymm9 # 7bdc <_sk_callback_avx+0x16c>
+ .byte 196,98,125,24,13,124,170,0,0 // vbroadcastss 0xaa7c(%rip),%ymm9 # ade4 <_sk_clut_4D_avx+0x214d>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -20441,7 +24268,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,19,120,0,0 // vbroadcastss 0x7813(%rip),%ymm8 # 7be0 <_sk_callback_avx+0x170>
+ .byte 196,98,125,24,5,27,170,0,0 // vbroadcastss 0xaa1b(%rip),%ymm8 # ade8 <_sk_clut_4D_avx+0x2151>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -20454,7 +24281,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,246,119,0,0 // vbroadcastss 0x77f6(%rip),%ymm0 # 7be4 <_sk_callback_avx+0x174>
+ .byte 196,226,125,24,5,254,169,0,0 // vbroadcastss 0xa9fe(%rip),%ymm0 # adec <_sk_clut_4D_avx+0x2155>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -20467,7 +24294,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,217,119,0,0 // vbroadcastss 0x77d9(%rip),%ymm8 # 7be8 <_sk_callback_avx+0x178>
+ .byte 196,98,125,24,5,225,169,0,0 // vbroadcastss 0xa9e1(%rip),%ymm8 # adf0 <_sk_clut_4D_avx+0x2159>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -20484,7 +24311,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,172,119,0,0 // vbroadcastss 0x77ac(%rip),%ymm8 # 7bec <_sk_callback_avx+0x17c>
+ .byte 196,98,125,24,5,180,169,0,0 // vbroadcastss 0xa9b4(%rip),%ymm8 # adf4 <_sk_clut_4D_avx+0x215d>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -20512,7 +24339,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,107,119,0,0 // vbroadcastss 0x776b(%rip),%ymm8 # 7bf0 <_sk_callback_avx+0x180>
+ .byte 196,98,125,24,5,115,169,0,0 // vbroadcastss 0xa973(%rip),%ymm8 # adf8 <_sk_clut_4D_avx+0x2161>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20572,7 +24399,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,186,118,0,0 // vbroadcastss 0x76ba(%rip),%ymm8 # 7bf4 <_sk_callback_avx+0x184>
+ .byte 196,98,125,24,5,194,168,0,0 // vbroadcastss 0xa8c2(%rip),%ymm8 # adfc <_sk_clut_4D_avx+0x2165>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20609,7 +24436,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,58,118,0,0 // vbroadcastss 0x763a(%rip),%ymm8 # 7bf8 <_sk_callback_avx+0x188>
+ .byte 196,98,125,24,5,66,168,0,0 // vbroadcastss 0xa842(%rip),%ymm8 # ae00 <_sk_clut_4D_avx+0x2169>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20635,7 +24462,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,230,117,0,0 // vbroadcastss 0x75e6(%rip),%ymm8 # 7bfc <_sk_callback_avx+0x18c>
+ .byte 196,98,125,24,5,238,167,0,0 // vbroadcastss 0xa7ee(%rip),%ymm8 # ae04 <_sk_clut_4D_avx+0x216d>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20664,7 +24491,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,134,117,0,0 // vbroadcastss 0x7586(%rip),%ymm8 # 7c00 <_sk_callback_avx+0x190>
+ .byte 196,98,125,24,5,142,167,0,0 // vbroadcastss 0xa78e(%rip),%ymm8 # ae08 <_sk_clut_4D_avx+0x2171>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20687,7 +24514,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,65,117,0,0 // vbroadcastss 0x7541(%rip),%ymm8 # 7c04 <_sk_callback_avx+0x194>
+ .byte 196,98,125,24,5,73,167,0,0 // vbroadcastss 0xa749(%rip),%ymm8 # ae0c <_sk_clut_4D_avx+0x2175>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20698,7 +24525,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,44,117,0,0 // vbroadcastss 0x752c(%rip),%ymm8 # 7c08 <_sk_callback_avx+0x198>
+ .byte 196,98,125,24,5,52,167,0,0 // vbroadcastss 0xa734(%rip),%ymm8 # ae10 <_sk_clut_4D_avx+0x2179>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -20760,7 +24587,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,40,116,0,0 // vbroadcastss 0x7428(%rip),%ymm9 # 7c0c <_sk_callback_avx+0x19c>
+ .byte 196,98,125,24,13,48,166,0,0 // vbroadcastss 0xa630(%rip),%ymm9 # ae14 <_sk_clut_4D_avx+0x217d>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -20817,7 +24644,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,58,115,0,0 // vbroadcastss 0x733a(%rip),%ymm8 # 7c10 <_sk_callback_avx+0x1a0>
+ .byte 196,98,125,24,5,66,165,0,0 // vbroadcastss 0xa542(%rip),%ymm8 # ae18 <_sk_clut_4D_avx+0x2181>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20872,7 +24699,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,99,114,0,0 // vbroadcastss 0x7263(%rip),%ymm8 # 7c14 <_sk_callback_avx+0x1a4>
+ .byte 196,98,125,24,5,107,164,0,0 // vbroadcastss 0xa46b(%rip),%ymm8 # ae1c <_sk_clut_4D_avx+0x2185>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20938,10 +24765,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,90,113,0,0 // vbroadcastss 0x715a(%rip),%ymm11 # 7c1c <_sk_callback_avx+0x1ac>
+ .byte 196,98,125,24,29,98,163,0,0 // vbroadcastss 0xa362(%rip),%ymm11 # ae24 <_sk_clut_4D_avx+0x218d>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,75,113,0,0 // vbroadcastss 0x714b(%rip),%ymm13 # 7c20 <_sk_callback_avx+0x1b0>
+ .byte 196,98,125,24,45,83,163,0,0 // vbroadcastss 0xa353(%rip),%ymm13 # ae28 <_sk_clut_4D_avx+0x2191>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -20952,7 +24779,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,9,113,0,0 // vbroadcastss 0x7109(%rip),%ymm8 # 7c18 <_sk_callback_avx+0x1a8>
+ .byte 196,98,125,24,5,17,163,0,0 // vbroadcastss 0xa311(%rip),%ymm8 # ae20 <_sk_clut_4D_avx+0x2189>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -21079,12 +24906,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,216,110,0,0 // vbroadcastss 0x6ed8(%rip),%ymm14 # 7c24 <_sk_callback_avx+0x1b4>
+ .byte 196,98,125,24,53,224,160,0,0 // vbroadcastss 0xa0e0(%rip),%ymm14 # ae2c <_sk_clut_4D_avx+0x2195>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,206,110,0,0 // vbroadcastss 0x6ece(%rip),%ymm15 # 7c28 <_sk_callback_avx+0x1b8>
+ .byte 196,98,125,24,61,214,160,0,0 // vbroadcastss 0xa0d6(%rip),%ymm15 # ae30 <_sk_clut_4D_avx+0x2199>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,191,110,0,0 // vbroadcastss 0x6ebf(%rip),%ymm0 # 7c2c <_sk_callback_avx+0x1bc>
+ .byte 196,226,125,24,5,199,160,0,0 // vbroadcastss 0xa0c7(%rip),%ymm0 # ae34 <_sk_clut_4D_avx+0x219d>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -21145,7 +24972,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,152,109,0,0 // vbroadcastss 0x6d98(%rip),%ymm8 # 7c30 <_sk_callback_avx+0x1c0>
+ .byte 196,98,125,24,5,160,159,0,0 // vbroadcastss 0x9fa0(%rip),%ymm8 # ae38 <_sk_clut_4D_avx+0x21a1>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -21202,12 +25029,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,166,108,0,0 // vbroadcastss 0x6ca6(%rip),%ymm14 # 7c34 <_sk_callback_avx+0x1c4>
+ .byte 196,98,125,24,53,174,158,0,0 // vbroadcastss 0x9eae(%rip),%ymm14 # ae3c <_sk_clut_4D_avx+0x21a5>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,156,108,0,0 // vbroadcastss 0x6c9c(%rip),%ymm15 # 7c38 <_sk_callback_avx+0x1c8>
+ .byte 196,98,125,24,61,164,158,0,0 // vbroadcastss 0x9ea4(%rip),%ymm15 # ae40 <_sk_clut_4D_avx+0x21a9>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,141,108,0,0 // vbroadcastss 0x6c8d(%rip),%ymm0 # 7c3c <_sk_callback_avx+0x1cc>
+ .byte 196,226,125,24,5,149,158,0,0 // vbroadcastss 0x9e95(%rip),%ymm0 # ae44 <_sk_clut_4D_avx+0x21ad>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -21268,7 +25095,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,102,107,0,0 // vbroadcastss 0x6b66(%rip),%ymm8 # 7c40 <_sk_callback_avx+0x1d0>
+ .byte 196,98,125,24,5,110,157,0,0 // vbroadcastss 0x9d6e(%rip),%ymm8 # ae48 <_sk_clut_4D_avx+0x21b1>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -21297,12 +25124,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,252,106,0,0 // vbroadcastss 0x6afc(%rip),%ymm13 # 7c44 <_sk_callback_avx+0x1d4>
+ .byte 196,98,125,24,45,4,157,0,0 // vbroadcastss 0x9d04(%rip),%ymm13 # ae4c <_sk_clut_4D_avx+0x21b5>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,242,106,0,0 // vbroadcastss 0x6af2(%rip),%ymm14 # 7c48 <_sk_callback_avx+0x1d8>
+ .byte 196,98,125,24,53,250,156,0,0 // vbroadcastss 0x9cfa(%rip),%ymm14 # ae50 <_sk_clut_4D_avx+0x21b9>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,227,106,0,0 // vbroadcastss 0x6ae3(%rip),%ymm15 # 7c4c <_sk_callback_avx+0x1dc>
+ .byte 196,98,125,24,61,235,156,0,0 // vbroadcastss 0x9ceb(%rip),%ymm15 # ae54 <_sk_clut_4D_avx+0x21bd>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -21365,7 +25192,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,170,105,0,0 // vbroadcastss 0x69aa(%rip),%ymm0 # 7c50 <_sk_callback_avx+0x1e0>
+ .byte 196,226,125,24,5,178,155,0,0 // vbroadcastss 0x9bb2(%rip),%ymm0 # ae58 <_sk_clut_4D_avx+0x21c1>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -21395,12 +25222,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,60,105,0,0 // vbroadcastss 0x693c(%rip),%ymm13 # 7c54 <_sk_callback_avx+0x1e4>
+ .byte 196,98,125,24,45,68,155,0,0 // vbroadcastss 0x9b44(%rip),%ymm13 # ae5c <_sk_clut_4D_avx+0x21c5>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,50,105,0,0 // vbroadcastss 0x6932(%rip),%ymm14 # 7c58 <_sk_callback_avx+0x1e8>
+ .byte 196,98,125,24,53,58,155,0,0 // vbroadcastss 0x9b3a(%rip),%ymm14 # ae60 <_sk_clut_4D_avx+0x21c9>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,35,105,0,0 // vbroadcastss 0x6923(%rip),%ymm15 # 7c5c <_sk_callback_avx+0x1ec>
+ .byte 196,98,125,24,61,43,155,0,0 // vbroadcastss 0x9b2b(%rip),%ymm15 # ae64 <_sk_clut_4D_avx+0x21cd>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -21463,7 +25290,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,234,103,0,0 // vbroadcastss 0x67ea(%rip),%ymm0 # 7c60 <_sk_callback_avx+0x1f0>
+ .byte 196,226,125,24,5,242,153,0,0 // vbroadcastss 0x99f2(%rip),%ymm0 # ae68 <_sk_clut_4D_avx+0x21d1>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -21499,7 +25326,7 @@ _sk_srcover_rgba_8888_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,41,1,0,0 // jne 1611 <_sk_srcover_rgba_8888_avx+0x150>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,13,140,109,0,0 // vmovaps 0x6d8c(%rip),%ymm9 # 8280 <_sk_callback_avx+0x810>
+ .byte 197,124,40,13,172,159,0,0 // vmovaps 0x9fac(%rip),%ymm9 # b4a0 <_sk_clut_4D_avx+0x2809>
.byte 196,193,68,84,225 // vandps %ymm9,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
@@ -21517,9 +25344,9 @@ _sk_srcover_rgba_8888_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,53,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,15,103,0,0 // vbroadcastss 0x670f(%rip),%ymm8 # 7c64 <_sk_callback_avx+0x1f4>
+ .byte 196,98,125,24,5,23,153,0,0 // vbroadcastss 0x9917(%rip),%ymm8 # ae6c <_sk_clut_4D_avx+0x21d5>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,6,103,0,0 // vbroadcastss 0x6706(%rip),%ymm9 # 7c68 <_sk_callback_avx+0x1f8>
+ .byte 196,98,125,24,13,14,153,0,0 // vbroadcastss 0x990e(%rip),%ymm9 # ae70 <_sk_clut_4D_avx+0x21d9>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -21564,9 +25391,9 @@ _sk_srcover_rgba_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,151,106,0,0 // vpshufb 0x6a97(%rip),%xmm4,%xmm5 # 80d0 <_sk_callback_avx+0x660>
+ .byte 196,226,89,0,45,199,156,0,0 // vpshufb 0x9cc7(%rip),%xmm4,%xmm5 # b300 <_sk_clut_4D_avx+0x2669>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,153,106,0,0 // vpshufb 0x6a99(%rip),%xmm4,%xmm4 # 80e0 <_sk_callback_avx+0x670>
+ .byte 196,226,89,0,37,201,156,0,0 // vpshufb 0x9cc9(%rip),%xmm4,%xmm4 # b310 <_sk_clut_4D_avx+0x2679>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
@@ -21578,9 +25405,9 @@ _sk_srcover_rgba_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,76,106,0,0 // vpshufb 0x6a4c(%rip),%xmm9,%xmm10 # 80d0 <_sk_callback_avx+0x660>
+ .byte 196,98,49,0,21,124,156,0,0 // vpshufb 0x9c7c(%rip),%xmm9,%xmm10 # b300 <_sk_clut_4D_avx+0x2669>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,78,106,0,0 // vpshufb 0x6a4e(%rip),%xmm9,%xmm9 # 80e0 <_sk_callback_avx+0x670>
+ .byte 196,98,49,0,13,126,156,0,0 // vpshufb 0x9c7e(%rip),%xmm9,%xmm9 # b310 <_sk_clut_4D_avx+0x2679>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
@@ -21602,7 +25429,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,159,101,0,0 // vbroadcastss 0x659f(%rip),%ymm8 # 7c6c <_sk_callback_avx+0x1fc>
+ .byte 196,98,125,24,5,167,151,0,0 // vbroadcastss 0x97a7(%rip),%ymm8 # ae74 <_sk_clut_4D_avx+0x21dd>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -21614,7 +25441,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,130,101,0,0 // vbroadcastss 0x6582(%rip),%ymm8 # 7c70 <_sk_callback_avx+0x200>
+ .byte 196,98,125,24,5,138,151,0,0 // vbroadcastss 0x978a(%rip),%ymm8 # ae78 <_sk_clut_4D_avx+0x21e1>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -21626,7 +25453,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,104,101,0,0 // vbroadcastss 0x6568(%rip),%ymm8 # 7c74 <_sk_callback_avx+0x204>
+ .byte 196,98,125,24,5,112,151,0,0 // vbroadcastss 0x9770(%rip),%ymm8 # ae7c <_sk_clut_4D_avx+0x21e5>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -21659,7 +25486,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,39,101,0,0 // vbroadcastss 0x6527(%rip),%ymm8 # 7c78 <_sk_callback_avx+0x208>
+ .byte 196,98,125,24,5,47,151,0,0 // vbroadcastss 0x972f(%rip),%ymm8 # ae80 <_sk_clut_4D_avx+0x21e9>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -21715,7 +25542,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,187,100,0,0 // vbroadcastss 0x64bb(%rip),%ymm10 # 7c7c <_sk_callback_avx+0x20c>
+ .byte 196,98,125,24,21,195,150,0,0 // vbroadcastss 0x96c3(%rip),%ymm10 # ae84 <_sk_clut_4D_avx+0x21ed>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -21728,17 +25555,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,156,100,0,0 // vbroadcastss 0x649c(%rip),%ymm8 # 7c80 <_sk_callback_avx+0x210>
+ .byte 196,98,125,24,5,164,150,0,0 // vbroadcastss 0x96a4(%rip),%ymm8 # ae88 <_sk_clut_4D_avx+0x21f1>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,142,100,0,0 // vbroadcastss 0x648e(%rip),%ymm11 # 7c84 <_sk_callback_avx+0x214>
+ .byte 196,98,125,24,29,150,150,0,0 // vbroadcastss 0x9696(%rip),%ymm11 # ae8c <_sk_clut_4D_avx+0x21f5>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,132,100,0,0 // vbroadcastss 0x6484(%rip),%ymm13 # 7c88 <_sk_callback_avx+0x218>
+ .byte 196,98,125,24,45,140,150,0,0 // vbroadcastss 0x968c(%rip),%ymm13 # ae90 <_sk_clut_4D_avx+0x21f9>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,117,100,0,0 // vbroadcastss 0x6475(%rip),%ymm12 # 7c8c <_sk_callback_avx+0x21c>
+ .byte 196,98,125,24,37,125,150,0,0 // vbroadcastss 0x967d(%rip),%ymm12 # ae94 <_sk_clut_4D_avx+0x21fd>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,107,100,0,0 // vbroadcastss 0x646b(%rip),%ymm14 # 7c90 <_sk_callback_avx+0x220>
+ .byte 196,98,125,24,53,115,150,0,0 // vbroadcastss 0x9673(%rip),%ymm14 # ae98 <_sk_clut_4D_avx+0x2201>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -21764,17 +25591,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,4,100,0,0 // vbroadcastss 0x6404(%rip),%ymm8 # 7c94 <_sk_callback_avx+0x224>
+ .byte 196,98,125,24,5,12,150,0,0 // vbroadcastss 0x960c(%rip),%ymm8 # ae9c <_sk_clut_4D_avx+0x2205>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,246,99,0,0 // vbroadcastss 0x63f6(%rip),%ymm11 # 7c98 <_sk_callback_avx+0x228>
+ .byte 196,98,125,24,29,254,149,0,0 // vbroadcastss 0x95fe(%rip),%ymm11 # aea0 <_sk_clut_4D_avx+0x2209>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,236,99,0,0 // vbroadcastss 0x63ec(%rip),%ymm13 # 7c9c <_sk_callback_avx+0x22c>
+ .byte 196,98,125,24,45,244,149,0,0 // vbroadcastss 0x95f4(%rip),%ymm13 # aea4 <_sk_clut_4D_avx+0x220d>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,221,99,0,0 // vbroadcastss 0x63dd(%rip),%ymm12 # 7ca0 <_sk_callback_avx+0x230>
+ .byte 196,98,125,24,37,229,149,0,0 // vbroadcastss 0x95e5(%rip),%ymm12 # aea8 <_sk_clut_4D_avx+0x2211>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,211,99,0,0 // vbroadcastss 0x63d3(%rip),%ymm14 # 7ca4 <_sk_callback_avx+0x234>
+ .byte 196,98,125,24,53,219,149,0,0 // vbroadcastss 0x95db(%rip),%ymm14 # aeac <_sk_clut_4D_avx+0x2215>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -21801,20 +25628,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,104,99,0,0 // vbroadcastss 0x6368(%rip),%ymm8 # 7ca8 <_sk_callback_avx+0x238>
+ .byte 196,98,125,24,5,112,149,0,0 // vbroadcastss 0x9570(%rip),%ymm8 # aeb0 <_sk_clut_4D_avx+0x2219>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,94,99,0,0 // vbroadcastss 0x635e(%rip),%ymm11 # 7cac <_sk_callback_avx+0x23c>
+ .byte 196,98,125,24,29,102,149,0,0 // vbroadcastss 0x9566(%rip),%ymm11 # aeb4 <_sk_clut_4D_avx+0x221d>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,84,99,0,0 // vbroadcastss 0x6354(%rip),%ymm13 # 7cb0 <_sk_callback_avx+0x240>
+ .byte 196,98,125,24,45,92,149,0,0 // vbroadcastss 0x955c(%rip),%ymm13 # aeb8 <_sk_clut_4D_avx+0x2221>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,69,99,0,0 // vbroadcastss 0x6345(%rip),%ymm14 # 7cb4 <_sk_callback_avx+0x244>
+ .byte 196,98,125,24,53,77,149,0,0 // vbroadcastss 0x954d(%rip),%ymm14 # aebc <_sk_clut_4D_avx+0x2225>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,59,99,0,0 // vbroadcastss 0x633b(%rip),%ymm15 # 7cb8 <_sk_callback_avx+0x248>
+ .byte 196,98,125,24,61,67,149,0,0 // vbroadcastss 0x9543(%rip),%ymm15 # aec0 <_sk_clut_4D_avx+0x2229>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,39,99,0,0 // vbroadcastss 0x6327(%rip),%ymm12 # 7cbc <_sk_callback_avx+0x24c>
+ .byte 196,98,125,24,37,47,149,0,0 // vbroadcastss 0x952f(%rip),%ymm12 # aec4 <_sk_clut_4D_avx+0x222d>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -21851,7 +25678,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,141,98,0,0 // vbroadcastss 0x628d(%rip),%ymm11 # 7cc0 <_sk_callback_avx+0x250>
+ .byte 196,98,125,24,29,149,148,0,0 // vbroadcastss 0x9495(%rip),%ymm11 # aec8 <_sk_clut_4D_avx+0x2231>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -21861,19 +25688,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,102,98,0,0 // vbroadcastss 0x6266(%rip),%ymm11 # 7ccc <_sk_callback_avx+0x25c>
+ .byte 196,98,125,24,29,110,148,0,0 // vbroadcastss 0x946e(%rip),%ymm11 # aed4 <_sk_clut_4D_avx+0x223d>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,84,98,0,0 // vbroadcastss 0x6254(%rip),%ymm11 # 7cc8 <_sk_callback_avx+0x258>
+ .byte 196,98,125,24,29,92,148,0,0 // vbroadcastss 0x945c(%rip),%ymm11 # aed0 <_sk_clut_4D_avx+0x2239>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,60,98,0,0 // vbroadcastss 0x623c(%rip),%ymm2 # 7cc4 <_sk_callback_avx+0x254>
+ .byte 196,226,125,24,21,68,148,0,0 // vbroadcastss 0x9444(%rip),%ymm2 # aecc <_sk_clut_4D_avx+0x2235>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,35,98,0,0 // vbroadcastss 0x6223(%rip),%ymm12 # 7cd4 <_sk_callback_avx+0x264>
+ .byte 196,98,125,24,37,43,148,0,0 // vbroadcastss 0x942b(%rip),%ymm12 # aedc <_sk_clut_4D_avx+0x2245>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -21883,7 +25710,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,230,97,0,0 // vbroadcastss 0x61e6(%rip),%ymm8 # 7cd0 <_sk_callback_avx+0x260>
+ .byte 196,98,125,24,5,238,147,0,0 // vbroadcastss 0x93ee(%rip),%ymm8 # aed8 <_sk_clut_4D_avx+0x2241>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21900,7 +25727,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,179,97,0,0 // vbroadcastss 0x61b3(%rip),%ymm8 # 7cd8 <_sk_callback_avx+0x268>
+ .byte 196,98,125,24,5,187,147,0,0 // vbroadcastss 0x93bb(%rip),%ymm8 # aee0 <_sk_clut_4D_avx+0x2249>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -21908,23 +25735,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,141,97,0,0 // vbroadcastss 0x618d(%rip),%ymm11 # 7cdc <_sk_callback_avx+0x26c>
+ .byte 196,98,125,24,29,149,147,0,0 // vbroadcastss 0x9395(%rip),%ymm11 # aee4 <_sk_clut_4D_avx+0x224d>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,119,97,0,0 // vbroadcastss 0x6177(%rip),%ymm12 # 7ce4 <_sk_callback_avx+0x274>
+ .byte 196,98,125,24,37,127,147,0,0 // vbroadcastss 0x937f(%rip),%ymm12 # aeec <_sk_clut_4D_avx+0x2255>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,109,97,0,0 // vbroadcastss 0x616d(%rip),%ymm13 # 7ce8 <_sk_callback_avx+0x278>
+ .byte 196,98,125,24,45,117,147,0,0 // vbroadcastss 0x9375(%rip),%ymm13 # aef0 <_sk_clut_4D_avx+0x2259>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,78,97,0,0 // vbroadcastss 0x614e(%rip),%ymm1 # 7ce0 <_sk_callback_avx+0x270>
+ .byte 196,226,125,24,13,86,147,0,0 // vbroadcastss 0x9356(%rip),%ymm1 # aee8 <_sk_clut_4D_avx+0x2251>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,57,97,0,0 // vbroadcastss 0x6139(%rip),%ymm14 # 7cec <_sk_callback_avx+0x27c>
+ .byte 196,98,125,24,53,65,147,0,0 // vbroadcastss 0x9341(%rip),%ymm14 # aef4 <_sk_clut_4D_avx+0x225d>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -21943,7 +25770,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,219,96,0,0 // vbroadcastss 0x60db(%rip),%ymm0 # 7cf0 <_sk_callback_avx+0x280>
+ .byte 196,226,125,24,5,227,146,0,0 // vbroadcastss 0x92e3(%rip),%ymm0 # aef8 <_sk_clut_4D_avx+0x2261>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -22000,13 +25827,13 @@ _sk_scale_u8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,75 // jne 1d1c <_sk_scale_u8_avx+0x64>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,17,100,0,0 // vpand 0x6411(%rip),%xmm8,%xmm8 # 80f0 <_sk_callback_avx+0x680>
+ .byte 197,57,219,5,65,150,0,0 // vpand 0x9641(%rip),%xmm8,%xmm8 # b320 <_sk_clut_4D_avx+0x2689>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,242,95,0,0 // vbroadcastss 0x5ff2(%rip),%ymm9 # 7cf4 <_sk_callback_avx+0x284>
+ .byte 196,98,125,24,13,250,145,0,0 // vbroadcastss 0x91fa(%rip),%ymm9 # aefc <_sk_clut_4D_avx+0x2265>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -22104,13 +25931,13 @@ _sk_lerp_u8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,111 // jne 1e9b <_sk_lerp_u8_avx+0x88>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,198,98,0,0 // vpand 0x62c6(%rip),%xmm8,%xmm8 # 8100 <_sk_callback_avx+0x690>
+ .byte 197,57,219,5,246,148,0,0 // vpand 0x94f6(%rip),%xmm8,%xmm8 # b330 <_sk_clut_4D_avx+0x2699>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,155,94,0,0 // vbroadcastss 0x5e9b(%rip),%ymm9 # 7cf8 <_sk_callback_avx+0x288>
+ .byte 196,98,125,24,13,163,144,0,0 // vbroadcastss 0x90a3(%rip),%ymm9 # af00 <_sk_clut_4D_avx+0x2269>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -22167,7 +25994,7 @@ _sk_lerp_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf001f48 <_sk_callback_avx+0xffffffffdeffa4d8>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf001f48 <_sk_clut_4D_avx+0xffffffffdeff92b1>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -22197,20 +26024,20 @@ _sk_lerp_565_avx:
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,100,93,0,0 // vbroadcastss 0x5d64(%rip),%ymm9 # 7cfc <_sk_callback_avx+0x28c>
+ .byte 196,98,125,24,13,108,143,0,0 // vbroadcastss 0x8f6c(%rip),%ymm9 # af04 <_sk_clut_4D_avx+0x226d>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,85,93,0,0 // vbroadcastss 0x5d55(%rip),%ymm10 # 7d00 <_sk_callback_avx+0x290>
+ .byte 196,98,125,24,21,93,143,0,0 // vbroadcastss 0x8f5d(%rip),%ymm10 # af08 <_sk_clut_4D_avx+0x2271>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,75,93,0,0 // vbroadcastss 0x5d4b(%rip),%ymm10 # 7d04 <_sk_callback_avx+0x294>
+ .byte 196,98,125,24,21,83,143,0,0 // vbroadcastss 0x8f53(%rip),%ymm10 # af0c <_sk_clut_4D_avx+0x2275>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,60,93,0,0 // vbroadcastss 0x5d3c(%rip),%ymm11 # 7d08 <_sk_callback_avx+0x298>
+ .byte 196,98,125,24,29,68,143,0,0 // vbroadcastss 0x8f44(%rip),%ymm11 # af10 <_sk_clut_4D_avx+0x2279>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,50,93,0,0 // vbroadcastss 0x5d32(%rip),%ymm11 # 7d0c <_sk_callback_avx+0x29c>
+ .byte 196,98,125,24,29,58,143,0,0 // vbroadcastss 0x8f3a(%rip),%ymm11 # af14 <_sk_clut_4D_avx+0x227d>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,35,93,0,0 // vbroadcastss 0x5d23(%rip),%ymm11 # 7d10 <_sk_callback_avx+0x2a0>
+ .byte 196,98,125,24,29,43,143,0,0 // vbroadcastss 0x8f2b(%rip),%ymm11 # af18 <_sk_clut_4D_avx+0x2281>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
@@ -22291,7 +26118,7 @@ _sk_load_tables_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,248,1,0,0 // jne 2300 <_sk_load_tables_avx+0x218>
.byte 196,65,124,16,18 // vmovups (%r10),%ymm10
- .byte 197,124,40,13,139,97,0,0 // vmovaps 0x618b(%rip),%ymm9 # 82a0 <_sk_callback_avx+0x830>
+ .byte 197,124,40,13,171,147,0,0 // vmovaps 0x93ab(%rip),%ymm9 # b4c0 <_sk_clut_4D_avx+0x2829>
.byte 196,193,44,84,201 // vandps %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,195 // vmovq %xmm0,%r11
@@ -22383,7 +26210,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,38,90,0,0 // vbroadcastss 0x5a26(%rip),%ymm7 # 7d14 <_sk_callback_avx+0x2a4>
+ .byte 196,226,125,24,61,46,140,0,0 // vbroadcastss 0x8c2e(%rip),%ymm7 # af1c <_sk_clut_4D_avx+0x2285>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -22397,9 +26224,9 @@ _sk_load_tables_avx:
.byte 73,211,235 // shr %cl,%r11
.byte 196,193,249,110,195 // vmovq %r11,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,232,93,0,0 // vpshufb 0x5de8(%rip),%xmm0,%xmm1 # 8110 <_sk_callback_avx+0x6a0>
+ .byte 196,226,121,0,13,24,144,0,0 // vpshufb 0x9018(%rip),%xmm0,%xmm1 # b340 <_sk_clut_4D_avx+0x26a9>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,234,93,0,0 // vpshufb 0x5dea(%rip),%xmm0,%xmm0 # 8120 <_sk_callback_avx+0x6b0>
+ .byte 196,226,121,0,5,26,144,0,0 // vpshufb 0x901a(%rip),%xmm0,%xmm0 # b350 <_sk_clut_4D_avx+0x26b9>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,66,125,44,18 // vmaskmovps (%r10),%ymm0,%ymm10
@@ -22429,7 +26256,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,124,93,0,0 // vmovdqa 0x5d7c(%rip),%xmm10 # 8130 <_sk_callback_avx+0x6c0>
+ .byte 197,121,111,21,172,143,0,0 // vmovdqa 0x8fac(%rip),%xmm10 # b360 <_sk_clut_4D_avx+0x26c9>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -22527,7 +26354,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,107,87,0,0 // vbroadcastss 0x576b(%rip),%ymm7 # 7d18 <_sk_callback_avx+0x2a8>
+ .byte 196,226,125,24,61,115,137,0,0 // vbroadcastss 0x8973(%rip),%ymm7 # af20 <_sk_clut_4D_avx+0x2289>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -22590,7 +26417,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,129,90,0,0 // vmovdqa 0x5a81(%rip),%xmm9 # 8140 <_sk_callback_avx+0x6d0>
+ .byte 197,121,111,13,177,140,0,0 // vmovdqa 0x8cb1(%rip),%xmm9 # b370 <_sk_clut_4D_avx+0x26d9>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -22680,7 +26507,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,142,84,0,0 // vbroadcastss 0x548e(%rip),%ymm3 # 7d1c <_sk_callback_avx+0x2ac>
+ .byte 196,226,125,24,29,150,134,0,0 // vbroadcastss 0x8696(%rip),%ymm3 # af24 <_sk_clut_4D_avx+0x228d>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
@@ -22723,7 +26550,7 @@ HIDDEN _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,202,83,0,0 // vbroadcastss 0x53ca(%rip),%ymm8 # 7d20 <_sk_callback_avx+0x2b0>
+ .byte 196,98,125,24,5,210,133,0,0 // vbroadcastss 0x85d2(%rip),%ymm8 # af28 <_sk_clut_4D_avx+0x2291>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -22842,7 +26669,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,116,81,0,0 // vbroadcastss 0x5174(%rip),%ymm9 # 7d24 <_sk_callback_avx+0x2b4>
+ .byte 196,98,125,24,13,124,131,0,0 // vbroadcastss 0x837c(%rip),%ymm9 # af2c <_sk_clut_4D_avx+0x2295>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -22958,7 +26785,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,85,79,0,0 // vbroadcastss 0x4f55(%rip),%ymm9 # 7d28 <_sk_callback_avx+0x2b8>
+ .byte 196,98,125,24,13,93,129,0,0 // vbroadcastss 0x815d(%rip),%ymm9 # af30 <_sk_clut_4D_avx+0x2299>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -23163,36 +26990,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,2,76,0,0 // vbroadcastss 0x4c02(%rip),%ymm12 # 7d2c <_sk_callback_avx+0x2bc>
+ .byte 196,98,125,24,37,10,126,0,0 // vbroadcastss 0x7e0a(%rip),%ymm12 # af34 <_sk_clut_4D_avx+0x229d>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,248,75,0,0 // vbroadcastss 0x4bf8(%rip),%ymm12 # 7d30 <_sk_callback_avx+0x2c0>
+ .byte 196,98,125,24,37,0,126,0,0 // vbroadcastss 0x7e00(%rip),%ymm12 # af38 <_sk_clut_4D_avx+0x22a1>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,238,75,0,0 // vbroadcastss 0x4bee(%rip),%ymm12 # 7d34 <_sk_callback_avx+0x2c4>
+ .byte 196,98,125,24,37,246,125,0,0 // vbroadcastss 0x7df6(%rip),%ymm12 # af3c <_sk_clut_4D_avx+0x22a5>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,228,75,0,0 // vbroadcastss 0x4be4(%rip),%ymm12 # 7d38 <_sk_callback_avx+0x2c8>
+ .byte 196,98,125,24,37,236,125,0,0 // vbroadcastss 0x7dec(%rip),%ymm12 # af40 <_sk_clut_4D_avx+0x22a9>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,218,75,0,0 // vbroadcastss 0x4bda(%rip),%ymm12 # 7d3c <_sk_callback_avx+0x2cc>
+ .byte 196,98,125,24,37,226,125,0,0 // vbroadcastss 0x7de2(%rip),%ymm12 # af44 <_sk_clut_4D_avx+0x22ad>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,203,75,0,0 // vbroadcastss 0x4bcb(%rip),%ymm12 # 7d40 <_sk_callback_avx+0x2d0>
+ .byte 196,98,125,24,37,211,125,0,0 // vbroadcastss 0x7dd3(%rip),%ymm12 # af48 <_sk_clut_4D_avx+0x22b1>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,193,75,0,0 // vbroadcastss 0x4bc1(%rip),%ymm12 # 7d44 <_sk_callback_avx+0x2d4>
+ .byte 196,98,125,24,37,201,125,0,0 // vbroadcastss 0x7dc9(%rip),%ymm12 # af4c <_sk_clut_4D_avx+0x22b5>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,165,75,0,0 // vbroadcastss 0x4ba5(%rip),%ymm11 # 7d48 <_sk_callback_avx+0x2d8>
+ .byte 196,98,125,24,29,173,125,0,0 // vbroadcastss 0x7dad(%rip),%ymm11 # af50 <_sk_clut_4D_avx+0x22b9>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,155,75,0,0 // vbroadcastss 0x4b9b(%rip),%ymm11 # 7d4c <_sk_callback_avx+0x2dc>
+ .byte 196,98,125,24,29,163,125,0,0 // vbroadcastss 0x7da3(%rip),%ymm11 # af54 <_sk_clut_4D_avx+0x22bd>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,140,75,0,0 // vbroadcastss 0x4b8c(%rip),%ymm11 # 7d50 <_sk_callback_avx+0x2e0>
+ .byte 196,98,125,24,29,148,125,0,0 // vbroadcastss 0x7d94(%rip),%ymm11 # af58 <_sk_clut_4D_avx+0x22c1>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,130,75,0,0 // vbroadcastss 0x4b82(%rip),%ymm11 # 7d54 <_sk_callback_avx+0x2e4>
+ .byte 196,98,125,24,29,138,125,0,0 // vbroadcastss 0x7d8a(%rip),%ymm11 # af5c <_sk_clut_4D_avx+0x22c5>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,115,75,0,0 // vbroadcastss 0x4b73(%rip),%ymm10 # 7d58 <_sk_callback_avx+0x2e8>
+ .byte 196,98,125,24,21,123,125,0,0 // vbroadcastss 0x7d7b(%rip),%ymm10 # af60 <_sk_clut_4D_avx+0x22c9>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -23200,7 +27027,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,74,75,0,0 // vbroadcastss 0x4b4a(%rip),%ymm8 # 7d5c <_sk_callback_avx+0x2ec>
+ .byte 196,98,125,24,5,82,125,0,0 // vbroadcastss 0x7d52(%rip),%ymm8 # af64 <_sk_clut_4D_avx+0x22cd>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23222,36 +27049,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,251,74,0,0 // vbroadcastss 0x4afb(%rip),%ymm12 # 7d60 <_sk_callback_avx+0x2f0>
+ .byte 196,98,125,24,37,3,125,0,0 // vbroadcastss 0x7d03(%rip),%ymm12 # af68 <_sk_clut_4D_avx+0x22d1>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,241,74,0,0 // vbroadcastss 0x4af1(%rip),%ymm12 # 7d64 <_sk_callback_avx+0x2f4>
+ .byte 196,98,125,24,37,249,124,0,0 // vbroadcastss 0x7cf9(%rip),%ymm12 # af6c <_sk_clut_4D_avx+0x22d5>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,231,74,0,0 // vbroadcastss 0x4ae7(%rip),%ymm12 # 7d68 <_sk_callback_avx+0x2f8>
+ .byte 196,98,125,24,37,239,124,0,0 // vbroadcastss 0x7cef(%rip),%ymm12 # af70 <_sk_clut_4D_avx+0x22d9>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,221,74,0,0 // vbroadcastss 0x4add(%rip),%ymm12 # 7d6c <_sk_callback_avx+0x2fc>
+ .byte 196,98,125,24,37,229,124,0,0 // vbroadcastss 0x7ce5(%rip),%ymm12 # af74 <_sk_clut_4D_avx+0x22dd>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,211,74,0,0 // vbroadcastss 0x4ad3(%rip),%ymm12 # 7d70 <_sk_callback_avx+0x300>
+ .byte 196,98,125,24,37,219,124,0,0 // vbroadcastss 0x7cdb(%rip),%ymm12 # af78 <_sk_clut_4D_avx+0x22e1>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,196,74,0,0 // vbroadcastss 0x4ac4(%rip),%ymm12 # 7d74 <_sk_callback_avx+0x304>
+ .byte 196,98,125,24,37,204,124,0,0 // vbroadcastss 0x7ccc(%rip),%ymm12 # af7c <_sk_clut_4D_avx+0x22e5>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,186,74,0,0 // vbroadcastss 0x4aba(%rip),%ymm12 # 7d78 <_sk_callback_avx+0x308>
+ .byte 196,98,125,24,37,194,124,0,0 // vbroadcastss 0x7cc2(%rip),%ymm12 # af80 <_sk_clut_4D_avx+0x22e9>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,158,74,0,0 // vbroadcastss 0x4a9e(%rip),%ymm11 # 7d7c <_sk_callback_avx+0x30c>
+ .byte 196,98,125,24,29,166,124,0,0 // vbroadcastss 0x7ca6(%rip),%ymm11 # af84 <_sk_clut_4D_avx+0x22ed>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,148,74,0,0 // vbroadcastss 0x4a94(%rip),%ymm11 # 7d80 <_sk_callback_avx+0x310>
+ .byte 196,98,125,24,29,156,124,0,0 // vbroadcastss 0x7c9c(%rip),%ymm11 # af88 <_sk_clut_4D_avx+0x22f1>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,133,74,0,0 // vbroadcastss 0x4a85(%rip),%ymm11 # 7d84 <_sk_callback_avx+0x314>
+ .byte 196,98,125,24,29,141,124,0,0 // vbroadcastss 0x7c8d(%rip),%ymm11 # af8c <_sk_clut_4D_avx+0x22f5>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,123,74,0,0 // vbroadcastss 0x4a7b(%rip),%ymm11 # 7d88 <_sk_callback_avx+0x318>
+ .byte 196,98,125,24,29,131,124,0,0 // vbroadcastss 0x7c83(%rip),%ymm11 # af90 <_sk_clut_4D_avx+0x22f9>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,108,74,0,0 // vbroadcastss 0x4a6c(%rip),%ymm10 # 7d8c <_sk_callback_avx+0x31c>
+ .byte 196,98,125,24,21,116,124,0,0 // vbroadcastss 0x7c74(%rip),%ymm10 # af94 <_sk_clut_4D_avx+0x22fd>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -23259,7 +27086,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,67,74,0,0 // vbroadcastss 0x4a43(%rip),%ymm8 # 7d90 <_sk_callback_avx+0x320>
+ .byte 196,98,125,24,5,75,124,0,0 // vbroadcastss 0x7c4b(%rip),%ymm8 # af98 <_sk_clut_4D_avx+0x2301>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23281,36 +27108,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,244,73,0,0 // vbroadcastss 0x49f4(%rip),%ymm12 # 7d94 <_sk_callback_avx+0x324>
+ .byte 196,98,125,24,37,252,123,0,0 // vbroadcastss 0x7bfc(%rip),%ymm12 # af9c <_sk_clut_4D_avx+0x2305>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,234,73,0,0 // vbroadcastss 0x49ea(%rip),%ymm12 # 7d98 <_sk_callback_avx+0x328>
+ .byte 196,98,125,24,37,242,123,0,0 // vbroadcastss 0x7bf2(%rip),%ymm12 # afa0 <_sk_clut_4D_avx+0x2309>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,224,73,0,0 // vbroadcastss 0x49e0(%rip),%ymm12 # 7d9c <_sk_callback_avx+0x32c>
+ .byte 196,98,125,24,37,232,123,0,0 // vbroadcastss 0x7be8(%rip),%ymm12 # afa4 <_sk_clut_4D_avx+0x230d>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,214,73,0,0 // vbroadcastss 0x49d6(%rip),%ymm12 # 7da0 <_sk_callback_avx+0x330>
+ .byte 196,98,125,24,37,222,123,0,0 // vbroadcastss 0x7bde(%rip),%ymm12 # afa8 <_sk_clut_4D_avx+0x2311>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,204,73,0,0 // vbroadcastss 0x49cc(%rip),%ymm12 # 7da4 <_sk_callback_avx+0x334>
+ .byte 196,98,125,24,37,212,123,0,0 // vbroadcastss 0x7bd4(%rip),%ymm12 # afac <_sk_clut_4D_avx+0x2315>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,189,73,0,0 // vbroadcastss 0x49bd(%rip),%ymm12 # 7da8 <_sk_callback_avx+0x338>
+ .byte 196,98,125,24,37,197,123,0,0 // vbroadcastss 0x7bc5(%rip),%ymm12 # afb0 <_sk_clut_4D_avx+0x2319>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,179,73,0,0 // vbroadcastss 0x49b3(%rip),%ymm12 # 7dac <_sk_callback_avx+0x33c>
+ .byte 196,98,125,24,37,187,123,0,0 // vbroadcastss 0x7bbb(%rip),%ymm12 # afb4 <_sk_clut_4D_avx+0x231d>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,151,73,0,0 // vbroadcastss 0x4997(%rip),%ymm11 # 7db0 <_sk_callback_avx+0x340>
+ .byte 196,98,125,24,29,159,123,0,0 // vbroadcastss 0x7b9f(%rip),%ymm11 # afb8 <_sk_clut_4D_avx+0x2321>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,141,73,0,0 // vbroadcastss 0x498d(%rip),%ymm11 # 7db4 <_sk_callback_avx+0x344>
+ .byte 196,98,125,24,29,149,123,0,0 // vbroadcastss 0x7b95(%rip),%ymm11 # afbc <_sk_clut_4D_avx+0x2325>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,126,73,0,0 // vbroadcastss 0x497e(%rip),%ymm11 # 7db8 <_sk_callback_avx+0x348>
+ .byte 196,98,125,24,29,134,123,0,0 // vbroadcastss 0x7b86(%rip),%ymm11 # afc0 <_sk_clut_4D_avx+0x2329>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,116,73,0,0 // vbroadcastss 0x4974(%rip),%ymm11 # 7dbc <_sk_callback_avx+0x34c>
+ .byte 196,98,125,24,29,124,123,0,0 // vbroadcastss 0x7b7c(%rip),%ymm11 # afc4 <_sk_clut_4D_avx+0x232d>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,101,73,0,0 // vbroadcastss 0x4965(%rip),%ymm10 # 7dc0 <_sk_callback_avx+0x350>
+ .byte 196,98,125,24,21,109,123,0,0 // vbroadcastss 0x7b6d(%rip),%ymm10 # afc8 <_sk_clut_4D_avx+0x2331>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -23318,7 +27145,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,60,73,0,0 // vbroadcastss 0x493c(%rip),%ymm8 # 7dc4 <_sk_callback_avx+0x354>
+ .byte 196,98,125,24,5,68,123,0,0 // vbroadcastss 0x7b44(%rip),%ymm8 # afcc <_sk_clut_4D_avx+0x2335>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23340,36 +27167,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,237,72,0,0 // vbroadcastss 0x48ed(%rip),%ymm12 # 7dc8 <_sk_callback_avx+0x358>
+ .byte 196,98,125,24,37,245,122,0,0 // vbroadcastss 0x7af5(%rip),%ymm12 # afd0 <_sk_clut_4D_avx+0x2339>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,227,72,0,0 // vbroadcastss 0x48e3(%rip),%ymm12 # 7dcc <_sk_callback_avx+0x35c>
+ .byte 196,98,125,24,37,235,122,0,0 // vbroadcastss 0x7aeb(%rip),%ymm12 # afd4 <_sk_clut_4D_avx+0x233d>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,217,72,0,0 // vbroadcastss 0x48d9(%rip),%ymm12 # 7dd0 <_sk_callback_avx+0x360>
+ .byte 196,98,125,24,37,225,122,0,0 // vbroadcastss 0x7ae1(%rip),%ymm12 # afd8 <_sk_clut_4D_avx+0x2341>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,207,72,0,0 // vbroadcastss 0x48cf(%rip),%ymm12 # 7dd4 <_sk_callback_avx+0x364>
+ .byte 196,98,125,24,37,215,122,0,0 // vbroadcastss 0x7ad7(%rip),%ymm12 # afdc <_sk_clut_4D_avx+0x2345>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,197,72,0,0 // vbroadcastss 0x48c5(%rip),%ymm12 # 7dd8 <_sk_callback_avx+0x368>
+ .byte 196,98,125,24,37,205,122,0,0 // vbroadcastss 0x7acd(%rip),%ymm12 # afe0 <_sk_clut_4D_avx+0x2349>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,182,72,0,0 // vbroadcastss 0x48b6(%rip),%ymm12 # 7ddc <_sk_callback_avx+0x36c>
+ .byte 196,98,125,24,37,190,122,0,0 // vbroadcastss 0x7abe(%rip),%ymm12 # afe4 <_sk_clut_4D_avx+0x234d>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,172,72,0,0 // vbroadcastss 0x48ac(%rip),%ymm12 # 7de0 <_sk_callback_avx+0x370>
+ .byte 196,98,125,24,37,180,122,0,0 // vbroadcastss 0x7ab4(%rip),%ymm12 # afe8 <_sk_clut_4D_avx+0x2351>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,144,72,0,0 // vbroadcastss 0x4890(%rip),%ymm11 # 7de4 <_sk_callback_avx+0x374>
+ .byte 196,98,125,24,29,152,122,0,0 // vbroadcastss 0x7a98(%rip),%ymm11 # afec <_sk_clut_4D_avx+0x2355>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,134,72,0,0 // vbroadcastss 0x4886(%rip),%ymm11 # 7de8 <_sk_callback_avx+0x378>
+ .byte 196,98,125,24,29,142,122,0,0 // vbroadcastss 0x7a8e(%rip),%ymm11 # aff0 <_sk_clut_4D_avx+0x2359>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,119,72,0,0 // vbroadcastss 0x4877(%rip),%ymm11 # 7dec <_sk_callback_avx+0x37c>
+ .byte 196,98,125,24,29,127,122,0,0 // vbroadcastss 0x7a7f(%rip),%ymm11 # aff4 <_sk_clut_4D_avx+0x235d>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,109,72,0,0 // vbroadcastss 0x486d(%rip),%ymm11 # 7df0 <_sk_callback_avx+0x380>
+ .byte 196,98,125,24,29,117,122,0,0 // vbroadcastss 0x7a75(%rip),%ymm11 # aff8 <_sk_clut_4D_avx+0x2361>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,94,72,0,0 // vbroadcastss 0x485e(%rip),%ymm10 # 7df4 <_sk_callback_avx+0x384>
+ .byte 196,98,125,24,21,102,122,0,0 // vbroadcastss 0x7a66(%rip),%ymm10 # affc <_sk_clut_4D_avx+0x2365>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -23377,7 +27204,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,53,72,0,0 // vbroadcastss 0x4835(%rip),%ymm8 # 7df8 <_sk_callback_avx+0x388>
+ .byte 196,98,125,24,5,61,122,0,0 // vbroadcastss 0x7a3d(%rip),%ymm8 # b000 <_sk_clut_4D_avx+0x2369>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23396,34 +27223,34 @@ _sk_gamma_avx:
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
- .byte 196,98,125,24,5,248,71,0,0 // vbroadcastss 0x47f8(%rip),%ymm8 # 7dfc <_sk_callback_avx+0x38c>
+ .byte 196,98,125,24,5,0,122,0,0 // vbroadcastss 0x7a00(%rip),%ymm8 # b004 <_sk_clut_4D_avx+0x236d>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,238,71,0,0 // vbroadcastss 0x47ee(%rip),%ymm9 # 7e00 <_sk_callback_avx+0x390>
+ .byte 196,98,125,24,13,246,121,0,0 // vbroadcastss 0x79f6(%rip),%ymm9 # b008 <_sk_clut_4D_avx+0x2371>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
- .byte 196,226,125,24,37,228,71,0,0 // vbroadcastss 0x47e4(%rip),%ymm4 # 7e04 <_sk_callback_avx+0x394>
+ .byte 196,226,125,24,37,236,121,0,0 // vbroadcastss 0x79ec(%rip),%ymm4 # b00c <_sk_clut_4D_avx+0x2375>
.byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,21,219,71,0,0 // vbroadcastss 0x47db(%rip),%ymm10 # 7e08 <_sk_callback_avx+0x398>
+ .byte 196,98,125,24,21,227,121,0,0 // vbroadcastss 0x79e3(%rip),%ymm10 # b010 <_sk_clut_4D_avx+0x2379>
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,29,209,71,0,0 // vbroadcastss 0x47d1(%rip),%ymm11 # 7e0c <_sk_callback_avx+0x39c>
+ .byte 196,98,125,24,29,217,121,0,0 // vbroadcastss 0x79d9(%rip),%ymm11 # b014 <_sk_clut_4D_avx+0x237d>
.byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
.byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
- .byte 196,98,125,24,37,195,71,0,0 // vbroadcastss 0x47c3(%rip),%ymm12 # 7e10 <_sk_callback_avx+0x3a0>
+ .byte 196,98,125,24,37,203,121,0,0 // vbroadcastss 0x79cb(%rip),%ymm12 # b018 <_sk_clut_4D_avx+0x2381>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,45,185,71,0,0 // vbroadcastss 0x47b9(%rip),%ymm13 # 7e14 <_sk_callback_avx+0x3a4>
+ .byte 196,98,125,24,45,193,121,0,0 // vbroadcastss 0x79c1(%rip),%ymm13 # b01c <_sk_clut_4D_avx+0x2385>
.byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
.byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
.byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
.byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
.byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
.byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
- .byte 196,98,125,24,61,152,71,0,0 // vbroadcastss 0x4798(%rip),%ymm15 # 7e18 <_sk_callback_avx+0x3a8>
+ .byte 196,98,125,24,61,160,121,0,0 // vbroadcastss 0x79a0(%rip),%ymm15 # b020 <_sk_clut_4D_avx+0x2389>
.byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
- .byte 196,226,125,24,29,142,71,0,0 // vbroadcastss 0x478e(%rip),%ymm3 # 7e1c <_sk_callback_avx+0x3ac>
+ .byte 196,226,125,24,29,150,121,0,0 // vbroadcastss 0x7996(%rip),%ymm3 # b024 <_sk_clut_4D_avx+0x238d>
.byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
- .byte 196,226,125,24,21,129,71,0,0 // vbroadcastss 0x4781(%rip),%ymm2 # 7e20 <_sk_callback_avx+0x3b0>
+ .byte 196,226,125,24,21,137,121,0,0 // vbroadcastss 0x7989(%rip),%ymm2 # b028 <_sk_clut_4D_avx+0x2391>
.byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
- .byte 196,226,125,24,53,120,71,0,0 // vbroadcastss 0x4778(%rip),%ymm6 # 7e24 <_sk_callback_avx+0x3b4>
+ .byte 196,226,125,24,53,128,121,0,0 // vbroadcastss 0x7980(%rip),%ymm6 # b02c <_sk_clut_4D_avx+0x2395>
.byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
.byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
@@ -23465,7 +27292,7 @@ _sk_gamma_avx:
.byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
.byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
.byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,187,70,0,0 // vbroadcastss 0x46bb(%rip),%ymm2 # 7e28 <_sk_callback_avx+0x3b8>
+ .byte 196,226,125,24,21,195,120,0,0 // vbroadcastss 0x78c3(%rip),%ymm2 # b030 <_sk_clut_4D_avx+0x2399>
.byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
.byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
.byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
@@ -23485,31 +27312,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,119,70,0,0 // vbroadcastss 0x4677(%rip),%ymm8 # 7e2c <_sk_callback_avx+0x3bc>
+ .byte 196,98,125,24,5,127,120,0,0 // vbroadcastss 0x787f(%rip),%ymm8 # b034 <_sk_clut_4D_avx+0x239d>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,109,70,0,0 // vbroadcastss 0x466d(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x3c0>
+ .byte 196,98,125,24,5,117,120,0,0 // vbroadcastss 0x7875(%rip),%ymm8 # b038 <_sk_clut_4D_avx+0x23a1>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,99,70,0,0 // vbroadcastss 0x4663(%rip),%ymm9 # 7e34 <_sk_callback_avx+0x3c4>
+ .byte 196,98,125,24,13,107,120,0,0 // vbroadcastss 0x786b(%rip),%ymm9 # b03c <_sk_clut_4D_avx+0x23a5>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,79,70,0,0 // vbroadcastss 0x464f(%rip),%ymm8 # 7e38 <_sk_callback_avx+0x3c8>
+ .byte 196,98,125,24,5,87,120,0,0 // vbroadcastss 0x7857(%rip),%ymm8 # b040 <_sk_clut_4D_avx+0x23a9>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,69,70,0,0 // vbroadcastss 0x4645(%rip),%ymm8 # 7e3c <_sk_callback_avx+0x3cc>
+ .byte 196,98,125,24,5,77,120,0,0 // vbroadcastss 0x784d(%rip),%ymm8 # b044 <_sk_clut_4D_avx+0x23ad>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,59,70,0,0 // vbroadcastss 0x463b(%rip),%ymm8 # 7e40 <_sk_callback_avx+0x3d0>
+ .byte 196,98,125,24,5,67,120,0,0 // vbroadcastss 0x7843(%rip),%ymm8 # b048 <_sk_clut_4D_avx+0x23b1>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,45,70,0,0 // vbroadcastss 0x462d(%rip),%ymm8 # 7e44 <_sk_callback_avx+0x3d4>
+ .byte 196,98,125,24,5,53,120,0,0 // vbroadcastss 0x7835(%rip),%ymm8 # b04c <_sk_clut_4D_avx+0x23b5>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,22,70,0,0 // vbroadcastss 0x4616(%rip),%ymm9 # 7e48 <_sk_callback_avx+0x3d8>
+ .byte 196,98,125,24,13,30,120,0,0 // vbroadcastss 0x781e(%rip),%ymm9 # b050 <_sk_clut_4D_avx+0x23b9>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,11,70,0,0 // vbroadcastss 0x460b(%rip),%ymm11 # 7e4c <_sk_callback_avx+0x3dc>
+ .byte 196,98,125,24,29,19,120,0,0 // vbroadcastss 0x7813(%rip),%ymm11 # b054 <_sk_clut_4D_avx+0x23bd>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,1,70,0,0 // vbroadcastss 0x4601(%rip),%ymm12 # 7e50 <_sk_callback_avx+0x3e0>
+ .byte 196,98,125,24,37,9,120,0,0 // vbroadcastss 0x7809(%rip),%ymm12 # b058 <_sk_clut_4D_avx+0x23c1>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -23524,9 +27351,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,183,69,0,0 // vbroadcastss 0x45b7(%rip),%ymm0 # 7e54 <_sk_callback_avx+0x3e4>
+ .byte 196,226,125,24,5,191,119,0,0 // vbroadcastss 0x77bf(%rip),%ymm0 # b05c <_sk_clut_4D_avx+0x23c5>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,174,69,0,0 // vbroadcastss 0x45ae(%rip),%ymm8 # 7e58 <_sk_callback_avx+0x3e8>
+ .byte 196,98,125,24,5,182,119,0,0 // vbroadcastss 0x77b6(%rip),%ymm8 # b060 <_sk_clut_4D_avx+0x23c9>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23545,13 +27372,13 @@ _sk_load_a8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,67 // jne 390f <_sk_load_a8_avx+0x5c>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,118,72,0,0 // vpand 0x4876(%rip),%xmm0,%xmm0 # 8150 <_sk_callback_avx+0x6e0>
+ .byte 197,249,219,5,166,122,0,0 // vpand 0x7aa6(%rip),%xmm0,%xmm0 # b380 <_sk_clut_4D_avx+0x26e9>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,98,69,0,0 // vbroadcastss 0x4562(%rip),%ymm1 # 7e5c <_sk_callback_avx+0x3ec>
+ .byte 196,226,125,24,13,106,119,0,0 // vbroadcastss 0x776a(%rip),%ymm1 # b064 <_sk_clut_4D_avx+0x23cd>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -23627,13 +27454,13 @@ _sk_load_a8_dst_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,67 // jne 3a20 <_sk_load_a8_dst_avx+0x5c>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,117,71,0,0 // vpand 0x4775(%rip),%xmm4,%xmm4 # 8160 <_sk_callback_avx+0x6f0>
+ .byte 197,217,219,37,165,121,0,0 // vpand 0x79a5(%rip),%xmm4,%xmm4 # b390 <_sk_clut_4D_avx+0x26f9>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,85,68,0,0 // vbroadcastss 0x4455(%rip),%ymm5 # 7e60 <_sk_callback_avx+0x3f0>
+ .byte 196,226,125,24,45,93,118,0,0 // vbroadcastss 0x765d(%rip),%ymm5 # b068 <_sk_clut_4D_avx+0x23d1>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -23682,7 +27509,7 @@ _sk_load_a8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde003ac8 <_sk_callback_avx+0xffffffffddffc058>
+ .byte 232,255,255,255,221 // callq ffffffffde003ac8 <_sk_clut_4D_avx+0xffffffffddffae31>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -23737,7 +27564,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,196,66,0,0 // vbroadcastss 0x42c4(%rip),%ymm1 # 7e64 <_sk_callback_avx+0x3f4>
+ .byte 196,226,125,24,13,204,116,0,0 // vbroadcastss 0x74cc(%rip),%ymm1 # b06c <_sk_clut_4D_avx+0x23d5>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -23756,7 +27583,7 @@ _sk_store_a8_avx:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,151,66,0,0 // vbroadcastss 0x4297(%rip),%ymm8 # 7e68 <_sk_callback_avx+0x3f8>
+ .byte 196,98,125,24,5,159,116,0,0 // vbroadcastss 0x749f(%rip),%ymm8 # b070 <_sk_clut_4D_avx+0x23d9>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -23782,13 +27609,13 @@ _sk_store_a8_avx:
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
.byte 235,201 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,50,69,0,0 // vpshufb 0x4532(%rip),%xmm8,%xmm8 # 8170 <_sk_callback_avx+0x700>
+ .byte 196,98,57,0,5,98,119,0,0 // vpshufb 0x7762(%rip),%xmm8,%xmm8 # b3a0 <_sk_clut_4D_avx+0x2709>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
.byte 235,175 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,24,69,0,0 // vpshufb 0x4518(%rip),%xmm8,%xmm8 # 8180 <_sk_callback_avx+0x710>
+ .byte 196,98,57,0,5,72,119,0,0 // vpshufb 0x7748(%rip),%xmm8,%xmm8 # b3b0 <_sk_clut_4D_avx+0x2719>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
.byte 235,134 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 180,255 // mov $0xff,%ah
@@ -23825,16 +27652,16 @@ _sk_load_g8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,72 // jne 3ced <_sk_load_g8_avx+0x61>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,221,68,0,0 // vpand 0x44dd(%rip),%xmm0,%xmm0 # 8190 <_sk_callback_avx+0x720>
+ .byte 197,249,219,5,13,119,0,0 // vpand 0x770d(%rip),%xmm0,%xmm0 # b3c0 <_sk_clut_4D_avx+0x2729>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,153,65,0,0 // vbroadcastss 0x4199(%rip),%ymm1 # 7e6c <_sk_callback_avx+0x3fc>
+ .byte 196,226,125,24,13,161,115,0,0 // vbroadcastss 0x73a1(%rip),%ymm1 # b074 <_sk_clut_4D_avx+0x23dd>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,142,65,0,0 // vbroadcastss 0x418e(%rip),%ymm3 # 7e70 <_sk_callback_avx+0x400>
+ .byte 196,226,125,24,29,150,115,0,0 // vbroadcastss 0x7396(%rip),%ymm3 # b078 <_sk_clut_4D_avx+0x23e1>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -23880,7 +27707,7 @@ _sk_load_g8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf003d94 <_sk_callback_avx+0xffffffffdeffc324>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf003d94 <_sk_clut_4D_avx+0xffffffffdeffb0fd>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -23905,16 +27732,16 @@ _sk_load_g8_dst_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,72 // jne 3e01 <_sk_load_g8_dst_avx+0x61>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,217,67,0,0 // vpand 0x43d9(%rip),%xmm4,%xmm4 # 81a0 <_sk_callback_avx+0x730>
+ .byte 197,217,219,37,9,118,0,0 // vpand 0x7609(%rip),%xmm4,%xmm4 # b3d0 <_sk_clut_4D_avx+0x2739>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,141,64,0,0 // vbroadcastss 0x408d(%rip),%ymm5 # 7e74 <_sk_callback_avx+0x404>
+ .byte 196,226,125,24,45,149,114,0,0 // vbroadcastss 0x7295(%rip),%ymm5 # b07c <_sk_clut_4D_avx+0x23e5>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,130,64,0,0 // vbroadcastss 0x4082(%rip),%ymm7 # 7e78 <_sk_callback_avx+0x408>
+ .byte 196,226,125,24,61,138,114,0,0 // vbroadcastss 0x728a(%rip),%ymm7 # b080 <_sk_clut_4D_avx+0x23e9>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -23960,7 +27787,7 @@ _sk_load_g8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf003ea8 <_sk_callback_avx+0xffffffffdeffc438>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf003ea8 <_sk_clut_4D_avx+0xffffffffdeffb211>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -24015,10 +27842,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,252,62,0,0 // vbroadcastss 0x3efc(%rip),%ymm1 # 7e7c <_sk_callback_avx+0x40c>
+ .byte 196,226,125,24,13,4,113,0,0 // vbroadcastss 0x7104(%rip),%ymm1 # b084 <_sk_clut_4D_avx+0x23ed>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,241,62,0,0 // vbroadcastss 0x3ef1(%rip),%ymm3 # 7e80 <_sk_callback_avx+0x410>
+ .byte 196,226,125,24,29,249,112,0,0 // vbroadcastss 0x70f9(%rip),%ymm3 # b088 <_sk_clut_4D_avx+0x23f1>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -24042,23 +27869,23 @@ _sk_load_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,169,62,0,0 // vbroadcastss 0x3ea9(%rip),%ymm0 # 7e84 <_sk_callback_avx+0x414>
+ .byte 196,226,125,24,5,177,112,0,0 // vbroadcastss 0x70b1(%rip),%ymm0 # b08c <_sk_clut_4D_avx+0x23f5>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,156,62,0,0 // vbroadcastss 0x3e9c(%rip),%ymm1 # 7e88 <_sk_callback_avx+0x418>
+ .byte 196,226,125,24,13,164,112,0,0 // vbroadcastss 0x70a4(%rip),%ymm1 # b090 <_sk_clut_4D_avx+0x23f9>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,147,62,0,0 // vbroadcastss 0x3e93(%rip),%ymm1 # 7e8c <_sk_callback_avx+0x41c>
+ .byte 196,226,125,24,13,155,112,0,0 // vbroadcastss 0x709b(%rip),%ymm1 # b094 <_sk_clut_4D_avx+0x23fd>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,134,62,0,0 // vbroadcastss 0x3e86(%rip),%ymm3 # 7e90 <_sk_callback_avx+0x420>
+ .byte 196,226,125,24,29,142,112,0,0 // vbroadcastss 0x708e(%rip),%ymm3 # b098 <_sk_clut_4D_avx+0x2401>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,125,62,0,0 // vbroadcastss 0x3e7d(%rip),%ymm3 # 7e94 <_sk_callback_avx+0x424>
+ .byte 196,226,125,24,29,133,112,0,0 // vbroadcastss 0x7085(%rip),%ymm3 # b09c <_sk_clut_4D_avx+0x2405>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,112,62,0,0 // vbroadcastss 0x3e70(%rip),%ymm3 # 7e98 <_sk_callback_avx+0x428>
+ .byte 196,226,125,24,29,120,112,0,0 // vbroadcastss 0x7078(%rip),%ymm3 # b0a0 <_sk_clut_4D_avx+0x2409>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,101,62,0,0 // vbroadcastss 0x3e65(%rip),%ymm3 # 7e9c <_sk_callback_avx+0x42c>
+ .byte 196,226,125,24,29,109,112,0,0 // vbroadcastss 0x706d(%rip),%ymm3 # b0a4 <_sk_clut_4D_avx+0x240d>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -24126,23 +27953,23 @@ _sk_load_565_dst_avx:
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,130,61,0,0 // vbroadcastss 0x3d82(%rip),%ymm4 # 7ea0 <_sk_callback_avx+0x430>
+ .byte 196,226,125,24,37,138,111,0,0 // vbroadcastss 0x6f8a(%rip),%ymm4 # b0a8 <_sk_clut_4D_avx+0x2411>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,117,61,0,0 // vbroadcastss 0x3d75(%rip),%ymm5 # 7ea4 <_sk_callback_avx+0x434>
+ .byte 196,226,125,24,45,125,111,0,0 // vbroadcastss 0x6f7d(%rip),%ymm5 # b0ac <_sk_clut_4D_avx+0x2415>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,108,61,0,0 // vbroadcastss 0x3d6c(%rip),%ymm5 # 7ea8 <_sk_callback_avx+0x438>
+ .byte 196,226,125,24,45,116,111,0,0 // vbroadcastss 0x6f74(%rip),%ymm5 # b0b0 <_sk_clut_4D_avx+0x2419>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,95,61,0,0 // vbroadcastss 0x3d5f(%rip),%ymm7 # 7eac <_sk_callback_avx+0x43c>
+ .byte 196,226,125,24,61,103,111,0,0 // vbroadcastss 0x6f67(%rip),%ymm7 # b0b4 <_sk_clut_4D_avx+0x241d>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,86,61,0,0 // vbroadcastss 0x3d56(%rip),%ymm7 # 7eb0 <_sk_callback_avx+0x440>
+ .byte 196,226,125,24,61,94,111,0,0 // vbroadcastss 0x6f5e(%rip),%ymm7 # b0b8 <_sk_clut_4D_avx+0x2421>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,73,61,0,0 // vbroadcastss 0x3d49(%rip),%ymm7 # 7eb4 <_sk_callback_avx+0x444>
+ .byte 196,226,125,24,61,81,111,0,0 // vbroadcastss 0x6f51(%rip),%ymm7 # b0bc <_sk_clut_4D_avx+0x2425>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,62,61,0,0 // vbroadcastss 0x3d3e(%rip),%ymm7 # 7eb8 <_sk_callback_avx+0x448>
+ .byte 196,226,125,24,61,70,111,0,0 // vbroadcastss 0x6f46(%rip),%ymm7 # b0c0 <_sk_clut_4D_avx+0x2429>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -24242,23 +28069,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,202,59,0,0 // vbroadcastss 0x3bca(%rip),%ymm0 # 7ebc <_sk_callback_avx+0x44c>
+ .byte 196,226,125,24,5,210,109,0,0 // vbroadcastss 0x6dd2(%rip),%ymm0 # b0c4 <_sk_clut_4D_avx+0x242d>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,189,59,0,0 // vbroadcastss 0x3bbd(%rip),%ymm1 # 7ec0 <_sk_callback_avx+0x450>
+ .byte 196,226,125,24,13,197,109,0,0 // vbroadcastss 0x6dc5(%rip),%ymm1 # b0c8 <_sk_clut_4D_avx+0x2431>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,180,59,0,0 // vbroadcastss 0x3bb4(%rip),%ymm1 # 7ec4 <_sk_callback_avx+0x454>
+ .byte 196,226,125,24,13,188,109,0,0 // vbroadcastss 0x6dbc(%rip),%ymm1 # b0cc <_sk_clut_4D_avx+0x2435>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,167,59,0,0 // vbroadcastss 0x3ba7(%rip),%ymm3 # 7ec8 <_sk_callback_avx+0x458>
+ .byte 196,226,125,24,29,175,109,0,0 // vbroadcastss 0x6daf(%rip),%ymm3 # b0d0 <_sk_clut_4D_avx+0x2439>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,158,59,0,0 // vbroadcastss 0x3b9e(%rip),%ymm3 # 7ecc <_sk_callback_avx+0x45c>
+ .byte 196,226,125,24,29,166,109,0,0 // vbroadcastss 0x6da6(%rip),%ymm3 # b0d4 <_sk_clut_4D_avx+0x243d>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,145,59,0,0 // vbroadcastss 0x3b91(%rip),%ymm3 # 7ed0 <_sk_callback_avx+0x460>
+ .byte 196,226,125,24,29,153,109,0,0 // vbroadcastss 0x6d99(%rip),%ymm3 # b0d8 <_sk_clut_4D_avx+0x2441>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,134,59,0,0 // vbroadcastss 0x3b86(%rip),%ymm3 # 7ed4 <_sk_callback_avx+0x464>
+ .byte 196,226,125,24,29,142,109,0,0 // vbroadcastss 0x6d8e(%rip),%ymm3 # b0dc <_sk_clut_4D_avx+0x2445>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_avx
@@ -24273,14 +28100,14 @@ _sk_store_565_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,104,59,0,0 // vbroadcastss 0x3b68(%rip),%ymm8 # 7ed8 <_sk_callback_avx+0x468>
+ .byte 196,98,125,24,5,112,109,0,0 // vbroadcastss 0x6d70(%rip),%ymm8 # b0e0 <_sk_clut_4D_avx+0x2449>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,65,59,0,0 // vbroadcastss 0x3b41(%rip),%ymm10 # 7edc <_sk_callback_avx+0x46c>
+ .byte 196,98,125,24,21,73,109,0,0 // vbroadcastss 0x6d49(%rip),%ymm10 # b0e4 <_sk_clut_4D_avx+0x244d>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -24363,25 +28190,25 @@ _sk_load_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,54,58,0,0 // vbroadcastss 0x3a36(%rip),%ymm0 # 7ee0 <_sk_callback_avx+0x470>
+ .byte 196,226,125,24,5,62,108,0,0 // vbroadcastss 0x6c3e(%rip),%ymm0 # b0e8 <_sk_clut_4D_avx+0x2451>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,41,58,0,0 // vbroadcastss 0x3a29(%rip),%ymm1 # 7ee4 <_sk_callback_avx+0x474>
+ .byte 196,226,125,24,13,49,108,0,0 // vbroadcastss 0x6c31(%rip),%ymm1 # b0ec <_sk_clut_4D_avx+0x2455>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,32,58,0,0 // vbroadcastss 0x3a20(%rip),%ymm1 # 7ee8 <_sk_callback_avx+0x478>
+ .byte 196,226,125,24,13,40,108,0,0 // vbroadcastss 0x6c28(%rip),%ymm1 # b0f0 <_sk_clut_4D_avx+0x2459>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,19,58,0,0 // vbroadcastss 0x3a13(%rip),%ymm2 # 7eec <_sk_callback_avx+0x47c>
+ .byte 196,226,125,24,21,27,108,0,0 // vbroadcastss 0x6c1b(%rip),%ymm2 # b0f4 <_sk_clut_4D_avx+0x245d>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,10,58,0,0 // vbroadcastss 0x3a0a(%rip),%ymm2 # 7ef0 <_sk_callback_avx+0x480>
+ .byte 196,226,125,24,21,18,108,0,0 // vbroadcastss 0x6c12(%rip),%ymm2 # b0f8 <_sk_clut_4D_avx+0x2461>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,253,57,0,0 // vbroadcastss 0x39fd(%rip),%ymm8 # 7ef4 <_sk_callback_avx+0x484>
+ .byte 196,98,125,24,5,5,108,0,0 // vbroadcastss 0x6c05(%rip),%ymm8 # b0fc <_sk_clut_4D_avx+0x2465>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,243,57,0,0 // vbroadcastss 0x39f3(%rip),%ymm8 # 7ef8 <_sk_callback_avx+0x488>
+ .byte 196,98,125,24,5,251,107,0,0 // vbroadcastss 0x6bfb(%rip),%ymm8 # b100 <_sk_clut_4D_avx+0x2469>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,229,57,0,0 // vbroadcastss 0x39e5(%rip),%ymm8 # 7efc <_sk_callback_avx+0x48c>
+ .byte 196,98,125,24,5,237,107,0,0 // vbroadcastss 0x6bed(%rip),%ymm8 # b104 <_sk_clut_4D_avx+0x246d>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24454,25 +28281,25 @@ _sk_load_4444_dst_avx:
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,250,56,0,0 // vbroadcastss 0x38fa(%rip),%ymm4 # 7f00 <_sk_callback_avx+0x490>
+ .byte 196,226,125,24,37,2,107,0,0 // vbroadcastss 0x6b02(%rip),%ymm4 # b108 <_sk_clut_4D_avx+0x2471>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,237,56,0,0 // vbroadcastss 0x38ed(%rip),%ymm5 # 7f04 <_sk_callback_avx+0x494>
+ .byte 196,226,125,24,45,245,106,0,0 // vbroadcastss 0x6af5(%rip),%ymm5 # b10c <_sk_clut_4D_avx+0x2475>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,228,56,0,0 // vbroadcastss 0x38e4(%rip),%ymm5 # 7f08 <_sk_callback_avx+0x498>
+ .byte 196,226,125,24,45,236,106,0,0 // vbroadcastss 0x6aec(%rip),%ymm5 # b110 <_sk_clut_4D_avx+0x2479>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,215,56,0,0 // vbroadcastss 0x38d7(%rip),%ymm6 # 7f0c <_sk_callback_avx+0x49c>
+ .byte 196,226,125,24,53,223,106,0,0 // vbroadcastss 0x6adf(%rip),%ymm6 # b114 <_sk_clut_4D_avx+0x247d>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,206,56,0,0 // vbroadcastss 0x38ce(%rip),%ymm6 # 7f10 <_sk_callback_avx+0x4a0>
+ .byte 196,226,125,24,53,214,106,0,0 // vbroadcastss 0x6ad6(%rip),%ymm6 # b118 <_sk_clut_4D_avx+0x2481>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,193,56,0,0 // vbroadcastss 0x38c1(%rip),%ymm8 # 7f14 <_sk_callback_avx+0x4a4>
+ .byte 196,98,125,24,5,201,106,0,0 // vbroadcastss 0x6ac9(%rip),%ymm8 # b11c <_sk_clut_4D_avx+0x2485>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,183,56,0,0 // vbroadcastss 0x38b7(%rip),%ymm8 # 7f18 <_sk_callback_avx+0x4a8>
+ .byte 196,98,125,24,5,191,106,0,0 // vbroadcastss 0x6abf(%rip),%ymm8 # b120 <_sk_clut_4D_avx+0x2489>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,169,56,0,0 // vbroadcastss 0x38a9(%rip),%ymm8 # 7f1c <_sk_callback_avx+0x4ac>
+ .byte 196,98,125,24,5,177,106,0,0 // vbroadcastss 0x6ab1(%rip),%ymm8 # b124 <_sk_clut_4D_avx+0x248d>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24574,25 +28401,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,46,55,0,0 // vbroadcastss 0x372e(%rip),%ymm0 # 7f20 <_sk_callback_avx+0x4b0>
+ .byte 196,226,125,24,5,54,105,0,0 // vbroadcastss 0x6936(%rip),%ymm0 # b128 <_sk_clut_4D_avx+0x2491>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,33,55,0,0 // vbroadcastss 0x3721(%rip),%ymm1 # 7f24 <_sk_callback_avx+0x4b4>
+ .byte 196,226,125,24,13,41,105,0,0 // vbroadcastss 0x6929(%rip),%ymm1 # b12c <_sk_clut_4D_avx+0x2495>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,24,55,0,0 // vbroadcastss 0x3718(%rip),%ymm1 # 7f28 <_sk_callback_avx+0x4b8>
+ .byte 196,226,125,24,13,32,105,0,0 // vbroadcastss 0x6920(%rip),%ymm1 # b130 <_sk_clut_4D_avx+0x2499>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,11,55,0,0 // vbroadcastss 0x370b(%rip),%ymm2 # 7f2c <_sk_callback_avx+0x4bc>
+ .byte 196,226,125,24,21,19,105,0,0 // vbroadcastss 0x6913(%rip),%ymm2 # b134 <_sk_clut_4D_avx+0x249d>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,2,55,0,0 // vbroadcastss 0x3702(%rip),%ymm2 # 7f30 <_sk_callback_avx+0x4c0>
+ .byte 196,226,125,24,21,10,105,0,0 // vbroadcastss 0x690a(%rip),%ymm2 # b138 <_sk_clut_4D_avx+0x24a1>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,245,54,0,0 // vbroadcastss 0x36f5(%rip),%ymm8 # 7f34 <_sk_callback_avx+0x4c4>
+ .byte 196,98,125,24,5,253,104,0,0 // vbroadcastss 0x68fd(%rip),%ymm8 # b13c <_sk_clut_4D_avx+0x24a5>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,235,54,0,0 // vbroadcastss 0x36eb(%rip),%ymm8 # 7f38 <_sk_callback_avx+0x4c8>
+ .byte 196,98,125,24,5,243,104,0,0 // vbroadcastss 0x68f3(%rip),%ymm8 # b140 <_sk_clut_4D_avx+0x24a9>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,221,54,0,0 // vbroadcastss 0x36dd(%rip),%ymm8 # 7f3c <_sk_callback_avx+0x4cc>
+ .byte 196,98,125,24,5,229,104,0,0 // vbroadcastss 0x68e5(%rip),%ymm8 # b144 <_sk_clut_4D_avx+0x24ad>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -24609,7 +28436,7 @@ _sk_store_4444_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,184,54,0,0 // vbroadcastss 0x36b8(%rip),%ymm8 # 7f40 <_sk_callback_avx+0x4d0>
+ .byte 196,98,125,24,5,192,104,0,0 // vbroadcastss 0x68c0(%rip),%ymm8 # b148 <_sk_clut_4D_avx+0x24b1>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -24702,10 +28529,10 @@ _sk_load_8888_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,136,0,0,0 // jne 4a4b <_sk_load_8888_avx+0xaf>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,124,40,21,241,56,0,0 // vmovaps 0x38f1(%rip),%ymm10 # 82c0 <_sk_callback_avx+0x850>
+ .byte 197,124,40,21,17,107,0,0 // vmovaps 0x6b11(%rip),%ymm10 # b4e0 <_sk_clut_4D_avx+0x2849>
.byte 196,193,100,84,194 // vandps %ymm10,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,99,53,0,0 // vbroadcastss 0x3563(%rip),%ymm8 # 7f44 <_sk_callback_avx+0x4d4>
+ .byte 196,98,125,24,5,107,103,0,0 // vbroadcastss 0x676b(%rip),%ymm8 # b14c <_sk_clut_4D_avx+0x24b5>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
.byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9
@@ -24735,9 +28562,9 @@ _sk_load_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,61,55,0,0 // vpshufb 0x373d(%rip),%xmm0,%xmm1 # 81b0 <_sk_callback_avx+0x740>
+ .byte 196,226,121,0,13,109,105,0,0 // vpshufb 0x696d(%rip),%xmm0,%xmm1 # b3e0 <_sk_clut_4D_avx+0x2749>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,63,55,0,0 // vpshufb 0x373f(%rip),%xmm0,%xmm0 # 81c0 <_sk_callback_avx+0x750>
+ .byte 196,226,121,0,5,111,105,0,0 // vpshufb 0x696f(%rip),%xmm0,%xmm0 # b3f0 <_sk_clut_4D_avx+0x2759>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
@@ -24759,10 +28586,10 @@ _sk_load_8888_dst_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,136,0,0,0 // jne 4b45 <_sk_load_8888_dst_avx+0xaf>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,21,23,56,0,0 // vmovaps 0x3817(%rip),%ymm10 # 82e0 <_sk_callback_avx+0x870>
+ .byte 197,124,40,21,55,106,0,0 // vmovaps 0x6a37(%rip),%ymm10 # b500 <_sk_clut_4D_avx+0x2869>
.byte 196,193,68,84,226 // vandps %ymm10,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,109,52,0,0 // vbroadcastss 0x346d(%rip),%ymm8 # 7f48 <_sk_callback_avx+0x4d8>
+ .byte 196,98,125,24,5,117,102,0,0 // vbroadcastss 0x6675(%rip),%ymm8 # b150 <_sk_clut_4D_avx+0x24b9>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
.byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9
@@ -24792,9 +28619,9 @@ _sk_load_8888_dst_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,99,54,0,0 // vpshufb 0x3663(%rip),%xmm4,%xmm5 # 81d0 <_sk_callback_avx+0x760>
+ .byte 196,226,89,0,45,147,104,0,0 // vpshufb 0x6893(%rip),%xmm4,%xmm5 # b400 <_sk_clut_4D_avx+0x2769>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,101,54,0,0 // vpshufb 0x3665(%rip),%xmm4,%xmm4 # 81e0 <_sk_callback_avx+0x770>
+ .byte 196,226,89,0,37,149,104,0,0 // vpshufb 0x6895(%rip),%xmm4,%xmm4 # b410 <_sk_clut_4D_avx+0x2779>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
@@ -24837,10 +28664,10 @@ _sk_gather_8888_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,197,54,0,0 // vmovaps 0x36c5(%rip),%ymm10 # 8300 <_sk_callback_avx+0x890>
+ .byte 197,124,40,21,229,104,0,0 // vmovaps 0x68e5(%rip),%ymm10 # b520 <_sk_clut_4D_avx+0x2889>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,255,50,0,0 // vbroadcastss 0x32ff(%rip),%ymm9 # 7f4c <_sk_callback_avx+0x4dc>
+ .byte 196,98,125,24,13,7,101,0,0 // vbroadcastss 0x6507(%rip),%ymm9 # b154 <_sk_clut_4D_avx+0x24bd>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -24875,7 +28702,7 @@ _sk_store_8888_avx:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,123,50,0,0 // vbroadcastss 0x327b(%rip),%ymm8 # 7f50 <_sk_callback_avx+0x4e0>
+ .byte 196,98,125,24,5,131,100,0,0 // vbroadcastss 0x6483(%rip),%ymm8 # b158 <_sk_clut_4D_avx+0x24c1>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -24912,9 +28739,9 @@ _sk_store_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,100,52,0,0 // vpshufb 0x3464(%rip),%xmm9,%xmm10 # 81f0 <_sk_callback_avx+0x780>
+ .byte 196,98,49,0,21,148,102,0,0 // vpshufb 0x6694(%rip),%xmm9,%xmm10 # b420 <_sk_clut_4D_avx+0x2789>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,102,52,0,0 // vpshufb 0x3466(%rip),%xmm9,%xmm9 # 8200 <_sk_callback_avx+0x790>
+ .byte 196,98,49,0,13,150,102,0,0 // vpshufb 0x6696(%rip),%xmm9,%xmm9 # b430 <_sk_clut_4D_avx+0x2799>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
@@ -24936,10 +28763,10 @@ _sk_load_bgra_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,136,0,0,0 // jne 4e5b <_sk_load_bgra_avx+0xaf>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,124,40,21,65,53,0,0 // vmovaps 0x3541(%rip),%ymm10 # 8320 <_sk_callback_avx+0x8b0>
+ .byte 197,124,40,21,97,103,0,0 // vmovaps 0x6761(%rip),%ymm10 # b540 <_sk_clut_4D_avx+0x28a9>
.byte 196,193,100,84,202 // vandps %ymm10,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,99,49,0,0 // vbroadcastss 0x3163(%rip),%ymm8 # 7f54 <_sk_callback_avx+0x4e4>
+ .byte 196,98,125,24,5,107,99,0,0 // vbroadcastss 0x636b(%rip),%ymm8 # b15c <_sk_clut_4D_avx+0x24c5>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
.byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9
@@ -24969,9 +28796,9 @@ _sk_load_bgra_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,141,51,0,0 // vpshufb 0x338d(%rip),%xmm0,%xmm1 # 8210 <_sk_callback_avx+0x7a0>
+ .byte 196,226,121,0,13,189,101,0,0 // vpshufb 0x65bd(%rip),%xmm0,%xmm1 # b440 <_sk_clut_4D_avx+0x27a9>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,143,51,0,0 // vpshufb 0x338f(%rip),%xmm0,%xmm0 # 8220 <_sk_callback_avx+0x7b0>
+ .byte 196,226,121,0,5,191,101,0,0 // vpshufb 0x65bf(%rip),%xmm0,%xmm0 # b450 <_sk_clut_4D_avx+0x27b9>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
@@ -24993,10 +28820,10 @@ _sk_load_bgra_dst_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,136,0,0,0 // jne 4f55 <_sk_load_bgra_dst_avx+0xaf>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,21,103,52,0,0 // vmovaps 0x3467(%rip),%ymm10 # 8340 <_sk_callback_avx+0x8d0>
+ .byte 197,124,40,21,135,102,0,0 // vmovaps 0x6687(%rip),%ymm10 # b560 <_sk_clut_4D_avx+0x28c9>
.byte 196,193,68,84,234 // vandps %ymm10,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,109,48,0,0 // vbroadcastss 0x306d(%rip),%ymm8 # 7f58 <_sk_callback_avx+0x4e8>
+ .byte 196,98,125,24,5,117,98,0,0 // vbroadcastss 0x6275(%rip),%ymm8 # b160 <_sk_clut_4D_avx+0x24c9>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
.byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9
@@ -25026,9 +28853,9 @@ _sk_load_bgra_dst_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,179,50,0,0 // vpshufb 0x32b3(%rip),%xmm4,%xmm5 # 8230 <_sk_callback_avx+0x7c0>
+ .byte 196,226,89,0,45,227,100,0,0 // vpshufb 0x64e3(%rip),%xmm4,%xmm5 # b460 <_sk_clut_4D_avx+0x27c9>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,181,50,0,0 // vpshufb 0x32b5(%rip),%xmm4,%xmm4 # 8240 <_sk_callback_avx+0x7d0>
+ .byte 196,226,89,0,37,229,100,0,0 // vpshufb 0x64e5(%rip),%xmm4,%xmm4 # b470 <_sk_clut_4D_avx+0x27d9>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
@@ -25071,10 +28898,10 @@ _sk_gather_bgra_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,21,51,0,0 // vmovaps 0x3315(%rip),%ymm9 # 8360 <_sk_callback_avx+0x8f0>
+ .byte 197,124,40,13,53,101,0,0 // vmovaps 0x6535(%rip),%ymm9 # b580 <_sk_clut_4D_avx+0x28e9>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,255,46,0,0 // vbroadcastss 0x2eff(%rip),%ymm10 # 7f5c <_sk_callback_avx+0x4ec>
+ .byte 196,98,125,24,21,7,97,0,0 // vbroadcastss 0x6107(%rip),%ymm10 # b164 <_sk_clut_4D_avx+0x24cd>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -25109,7 +28936,7 @@ _sk_store_bgra_avx:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,123,46,0,0 // vbroadcastss 0x2e7b(%rip),%ymm8 # 7f60 <_sk_callback_avx+0x4f0>
+ .byte 196,98,125,24,5,131,96,0,0 // vbroadcastss 0x6083(%rip),%ymm8 # b168 <_sk_clut_4D_avx+0x24d1>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -25146,9 +28973,9 @@ _sk_store_bgra_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,180,48,0,0 // vpshufb 0x30b4(%rip),%xmm9,%xmm10 # 8250 <_sk_callback_avx+0x7e0>
+ .byte 196,98,49,0,21,228,98,0,0 // vpshufb 0x62e4(%rip),%xmm9,%xmm10 # b480 <_sk_clut_4D_avx+0x27e9>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,182,48,0,0 // vpshufb 0x30b6(%rip),%xmm9,%xmm9 # 8260 <_sk_callback_avx+0x7f0>
+ .byte 196,98,49,0,13,230,98,0,0 // vpshufb 0x62e6(%rip),%xmm9,%xmm9 # b490 <_sk_clut_4D_avx+0x27f9>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
@@ -25189,13 +29016,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,15,45,0,0 // vbroadcastss 0x2d0f(%rip),%ymm12 # 7f64 <_sk_callback_avx+0x4f4>
+ .byte 196,98,125,24,37,23,95,0,0 // vbroadcastss 0x5f17(%rip),%ymm12 # b16c <_sk_clut_4D_avx+0x24d5>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,251,44,0,0 // vbroadcastss 0x2cfb(%rip),%xmm11 # 7f68 <_sk_callback_avx+0x4f8>
+ .byte 196,98,121,24,29,3,95,0,0 // vbroadcastss 0x5f03(%rip),%xmm11 # b170 <_sk_clut_4D_avx+0x24d9>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,241,44,0,0 // vbroadcastss 0x2cf1(%rip),%xmm13 # 7f6c <_sk_callback_avx+0x4fc>
+ .byte 196,98,121,24,45,249,94,0,0 // vbroadcastss 0x5ef9(%rip),%xmm13 # b174 <_sk_clut_4D_avx+0x24dd>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -25209,7 +29036,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,167,44,0,0 // vbroadcastss 0x2ca7(%rip),%xmm3 # 7f70 <_sk_callback_avx+0x500>
+ .byte 196,226,121,24,29,175,94,0,0 // vbroadcastss 0x5eaf(%rip),%xmm3 # b178 <_sk_clut_4D_avx+0x24e1>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -25361,13 +29188,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,214,41,0,0 // vbroadcastss 0x29d6(%rip),%ymm12 # 7f74 <_sk_callback_avx+0x504>
+ .byte 196,98,125,24,37,222,91,0,0 // vbroadcastss 0x5bde(%rip),%ymm12 # b17c <_sk_clut_4D_avx+0x24e5>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,194,41,0,0 // vbroadcastss 0x29c2(%rip),%xmm11 # 7f78 <_sk_callback_avx+0x508>
+ .byte 196,98,121,24,29,202,91,0,0 // vbroadcastss 0x5bca(%rip),%xmm11 # b180 <_sk_clut_4D_avx+0x24e9>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,184,41,0,0 // vbroadcastss 0x29b8(%rip),%xmm13 # 7f7c <_sk_callback_avx+0x50c>
+ .byte 196,98,121,24,45,192,91,0,0 // vbroadcastss 0x5bc0(%rip),%xmm13 # b184 <_sk_clut_4D_avx+0x24ed>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -25381,7 +29208,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,110,41,0,0 // vbroadcastss 0x296e(%rip),%xmm7 # 7f80 <_sk_callback_avx+0x510>
+ .byte 196,226,121,24,61,118,91,0,0 // vbroadcastss 0x5b76(%rip),%xmm7 # b188 <_sk_clut_4D_avx+0x24f1>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -25557,13 +29384,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,44,38,0,0 // vbroadcastss 0x262c(%rip),%ymm12 # 7f84 <_sk_callback_avx+0x514>
+ .byte 196,98,125,24,37,52,88,0,0 // vbroadcastss 0x5834(%rip),%ymm12 # b18c <_sk_clut_4D_avx+0x24f5>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,24,38,0,0 // vbroadcastss 0x2618(%rip),%xmm11 # 7f88 <_sk_callback_avx+0x518>
+ .byte 196,98,121,24,29,32,88,0,0 // vbroadcastss 0x5820(%rip),%xmm11 # b190 <_sk_clut_4D_avx+0x24f9>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,14,38,0,0 // vbroadcastss 0x260e(%rip),%xmm13 # 7f8c <_sk_callback_avx+0x51c>
+ .byte 196,98,121,24,45,22,88,0,0 // vbroadcastss 0x5816(%rip),%xmm13 # b194 <_sk_clut_4D_avx+0x24fd>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -25577,7 +29404,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,196,37,0,0 // vbroadcastss 0x25c4(%rip),%xmm3 # 7f90 <_sk_callback_avx+0x520>
+ .byte 196,226,121,24,29,204,87,0,0 // vbroadcastss 0x57cc(%rip),%xmm3 # b198 <_sk_clut_4D_avx+0x2501>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -25677,12 +29504,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,228,35,0,0 // vbroadcastss 0x23e4(%rip),%ymm9 # 7f94 <_sk_callback_avx+0x524>
+ .byte 196,98,125,24,13,236,85,0,0 // vbroadcastss 0x55ec(%rip),%ymm9 # b19c <_sk_clut_4D_avx+0x2505>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,201,35,0,0 // vbroadcastss 0x23c9(%rip),%xmm8 # 7f98 <_sk_callback_avx+0x528>
+ .byte 196,98,121,24,5,209,85,0,0 // vbroadcastss 0x55d1(%rip),%xmm8 # b1a0 <_sk_clut_4D_avx+0x2509>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -25692,7 +29519,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,144,35,0,0 // vbroadcastss 0x2390(%rip),%ymm10 # 7f9c <_sk_callback_avx+0x52c>
+ .byte 196,98,125,24,21,152,85,0,0 // vbroadcastss 0x5598(%rip),%ymm10 # b1a4 <_sk_clut_4D_avx+0x250d>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -25847,7 +29674,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,186,32,0,0 // vbroadcastss 0x20ba(%rip),%ymm11 # 7fa0 <_sk_callback_avx+0x530>
+ .byte 196,98,125,24,29,194,82,0,0 // vbroadcastss 0x52c2(%rip),%ymm11 # b1a8 <_sk_clut_4D_avx+0x2511>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -25947,7 +29774,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,1,31,0,0 // vbroadcastss 0x1f01(%rip),%ymm11 # 7fa4 <_sk_callback_avx+0x534>
+ .byte 196,98,125,24,29,9,81,0,0 // vbroadcastss 0x5109(%rip),%ymm11 # b1ac <_sk_clut_4D_avx+0x2515>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -25968,7 +29795,7 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,158,30,0,0 // vbroadcastss 0x1e9e(%rip),%ymm3 # 7fa8 <_sk_callback_avx+0x538>
+ .byte 196,226,125,24,29,166,80,0,0 // vbroadcastss 0x50a6(%rip),%ymm3 # b1b0 <_sk_clut_4D_avx+0x2519>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
@@ -26016,7 +29843,7 @@ _sk_store_u16_be_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,202,29,0,0 // vbroadcastss 0x1dca(%rip),%ymm8 # 7fac <_sk_callback_avx+0x53c>
+ .byte 196,98,125,24,5,210,79,0,0 // vbroadcastss 0x4fd2(%rip),%ymm8 # b1b4 <_sk_clut_4D_avx+0x251d>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -26336,7 +30163,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,239,24,0,0 // vmulss 0x18ef(%rip),%xmm9,%xmm0 # 7fb0 <_sk_callback_avx+0x540>
+ .byte 197,178,89,5,247,74,0,0 // vmulss 0x4af7(%rip),%xmm9,%xmm0 # b1b8 <_sk_clut_4D_avx+0x2521>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -26370,7 +30197,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,102,24,0,0 // vmulss 0x1866(%rip),%xmm9,%xmm1 # 7fb4 <_sk_callback_avx+0x544>
+ .byte 197,178,89,13,110,74,0,0 // vmulss 0x4a6e(%rip),%xmm9,%xmm1 # b1bc <_sk_clut_4D_avx+0x2525>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -26397,7 +30224,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,0,24,0,0 // vbroadcastss 0x1800(%rip),%ymm8 # 7fb8 <_sk_callback_avx+0x548>
+ .byte 196,98,125,24,5,8,74,0,0 // vbroadcastss 0x4a08(%rip),%ymm8 # b1c0 <_sk_clut_4D_avx+0x2529>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26415,9 +30242,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,227,23,0,0 // vbroadcastss 0x17e3(%rip),%ymm8 # 7fbc <_sk_callback_avx+0x54c>
+ .byte 196,98,125,24,5,235,73,0,0 // vbroadcastss 0x49eb(%rip),%ymm8 # b1c4 <_sk_clut_4D_avx+0x252d>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,217,23,0,0 // vbroadcastss 0x17d9(%rip),%ymm9 # 7fc0 <_sk_callback_avx+0x550>
+ .byte 196,98,125,24,13,225,73,0,0 // vbroadcastss 0x49e1(%rip),%ymm9 # b1c8 <_sk_clut_4D_avx+0x2531>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -26433,12 +30260,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,169,23,0,0 // vbroadcastss 0x17a9(%rip),%ymm3 # 7fc4 <_sk_callback_avx+0x554>
+ .byte 196,226,125,24,29,177,73,0,0 // vbroadcastss 0x49b1(%rip),%ymm3 # b1cc <_sk_clut_4D_avx+0x2535>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,160,23,0,0 // vbroadcastss 0x17a0(%rip),%ymm3 # 7fc8 <_sk_callback_avx+0x558>
+ .byte 196,226,125,24,29,168,73,0,0 // vbroadcastss 0x49a8(%rip),%ymm3 # b1d0 <_sk_clut_4D_avx+0x2539>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,147,23,0,0 // vbroadcastss 0x1793(%rip),%ymm1 # 7fcc <_sk_callback_avx+0x55c>
+ .byte 196,226,125,24,13,155,73,0,0 // vbroadcastss 0x499b(%rip),%ymm1 # b1d4 <_sk_clut_4D_avx+0x253d>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26846,18 +30673,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,122,16,0,0 // vbroadcastss 0x107a(%rip),%ymm0 # 7fd0 <_sk_callback_avx+0x560>
+ .byte 196,226,125,24,5,130,66,0,0 // vbroadcastss 0x4282(%rip),%ymm0 # b1d8 <_sk_clut_4D_avx+0x2541>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,113,16,0,0 // vbroadcastss 0x1071(%rip),%ymm1 # 7fd4 <_sk_callback_avx+0x564>
+ .byte 196,226,125,24,13,121,66,0,0 // vbroadcastss 0x4279(%rip),%ymm1 # b1dc <_sk_clut_4D_avx+0x2545>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,100,16,0,0 // vbroadcastss 0x1064(%rip),%ymm1 # 7fd8 <_sk_callback_avx+0x568>
+ .byte 196,226,125,24,13,108,66,0,0 // vbroadcastss 0x426c(%rip),%ymm1 # b1e0 <_sk_clut_4D_avx+0x2549>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,87,16,0,0 // vbroadcastss 0x1057(%rip),%ymm1 # 7fdc <_sk_callback_avx+0x56c>
+ .byte 196,226,125,24,13,95,66,0,0 // vbroadcastss 0x425f(%rip),%ymm1 # b1e4 <_sk_clut_4D_avx+0x254d>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,74,16,0,0 // vbroadcastss 0x104a(%rip),%ymm1 # 7fe0 <_sk_callback_avx+0x570>
+ .byte 196,226,125,24,13,82,66,0,0 // vbroadcastss 0x4252(%rip),%ymm1 # b1e8 <_sk_clut_4D_avx+0x2551>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -26885,7 +30712,7 @@ _sk_gradient_avx:
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,2,16,0,0 // vbroadcastss 0x1002(%rip),%ymm10 # 7fe4 <_sk_callback_avx+0x574>
+ .byte 196,98,125,24,21,10,66,0,0 // vbroadcastss 0x420a(%rip),%ymm10 # b1ec <_sk_clut_4D_avx+0x2555>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -27080,27 +30907,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,248,11,0,0 // vbroadcastss 0xbf8(%rip),%ymm13 # 7fe8 <_sk_callback_avx+0x578>
+ .byte 196,98,125,24,45,0,62,0,0 // vbroadcastss 0x3e00(%rip),%ymm13 # b1f0 <_sk_clut_4D_avx+0x2559>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,238,11,0,0 // vbroadcastss 0xbee(%rip),%ymm14 # 7fec <_sk_callback_avx+0x57c>
+ .byte 196,98,125,24,53,246,61,0,0 // vbroadcastss 0x3df6(%rip),%ymm14 # b1f4 <_sk_clut_4D_avx+0x255d>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,223,11,0,0 // vbroadcastss 0xbdf(%rip),%ymm14 # 7ff0 <_sk_callback_avx+0x580>
+ .byte 196,98,125,24,53,231,61,0,0 // vbroadcastss 0x3de7(%rip),%ymm14 # b1f8 <_sk_clut_4D_avx+0x2561>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,208,11,0,0 // vbroadcastss 0xbd0(%rip),%ymm13 # 7ff4 <_sk_callback_avx+0x584>
+ .byte 196,98,125,24,45,216,61,0,0 // vbroadcastss 0x3dd8(%rip),%ymm13 # b1fc <_sk_clut_4D_avx+0x2565>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,187,11,0,0 // vbroadcastss 0xbbb(%rip),%ymm10 # 7ff8 <_sk_callback_avx+0x588>
+ .byte 196,98,125,24,21,195,61,0,0 // vbroadcastss 0x3dc3(%rip),%ymm10 # b200 <_sk_clut_4D_avx+0x2569>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,165,11,0,0 // vbroadcastss 0xba5(%rip),%ymm10 # 7ffc <_sk_callback_avx+0x58c>
+ .byte 196,98,125,24,21,173,61,0,0 // vbroadcastss 0x3dad(%rip),%ymm10 # b204 <_sk_clut_4D_avx+0x256d>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,143,11,0,0 // vbroadcastss 0xb8f(%rip),%ymm10 # 8000 <_sk_callback_avx+0x590>
+ .byte 196,98,125,24,21,151,61,0,0 // vbroadcastss 0x3d97(%rip),%ymm10 # b208 <_sk_clut_4D_avx+0x2571>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -27130,7 +30957,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,57,11,0,0 // vbroadcastss 0xb39(%rip),%ymm11 # 8004 <_sk_callback_avx+0x594>
+ .byte 196,98,125,24,29,65,61,0,0 // vbroadcastss 0x3d41(%rip),%ymm11 # b20c <_sk_clut_4D_avx+0x2575>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -27139,17 +30966,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,13,11,0,0 // vbroadcastss 0xb0d(%rip),%ymm9 # 8008 <_sk_callback_avx+0x598>
+ .byte 196,98,125,24,13,21,61,0,0 // vbroadcastss 0x3d15(%rip),%ymm9 # b210 <_sk_clut_4D_avx+0x2579>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,235,10,0,0 // vbroadcastss 0xaeb(%rip),%ymm9 # 800c <_sk_callback_avx+0x59c>
+ .byte 196,98,125,24,13,243,60,0,0 // vbroadcastss 0x3cf3(%rip),%ymm9 # b214 <_sk_clut_4D_avx+0x257d>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,220,10,0,0 // vbroadcastss 0xadc(%rip),%ymm11 # 8010 <_sk_callback_avx+0x5a0>
+ .byte 196,98,125,24,29,228,60,0,0 // vbroadcastss 0x3ce4(%rip),%ymm11 # b218 <_sk_clut_4D_avx+0x2581>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -27169,7 +30996,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,155,10,0,0 // vbroadcastss 0xa9b(%rip),%ymm11 # 8014 <_sk_callback_avx+0x5a4>
+ .byte 196,98,125,24,29,163,60,0,0 // vbroadcastss 0x3ca3(%rip),%ymm11 # b21c <_sk_clut_4D_avx+0x2585>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -27178,17 +31005,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,111,10,0,0 // vbroadcastss 0xa6f(%rip),%ymm9 # 8018 <_sk_callback_avx+0x5a8>
+ .byte 196,98,125,24,13,119,60,0,0 // vbroadcastss 0x3c77(%rip),%ymm9 # b220 <_sk_clut_4D_avx+0x2589>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,77,10,0,0 // vbroadcastss 0xa4d(%rip),%ymm9 # 801c <_sk_callback_avx+0x5ac>
+ .byte 196,98,125,24,13,85,60,0,0 // vbroadcastss 0x3c55(%rip),%ymm9 # b224 <_sk_clut_4D_avx+0x258d>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,62,10,0,0 // vbroadcastss 0xa3e(%rip),%ymm11 # 8020 <_sk_callback_avx+0x5b0>
+ .byte 196,98,125,24,29,70,60,0,0 // vbroadcastss 0x3c46(%rip),%ymm11 # b228 <_sk_clut_4D_avx+0x2591>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -27207,7 +31034,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,3,10,0,0 // vbroadcastss 0xa03(%rip),%ymm10 # 8024 <_sk_callback_avx+0x5b4>
+ .byte 196,98,125,24,21,11,60,0,0 // vbroadcastss 0x3c0b(%rip),%ymm10 # b22c <_sk_clut_4D_avx+0x2595>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -27216,7 +31043,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,215,9,0,0 // vbroadcastss 0x9d7(%rip),%ymm8 # 8028 <_sk_callback_avx+0x5b8>
+ .byte 196,98,125,24,5,223,59,0,0 // vbroadcastss 0x3bdf(%rip),%ymm8 # b230 <_sk_clut_4D_avx+0x2599>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27257,7 +31084,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,115,9,0,0 // vbroadcastss 0x973(%rip),%ymm8 # 802c <_sk_callback_avx+0x5bc>
+ .byte 196,98,125,24,5,123,59,0,0 // vbroadcastss 0x3b7b(%rip),%ymm8 # b234 <_sk_clut_4D_avx+0x259d>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -27294,9 +31121,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,255,8,0,0 // vbroadcastss 0x8ff(%rip),%ymm0 # 8030 <_sk_callback_avx+0x5c0>
+ .byte 196,226,125,24,5,7,59,0,0 // vbroadcastss 0x3b07(%rip),%ymm0 # b238 <_sk_clut_4D_avx+0x25a1>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,246,8,0,0 // vbroadcastss 0x8f6(%rip),%ymm8 # 8034 <_sk_callback_avx+0x5c4>
+ .byte 196,98,125,24,5,254,58,0,0 // vbroadcastss 0x3afe(%rip),%ymm8 # b23c <_sk_clut_4D_avx+0x25a5>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27307,7 +31134,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,222,8,0,0 // vbroadcastss 0x8de(%rip),%ymm0 # 8038 <_sk_callback_avx+0x5c8>
+ .byte 196,226,125,24,5,230,58,0,0 // vbroadcastss 0x3ae6(%rip),%ymm0 # b240 <_sk_clut_4D_avx+0x25a9>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -27319,9 +31146,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,194,8,0,0 // vbroadcastss 0x8c2(%rip),%ymm1 # 803c <_sk_callback_avx+0x5cc>
+ .byte 196,226,125,24,13,202,58,0,0 // vbroadcastss 0x3aca(%rip),%ymm1 # b244 <_sk_clut_4D_avx+0x25ad>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,184,8,0,0 // vbroadcastss 0x8b8(%rip),%ymm8 # 8040 <_sk_callback_avx+0x5d0>
+ .byte 196,98,125,24,5,192,58,0,0 // vbroadcastss 0x3ac0(%rip),%ymm8 # b248 <_sk_clut_4D_avx+0x25b1>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27332,7 +31159,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,160,8,0,0 // vbroadcastss 0x8a0(%rip),%ymm1 # 8044 <_sk_callback_avx+0x5d4>
+ .byte 196,226,125,24,13,168,58,0,0 // vbroadcastss 0x3aa8(%rip),%ymm1 # b24c <_sk_clut_4D_avx+0x25b5>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -27344,14 +31171,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,131,8,0,0 // vbroadcastss 0x883(%rip),%ymm0 # 8048 <_sk_callback_avx+0x5d8>
+ .byte 196,226,125,24,5,139,58,0,0 // vbroadcastss 0x3a8b(%rip),%ymm0 # b250 <_sk_clut_4D_avx+0x25b9>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,122,8,0,0 // vbroadcastss 0x87a(%rip),%ymm8 # 804c <_sk_callback_avx+0x5dc>
+ .byte 196,98,125,24,5,130,58,0,0 // vbroadcastss 0x3a82(%rip),%ymm8 # b254 <_sk_clut_4D_avx+0x25bd>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,107,8,0,0 // vbroadcastss 0x86b(%rip),%ymm10 # 8050 <_sk_callback_avx+0x5e0>
+ .byte 196,98,125,24,21,115,58,0,0 // vbroadcastss 0x3a73(%rip),%ymm10 # b258 <_sk_clut_4D_avx+0x25c1>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,97,8,0,0 // vbroadcastss 0x861(%rip),%ymm10 # 8054 <_sk_callback_avx+0x5e4>
+ .byte 196,98,125,24,21,105,58,0,0 // vbroadcastss 0x3a69(%rip),%ymm10 # b25c <_sk_clut_4D_avx+0x25c5>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -27363,19 +31190,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,68,8,0,0 // vbroadcastss 0x844(%rip),%ymm0 # 8058 <_sk_callback_avx+0x5e8>
+ .byte 196,226,125,24,5,76,58,0,0 // vbroadcastss 0x3a4c(%rip),%ymm0 # b260 <_sk_clut_4D_avx+0x25c9>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,59,8,0,0 // vbroadcastss 0x83b(%rip),%ymm8 # 805c <_sk_callback_avx+0x5ec>
+ .byte 196,98,125,24,5,67,58,0,0 // vbroadcastss 0x3a43(%rip),%ymm8 # b264 <_sk_clut_4D_avx+0x25cd>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,49,8,0,0 // vbroadcastss 0x831(%rip),%ymm9 # 8060 <_sk_callback_avx+0x5f0>
+ .byte 196,98,125,24,13,57,58,0,0 // vbroadcastss 0x3a39(%rip),%ymm9 # b268 <_sk_clut_4D_avx+0x25d1>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,39,8,0,0 // vbroadcastss 0x827(%rip),%ymm10 # 8064 <_sk_callback_avx+0x5f4>
+ .byte 196,98,125,24,21,47,58,0,0 // vbroadcastss 0x3a2f(%rip),%ymm10 # b26c <_sk_clut_4D_avx+0x25d5>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,24,8,0,0 // vbroadcastss 0x818(%rip),%ymm10 # 8068 <_sk_callback_avx+0x5f8>
+ .byte 196,98,125,24,21,32,58,0,0 // vbroadcastss 0x3a20(%rip),%ymm10 # b270 <_sk_clut_4D_avx+0x25d9>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,9,8,0,0 // vbroadcastss 0x809(%rip),%ymm9 # 806c <_sk_callback_avx+0x5fc>
+ .byte 196,98,125,24,13,17,58,0,0 // vbroadcastss 0x3a11(%rip),%ymm9 # b274 <_sk_clut_4D_avx+0x25dd>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27386,17 +31213,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,241,7,0,0 // vbroadcastss 0x7f1(%rip),%ymm8 # 8070 <_sk_callback_avx+0x600>
+ .byte 196,98,125,24,5,249,57,0,0 // vbroadcastss 0x39f9(%rip),%ymm8 # b278 <_sk_clut_4D_avx+0x25e1>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,227,7,0,0 // vbroadcastss 0x7e3(%rip),%ymm10 # 8074 <_sk_callback_avx+0x604>
+ .byte 196,98,125,24,21,235,57,0,0 // vbroadcastss 0x39eb(%rip),%ymm10 # b27c <_sk_clut_4D_avx+0x25e5>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,217,7,0,0 // vbroadcastss 0x7d9(%rip),%ymm11 # 8078 <_sk_callback_avx+0x608>
+ .byte 196,98,125,24,29,225,57,0,0 // vbroadcastss 0x39e1(%rip),%ymm11 # b280 <_sk_clut_4D_avx+0x25e9>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,192,7,0,0 // vbroadcastss 0x7c0(%rip),%ymm9 # 807c <_sk_callback_avx+0x60c>
+ .byte 196,98,125,24,13,200,57,0,0 // vbroadcastss 0x39c8(%rip),%ymm9 # b284 <_sk_clut_4D_avx+0x25ed>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27407,13 +31234,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,168,7,0,0 // vbroadcastss 0x7a8(%rip),%ymm0 # 8080 <_sk_callback_avx+0x610>
+ .byte 196,226,125,24,5,176,57,0,0 // vbroadcastss 0x39b0(%rip),%ymm0 # b288 <_sk_clut_4D_avx+0x25f1>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,149,7,0,0 // vbroadcastss 0x795(%rip),%ymm10 # 8084 <_sk_callback_avx+0x614>
+ .byte 196,98,125,24,21,157,57,0,0 // vbroadcastss 0x399d(%rip),%ymm10 # b28c <_sk_clut_4D_avx+0x25f5>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,139,7,0,0 // vbroadcastss 0x78b(%rip),%ymm10 # 8088 <_sk_callback_avx+0x618>
+ .byte 196,98,125,24,21,147,57,0,0 // vbroadcastss 0x3993(%rip),%ymm10 # b290 <_sk_clut_4D_avx+0x25f9>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -27425,14 +31252,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,110,7,0,0 // vbroadcastss 0x76e(%rip),%ymm1 # 808c <_sk_callback_avx+0x61c>
+ .byte 196,226,125,24,13,118,57,0,0 // vbroadcastss 0x3976(%rip),%ymm1 # b294 <_sk_clut_4D_avx+0x25fd>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,100,7,0,0 // vbroadcastss 0x764(%rip),%ymm8 # 8090 <_sk_callback_avx+0x620>
+ .byte 196,98,125,24,5,108,57,0,0 // vbroadcastss 0x396c(%rip),%ymm8 # b298 <_sk_clut_4D_avx+0x2601>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,85,7,0,0 // vbroadcastss 0x755(%rip),%ymm10 # 8094 <_sk_callback_avx+0x624>
+ .byte 196,98,125,24,21,93,57,0,0 // vbroadcastss 0x395d(%rip),%ymm10 # b29c <_sk_clut_4D_avx+0x2605>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm10 # 8098 <_sk_callback_avx+0x628>
+ .byte 196,98,125,24,21,83,57,0,0 // vbroadcastss 0x3953(%rip),%ymm10 # b2a0 <_sk_clut_4D_avx+0x2609>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -27444,19 +31271,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm1 # 809c <_sk_callback_avx+0x62c>
+ .byte 196,226,125,24,13,54,57,0,0 // vbroadcastss 0x3936(%rip),%ymm1 # b2a4 <_sk_clut_4D_avx+0x260d>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,36,7,0,0 // vbroadcastss 0x724(%rip),%ymm8 # 80a0 <_sk_callback_avx+0x630>
+ .byte 196,98,125,24,5,44,57,0,0 // vbroadcastss 0x392c(%rip),%ymm8 # b2a8 <_sk_clut_4D_avx+0x2611>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,26,7,0,0 // vbroadcastss 0x71a(%rip),%ymm9 # 80a4 <_sk_callback_avx+0x634>
+ .byte 196,98,125,24,13,34,57,0,0 // vbroadcastss 0x3922(%rip),%ymm9 # b2ac <_sk_clut_4D_avx+0x2615>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,16,7,0,0 // vbroadcastss 0x710(%rip),%ymm10 # 80a8 <_sk_callback_avx+0x638>
+ .byte 196,98,125,24,21,24,57,0,0 // vbroadcastss 0x3918(%rip),%ymm10 # b2b0 <_sk_clut_4D_avx+0x2619>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,1,7,0,0 // vbroadcastss 0x701(%rip),%ymm10 # 80ac <_sk_callback_avx+0x63c>
+ .byte 196,98,125,24,21,9,57,0,0 // vbroadcastss 0x3909(%rip),%ymm10 # b2b4 <_sk_clut_4D_avx+0x261d>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,242,6,0,0 // vbroadcastss 0x6f2(%rip),%ymm9 # 80b0 <_sk_callback_avx+0x640>
+ .byte 196,98,125,24,13,250,56,0,0 // vbroadcastss 0x38fa(%rip),%ymm9 # b2b8 <_sk_clut_4D_avx+0x2621>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27467,17 +31294,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm8 # 80b4 <_sk_callback_avx+0x644>
+ .byte 196,98,125,24,5,226,56,0,0 // vbroadcastss 0x38e2(%rip),%ymm8 # b2bc <_sk_clut_4D_avx+0x2625>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,203,6,0,0 // vbroadcastss 0x6cb(%rip),%ymm10 # 80b8 <_sk_callback_avx+0x648>
+ .byte 196,98,125,24,21,211,56,0,0 // vbroadcastss 0x38d3(%rip),%ymm10 # b2c0 <_sk_clut_4D_avx+0x2629>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,193,6,0,0 // vbroadcastss 0x6c1(%rip),%ymm11 # 80bc <_sk_callback_avx+0x64c>
+ .byte 196,98,125,24,29,201,56,0,0 // vbroadcastss 0x38c9(%rip),%ymm11 # b2c4 <_sk_clut_4D_avx+0x262d>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,168,6,0,0 // vbroadcastss 0x6a8(%rip),%ymm9 # 80c0 <_sk_callback_avx+0x650>
+ .byte 196,98,125,24,13,176,56,0,0 // vbroadcastss 0x38b0(%rip),%ymm9 # b2c8 <_sk_clut_4D_avx+0x2631>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27488,13 +31315,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,144,6,0,0 // vbroadcastss 0x690(%rip),%ymm1 # 80c4 <_sk_callback_avx+0x654>
+ .byte 196,226,125,24,13,152,56,0,0 // vbroadcastss 0x3898(%rip),%ymm1 # b2cc <_sk_clut_4D_avx+0x2635>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,124,6,0,0 // vbroadcastss 0x67c(%rip),%ymm10 # 80c8 <_sk_callback_avx+0x658>
+ .byte 196,98,125,24,21,132,56,0,0 // vbroadcastss 0x3884(%rip),%ymm10 # b2d0 <_sk_clut_4D_avx+0x2639>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,114,6,0,0 // vbroadcastss 0x672(%rip),%ymm10 # 80cc <_sk_callback_avx+0x65c>
+ .byte 196,98,125,24,21,122,56,0,0 // vbroadcastss 0x387a(%rip),%ymm10 # b2d4 <_sk_clut_4D_avx+0x263d>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -27583,6 +31410,2443 @@ _sk_callback_avx:
.byte 93 // pop %rbp
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_clut_3D_avx
+.globl _sk_clut_3D_avx
+FUNCTION(_sk_clut_3D_avx)
+_sk_clut_3D_avx:
+ .byte 65,87 // push %r15
+ .byte 65,86 // push %r14
+ .byte 83 // push %rbx
+ .byte 72,129,236,0,2,0,0 // sub $0x200,%rsp
+ .byte 197,252,17,188,36,224,1,0,0 // vmovups %ymm7,0x1e0(%rsp)
+ .byte 197,252,17,180,36,192,1,0,0 // vmovups %ymm6,0x1c0(%rsp)
+ .byte 197,252,17,172,36,160,1,0,0 // vmovups %ymm5,0x1a0(%rsp)
+ .byte 197,252,17,164,36,128,1,0,0 // vmovups %ymm4,0x180(%rsp)
+ .byte 197,252,17,156,36,96,1,0,0 // vmovups %ymm3,0x160(%rsp)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,16 // mov 0x10(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,218 // vmovd %r10d,%xmm3
+ .byte 197,249,112,219,0 // vpshufd $0x0,%xmm3,%xmm3
+ .byte 196,227,101,24,219,1 // vinsertf128 $0x1,%xmm3,%ymm3,%ymm3
+ .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,252,17,148,36,0,1,0,0 // vmovups %ymm2,0x100(%rsp)
+ .byte 197,254,91,218 // vcvttps2dq %ymm2,%ymm3
+ .byte 68,139,80,12 // mov 0xc(%rax),%r10d
+ .byte 69,141,90,255 // lea -0x1(%r10),%r11d
+ .byte 196,193,121,110,211 // vmovd %r11d,%xmm2
+ .byte 197,249,112,210,0 // vpshufd $0x0,%xmm2,%xmm2
+ .byte 196,227,109,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
+ .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
+ .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
+ .byte 197,252,17,12,36 // vmovups %ymm1,(%rsp)
+ .byte 197,254,91,225 // vcvttps2dq %ymm1,%ymm4
+ .byte 196,193,121,110,201 // vmovd %r9d,%xmm1
+ .byte 197,121,112,233,0 // vpshufd $0x0,%xmm1,%xmm13
+ .byte 196,194,89,64,213 // vpmulld %xmm13,%xmm4,%xmm2
+ .byte 197,253,111,236 // vmovdqa %ymm4,%ymm5
+ .byte 197,254,127,108,36,96 // vmovdqu %ymm5,0x60(%rsp)
+ .byte 197,249,127,148,36,160,0,0,0 // vmovdqa %xmm2,0xa0(%rsp)
+ .byte 197,105,254,211 // vpaddd %xmm3,%xmm2,%xmm10
+ .byte 197,254,127,156,36,224,0,0,0 // vmovdqu %ymm3,0xe0(%rsp)
+ .byte 196,193,121,110,210 // vmovd %r10d,%xmm2
+ .byte 196,226,105,64,201 // vpmulld %xmm1,%xmm2,%xmm1
+ .byte 197,121,112,241,0 // vpshufd $0x0,%xmm1,%xmm14
+ .byte 68,139,72,8 // mov 0x8(%rax),%r9d
+ .byte 65,255,201 // dec %r9d
+ .byte 196,193,121,110,201 // vmovd %r9d,%xmm1
+ .byte 197,249,112,201,0 // vpshufd $0x0,%xmm1,%xmm1
+ .byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
+ .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
+ .byte 197,116,89,192 // vmulps %ymm0,%ymm1,%ymm8
+ .byte 196,193,126,91,200 // vcvttps2dq %ymm8,%ymm1
+ .byte 196,194,113,64,198 // vpmulld %xmm14,%xmm1,%xmm0
+ .byte 197,253,111,241 // vmovdqa %ymm1,%ymm6
+ .byte 197,254,127,116,36,160 // vmovdqu %ymm6,-0x60(%rsp)
+ .byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp)
+ .byte 72,139,0 // mov (%rax),%rax
+ .byte 196,193,121,254,194 // vpaddd %xmm10,%xmm0,%xmm0
+ .byte 196,98,121,24,29,18,54,0,0 // vbroadcastss 0x3612(%rip),%xmm11 # b2dc <_sk_clut_4D_avx+0x2645>
+ .byte 196,194,121,64,203 // vpmulld %xmm11,%xmm0,%xmm1
+ .byte 196,193,249,126,201 // vmovq %xmm1,%r9
+ .byte 69,137,202 // mov %r9d,%r10d
+ .byte 196,195,249,22,203,1 // vpextrq $0x1,%xmm1,%r11
+ .byte 68,137,219 // mov %r11d,%ebx
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,4,144 // vmovss (%rax,%r10,4),%xmm0
+ .byte 196,163,121,33,4,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm0,%xmm0
+ .byte 196,227,121,33,4,152,32 // vinsertps $0x20,(%rax,%rbx,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,152 // vmovss (%rax,%r11,4),%xmm2
+ .byte 196,227,121,33,226,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm4
+ .byte 196,227,125,25,232,1 // vextractf128 $0x1,%ymm5,%xmm0
+ .byte 196,194,121,64,213 // vpmulld %xmm13,%xmm0,%xmm2
+ .byte 197,249,127,148,36,128,0,0,0 // vmovdqa %xmm2,0x80(%rsp)
+ .byte 196,227,125,25,240,1 // vextractf128 $0x1,%ymm6,%xmm0
+ .byte 196,194,121,64,238 // vpmulld %xmm14,%xmm0,%xmm5
+ .byte 197,249,127,108,36,208 // vmovdqa %xmm5,-0x30(%rsp)
+ .byte 196,227,125,25,216,1 // vextractf128 $0x1,%ymm3,%xmm0
+ .byte 197,248,41,68,36,128 // vmovaps %xmm0,-0x80(%rsp)
+ .byte 197,233,254,192 // vpaddd %xmm0,%xmm2,%xmm0
+ .byte 197,209,254,208 // vpaddd %xmm0,%xmm5,%xmm2
+ .byte 196,194,105,64,211 // vpmulld %xmm11,%xmm2,%xmm2
+ .byte 197,249,126,211 // vmovd %xmm2,%ebx
+ .byte 196,195,121,22,209,1 // vpextrd $0x1,%xmm2,%r9d
+ .byte 196,195,121,22,210,2 // vpextrd $0x2,%xmm2,%r10d
+ .byte 196,195,121,22,211,3 // vpextrd $0x3,%xmm2,%r11d
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,163,65,33,60,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm7,%xmm7
+ .byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
+ .byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,227,93,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
+ .byte 197,252,17,92,36,64 // vmovups %ymm3,0x40(%rsp)
+ .byte 196,98,121,24,13,85,53,0,0 // vbroadcastss 0x3555(%rip),%xmm9 # b2e0 <_sk_clut_4D_avx+0x2649>
+ .byte 196,193,105,254,249 // vpaddd %xmm9,%xmm2,%xmm7
+ .byte 196,195,249,22,249,1 // vpextrq $0x1,%xmm7,%r9
+ .byte 196,193,249,126,250 // vmovq %xmm7,%r10
+ .byte 196,193,113,254,249 // vpaddd %xmm9,%xmm1,%xmm7
+ .byte 196,225,249,126,251 // vmovq %xmm7,%rbx
+ .byte 196,195,249,22,251,1 // vpextrq $0x1,%xmm7,%r11
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,60,176 // vmovss (%rax,%r14,4),%xmm7
+ .byte 196,163,65,33,60,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm7,%xmm7
+ .byte 196,161,122,16,52,184 // vmovss (%rax,%r15,4),%xmm6
+ .byte 196,227,65,33,246,32 // vinsertps $0x20,%xmm6,%xmm7,%xmm6
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,73,33,247,48 // vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ .byte 65,137,217 // mov %ebx,%r9d
+ .byte 69,137,218 // mov %r11d,%r10d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,65,33,60,152,16 // vinsertps $0x10,(%rax,%rbx,4),%xmm7,%xmm7
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,65,33,237,32 // vinsertps $0x20,%xmm5,%xmm7,%xmm5
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
+ .byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
+ .byte 196,99,85,24,254,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
+ .byte 196,98,121,24,37,196,52,0,0 // vbroadcastss 0x34c4(%rip),%xmm12 # b2e4 <_sk_clut_4D_avx+0x264d>
+ .byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,113,254,204 // vpaddd %xmm12,%xmm1,%xmm1
+ .byte 196,193,249,126,203 // vmovq %xmm1,%r11
+ .byte 196,227,249,22,203,1 // vpextrq $0x1,%xmm1,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,12,176 // vmovss (%rax,%r14,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,113,33,202,32 // vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,113,33,202,48 // vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,105,33,213,32 // vinsertps $0x20,%xmm5,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
+ .byte 196,227,105,33,213,48 // vinsertps $0x30,%xmm5,%xmm2,%xmm2
+ .byte 196,227,109,24,225,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
+ .byte 196,226,125,24,13,36,52,0,0 // vbroadcastss 0x3424(%rip),%ymm1 # b2d8 <_sk_clut_4D_avx+0x2641>
+ .byte 197,188,88,209 // vaddps %ymm1,%ymm8,%ymm2
+ .byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp)
+ .byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2
+ .byte 196,227,125,25,213,1 // vextractf128 $0x1,%ymm2,%xmm5
+ .byte 196,194,81,64,222 // vpmulld %xmm14,%xmm5,%xmm3
+ .byte 197,249,127,92,36,240 // vmovdqa %xmm3,-0x10(%rsp)
+ .byte 196,194,105,64,214 // vpmulld %xmm14,%xmm2,%xmm2
+ .byte 197,249,127,84,36,192 // vmovdqa %xmm2,-0x40(%rsp)
+ .byte 196,193,105,254,210 // vpaddd %xmm10,%xmm2,%xmm2
+ .byte 196,194,105,64,235 // vpmulld %xmm11,%xmm2,%xmm5
+ .byte 196,193,249,126,234 // vmovq %xmm5,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,235,1 // vpextrq $0x1,%xmm5,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,105,33,214,48 // vinsertps $0x30,%xmm6,%xmm2,%xmm2
+ .byte 197,225,254,192 // vpaddd %xmm0,%xmm3,%xmm0
+ .byte 196,194,121,64,195 // vpmulld %xmm11,%xmm0,%xmm0
+ .byte 197,249,126,195 // vmovd %xmm0,%ebx
+ .byte 196,195,121,22,193,1 // vpextrd $0x1,%xmm0,%r9d
+ .byte 196,195,121,22,194,2 // vpextrd $0x2,%xmm0,%r10d
+ .byte 196,195,121,22,195,3 // vpextrd $0x3,%xmm0,%r11d
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,163,73,33,52,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm6,%xmm6
+ .byte 196,163,73,33,52,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm6,%xmm6
+ .byte 196,163,73,33,52,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm6,%xmm6
+ .byte 196,227,109,24,214,1 // vinsertf128 $0x1,%xmm6,%ymm2,%ymm2
+ .byte 196,193,121,254,241 // vpaddd %xmm9,%xmm0,%xmm6
+ .byte 196,195,249,22,241,1 // vpextrq $0x1,%xmm6,%r9
+ .byte 196,193,249,126,242 // vmovq %xmm6,%r10
+ .byte 196,193,81,254,241 // vpaddd %xmm9,%xmm5,%xmm6
+ .byte 196,193,249,126,243 // vmovq %xmm6,%r11
+ .byte 196,227,249,22,243,1 // vpextrq $0x1,%xmm6,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,52,176 // vmovss (%rax,%r14,4),%xmm6
+ .byte 196,163,73,33,52,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm6,%xmm6
+ .byte 196,161,122,16,60,184 // vmovss (%rax,%r15,4),%xmm7
+ .byte 196,227,73,33,247,32 // vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,73,33,247,48 // vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,163,65,33,60,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,65,33,219,32 // vinsertps $0x20,%xmm3,%xmm7,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,97,33,223,48 // vinsertps $0x30,%xmm7,%xmm3,%xmm3
+ .byte 196,99,101,24,214,1 // vinsertf128 $0x1,%xmm6,%ymm3,%ymm10
+ .byte 196,193,121,254,196 // vpaddd %xmm12,%xmm0,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,81,254,196 // vpaddd %xmm12,%xmm5,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,97,33,221,32 // vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
+ .byte 196,227,97,33,221,48 // vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ .byte 196,227,101,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ .byte 197,252,91,92,36,160 // vcvtdq2ps -0x60(%rsp),%ymm3
+ .byte 197,60,92,243 // vsubps %ymm3,%ymm8,%ymm14
+ .byte 197,252,16,92,36,64 // vmovups 0x40(%rsp),%ymm3
+ .byte 197,236,92,211 // vsubps %ymm3,%ymm2,%ymm2
+ .byte 197,140,89,210 // vmulps %ymm2,%ymm14,%ymm2
+ .byte 197,228,88,210 // vaddps %ymm2,%ymm3,%ymm2
+ .byte 197,252,17,84,36,160 // vmovups %ymm2,-0x60(%rsp)
+ .byte 196,193,44,92,215 // vsubps %ymm15,%ymm10,%ymm2
+ .byte 197,140,89,210 // vmulps %ymm2,%ymm14,%ymm2
+ .byte 197,132,88,210 // vaddps %ymm2,%ymm15,%ymm2
+ .byte 197,252,17,148,36,64,1,0,0 // vmovups %ymm2,0x140(%rsp)
+ .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
+ .byte 197,140,89,192 // vmulps %ymm0,%ymm14,%ymm0
+ .byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
+ .byte 197,252,17,132,36,32,1,0,0 // vmovups %ymm0,0x120(%rsp)
+ .byte 197,244,88,4,36 // vaddps (%rsp),%ymm1,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 196,194,121,64,205 // vpmulld %xmm13,%xmm0,%xmm1
+ .byte 197,249,127,76,36,64 // vmovdqa %xmm1,0x40(%rsp)
+ .byte 196,227,125,25,192,1 // vextractf128 $0x1,%ymm0,%xmm0
+ .byte 196,194,121,64,213 // vpmulld %xmm13,%xmm0,%xmm2
+ .byte 197,249,127,148,36,208,0,0,0 // vmovdqa %xmm2,0xd0(%rsp)
+ .byte 197,241,254,180,36,224,0,0,0 // vpaddd 0xe0(%rsp),%xmm1,%xmm6
+ .byte 197,249,111,100,36,224 // vmovdqa -0x20(%rsp),%xmm4
+ .byte 197,201,254,196 // vpaddd %xmm4,%xmm6,%xmm0
+ .byte 196,194,121,64,235 // vpmulld %xmm11,%xmm0,%xmm5
+ .byte 196,193,249,126,234 // vmovq %xmm5,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,235,1 // vpextrq $0x1,%xmm5,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,227,121,33,201,48 // vinsertps $0x30,%xmm1,%xmm0,%xmm1
+ .byte 197,233,254,124,36,128 // vpaddd -0x80(%rsp),%xmm2,%xmm7
+ .byte 197,121,111,108,36,208 // vmovdqa -0x30(%rsp),%xmm13
+ .byte 196,193,65,254,197 // vpaddd %xmm13,%xmm7,%xmm0
+ .byte 196,194,121,64,195 // vpmulld %xmm11,%xmm0,%xmm0
+ .byte 197,249,126,195 // vmovd %xmm0,%ebx
+ .byte 196,195,121,22,193,1 // vpextrd $0x1,%xmm0,%r9d
+ .byte 196,195,121,22,194,2 // vpextrd $0x2,%xmm0,%r10d
+ .byte 196,195,121,22,195,3 // vpextrd $0x3,%xmm0,%r11d
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,163,105,33,20,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
+ .byte 197,252,17,76,36,128 // vmovups %ymm1,-0x80(%rsp)
+ .byte 196,193,121,254,201 // vpaddd %xmm9,%xmm0,%xmm1
+ .byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
+ .byte 196,193,249,126,202 // vmovq %xmm1,%r10
+ .byte 196,193,81,254,201 // vpaddd %xmm9,%xmm5,%xmm1
+ .byte 196,193,249,126,203 // vmovq %xmm1,%r11
+ .byte 196,227,249,22,203,1 // vpextrq $0x1,%xmm1,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,12,176 // vmovss (%rax,%r14,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,113,33,202,32 // vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,113,33,202,48 // vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,99,109,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm10
+ .byte 196,193,121,254,196 // vpaddd %xmm12,%xmm0,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,81,254,196 // vpaddd %xmm12,%xmm5,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,227,109,24,232,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm5
+ .byte 197,121,111,124,36,192 // vmovdqa -0x40(%rsp),%xmm15
+ .byte 197,129,254,198 // vpaddd %xmm6,%xmm15,%xmm0
+ .byte 196,194,121,64,243 // vpmulld %xmm11,%xmm0,%xmm6
+ .byte 196,193,249,126,242 // vmovq %xmm6,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,243,1 // vpextrq $0x1,%xmm6,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,227,121,33,210,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm2
+ .byte 197,193,254,68,36,240 // vpaddd -0x10(%rsp),%xmm7,%xmm0
+ .byte 196,194,121,64,195 // vpmulld %xmm11,%xmm0,%xmm0
+ .byte 197,249,126,195 // vmovd %xmm0,%ebx
+ .byte 196,195,121,22,193,1 // vpextrd $0x1,%xmm0,%r9d
+ .byte 196,195,121,22,194,2 // vpextrd $0x2,%xmm0,%r10d
+ .byte 196,195,121,22,195,3 // vpextrd $0x3,%xmm0,%r11d
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,163,97,33,28,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,227,109,24,251,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm7
+ .byte 196,193,121,254,209 // vpaddd %xmm9,%xmm0,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,73,254,209 // vpaddd %xmm9,%xmm6,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,12,144 // vmovss (%rax,%r10,4),%xmm1
+ .byte 196,227,97,33,201,32 // vinsertps $0x20,%xmm1,%xmm3,%xmm1
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,113,33,203,48 // vinsertps $0x30,%xmm3,%xmm1,%xmm1
+ .byte 196,99,117,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm8
+ .byte 196,193,121,254,196 // vpaddd %xmm12,%xmm0,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,73,254,196 // vpaddd %xmm12,%xmm6,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,12,184 // vmovss (%rax,%r15,4),%xmm1
+ .byte 196,227,121,33,193,32 // vinsertps $0x20,%xmm1,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,12,136 // vmovss (%rax,%r9,4),%xmm1
+ .byte 196,227,121,33,193,48 // vinsertps $0x30,%xmm1,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,12,136 // vmovss (%rax,%r9,4),%xmm1
+ .byte 196,163,113,33,12,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,161,122,16,20,144 // vmovss (%rax,%r10,4),%xmm2
+ .byte 196,227,113,33,202,32 // vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,227,113,33,202,48 // vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
+ .byte 197,252,16,84,36,128 // vmovups -0x80(%rsp),%ymm2
+ .byte 197,196,92,202 // vsubps %ymm2,%ymm7,%ymm1
+ .byte 197,140,89,201 // vmulps %ymm1,%ymm14,%ymm1
+ .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
+ .byte 196,193,60,92,210 // vsubps %ymm10,%ymm8,%ymm2
+ .byte 197,140,89,210 // vmulps %ymm2,%ymm14,%ymm2
+ .byte 197,172,88,210 // vaddps %ymm2,%ymm10,%ymm2
+ .byte 197,252,92,197 // vsubps %ymm5,%ymm0,%ymm0
+ .byte 197,140,89,192 // vmulps %ymm0,%ymm14,%ymm0
+ .byte 197,212,88,192 // vaddps %ymm0,%ymm5,%ymm0
+ .byte 197,252,91,92,36,96 // vcvtdq2ps 0x60(%rsp),%ymm3
+ .byte 197,252,16,44,36 // vmovups (%rsp),%ymm5
+ .byte 197,212,92,219 // vsubps %ymm3,%ymm5,%ymm3
+ .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
+ .byte 197,252,16,108,36,160 // vmovups -0x60(%rsp),%ymm5
+ .byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,212,88,201 // vaddps %ymm1,%ymm5,%ymm1
+ .byte 197,252,17,12,36 // vmovups %ymm1,(%rsp)
+ .byte 197,252,16,172,36,64,1,0,0 // vmovups 0x140(%rsp),%ymm5
+ .byte 197,236,92,205 // vsubps %ymm5,%ymm2,%ymm1
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,212,88,201 // vaddps %ymm1,%ymm5,%ymm1
+ .byte 197,252,17,76,36,96 // vmovups %ymm1,0x60(%rsp)
+ .byte 197,252,16,140,36,32,1,0,0 // vmovups 0x120(%rsp),%ymm1
+ .byte 197,252,92,193 // vsubps %ymm1,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,252,17,68,36,160 // vmovups %ymm0,-0x60(%rsp)
+ .byte 197,252,16,68,36,32 // vmovups 0x20(%rsp),%ymm0
+ .byte 197,252,88,132,36,0,1,0,0 // vaddps 0x100(%rsp),%ymm0,%ymm0
+ .byte 197,126,91,192 // vcvttps2dq %ymm0,%ymm8
+ .byte 197,185,254,188,36,160,0,0,0 // vpaddd 0xa0(%rsp),%xmm8,%xmm7
+ .byte 197,217,254,199 // vpaddd %xmm7,%xmm4,%xmm0
+ .byte 196,194,121,64,243 // vpmulld %xmm11,%xmm0,%xmm6
+ .byte 196,193,249,126,242 // vmovq %xmm6,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,243,1 // vpextrq $0x1,%xmm6,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,227,121,33,217,48 // vinsertps $0x30,%xmm1,%xmm0,%xmm3
+ .byte 196,99,125,25,192,1 // vextractf128 $0x1,%ymm8,%xmm0
+ .byte 197,248,41,68,36,32 // vmovaps %xmm0,0x20(%rsp)
+ .byte 197,249,254,140,36,128,0,0,0 // vpaddd 0x80(%rsp),%xmm0,%xmm1
+ .byte 197,145,254,193 // vpaddd %xmm1,%xmm13,%xmm0
+ .byte 196,194,121,64,195 // vpmulld %xmm11,%xmm0,%xmm0
+ .byte 197,249,126,195 // vmovd %xmm0,%ebx
+ .byte 196,195,121,22,193,1 // vpextrd $0x1,%xmm0,%r9d
+ .byte 196,195,121,22,194,2 // vpextrd $0x2,%xmm0,%r10d
+ .byte 196,195,121,22,195,3 // vpextrd $0x3,%xmm0,%r11d
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,163,105,33,20,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,227,101,24,226,1 // vinsertf128 $0x1,%xmm2,%ymm3,%ymm4
+ .byte 196,193,121,254,209 // vpaddd %xmm9,%xmm0,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,73,254,209 // vpaddd %xmm9,%xmm6,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,97,33,221,32 // vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
+ .byte 196,227,97,33,221,48 // vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ .byte 196,99,101,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm3,%ymm10
+ .byte 196,193,121,254,196 // vpaddd %xmm12,%xmm0,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,73,254,196 // vpaddd %xmm12,%xmm6,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,99,109,24,232,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm13
+ .byte 197,129,254,199 // vpaddd %xmm7,%xmm15,%xmm0
+ .byte 196,194,121,64,243 // vpmulld %xmm11,%xmm0,%xmm6
+ .byte 196,193,249,126,242 // vmovq %xmm6,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,243,1 // vpextrq $0x1,%xmm6,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 197,121,111,124,36,240 // vmovdqa -0x10(%rsp),%xmm15
+ .byte 197,129,254,201 // vpaddd %xmm1,%xmm15,%xmm1
+ .byte 196,194,113,64,251 // vpmulld %xmm11,%xmm1,%xmm7
+ .byte 197,249,126,251 // vmovd %xmm7,%ebx
+ .byte 196,195,121,22,249,1 // vpextrd $0x1,%xmm7,%r9d
+ .byte 196,195,121,22,250,2 // vpextrd $0x2,%xmm7,%r10d
+ .byte 196,195,121,22,251,3 // vpextrd $0x3,%xmm7,%r11d
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,227,125,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm1
+ .byte 196,193,65,254,193 // vpaddd %xmm9,%xmm7,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,73,254,193 // vpaddd %xmm9,%xmm6,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,227,109,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ .byte 196,193,65,254,212 // vpaddd %xmm12,%xmm7,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,73,254,212 // vpaddd %xmm12,%xmm6,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,97,33,221,32 // vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
+ .byte 196,227,97,33,221,48 // vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ .byte 196,227,101,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm3,%ymm2
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 197,140,89,201 // vmulps %ymm1,%ymm14,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 197,252,17,140,36,160,0,0,0 // vmovups %ymm1,0xa0(%rsp)
+ .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
+ .byte 197,140,89,192 // vmulps %ymm0,%ymm14,%ymm0
+ .byte 197,172,88,192 // vaddps %ymm0,%ymm10,%ymm0
+ .byte 197,252,17,132,36,128,0,0,0 // vmovups %ymm0,0x80(%rsp)
+ .byte 196,193,108,92,197 // vsubps %ymm13,%ymm2,%ymm0
+ .byte 197,140,89,192 // vmulps %ymm0,%ymm14,%ymm0
+ .byte 197,20,88,208 // vaddps %ymm0,%ymm13,%ymm10
+ .byte 197,249,111,68,36,32 // vmovdqa 0x20(%rsp),%xmm0
+ .byte 197,249,254,180,36,208,0,0,0 // vpaddd 0xd0(%rsp),%xmm0,%xmm6
+ .byte 197,185,254,68,36,64 // vpaddd 0x40(%rsp),%xmm8,%xmm0
+ .byte 197,249,254,76,36,224 // vpaddd -0x20(%rsp),%xmm0,%xmm1
+ .byte 196,66,113,64,235 // vpmulld %xmm11,%xmm1,%xmm13
+ .byte 196,65,249,126,234 // vmovq %xmm13,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,99,249,22,235,1 // vpextrq $0x1,%xmm13,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,12,136 // vmovss (%rax,%r9,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,227,113,33,202,48 // vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ .byte 197,201,254,84,36,208 // vpaddd -0x30(%rsp),%xmm6,%xmm2
+ .byte 196,194,105,64,211 // vpmulld %xmm11,%xmm2,%xmm2
+ .byte 197,249,126,211 // vmovd %xmm2,%ebx
+ .byte 196,195,121,22,209,1 // vpextrd $0x1,%xmm2,%r9d
+ .byte 196,195,121,22,210,2 // vpextrd $0x2,%xmm2,%r10d
+ .byte 196,195,121,22,211,3 // vpextrd $0x3,%xmm2,%r11d
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,163,97,33,28,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,227,117,24,203,1 // vinsertf128 $0x1,%xmm3,%ymm1,%ymm1
+ .byte 196,193,105,254,217 // vpaddd %xmm9,%xmm2,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,17,254,217 // vpaddd %xmm9,%xmm13,%xmm3
+ .byte 196,193,249,126,219 // vmovq %xmm3,%r11
+ .byte 196,227,249,22,219,1 // vpextrq $0x1,%xmm3,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,28,176 // vmovss (%rax,%r14,4),%xmm3
+ .byte 196,163,97,33,28,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,161,122,16,44,184 // vmovss (%rax,%r15,4),%xmm5
+ .byte 196,227,97,33,221,32 // vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,44,136 // vmovss (%rax,%r9,4),%xmm5
+ .byte 196,227,97,33,221,48 // vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,44,136 // vmovss (%rax,%r9,4),%xmm5
+ .byte 196,163,81,33,44,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm5,%xmm5
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,81,33,239,32 // vinsertps $0x20,%xmm7,%xmm5,%xmm5
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
+ .byte 196,227,85,24,235,1 // vinsertf128 $0x1,%xmm3,%ymm5,%ymm5
+ .byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,17,254,212 // vpaddd %xmm12,%xmm13,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,97,33,223,32 // vinsertps $0x20,%xmm7,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,97,33,223,48 // vinsertps $0x30,%xmm7,%xmm3,%xmm3
+ .byte 196,99,101,24,234,1 // vinsertf128 $0x1,%xmm2,%ymm3,%ymm13
+ .byte 197,249,254,68,36,192 // vpaddd -0x40(%rsp),%xmm0,%xmm0
+ .byte 197,129,254,214 // vpaddd %xmm6,%xmm15,%xmm2
+ .byte 196,194,105,64,243 // vpmulld %xmm11,%xmm2,%xmm6
+ .byte 196,194,121,64,195 // vpmulld %xmm11,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 197,249,126,243 // vmovd %xmm6,%ebx
+ .byte 196,195,121,22,241,1 // vpextrd $0x1,%xmm6,%r9d
+ .byte 196,195,121,22,242,2 // vpextrd $0x2,%xmm6,%r10d
+ .byte 196,195,121,22,243,3 // vpextrd $0x3,%xmm6,%r11d
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,163,97,33,28,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,227,109,24,219,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm3
+ .byte 196,193,73,254,209 // vpaddd %xmm9,%xmm6,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,121,254,209 // vpaddd %xmm9,%xmm0,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,105,33,212,32 // vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,105,33,212,48 // vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,89,33,231,32 // vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,89,33,231,48 // vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ .byte 196,227,93,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ .byte 196,193,73,254,228 // vpaddd %xmm12,%xmm6,%xmm4
+ .byte 196,195,249,22,225,1 // vpextrq $0x1,%xmm4,%r9
+ .byte 196,193,249,126,226 // vmovq %xmm4,%r10
+ .byte 196,193,121,254,196 // vpaddd %xmm12,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,195,249,22,199,1 // vpextrq $0x1,%xmm0,%r15
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 68,137,203 // mov %r9d,%ebx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,121,33,196,32 // vinsertps $0x20,%xmm4,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,121,33,196,48 // vinsertps $0x30,%xmm4,%xmm0,%xmm0
+ .byte 68,137,219 // mov %r11d,%ebx
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 68,137,251 // mov %r15d,%ebx
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 73,193,239,32 // shr $0x20,%r15
+ .byte 196,161,122,16,52,184 // vmovss (%rax,%r15,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 196,227,93,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm4,%ymm0
+ .byte 197,228,92,217 // vsubps %ymm1,%ymm3,%ymm3
+ .byte 197,140,89,219 // vmulps %ymm3,%ymm14,%ymm3
+ .byte 197,244,88,203 // vaddps %ymm3,%ymm1,%ymm1
+ .byte 197,236,92,213 // vsubps %ymm5,%ymm2,%ymm2
+ .byte 197,140,89,210 // vmulps %ymm2,%ymm14,%ymm2
+ .byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
+ .byte 196,193,124,92,197 // vsubps %ymm13,%ymm0,%ymm0
+ .byte 197,140,89,192 // vmulps %ymm0,%ymm14,%ymm0
+ .byte 197,148,88,192 // vaddps %ymm0,%ymm13,%ymm0
+ .byte 197,252,16,164,36,160,0,0,0 // vmovups 0xa0(%rsp),%ymm4
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 197,252,16,92,36,128 // vmovups -0x80(%rsp),%ymm3
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 197,252,16,164,36,128,0,0,0 // vmovups 0x80(%rsp),%ymm4
+ .byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,220,88,210 // vaddps %ymm2,%ymm4,%ymm2
+ .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,172,88,216 // vaddps %ymm0,%ymm10,%ymm3
+ .byte 197,252,91,132,36,224,0,0,0 // vcvtdq2ps 0xe0(%rsp),%ymm0
+ .byte 197,252,16,164,36,0,1,0,0 // vmovups 0x100(%rsp),%ymm4
+ .byte 197,220,92,224 // vsubps %ymm0,%ymm4,%ymm4
+ .byte 197,252,16,44,36 // vmovups (%rsp),%ymm5
+ .byte 197,244,92,197 // vsubps %ymm5,%ymm1,%ymm0
+ .byte 197,220,89,192 // vmulps %ymm0,%ymm4,%ymm0
+ .byte 197,212,88,192 // vaddps %ymm0,%ymm5,%ymm0
+ .byte 197,252,16,108,36,96 // vmovups 0x60(%rsp),%ymm5
+ .byte 197,236,92,205 // vsubps %ymm5,%ymm2,%ymm1
+ .byte 197,220,89,201 // vmulps %ymm1,%ymm4,%ymm1
+ .byte 197,212,88,201 // vaddps %ymm1,%ymm5,%ymm1
+ .byte 197,252,16,108,36,160 // vmovups -0x60(%rsp),%ymm5
+ .byte 197,228,92,213 // vsubps %ymm5,%ymm3,%ymm2
+ .byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2
+ .byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,16,156,36,96,1,0,0 // vmovups 0x160(%rsp),%ymm3
+ .byte 197,252,16,164,36,128,1,0,0 // vmovups 0x180(%rsp),%ymm4
+ .byte 197,252,16,172,36,160,1,0,0 // vmovups 0x1a0(%rsp),%ymm5
+ .byte 197,252,16,180,36,192,1,0,0 // vmovups 0x1c0(%rsp),%ymm6
+ .byte 197,252,16,188,36,224,1,0,0 // vmovups 0x1e0(%rsp),%ymm7
+ .byte 72,129,196,0,2,0,0 // add $0x200,%rsp
+ .byte 91 // pop %rbx
+ .byte 65,94 // pop %r14
+ .byte 65,95 // pop %r15
+ .byte 255,224 // jmpq *%rax
+
+HIDDEN _sk_clut_4D_avx
+.globl _sk_clut_4D_avx
+FUNCTION(_sk_clut_4D_avx)
+_sk_clut_4D_avx:
+ .byte 65,87 // push %r15
+ .byte 65,86 // push %r14
+ .byte 83 // push %rbx
+ .byte 72,129,236,160,2,0,0 // sub $0x2a0,%rsp
+ .byte 197,252,17,188,36,128,2,0,0 // vmovups %ymm7,0x280(%rsp)
+ .byte 197,252,17,180,36,96,2,0,0 // vmovups %ymm6,0x260(%rsp)
+ .byte 197,252,17,172,36,64,2,0,0 // vmovups %ymm5,0x240(%rsp)
+ .byte 197,252,17,164,36,32,2,0,0 // vmovups %ymm4,0x220(%rsp)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,20 // mov 0x14(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,226 // vmovd %r10d,%xmm4
+ .byte 197,249,112,228,0 // vpshufd $0x0,%xmm4,%xmm4
+ .byte 196,227,93,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm4,%ymm4
+ .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
+ .byte 197,220,89,219 // vmulps %ymm3,%ymm4,%ymm3
+ .byte 197,252,17,156,36,0,2,0,0 // vmovups %ymm3,0x200(%rsp)
+ .byte 197,254,91,227 // vcvttps2dq %ymm3,%ymm4
+ .byte 68,139,80,16 // mov 0x10(%rax),%r10d
+ .byte 69,141,90,255 // lea -0x1(%r10),%r11d
+ .byte 196,193,121,110,219 // vmovd %r11d,%xmm3
+ .byte 197,249,112,219,0 // vpshufd $0x0,%xmm3,%xmm3
+ .byte 196,227,101,24,219,1 // vinsertf128 $0x1,%xmm3,%ymm3,%ymm3
+ .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,252,17,148,36,32,1,0,0 // vmovups %ymm2,0x120(%rsp)
+ .byte 197,254,91,234 // vcvttps2dq %ymm2,%ymm5
+ .byte 196,193,121,110,209 // vmovd %r9d,%xmm2
+ .byte 197,249,112,242,0 // vpshufd $0x0,%xmm2,%xmm6
+ .byte 196,226,81,64,222 // vpmulld %xmm6,%xmm5,%xmm3
+ .byte 197,249,111,254 // vmovdqa %xmm6,%xmm7
+ .byte 197,249,127,124,36,224 // vmovdqa %xmm7,-0x20(%rsp)
+ .byte 197,254,127,172,36,128,1,0,0 // vmovdqu %ymm5,0x180(%rsp)
+ .byte 197,249,127,156,36,192,0,0,0 // vmovdqa %xmm3,0xc0(%rsp)
+ .byte 197,225,254,244 // vpaddd %xmm4,%xmm3,%xmm6
+ .byte 197,249,127,116,36,96 // vmovdqa %xmm6,0x60(%rsp)
+ .byte 197,254,127,164,36,224,1,0,0 // vmovdqu %ymm4,0x1e0(%rsp)
+ .byte 196,193,121,110,218 // vmovd %r10d,%xmm3
+ .byte 196,226,97,64,210 // vpmulld %xmm2,%xmm3,%xmm2
+ .byte 197,121,112,194,0 // vpshufd $0x0,%xmm2,%xmm8
+ .byte 68,139,72,12 // mov 0xc(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 196,193,121,110,218 // vmovd %r10d,%xmm3
+ .byte 197,249,112,219,0 // vpshufd $0x0,%xmm3,%xmm3
+ .byte 196,227,101,24,219,1 // vinsertf128 $0x1,%xmm3,%ymm3,%ymm3
+ .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
+ .byte 197,228,89,217 // vmulps %ymm1,%ymm3,%ymm3
+ .byte 197,252,17,156,36,128,0,0,0 // vmovups %ymm3,0x80(%rsp)
+ .byte 196,193,121,110,201 // vmovd %r9d,%xmm1
+ .byte 196,226,113,64,202 // vpmulld %xmm2,%xmm1,%xmm1
+ .byte 68,139,72,8 // mov 0x8(%rax),%r9d
+ .byte 65,255,201 // dec %r9d
+ .byte 196,193,121,110,209 // vmovd %r9d,%xmm2
+ .byte 197,249,112,210,0 // vpshufd $0x0,%xmm2,%xmm2
+ .byte 196,227,109,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
+ .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
+ .byte 197,108,89,232 // vmulps %ymm0,%ymm2,%ymm13
+ .byte 197,254,91,211 // vcvttps2dq %ymm3,%ymm2
+ .byte 197,249,112,193,0 // vpshufd $0x0,%xmm1,%xmm0
+ .byte 72,139,0 // mov (%rax),%rax
+ .byte 196,194,105,64,200 // vpmulld %xmm8,%xmm2,%xmm1
+ .byte 197,125,111,210 // vmovdqa %ymm2,%ymm10
+ .byte 197,126,127,148,36,224,0,0,0 // vmovdqu %ymm10,0xe0(%rsp)
+ .byte 197,249,127,140,36,0,1,0,0 // vmovdqa %xmm1,0x100(%rsp)
+ .byte 197,241,254,214 // vpaddd %xmm6,%xmm1,%xmm2
+ .byte 196,65,126,91,229 // vcvttps2dq %ymm13,%ymm12
+ .byte 196,226,25,64,200 // vpmulld %xmm0,%xmm12,%xmm1
+ .byte 197,249,127,76,36,128 // vmovdqa %xmm1,-0x80(%rsp)
+ .byte 197,241,254,202 // vpaddd %xmm2,%xmm1,%xmm1
+ .byte 196,98,121,24,61,226,36,0,0 // vbroadcastss 0x24e2(%rip),%xmm15 # b2ec <_sk_clut_4D_avx+0x2655>
+ .byte 196,194,113,64,247 // vpmulld %xmm15,%xmm1,%xmm6
+ .byte 196,193,249,126,241 // vmovq %xmm6,%r9
+ .byte 69,137,202 // mov %r9d,%r10d
+ .byte 196,195,249,22,243,1 // vpextrq $0x1,%xmm6,%r11
+ .byte 68,137,219 // mov %r11d,%ebx
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,12,144 // vmovss (%rax,%r10,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,227,113,33,12,152,32 // vinsertps $0x20,(%rax,%rbx,4),%xmm1,%xmm1
+ .byte 196,161,122,16,28,152 // vmovss (%rax,%r11,4),%xmm3
+ .byte 196,99,113,33,203,48 // vinsertps $0x30,%xmm3,%xmm1,%xmm9
+ .byte 196,227,125,25,233,1 // vextractf128 $0x1,%ymm5,%xmm1
+ .byte 196,226,113,64,239 // vpmulld %xmm7,%xmm1,%xmm5
+ .byte 197,249,127,172,36,160,0,0,0 // vmovdqa %xmm5,0xa0(%rsp)
+ .byte 196,99,125,25,209,1 // vextractf128 $0x1,%ymm10,%xmm1
+ .byte 196,194,113,64,216 // vpmulld %xmm8,%xmm1,%xmm3
+ .byte 197,249,127,92,36,16 // vmovdqa %xmm3,0x10(%rsp)
+ .byte 196,99,125,25,225,1 // vextractf128 $0x1,%ymm12,%xmm1
+ .byte 196,226,113,64,248 // vpmulld %xmm0,%xmm1,%xmm7
+ .byte 197,249,127,124,36,176 // vmovdqa %xmm7,-0x50(%rsp)
+ .byte 196,227,125,25,225,1 // vextractf128 $0x1,%ymm4,%xmm1
+ .byte 197,248,41,76,36,192 // vmovaps %xmm1,-0x40(%rsp)
+ .byte 197,209,254,201 // vpaddd %xmm1,%xmm5,%xmm1
+ .byte 197,249,127,140,36,64,1,0,0 // vmovdqa %xmm1,0x140(%rsp)
+ .byte 197,225,254,201 // vpaddd %xmm1,%xmm3,%xmm1
+ .byte 197,193,254,217 // vpaddd %xmm1,%xmm7,%xmm3
+ .byte 196,194,97,64,223 // vpmulld %xmm15,%xmm3,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,163,65,33,60,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm7,%xmm7
+ .byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
+ .byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,99,53,24,247,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
+ .byte 196,98,121,24,21,13,36,0,0 // vbroadcastss 0x240d(%rip),%xmm10 # b2f0 <_sk_clut_4D_avx+0x2659>
+ .byte 196,65,97,254,202 // vpaddd %xmm10,%xmm3,%xmm9
+ .byte 196,67,249,22,201,1 // vpextrq $0x1,%xmm9,%r9
+ .byte 196,65,249,126,202 // vmovq %xmm9,%r10
+ .byte 196,65,73,254,202 // vpaddd %xmm10,%xmm6,%xmm9
+ .byte 196,97,249,126,203 // vmovq %xmm9,%rbx
+ .byte 196,67,249,22,203,1 // vpextrq $0x1,%xmm9,%r11
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,60,176 // vmovss (%rax,%r14,4),%xmm7
+ .byte 196,163,65,33,60,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm7,%xmm7
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,65,33,228,32 // vinsertps $0x20,%xmm4,%xmm7,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,89,33,231,48 // vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ .byte 65,137,217 // mov %ebx,%r9d
+ .byte 69,137,218 // mov %r11d,%r10d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,65,33,60,152,16 // vinsertps $0x10,(%rax,%rbx,4),%xmm7,%xmm7
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,65,33,237,32 // vinsertps $0x20,%xmm5,%xmm7,%xmm5
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
+ .byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
+ .byte 196,99,85,24,220,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
+ .byte 196,98,121,24,13,124,35,0,0 // vbroadcastss 0x237c(%rip),%xmm9 # b2f4 <_sk_clut_4D_avx+0x265d>
+ .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,73,254,217 // vpaddd %xmm9,%xmm6,%xmm3
+ .byte 196,193,249,126,219 // vmovq %xmm3,%r11
+ .byte 196,227,249,22,219,1 // vpextrq $0x1,%xmm3,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,28,176 // vmovss (%rax,%r14,4),%xmm3
+ .byte 196,163,97,33,28,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,89,33,229,32 // vinsertps $0x20,%xmm5,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
+ .byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4
+ .byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
+ .byte 196,226,125,24,37,220,34,0,0 // vbroadcastss 0x22dc(%rip),%ymm4 # b2e8 <_sk_clut_4D_avx+0x2651>
+ .byte 197,148,88,220 // vaddps %ymm4,%ymm13,%ymm3
+ .byte 197,252,40,252 // vmovaps %ymm4,%ymm7
+ .byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
+ .byte 197,254,91,219 // vcvttps2dq %ymm3,%ymm3
+ .byte 196,227,125,25,220,1 // vextractf128 $0x1,%ymm3,%xmm4
+ .byte 196,226,89,64,224 // vpmulld %xmm0,%xmm4,%xmm4
+ .byte 197,249,127,100,36,160 // vmovdqa %xmm4,-0x60(%rsp)
+ .byte 196,226,97,64,192 // vpmulld %xmm0,%xmm3,%xmm0
+ .byte 197,249,127,68,36,144 // vmovdqa %xmm0,-0x70(%rsp)
+ .byte 197,249,254,194 // vpaddd %xmm2,%xmm0,%xmm0
+ .byte 196,194,121,64,215 // vpmulld %xmm15,%xmm0,%xmm2
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,121,33,219,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm3
+ .byte 197,217,254,193 // vpaddd %xmm1,%xmm4,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 197,249,126,195 // vmovd %xmm0,%ebx
+ .byte 196,195,121,22,193,1 // vpextrd $0x1,%xmm0,%r9d
+ .byte 196,195,121,22,194,2 // vpextrd $0x2,%xmm0,%r10d
+ .byte 196,195,121,22,195,3 // vpextrd $0x3,%xmm0,%r11d
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,227,101,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm3,%ymm3
+ .byte 196,193,121,254,202 // vpaddd %xmm10,%xmm0,%xmm1
+ .byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
+ .byte 196,193,249,126,202 // vmovq %xmm1,%r10
+ .byte 196,193,105,254,202 // vpaddd %xmm10,%xmm2,%xmm1
+ .byte 196,193,249,126,203 // vmovq %xmm1,%r11
+ .byte 196,227,249,22,203,1 // vpextrq $0x1,%xmm1,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,12,176 // vmovss (%rax,%r14,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,113,33,204,32 // vinsertps $0x20,%xmm4,%xmm1,%xmm1
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,113,33,204,48 // vinsertps $0x30,%xmm4,%xmm1,%xmm1
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,44,144 // vmovss (%rax,%r10,4),%xmm5
+ .byte 196,227,89,33,229,32 // vinsertps $0x20,%xmm5,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
+ .byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4
+ .byte 196,227,93,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm4,%ymm1
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,105,254,193 // vpaddd %xmm9,%xmm2,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,105,33,212,32 // vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,105,33,212,48 // vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ .byte 196,227,109,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ .byte 196,193,124,91,212 // vcvtdq2ps %ymm12,%ymm2
+ .byte 197,148,92,234 // vsubps %ymm2,%ymm13,%ymm5
+ .byte 196,193,100,92,214 // vsubps %ymm14,%ymm3,%ymm2
+ .byte 197,212,89,210 // vmulps %ymm2,%ymm5,%ymm2
+ .byte 197,12,88,234 // vaddps %ymm2,%ymm14,%ymm13
+ .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
+ .byte 197,212,89,201 // vmulps %ymm1,%ymm5,%ymm1
+ .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
+ .byte 197,252,17,140,36,96,1,0,0 // vmovups %ymm1,0x160(%rsp)
+ .byte 197,252,92,198 // vsubps %ymm6,%ymm0,%ymm0
+ .byte 197,212,89,192 // vmulps %ymm0,%ymm5,%ymm0
+ .byte 197,204,88,192 // vaddps %ymm0,%ymm6,%ymm0
+ .byte 197,252,17,68,36,64 // vmovups %ymm0,0x40(%rsp)
+ .byte 197,124,16,156,36,128,0,0,0 // vmovups 0x80(%rsp),%ymm11
+ .byte 197,164,88,199 // vaddps %ymm7,%ymm11,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 196,194,121,64,200 // vpmulld %xmm8,%xmm0,%xmm1
+ .byte 197,249,127,12,36 // vmovdqa %xmm1,(%rsp)
+ .byte 196,227,125,25,192,1 // vextractf128 $0x1,%ymm0,%xmm0
+ .byte 196,194,121,64,216 // vpmulld %xmm8,%xmm0,%xmm3
+ .byte 197,249,127,92,36,240 // vmovdqa %xmm3,-0x10(%rsp)
+ .byte 197,241,254,124,36,96 // vpaddd 0x60(%rsp),%xmm1,%xmm7
+ .byte 197,193,254,68,36,128 // vpaddd -0x80(%rsp),%xmm7,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,12,136 // vmovss (%rax,%r9,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,227,113,33,202,48 // vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ .byte 197,225,254,148,36,64,1,0,0 // vpaddd 0x140(%rsp),%xmm3,%xmm2
+ .byte 197,233,254,92,36,176 // vpaddd -0x50(%rsp),%xmm2,%xmm3
+ .byte 196,194,97,64,223 // vpmulld %xmm15,%xmm3,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,163,89,33,36,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,99,117,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm1,%ymm12
+ .byte 196,193,97,254,202 // vpaddd %xmm10,%xmm3,%xmm1
+ .byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
+ .byte 196,193,249,126,202 // vmovq %xmm1,%r10
+ .byte 196,193,121,254,202 // vpaddd %xmm10,%xmm0,%xmm1
+ .byte 196,193,249,126,203 // vmovq %xmm1,%r11
+ .byte 196,227,249,22,203,1 // vpextrq $0x1,%xmm1,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,12,176 // vmovss (%rax,%r14,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,113,33,204,32 // vinsertps $0x20,%xmm4,%xmm1,%xmm1
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,113,33,204,48 // vinsertps $0x30,%xmm4,%xmm1,%xmm1
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,52,144 // vmovss (%rax,%r10,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 196,227,93,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm4,%ymm1
+ .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,99,101,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm8
+ .byte 197,121,111,116,36,144 // vmovdqa -0x70(%rsp),%xmm14
+ .byte 197,137,254,199 // vpaddd %xmm7,%xmm14,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,228,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm4
+ .byte 197,233,254,84,36,160 // vpaddd -0x60(%rsp),%xmm2,%xmm2
+ .byte 196,194,105,64,223 // vpmulld %xmm15,%xmm2,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,163,105,33,20,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,227,93,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ .byte 196,193,97,254,226 // vpaddd %xmm10,%xmm3,%xmm4
+ .byte 196,195,249,22,225,1 // vpextrq $0x1,%xmm4,%r9
+ .byte 196,193,249,126,226 // vmovq %xmm4,%r10
+ .byte 196,193,121,254,226 // vpaddd %xmm10,%xmm0,%xmm4
+ .byte 196,193,249,126,227 // vmovq %xmm4,%r11
+ .byte 196,227,249,22,227,1 // vpextrq $0x1,%xmm4,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,36,176 // vmovss (%rax,%r14,4),%xmm4
+ .byte 196,163,89,33,36,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,161,122,16,52,184 // vmovss (%rax,%r15,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,163,73,33,52,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm6,%xmm6
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,73,33,247,32 // vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,73,33,247,48 // vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ .byte 196,227,77,24,252,1 // vinsertf128 $0x1,%xmm4,%ymm6,%ymm7
+ .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,227,101,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ .byte 196,193,108,92,212 // vsubps %ymm12,%ymm2,%ymm2
+ .byte 197,212,89,210 // vmulps %ymm2,%ymm5,%ymm2
+ .byte 197,156,88,210 // vaddps %ymm2,%ymm12,%ymm2
+ .byte 197,196,92,217 // vsubps %ymm1,%ymm7,%ymm3
+ .byte 197,212,89,219 // vmulps %ymm3,%ymm5,%ymm3
+ .byte 197,244,88,203 // vaddps %ymm3,%ymm1,%ymm1
+ .byte 196,193,124,92,192 // vsubps %ymm8,%ymm0,%ymm0
+ .byte 197,212,89,192 // vmulps %ymm0,%ymm5,%ymm0
+ .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
+ .byte 197,252,91,156,36,224,0,0,0 // vcvtdq2ps 0xe0(%rsp),%ymm3
+ .byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
+ .byte 197,252,17,156,36,224,0,0,0 // vmovups %ymm3,0xe0(%rsp)
+ .byte 196,193,108,92,213 // vsubps %ymm13,%ymm2,%ymm2
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,148,88,210 // vaddps %ymm2,%ymm13,%ymm2
+ .byte 197,252,17,148,36,128,0,0,0 // vmovups %ymm2,0x80(%rsp)
+ .byte 197,252,16,148,36,96,1,0,0 // vmovups 0x160(%rsp),%ymm2
+ .byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
+ .byte 197,252,17,76,36,96 // vmovups %ymm1,0x60(%rsp)
+ .byte 197,252,16,76,36,64 // vmovups 0x40(%rsp),%ymm1
+ .byte 197,252,92,193 // vsubps %ymm1,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,252,17,68,36,64 // vmovups %ymm0,0x40(%rsp)
+ .byte 197,252,16,68,36,32 // vmovups 0x20(%rsp),%ymm0
+ .byte 197,252,88,132,36,32,1,0,0 // vaddps 0x120(%rsp),%ymm0,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
+ .byte 197,249,111,84,36,224 // vmovdqa -0x20(%rsp),%xmm2
+ .byte 196,226,113,64,218 // vpmulld %xmm2,%xmm1,%xmm3
+ .byte 197,249,127,156,36,96,1,0,0 // vmovdqa %xmm3,0x160(%rsp)
+ .byte 196,226,121,64,194 // vpmulld %xmm2,%xmm0,%xmm0
+ .byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp)
+ .byte 197,249,254,132,36,224,1,0,0 // vpaddd 0x1e0(%rsp),%xmm0,%xmm0
+ .byte 197,249,127,132,36,208,1,0,0 // vmovdqa %xmm0,0x1d0(%rsp)
+ .byte 197,249,254,148,36,0,1,0,0 // vpaddd 0x100(%rsp),%xmm0,%xmm2
+ .byte 197,233,254,68,36,128 // vpaddd -0x80(%rsp),%xmm2,%xmm0
+ .byte 196,194,121,64,247 // vpmulld %xmm15,%xmm0,%xmm6
+ .byte 196,193,249,126,242 // vmovq %xmm6,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,243,1 // vpextrq $0x1,%xmm6,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,227,121,33,225,48 // vinsertps $0x30,%xmm1,%xmm0,%xmm4
+ .byte 197,225,254,68,36,192 // vpaddd -0x40(%rsp),%xmm3,%xmm0
+ .byte 197,249,127,132,36,192,1,0,0 // vmovdqa %xmm0,0x1c0(%rsp)
+ .byte 197,249,254,76,36,16 // vpaddd 0x10(%rsp),%xmm0,%xmm1
+ .byte 197,121,111,108,36,176 // vmovdqa -0x50(%rsp),%xmm13
+ .byte 196,193,113,254,221 // vpaddd %xmm13,%xmm1,%xmm3
+ .byte 196,194,97,64,223 // vpmulld %xmm15,%xmm3,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,163,65,33,60,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm7,%xmm7
+ .byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
+ .byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,227,93,24,199,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm0
+ .byte 197,252,17,68,36,192 // vmovups %ymm0,-0x40(%rsp)
+ .byte 196,193,97,254,250 // vpaddd %xmm10,%xmm3,%xmm7
+ .byte 196,195,249,22,249,1 // vpextrq $0x1,%xmm7,%r9
+ .byte 196,193,249,126,250 // vmovq %xmm7,%r10
+ .byte 196,193,73,254,250 // vpaddd %xmm10,%xmm6,%xmm7
+ .byte 196,193,249,126,251 // vmovq %xmm7,%r11
+ .byte 196,227,249,22,251,1 // vpextrq $0x1,%xmm7,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,60,176 // vmovss (%rax,%r14,4),%xmm7
+ .byte 196,163,65,33,60,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm7,%xmm7
+ .byte 196,161,122,16,4,184 // vmovss (%rax,%r15,4),%xmm0
+ .byte 196,227,65,33,192,32 // vinsertps $0x20,%xmm0,%xmm7,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,121,33,199,48 // vinsertps $0x30,%xmm7,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,163,65,33,60,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,65,33,228,32 // vinsertps $0x20,%xmm4,%xmm7,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,89,33,231,48 // vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ .byte 196,99,93,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm4,%ymm8
+ .byte 196,193,97,254,193 // vpaddd %xmm9,%xmm3,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,73,254,193 // vpaddd %xmm9,%xmm6,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,99,101,24,224,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm12
+ .byte 197,137,254,194 // vpaddd %xmm2,%xmm14,%xmm0
+ .byte 196,194,121,64,215 // vpmulld %xmm15,%xmm0,%xmm2
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 197,121,111,92,36,160 // vmovdqa -0x60(%rsp),%xmm11
+ .byte 197,161,254,201 // vpaddd %xmm1,%xmm11,%xmm1
+ .byte 196,194,113,64,223 // vpmulld %xmm15,%xmm1,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,227,125,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm1
+ .byte 196,193,97,254,194 // vpaddd %xmm10,%xmm3,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,105,254,194 // vpaddd %xmm10,%xmm2,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,121,33,196,32 // vinsertps $0x20,%xmm4,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,121,33,196,48 // vinsertps $0x30,%xmm4,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,52,144 // vmovss (%rax,%r10,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 196,227,93,24,240,1 // vinsertf128 $0x1,%xmm0,%ymm4,%ymm6
+ .byte 196,193,97,254,193 // vpaddd %xmm9,%xmm3,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,105,254,193 // vpaddd %xmm9,%xmm2,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,227,109,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ .byte 197,252,16,84,36,192 // vmovups -0x40(%rsp),%ymm2
+ .byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
+ .byte 197,212,89,201 // vmulps %ymm1,%ymm5,%ymm1
+ .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
+ .byte 197,252,17,76,36,192 // vmovups %ymm1,-0x40(%rsp)
+ .byte 196,193,76,92,200 // vsubps %ymm8,%ymm6,%ymm1
+ .byte 197,212,89,201 // vmulps %ymm1,%ymm5,%ymm1
+ .byte 197,188,88,201 // vaddps %ymm1,%ymm8,%ymm1
+ .byte 197,252,17,140,36,64,1,0,0 // vmovups %ymm1,0x140(%rsp)
+ .byte 196,193,124,92,196 // vsubps %ymm12,%ymm0,%ymm0
+ .byte 197,212,89,192 // vmulps %ymm0,%ymm5,%ymm0
+ .byte 197,28,88,192 // vaddps %ymm0,%ymm12,%ymm8
+ .byte 197,249,111,132,36,208,1,0,0 // vmovdqa 0x1d0(%rsp),%xmm0
+ .byte 197,249,254,52,36 // vpaddd (%rsp),%xmm0,%xmm6
+ .byte 197,201,254,68,36,128 // vpaddd -0x80(%rsp),%xmm6,%xmm0
+ .byte 196,194,121,64,215 // vpmulld %xmm15,%xmm0,%xmm2
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,227,121,33,217,48 // vinsertps $0x30,%xmm1,%xmm0,%xmm3
+ .byte 197,249,111,132,36,192,1,0,0 // vmovdqa 0x1c0(%rsp),%xmm0
+ .byte 197,249,254,76,36,240 // vpaddd -0x10(%rsp),%xmm0,%xmm1
+ .byte 196,193,113,254,197 // vpaddd %xmm13,%xmm1,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 197,249,126,195 // vmovd %xmm0,%ebx
+ .byte 196,195,121,22,193,1 // vpextrd $0x1,%xmm0,%r9d
+ .byte 196,195,121,22,194,2 // vpextrd $0x2,%xmm0,%r10d
+ .byte 196,195,121,22,195,3 // vpextrd $0x3,%xmm0,%r11d
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,163,89,33,36,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,99,101,24,236,1 // vinsertf128 $0x1,%xmm4,%ymm3,%ymm13
+ .byte 196,193,121,254,226 // vpaddd %xmm10,%xmm0,%xmm4
+ .byte 196,195,249,22,225,1 // vpextrq $0x1,%xmm4,%r9
+ .byte 196,193,249,126,226 // vmovq %xmm4,%r10
+ .byte 196,193,105,254,226 // vpaddd %xmm10,%xmm2,%xmm4
+ .byte 196,193,249,126,227 // vmovq %xmm4,%r11
+ .byte 196,227,249,22,227,1 // vpextrq $0x1,%xmm4,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,36,176 // vmovss (%rax,%r14,4),%xmm4
+ .byte 196,163,89,33,36,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,161,122,16,60,184 // vmovss (%rax,%r15,4),%xmm7
+ .byte 196,227,89,33,231,32 // vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,89,33,231,48 // vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,163,65,33,60,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,65,33,219,32 // vinsertps $0x20,%xmm3,%xmm7,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,97,33,223,48 // vinsertps $0x30,%xmm7,%xmm3,%xmm3
+ .byte 196,99,101,24,244,1 // vinsertf128 $0x1,%xmm4,%ymm3,%ymm14
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,105,254,193 // vpaddd %xmm9,%xmm2,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,99,109,24,224,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm12
+ .byte 197,201,254,68,36,144 // vpaddd -0x70(%rsp),%xmm6,%xmm0
+ .byte 196,194,121,64,215 // vpmulld %xmm15,%xmm0,%xmm2
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,121,33,219,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm3
+ .byte 197,161,254,193 // vpaddd %xmm1,%xmm11,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 197,249,126,195 // vmovd %xmm0,%ebx
+ .byte 196,195,121,22,193,1 // vpextrd $0x1,%xmm0,%r9d
+ .byte 196,195,121,22,194,2 // vpextrd $0x2,%xmm0,%r10d
+ .byte 196,195,121,22,195,3 // vpextrd $0x3,%xmm0,%r11d
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,227,101,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm3,%ymm1
+ .byte 196,193,121,254,218 // vpaddd %xmm10,%xmm0,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,105,254,218 // vpaddd %xmm10,%xmm2,%xmm3
+ .byte 196,193,249,126,219 // vmovq %xmm3,%r11
+ .byte 196,227,249,22,219,1 // vpextrq $0x1,%xmm3,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,28,176 // vmovss (%rax,%r14,4),%xmm3
+ .byte 196,163,97,33,28,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,52,144 // vmovss (%rax,%r10,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,105,254,193 // vpaddd %xmm9,%xmm2,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,227,109,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ .byte 196,193,116,92,205 // vsubps %ymm13,%ymm1,%ymm1
+ .byte 197,252,17,172,36,160,1,0,0 // vmovups %ymm5,0x1a0(%rsp)
+ .byte 197,212,89,201 // vmulps %ymm1,%ymm5,%ymm1
+ .byte 197,148,88,201 // vaddps %ymm1,%ymm13,%ymm1
+ .byte 196,193,76,92,214 // vsubps %ymm14,%ymm6,%ymm2
+ .byte 197,212,89,210 // vmulps %ymm2,%ymm5,%ymm2
+ .byte 197,140,88,210 // vaddps %ymm2,%ymm14,%ymm2
+ .byte 196,193,124,92,196 // vsubps %ymm12,%ymm0,%ymm0
+ .byte 197,212,89,192 // vmulps %ymm0,%ymm5,%ymm0
+ .byte 197,156,88,192 // vaddps %ymm0,%ymm12,%ymm0
+ .byte 197,252,16,100,36,192 // vmovups -0x40(%rsp),%ymm4
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 197,252,16,156,36,224,0,0,0 // vmovups 0xe0(%rsp),%ymm3
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 197,252,16,164,36,64,1,0,0 // vmovups 0x140(%rsp),%ymm4
+ .byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,220,88,210 // vaddps %ymm2,%ymm4,%ymm2
+ .byte 196,193,124,92,192 // vsubps %ymm8,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
+ .byte 197,252,91,156,36,128,1,0,0 // vcvtdq2ps 0x180(%rsp),%ymm3
+ .byte 197,252,16,164,36,32,1,0,0 // vmovups 0x120(%rsp),%ymm4
+ .byte 197,220,92,219 // vsubps %ymm3,%ymm4,%ymm3
+ .byte 197,252,17,92,36,192 // vmovups %ymm3,-0x40(%rsp)
+ .byte 197,252,16,164,36,128,0,0,0 // vmovups 0x80(%rsp),%ymm4
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 197,252,17,140,36,32,1,0,0 // vmovups %ymm1,0x120(%rsp)
+ .byte 197,252,16,100,36,96 // vmovups 0x60(%rsp),%ymm4
+ .byte 197,236,92,204 // vsubps %ymm4,%ymm2,%ymm1
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 197,252,17,140,36,128,1,0,0 // vmovups %ymm1,0x180(%rsp)
+ .byte 197,252,16,76,36,64 // vmovups 0x40(%rsp),%ymm1
+ .byte 197,252,92,193 // vsubps %ymm1,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,252,17,132,36,128,0,0,0 // vmovups %ymm0,0x80(%rsp)
+ .byte 197,252,16,68,36,32 // vmovups 0x20(%rsp),%ymm0
+ .byte 197,252,88,132,36,0,2,0,0 // vaddps 0x200(%rsp),%ymm0,%ymm0
+ .byte 197,254,91,192 // vcvttps2dq %ymm0,%ymm0
+ .byte 197,249,254,140,36,192,0,0,0 // vpaddd 0xc0(%rsp),%xmm0,%xmm1
+ .byte 197,249,127,76,36,32 // vmovdqa %xmm1,0x20(%rsp)
+ .byte 197,253,111,224 // vmovdqa %ymm0,%ymm4
+ .byte 197,254,127,100,36,64 // vmovdqu %ymm4,0x40(%rsp)
+ .byte 197,241,254,148,36,0,1,0,0 // vpaddd 0x100(%rsp),%xmm1,%xmm2
+ .byte 197,249,111,108,36,128 // vmovdqa -0x80(%rsp),%xmm5
+ .byte 197,209,254,194 // vpaddd %xmm2,%xmm5,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,12,136 // vmovss (%rax,%r9,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,113,33,251,48 // vinsertps $0x30,%xmm3,%xmm1,%xmm7
+ .byte 196,227,125,25,225,1 // vextractf128 $0x1,%ymm4,%xmm1
+ .byte 197,248,41,76,36,96 // vmovaps %xmm1,0x60(%rsp)
+ .byte 197,113,254,180,36,160,0,0,0 // vpaddd 0xa0(%rsp),%xmm1,%xmm14
+ .byte 197,137,254,76,36,16 // vpaddd 0x10(%rsp),%xmm14,%xmm1
+ .byte 197,241,254,92,36,176 // vpaddd -0x50(%rsp),%xmm1,%xmm3
+ .byte 196,194,97,64,223 // vpmulld %xmm15,%xmm3,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,163,89,33,36,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,99,69,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm7,%ymm12
+ .byte 196,193,97,254,226 // vpaddd %xmm10,%xmm3,%xmm4
+ .byte 196,195,249,22,225,1 // vpextrq $0x1,%xmm4,%r9
+ .byte 196,193,249,126,226 // vmovq %xmm4,%r10
+ .byte 196,193,121,254,226 // vpaddd %xmm10,%xmm0,%xmm4
+ .byte 196,225,249,126,227 // vmovq %xmm4,%rbx
+ .byte 196,195,249,22,227,1 // vpextrq $0x1,%xmm4,%r11
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,36,176 // vmovss (%rax,%r14,4),%xmm4
+ .byte 196,163,89,33,36,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,161,122,16,52,184 // vmovss (%rax,%r15,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 65,137,217 // mov %ebx,%r9d
+ .byte 69,137,218 // mov %r11d,%r10d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,227,73,33,52,152,16 // vinsertps $0x10,(%rax,%rbx,4),%xmm6,%xmm6
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,73,33,247,32 // vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
+ .byte 196,227,73,33,247,48 // vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ .byte 196,99,77,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm6,%ymm8
+ .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,99,101,24,232,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm13
+ .byte 197,121,111,92,36,144 // vmovdqa -0x70(%rsp),%xmm11
+ .byte 197,161,254,194 // vpaddd %xmm2,%xmm11,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 197,241,254,76,36,160 // vpaddd -0x60(%rsp),%xmm1,%xmm1
+ .byte 196,194,113,64,223 // vpmulld %xmm15,%xmm1,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,227,109,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm1
+ .byte 196,193,97,254,210 // vpaddd %xmm10,%xmm3,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,121,254,210 // vpaddd %xmm10,%xmm0,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,105,33,212,32 // vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,105,33,212,48 // vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,52,144 // vmovss (%rax,%r10,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 196,227,93,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,227,101,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ .byte 196,193,116,92,204 // vsubps %ymm12,%ymm1,%ymm1
+ .byte 197,252,16,156,36,160,1,0,0 // vmovups 0x1a0(%rsp),%ymm3
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,28,88,225 // vaddps %ymm1,%ymm12,%ymm12
+ .byte 196,193,108,92,200 // vsubps %ymm8,%ymm2,%ymm1
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,188,88,201 // vaddps %ymm1,%ymm8,%ymm1
+ .byte 197,252,17,140,36,192,0,0,0 // vmovups %ymm1,0xc0(%rsp)
+ .byte 196,193,124,92,197 // vsubps %ymm13,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,148,88,192 // vaddps %ymm0,%ymm13,%ymm0
+ .byte 197,252,17,132,36,160,0,0,0 // vmovups %ymm0,0xa0(%rsp)
+ .byte 197,249,111,68,36,32 // vmovdqa 0x20(%rsp),%xmm0
+ .byte 197,249,254,20,36 // vpaddd (%rsp),%xmm0,%xmm2
+ .byte 197,233,254,197 // vpaddd %xmm5,%xmm2,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,12,136 // vmovss (%rax,%r9,4),%xmm1
+ .byte 196,163,113,33,12,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,113,33,227,48 // vinsertps $0x30,%xmm3,%xmm1,%xmm4
+ .byte 197,137,254,76,36,240 // vpaddd -0x10(%rsp),%xmm14,%xmm1
+ .byte 197,121,111,68,36,176 // vmovdqa -0x50(%rsp),%xmm8
+ .byte 196,193,113,254,216 // vpaddd %xmm8,%xmm1,%xmm3
+ .byte 196,194,97,64,223 // vpmulld %xmm15,%xmm3,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,163,73,33,52,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm6,%xmm6
+ .byte 196,163,73,33,52,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm6,%xmm6
+ .byte 196,163,73,33,52,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm6,%xmm6
+ .byte 196,99,93,24,246,1 // vinsertf128 $0x1,%xmm6,%ymm4,%ymm14
+ .byte 196,193,97,254,226 // vpaddd %xmm10,%xmm3,%xmm4
+ .byte 196,195,249,22,225,1 // vpextrq $0x1,%xmm4,%r9
+ .byte 196,193,249,126,226 // vmovq %xmm4,%r10
+ .byte 196,193,121,254,226 // vpaddd %xmm10,%xmm0,%xmm4
+ .byte 196,193,249,126,227 // vmovq %xmm4,%r11
+ .byte 196,227,249,22,227,1 // vpextrq $0x1,%xmm4,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,36,176 // vmovss (%rax,%r14,4),%xmm4
+ .byte 196,163,89,33,36,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,161,122,16,52,184 // vmovss (%rax,%r15,4),%xmm6
+ .byte 196,227,89,33,230,32 // vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,227,89,33,230,48 // vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,163,73,33,52,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm6,%xmm6
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,73,33,247,32 // vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,73,33,247,48 // vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ .byte 196,227,77,24,244,1 // vinsertf128 $0x1,%xmm4,%ymm6,%ymm6
+ .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,99,101,24,232,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm13
+ .byte 197,161,254,194 // vpaddd %xmm2,%xmm11,%xmm0
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 197,249,111,108,36,160 // vmovdqa -0x60(%rsp),%xmm5
+ .byte 197,209,254,201 // vpaddd %xmm1,%xmm5,%xmm1
+ .byte 196,194,113,64,223 // vpmulld %xmm15,%xmm1,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,227,109,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm1
+ .byte 196,193,97,254,210 // vpaddd %xmm10,%xmm3,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,121,254,210 // vpaddd %xmm10,%xmm0,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,36,184 // vmovss (%rax,%r15,4),%xmm4
+ .byte 196,227,105,33,212,32 // vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,227,105,33,212,48 // vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,36,136 // vmovss (%rax,%r9,4),%xmm4
+ .byte 196,163,89,33,36,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,89,33,231,32 // vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,89,33,231,48 // vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ .byte 196,227,93,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ .byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
+ .byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
+ .byte 196,193,249,126,218 // vmovq %xmm3,%r10
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,227,101,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ .byte 196,193,116,92,206 // vsubps %ymm14,%ymm1,%ymm1
+ .byte 197,252,16,156,36,160,1,0,0 // vmovups 0x1a0(%rsp),%ymm3
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,140,88,201 // vaddps %ymm1,%ymm14,%ymm1
+ .byte 197,236,92,214 // vsubps %ymm6,%ymm2,%ymm2
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,204,88,210 // vaddps %ymm2,%ymm6,%ymm2
+ .byte 196,193,124,92,197 // vsubps %ymm13,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,148,88,192 // vaddps %ymm0,%ymm13,%ymm0
+ .byte 196,193,116,92,204 // vsubps %ymm12,%ymm1,%ymm1
+ .byte 197,252,16,156,36,224,0,0,0 // vmovups 0xe0(%rsp),%ymm3
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,156,88,201 // vaddps %ymm1,%ymm12,%ymm1
+ .byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp)
+ .byte 197,252,16,164,36,192,0,0,0 // vmovups 0xc0(%rsp),%ymm4
+ .byte 197,236,92,204 // vsubps %ymm4,%ymm2,%ymm1
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 197,252,17,140,36,192,0,0,0 // vmovups %ymm1,0xc0(%rsp)
+ .byte 197,252,16,140,36,160,0,0,0 // vmovups 0xa0(%rsp),%ymm1
+ .byte 197,252,92,193 // vsubps %ymm1,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,252,17,132,36,160,0,0,0 // vmovups %ymm0,0xa0(%rsp)
+ .byte 197,254,111,68,36,64 // vmovdqu 0x40(%rsp),%ymm0
+ .byte 197,121,254,116,36,224 // vpaddd -0x20(%rsp),%xmm0,%xmm14
+ .byte 197,249,111,68,36,96 // vmovdqa 0x60(%rsp),%xmm0
+ .byte 197,121,254,172,36,96,1,0,0 // vpaddd 0x160(%rsp),%xmm0,%xmm13
+ .byte 197,137,254,148,36,0,1,0,0 // vpaddd 0x100(%rsp),%xmm14,%xmm2
+ .byte 197,233,254,68,36,128 // vpaddd -0x80(%rsp),%xmm2,%xmm0
+ .byte 196,194,121,64,247 // vpmulld %xmm15,%xmm0,%xmm6
+ .byte 196,193,249,126,242 // vmovq %xmm6,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,243,1 // vpextrq $0x1,%xmm6,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,227,121,33,193,48 // vinsertps $0x30,%xmm1,%xmm0,%xmm0
+ .byte 197,145,254,76,36,16 // vpaddd 0x10(%rsp),%xmm13,%xmm1
+ .byte 196,193,113,254,216 // vpaddd %xmm8,%xmm1,%xmm3
+ .byte 196,194,97,64,223 // vpmulld %xmm15,%xmm3,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,163,89,33,36,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,163,89,33,36,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ .byte 196,99,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm12
+ .byte 196,193,97,254,226 // vpaddd %xmm10,%xmm3,%xmm4
+ .byte 196,195,249,22,225,1 // vpextrq $0x1,%xmm4,%r9
+ .byte 196,193,249,126,226 // vmovq %xmm4,%r10
+ .byte 196,193,73,254,226 // vpaddd %xmm10,%xmm6,%xmm4
+ .byte 196,193,249,126,227 // vmovq %xmm4,%r11
+ .byte 196,227,249,22,227,1 // vpextrq $0x1,%xmm4,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,36,176 // vmovss (%rax,%r14,4),%xmm4
+ .byte 196,163,89,33,36,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,161,122,16,60,184 // vmovss (%rax,%r15,4),%xmm7
+ .byte 196,227,89,33,231,32 // vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,89,33,231,48 // vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,163,65,33,60,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,161,122,16,4,144 // vmovss (%rax,%r10,4),%xmm0
+ .byte 196,227,65,33,192,32 // vinsertps $0x20,%xmm0,%xmm7,%xmm0
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,121,33,199,48 // vinsertps $0x30,%xmm7,%xmm0,%xmm0
+ .byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
+ .byte 196,193,97,254,193 // vpaddd %xmm9,%xmm3,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,73,254,193 // vpaddd %xmm9,%xmm6,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,121,33,195,32 // vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,52,144 // vmovss (%rax,%r10,4),%xmm6
+ .byte 196,227,97,33,222,32 // vinsertps $0x20,%xmm6,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,97,33,222,48 // vinsertps $0x30,%xmm6,%xmm3,%xmm3
+ .byte 196,99,101,24,216,1 // vinsertf128 $0x1,%xmm0,%ymm3,%ymm11
+ .byte 197,233,254,68,36,144 // vpaddd -0x70(%rsp),%xmm2,%xmm0
+ .byte 196,194,121,64,215 // vpmulld %xmm15,%xmm0,%xmm2
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,136 // vmovss (%rax,%r9,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,163,121,33,4,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,121,33,195,48 // vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ .byte 197,209,254,201 // vpaddd %xmm1,%xmm5,%xmm1
+ .byte 196,194,113,64,223 // vpmulld %xmm15,%xmm1,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ .byte 196,163,113,33,12,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 196,227,125,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm1
+ .byte 196,193,97,254,194 // vpaddd %xmm10,%xmm3,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,105,254,194 // vpaddd %xmm10,%xmm2,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,52,184 // vmovss (%rax,%r15,4),%xmm6
+ .byte 196,227,121,33,198,32 // vinsertps $0x20,%xmm6,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,227,121,33,198,48 // vinsertps $0x30,%xmm6,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,52,136 // vmovss (%rax,%r9,4),%xmm6
+ .byte 196,163,73,33,52,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm6,%xmm6
+ .byte 196,161,122,16,60,144 // vmovss (%rax,%r10,4),%xmm7
+ .byte 196,227,73,33,247,32 // vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,73,33,247,48 // vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ .byte 196,227,77,24,240,1 // vinsertf128 $0x1,%xmm0,%ymm6,%ymm6
+ .byte 196,193,97,254,193 // vpaddd %xmm9,%xmm3,%xmm0
+ .byte 196,195,249,22,193,1 // vpextrq $0x1,%xmm0,%r9
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 196,193,105,254,193 // vpaddd %xmm9,%xmm2,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,121,33,194,32 // vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,227,121,33,194,48 // vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,144 // vmovss (%rax,%r10,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 196,227,109,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ .byte 196,193,116,92,204 // vsubps %ymm12,%ymm1,%ymm1
+ .byte 197,252,16,148,36,160,1,0,0 // vmovups 0x1a0(%rsp),%ymm2
+ .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
+ .byte 197,156,88,201 // vaddps %ymm1,%ymm12,%ymm1
+ .byte 197,252,17,140,36,0,1,0,0 // vmovups %ymm1,0x100(%rsp)
+ .byte 197,204,92,204 // vsubps %ymm4,%ymm6,%ymm1
+ .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
+ .byte 197,92,88,225 // vaddps %ymm1,%ymm4,%ymm12
+ .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
+ .byte 197,236,89,192 // vmulps %ymm0,%ymm2,%ymm0
+ .byte 197,252,40,234 // vmovaps %ymm2,%ymm5
+ .byte 197,36,88,216 // vaddps %ymm0,%ymm11,%ymm11
+ .byte 197,145,254,76,36,240 // vpaddd -0x10(%rsp),%xmm13,%xmm1
+ .byte 197,137,254,4,36 // vpaddd (%rsp),%xmm14,%xmm0
+ .byte 197,249,254,92,36,128 // vpaddd -0x80(%rsp),%xmm0,%xmm3
+ .byte 196,66,97,64,247 // vpmulld %xmm15,%xmm3,%xmm14
+ .byte 196,65,249,126,242 // vmovq %xmm14,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,99,249,22,243,1 // vpextrq $0x1,%xmm14,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,228,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm4
+ .byte 196,193,113,254,216 // vpaddd %xmm8,%xmm1,%xmm3
+ .byte 196,194,97,64,223 // vpmulld %xmm15,%xmm3,%xmm3
+ .byte 197,249,126,219 // vmovd %xmm3,%ebx
+ .byte 196,195,121,22,217,1 // vpextrd $0x1,%xmm3,%r9d
+ .byte 196,195,121,22,218,2 // vpextrd $0x2,%xmm3,%r10d
+ .byte 196,195,121,22,219,3 // vpextrd $0x3,%xmm3,%r11d
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,163,73,33,52,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm6,%xmm6
+ .byte 196,163,73,33,52,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm6,%xmm6
+ .byte 196,163,73,33,52,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm6,%xmm6
+ .byte 196,99,93,24,198,1 // vinsertf128 $0x1,%xmm6,%ymm4,%ymm8
+ .byte 196,193,97,254,226 // vpaddd %xmm10,%xmm3,%xmm4
+ .byte 196,195,249,22,225,1 // vpextrq $0x1,%xmm4,%r9
+ .byte 196,193,249,126,226 // vmovq %xmm4,%r10
+ .byte 196,193,9,254,226 // vpaddd %xmm10,%xmm14,%xmm4
+ .byte 196,193,249,126,227 // vmovq %xmm4,%r11
+ .byte 196,227,249,22,227,1 // vpextrq $0x1,%xmm4,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,36,176 // vmovss (%rax,%r14,4),%xmm4
+ .byte 196,163,89,33,36,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ .byte 196,161,122,16,60,184 // vmovss (%rax,%r15,4),%xmm7
+ .byte 196,227,89,33,231,32 // vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,227,89,33,231,48 // vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,60,136 // vmovss (%rax,%r9,4),%xmm7
+ .byte 196,163,65,33,60,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ .byte 196,161,122,16,20,144 // vmovss (%rax,%r10,4),%xmm2
+ .byte 196,227,65,33,210,32 // vinsertps $0x20,%xmm2,%xmm7,%xmm2
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,60,152 // vmovss (%rax,%rbx,4),%xmm7
+ .byte 196,227,105,33,215,48 // vinsertps $0x30,%xmm7,%xmm2,%xmm2
+ .byte 196,227,109,24,252,1 // vinsertf128 $0x1,%xmm4,%ymm2,%ymm7
+ .byte 196,193,97,254,209 // vpaddd %xmm9,%xmm3,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,9,254,209 // vpaddd %xmm9,%xmm14,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,36,144 // vmovss (%rax,%r10,4),%xmm4
+ .byte 196,227,97,33,220,32 // vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,36,152 // vmovss (%rax,%rbx,4),%xmm4
+ .byte 196,227,97,33,220,48 // vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ .byte 196,99,101,24,242,1 // vinsertf128 $0x1,%xmm2,%ymm3,%ymm14
+ .byte 197,249,254,68,36,144 // vpaddd -0x70(%rsp),%xmm0,%xmm0
+ .byte 197,241,254,76,36,160 // vpaddd -0x60(%rsp),%xmm1,%xmm1
+ .byte 196,194,113,64,207 // vpmulld %xmm15,%xmm1,%xmm1
+ .byte 196,194,121,64,199 // vpmulld %xmm15,%xmm0,%xmm0
+ .byte 196,193,249,126,194 // vmovq %xmm0,%r10
+ .byte 69,137,209 // mov %r10d,%r9d
+ .byte 196,227,249,22,195,1 // vpextrq $0x1,%xmm0,%rbx
+ .byte 65,137,219 // mov %ebx,%r11d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,20,136 // vmovss (%rax,%r9,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,163,105,33,20,152,32 // vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 197,249,126,203 // vmovd %xmm1,%ebx
+ .byte 196,195,121,22,201,1 // vpextrd $0x1,%xmm1,%r9d
+ .byte 196,195,121,22,202,2 // vpextrd $0x2,%xmm1,%r10d
+ .byte 196,195,121,22,203,3 // vpextrd $0x3,%xmm1,%r11d
+ .byte 197,250,16,28,152 // vmovss (%rax,%rbx,4),%xmm3
+ .byte 196,163,97,33,28,136,16 // vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ .byte 196,163,97,33,28,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,227,109,24,227,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm4
+ .byte 196,193,113,254,210 // vpaddd %xmm10,%xmm1,%xmm2
+ .byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
+ .byte 196,193,249,126,210 // vmovq %xmm2,%r10
+ .byte 196,193,121,254,210 // vpaddd %xmm10,%xmm0,%xmm2
+ .byte 196,193,249,126,211 // vmovq %xmm2,%r11
+ .byte 196,227,249,22,211,1 // vpextrq $0x1,%xmm2,%rbx
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 69,137,207 // mov %r9d,%r15d
+ .byte 196,161,122,16,20,176 // vmovss (%rax,%r14,4),%xmm2
+ .byte 196,163,105,33,20,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ .byte 196,161,122,16,28,184 // vmovss (%rax,%r15,4),%xmm3
+ .byte 196,227,105,33,211,32 // vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ .byte 69,137,217 // mov %r11d,%r9d
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 196,161,122,16,28,136 // vmovss (%rax,%r9,4),%xmm3
+ .byte 196,163,97,33,28,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ .byte 196,161,122,16,52,144 // vmovss (%rax,%r10,4),%xmm6
+ .byte 196,227,97,33,222,32 // vinsertps $0x20,%xmm6,%xmm3,%xmm3
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 197,250,16,52,152 // vmovss (%rax,%rbx,4),%xmm6
+ .byte 196,227,97,33,222,48 // vinsertps $0x30,%xmm6,%xmm3,%xmm3
+ .byte 196,227,101,24,218,1 // vinsertf128 $0x1,%xmm2,%ymm3,%ymm3
+ .byte 196,193,113,254,201 // vpaddd %xmm9,%xmm1,%xmm1
+ .byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
+ .byte 196,193,249,126,202 // vmovq %xmm1,%r10
+ .byte 196,193,121,254,193 // vpaddd %xmm9,%xmm0,%xmm0
+ .byte 196,193,249,126,195 // vmovq %xmm0,%r11
+ .byte 196,195,249,22,199,1 // vpextrq $0x1,%xmm0,%r15
+ .byte 69,137,214 // mov %r10d,%r14d
+ .byte 73,193,234,32 // shr $0x20,%r10
+ .byte 196,161,122,16,4,176 // vmovss (%rax,%r14,4),%xmm0
+ .byte 196,163,121,33,4,144,16 // vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ .byte 68,137,203 // mov %r9d,%ebx
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,227,121,33,193,32 // vinsertps $0x20,%xmm1,%xmm0,%xmm0
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 196,161,122,16,12,136 // vmovss (%rax,%r9,4),%xmm1
+ .byte 196,227,121,33,193,48 // vinsertps $0x30,%xmm1,%xmm0,%xmm0
+ .byte 68,137,219 // mov %r11d,%ebx
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 197,250,16,12,152 // vmovss (%rax,%rbx,4),%xmm1
+ .byte 196,163,113,33,12,152,16 // vinsertps $0x10,(%rax,%r11,4),%xmm1,%xmm1
+ .byte 68,137,251 // mov %r15d,%ebx
+ .byte 197,250,16,20,152 // vmovss (%rax,%rbx,4),%xmm2
+ .byte 196,227,113,33,202,32 // vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ .byte 73,193,239,32 // shr $0x20,%r15
+ .byte 196,161,122,16,20,184 // vmovss (%rax,%r15,4),%xmm2
+ .byte 196,227,113,33,202,48 // vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
+ .byte 196,193,92,92,200 // vsubps %ymm8,%ymm4,%ymm1
+ .byte 197,212,89,201 // vmulps %ymm1,%ymm5,%ymm1
+ .byte 197,188,88,201 // vaddps %ymm1,%ymm8,%ymm1
+ .byte 197,228,92,215 // vsubps %ymm7,%ymm3,%ymm2
+ .byte 197,212,89,210 // vmulps %ymm2,%ymm5,%ymm2
+ .byte 197,196,88,210 // vaddps %ymm2,%ymm7,%ymm2
+ .byte 196,193,124,92,198 // vsubps %ymm14,%ymm0,%ymm0
+ .byte 197,212,89,192 // vmulps %ymm0,%ymm5,%ymm0
+ .byte 197,140,88,192 // vaddps %ymm0,%ymm14,%ymm0
+ .byte 197,252,16,164,36,0,1,0,0 // vmovups 0x100(%rsp),%ymm4
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 197,252,16,156,36,224,0,0,0 // vmovups 0xe0(%rsp),%ymm3
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 196,193,108,92,212 // vsubps %ymm12,%ymm2,%ymm2
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,156,88,210 // vaddps %ymm2,%ymm12,%ymm2
+ .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
+ .byte 197,252,16,100,36,32 // vmovups 0x20(%rsp),%ymm4
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 197,252,16,92,36,192 // vmovups -0x40(%rsp),%ymm3
+ .byte 197,228,89,201 // vmulps %ymm1,%ymm3,%ymm1
+ .byte 197,220,88,201 // vaddps %ymm1,%ymm4,%ymm1
+ .byte 197,252,16,164,36,192,0,0,0 // vmovups 0xc0(%rsp),%ymm4
+ .byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
+ .byte 197,220,88,210 // vaddps %ymm2,%ymm4,%ymm2
+ .byte 197,252,16,164,36,160,0,0,0 // vmovups 0xa0(%rsp),%ymm4
+ .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
+ .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
+ .byte 197,220,88,216 // vaddps %ymm0,%ymm4,%ymm3
+ .byte 197,252,91,132,36,224,1,0,0 // vcvtdq2ps 0x1e0(%rsp),%ymm0
+ .byte 197,252,16,164,36,0,2,0,0 // vmovups 0x200(%rsp),%ymm4
+ .byte 197,220,92,224 // vsubps %ymm0,%ymm4,%ymm4
+ .byte 197,252,16,172,36,32,1,0,0 // vmovups 0x120(%rsp),%ymm5
+ .byte 197,244,92,197 // vsubps %ymm5,%ymm1,%ymm0
+ .byte 197,220,89,192 // vmulps %ymm0,%ymm4,%ymm0
+ .byte 197,212,88,192 // vaddps %ymm0,%ymm5,%ymm0
+ .byte 197,252,16,172,36,128,1,0,0 // vmovups 0x180(%rsp),%ymm5
+ .byte 197,236,92,205 // vsubps %ymm5,%ymm2,%ymm1
+ .byte 197,220,89,201 // vmulps %ymm1,%ymm4,%ymm1
+ .byte 197,212,88,201 // vaddps %ymm1,%ymm5,%ymm1
+ .byte 197,252,16,172,36,128,0,0,0 // vmovups 0x80(%rsp),%ymm5
+ .byte 197,228,92,213 // vsubps %ymm5,%ymm3,%ymm2
+ .byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2
+ .byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 196,226,125,24,29,112,5,0,0 // vbroadcastss 0x570(%rip),%ymm3 # b2f8 <_sk_clut_4D_avx+0x2661>
+ .byte 197,252,16,164,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm4
+ .byte 197,252,16,172,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm5
+ .byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6
+ .byte 197,252,16,188,36,128,2,0,0 // vmovups 0x280(%rsp),%ymm7
+ .byte 72,129,196,160,2,0,0 // add $0x2a0,%rsp
+ .byte 91 // pop %rbx
+ .byte 65,94 // pop %r14
+ .byte 65,95 // pop %r15
+ .byte 255,224 // jmpq *%rax
+
BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
@@ -27626,25 +33890,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7c6d <.literal4+0xb9>
+ .byte 71,225,61 // rex.RXB loope ae75 <.literal4+0xb9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7c7d <.literal4+0xc9>
+ .byte 71,225,61 // rex.RXB loope ae85 <.literal4+0xc9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7c8d <.literal4+0xd9>
+ .byte 71,225,61 // rex.RXB loope ae95 <.literal4+0xd9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7c9d <.literal4+0xe9>
+ .byte 71,225,61 // rex.RXB loope aea5 <.literal4+0xe9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -27709,7 +33973,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7d0d <.literal4+0x159>
+ .byte 224,7 // loopne af15 <.literal4+0x159>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27725,10 +33989,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 7d34 <.literal4+0x180>
+ .byte 127,0 // jg af3c <.literal4+0x180>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7dad <.literal4+0x1f9>
+ .byte 119,115 // ja afb5 <.literal4+0x1f9>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27742,10 +34006,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7d68 <.literal4+0x1b4>
+ .byte 127,0 // jg af70 <.literal4+0x1b4>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7de1 <.literal4+0x22d>
+ .byte 119,115 // ja afe9 <.literal4+0x22d>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27759,10 +34023,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7d9c <.literal4+0x1e8>
+ .byte 127,0 // jg afa4 <.literal4+0x1e8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7e15 <.literal4+0x261>
+ .byte 119,115 // ja b01d <.literal4+0x261>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27776,10 +34040,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7dd0 <.literal4+0x21c>
+ .byte 127,0 // jg afd8 <.literal4+0x21c>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7e49 <.literal4+0x295>
+ .byte 119,115 // ja b051 <.literal4+0x295>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27793,10 +34057,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7e04 <.literal4+0x250>
+ .byte 127,0 // jg b00c <.literal4+0x250>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7e7d <.literal4+0x2c9>
+ .byte 119,115 // ja b085 <.literal4+0x2c9>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27809,7 +34073,7 @@ BALIGN4
.byte 0,75,0 // add %cl,0x0(%rbx)
.byte 0,200 // add %cl,%al
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 7e77 <.literal4+0x2c3>
+ .byte 127,67 // jg b07f <.literal4+0x2c3>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -27821,7 +34085,7 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 7e97 <.literal4+0x2e3>
+ .byte 118,63 // jbe b09f <.literal4+0x2e3>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
@@ -27843,7 +34107,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7eb1 <.literal4+0x2fd>
+ .byte 224,7 // loopne b0b9 <.literal4+0x2fd>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27855,7 +34119,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7ecd <.literal4+0x319>
+ .byte 224,7 // loopne b0d5 <.literal4+0x319>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27866,7 +34130,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 7f22 <.literal4+0x36e>
+ .byte 124,66 // jl b12a <.literal4+0x36e>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -27892,7 +34156,7 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 7f85 <.literal4+0x3d1>
+ .byte 112,65 // jo b18d <.literal4+0x3d1>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
@@ -27918,7 +34182,7 @@ BALIGN4
.byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax)
.byte 63 // (bad)
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7ff7 <.literal4+0x443>
+ .byte 127,71 // jg b1ff <.literal4+0x443>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -28031,7 +34295,24 @@ BALIGN4
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
- .byte 190 // .byte 0xbe
+ .byte 190,114,249,127,63 // mov $0x3f7ff972,%esi
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 114,249 // jb b2e3 <.literal4+0x527>
+ .byte 127,63 // jg b32b <_sk_clut_4D_avx+0x2694>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128 // .byte 0x80
+ .byte 63 // (bad)
BALIGN16
.byte 0,2 // add %al,(%rdx)
@@ -28453,7 +34734,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,220,94,0,0 // movaps 0x5edc(%rip),%xmm2 # 5fa0 <_sk_callback_sse41+0xf4>
+ .byte 15,40,21,156,121,0,0 // movaps 0x799c(%rip),%xmm2 # 7a60 <_sk_clut_4D_sse41+0x11c2>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -28462,7 +34743,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,203,94,0,0 // movaps 0x5ecb(%rip),%xmm2 # 5fb0 <_sk_callback_sse41+0x104>
+ .byte 15,40,21,139,121,0,0 // movaps 0x798b(%rip),%xmm2 # 7a70 <_sk_clut_4D_sse41+0x11d2>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -28482,14 +34763,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,153,94,0,0 // movdqa 0x5e99(%rip),%xmm10 # 5fc0 <_sk_callback_sse41+0x114>
+ .byte 102,68,15,111,21,89,121,0,0 // movdqa 0x7959(%rip),%xmm10 # 7a80 <_sk_clut_4D_sse41+0x11e2>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,133,94,0,0 // movdqa 0x5e85(%rip),%xmm12 # 5fd0 <_sk_callback_sse41+0x124>
- .byte 102,68,15,111,45,140,94,0,0 // movdqa 0x5e8c(%rip),%xmm13 # 5fe0 <_sk_callback_sse41+0x134>
+ .byte 102,68,15,111,37,69,121,0,0 // movdqa 0x7945(%rip),%xmm12 # 7a90 <_sk_clut_4D_sse41+0x11f2>
+ .byte 102,68,15,111,45,76,121,0,0 // movdqa 0x794c(%rip),%xmm13 # 7aa0 <_sk_clut_4D_sse41+0x1202>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -28505,8 +34786,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,71,94,0,0 // mulps 0x5e47(%rip),%xmm8 # 5ff0 <_sk_callback_sse41+0x144>
- .byte 68,15,88,5,79,94,0,0 // addps 0x5e4f(%rip),%xmm8 # 6000 <_sk_callback_sse41+0x154>
+ .byte 68,15,89,5,7,121,0,0 // mulps 0x7907(%rip),%xmm8 # 7ab0 <_sk_clut_4D_sse41+0x1212>
+ .byte 68,15,88,5,15,121,0,0 // addps 0x790f(%rip),%xmm8 # 7ac0 <_sk_clut_4D_sse41+0x1222>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -28548,7 +34829,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,229,93,0,0 // movaps 0x5de5(%rip),%xmm3 # 6010 <_sk_callback_sse41+0x164>
+ .byte 15,40,29,165,120,0,0 // movaps 0x78a5(%rip),%xmm3 # 7ad0 <_sk_clut_4D_sse41+0x1232>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -28559,7 +34840,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,225,93,0,0 // movaps 0x5de1(%rip),%xmm0 # 6020 <_sk_callback_sse41+0x174>
+ .byte 15,40,5,161,120,0,0 // movaps 0x78a1(%rip),%xmm0 # 7ae0 <_sk_clut_4D_sse41+0x1242>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -28605,7 +34886,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,161,93,0,0 // movaps 0x5da1(%rip),%xmm8 # 6030 <_sk_callback_sse41+0x184>
+ .byte 68,15,40,5,97,120,0,0 // movaps 0x7861(%rip),%xmm8 # 7af0 <_sk_clut_4D_sse41+0x1252>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28630,7 +34911,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,100,93,0,0 // movaps 0x5d64(%rip),%xmm9 # 6040 <_sk_callback_sse41+0x194>
+ .byte 68,15,40,13,36,120,0,0 // movaps 0x7824(%rip),%xmm9 # 7b00 <_sk_clut_4D_sse41+0x1262>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -28677,7 +34958,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,8,93,0,0 // movaps 0x5d08(%rip),%xmm8 # 6050 <_sk_callback_sse41+0x1a4>
+ .byte 68,15,40,5,200,119,0,0 // movaps 0x77c8(%rip),%xmm8 # 7b10 <_sk_clut_4D_sse41+0x1272>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -28690,7 +34971,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,248,92,0,0 // movaps 0x5cf8(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x1b4>
+ .byte 68,15,40,5,184,119,0,0 // movaps 0x77b8(%rip),%xmm8 # 7b20 <_sk_clut_4D_sse41+0x1282>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -28707,7 +34988,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,219,92,0,0 // movaps 0x5cdb(%rip),%xmm8 # 6070 <_sk_callback_sse41+0x1c4>
+ .byte 68,15,40,5,155,119,0,0 // movaps 0x779b(%rip),%xmm8 # 7b30 <_sk_clut_4D_sse41+0x1292>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28727,7 +35008,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,175,92,0,0 // movaps 0x5caf(%rip),%xmm8 # 6080 <_sk_callback_sse41+0x1d4>
+ .byte 68,15,40,5,111,119,0,0 // movaps 0x776f(%rip),%xmm8 # 7b40 <_sk_clut_4D_sse41+0x12a2>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -28755,7 +35036,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,131,92,0,0 // movaps 0x5c83(%rip),%xmm8 # 6090 <_sk_callback_sse41+0x1e4>
+ .byte 68,15,40,5,67,119,0,0 // movaps 0x7743(%rip),%xmm8 # 7b50 <_sk_clut_4D_sse41+0x12b2>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -28830,7 +35111,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,184,91,0,0 // movaps 0x5bb8(%rip),%xmm3 # 60a0 <_sk_callback_sse41+0x1f4>
+ .byte 15,40,29,120,118,0,0 // movaps 0x7678(%rip),%xmm3 # 7b60 <_sk_clut_4D_sse41+0x12c2>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -28878,7 +35159,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,35,91,0,0 // movaps 0x5b23(%rip),%xmm2 # 60b0 <_sk_callback_sse41+0x204>
+ .byte 15,40,21,227,117,0,0 // movaps 0x75e3(%rip),%xmm2 # 7b70 <_sk_clut_4D_sse41+0x12d2>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28912,7 +35193,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,200,90,0,0 // movaps 0x5ac8(%rip),%xmm2 # 60c0 <_sk_callback_sse41+0x214>
+ .byte 15,40,21,136,117,0,0 // movaps 0x7588(%rip),%xmm2 # 7b80 <_sk_clut_4D_sse41+0x12e2>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28949,7 +35230,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,98,90,0,0 // movaps 0x5a62(%rip),%xmm2 # 60d0 <_sk_callback_sse41+0x224>
+ .byte 15,40,21,34,117,0,0 // movaps 0x7522(%rip),%xmm2 # 7b90 <_sk_clut_4D_sse41+0x12f2>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28977,7 +35258,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,34,90,0,0 // movaps 0x5a22(%rip),%xmm2 # 60e0 <_sk_callback_sse41+0x234>
+ .byte 15,40,21,226,116,0,0 // movaps 0x74e2(%rip),%xmm2 # 7ba0 <_sk_clut_4D_sse41+0x1302>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28990,7 +35271,7 @@ HIDDEN _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,21,90,0,0 // movaps 0x5a15(%rip),%xmm10 # 60f0 <_sk_callback_sse41+0x244>
+ .byte 68,15,40,21,213,116,0,0 // movaps 0x74d5(%rip),%xmm10 # 7bb0 <_sk_clut_4D_sse41+0x1312>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,203 // movaps %xmm11,%xmm9
@@ -29072,7 +35353,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,243,88,0,0 // movaps 0x58f3(%rip),%xmm10 # 6100 <_sk_callback_sse41+0x254>
+ .byte 68,15,40,21,179,115,0,0 // movaps 0x73b3(%rip),%xmm10 # 7bc0 <_sk_clut_4D_sse41+0x1322>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -29154,7 +35435,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,204,87,0,0 // movaps 0x57cc(%rip),%xmm10 # 6110 <_sk_callback_sse41+0x264>
+ .byte 68,15,40,21,140,114,0,0 // movaps 0x728c(%rip),%xmm10 # 7bd0 <_sk_clut_4D_sse41+0x1332>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -29237,7 +35518,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,177,86,0,0 // movaps 0x56b1(%rip),%xmm10 # 6120 <_sk_callback_sse41+0x274>
+ .byte 68,15,40,21,113,113,0,0 // movaps 0x7171(%rip),%xmm10 # 7be0 <_sk_clut_4D_sse41+0x1342>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -29322,7 +35603,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,136,85,0,0 // movaps 0x5588(%rip),%xmm1 # 6130 <_sk_callback_sse41+0x284>
+ .byte 15,40,13,72,112,0,0 // movaps 0x7048(%rip),%xmm1 # 7bf0 <_sk_clut_4D_sse41+0x1352>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -29335,10 +35616,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,102,85,0,0 // movaps 0x5566(%rip),%xmm13 # 6140 <_sk_callback_sse41+0x294>
+ .byte 68,15,40,45,38,112,0,0 // movaps 0x7026(%rip),%xmm13 # 7c00 <_sk_clut_4D_sse41+0x1362>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,102,85,0,0 // movaps 0x5566(%rip),%xmm12 # 6150 <_sk_callback_sse41+0x2a4>
+ .byte 68,15,40,37,38,112,0,0 // movaps 0x7026(%rip),%xmm12 # 7c10 <_sk_clut_4D_sse41+0x1372>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -29524,12 +35805,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,209,82,0,0 // movaps 0x52d1(%rip),%xmm0 # 6160 <_sk_callback_sse41+0x2b4>
+ .byte 15,40,5,145,109,0,0 // movaps 0x6d91(%rip),%xmm0 # 7c20 <_sk_clut_4D_sse41+0x1382>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,214,82,0,0 // movaps 0x52d6(%rip),%xmm2 # 6170 <_sk_callback_sse41+0x2c4>
+ .byte 15,40,21,150,109,0,0 // movaps 0x6d96(%rip),%xmm2 # 7c30 <_sk_clut_4D_sse41+0x1392>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,215,82,0,0 // movaps 0x52d7(%rip),%xmm14 # 6180 <_sk_callback_sse41+0x2d4>
+ .byte 68,15,40,53,151,109,0,0 // movaps 0x6d97(%rip),%xmm14 # 7c40 <_sk_clut_4D_sse41+0x13a2>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -29612,7 +35893,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,155,81,0,0 // movaps 0x519b(%rip),%xmm9 # 6190 <_sk_callback_sse41+0x2e4>
+ .byte 68,15,40,13,91,108,0,0 // movaps 0x6c5b(%rip),%xmm9 # 7c50 <_sk_clut_4D_sse41+0x13b2>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -29706,14 +35987,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,85,80,0,0 // movaps 0x5055(%rip),%xmm2 # 61a0 <_sk_callback_sse41+0x2f4>
+ .byte 15,40,21,21,107,0,0 // movaps 0x6b15(%rip),%xmm2 # 7c60 <_sk_clut_4D_sse41+0x13c2>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,88,80,0,0 // movaps 0x5058(%rip),%xmm1 # 61b0 <_sk_callback_sse41+0x304>
+ .byte 15,40,13,24,107,0,0 // movaps 0x6b18(%rip),%xmm1 # 7c70 <_sk_clut_4D_sse41+0x13d2>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,87,80,0,0 // movaps 0x5057(%rip),%xmm13 # 61c0 <_sk_callback_sse41+0x314>
+ .byte 68,15,40,45,23,107,0,0 // movaps 0x6b17(%rip),%xmm13 # 7c80 <_sk_clut_4D_sse41+0x13e2>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -29794,7 +36075,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,29,79,0,0 // movaps 0x4f1d(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x324>
+ .byte 68,15,40,13,221,105,0,0 // movaps 0x69dd(%rip),%xmm9 # 7c90 <_sk_clut_4D_sse41+0x13f2>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -29849,14 +36130,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,104,78,0,0 // movaps 0x4e68(%rip),%xmm9 # 61e0 <_sk_callback_sse41+0x334>
+ .byte 68,15,40,13,40,105,0,0 // movaps 0x6928(%rip),%xmm9 # 7ca0 <_sk_clut_4D_sse41+0x1402>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,104,78,0,0 // movaps 0x4e68(%rip),%xmm10 # 61f0 <_sk_callback_sse41+0x344>
+ .byte 68,15,40,21,40,105,0,0 // movaps 0x6928(%rip),%xmm10 # 7cb0 <_sk_clut_4D_sse41+0x1412>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,101,78,0,0 // movaps 0x4e65(%rip),%xmm11 # 6200 <_sk_callback_sse41+0x354>
+ .byte 68,15,40,29,37,105,0,0 // movaps 0x6925(%rip),%xmm11 # 7cc0 <_sk_clut_4D_sse41+0x1422>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -29941,7 +36222,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,33,77,0,0 // movaps 0x4d21(%rip),%xmm9 # 6210 <_sk_callback_sse41+0x364>
+ .byte 68,15,40,13,225,103,0,0 // movaps 0x67e1(%rip),%xmm9 # 7cd0 <_sk_clut_4D_sse41+0x1432>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -29993,13 +36274,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,121,76,0,0 // movaps 0x4c79(%rip),%xmm8 # 6220 <_sk_callback_sse41+0x374>
+ .byte 68,15,40,5,57,103,0,0 // movaps 0x6739(%rip),%xmm8 # 7ce0 <_sk_clut_4D_sse41+0x1442>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,125,76,0,0 // movaps 0x4c7d(%rip),%xmm10 # 6230 <_sk_callback_sse41+0x384>
+ .byte 68,15,40,21,61,103,0,0 // movaps 0x673d(%rip),%xmm10 # 7cf0 <_sk_clut_4D_sse41+0x1452>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,123,76,0,0 // movaps 0x4c7b(%rip),%xmm12 # 6240 <_sk_callback_sse41+0x394>
+ .byte 68,15,40,37,59,103,0,0 // movaps 0x673b(%rip),%xmm12 # 7d00 <_sk_clut_4D_sse41+0x1462>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -30084,7 +36365,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,49,75,0,0 // movaps 0x4b31(%rip),%xmm0 # 6250 <_sk_callback_sse41+0x3a4>
+ .byte 15,40,5,241,101,0,0 // movaps 0x65f1(%rip),%xmm0 # 7d10 <_sk_clut_4D_sse41+0x1472>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -30132,20 +36413,20 @@ _sk_srcover_rgba_8888_sse41:
.byte 15,133,219,0,0,0 // jne 1887 <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,163,74,0,0 // movdqa 0x4aa3(%rip),%xmm4 # 6260 <_sk_callback_sse41+0x3b4>
+ .byte 102,15,111,37,99,101,0,0 // movdqa 0x6563(%rip),%xmm4 # 7d20 <_sk_clut_4D_sse41+0x1482>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,159,74,0,0 // pshufb 0x4a9f(%rip),%xmm5 # 6270 <_sk_callback_sse41+0x3c4>
+ .byte 102,15,56,0,45,95,101,0,0 // pshufb 0x655f(%rip),%xmm5 # 7d30 <_sk_clut_4D_sse41+0x1492>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,159,74,0,0 // pshufb 0x4a9f(%rip),%xmm6 # 6280 <_sk_callback_sse41+0x3d4>
+ .byte 102,15,56,0,53,95,101,0,0 // pshufb 0x655f(%rip),%xmm6 # 7d40 <_sk_clut_4D_sse41+0x14a2>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,156,74,0,0 // movaps 0x4a9c(%rip),%xmm8 # 6290 <_sk_callback_sse41+0x3e4>
+ .byte 68,15,40,5,92,101,0,0 // movaps 0x655c(%rip),%xmm8 # 7d50 <_sk_clut_4D_sse41+0x14b2>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,160,74,0,0 // movaps 0x4aa0(%rip),%xmm12 # 62a0 <_sk_callback_sse41+0x3f4>
+ .byte 68,15,40,37,96,101,0,0 // movaps 0x6560(%rip),%xmm12 # 7d60 <_sk_clut_4D_sse41+0x14c2>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -30225,7 +36506,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,139,73,0,0 // movaps 0x498b(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x404>
+ .byte 68,15,40,5,75,100,0,0 // movaps 0x644b(%rip),%xmm8 # 7d70 <_sk_clut_4D_sse41+0x14d2>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -30237,7 +36518,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,128,73,0,0 // minps 0x4980(%rip),%xmm3 # 62c0 <_sk_callback_sse41+0x414>
+ .byte 15,93,29,64,100,0,0 // minps 0x6440(%rip),%xmm3 # 7d80 <_sk_clut_4D_sse41+0x14e2>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -30248,7 +36529,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,124,73,0,0 // minps 0x497c(%rip),%xmm7 # 62d0 <_sk_callback_sse41+0x424>
+ .byte 15,93,61,60,100,0,0 // minps 0x643c(%rip),%xmm7 # 7d90 <_sk_clut_4D_sse41+0x14f2>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -30283,7 +36564,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,72,73,0,0 // movaps 0x4948(%rip),%xmm8 # 62e0 <_sk_callback_sse41+0x434>
+ .byte 68,15,40,5,8,100,0,0 // movaps 0x6408(%rip),%xmm8 # 7da0 <_sk_clut_4D_sse41+0x1502>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -30345,7 +36626,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,226,72,0,0 // movaps 0x48e2(%rip),%xmm9 # 62f0 <_sk_callback_sse41+0x444>
+ .byte 68,15,40,13,162,99,0,0 // movaps 0x63a2(%rip),%xmm9 # 7db0 <_sk_clut_4D_sse41+0x1512>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -30359,20 +36640,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,205,72,0,0 // movaps 0x48cd(%rip),%xmm11 # 6300 <_sk_callback_sse41+0x454>
+ .byte 68,15,40,29,141,99,0,0 // movaps 0x638d(%rip),%xmm11 # 7dc0 <_sk_clut_4D_sse41+0x1522>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,197,72,0,0 // movaps 0x48c5(%rip),%xmm12 # 6310 <_sk_callback_sse41+0x464>
+ .byte 68,15,40,37,133,99,0,0 // movaps 0x6385(%rip),%xmm12 # 7dd0 <_sk_clut_4D_sse41+0x1532>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,197,72,0,0 // movaps 0x48c5(%rip),%xmm13 # 6320 <_sk_callback_sse41+0x474>
+ .byte 68,15,40,45,133,99,0,0 // movaps 0x6385(%rip),%xmm13 # 7de0 <_sk_clut_4D_sse41+0x1542>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,197,72,0,0 // movaps 0x48c5(%rip),%xmm14 # 6330 <_sk_callback_sse41+0x484>
+ .byte 68,15,40,53,133,99,0,0 // movaps 0x6385(%rip),%xmm14 # 7df0 <_sk_clut_4D_sse41+0x1552>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,201,72,0,0 // movaps 0x48c9(%rip),%xmm15 # 6340 <_sk_callback_sse41+0x494>
+ .byte 68,15,40,61,137,99,0,0 // movaps 0x6389(%rip),%xmm15 # 7e00 <_sk_clut_4D_sse41+0x1562>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -30409,19 +36690,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,84,72,0,0 // movaps 0x4854(%rip),%xmm11 # 6350 <_sk_callback_sse41+0x4a4>
+ .byte 68,15,40,29,20,99,0,0 // movaps 0x6314(%rip),%xmm11 # 7e10 <_sk_clut_4D_sse41+0x1572>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,77,72,0,0 // movaps 0x484d(%rip),%xmm12 # 6360 <_sk_callback_sse41+0x4b4>
+ .byte 68,15,40,37,13,99,0,0 // movaps 0x630d(%rip),%xmm12 # 7e20 <_sk_clut_4D_sse41+0x1582>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,81,72,0,0 // movaps 0x4851(%rip),%xmm13 # 6370 <_sk_callback_sse41+0x4c4>
+ .byte 68,15,40,45,17,99,0,0 // movaps 0x6311(%rip),%xmm13 # 7e30 <_sk_clut_4D_sse41+0x1592>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,82,72,0,0 // movaps 0x4852(%rip),%xmm14 # 6380 <_sk_callback_sse41+0x4d4>
+ .byte 68,15,40,53,18,99,0,0 // movaps 0x6312(%rip),%xmm14 # 7e40 <_sk_clut_4D_sse41+0x15a2>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,86,72,0,0 // movaps 0x4856(%rip),%xmm15 # 6390 <_sk_callback_sse41+0x4e4>
+ .byte 68,15,40,61,22,99,0,0 // movaps 0x6316(%rip),%xmm15 # 7e50 <_sk_clut_4D_sse41+0x15b2>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -30465,22 +36746,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,202,71,0,0 // movaps 0x47ca(%rip),%xmm11 # 63a0 <_sk_callback_sse41+0x4f4>
+ .byte 68,15,40,29,138,98,0,0 // movaps 0x628a(%rip),%xmm11 # 7e60 <_sk_clut_4D_sse41+0x15c2>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,202,71,0,0 // movaps 0x47ca(%rip),%xmm12 # 63b0 <_sk_callback_sse41+0x504>
+ .byte 68,15,40,37,138,98,0,0 // movaps 0x628a(%rip),%xmm12 # 7e70 <_sk_clut_4D_sse41+0x15d2>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,202,71,0,0 // movaps 0x47ca(%rip),%xmm10 # 63c0 <_sk_callback_sse41+0x514>
+ .byte 68,15,40,21,138,98,0,0 // movaps 0x628a(%rip),%xmm10 # 7e80 <_sk_clut_4D_sse41+0x15e2>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,202,71,0,0 // movaps 0x47ca(%rip),%xmm13 # 63d0 <_sk_callback_sse41+0x524>
+ .byte 68,15,40,45,138,98,0,0 // movaps 0x628a(%rip),%xmm13 # 7e90 <_sk_clut_4D_sse41+0x15f2>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,206,71,0,0 // movaps 0x47ce(%rip),%xmm14 # 63e0 <_sk_callback_sse41+0x534>
+ .byte 68,15,40,53,142,98,0,0 // movaps 0x628e(%rip),%xmm14 # 7ea0 <_sk_clut_4D_sse41+0x1602>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,202,71,0,0 // movaps 0x47ca(%rip),%xmm15 # 63f0 <_sk_callback_sse41+0x544>
+ .byte 68,15,40,61,138,98,0,0 // movaps 0x628a(%rip),%xmm15 # 7eb0 <_sk_clut_4D_sse41+0x1612>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -30533,7 +36814,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,226 // minps %xmm2,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,23,71,0,0 // movaps 0x4717(%rip),%xmm14 # 6400 <_sk_callback_sse41+0x554>
+ .byte 68,15,40,53,215,97,0,0 // movaps 0x61d7(%rip),%xmm14 # 7ec0 <_sk_clut_4D_sse41+0x1622>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -30542,27 +36823,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,254,70,0,0 // andps 0x46fe(%rip),%xmm15 # 6410 <_sk_callback_sse41+0x564>
+ .byte 68,15,84,61,190,97,0,0 // andps 0x61be(%rip),%xmm15 # 7ed0 <_sk_clut_4D_sse41+0x1632>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,241,70,0,0 // movaps 0x46f1(%rip),%xmm13 # 6420 <_sk_callback_sse41+0x574>
+ .byte 68,15,40,45,177,97,0,0 // movaps 0x61b1(%rip),%xmm13 # 7ee0 <_sk_clut_4D_sse41+0x1642>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,237,70,0,0 // addps 0x46ed(%rip),%xmm8 # 6430 <_sk_callback_sse41+0x584>
+ .byte 68,15,88,5,173,97,0,0 // addps 0x61ad(%rip),%xmm8 # 7ef0 <_sk_clut_4D_sse41+0x1652>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,229,70,0,0 // mulps 0x46e5(%rip),%xmm8 # 6440 <_sk_callback_sse41+0x594>
+ .byte 68,15,89,5,165,97,0,0 // mulps 0x61a5(%rip),%xmm8 # 7f00 <_sk_clut_4D_sse41+0x1662>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,217,70,0,0 // movaps 0x46d9(%rip),%xmm0 # 6450 <_sk_callback_sse41+0x5a4>
+ .byte 15,40,5,153,97,0,0 // movaps 0x6199(%rip),%xmm0 # 7f10 <_sk_clut_4D_sse41+0x1672>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -30584,7 +36865,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,159,70,0,0 // movaps 0x469f(%rip),%xmm9 # 6460 <_sk_callback_sse41+0x5b4>
+ .byte 68,15,40,13,95,97,0,0 // movaps 0x615f(%rip),%xmm9 # 7f20 <_sk_clut_4D_sse41+0x1682>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -30597,19 +36878,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,122,70,0,0 // movaps 0x467a(%rip),%xmm14 # 6470 <_sk_callback_sse41+0x5c4>
+ .byte 68,15,40,53,58,97,0,0 // movaps 0x613a(%rip),%xmm14 # 7f30 <_sk_clut_4D_sse41+0x1692>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,115,70,0,0 // movaps 0x4673(%rip),%xmm11 # 6480 <_sk_callback_sse41+0x5d4>
+ .byte 68,15,40,29,51,97,0,0 // movaps 0x6133(%rip),%xmm11 # 7f40 <_sk_clut_4D_sse41+0x16a2>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,108,70,0,0 // movaps 0x466c(%rip),%xmm7 # 6490 <_sk_callback_sse41+0x5e4>
+ .byte 15,40,61,44,97,0,0 // movaps 0x612c(%rip),%xmm7 # 7f50 <_sk_clut_4D_sse41+0x16b2>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,109,70,0,0 // movaps 0x466d(%rip),%xmm3 # 64a0 <_sk_callback_sse41+0x5f4>
+ .byte 15,40,29,45,97,0,0 // movaps 0x612d(%rip),%xmm3 # 7f60 <_sk_clut_4D_sse41+0x16c2>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -30619,7 +36900,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,76,70,0,0 // movaps 0x464c(%rip),%xmm12 # 64b0 <_sk_callback_sse41+0x604>
+ .byte 68,15,40,37,12,97,0,0 // movaps 0x610c(%rip),%xmm12 # 7f70 <_sk_clut_4D_sse41+0x16d2>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -30653,7 +36934,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,196,69,0,0 // addps 0x45c4(%rip),%xmm10 # 64c0 <_sk_callback_sse41+0x614>
+ .byte 68,15,88,21,132,96,0,0 // addps 0x6084(%rip),%xmm10 # 7f80 <_sk_clut_4D_sse41+0x16e2>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -30710,9 +36991,9 @@ _sk_scale_u8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,52 // jne 1fe3 <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,17,69,0,0 // pand 0x4511(%rip),%xmm8 # 64d0 <_sk_callback_sse41+0x624>
+ .byte 102,68,15,219,5,209,95,0,0 // pand 0x5fd1(%rip),%xmm8 # 7f90 <_sk_clut_4D_sse41+0x16f2>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,21,69,0,0 // mulps 0x4515(%rip),%xmm8 # 64e0 <_sk_callback_sse41+0x634>
+ .byte 68,15,89,5,213,95,0,0 // mulps 0x5fd5(%rip),%xmm8 # 7fa0 <_sk_clut_4D_sse41+0x1702>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -30776,9 +37057,9 @@ _sk_lerp_u8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,72 // jne 20d2 <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,86,68,0,0 // pand 0x4456(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0x644>
+ .byte 102,68,15,219,5,22,95,0,0 // pand 0x5f16(%rip),%xmm8 # 7fb0 <_sk_clut_4D_sse41+0x1712>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,90,68,0,0 // mulps 0x445a(%rip),%xmm8 # 6500 <_sk_callback_sse41+0x654>
+ .byte 68,15,89,5,26,95,0,0 // mulps 0x5f1a(%rip),%xmm8 # 7fc0 <_sk_clut_4D_sse41+0x1722>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -30828,17 +37109,17 @@ _sk_lerp_565_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,152,0,0,0 // jne 21e3 <_sk_lerp_565_sse41+0xb7>
.byte 102,71,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm10
- .byte 102,68,15,111,5,181,67,0,0 // movdqa 0x43b5(%rip),%xmm8 # 6510 <_sk_callback_sse41+0x664>
+ .byte 102,68,15,111,5,117,94,0,0 // movdqa 0x5e75(%rip),%xmm8 # 7fd0 <_sk_clut_4D_sse41+0x1732>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,180,67,0,0 // mulps 0x43b4(%rip),%xmm8 # 6520 <_sk_callback_sse41+0x674>
- .byte 102,68,15,111,13,187,67,0,0 // movdqa 0x43bb(%rip),%xmm9 # 6530 <_sk_callback_sse41+0x684>
+ .byte 68,15,89,5,116,94,0,0 // mulps 0x5e74(%rip),%xmm8 # 7fe0 <_sk_clut_4D_sse41+0x1742>
+ .byte 102,68,15,111,13,123,94,0,0 // movdqa 0x5e7b(%rip),%xmm9 # 7ff0 <_sk_clut_4D_sse41+0x1752>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,186,67,0,0 // mulps 0x43ba(%rip),%xmm9 # 6540 <_sk_callback_sse41+0x694>
- .byte 102,68,15,219,21,193,67,0,0 // pand 0x43c1(%rip),%xmm10 # 6550 <_sk_callback_sse41+0x6a4>
+ .byte 68,15,89,13,122,94,0,0 // mulps 0x5e7a(%rip),%xmm9 # 8000 <_sk_clut_4D_sse41+0x1762>
+ .byte 102,68,15,219,21,129,94,0,0 // pand 0x5e81(%rip),%xmm10 # 8010 <_sk_clut_4D_sse41+0x1772>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,197,67,0,0 // mulps 0x43c5(%rip),%xmm10 # 6560 <_sk_callback_sse41+0x6b4>
+ .byte 68,15,89,21,133,94,0,0 // mulps 0x5e85(%rip),%xmm10 # 8020 <_sk_clut_4D_sse41+0x1782>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -30892,7 +37173,7 @@ _sk_load_tables_sse41:
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,18,67,0,0 // movdqa 0x4312(%rip),%xmm0 # 6570 <_sk_callback_sse41+0x6c4>
+ .byte 102,15,111,5,210,93,0,0 // movdqa 0x5dd2(%rip),%xmm0 # 8030 <_sk_clut_4D_sse41+0x1792>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -30907,7 +37188,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0
.byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,205,66,0,0 // pshufb 0x42cd(%rip),%xmm1 # 6580 <_sk_callback_sse41+0x6d4>
+ .byte 102,15,56,0,13,141,93,0,0 // pshufb 0x5d8d(%rip),%xmm1 # 8040 <_sk_clut_4D_sse41+0x17a2>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,211 // movzbl %bl,%r10d
@@ -30922,7 +37203,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,72,24 // mov 0x18(%rax),%r9
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,137,66,0,0 // pshufb 0x4289(%rip),%xmm2 # 6590 <_sk_callback_sse41+0x6e4>
+ .byte 102,15,56,0,21,73,93,0,0 // pshufb 0x5d49(%rip),%xmm2 # 8050 <_sk_clut_4D_sse41+0x17b2>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,208 // movzbl %al,%r10d
@@ -30937,7 +37218,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,70,66,0,0 // mulps 0x4246(%rip),%xmm3 # 65a0 <_sk_callback_sse41+0x6f4>
+ .byte 15,89,29,6,93,0,0 // mulps 0x5d06(%rip),%xmm3 # 8060 <_sk_clut_4D_sse41+0x17c2>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -30980,7 +37261,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,180,65,0,0 // movdqa 0x41b4(%rip),%xmm8 # 65b0 <_sk_callback_sse41+0x704>
+ .byte 102,68,15,111,5,116,92,0,0 // movdqa 0x5c74(%rip),%xmm8 # 8070 <_sk_clut_4D_sse41+0x17d2>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -30998,7 +37279,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,99,65,0,0 // pshufb 0x4163(%rip),%xmm1 # 65c0 <_sk_callback_sse41+0x714>
+ .byte 102,15,56,0,13,35,92,0,0 // pshufb 0x5c23(%rip),%xmm1 # 8080 <_sk_clut_4D_sse41+0x17e2>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -31034,7 +37315,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,177,64,0,0 // mulps 0x40b1(%rip),%xmm3 # 65d0 <_sk_callback_sse41+0x724>
+ .byte 15,89,29,113,91,0,0 // mulps 0x5b71(%rip),%xmm3 # 8090 <_sk_clut_4D_sse41+0x17f2>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -31076,7 +37357,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,38,64,0,0 // movdqa 0x4026(%rip),%xmm8 # 65e0 <_sk_callback_sse41+0x734>
+ .byte 102,68,15,111,5,230,90,0,0 // movdqa 0x5ae6(%rip),%xmm8 # 80a0 <_sk_clut_4D_sse41+0x1802>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -31094,7 +37375,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,213,63,0,0 // pshufb 0x3fd5(%rip),%xmm1 # 65f0 <_sk_callback_sse41+0x744>
+ .byte 102,15,56,0,13,149,90,0,0 // pshufb 0x5a95(%rip),%xmm1 # 80b0 <_sk_clut_4D_sse41+0x1812>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -31125,7 +37406,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,64,63,0,0 // movaps 0x3f40(%rip),%xmm3 # 6600 <_sk_callback_sse41+0x754>
+ .byte 15,40,29,0,90,0,0 // movaps 0x5a00(%rip),%xmm3 # 80c0 <_sk_clut_4D_sse41+0x1822>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -31159,7 +37440,7 @@ _sk_byte_tables_sse41:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,216,62,0,0 // movaps 0x3ed8(%rip),%xmm8 # 6610 <_sk_callback_sse41+0x764>
+ .byte 68,15,40,5,152,89,0,0 // movaps 0x5998(%rip),%xmm8 # 80d0 <_sk_clut_4D_sse41+0x1832>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
@@ -31178,7 +37459,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,137,62,0,0 // movaps 0x3e89(%rip),%xmm9 # 6620 <_sk_callback_sse41+0x774>
+ .byte 68,15,40,13,73,89,0,0 // movaps 0x5949(%rip),%xmm9 # 80e0 <_sk_clut_4D_sse41+0x1842>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -31274,7 +37555,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,1,61,0,0 // movaps 0x3d01(%rip),%xmm9 # 6630 <_sk_callback_sse41+0x784>
+ .byte 68,15,40,13,193,87,0,0 // movaps 0x57c1(%rip),%xmm9 # 80f0 <_sk_clut_4D_sse41+0x1852>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -31461,31 +37742,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,73,58,0,0 // mulps 0x3a49(%rip),%xmm8 # 6640 <_sk_callback_sse41+0x794>
- .byte 68,15,84,21,81,58,0,0 // andps 0x3a51(%rip),%xmm10 # 6650 <_sk_callback_sse41+0x7a4>
- .byte 68,15,86,21,89,58,0,0 // orps 0x3a59(%rip),%xmm10 # 6660 <_sk_callback_sse41+0x7b4>
- .byte 68,15,88,5,97,58,0,0 // addps 0x3a61(%rip),%xmm8 # 6670 <_sk_callback_sse41+0x7c4>
- .byte 68,15,40,37,105,58,0,0 // movaps 0x3a69(%rip),%xmm12 # 6680 <_sk_callback_sse41+0x7d4>
+ .byte 68,15,89,5,9,85,0,0 // mulps 0x5509(%rip),%xmm8 # 8100 <_sk_clut_4D_sse41+0x1862>
+ .byte 68,15,84,21,17,85,0,0 // andps 0x5511(%rip),%xmm10 # 8110 <_sk_clut_4D_sse41+0x1872>
+ .byte 68,15,86,21,25,85,0,0 // orps 0x5519(%rip),%xmm10 # 8120 <_sk_clut_4D_sse41+0x1882>
+ .byte 68,15,88,5,33,85,0,0 // addps 0x5521(%rip),%xmm8 # 8130 <_sk_clut_4D_sse41+0x1892>
+ .byte 68,15,40,37,41,85,0,0 // movaps 0x5529(%rip),%xmm12 # 8140 <_sk_clut_4D_sse41+0x18a2>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,105,58,0,0 // addps 0x3a69(%rip),%xmm10 # 6690 <_sk_callback_sse41+0x7e4>
- .byte 68,15,40,37,113,58,0,0 // movaps 0x3a71(%rip),%xmm12 # 66a0 <_sk_callback_sse41+0x7f4>
+ .byte 68,15,88,21,41,85,0,0 // addps 0x5529(%rip),%xmm10 # 8150 <_sk_clut_4D_sse41+0x18b2>
+ .byte 68,15,40,37,49,85,0,0 // movaps 0x5531(%rip),%xmm12 # 8160 <_sk_clut_4D_sse41+0x18c2>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,94,58,0,0 // addps 0x3a5e(%rip),%xmm8 # 66b0 <_sk_callback_sse41+0x804>
- .byte 68,15,40,21,102,58,0,0 // movaps 0x3a66(%rip),%xmm10 # 66c0 <_sk_callback_sse41+0x814>
+ .byte 68,15,88,5,30,85,0,0 // addps 0x551e(%rip),%xmm8 # 8170 <_sk_clut_4D_sse41+0x18d2>
+ .byte 68,15,40,21,38,85,0,0 // movaps 0x5526(%rip),%xmm10 # 8180 <_sk_clut_4D_sse41+0x18e2>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,102,58,0,0 // movaps 0x3a66(%rip),%xmm10 # 66d0 <_sk_callback_sse41+0x824>
+ .byte 68,15,40,21,38,85,0,0 // movaps 0x5526(%rip),%xmm10 # 8190 <_sk_clut_4D_sse41+0x18f2>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,106,58,0,0 // movaps 0x3a6a(%rip),%xmm11 # 66e0 <_sk_callback_sse41+0x834>
+ .byte 68,15,40,29,42,85,0,0 // movaps 0x552a(%rip),%xmm11 # 81a0 <_sk_clut_4D_sse41+0x1902>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,106,58,0,0 // mulps 0x3a6a(%rip),%xmm11 # 66f0 <_sk_callback_sse41+0x844>
+ .byte 68,15,89,29,42,85,0,0 // mulps 0x552a(%rip),%xmm11 # 81b0 <_sk_clut_4D_sse41+0x1912>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -31493,7 +37774,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,81,58,0,0 // minps 0x3a51(%rip),%xmm8 # 6700 <_sk_callback_sse41+0x854>
+ .byte 68,15,93,5,17,85,0,0 // minps 0x5511(%rip),%xmm8 # 81c0 <_sk_clut_4D_sse41+0x1922>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31523,31 +37804,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,242,57,0,0 // mulps 0x39f2(%rip),%xmm12 # 6710 <_sk_callback_sse41+0x864>
- .byte 68,15,84,29,250,57,0,0 // andps 0x39fa(%rip),%xmm11 # 6720 <_sk_callback_sse41+0x874>
- .byte 68,15,86,29,2,58,0,0 // orps 0x3a02(%rip),%xmm11 # 6730 <_sk_callback_sse41+0x884>
- .byte 68,15,88,37,10,58,0,0 // addps 0x3a0a(%rip),%xmm12 # 6740 <_sk_callback_sse41+0x894>
- .byte 15,40,13,19,58,0,0 // movaps 0x3a13(%rip),%xmm1 # 6750 <_sk_callback_sse41+0x8a4>
+ .byte 68,15,89,37,178,84,0,0 // mulps 0x54b2(%rip),%xmm12 # 81d0 <_sk_clut_4D_sse41+0x1932>
+ .byte 68,15,84,29,186,84,0,0 // andps 0x54ba(%rip),%xmm11 # 81e0 <_sk_clut_4D_sse41+0x1942>
+ .byte 68,15,86,29,194,84,0,0 // orps 0x54c2(%rip),%xmm11 # 81f0 <_sk_clut_4D_sse41+0x1952>
+ .byte 68,15,88,37,202,84,0,0 // addps 0x54ca(%rip),%xmm12 # 8200 <_sk_clut_4D_sse41+0x1962>
+ .byte 15,40,13,211,84,0,0 // movaps 0x54d3(%rip),%xmm1 # 8210 <_sk_clut_4D_sse41+0x1972>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,19,58,0,0 // addps 0x3a13(%rip),%xmm11 # 6760 <_sk_callback_sse41+0x8b4>
- .byte 15,40,13,28,58,0,0 // movaps 0x3a1c(%rip),%xmm1 # 6770 <_sk_callback_sse41+0x8c4>
+ .byte 68,15,88,29,211,84,0,0 // addps 0x54d3(%rip),%xmm11 # 8220 <_sk_clut_4D_sse41+0x1982>
+ .byte 15,40,13,220,84,0,0 // movaps 0x54dc(%rip),%xmm1 # 8230 <_sk_clut_4D_sse41+0x1992>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,9,58,0,0 // addps 0x3a09(%rip),%xmm12 # 6780 <_sk_callback_sse41+0x8d4>
- .byte 15,40,13,18,58,0,0 // movaps 0x3a12(%rip),%xmm1 # 6790 <_sk_callback_sse41+0x8e4>
+ .byte 68,15,88,37,201,84,0,0 // addps 0x54c9(%rip),%xmm12 # 8240 <_sk_clut_4D_sse41+0x19a2>
+ .byte 15,40,13,210,84,0,0 // movaps 0x54d2(%rip),%xmm1 # 8250 <_sk_clut_4D_sse41+0x19b2>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,18,58,0,0 // movaps 0x3a12(%rip),%xmm10 # 67a0 <_sk_callback_sse41+0x8f4>
+ .byte 68,15,40,21,210,84,0,0 // movaps 0x54d2(%rip),%xmm10 # 8260 <_sk_clut_4D_sse41+0x19c2>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,23,58,0,0 // movaps 0x3a17(%rip),%xmm1 # 67b0 <_sk_callback_sse41+0x904>
+ .byte 15,40,13,215,84,0,0 // movaps 0x54d7(%rip),%xmm1 # 8270 <_sk_clut_4D_sse41+0x19d2>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,24,58,0,0 // mulps 0x3a18(%rip),%xmm1 # 67c0 <_sk_callback_sse41+0x914>
+ .byte 15,89,13,216,84,0,0 // mulps 0x54d8(%rip),%xmm1 # 8280 <_sk_clut_4D_sse41+0x19e2>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -31555,7 +37836,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,3,58,0,0 // minps 0x3a03(%rip),%xmm1 # 67d0 <_sk_callback_sse41+0x924>
+ .byte 15,93,13,195,84,0,0 // minps 0x54c3(%rip),%xmm1 # 8290 <_sk_clut_4D_sse41+0x19f2>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31585,31 +37866,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,164,57,0,0 // mulps 0x39a4(%rip),%xmm12 # 67e0 <_sk_callback_sse41+0x934>
- .byte 68,15,84,29,172,57,0,0 // andps 0x39ac(%rip),%xmm11 # 67f0 <_sk_callback_sse41+0x944>
- .byte 68,15,86,29,180,57,0,0 // orps 0x39b4(%rip),%xmm11 # 6800 <_sk_callback_sse41+0x954>
- .byte 68,15,88,37,188,57,0,0 // addps 0x39bc(%rip),%xmm12 # 6810 <_sk_callback_sse41+0x964>
- .byte 15,40,21,197,57,0,0 // movaps 0x39c5(%rip),%xmm2 # 6820 <_sk_callback_sse41+0x974>
+ .byte 68,15,89,37,100,84,0,0 // mulps 0x5464(%rip),%xmm12 # 82a0 <_sk_clut_4D_sse41+0x1a02>
+ .byte 68,15,84,29,108,84,0,0 // andps 0x546c(%rip),%xmm11 # 82b0 <_sk_clut_4D_sse41+0x1a12>
+ .byte 68,15,86,29,116,84,0,0 // orps 0x5474(%rip),%xmm11 # 82c0 <_sk_clut_4D_sse41+0x1a22>
+ .byte 68,15,88,37,124,84,0,0 // addps 0x547c(%rip),%xmm12 # 82d0 <_sk_clut_4D_sse41+0x1a32>
+ .byte 15,40,21,133,84,0,0 // movaps 0x5485(%rip),%xmm2 # 82e0 <_sk_clut_4D_sse41+0x1a42>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,197,57,0,0 // addps 0x39c5(%rip),%xmm11 # 6830 <_sk_callback_sse41+0x984>
- .byte 15,40,21,206,57,0,0 // movaps 0x39ce(%rip),%xmm2 # 6840 <_sk_callback_sse41+0x994>
+ .byte 68,15,88,29,133,84,0,0 // addps 0x5485(%rip),%xmm11 # 82f0 <_sk_clut_4D_sse41+0x1a52>
+ .byte 15,40,21,142,84,0,0 // movaps 0x548e(%rip),%xmm2 # 8300 <_sk_clut_4D_sse41+0x1a62>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,187,57,0,0 // addps 0x39bb(%rip),%xmm12 # 6850 <_sk_callback_sse41+0x9a4>
- .byte 15,40,21,196,57,0,0 // movaps 0x39c4(%rip),%xmm2 # 6860 <_sk_callback_sse41+0x9b4>
+ .byte 68,15,88,37,123,84,0,0 // addps 0x547b(%rip),%xmm12 # 8310 <_sk_clut_4D_sse41+0x1a72>
+ .byte 15,40,21,132,84,0,0 // movaps 0x5484(%rip),%xmm2 # 8320 <_sk_clut_4D_sse41+0x1a82>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,196,57,0,0 // movaps 0x39c4(%rip),%xmm10 # 6870 <_sk_callback_sse41+0x9c4>
+ .byte 68,15,40,21,132,84,0,0 // movaps 0x5484(%rip),%xmm10 # 8330 <_sk_clut_4D_sse41+0x1a92>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,201,57,0,0 // movaps 0x39c9(%rip),%xmm2 # 6880 <_sk_callback_sse41+0x9d4>
+ .byte 15,40,21,137,84,0,0 // movaps 0x5489(%rip),%xmm2 # 8340 <_sk_clut_4D_sse41+0x1aa2>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,202,57,0,0 // mulps 0x39ca(%rip),%xmm2 # 6890 <_sk_callback_sse41+0x9e4>
+ .byte 15,89,21,138,84,0,0 // mulps 0x548a(%rip),%xmm2 # 8350 <_sk_clut_4D_sse41+0x1ab2>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -31617,7 +37898,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,181,57,0,0 // minps 0x39b5(%rip),%xmm2 # 68a0 <_sk_callback_sse41+0x9f4>
+ .byte 15,93,21,117,84,0,0 // minps 0x5475(%rip),%xmm2 # 8360 <_sk_clut_4D_sse41+0x1ac2>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31647,31 +37928,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,86,57,0,0 // mulps 0x3956(%rip),%xmm12 # 68b0 <_sk_callback_sse41+0xa04>
- .byte 68,15,84,29,94,57,0,0 // andps 0x395e(%rip),%xmm11 # 68c0 <_sk_callback_sse41+0xa14>
- .byte 68,15,86,29,102,57,0,0 // orps 0x3966(%rip),%xmm11 # 68d0 <_sk_callback_sse41+0xa24>
- .byte 68,15,88,37,110,57,0,0 // addps 0x396e(%rip),%xmm12 # 68e0 <_sk_callback_sse41+0xa34>
- .byte 15,40,29,119,57,0,0 // movaps 0x3977(%rip),%xmm3 # 68f0 <_sk_callback_sse41+0xa44>
+ .byte 68,15,89,37,22,84,0,0 // mulps 0x5416(%rip),%xmm12 # 8370 <_sk_clut_4D_sse41+0x1ad2>
+ .byte 68,15,84,29,30,84,0,0 // andps 0x541e(%rip),%xmm11 # 8380 <_sk_clut_4D_sse41+0x1ae2>
+ .byte 68,15,86,29,38,84,0,0 // orps 0x5426(%rip),%xmm11 # 8390 <_sk_clut_4D_sse41+0x1af2>
+ .byte 68,15,88,37,46,84,0,0 // addps 0x542e(%rip),%xmm12 # 83a0 <_sk_clut_4D_sse41+0x1b02>
+ .byte 15,40,29,55,84,0,0 // movaps 0x5437(%rip),%xmm3 # 83b0 <_sk_clut_4D_sse41+0x1b12>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,119,57,0,0 // addps 0x3977(%rip),%xmm11 # 6900 <_sk_callback_sse41+0xa54>
- .byte 15,40,29,128,57,0,0 // movaps 0x3980(%rip),%xmm3 # 6910 <_sk_callback_sse41+0xa64>
+ .byte 68,15,88,29,55,84,0,0 // addps 0x5437(%rip),%xmm11 # 83c0 <_sk_clut_4D_sse41+0x1b22>
+ .byte 15,40,29,64,84,0,0 // movaps 0x5440(%rip),%xmm3 # 83d0 <_sk_clut_4D_sse41+0x1b32>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,109,57,0,0 // addps 0x396d(%rip),%xmm12 # 6920 <_sk_callback_sse41+0xa74>
- .byte 15,40,29,118,57,0,0 // movaps 0x3976(%rip),%xmm3 # 6930 <_sk_callback_sse41+0xa84>
+ .byte 68,15,88,37,45,84,0,0 // addps 0x542d(%rip),%xmm12 # 83e0 <_sk_clut_4D_sse41+0x1b42>
+ .byte 15,40,29,54,84,0,0 // movaps 0x5436(%rip),%xmm3 # 83f0 <_sk_clut_4D_sse41+0x1b52>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,118,57,0,0 // movaps 0x3976(%rip),%xmm10 # 6940 <_sk_callback_sse41+0xa94>
+ .byte 68,15,40,21,54,84,0,0 // movaps 0x5436(%rip),%xmm10 # 8400 <_sk_clut_4D_sse41+0x1b62>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,123,57,0,0 // movaps 0x397b(%rip),%xmm3 # 6950 <_sk_callback_sse41+0xaa4>
+ .byte 15,40,29,59,84,0,0 // movaps 0x543b(%rip),%xmm3 # 8410 <_sk_clut_4D_sse41+0x1b72>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,124,57,0,0 // mulps 0x397c(%rip),%xmm3 # 6960 <_sk_callback_sse41+0xab4>
+ .byte 15,89,29,60,84,0,0 // mulps 0x543c(%rip),%xmm3 # 8420 <_sk_clut_4D_sse41+0x1b82>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -31679,7 +37960,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,103,57,0,0 // minps 0x3967(%rip),%xmm3 # 6970 <_sk_callback_sse41+0xac4>
+ .byte 15,93,29,39,84,0,0 // minps 0x5427(%rip),%xmm3 # 8430 <_sk_clut_4D_sse41+0x1b92>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31696,20 +37977,20 @@ _sk_gamma_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,70,57,0,0 // mulps 0x3946(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
- .byte 68,15,40,53,78,57,0,0 // movaps 0x394e(%rip),%xmm14 # 6990 <_sk_callback_sse41+0xae4>
+ .byte 15,89,5,6,84,0,0 // mulps 0x5406(%rip),%xmm0 # 8440 <_sk_clut_4D_sse41+0x1ba2>
+ .byte 68,15,40,53,14,84,0,0 // movaps 0x540e(%rip),%xmm14 # 8450 <_sk_clut_4D_sse41+0x1bb2>
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,37,82,57,0,0 // movaps 0x3952(%rip),%xmm12 # 69a0 <_sk_callback_sse41+0xaf4>
+ .byte 68,15,40,37,18,84,0,0 // movaps 0x5412(%rip),%xmm12 # 8460 <_sk_clut_4D_sse41+0x1bc2>
.byte 65,15,86,212 // orps %xmm12,%xmm2
- .byte 68,15,40,21,86,57,0,0 // movaps 0x3956(%rip),%xmm10 # 69b0 <_sk_callback_sse41+0xb04>
+ .byte 68,15,40,21,22,84,0,0 // movaps 0x5416(%rip),%xmm10 # 8470 <_sk_clut_4D_sse41+0x1bd2>
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,29,90,57,0,0 // movaps 0x395a(%rip),%xmm11 # 69c0 <_sk_callback_sse41+0xb14>
+ .byte 68,15,40,29,26,84,0,0 // movaps 0x541a(%rip),%xmm11 # 8480 <_sk_clut_4D_sse41+0x1be2>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,13,88,57,0,0 // movaps 0x3958(%rip),%xmm9 # 69d0 <_sk_callback_sse41+0xb24>
+ .byte 68,15,40,13,24,84,0,0 // movaps 0x5418(%rip),%xmm9 # 8490 <_sk_clut_4D_sse41+0x1bf2>
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 68,15,40,45,92,57,0,0 // movaps 0x395c(%rip),%xmm13 # 69e0 <_sk_callback_sse41+0xb34>
+ .byte 68,15,40,45,28,84,0,0 // movaps 0x541c(%rip),%xmm13 # 84a0 <_sk_clut_4D_sse41+0x1c02>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -31720,21 +38001,21 @@ _sk_gamma_sse41:
.byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,63,57,0,0 // movaps 0x393f(%rip),%xmm6 # 69f0 <_sk_callback_sse41+0xb44>
+ .byte 15,40,53,255,83,0,0 // movaps 0x53ff(%rip),%xmm6 # 84b0 <_sk_clut_4D_sse41+0x1c12>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,85,57,0,0 // movaps 0x3955(%rip),%xmm7 # 6a10 <_sk_callback_sse41+0xb64>
+ .byte 15,40,61,21,84,0,0 // movaps 0x5415(%rip),%xmm7 # 84d0 <_sk_clut_4D_sse41+0x1c32>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,53,57,0,0 // movaps 0x3935(%rip),%xmm4 # 6a00 <_sk_callback_sse41+0xb54>
+ .byte 15,40,37,245,83,0,0 // movaps 0x53f5(%rip),%xmm4 # 84c0 <_sk_clut_4D_sse41+0x1c22>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,71,57,0,0 // movaps 0x3947(%rip),%xmm15 # 6a20 <_sk_callback_sse41+0xb74>
+ .byte 68,15,40,61,7,84,0,0 // movaps 0x5407(%rip),%xmm15 # 84e0 <_sk_clut_4D_sse41+0x1c42>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,147,56,0,0 // mulps 0x3893(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
+ .byte 15,89,5,83,83,0,0 // mulps 0x5353(%rip),%xmm0 # 8440 <_sk_clut_4D_sse41+0x1ba2>
.byte 65,15,84,206 // andps %xmm14,%xmm1
.byte 65,15,86,204 // orps %xmm12,%xmm1
.byte 65,15,88,194 // addps %xmm10,%xmm0
@@ -31760,8 +38041,8 @@ _sk_gamma_sse41:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,52,56,0,0 // mulps 0x3834(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
- .byte 15,84,29,61,56,0,0 // andps 0x383d(%rip),%xmm3 # 6990 <_sk_callback_sse41+0xae4>
+ .byte 15,89,5,244,82,0,0 // mulps 0x52f4(%rip),%xmm0 # 8440 <_sk_clut_4D_sse41+0x1ba2>
+ .byte 15,84,29,253,82,0,0 // andps 0x52fd(%rip),%xmm3 # 8450 <_sk_clut_4D_sse41+0x1bb2>
.byte 65,15,86,220 // orps %xmm12,%xmm3
.byte 65,15,88,194 // addps %xmm10,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
@@ -31779,7 +38060,7 @@ _sk_gamma_sse41:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,149,56,0,0 // movaps 0x3895(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xb84>
+ .byte 15,40,5,85,83,0,0 // movaps 0x5355(%rip),%xmm0 # 84f0 <_sk_clut_4D_sse41+0x1c52>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -31799,29 +38080,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,101,56,0,0 // mulps 0x3865(%rip),%xmm8 # 6a40 <_sk_callback_sse41+0xb94>
- .byte 68,15,40,13,109,56,0,0 // movaps 0x386d(%rip),%xmm9 # 6a50 <_sk_callback_sse41+0xba4>
+ .byte 68,15,89,5,37,83,0,0 // mulps 0x5325(%rip),%xmm8 # 8500 <_sk_clut_4D_sse41+0x1c62>
+ .byte 68,15,40,13,45,83,0,0 // movaps 0x532d(%rip),%xmm9 # 8510 <_sk_clut_4D_sse41+0x1c72>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,114,56,0,0 // movaps 0x3872(%rip),%xmm0 # 6a60 <_sk_callback_sse41+0xbb4>
+ .byte 15,40,5,50,83,0,0 // movaps 0x5332(%rip),%xmm0 # 8520 <_sk_clut_4D_sse41+0x1c82>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,112,56,0,0 // addps 0x3870(%rip),%xmm8 # 6a70 <_sk_callback_sse41+0xbc4>
- .byte 68,15,89,5,120,56,0,0 // mulps 0x3878(%rip),%xmm8 # 6a80 <_sk_callback_sse41+0xbd4>
- .byte 15,89,13,129,56,0,0 // mulps 0x3881(%rip),%xmm1 # 6a90 <_sk_callback_sse41+0xbe4>
+ .byte 68,15,88,5,48,83,0,0 // addps 0x5330(%rip),%xmm8 # 8530 <_sk_clut_4D_sse41+0x1c92>
+ .byte 68,15,89,5,56,83,0,0 // mulps 0x5338(%rip),%xmm8 # 8540 <_sk_clut_4D_sse41+0x1ca2>
+ .byte 15,89,13,65,83,0,0 // mulps 0x5341(%rip),%xmm1 # 8550 <_sk_clut_4D_sse41+0x1cb2>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,134,56,0,0 // mulps 0x3886(%rip),%xmm2 # 6aa0 <_sk_callback_sse41+0xbf4>
+ .byte 15,89,21,70,83,0,0 // mulps 0x5346(%rip),%xmm2 # 8560 <_sk_clut_4D_sse41+0x1cc2>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,122,56,0,0 // movaps 0x387a(%rip),%xmm9 # 6ab0 <_sk_callback_sse41+0xc04>
+ .byte 68,15,40,13,58,83,0,0 // movaps 0x533a(%rip),%xmm9 # 8570 <_sk_clut_4D_sse41+0x1cd2>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,122,56,0,0 // movaps 0x387a(%rip),%xmm2 # 6ac0 <_sk_callback_sse41+0xc14>
+ .byte 15,40,21,58,83,0,0 // movaps 0x533a(%rip),%xmm2 # 8580 <_sk_clut_4D_sse41+0x1ce2>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,127,56,0,0 // movaps 0x387f(%rip),%xmm12 # 6ad0 <_sk_callback_sse41+0xc24>
+ .byte 68,15,40,37,63,83,0,0 // movaps 0x533f(%rip),%xmm12 # 8590 <_sk_clut_4D_sse41+0x1cf2>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -31840,8 +38121,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,56,56,0,0 // mulps 0x3838(%rip),%xmm1 # 6ae0 <_sk_callback_sse41+0xc34>
- .byte 15,89,21,65,56,0,0 // mulps 0x3841(%rip),%xmm2 # 6af0 <_sk_callback_sse41+0xc44>
+ .byte 15,89,13,248,82,0,0 // mulps 0x52f8(%rip),%xmm1 # 85a0 <_sk_clut_4D_sse41+0x1d02>
+ .byte 15,89,21,1,83,0,0 // mulps 0x5301(%rip),%xmm2 # 85b0 <_sk_clut_4D_sse41+0x1d12>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -31860,9 +38141,9 @@ _sk_load_a8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,39 // jne 32f9 <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,31,56,0,0 // pand 0x381f(%rip),%xmm0 # 6b00 <_sk_callback_sse41+0xc54>
+ .byte 102,15,219,5,223,82,0,0 // pand 0x52df(%rip),%xmm0 # 85c0 <_sk_clut_4D_sse41+0x1d22>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,37,56,0,0 // mulps 0x3825(%rip),%xmm3 # 6b10 <_sk_callback_sse41+0xc64>
+ .byte 15,89,29,229,82,0,0 // mulps 0x52e5(%rip),%xmm3 # 85d0 <_sk_clut_4D_sse41+0x1d32>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -31902,9 +38183,9 @@ _sk_load_a8_dst_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,39 // jne 3385 <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,179,55,0,0 // pand 0x37b3(%rip),%xmm4 # 6b20 <_sk_callback_sse41+0xc74>
+ .byte 102,15,219,37,115,82,0,0 // pand 0x5273(%rip),%xmm4 # 85e0 <_sk_clut_4D_sse41+0x1d42>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,185,55,0,0 // mulps 0x37b9(%rip),%xmm7 # 6b30 <_sk_callback_sse41+0xc84>
+ .byte 15,89,61,121,82,0,0 // mulps 0x5279(%rip),%xmm7 # 85f0 <_sk_clut_4D_sse41+0x1d52>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -31958,7 +38239,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,254,54,0,0 // mulps 0x36fe(%rip),%xmm3 # 6b40 <_sk_callback_sse41+0xc94>
+ .byte 15,89,29,190,81,0,0 // mulps 0x51be(%rip),%xmm3 # 8600 <_sk_clut_4D_sse41+0x1d62>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -31976,7 +38257,7 @@ _sk_store_a8_sse41:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,227,54,0,0 // movaps 0x36e3(%rip),%xmm8 # 6b50 <_sk_callback_sse41+0xca4>
+ .byte 68,15,40,5,163,81,0,0 // movaps 0x51a3(%rip),%xmm8 # 8610 <_sk_clut_4D_sse41+0x1d72>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
@@ -31997,7 +38278,7 @@ _sk_store_a8_sse41:
.byte 65,128,250,3 // cmp $0x3,%r10b
.byte 117,221 // jne 348f <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,25,2,8 // pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- .byte 102,68,15,56,0,5,155,54,0,0 // pshufb 0x369b(%rip),%xmm8 # 6b60 <_sk_callback_sse41+0xcb4>
+ .byte 102,68,15,56,0,5,91,81,0,0 // pshufb 0x515b(%rip),%xmm8 # 8620 <_sk_clut_4D_sse41+0x1d82>
.byte 102,71,15,58,21,4,25,0 // pextrw $0x0,%xmm8,(%r9,%r11,1)
.byte 235,192 // jmp 348f <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,25,0 // pextrb $0x0,%xmm8,(%r9,%r11,1)
@@ -32016,11 +38297,11 @@ _sk_load_g8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,42 // jne 351b <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,112,54,0,0 // pand 0x3670(%rip),%xmm0 # 6b70 <_sk_callback_sse41+0xcc4>
+ .byte 102,15,219,5,48,81,0,0 // pand 0x5130(%rip),%xmm0 # 8630 <_sk_clut_4D_sse41+0x1d92>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,118,54,0,0 // mulps 0x3676(%rip),%xmm0 # 6b80 <_sk_callback_sse41+0xcd4>
+ .byte 15,89,5,54,81,0,0 // mulps 0x5136(%rip),%xmm0 # 8640 <_sk_clut_4D_sse41+0x1da2>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,125,54,0,0 // movaps 0x367d(%rip),%xmm3 # 6b90 <_sk_callback_sse41+0xce4>
+ .byte 15,40,29,61,81,0,0 // movaps 0x513d(%rip),%xmm3 # 8650 <_sk_clut_4D_sse41+0x1db2>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -32058,11 +38339,11 @@ _sk_load_g8_dst_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,42 // jne 35aa <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,17,54,0,0 // pand 0x3611(%rip),%xmm4 # 6ba0 <_sk_callback_sse41+0xcf4>
+ .byte 102,15,219,37,209,80,0,0 // pand 0x50d1(%rip),%xmm4 # 8660 <_sk_clut_4D_sse41+0x1dc2>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,23,54,0,0 // mulps 0x3617(%rip),%xmm4 # 6bb0 <_sk_callback_sse41+0xd04>
+ .byte 15,89,37,215,80,0,0 // mulps 0x50d7(%rip),%xmm4 # 8670 <_sk_clut_4D_sse41+0x1dd2>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,30,54,0,0 // movaps 0x361e(%rip),%xmm7 # 6bc0 <_sk_callback_sse41+0xd14>
+ .byte 15,40,61,222,80,0,0 // movaps 0x50de(%rip),%xmm7 # 8680 <_sk_clut_4D_sse41+0x1de2>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
@@ -32114,9 +38395,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,105,53,0,0 // mulps 0x3569(%rip),%xmm0 # 6bd0 <_sk_callback_sse41+0xd24>
+ .byte 15,89,5,41,80,0,0 // mulps 0x5029(%rip),%xmm0 # 8690 <_sk_clut_4D_sse41+0x1df2>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,112,53,0,0 // movaps 0x3570(%rip),%xmm3 # 6be0 <_sk_callback_sse41+0xd34>
+ .byte 15,40,29,48,80,0,0 // movaps 0x5030(%rip),%xmm3 # 86a0 <_sk_clut_4D_sse41+0x1e02>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -32136,19 +38417,19 @@ _sk_load_565_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,80 // jne 36e4 <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm2
- .byte 102,15,111,5,77,53,0,0 // movdqa 0x354d(%rip),%xmm0 # 6bf0 <_sk_callback_sse41+0xd44>
+ .byte 102,15,111,5,13,80,0,0 // movdqa 0x500d(%rip),%xmm0 # 86b0 <_sk_clut_4D_sse41+0x1e12>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,79,53,0,0 // mulps 0x354f(%rip),%xmm0 # 6c00 <_sk_callback_sse41+0xd54>
- .byte 102,15,111,13,87,53,0,0 // movdqa 0x3557(%rip),%xmm1 # 6c10 <_sk_callback_sse41+0xd64>
+ .byte 15,89,5,15,80,0,0 // mulps 0x500f(%rip),%xmm0 # 86c0 <_sk_clut_4D_sse41+0x1e22>
+ .byte 102,15,111,13,23,80,0,0 // movdqa 0x5017(%rip),%xmm1 # 86d0 <_sk_clut_4D_sse41+0x1e32>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,89,53,0,0 // mulps 0x3559(%rip),%xmm1 # 6c20 <_sk_callback_sse41+0xd74>
- .byte 102,15,219,21,97,53,0,0 // pand 0x3561(%rip),%xmm2 # 6c30 <_sk_callback_sse41+0xd84>
+ .byte 15,89,13,25,80,0,0 // mulps 0x5019(%rip),%xmm1 # 86e0 <_sk_clut_4D_sse41+0x1e42>
+ .byte 102,15,219,21,33,80,0,0 // pand 0x5021(%rip),%xmm2 # 86f0 <_sk_clut_4D_sse41+0x1e52>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,103,53,0,0 // mulps 0x3567(%rip),%xmm2 # 6c40 <_sk_callback_sse41+0xd94>
+ .byte 15,89,21,39,80,0,0 // mulps 0x5027(%rip),%xmm2 # 8700 <_sk_clut_4D_sse41+0x1e62>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,110,53,0,0 // movaps 0x356e(%rip),%xmm3 # 6c50 <_sk_callback_sse41+0xda4>
+ .byte 15,40,29,46,80,0,0 // movaps 0x502e(%rip),%xmm3 # 8710 <_sk_clut_4D_sse41+0x1e72>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
@@ -32184,19 +38465,19 @@ _sk_load_565_dst_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,80 // jne 379f <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,89 // pmovzxwd (%r9,%r11,2),%xmm6
- .byte 102,15,111,37,2,53,0,0 // movdqa 0x3502(%rip),%xmm4 # 6c60 <_sk_callback_sse41+0xdb4>
+ .byte 102,15,111,37,194,79,0,0 // movdqa 0x4fc2(%rip),%xmm4 # 8720 <_sk_clut_4D_sse41+0x1e82>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,4,53,0,0 // mulps 0x3504(%rip),%xmm4 # 6c70 <_sk_callback_sse41+0xdc4>
- .byte 102,15,111,45,12,53,0,0 // movdqa 0x350c(%rip),%xmm5 # 6c80 <_sk_callback_sse41+0xdd4>
+ .byte 15,89,37,196,79,0,0 // mulps 0x4fc4(%rip),%xmm4 # 8730 <_sk_clut_4D_sse41+0x1e92>
+ .byte 102,15,111,45,204,79,0,0 // movdqa 0x4fcc(%rip),%xmm5 # 8740 <_sk_clut_4D_sse41+0x1ea2>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,14,53,0,0 // mulps 0x350e(%rip),%xmm5 # 6c90 <_sk_callback_sse41+0xde4>
- .byte 102,15,219,53,22,53,0,0 // pand 0x3516(%rip),%xmm6 # 6ca0 <_sk_callback_sse41+0xdf4>
+ .byte 15,89,45,206,79,0,0 // mulps 0x4fce(%rip),%xmm5 # 8750 <_sk_clut_4D_sse41+0x1eb2>
+ .byte 102,15,219,53,214,79,0,0 // pand 0x4fd6(%rip),%xmm6 # 8760 <_sk_clut_4D_sse41+0x1ec2>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,28,53,0,0 // mulps 0x351c(%rip),%xmm6 # 6cb0 <_sk_callback_sse41+0xe04>
+ .byte 15,89,53,220,79,0,0 // mulps 0x4fdc(%rip),%xmm6 # 8770 <_sk_clut_4D_sse41+0x1ed2>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,35,53,0,0 // movaps 0x3523(%rip),%xmm7 # 6cc0 <_sk_callback_sse41+0xe14>
+ .byte 15,40,61,227,79,0,0 // movaps 0x4fe3(%rip),%xmm7 # 8780 <_sk_clut_4D_sse41+0x1ee2>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
@@ -32244,19 +38525,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,119,52,0,0 // movdqa 0x3477(%rip),%xmm0 # 6cd0 <_sk_callback_sse41+0xe24>
+ .byte 102,15,111,5,55,79,0,0 // movdqa 0x4f37(%rip),%xmm0 # 8790 <_sk_clut_4D_sse41+0x1ef2>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,121,52,0,0 // mulps 0x3479(%rip),%xmm0 # 6ce0 <_sk_callback_sse41+0xe34>
- .byte 102,15,111,13,129,52,0,0 // movdqa 0x3481(%rip),%xmm1 # 6cf0 <_sk_callback_sse41+0xe44>
+ .byte 15,89,5,57,79,0,0 // mulps 0x4f39(%rip),%xmm0 # 87a0 <_sk_clut_4D_sse41+0x1f02>
+ .byte 102,15,111,13,65,79,0,0 // movdqa 0x4f41(%rip),%xmm1 # 87b0 <_sk_clut_4D_sse41+0x1f12>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,131,52,0,0 // mulps 0x3483(%rip),%xmm1 # 6d00 <_sk_callback_sse41+0xe54>
- .byte 102,15,219,21,139,52,0,0 // pand 0x348b(%rip),%xmm2 # 6d10 <_sk_callback_sse41+0xe64>
+ .byte 15,89,13,67,79,0,0 // mulps 0x4f43(%rip),%xmm1 # 87c0 <_sk_clut_4D_sse41+0x1f22>
+ .byte 102,15,219,21,75,79,0,0 // pand 0x4f4b(%rip),%xmm2 # 87d0 <_sk_clut_4D_sse41+0x1f32>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,145,52,0,0 // mulps 0x3491(%rip),%xmm2 # 6d20 <_sk_callback_sse41+0xe74>
+ .byte 15,89,21,81,79,0,0 // mulps 0x4f51(%rip),%xmm2 # 87e0 <_sk_clut_4D_sse41+0x1f42>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,152,52,0,0 // movaps 0x3498(%rip),%xmm3 # 6d30 <_sk_callback_sse41+0xe84>
+ .byte 15,40,29,88,79,0,0 // movaps 0x4f58(%rip),%xmm3 # 87f0 <_sk_clut_4D_sse41+0x1f52>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -32271,12 +38552,12 @@ _sk_store_565_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,135,52,0,0 // movaps 0x3487(%rip),%xmm8 # 6d40 <_sk_callback_sse41+0xe94>
+ .byte 68,15,40,5,71,79,0,0 // movaps 0x4f47(%rip),%xmm8 # 8800 <_sk_clut_4D_sse41+0x1f62>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,124,52,0,0 // movaps 0x347c(%rip),%xmm10 # 6d50 <_sk_callback_sse41+0xea4>
+ .byte 68,15,40,21,60,79,0,0 // movaps 0x4f3c(%rip),%xmm10 # 8810 <_sk_clut_4D_sse41+0x1f72>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -32320,21 +38601,21 @@ _sk_load_4444_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,95 // jne 39c5 <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm3
- .byte 102,15,111,5,235,51,0,0 // movdqa 0x33eb(%rip),%xmm0 # 6d60 <_sk_callback_sse41+0xeb4>
+ .byte 102,15,111,5,171,78,0,0 // movdqa 0x4eab(%rip),%xmm0 # 8820 <_sk_clut_4D_sse41+0x1f82>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,237,51,0,0 // mulps 0x33ed(%rip),%xmm0 # 6d70 <_sk_callback_sse41+0xec4>
- .byte 102,15,111,13,245,51,0,0 // movdqa 0x33f5(%rip),%xmm1 # 6d80 <_sk_callback_sse41+0xed4>
+ .byte 15,89,5,173,78,0,0 // mulps 0x4ead(%rip),%xmm0 # 8830 <_sk_clut_4D_sse41+0x1f92>
+ .byte 102,15,111,13,181,78,0,0 // movdqa 0x4eb5(%rip),%xmm1 # 8840 <_sk_clut_4D_sse41+0x1fa2>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,247,51,0,0 // mulps 0x33f7(%rip),%xmm1 # 6d90 <_sk_callback_sse41+0xee4>
- .byte 102,15,111,21,255,51,0,0 // movdqa 0x33ff(%rip),%xmm2 # 6da0 <_sk_callback_sse41+0xef4>
+ .byte 15,89,13,183,78,0,0 // mulps 0x4eb7(%rip),%xmm1 # 8850 <_sk_clut_4D_sse41+0x1fb2>
+ .byte 102,15,111,21,191,78,0,0 // movdqa 0x4ebf(%rip),%xmm2 # 8860 <_sk_clut_4D_sse41+0x1fc2>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,1,52,0,0 // mulps 0x3401(%rip),%xmm2 # 6db0 <_sk_callback_sse41+0xf04>
- .byte 102,15,219,29,9,52,0,0 // pand 0x3409(%rip),%xmm3 # 6dc0 <_sk_callback_sse41+0xf14>
+ .byte 15,89,21,193,78,0,0 // mulps 0x4ec1(%rip),%xmm2 # 8870 <_sk_clut_4D_sse41+0x1fd2>
+ .byte 102,15,219,29,201,78,0,0 // pand 0x4ec9(%rip),%xmm3 # 8880 <_sk_clut_4D_sse41+0x1fe2>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,15,52,0,0 // mulps 0x340f(%rip),%xmm3 # 6dd0 <_sk_callback_sse41+0xf24>
+ .byte 15,89,29,207,78,0,0 // mulps 0x4ecf(%rip),%xmm3 # 8890 <_sk_clut_4D_sse41+0x1ff2>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -32371,21 +38652,21 @@ _sk_load_4444_dst_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,95 // jne 3a8f <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,89 // pmovzxwd (%r9,%r11,2),%xmm7
- .byte 102,15,111,37,161,51,0,0 // movdqa 0x33a1(%rip),%xmm4 # 6de0 <_sk_callback_sse41+0xf34>
+ .byte 102,15,111,37,97,78,0,0 // movdqa 0x4e61(%rip),%xmm4 # 88a0 <_sk_clut_4D_sse41+0x2002>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,163,51,0,0 // mulps 0x33a3(%rip),%xmm4 # 6df0 <_sk_callback_sse41+0xf44>
- .byte 102,15,111,45,171,51,0,0 // movdqa 0x33ab(%rip),%xmm5 # 6e00 <_sk_callback_sse41+0xf54>
+ .byte 15,89,37,99,78,0,0 // mulps 0x4e63(%rip),%xmm4 # 88b0 <_sk_clut_4D_sse41+0x2012>
+ .byte 102,15,111,45,107,78,0,0 // movdqa 0x4e6b(%rip),%xmm5 # 88c0 <_sk_clut_4D_sse41+0x2022>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,173,51,0,0 // mulps 0x33ad(%rip),%xmm5 # 6e10 <_sk_callback_sse41+0xf64>
- .byte 102,15,111,53,181,51,0,0 // movdqa 0x33b5(%rip),%xmm6 # 6e20 <_sk_callback_sse41+0xf74>
+ .byte 15,89,45,109,78,0,0 // mulps 0x4e6d(%rip),%xmm5 # 88d0 <_sk_clut_4D_sse41+0x2032>
+ .byte 102,15,111,53,117,78,0,0 // movdqa 0x4e75(%rip),%xmm6 # 88e0 <_sk_clut_4D_sse41+0x2042>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,183,51,0,0 // mulps 0x33b7(%rip),%xmm6 # 6e30 <_sk_callback_sse41+0xf84>
- .byte 102,15,219,61,191,51,0,0 // pand 0x33bf(%rip),%xmm7 # 6e40 <_sk_callback_sse41+0xf94>
+ .byte 15,89,53,119,78,0,0 // mulps 0x4e77(%rip),%xmm6 # 88f0 <_sk_clut_4D_sse41+0x2052>
+ .byte 102,15,219,61,127,78,0,0 // pand 0x4e7f(%rip),%xmm7 # 8900 <_sk_clut_4D_sse41+0x2062>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,197,51,0,0 // mulps 0x33c5(%rip),%xmm7 # 6e50 <_sk_callback_sse41+0xfa4>
+ .byte 15,89,61,133,78,0,0 // mulps 0x4e85(%rip),%xmm7 # 8910 <_sk_clut_4D_sse41+0x2072>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -32434,21 +38715,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,23,51,0,0 // movdqa 0x3317(%rip),%xmm0 # 6e60 <_sk_callback_sse41+0xfb4>
+ .byte 102,15,111,5,215,77,0,0 // movdqa 0x4dd7(%rip),%xmm0 # 8920 <_sk_clut_4D_sse41+0x2082>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,25,51,0,0 // mulps 0x3319(%rip),%xmm0 # 6e70 <_sk_callback_sse41+0xfc4>
- .byte 102,15,111,13,33,51,0,0 // movdqa 0x3321(%rip),%xmm1 # 6e80 <_sk_callback_sse41+0xfd4>
+ .byte 15,89,5,217,77,0,0 // mulps 0x4dd9(%rip),%xmm0 # 8930 <_sk_clut_4D_sse41+0x2092>
+ .byte 102,15,111,13,225,77,0,0 // movdqa 0x4de1(%rip),%xmm1 # 8940 <_sk_clut_4D_sse41+0x20a2>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,35,51,0,0 // mulps 0x3323(%rip),%xmm1 # 6e90 <_sk_callback_sse41+0xfe4>
- .byte 102,15,111,21,43,51,0,0 // movdqa 0x332b(%rip),%xmm2 # 6ea0 <_sk_callback_sse41+0xff4>
+ .byte 15,89,13,227,77,0,0 // mulps 0x4de3(%rip),%xmm1 # 8950 <_sk_clut_4D_sse41+0x20b2>
+ .byte 102,15,111,21,235,77,0,0 // movdqa 0x4deb(%rip),%xmm2 # 8960 <_sk_clut_4D_sse41+0x20c2>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,45,51,0,0 // mulps 0x332d(%rip),%xmm2 # 6eb0 <_sk_callback_sse41+0x1004>
- .byte 102,15,219,29,53,51,0,0 // pand 0x3335(%rip),%xmm3 # 6ec0 <_sk_callback_sse41+0x1014>
+ .byte 15,89,21,237,77,0,0 // mulps 0x4ded(%rip),%xmm2 # 8970 <_sk_clut_4D_sse41+0x20d2>
+ .byte 102,15,219,29,245,77,0,0 // pand 0x4df5(%rip),%xmm3 # 8980 <_sk_clut_4D_sse41+0x20e2>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,59,51,0,0 // mulps 0x333b(%rip),%xmm3 # 6ed0 <_sk_callback_sse41+0x1024>
+ .byte 15,89,29,251,77,0,0 // mulps 0x4dfb(%rip),%xmm3 # 8990 <_sk_clut_4D_sse41+0x20f2>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -32464,7 +38745,7 @@ _sk_store_4444_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,40,51,0,0 // movaps 0x3328(%rip),%xmm8 # 6ee0 <_sk_callback_sse41+0x1034>
+ .byte 68,15,40,5,232,77,0,0 // movaps 0x4de8(%rip),%xmm8 # 89a0 <_sk_clut_4D_sse41+0x2102>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -32518,17 +38799,17 @@ _sk_load_8888_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,89 // jne 3cd3 <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,104,50,0,0 // movdqa 0x3268(%rip),%xmm0 # 6ef0 <_sk_callback_sse41+0x1044>
+ .byte 102,15,111,5,40,77,0,0 // movdqa 0x4d28(%rip),%xmm0 # 89b0 <_sk_clut_4D_sse41+0x2112>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,105,50,0,0 // movaps 0x3269(%rip),%xmm8 # 6f00 <_sk_callback_sse41+0x1054>
+ .byte 68,15,40,5,41,77,0,0 // movaps 0x4d29(%rip),%xmm8 # 89c0 <_sk_clut_4D_sse41+0x2122>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,104,50,0,0 // pshufb 0x3268(%rip),%xmm1 # 6f10 <_sk_callback_sse41+0x1064>
+ .byte 102,15,56,0,13,40,77,0,0 // pshufb 0x4d28(%rip),%xmm1 # 89d0 <_sk_clut_4D_sse41+0x2132>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,100,50,0,0 // pshufb 0x3264(%rip),%xmm2 # 6f20 <_sk_callback_sse41+0x1074>
+ .byte 102,15,56,0,21,36,77,0,0 // pshufb 0x4d24(%rip),%xmm2 # 89e0 <_sk_clut_4D_sse41+0x2142>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32567,17 +38848,17 @@ _sk_load_8888_dst_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,89 // jne 3d8d <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,238,49,0,0 // movdqa 0x31ee(%rip),%xmm4 # 6f30 <_sk_callback_sse41+0x1084>
+ .byte 102,15,111,37,174,76,0,0 // movdqa 0x4cae(%rip),%xmm4 # 89f0 <_sk_clut_4D_sse41+0x2152>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,239,49,0,0 // movaps 0x31ef(%rip),%xmm8 # 6f40 <_sk_callback_sse41+0x1094>
+ .byte 68,15,40,5,175,76,0,0 // movaps 0x4caf(%rip),%xmm8 # 8a00 <_sk_clut_4D_sse41+0x2162>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,238,49,0,0 // pshufb 0x31ee(%rip),%xmm5 # 6f50 <_sk_callback_sse41+0x10a4>
+ .byte 102,15,56,0,45,174,76,0,0 // pshufb 0x4cae(%rip),%xmm5 # 8a10 <_sk_clut_4D_sse41+0x2172>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,234,49,0,0 // pshufb 0x31ea(%rip),%xmm6 # 6f60 <_sk_callback_sse41+0x10b4>
+ .byte 102,15,56,0,53,170,76,0,0 // pshufb 0x4caa(%rip),%xmm6 # 8a20 <_sk_clut_4D_sse41+0x2182>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -32625,17 +38906,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,61,49,0,0 // movdqa 0x313d(%rip),%xmm0 # 6f70 <_sk_callback_sse41+0x10c4>
+ .byte 102,15,111,5,253,75,0,0 // movdqa 0x4bfd(%rip),%xmm0 # 8a30 <_sk_clut_4D_sse41+0x2192>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,62,49,0,0 // movaps 0x313e(%rip),%xmm8 # 6f80 <_sk_callback_sse41+0x10d4>
+ .byte 68,15,40,5,254,75,0,0 // movaps 0x4bfe(%rip),%xmm8 # 8a40 <_sk_clut_4D_sse41+0x21a2>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,61,49,0,0 // pshufb 0x313d(%rip),%xmm1 # 6f90 <_sk_callback_sse41+0x10e4>
+ .byte 102,15,56,0,13,253,75,0,0 // pshufb 0x4bfd(%rip),%xmm1 # 8a50 <_sk_clut_4D_sse41+0x21b2>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,57,49,0,0 // pshufb 0x3139(%rip),%xmm2 # 6fa0 <_sk_callback_sse41+0x10f4>
+ .byte 102,15,56,0,21,249,75,0,0 // pshufb 0x4bf9(%rip),%xmm2 # 8a60 <_sk_clut_4D_sse41+0x21c2>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32656,7 +38937,7 @@ _sk_store_8888_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,18,49,0,0 // movaps 0x3112(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x1104>
+ .byte 68,15,40,5,210,75,0,0 // movaps 0x4bd2(%rip),%xmm8 # 8a70 <_sk_clut_4D_sse41+0x21d2>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -32707,17 +38988,17 @@ _sk_load_bgra_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,89 // jne 3fa5 <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,102,48,0,0 // movdqa 0x3066(%rip),%xmm0 # 6fc0 <_sk_callback_sse41+0x1114>
+ .byte 102,15,111,5,38,75,0,0 // movdqa 0x4b26(%rip),%xmm0 # 8a80 <_sk_clut_4D_sse41+0x21e2>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,103,48,0,0 // movaps 0x3067(%rip),%xmm8 # 6fd0 <_sk_callback_sse41+0x1124>
+ .byte 68,15,40,5,39,75,0,0 // movaps 0x4b27(%rip),%xmm8 # 8a90 <_sk_clut_4D_sse41+0x21f2>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,102,48,0,0 // pshufb 0x3066(%rip),%xmm0 # 6fe0 <_sk_callback_sse41+0x1134>
+ .byte 102,15,56,0,5,38,75,0,0 // pshufb 0x4b26(%rip),%xmm0 # 8aa0 <_sk_clut_4D_sse41+0x2202>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,98,48,0,0 // pshufb 0x3062(%rip),%xmm0 # 6ff0 <_sk_callback_sse41+0x1144>
+ .byte 102,15,56,0,5,34,75,0,0 // pshufb 0x4b22(%rip),%xmm0 # 8ab0 <_sk_clut_4D_sse41+0x2212>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32756,17 +39037,17 @@ _sk_load_bgra_dst_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,89 // jne 405f <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,236,47,0,0 // movdqa 0x2fec(%rip),%xmm4 # 7000 <_sk_callback_sse41+0x1154>
+ .byte 102,15,111,37,172,74,0,0 // movdqa 0x4aac(%rip),%xmm4 # 8ac0 <_sk_clut_4D_sse41+0x2222>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,237,47,0,0 // movaps 0x2fed(%rip),%xmm8 # 7010 <_sk_callback_sse41+0x1164>
+ .byte 68,15,40,5,173,74,0,0 // movaps 0x4aad(%rip),%xmm8 # 8ad0 <_sk_clut_4D_sse41+0x2232>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,236,47,0,0 // pshufb 0x2fec(%rip),%xmm4 # 7020 <_sk_callback_sse41+0x1174>
+ .byte 102,15,56,0,37,172,74,0,0 // pshufb 0x4aac(%rip),%xmm4 # 8ae0 <_sk_clut_4D_sse41+0x2242>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,232,47,0,0 // pshufb 0x2fe8(%rip),%xmm4 # 7030 <_sk_callback_sse41+0x1184>
+ .byte 102,15,56,0,37,168,74,0,0 // pshufb 0x4aa8(%rip),%xmm4 # 8af0 <_sk_clut_4D_sse41+0x2252>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -32814,17 +39095,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,59,47,0,0 // movdqa 0x2f3b(%rip),%xmm0 # 7040 <_sk_callback_sse41+0x1194>
+ .byte 102,15,111,5,251,73,0,0 // movdqa 0x49fb(%rip),%xmm0 # 8b00 <_sk_clut_4D_sse41+0x2262>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,60,47,0,0 // movaps 0x2f3c(%rip),%xmm8 # 7050 <_sk_callback_sse41+0x11a4>
+ .byte 68,15,40,5,252,73,0,0 // movaps 0x49fc(%rip),%xmm8 # 8b10 <_sk_clut_4D_sse41+0x2272>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,59,47,0,0 // pshufb 0x2f3b(%rip),%xmm0 # 7060 <_sk_callback_sse41+0x11b4>
+ .byte 102,15,56,0,5,251,73,0,0 // pshufb 0x49fb(%rip),%xmm0 # 8b20 <_sk_clut_4D_sse41+0x2282>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,55,47,0,0 // pshufb 0x2f37(%rip),%xmm0 # 7070 <_sk_callback_sse41+0x11c4>
+ .byte 102,15,56,0,5,247,73,0,0 // pshufb 0x49f7(%rip),%xmm0 # 8b30 <_sk_clut_4D_sse41+0x2292>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32845,7 +39126,7 @@ _sk_store_bgra_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,16,47,0,0 // movaps 0x2f10(%rip),%xmm8 # 7080 <_sk_callback_sse41+0x11d4>
+ .byte 68,15,40,5,208,73,0,0 // movaps 0x49d0(%rip),%xmm8 # 8b40 <_sk_clut_4D_sse41+0x22a2>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -32904,18 +39185,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,53,46,0,0 // movdqa 0x2e35(%rip),%xmm8 # 7090 <_sk_callback_sse41+0x11e4>
+ .byte 102,68,15,111,5,245,72,0,0 // movdqa 0x48f5(%rip),%xmm8 # 8b50 <_sk_clut_4D_sse41+0x22b2>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,48,46,0,0 // movdqa 0x2e30(%rip),%xmm3 # 70a0 <_sk_callback_sse41+0x11f4>
+ .byte 102,15,111,29,240,72,0,0 // movdqa 0x48f0(%rip),%xmm3 # 8b60 <_sk_clut_4D_sse41+0x22c2>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,28,46,0,0 // movdqa 0x2e1c(%rip),%xmm10 # 70b0 <_sk_callback_sse41+0x1204>
+ .byte 102,68,15,111,21,220,72,0,0 // movdqa 0x48dc(%rip),%xmm10 # 8b70 <_sk_clut_4D_sse41+0x22d2>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -32991,18 +39272,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,205,44,0,0 // movdqa 0x2ccd(%rip),%xmm8 # 70c0 <_sk_callback_sse41+0x1214>
+ .byte 102,68,15,111,5,141,71,0,0 // movdqa 0x478d(%rip),%xmm8 # 8b80 <_sk_clut_4D_sse41+0x22e2>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,200,44,0,0 // movdqa 0x2cc8(%rip),%xmm7 # 70d0 <_sk_callback_sse41+0x1224>
+ .byte 102,15,111,61,136,71,0,0 // movdqa 0x4788(%rip),%xmm7 # 8b90 <_sk_clut_4D_sse41+0x22f2>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,180,44,0,0 // movdqa 0x2cb4(%rip),%xmm10 # 70e0 <_sk_callback_sse41+0x1234>
+ .byte 102,68,15,111,21,116,71,0,0 // movdqa 0x4774(%rip),%xmm10 # 8ba0 <_sk_clut_4D_sse41+0x2302>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -33088,18 +39369,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,55,43,0,0 // movdqa 0x2b37(%rip),%xmm8 # 70f0 <_sk_callback_sse41+0x1244>
+ .byte 102,68,15,111,5,247,69,0,0 // movdqa 0x45f7(%rip),%xmm8 # 8bb0 <_sk_clut_4D_sse41+0x2312>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,50,43,0,0 // movdqa 0x2b32(%rip),%xmm3 # 7100 <_sk_callback_sse41+0x1254>
+ .byte 102,15,111,29,242,69,0,0 // movdqa 0x45f2(%rip),%xmm3 # 8bc0 <_sk_clut_4D_sse41+0x2322>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,30,43,0,0 // movdqa 0x2b1e(%rip),%xmm10 # 7110 <_sk_callback_sse41+0x1264>
+ .byte 102,68,15,111,21,222,69,0,0 // movdqa 0x45de(%rip),%xmm10 # 8bd0 <_sk_clut_4D_sse41+0x2332>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -33153,17 +39434,17 @@ _sk_store_f16_sse41:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,65,42,0,0 // movdqa 0x2a41(%rip),%xmm10 # 7120 <_sk_callback_sse41+0x1274>
+ .byte 102,68,15,111,21,1,69,0,0 // movdqa 0x4501(%rip),%xmm10 # 8be0 <_sk_clut_4D_sse41+0x2342>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,52,42,0,0 // movdqa 0x2a34(%rip),%xmm9 # 7130 <_sk_callback_sse41+0x1284>
+ .byte 102,68,15,111,13,244,68,0,0 // movdqa 0x44f4(%rip),%xmm9 # 8bf0 <_sk_clut_4D_sse41+0x2352>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,37,42,0,0 // movdqa 0x2a25(%rip),%xmm12 # 7140 <_sk_callback_sse41+0x1294>
+ .byte 102,68,15,111,37,229,68,0,0 // movdqa 0x44e5(%rip),%xmm12 # 8c00 <_sk_clut_4D_sse41+0x2362>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -33252,7 +39533,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,165,40,0,0 // movaps 0x28a5(%rip),%xmm8 # 7150 <_sk_callback_sse41+0x12a4>
+ .byte 68,15,40,5,101,67,0,0 // movaps 0x4365(%rip),%xmm8 # 8c10 <_sk_clut_4D_sse41+0x2372>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -33326,7 +39607,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,132,39,0,0 // movaps 0x2784(%rip),%xmm8 # 7160 <_sk_callback_sse41+0x12b4>
+ .byte 68,15,40,5,68,66,0,0 // movaps 0x4244(%rip),%xmm8 # 8c20 <_sk_clut_4D_sse41+0x2382>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -33343,7 +39624,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,75,39,0,0 // movaps 0x274b(%rip),%xmm3 # 7170 <_sk_callback_sse41+0x12c4>
+ .byte 15,40,29,11,66,0,0 // movaps 0x420b(%rip),%xmm3 # 8c30 <_sk_clut_4D_sse41+0x2392>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
@@ -33377,7 +39658,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,212,38,0,0 // movaps 0x26d4(%rip),%xmm10 # 7180 <_sk_callback_sse41+0x12d4>
+ .byte 68,15,40,21,148,65,0,0 // movaps 0x4194(%rip),%xmm10 # 8c40 <_sk_clut_4D_sse41+0x23a2>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -33652,7 +39933,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,126,39,0,0 // mulss 0x277e(%rip),%xmm9 # 75f0 <_sk_callback_sse41+0x1744>
+ .byte 243,68,15,89,13,206,66,0,0 // mulss 0x42ce(%rip),%xmm9 # 9140 <_sk_clut_4D_sse41+0x28a2>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -33683,7 +39964,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,16,39,0,0 // mulss 0x2710(%rip),%xmm9 # 75f4 <_sk_callback_sse41+0x1748>
+ .byte 243,68,15,89,13,96,66,0,0 // mulss 0x4260(%rip),%xmm9 # 9144 <_sk_clut_4D_sse41+0x28a6>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -33708,7 +39989,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,87,34,0,0 // minps 0x2257(%rip),%xmm8 # 7190 <_sk_callback_sse41+0x12e4>
+ .byte 68,15,93,5,23,61,0,0 // minps 0x3d17(%rip),%xmm8 # 8c50 <_sk_clut_4D_sse41+0x23b2>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -33726,9 +40007,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,72,34,0,0 // movaps 0x2248(%rip),%xmm8 # 71a0 <_sk_callback_sse41+0x12f4>
+ .byte 68,15,40,5,8,61,0,0 // movaps 0x3d08(%rip),%xmm8 # 8c60 <_sk_clut_4D_sse41+0x23c2>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,76,34,0,0 // movaps 0x224c(%rip),%xmm9 # 71b0 <_sk_callback_sse41+0x1304>
+ .byte 68,15,40,13,12,61,0,0 // movaps 0x3d0c(%rip),%xmm9 # 8c70 <_sk_clut_4D_sse41+0x23d2>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -33745,10 +40026,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,43,34,0,0 // mulps 0x222b(%rip),%xmm0 # 71c0 <_sk_callback_sse41+0x1314>
- .byte 15,89,13,52,34,0,0 // mulps 0x2234(%rip),%xmm1 # 71d0 <_sk_callback_sse41+0x1324>
+ .byte 15,89,5,235,60,0,0 // mulps 0x3ceb(%rip),%xmm0 # 8c80 <_sk_clut_4D_sse41+0x23e2>
+ .byte 15,89,13,244,60,0,0 // mulps 0x3cf4(%rip),%xmm1 # 8c90 <_sk_clut_4D_sse41+0x23f2>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,58,34,0,0 // mulps 0x223a(%rip),%xmm3 # 71e0 <_sk_callback_sse41+0x1334>
+ .byte 15,89,29,250,60,0,0 // mulps 0x3cfa(%rip),%xmm3 # 8ca0 <_sk_clut_4D_sse41+0x2402>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -34153,15 +40434,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,229,27,0,0 // movaps 0x1be5(%rip),%xmm0 # 71f0 <_sk_callback_sse41+0x1344>
+ .byte 15,40,5,165,54,0,0 // movaps 0x36a5(%rip),%xmm0 # 8cb0 <_sk_clut_4D_sse41+0x2412>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,235,27,0,0 // addps 0x1beb(%rip),%xmm0 # 7200 <_sk_callback_sse41+0x1354>
+ .byte 15,88,5,171,54,0,0 // addps 0x36ab(%rip),%xmm0 # 8cc0 <_sk_clut_4D_sse41+0x2422>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,241,27,0,0 // addps 0x1bf1(%rip),%xmm0 # 7210 <_sk_callback_sse41+0x1364>
+ .byte 15,88,5,177,54,0,0 // addps 0x36b1(%rip),%xmm0 # 8cd0 <_sk_clut_4D_sse41+0x2432>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,247,27,0,0 // addps 0x1bf7(%rip),%xmm0 # 7220 <_sk_callback_sse41+0x1374>
+ .byte 15,88,5,183,54,0,0 // addps 0x36b7(%rip),%xmm0 # 8ce0 <_sk_clut_4D_sse41+0x2442>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,253,27,0,0 // addps 0x1bfd(%rip),%xmm0 # 7230 <_sk_callback_sse41+0x1384>
+ .byte 15,88,5,189,54,0,0 // addps 0x36bd(%rip),%xmm0 # 8cf0 <_sk_clut_4D_sse41+0x2452>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -34184,7 +40465,7 @@ _sk_gradient_sse41:
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,214,27,0,0 // movaps 0x1bd6(%rip),%xmm2 # 7240 <_sk_callback_sse41+0x1394>
+ .byte 15,40,21,150,54,0,0 // movaps 0x3696(%rip),%xmm2 # 8d00 <_sk_clut_4D_sse41+0x2462>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -34322,26 +40603,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,119,25,0,0 // movaps 0x1977(%rip),%xmm10 # 7250 <_sk_callback_sse41+0x13a4>
+ .byte 68,15,40,21,55,52,0,0 // movaps 0x3437(%rip),%xmm10 # 8d10 <_sk_clut_4D_sse41+0x2472>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,123,25,0,0 // addps 0x197b(%rip),%xmm10 # 7260 <_sk_callback_sse41+0x13b4>
+ .byte 68,15,88,21,59,52,0,0 // addps 0x343b(%rip),%xmm10 # 8d20 <_sk_clut_4D_sse41+0x2482>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,127,25,0,0 // addps 0x197f(%rip),%xmm10 # 7270 <_sk_callback_sse41+0x13c4>
+ .byte 68,15,88,21,63,52,0,0 // addps 0x343f(%rip),%xmm10 # 8d30 <_sk_clut_4D_sse41+0x2492>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,131,25,0,0 // addps 0x1983(%rip),%xmm10 # 7280 <_sk_callback_sse41+0x13d4>
+ .byte 68,15,88,21,67,52,0,0 // addps 0x3443(%rip),%xmm10 # 8d40 <_sk_clut_4D_sse41+0x24a2>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,130,25,0,0 // movaps 0x1982(%rip),%xmm11 # 7290 <_sk_callback_sse41+0x13e4>
+ .byte 68,15,40,29,66,52,0,0 // movaps 0x3442(%rip),%xmm11 # 8d50 <_sk_clut_4D_sse41+0x24b2>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,123,25,0,0 // movaps 0x197b(%rip),%xmm11 # 72a0 <_sk_callback_sse41+0x13f4>
+ .byte 68,15,40,29,59,52,0,0 // movaps 0x343b(%rip),%xmm11 # 8d60 <_sk_clut_4D_sse41+0x24c2>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,109,25,0,0 // movaps 0x196d(%rip),%xmm9 # 72b0 <_sk_callback_sse41+0x1404>
+ .byte 68,15,40,13,45,52,0,0 // movaps 0x342d(%rip),%xmm9 # 8d70 <_sk_clut_4D_sse41+0x24d2>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -34375,7 +40656,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,22,25,0,0 // mulps 0x1916(%rip),%xmm9 # 72c0 <_sk_callback_sse41+0x1414>
+ .byte 68,15,89,13,214,51,0,0 // mulps 0x33d6(%rip),%xmm9 # 8d80 <_sk_clut_4D_sse41+0x24e2>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -34383,7 +40664,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,1,25,0,0 // mulps 0x1901(%rip),%xmm10 # 72d0 <_sk_callback_sse41+0x1424>
+ .byte 68,15,89,21,193,51,0,0 // mulps 0x33c1(%rip),%xmm10 # 8d90 <_sk_clut_4D_sse41+0x24f2>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -34392,8 +40673,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,233,24,0,0 // xorps 0x18e9(%rip),%xmm9 # 72e0 <_sk_callback_sse41+0x1434>
- .byte 68,15,89,5,241,24,0,0 // mulps 0x18f1(%rip),%xmm8 # 72f0 <_sk_callback_sse41+0x1444>
+ .byte 68,15,87,13,169,51,0,0 // xorps 0x33a9(%rip),%xmm9 # 8da0 <_sk_clut_4D_sse41+0x2502>
+ .byte 68,15,89,5,177,51,0,0 // mulps 0x33b1(%rip),%xmm8 # 8db0 <_sk_clut_4D_sse41+0x2512>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -34414,7 +40695,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,184,24,0,0 // mulps 0x18b8(%rip),%xmm9 # 7300 <_sk_callback_sse41+0x1454>
+ .byte 68,15,89,13,120,51,0,0 // mulps 0x3378(%rip),%xmm9 # 8dc0 <_sk_clut_4D_sse41+0x2522>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -34422,7 +40703,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,163,24,0,0 // mulps 0x18a3(%rip),%xmm10 # 7310 <_sk_callback_sse41+0x1464>
+ .byte 68,15,89,21,99,51,0,0 // mulps 0x3363(%rip),%xmm10 # 8dd0 <_sk_clut_4D_sse41+0x2532>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -34431,8 +40712,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,139,24,0,0 // xorps 0x188b(%rip),%xmm9 # 7320 <_sk_callback_sse41+0x1474>
- .byte 68,15,89,5,147,24,0,0 // mulps 0x1893(%rip),%xmm8 # 7330 <_sk_callback_sse41+0x1484>
+ .byte 68,15,87,13,75,51,0,0 // xorps 0x334b(%rip),%xmm9 # 8de0 <_sk_clut_4D_sse41+0x2542>
+ .byte 68,15,89,5,83,51,0,0 // mulps 0x3353(%rip),%xmm8 # 8df0 <_sk_clut_4D_sse41+0x2552>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -34450,7 +40731,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,107,24,0,0 // mulps 0x186b(%rip),%xmm9 # 7340 <_sk_callback_sse41+0x1494>
+ .byte 68,15,89,13,43,51,0,0 // mulps 0x332b(%rip),%xmm9 # 8e00 <_sk_clut_4D_sse41+0x2562>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -34458,7 +40739,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,87,24,0,0 // xorps 0x1857(%rip),%xmm0 # 7350 <_sk_callback_sse41+0x14a4>
+ .byte 15,87,5,23,51,0,0 // xorps 0x3317(%rip),%xmm0 # 8e10 <_sk_clut_4D_sse41+0x2572>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34501,7 +40782,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,253,23,0,0 // movaps 0x17fd(%rip),%xmm8 # 7360 <_sk_callback_sse41+0x14b4>
+ .byte 68,15,40,5,189,50,0,0 // movaps 0x32bd(%rip),%xmm8 # 8e20 <_sk_clut_4D_sse41+0x2582>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -34545,8 +40826,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,127,23,0,0 // addps 0x177f(%rip),%xmm0 # 7370 <_sk_callback_sse41+0x14c4>
- .byte 68,15,40,13,135,23,0,0 // movaps 0x1787(%rip),%xmm9 # 7380 <_sk_callback_sse41+0x14d4>
+ .byte 15,88,5,63,50,0,0 // addps 0x323f(%rip),%xmm0 # 8e30 <_sk_clut_4D_sse41+0x2592>
+ .byte 68,15,40,13,71,50,0,0 // movaps 0x3247(%rip),%xmm9 # 8e40 <_sk_clut_4D_sse41+0x25a2>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34559,7 +40840,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,118,23,0,0 // addps 0x1776(%rip),%xmm0 # 7390 <_sk_callback_sse41+0x14e4>
+ .byte 15,88,5,54,50,0,0 // addps 0x3236(%rip),%xmm0 # 8e50 <_sk_clut_4D_sse41+0x25b2>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34571,8 +40852,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,104,23,0,0 // addps 0x1768(%rip),%xmm1 # 73a0 <_sk_callback_sse41+0x14f4>
- .byte 68,15,40,13,112,23,0,0 // movaps 0x1770(%rip),%xmm9 # 73b0 <_sk_callback_sse41+0x1504>
+ .byte 15,88,13,40,50,0,0 // addps 0x3228(%rip),%xmm1 # 8e60 <_sk_clut_4D_sse41+0x25c2>
+ .byte 68,15,40,13,48,50,0,0 // movaps 0x3230(%rip),%xmm9 # 8e70 <_sk_clut_4D_sse41+0x25d2>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34585,7 +40866,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,94,23,0,0 // addps 0x175e(%rip),%xmm1 # 73c0 <_sk_callback_sse41+0x1514>
+ .byte 15,88,13,30,50,0,0 // addps 0x321e(%rip),%xmm1 # 8e80 <_sk_clut_4D_sse41+0x25e2>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34597,13 +40878,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,81,23,0,0 // addps 0x1751(%rip),%xmm0 # 73d0 <_sk_callback_sse41+0x1524>
- .byte 68,15,40,13,89,23,0,0 // movaps 0x1759(%rip),%xmm9 # 73e0 <_sk_callback_sse41+0x1534>
+ .byte 15,88,5,17,50,0,0 // addps 0x3211(%rip),%xmm0 # 8e90 <_sk_clut_4D_sse41+0x25f2>
+ .byte 68,15,40,13,25,50,0,0 // movaps 0x3219(%rip),%xmm9 # 8ea0 <_sk_clut_4D_sse41+0x2602>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,85,23,0,0 // mulps 0x1755(%rip),%xmm9 # 73f0 <_sk_callback_sse41+0x1544>
- .byte 68,15,88,13,93,23,0,0 // addps 0x175d(%rip),%xmm9 # 7400 <_sk_callback_sse41+0x1554>
+ .byte 68,15,89,13,21,50,0,0 // mulps 0x3215(%rip),%xmm9 # 8eb0 <_sk_clut_4D_sse41+0x2612>
+ .byte 68,15,88,13,29,50,0,0 // addps 0x321d(%rip),%xmm9 # 8ec0 <_sk_clut_4D_sse41+0x2622>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34616,16 +40897,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,76,23,0,0 // addps 0x174c(%rip),%xmm0 # 7410 <_sk_callback_sse41+0x1564>
- .byte 68,15,40,13,84,23,0,0 // movaps 0x1754(%rip),%xmm9 # 7420 <_sk_callback_sse41+0x1574>
+ .byte 15,88,5,12,50,0,0 // addps 0x320c(%rip),%xmm0 # 8ed0 <_sk_clut_4D_sse41+0x2632>
+ .byte 68,15,40,13,20,50,0,0 // movaps 0x3214(%rip),%xmm9 # 8ee0 <_sk_clut_4D_sse41+0x2642>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,88,23,0,0 // movaps 0x1758(%rip),%xmm8 # 7430 <_sk_callback_sse41+0x1584>
+ .byte 68,15,40,5,24,50,0,0 // movaps 0x3218(%rip),%xmm8 # 8ef0 <_sk_clut_4D_sse41+0x2652>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,92,23,0,0 // addps 0x175c(%rip),%xmm8 # 7440 <_sk_callback_sse41+0x1594>
+ .byte 68,15,88,5,28,50,0,0 // addps 0x321c(%rip),%xmm8 # 8f00 <_sk_clut_4D_sse41+0x2662>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,96,23,0,0 // addps 0x1760(%rip),%xmm8 # 7450 <_sk_callback_sse41+0x15a4>
+ .byte 68,15,88,5,32,50,0,0 // addps 0x3220(%rip),%xmm8 # 8f10 <_sk_clut_4D_sse41+0x2672>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,100,23,0,0 // addps 0x1764(%rip),%xmm8 # 7460 <_sk_callback_sse41+0x15b4>
+ .byte 68,15,88,5,36,50,0,0 // addps 0x3224(%rip),%xmm8 # 8f20 <_sk_clut_4D_sse41+0x2682>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34635,17 +40916,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,94,23,0,0 // movaps 0x175e(%rip),%xmm8 # 7470 <_sk_callback_sse41+0x15c4>
+ .byte 68,15,40,5,30,50,0,0 // movaps 0x321e(%rip),%xmm8 # 8f30 <_sk_clut_4D_sse41+0x2692>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,90,23,0,0 // movaps 0x175a(%rip),%xmm10 # 7480 <_sk_callback_sse41+0x15d4>
+ .byte 68,15,40,21,26,50,0,0 // movaps 0x321a(%rip),%xmm10 # 8f40 <_sk_clut_4D_sse41+0x26a2>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,94,23,0,0 // addps 0x175e(%rip),%xmm10 # 7490 <_sk_callback_sse41+0x15e4>
+ .byte 68,15,88,21,30,50,0,0 // addps 0x321e(%rip),%xmm10 # 8f50 <_sk_clut_4D_sse41+0x26b2>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,90,23,0,0 // addps 0x175a(%rip),%xmm10 # 74a0 <_sk_callback_sse41+0x15f4>
+ .byte 68,15,88,21,26,50,0,0 // addps 0x321a(%rip),%xmm10 # 8f60 <_sk_clut_4D_sse41+0x26c2>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34657,11 +40938,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,77,23,0,0 // addps 0x174d(%rip),%xmm0 # 74b0 <_sk_callback_sse41+0x1604>
+ .byte 15,88,5,13,50,0,0 // addps 0x320d(%rip),%xmm0 # 8f70 <_sk_clut_4D_sse41+0x26d2>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,77,23,0,0 // mulps 0x174d(%rip),%xmm8 # 74c0 <_sk_callback_sse41+0x1614>
- .byte 68,15,88,5,85,23,0,0 // addps 0x1755(%rip),%xmm8 # 74d0 <_sk_callback_sse41+0x1624>
+ .byte 68,15,89,5,13,50,0,0 // mulps 0x320d(%rip),%xmm8 # 8f80 <_sk_clut_4D_sse41+0x26e2>
+ .byte 68,15,88,5,21,50,0,0 // addps 0x3215(%rip),%xmm8 # 8f90 <_sk_clut_4D_sse41+0x26f2>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34674,13 +40955,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,67,23,0,0 // addps 0x1743(%rip),%xmm1 # 74e0 <_sk_callback_sse41+0x1634>
- .byte 68,15,40,13,75,23,0,0 // movaps 0x174b(%rip),%xmm9 # 74f0 <_sk_callback_sse41+0x1644>
+ .byte 15,88,13,3,50,0,0 // addps 0x3203(%rip),%xmm1 # 8fa0 <_sk_clut_4D_sse41+0x2702>
+ .byte 68,15,40,13,11,50,0,0 // movaps 0x320b(%rip),%xmm9 # 8fb0 <_sk_clut_4D_sse41+0x2712>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,71,23,0,0 // mulps 0x1747(%rip),%xmm9 # 7500 <_sk_callback_sse41+0x1654>
- .byte 68,15,88,13,79,23,0,0 // addps 0x174f(%rip),%xmm9 # 7510 <_sk_callback_sse41+0x1664>
+ .byte 68,15,89,13,7,50,0,0 // mulps 0x3207(%rip),%xmm9 # 8fc0 <_sk_clut_4D_sse41+0x2722>
+ .byte 68,15,88,13,15,50,0,0 // addps 0x320f(%rip),%xmm9 # 8fd0 <_sk_clut_4D_sse41+0x2732>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34693,16 +40974,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,61,23,0,0 // addps 0x173d(%rip),%xmm1 # 7520 <_sk_callback_sse41+0x1674>
- .byte 68,15,40,13,69,23,0,0 // movaps 0x1745(%rip),%xmm9 # 7530 <_sk_callback_sse41+0x1684>
+ .byte 15,88,13,253,49,0,0 // addps 0x31fd(%rip),%xmm1 # 8fe0 <_sk_clut_4D_sse41+0x2742>
+ .byte 68,15,40,13,5,50,0,0 // movaps 0x3205(%rip),%xmm9 # 8ff0 <_sk_clut_4D_sse41+0x2752>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,73,23,0,0 // movaps 0x1749(%rip),%xmm8 # 7540 <_sk_callback_sse41+0x1694>
+ .byte 68,15,40,5,9,50,0,0 // movaps 0x3209(%rip),%xmm8 # 9000 <_sk_clut_4D_sse41+0x2762>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,77,23,0,0 // addps 0x174d(%rip),%xmm8 # 7550 <_sk_callback_sse41+0x16a4>
+ .byte 68,15,88,5,13,50,0,0 // addps 0x320d(%rip),%xmm8 # 9010 <_sk_clut_4D_sse41+0x2772>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,81,23,0,0 // addps 0x1751(%rip),%xmm8 # 7560 <_sk_callback_sse41+0x16b4>
+ .byte 68,15,88,5,17,50,0,0 // addps 0x3211(%rip),%xmm8 # 9020 <_sk_clut_4D_sse41+0x2782>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,85,23,0,0 // addps 0x1755(%rip),%xmm8 # 7570 <_sk_callback_sse41+0x16c4>
+ .byte 68,15,88,5,21,50,0,0 // addps 0x3215(%rip),%xmm8 # 9030 <_sk_clut_4D_sse41+0x2792>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34712,17 +40993,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,79,23,0,0 // movaps 0x174f(%rip),%xmm8 # 7580 <_sk_callback_sse41+0x16d4>
+ .byte 68,15,40,5,15,50,0,0 // movaps 0x320f(%rip),%xmm8 # 9040 <_sk_clut_4D_sse41+0x27a2>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,74,23,0,0 // movaps 0x174a(%rip),%xmm10 # 7590 <_sk_callback_sse41+0x16e4>
+ .byte 68,15,40,21,10,50,0,0 // movaps 0x320a(%rip),%xmm10 # 9050 <_sk_clut_4D_sse41+0x27b2>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,78,23,0,0 // addps 0x174e(%rip),%xmm10 # 75a0 <_sk_callback_sse41+0x16f4>
+ .byte 68,15,88,21,14,50,0,0 // addps 0x320e(%rip),%xmm10 # 9060 <_sk_clut_4D_sse41+0x27c2>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,74,23,0,0 // addps 0x174a(%rip),%xmm10 # 75b0 <_sk_callback_sse41+0x1704>
+ .byte 68,15,88,21,10,50,0,0 // addps 0x320a(%rip),%xmm10 # 9070 <_sk_clut_4D_sse41+0x27d2>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34734,11 +41015,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,60,23,0,0 // addps 0x173c(%rip),%xmm1 # 75c0 <_sk_callback_sse41+0x1714>
+ .byte 15,88,13,252,49,0,0 // addps 0x31fc(%rip),%xmm1 # 9080 <_sk_clut_4D_sse41+0x27e2>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,60,23,0,0 // mulps 0x173c(%rip),%xmm8 # 75d0 <_sk_callback_sse41+0x1724>
- .byte 68,15,88,5,68,23,0,0 // addps 0x1744(%rip),%xmm8 # 75e0 <_sk_callback_sse41+0x1734>
+ .byte 68,15,89,5,252,49,0,0 // mulps 0x31fc(%rip),%xmm8 # 9090 <_sk_clut_4D_sse41+0x27f2>
+ .byte 68,15,88,5,4,50,0,0 // addps 0x3204(%rip),%xmm8 # 90a0 <_sk_clut_4D_sse41+0x2802>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34824,6 +41105,1388 @@ _sk_callback_sse41:
.byte 93 // pop %rbp
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_clut_3D_sse41
+.globl _sk_clut_3D_sse41
+FUNCTION(_sk_clut_3D_sse41)
+_sk_clut_3D_sse41:
+ .byte 85 // push %rbp
+ .byte 65,87 // push %r15
+ .byte 65,86 // push %r14
+ .byte 65,85 // push %r13
+ .byte 65,84 // push %r12
+ .byte 83 // push %rbx
+ .byte 72,131,236,72 // sub $0x48,%rsp
+ .byte 15,41,124,36,48 // movaps %xmm7,0x30(%rsp)
+ .byte 15,41,116,36,32 // movaps %xmm6,0x20(%rsp)
+ .byte 15,41,108,36,16 // movaps %xmm5,0x10(%rsp)
+ .byte 15,41,36,36 // movaps %xmm4,(%rsp)
+ .byte 15,41,92,36,240 // movaps %xmm3,-0x10(%rsp)
+ .byte 76,137,68,36,152 // mov %r8,-0x68(%rsp)
+ .byte 72,137,76,36,144 // mov %rcx,-0x70(%rsp)
+ .byte 73,137,208 // mov %rdx,%r8
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,16 // mov 0x10(%rax),%r9d
+ .byte 65,141,89,255 // lea -0x1(%r9),%ebx
+ .byte 102,15,110,219 // movd %ebx,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,89,218 // mulps %xmm2,%xmm3
+ .byte 243,15,91,227 // cvttps2dq %xmm3,%xmm4
+ .byte 68,15,40,195 // movaps %xmm3,%xmm8
+ .byte 68,15,41,68,36,224 // movaps %xmm8,-0x20(%rsp)
+ .byte 102,65,15,110,209 // movd %r9d,%xmm2
+ .byte 102,15,112,234,0 // pshufd $0x0,%xmm2,%xmm5
+ .byte 102,15,127,108,36,160 // movdqa %xmm5,-0x60(%rsp)
+ .byte 68,139,72,12 // mov 0xc(%rax),%r9d
+ .byte 65,141,89,255 // lea -0x1(%r9),%ebx
+ .byte 102,15,110,219 // movd %ebx,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 243,68,15,91,235 // cvttps2dq %xmm3,%xmm13
+ .byte 102,68,15,127,108,36,192 // movdqa %xmm13,-0x40(%rsp)
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,41,124,36,128 // movaps %xmm7,-0x80(%rsp)
+ .byte 102,68,15,56,64,237 // pmulld %xmm5,%xmm13
+ .byte 102,65,15,111,205 // movdqa %xmm13,%xmm1
+ .byte 102,15,254,204 // paddd %xmm4,%xmm1
+ .byte 102,68,15,111,212 // movdqa %xmm4,%xmm10
+ .byte 102,68,15,127,84,36,208 // movdqa %xmm10,-0x30(%rsp)
+ .byte 102,65,15,110,217 // movd %r9d,%xmm3
+ .byte 102,15,56,64,218 // pmulld %xmm2,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 139,88,8 // mov 0x8(%rax),%ebx
+ .byte 255,203 // dec %ebx
+ .byte 102,15,110,211 // movd %ebx,%xmm2
+ .byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
+ .byte 68,15,91,242 // cvtdq2ps %xmm2,%xmm14
+ .byte 68,15,89,240 // mulps %xmm0,%xmm14
+ .byte 243,65,15,91,198 // cvttps2dq %xmm14,%xmm0
+ .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
+ .byte 102,68,15,56,64,227 // pmulld %xmm3,%xmm12
+ .byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
+ .byte 102,15,254,209 // paddd %xmm1,%xmm2
+ .byte 102,15,111,37,45,48,0,0 // movdqa 0x302d(%rip),%xmm4 # 90c0 <_sk_clut_4D_sse41+0x2822>
+ .byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
+ .byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
+ .byte 102,68,15,111,61,42,48,0,0 // movdqa 0x302a(%rip),%xmm15 # 90d0 <_sk_clut_4D_sse41+0x2832>
+ .byte 102,15,111,226 // movdqa %xmm2,%xmm4
+ .byte 102,65,15,254,231 // paddd %xmm15,%xmm4
+ .byte 102,73,15,58,22,225,1 // pextrq $0x1,%xmm4,%r9
+ .byte 102,72,15,126,227 // movq %xmm4,%rbx
+ .byte 72,139,0 // mov (%rax),%rax
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 69,137,203 // mov %r9d,%r11d
+ .byte 243,66,15,16,36,144 // movss (%rax,%r10,4),%xmm4
+ .byte 102,15,58,33,36,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm4
+ .byte 243,66,15,16,44,152 // movss (%rax,%r11,4),%xmm5
+ .byte 102,15,58,33,229,32 // insertps $0x20,%xmm5,%xmm4
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 243,66,15,16,44,136 // movss (%rax,%r9,4),%xmm5
+ .byte 102,15,58,33,229,48 // insertps $0x30,%xmm5,%xmm4
+ .byte 102,65,15,126,209 // movd %xmm2,%r9d
+ .byte 102,65,15,58,22,210,1 // pextrd $0x1,%xmm2,%r10d
+ .byte 102,65,15,58,22,211,2 // pextrd $0x2,%xmm2,%r11d
+ .byte 102,65,15,58,22,214,3 // pextrd $0x3,%xmm2,%r14d
+ .byte 102,68,15,111,13,204,47,0,0 // movdqa 0x2fcc(%rip),%xmm9 # 90e0 <_sk_clut_4D_sse41+0x2842>
+ .byte 102,65,15,254,209 // paddd %xmm9,%xmm2
+ .byte 102,73,15,58,22,215,1 // pextrq $0x1,%xmm2,%r15
+ .byte 102,72,15,126,211 // movq %xmm2,%rbx
+ .byte 65,137,220 // mov %ebx,%r12d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 69,137,253 // mov %r15d,%r13d
+ .byte 243,66,15,16,52,160 // movss (%rax,%r12,4),%xmm6
+ .byte 102,15,58,33,52,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm6
+ .byte 243,66,15,16,20,168 // movss (%rax,%r13,4),%xmm2
+ .byte 102,15,58,33,242,32 // insertps $0x20,%xmm2,%xmm6
+ .byte 73,193,239,32 // shr $0x20,%r15
+ .byte 243,66,15,16,20,184 // movss (%rax,%r15,4),%xmm2
+ .byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
+ .byte 15,40,45,81,47,0,0 // movaps 0x2f51(%rip),%xmm5 # 90b0 <_sk_clut_4D_sse41+0x2812>
+ .byte 68,15,88,197 // addps %xmm5,%xmm8
+ .byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
+ .byte 15,40,215 // movaps %xmm7,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 65,15,88,238 // addps %xmm14,%xmm5
+ .byte 243,68,15,91,197 // cvttps2dq %xmm5,%xmm8
+ .byte 102,68,15,56,64,195 // pmulld %xmm3,%xmm8
+ .byte 102,65,15,254,200 // paddd %xmm8,%xmm1
+ .byte 102,65,15,111,251 // movdqa %xmm11,%xmm7
+ .byte 102,15,56,64,207 // pmulld %xmm7,%xmm1
+ .byte 102,15,111,217 // movdqa %xmm1,%xmm3
+ .byte 102,65,15,254,223 // paddd %xmm15,%xmm3
+ .byte 102,73,15,58,22,223,1 // pextrq $0x1,%xmm3,%r15
+ .byte 102,72,15,126,219 // movq %xmm3,%rbx
+ .byte 65,137,220 // mov %ebx,%r12d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 69,137,253 // mov %r15d,%r13d
+ .byte 243,66,15,16,44,160 // movss (%rax,%r12,4),%xmm5
+ .byte 102,15,58,33,44,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm5
+ .byte 243,66,15,16,28,168 // movss (%rax,%r13,4),%xmm3
+ .byte 102,15,58,33,235,32 // insertps $0x20,%xmm3,%xmm5
+ .byte 73,193,239,32 // shr $0x20,%r15
+ .byte 243,66,15,16,28,184 // movss (%rax,%r15,4),%xmm3
+ .byte 102,15,58,33,235,48 // insertps $0x30,%xmm3,%xmm5
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 102,65,15,58,22,207,1 // pextrd $0x1,%xmm1,%r15d
+ .byte 102,65,15,58,22,204,2 // pextrd $0x2,%xmm1,%r12d
+ .byte 102,65,15,58,22,205,3 // pextrd $0x3,%xmm1,%r13d
+ .byte 102,65,15,254,201 // paddd %xmm9,%xmm1
+ .byte 102,72,15,58,22,205,1 // pextrq $0x1,%xmm1,%rbp
+ .byte 102,72,15,126,201 // movq %xmm1,%rcx
+ .byte 137,202 // mov %ecx,%edx
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,28,144 // movss (%rax,%rdx,4),%xmm3
+ .byte 102,15,58,33,28,136,16 // insertps $0x10,(%rax,%rcx,4),%xmm3
+ .byte 137,233 // mov %ebp,%ecx
+ .byte 243,15,16,12,136 // movss (%rax,%rcx,4),%xmm1
+ .byte 102,15,58,33,217,32 // insertps $0x20,%xmm1,%xmm3
+ .byte 72,193,237,32 // shr $0x20,%rbp
+ .byte 243,15,16,12,168 // movss (%rax,%rbp,4),%xmm1
+ .byte 102,15,58,33,217,48 // insertps $0x30,%xmm1,%xmm3
+ .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
+ .byte 68,15,92,240 // subps %xmm0,%xmm14
+ .byte 243,66,15,16,4,136 // movss (%rax,%r9,4),%xmm0
+ .byte 102,66,15,58,33,4,144,16 // insertps $0x10,(%rax,%r10,4),%xmm0
+ .byte 102,66,15,58,33,4,152,32 // insertps $0x20,(%rax,%r11,4),%xmm0
+ .byte 102,66,15,58,33,4,176,48 // insertps $0x30,(%rax,%r14,4),%xmm0
+ .byte 243,15,16,12,152 // movss (%rax,%rbx,4),%xmm1
+ .byte 102,66,15,58,33,12,184,16 // insertps $0x10,(%rax,%r15,4),%xmm1
+ .byte 102,66,15,58,33,12,160,32 // insertps $0x20,(%rax,%r12,4),%xmm1
+ .byte 102,66,15,58,33,12,168,48 // insertps $0x30,(%rax,%r13,4),%xmm1
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 65,15,89,206 // mulps %xmm14,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 65,15,89,238 // mulps %xmm14,%xmm5
+ .byte 15,88,236 // addps %xmm4,%xmm5
+ .byte 15,92,222 // subps %xmm6,%xmm3
+ .byte 65,15,89,222 // mulps %xmm14,%xmm3
+ .byte 15,88,222 // addps %xmm6,%xmm3
+ .byte 243,68,15,91,218 // cvttps2dq %xmm2,%xmm11
+ .byte 102,68,15,56,64,92,36,160 // pmulld -0x60(%rsp),%xmm11
+ .byte 102,65,15,111,227 // movdqa %xmm11,%xmm4
+ .byte 102,65,15,254,226 // paddd %xmm10,%xmm4
+ .byte 102,15,111,196 // movdqa %xmm4,%xmm0
+ .byte 102,65,15,254,196 // paddd %xmm12,%xmm0
+ .byte 102,15,56,64,199 // pmulld %xmm7,%xmm0
+ .byte 102,68,15,111,215 // movdqa %xmm7,%xmm10
+ .byte 102,15,126,193 // movd %xmm0,%ecx
+ .byte 102,15,58,22,194,1 // pextrd $0x1,%xmm0,%edx
+ .byte 102,15,58,22,197,2 // pextrd $0x2,%xmm0,%ebp
+ .byte 102,15,58,22,195,3 // pextrd $0x3,%xmm0,%ebx
+ .byte 243,15,16,52,136 // movss (%rax,%rcx,4),%xmm6
+ .byte 102,15,58,33,52,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm6
+ .byte 102,15,58,33,52,168,32 // insertps $0x20,(%rax,%rbp,4),%xmm6
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
+ .byte 102,15,111,208 // movdqa %xmm0,%xmm2
+ .byte 102,65,15,254,215 // paddd %xmm15,%xmm2
+ .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
+ .byte 102,72,15,126,210 // movq %xmm2,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,20,168 // movss (%rax,%rbp,4),%xmm2
+ .byte 102,15,58,33,20,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm2
+ .byte 243,15,16,60,152 // movss (%rax,%rbx,4),%xmm7
+ .byte 102,15,58,33,215,32 // insertps $0x20,%xmm7,%xmm2
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,60,136 // movss (%rax,%rcx,4),%xmm7
+ .byte 102,15,58,33,215,48 // insertps $0x30,%xmm7,%xmm2
+ .byte 102,65,15,254,193 // paddd %xmm9,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,4,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm0
+ .byte 243,15,16,60,152 // movss (%rax,%rbx,4),%xmm7
+ .byte 102,15,58,33,199,32 // insertps $0x20,%xmm7,%xmm0
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,60,136 // movss (%rax,%rcx,4),%xmm7
+ .byte 102,15,58,33,199,48 // insertps $0x30,%xmm7,%xmm0
+ .byte 102,65,15,254,224 // paddd %xmm8,%xmm4
+ .byte 102,65,15,56,64,226 // pmulld %xmm10,%xmm4
+ .byte 102,15,111,252 // movdqa %xmm4,%xmm7
+ .byte 102,65,15,254,255 // paddd %xmm15,%xmm7
+ .byte 102,72,15,58,22,249,1 // pextrq $0x1,%xmm7,%rcx
+ .byte 102,72,15,126,250 // movq %xmm7,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,68,15,16,20,168 // movss (%rax,%rbp,4),%xmm10
+ .byte 102,68,15,58,33,20,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm10
+ .byte 243,15,16,60,152 // movss (%rax,%rbx,4),%xmm7
+ .byte 102,68,15,58,33,215,32 // insertps $0x20,%xmm7,%xmm10
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,60,136 // movss (%rax,%rcx,4),%xmm7
+ .byte 102,68,15,58,33,215,48 // insertps $0x30,%xmm7,%xmm10
+ .byte 102,65,15,126,225 // movd %xmm4,%r9d
+ .byte 102,65,15,58,22,226,1 // pextrd $0x1,%xmm4,%r10d
+ .byte 102,65,15,58,22,230,2 // pextrd $0x2,%xmm4,%r14d
+ .byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d
+ .byte 102,65,15,111,249 // movdqa %xmm9,%xmm7
+ .byte 102,15,254,231 // paddd %xmm7,%xmm4
+ .byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
+ .byte 102,72,15,126,226 // movq %xmm4,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,68,15,16,12,152 // movss (%rax,%rbx,4),%xmm9
+ .byte 102,68,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm9
+ .byte 243,15,16,36,168 // movss (%rax,%rbp,4),%xmm4
+ .byte 102,68,15,58,33,204,32 // insertps $0x20,%xmm4,%xmm9
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,36,136 // movss (%rax,%rcx,4),%xmm4
+ .byte 102,68,15,58,33,204,48 // insertps $0x30,%xmm4,%xmm9
+ .byte 243,66,15,16,36,136 // movss (%rax,%r9,4),%xmm4
+ .byte 102,66,15,58,33,36,144,16 // insertps $0x10,(%rax,%r10,4),%xmm4
+ .byte 102,66,15,58,33,36,176,32 // insertps $0x20,(%rax,%r14,4),%xmm4
+ .byte 102,66,15,58,33,36,152,48 // insertps $0x30,(%rax,%r11,4),%xmm4
+ .byte 15,92,230 // subps %xmm6,%xmm4
+ .byte 65,15,89,230 // mulps %xmm14,%xmm4
+ .byte 15,88,230 // addps %xmm6,%xmm4
+ .byte 68,15,92,210 // subps %xmm2,%xmm10
+ .byte 69,15,89,214 // mulps %xmm14,%xmm10
+ .byte 68,15,88,210 // addps %xmm2,%xmm10
+ .byte 68,15,92,200 // subps %xmm0,%xmm9
+ .byte 69,15,89,206 // mulps %xmm14,%xmm9
+ .byte 68,15,88,200 // addps %xmm0,%xmm9
+ .byte 15,91,68,36,192 // cvtdq2ps -0x40(%rsp),%xmm0
+ .byte 15,40,84,36,128 // movaps -0x80(%rsp),%xmm2
+ .byte 15,92,208 // subps %xmm0,%xmm2
+ .byte 15,41,84,36,128 // movaps %xmm2,-0x80(%rsp)
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 68,15,92,213 // subps %xmm5,%xmm10
+ .byte 68,15,89,210 // mulps %xmm2,%xmm10
+ .byte 68,15,88,213 // addps %xmm5,%xmm10
+ .byte 68,15,92,203 // subps %xmm3,%xmm9
+ .byte 68,15,89,202 // mulps %xmm2,%xmm9
+ .byte 68,15,88,203 // addps %xmm3,%xmm9
+ .byte 243,15,91,68,36,176 // cvttps2dq -0x50(%rsp),%xmm0
+ .byte 102,68,15,254,232 // paddd %xmm0,%xmm13
+ .byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
+ .byte 102,65,15,254,213 // paddd %xmm13,%xmm2
+ .byte 102,15,111,45,16,44,0,0 // movdqa 0x2c10(%rip),%xmm5 # 90c0 <_sk_clut_4D_sse41+0x2822>
+ .byte 102,15,56,64,213 // pmulld %xmm5,%xmm2
+ .byte 102,15,111,202 // movdqa %xmm2,%xmm1
+ .byte 102,65,15,254,207 // paddd %xmm15,%xmm1
+ .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
+ .byte 102,72,15,126,202 // movq %xmm1,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,12,168 // movss (%rax,%rbp,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,28,152 // movss (%rax,%rbx,4),%xmm3
+ .byte 102,15,58,33,203,32 // insertps $0x20,%xmm3,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,28,136 // movss (%rax,%rcx,4),%xmm3
+ .byte 102,15,58,33,203,48 // insertps $0x30,%xmm3,%xmm1
+ .byte 102,65,15,126,214 // movd %xmm2,%r14d
+ .byte 102,65,15,58,22,209,1 // pextrd $0x1,%xmm2,%r9d
+ .byte 102,65,15,58,22,210,2 // pextrd $0x2,%xmm2,%r10d
+ .byte 102,65,15,58,22,211,3 // pextrd $0x3,%xmm2,%r11d
+ .byte 102,15,254,215 // paddd %xmm7,%xmm2
+ .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
+ .byte 102,72,15,126,210 // movq %xmm2,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,20,168 // movss (%rax,%rbp,4),%xmm2
+ .byte 102,15,58,33,20,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm2
+ .byte 243,15,16,28,152 // movss (%rax,%rbx,4),%xmm3
+ .byte 102,15,58,33,211,32 // insertps $0x20,%xmm3,%xmm2
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,28,136 // movss (%rax,%rcx,4),%xmm3
+ .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
+ .byte 102,65,15,111,240 // movdqa %xmm8,%xmm6
+ .byte 102,68,15,254,238 // paddd %xmm6,%xmm13
+ .byte 102,68,15,56,64,237 // pmulld %xmm5,%xmm13
+ .byte 102,65,15,111,221 // movdqa %xmm13,%xmm3
+ .byte 102,65,15,254,223 // paddd %xmm15,%xmm3
+ .byte 102,72,15,58,22,217,1 // pextrq $0x1,%xmm3,%rcx
+ .byte 102,72,15,126,218 // movq %xmm3,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,68,15,16,4,152 // movss (%rax,%rbx,4),%xmm8
+ .byte 102,68,15,58,33,4,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm8
+ .byte 243,15,16,28,168 // movss (%rax,%rbp,4),%xmm3
+ .byte 102,68,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm8
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,28,136 // movss (%rax,%rcx,4),%xmm3
+ .byte 102,68,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm8
+ .byte 102,68,15,126,233 // movd %xmm13,%ecx
+ .byte 102,69,15,58,22,239,1 // pextrd $0x1,%xmm13,%r15d
+ .byte 102,69,15,58,22,236,2 // pextrd $0x2,%xmm13,%r12d
+ .byte 102,69,15,58,22,237,3 // pextrd $0x3,%xmm13,%r13d
+ .byte 102,68,15,254,239 // paddd %xmm7,%xmm13
+ .byte 102,76,15,58,22,234,1 // pextrq $0x1,%xmm13,%rdx
+ .byte 102,76,15,126,235 // movq %xmm13,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,68,15,16,44,168 // movss (%rax,%rbp,4),%xmm13
+ .byte 102,68,15,58,33,44,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm13
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,28,152 // movss (%rax,%rbx,4),%xmm3
+ .byte 102,68,15,58,33,235,32 // insertps $0x20,%xmm3,%xmm13
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,28,144 // movss (%rax,%rdx,4),%xmm3
+ .byte 102,68,15,58,33,235,48 // insertps $0x30,%xmm3,%xmm13
+ .byte 243,66,15,16,28,176 // movss (%rax,%r14,4),%xmm3
+ .byte 102,66,15,58,33,28,136,16 // insertps $0x10,(%rax,%r9,4),%xmm3
+ .byte 102,66,15,58,33,28,144,32 // insertps $0x20,(%rax,%r10,4),%xmm3
+ .byte 102,66,15,58,33,28,152,48 // insertps $0x30,(%rax,%r11,4),%xmm3
+ .byte 243,15,16,60,136 // movss (%rax,%rcx,4),%xmm7
+ .byte 102,66,15,58,33,60,184,16 // insertps $0x10,(%rax,%r15,4),%xmm7
+ .byte 102,66,15,58,33,60,160,32 // insertps $0x20,(%rax,%r12,4),%xmm7
+ .byte 102,66,15,58,33,60,168,48 // insertps $0x30,(%rax,%r13,4),%xmm7
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 65,15,89,254 // mulps %xmm14,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 68,15,92,193 // subps %xmm1,%xmm8
+ .byte 69,15,89,198 // mulps %xmm14,%xmm8
+ .byte 68,15,88,193 // addps %xmm1,%xmm8
+ .byte 68,15,92,234 // subps %xmm2,%xmm13
+ .byte 69,15,89,238 // mulps %xmm14,%xmm13
+ .byte 68,15,88,234 // addps %xmm2,%xmm13
+ .byte 102,68,15,254,216 // paddd %xmm0,%xmm11
+ .byte 102,69,15,254,227 // paddd %xmm11,%xmm12
+ .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 102,68,15,56,64,225 // pmulld %xmm1,%xmm12
+ .byte 102,65,15,111,196 // movdqa %xmm12,%xmm0
+ .byte 102,65,15,254,199 // paddd %xmm15,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,28,168 // movss (%rax,%rbp,4),%xmm3
+ .byte 102,15,58,33,28,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm3
+ .byte 243,15,16,4,152 // movss (%rax,%rbx,4),%xmm0
+ .byte 102,15,58,33,216,32 // insertps $0x20,%xmm0,%xmm3
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,15,58,33,216,48 // insertps $0x30,%xmm0,%xmm3
+ .byte 102,69,15,126,230 // movd %xmm12,%r14d
+ .byte 102,69,15,58,22,225,1 // pextrd $0x1,%xmm12,%r9d
+ .byte 102,69,15,58,22,226,2 // pextrd $0x2,%xmm12,%r10d
+ .byte 102,69,15,58,22,227,3 // pextrd $0x3,%xmm12,%r11d
+ .byte 102,15,111,21,4,42,0,0 // movdqa 0x2a04(%rip),%xmm2 # 90e0 <_sk_clut_4D_sse41+0x2842>
+ .byte 102,68,15,254,226 // paddd %xmm2,%xmm12
+ .byte 102,76,15,58,22,225,1 // pextrq $0x1,%xmm12,%rcx
+ .byte 102,76,15,126,226 // movq %xmm12,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,44,168 // movss (%rax,%rbp,4),%xmm5
+ .byte 102,15,58,33,44,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm5
+ .byte 243,15,16,4,152 // movss (%rax,%rbx,4),%xmm0
+ .byte 102,15,58,33,232,32 // insertps $0x20,%xmm0,%xmm5
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
+ .byte 102,68,15,254,222 // paddd %xmm6,%xmm11
+ .byte 102,68,15,56,64,217 // pmulld %xmm1,%xmm11
+ .byte 102,69,15,254,251 // paddd %xmm11,%xmm15
+ .byte 102,76,15,58,22,249,1 // pextrq $0x1,%xmm15,%rcx
+ .byte 102,76,15,126,250 // movq %xmm15,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,15,16,12,152 // movss (%rax,%rbx,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,200,32 // insertps $0x20,%xmm0,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,15,58,33,200,48 // insertps $0x30,%xmm0,%xmm1
+ .byte 102,68,15,126,217 // movd %xmm11,%ecx
+ .byte 102,69,15,58,22,223,1 // pextrd $0x1,%xmm11,%r15d
+ .byte 102,69,15,58,22,220,2 // pextrd $0x2,%xmm11,%r12d
+ .byte 102,69,15,58,22,221,3 // pextrd $0x3,%xmm11,%r13d
+ .byte 102,68,15,254,218 // paddd %xmm2,%xmm11
+ .byte 102,76,15,58,22,218,1 // pextrq $0x1,%xmm11,%rdx
+ .byte 102,76,15,126,219 // movq %xmm11,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,15,16,20,168 // movss (%rax,%rbp,4),%xmm2
+ .byte 102,15,58,33,20,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm2
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,4,152 // movss (%rax,%rbx,4),%xmm0
+ .byte 102,15,58,33,208,32 // insertps $0x20,%xmm0,%xmm2
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,4,144 // movss (%rax,%rdx,4),%xmm0
+ .byte 102,15,58,33,208,48 // insertps $0x30,%xmm0,%xmm2
+ .byte 243,66,15,16,52,176 // movss (%rax,%r14,4),%xmm6
+ .byte 102,66,15,58,33,52,136,16 // insertps $0x10,(%rax,%r9,4),%xmm6
+ .byte 102,66,15,58,33,52,144,32 // insertps $0x20,(%rax,%r10,4),%xmm6
+ .byte 102,66,15,58,33,52,152,48 // insertps $0x30,(%rax,%r11,4),%xmm6
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,66,15,58,33,4,184,16 // insertps $0x10,(%rax,%r15,4),%xmm0
+ .byte 102,66,15,58,33,4,160,32 // insertps $0x20,(%rax,%r12,4),%xmm0
+ .byte 102,66,15,58,33,4,168,48 // insertps $0x30,(%rax,%r13,4),%xmm0
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 65,15,89,198 // mulps %xmm14,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 65,15,89,206 // mulps %xmm14,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,92,213 // subps %xmm5,%xmm2
+ .byte 65,15,89,214 // mulps %xmm14,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,40,92,36,128 // movaps -0x80(%rsp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,199 // addps %xmm7,%xmm0
+ .byte 65,15,92,200 // subps %xmm8,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 65,15,88,200 // addps %xmm8,%xmm1
+ .byte 65,15,92,213 // subps %xmm13,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 65,15,88,213 // addps %xmm13,%xmm2
+ .byte 15,91,92,36,208 // cvtdq2ps -0x30(%rsp),%xmm3
+ .byte 15,40,108,36,224 // movaps -0x20(%rsp),%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 65,15,92,202 // subps %xmm10,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 65,15,88,202 // addps %xmm10,%xmm1
+ .byte 65,15,92,209 // subps %xmm9,%xmm2
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 65,15,88,209 // addps %xmm9,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,137,194 // mov %r8,%rdx
+ .byte 72,139,76,36,144 // mov -0x70(%rsp),%rcx
+ .byte 76,139,68,36,152 // mov -0x68(%rsp),%r8
+ .byte 15,40,92,36,240 // movaps -0x10(%rsp),%xmm3
+ .byte 15,40,36,36 // movaps (%rsp),%xmm4
+ .byte 15,40,108,36,16 // movaps 0x10(%rsp),%xmm5
+ .byte 15,40,116,36,32 // movaps 0x20(%rsp),%xmm6
+ .byte 15,40,124,36,48 // movaps 0x30(%rsp),%xmm7
+ .byte 72,131,196,72 // add $0x48,%rsp
+ .byte 91 // pop %rbx
+ .byte 65,92 // pop %r12
+ .byte 65,93 // pop %r13
+ .byte 65,94 // pop %r14
+ .byte 65,95 // pop %r15
+ .byte 93 // pop %rbp
+ .byte 255,224 // jmpq *%rax
+
+HIDDEN _sk_clut_4D_sse41
+.globl _sk_clut_4D_sse41
+FUNCTION(_sk_clut_4D_sse41)
+_sk_clut_4D_sse41:
+ .byte 85 // push %rbp
+ .byte 65,87 // push %r15
+ .byte 65,86 // push %r14
+ .byte 65,85 // push %r13
+ .byte 65,84 // push %r12
+ .byte 83 // push %rbx
+ .byte 72,129,236,152,0,0,0 // sub $0x98,%rsp
+ .byte 15,41,188,36,128,0,0,0 // movaps %xmm7,0x80(%rsp)
+ .byte 15,41,116,36,112 // movaps %xmm6,0x70(%rsp)
+ .byte 15,41,108,36,96 // movaps %xmm5,0x60(%rsp)
+ .byte 15,41,100,36,80 // movaps %xmm4,0x50(%rsp)
+ .byte 76,137,68,36,248 // mov %r8,-0x8(%rsp)
+ .byte 72,137,76,36,240 // mov %rcx,-0x10(%rsp)
+ .byte 73,137,208 // mov %rdx,%r8
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,20 // mov 0x14(%rax),%r9d
+ .byte 65,141,89,255 // lea -0x1(%r9),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
+ .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
+ .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 243,15,91,236 // cvttps2dq %xmm4,%xmm5
+ .byte 102,15,127,44,36 // movdqa %xmm5,(%rsp)
+ .byte 68,15,40,212 // movaps %xmm4,%xmm10
+ .byte 68,15,41,84,36,64 // movaps %xmm10,0x40(%rsp)
+ .byte 102,65,15,110,225 // movd %r9d,%xmm4
+ .byte 102,15,112,244,0 // pshufd $0x0,%xmm4,%xmm6
+ .byte 102,15,127,116,36,32 // movdqa %xmm6,0x20(%rsp)
+ .byte 68,139,72,16 // mov 0x10(%rax),%r9d
+ .byte 65,141,89,255 // lea -0x1(%r9),%ebx
+ .byte 102,15,110,219 // movd %ebx,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,89,218 // mulps %xmm2,%xmm3
+ .byte 243,68,15,91,227 // cvttps2dq %xmm3,%xmm12
+ .byte 102,68,15,127,100,36,192 // movdqa %xmm12,-0x40(%rsp)
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,41,124,36,224 // movaps %xmm7,-0x20(%rsp)
+ .byte 102,68,15,56,64,230 // pmulld %xmm6,%xmm12
+ .byte 102,65,15,111,220 // movdqa %xmm12,%xmm3
+ .byte 102,15,254,221 // paddd %xmm5,%xmm3
+ .byte 102,65,15,110,209 // movd %r9d,%xmm2
+ .byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
+ .byte 102,15,112,234,0 // pshufd $0x0,%xmm2,%xmm5
+ .byte 102,15,127,108,36,144 // movdqa %xmm5,-0x70(%rsp)
+ .byte 68,139,72,12 // mov 0xc(%rax),%r9d
+ .byte 65,141,89,255 // lea -0x1(%r9),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
+ .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
+ .byte 68,15,91,244 // cvtdq2ps %xmm4,%xmm14
+ .byte 68,15,89,241 // mulps %xmm1,%xmm14
+ .byte 102,65,15,110,225 // movd %r9d,%xmm4
+ .byte 102,15,56,64,226 // pmulld %xmm2,%xmm4
+ .byte 139,88,8 // mov 0x8(%rax),%ebx
+ .byte 255,203 // dec %ebx
+ .byte 102,15,110,203 // movd %ebx,%xmm1
+ .byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
+ .byte 68,15,91,249 // cvtdq2ps %xmm1,%xmm15
+ .byte 68,15,89,248 // mulps %xmm0,%xmm15
+ .byte 243,65,15,91,198 // cvttps2dq %xmm14,%xmm0
+ .byte 102,15,127,68,36,128 // movdqa %xmm0,-0x80(%rsp)
+ .byte 102,15,56,64,197 // pmulld %xmm5,%xmm0
+ .byte 102,15,127,68,36,208 // movdqa %xmm0,-0x30(%rsp)
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,254,203 // paddd %xmm3,%xmm1
+ .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
+ .byte 243,69,15,91,207 // cvttps2dq %xmm15,%xmm9
+ .byte 102,69,15,111,233 // movdqa %xmm9,%xmm13
+ .byte 102,68,15,56,64,236 // pmulld %xmm4,%xmm13
+ .byte 102,65,15,111,197 // movdqa %xmm13,%xmm0
+ .byte 102,68,15,127,108,36,176 // movdqa %xmm13,-0x50(%rsp)
+ .byte 102,15,254,193 // paddd %xmm1,%xmm0
+ .byte 102,15,56,64,5,29,39,0,0 // pmulld 0x271d(%rip),%xmm0 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,68,15,111,29,36,39,0,0 // movdqa 0x2724(%rip),%xmm11 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,15,111,208 // movdqa %xmm0,%xmm2
+ .byte 102,65,15,254,211 // paddd %xmm11,%xmm2
+ .byte 102,73,15,58,22,209,1 // pextrq $0x1,%xmm2,%r9
+ .byte 102,72,15,126,211 // movq %xmm2,%rbx
+ .byte 72,139,0 // mov (%rax),%rax
+ .byte 65,137,218 // mov %ebx,%r10d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 69,137,203 // mov %r9d,%r11d
+ .byte 243,66,15,16,20,144 // movss (%rax,%r10,4),%xmm2
+ .byte 102,15,58,33,20,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm2
+ .byte 243,66,15,16,44,152 // movss (%rax,%r11,4),%xmm5
+ .byte 102,15,58,33,213,32 // insertps $0x20,%xmm5,%xmm2
+ .byte 73,193,233,32 // shr $0x20,%r9
+ .byte 243,66,15,16,44,136 // movss (%rax,%r9,4),%xmm5
+ .byte 102,15,58,33,213,48 // insertps $0x30,%xmm5,%xmm2
+ .byte 102,65,15,126,193 // movd %xmm0,%r9d
+ .byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
+ .byte 102,65,15,58,22,195,2 // pextrd $0x2,%xmm0,%r11d
+ .byte 102,65,15,58,22,198,3 // pextrd $0x3,%xmm0,%r14d
+ .byte 102,68,15,111,5,198,38,0,0 // movdqa 0x26c6(%rip),%xmm8 # 9120 <_sk_clut_4D_sse41+0x2882>
+ .byte 102,65,15,254,192 // paddd %xmm8,%xmm0
+ .byte 102,73,15,58,22,199,1 // pextrq $0x1,%xmm0,%r15
+ .byte 102,72,15,126,195 // movq %xmm0,%rbx
+ .byte 65,137,220 // mov %ebx,%r12d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 69,137,253 // mov %r15d,%r13d
+ .byte 243,66,15,16,44,160 // movss (%rax,%r12,4),%xmm5
+ .byte 102,15,58,33,44,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm5
+ .byte 243,66,15,16,4,168 // movss (%rax,%r13,4),%xmm0
+ .byte 102,15,58,33,232,32 // insertps $0x20,%xmm0,%xmm5
+ .byte 73,193,239,32 // shr $0x20,%r15
+ .byte 243,66,15,16,4,184 // movss (%rax,%r15,4),%xmm0
+ .byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
+ .byte 15,40,53,75,38,0,0 // movaps 0x264b(%rip),%xmm6 # 90f0 <_sk_clut_4D_sse41+0x2852>
+ .byte 68,15,88,214 // addps %xmm6,%xmm10
+ .byte 68,15,41,84,36,48 // movaps %xmm10,0x30(%rsp)
+ .byte 15,88,254 // addps %xmm6,%xmm7
+ .byte 15,41,124,36,16 // movaps %xmm7,0x10(%rsp)
+ .byte 65,15,40,198 // movaps %xmm14,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 65,15,88,247 // addps %xmm15,%xmm6
+ .byte 243,15,91,246 // cvttps2dq %xmm6,%xmm6
+ .byte 102,15,56,64,244 // pmulld %xmm4,%xmm6
+ .byte 102,15,254,206 // paddd %xmm6,%xmm1
+ .byte 102,68,15,111,214 // movdqa %xmm6,%xmm10
+ .byte 102,68,15,127,84,36,160 // movdqa %xmm10,-0x60(%rsp)
+ .byte 102,15,56,64,13,28,38,0,0 // pmulld 0x261c(%rip),%xmm1 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,15,111,225 // movdqa %xmm1,%xmm4
+ .byte 102,65,15,254,227 // paddd %xmm11,%xmm4
+ .byte 102,73,15,58,22,231,1 // pextrq $0x1,%xmm4,%r15
+ .byte 102,72,15,126,227 // movq %xmm4,%rbx
+ .byte 65,137,220 // mov %ebx,%r12d
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 69,137,253 // mov %r15d,%r13d
+ .byte 243,66,15,16,52,160 // movss (%rax,%r12,4),%xmm6
+ .byte 102,15,58,33,52,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm6
+ .byte 243,66,15,16,36,168 // movss (%rax,%r13,4),%xmm4
+ .byte 102,15,58,33,244,32 // insertps $0x20,%xmm4,%xmm6
+ .byte 73,193,239,32 // shr $0x20,%r15
+ .byte 243,66,15,16,36,184 // movss (%rax,%r15,4),%xmm4
+ .byte 102,15,58,33,244,48 // insertps $0x30,%xmm4,%xmm6
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 102,65,15,58,22,207,1 // pextrd $0x1,%xmm1,%r15d
+ .byte 102,65,15,58,22,204,2 // pextrd $0x2,%xmm1,%r12d
+ .byte 102,65,15,58,22,205,3 // pextrd $0x3,%xmm1,%r13d
+ .byte 102,65,15,254,200 // paddd %xmm8,%xmm1
+ .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
+ .byte 102,72,15,58,22,205,1 // pextrq $0x1,%xmm1,%rbp
+ .byte 102,72,15,126,201 // movq %xmm1,%rcx
+ .byte 137,202 // mov %ecx,%edx
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,36,144 // movss (%rax,%rdx,4),%xmm4
+ .byte 102,15,58,33,36,136,16 // insertps $0x10,(%rax,%rcx,4),%xmm4
+ .byte 137,233 // mov %ebp,%ecx
+ .byte 243,15,16,12,136 // movss (%rax,%rcx,4),%xmm1
+ .byte 102,15,58,33,225,32 // insertps $0x20,%xmm1,%xmm4
+ .byte 72,193,237,32 // shr $0x20,%rbp
+ .byte 243,15,16,12,168 // movss (%rax,%rbp,4),%xmm1
+ .byte 102,15,58,33,225,48 // insertps $0x30,%xmm1,%xmm4
+ .byte 65,15,91,201 // cvtdq2ps %xmm9,%xmm1
+ .byte 68,15,92,249 // subps %xmm1,%xmm15
+ .byte 243,66,15,16,12,136 // movss (%rax,%r9,4),%xmm1
+ .byte 102,66,15,58,33,12,144,16 // insertps $0x10,(%rax,%r10,4),%xmm1
+ .byte 102,66,15,58,33,12,152,32 // insertps $0x20,(%rax,%r11,4),%xmm1
+ .byte 102,66,15,58,33,12,176,48 // insertps $0x30,(%rax,%r14,4),%xmm1
+ .byte 243,15,16,60,152 // movss (%rax,%rbx,4),%xmm7
+ .byte 102,66,15,58,33,60,184,16 // insertps $0x10,(%rax,%r15,4),%xmm7
+ .byte 102,66,15,58,33,60,160,32 // insertps $0x20,(%rax,%r12,4),%xmm7
+ .byte 102,66,15,58,33,60,168,48 // insertps $0x30,(%rax,%r13,4),%xmm7
+ .byte 15,92,249 // subps %xmm1,%xmm7
+ .byte 65,15,89,255 // mulps %xmm15,%xmm7
+ .byte 15,88,249 // addps %xmm1,%xmm7
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 65,15,89,247 // mulps %xmm15,%xmm6
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 65,15,89,231 // mulps %xmm15,%xmm4
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 243,15,91,192 // cvttps2dq %xmm0,%xmm0
+ .byte 102,15,56,64,68,36,144 // pmulld -0x70(%rsp),%xmm0
+ .byte 102,15,127,68,36,144 // movdqa %xmm0,-0x70(%rsp)
+ .byte 102,15,254,216 // paddd %xmm0,%xmm3
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
+ .byte 102,65,15,254,205 // paddd %xmm13,%xmm1
+ .byte 102,15,111,5,240,36,0,0 // movdqa 0x24f0(%rip),%xmm0 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,15,56,64,200 // pmulld %xmm0,%xmm1
+ .byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
+ .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,68,15,111,5,233,36,0,0 // movdqa 0x24e9(%rip),%xmm8 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,65,15,254,192 // paddd %xmm8,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,4,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm0
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
+ .byte 102,65,15,126,206 // movd %xmm1,%r14d
+ .byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d
+ .byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d
+ .byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d
+ .byte 102,65,15,254,203 // paddd %xmm11,%xmm1
+ .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
+ .byte 102,72,15,126,202 // movq %xmm1,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,12,168 // movss (%rax,%rbp,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,202,32 // insertps $0x20,%xmm2,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
+ .byte 102,65,15,254,218 // paddd %xmm10,%xmm3
+ .byte 102,65,15,56,64,217 // pmulld %xmm9,%xmm3
+ .byte 102,15,111,211 // movdqa %xmm3,%xmm2
+ .byte 102,65,15,254,208 // paddd %xmm8,%xmm2
+ .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
+ .byte 102,72,15,126,210 // movq %xmm2,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,68,15,16,20,152 // movss (%rax,%rbx,4),%xmm10
+ .byte 102,68,15,58,33,20,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm10
+ .byte 243,15,16,20,168 // movss (%rax,%rbp,4),%xmm2
+ .byte 102,68,15,58,33,210,32 // insertps $0x20,%xmm2,%xmm10
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,68,15,58,33,210,48 // insertps $0x30,%xmm2,%xmm10
+ .byte 102,15,126,217 // movd %xmm3,%ecx
+ .byte 102,65,15,58,22,223,1 // pextrd $0x1,%xmm3,%r15d
+ .byte 102,65,15,58,22,220,2 // pextrd $0x2,%xmm3,%r12d
+ .byte 102,65,15,58,22,221,3 // pextrd $0x3,%xmm3,%r13d
+ .byte 102,65,15,254,219 // paddd %xmm11,%xmm3
+ .byte 102,72,15,58,22,218,1 // pextrq $0x1,%xmm3,%rdx
+ .byte 102,72,15,126,219 // movq %xmm3,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,68,15,16,12,168 // movss (%rax,%rbp,4),%xmm9
+ .byte 102,68,15,58,33,12,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm9
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,68,15,58,33,202,32 // insertps $0x20,%xmm2,%xmm9
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,20,144 // movss (%rax,%rdx,4),%xmm2
+ .byte 102,68,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm9
+ .byte 243,66,15,16,20,176 // movss (%rax,%r14,4),%xmm2
+ .byte 102,66,15,58,33,20,136,16 // insertps $0x10,(%rax,%r9,4),%xmm2
+ .byte 102,66,15,58,33,20,144,32 // insertps $0x20,(%rax,%r10,4),%xmm2
+ .byte 102,66,15,58,33,20,152,48 // insertps $0x30,(%rax,%r11,4),%xmm2
+ .byte 243,68,15,16,4,136 // movss (%rax,%rcx,4),%xmm8
+ .byte 102,70,15,58,33,4,184,16 // insertps $0x10,(%rax,%r15,4),%xmm8
+ .byte 102,70,15,58,33,4,160,32 // insertps $0x20,(%rax,%r12,4),%xmm8
+ .byte 102,70,15,58,33,4,168,48 // insertps $0x30,(%rax,%r13,4),%xmm8
+ .byte 68,15,92,194 // subps %xmm2,%xmm8
+ .byte 69,15,89,199 // mulps %xmm15,%xmm8
+ .byte 68,15,88,194 // addps %xmm2,%xmm8
+ .byte 68,15,92,208 // subps %xmm0,%xmm10
+ .byte 69,15,89,215 // mulps %xmm15,%xmm10
+ .byte 68,15,88,208 // addps %xmm0,%xmm10
+ .byte 68,15,92,201 // subps %xmm1,%xmm9
+ .byte 69,15,89,207 // mulps %xmm15,%xmm9
+ .byte 68,15,88,201 // addps %xmm1,%xmm9
+ .byte 15,91,68,36,128 // cvtdq2ps -0x80(%rsp),%xmm0
+ .byte 68,15,92,240 // subps %xmm0,%xmm14
+ .byte 68,15,41,116,36,128 // movaps %xmm14,-0x80(%rsp)
+ .byte 68,15,92,199 // subps %xmm7,%xmm8
+ .byte 69,15,89,198 // mulps %xmm14,%xmm8
+ .byte 68,15,88,199 // addps %xmm7,%xmm8
+ .byte 68,15,92,214 // subps %xmm6,%xmm10
+ .byte 69,15,89,214 // mulps %xmm14,%xmm10
+ .byte 68,15,88,214 // addps %xmm6,%xmm10
+ .byte 68,15,92,204 // subps %xmm4,%xmm9
+ .byte 69,15,89,206 // mulps %xmm14,%xmm9
+ .byte 68,15,88,204 // addps %xmm4,%xmm9
+ .byte 243,68,15,91,116,36,16 // cvttps2dq 0x10(%rsp),%xmm14
+ .byte 102,68,15,56,64,116,36,32 // pmulld 0x20(%rsp),%xmm14
+ .byte 102,65,15,111,230 // movdqa %xmm14,%xmm4
+ .byte 102,15,254,36,36 // paddd (%rsp),%xmm4
+ .byte 102,15,111,196 // movdqa %xmm4,%xmm0
+ .byte 102,15,254,68,36,208 // paddd -0x30(%rsp),%xmm0
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,68,15,111,108,36,176 // movdqa -0x50(%rsp),%xmm13
+ .byte 102,65,15,254,205 // paddd %xmm13,%xmm1
+ .byte 102,15,111,45,197,34,0,0 // movdqa 0x22c5(%rip),%xmm5 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,15,56,64,205 // pmulld %xmm5,%xmm1
+ .byte 102,15,126,201 // movd %xmm1,%ecx
+ .byte 102,15,58,22,202,1 // pextrd $0x1,%xmm1,%edx
+ .byte 102,15,58,22,205,2 // pextrd $0x2,%xmm1,%ebp
+ .byte 102,15,58,22,203,3 // pextrd $0x3,%xmm1,%ebx
+ .byte 243,15,16,52,136 // movss (%rax,%rcx,4),%xmm6
+ .byte 102,15,58,33,52,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm6
+ .byte 102,15,58,33,52,168,32 // insertps $0x20,(%rax,%rbp,4),%xmm6
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
+ .byte 102,15,111,209 // movdqa %xmm1,%xmm2
+ .byte 102,15,111,29,144,34,0,0 // movdqa 0x2290(%rip),%xmm3 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
+ .byte 102,72,15,126,210 // movq %xmm2,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,60,168 // movss (%rax,%rbp,4),%xmm7
+ .byte 102,15,58,33,60,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm7
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,250,32 // insertps $0x20,%xmm2,%xmm7
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,15,58,33,250,48 // insertps $0x30,%xmm2,%xmm7
+ .byte 102,65,15,254,203 // paddd %xmm11,%xmm1
+ .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
+ .byte 102,72,15,126,202 // movq %xmm1,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,12,168 // movss (%rax,%rbp,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,202,32 // insertps $0x20,%xmm2,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
+ .byte 102,68,15,111,92,36,160 // movdqa -0x60(%rsp),%xmm11
+ .byte 102,65,15,254,195 // paddd %xmm11,%xmm0
+ .byte 102,15,56,64,197 // pmulld %xmm5,%xmm0
+ .byte 102,15,111,208 // movdqa %xmm0,%xmm2
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
+ .byte 102,72,15,126,210 // movq %xmm2,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,28,168 // movss (%rax,%rbp,4),%xmm3
+ .byte 102,15,58,33,28,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm3
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,218,32 // insertps $0x20,%xmm2,%xmm3
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,15,58,33,218,48 // insertps $0x30,%xmm2,%xmm3
+ .byte 102,65,15,126,193 // movd %xmm0,%r9d
+ .byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
+ .byte 102,65,15,58,22,198,2 // pextrd $0x2,%xmm0,%r14d
+ .byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
+ .byte 102,15,254,5,174,33,0,0 // paddd 0x21ae(%rip),%xmm0 # 9120 <_sk_clut_4D_sse41+0x2882>
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,15,16,44,152 // movss (%rax,%rbx,4),%xmm5
+ .byte 102,15,58,33,44,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm5
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,232,32 // insertps $0x20,%xmm0,%xmm5
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
+ .byte 243,66,15,16,20,136 // movss (%rax,%r9,4),%xmm2
+ .byte 102,66,15,58,33,20,144,16 // insertps $0x10,(%rax,%r10,4),%xmm2
+ .byte 102,66,15,58,33,20,176,32 // insertps $0x20,(%rax,%r14,4),%xmm2
+ .byte 102,66,15,58,33,20,152,48 // insertps $0x30,(%rax,%r11,4),%xmm2
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 65,15,89,215 // mulps %xmm15,%xmm2
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,92,223 // subps %xmm7,%xmm3
+ .byte 65,15,89,223 // mulps %xmm15,%xmm3
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 65,15,89,239 // mulps %xmm15,%xmm5
+ .byte 15,88,233 // addps %xmm1,%xmm5
+ .byte 102,15,254,100,36,144 // paddd -0x70(%rsp),%xmm4
+ .byte 102,15,111,196 // movdqa %xmm4,%xmm0
+ .byte 102,65,15,254,197 // paddd %xmm13,%xmm0
+ .byte 102,68,15,111,45,0,33,0,0 // movdqa 0x2100(%rip),%xmm13 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,65,15,56,64,197 // pmulld %xmm13,%xmm0
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,111,53,254,32,0,0 // movdqa 0x20fe(%rip),%xmm6 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,15,254,206 // paddd %xmm6,%xmm1
+ .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
+ .byte 102,72,15,126,202 // movq %xmm1,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,12,168 // movss (%rax,%rbp,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,52,152 // movss (%rax,%rbx,4),%xmm6
+ .byte 102,15,58,33,206,32 // insertps $0x20,%xmm6,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,52,136 // movss (%rax,%rcx,4),%xmm6
+ .byte 102,15,58,33,206,48 // insertps $0x30,%xmm6,%xmm1
+ .byte 102,65,15,126,198 // movd %xmm0,%r14d
+ .byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
+ .byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
+ .byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
+ .byte 102,15,111,61,174,32,0,0 // movdqa 0x20ae(%rip),%xmm7 # 9120 <_sk_clut_4D_sse41+0x2882>
+ .byte 102,15,254,199 // paddd %xmm7,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,4,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm0
+ .byte 243,15,16,52,152 // movss (%rax,%rbx,4),%xmm6
+ .byte 102,15,58,33,198,32 // insertps $0x20,%xmm6,%xmm0
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,52,136 // movss (%rax,%rcx,4),%xmm6
+ .byte 102,15,58,33,198,48 // insertps $0x30,%xmm6,%xmm0
+ .byte 102,65,15,254,227 // paddd %xmm11,%xmm4
+ .byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,68,15,111,45,72,32,0,0 // movdqa 0x2048(%rip),%xmm13 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,65,15,254,245 // paddd %xmm13,%xmm6
+ .byte 102,72,15,58,22,241,1 // pextrq $0x1,%xmm6,%rcx
+ .byte 102,72,15,126,242 // movq %xmm6,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,68,15,16,28,152 // movss (%rax,%rbx,4),%xmm11
+ .byte 102,68,15,58,33,28,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm11
+ .byte 243,15,16,52,168 // movss (%rax,%rbp,4),%xmm6
+ .byte 102,68,15,58,33,222,32 // insertps $0x20,%xmm6,%xmm11
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,52,136 // movss (%rax,%rcx,4),%xmm6
+ .byte 102,68,15,58,33,222,48 // insertps $0x30,%xmm6,%xmm11
+ .byte 102,15,126,225 // movd %xmm4,%ecx
+ .byte 102,65,15,58,22,231,1 // pextrd $0x1,%xmm4,%r15d
+ .byte 102,65,15,58,22,228,2 // pextrd $0x2,%xmm4,%r12d
+ .byte 102,65,15,58,22,229,3 // pextrd $0x3,%xmm4,%r13d
+ .byte 102,15,254,231 // paddd %xmm7,%xmm4
+ .byte 102,72,15,58,22,226,1 // pextrq $0x1,%xmm4,%rdx
+ .byte 102,72,15,126,227 // movq %xmm4,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,15,16,60,168 // movss (%rax,%rbp,4),%xmm7
+ .byte 102,15,58,33,60,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm7
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,36,152 // movss (%rax,%rbx,4),%xmm4
+ .byte 102,15,58,33,252,32 // insertps $0x20,%xmm4,%xmm7
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,36,144 // movss (%rax,%rdx,4),%xmm4
+ .byte 102,15,58,33,252,48 // insertps $0x30,%xmm4,%xmm7
+ .byte 243,66,15,16,36,176 // movss (%rax,%r14,4),%xmm4
+ .byte 102,66,15,58,33,36,136,16 // insertps $0x10,(%rax,%r9,4),%xmm4
+ .byte 102,66,15,58,33,36,144,32 // insertps $0x20,(%rax,%r10,4),%xmm4
+ .byte 102,66,15,58,33,36,152,48 // insertps $0x30,(%rax,%r11,4),%xmm4
+ .byte 243,15,16,52,136 // movss (%rax,%rcx,4),%xmm6
+ .byte 102,66,15,58,33,52,184,16 // insertps $0x10,(%rax,%r15,4),%xmm6
+ .byte 102,66,15,58,33,52,160,32 // insertps $0x20,(%rax,%r12,4),%xmm6
+ .byte 102,66,15,58,33,52,168,48 // insertps $0x30,(%rax,%r13,4),%xmm6
+ .byte 15,92,244 // subps %xmm4,%xmm6
+ .byte 65,15,89,247 // mulps %xmm15,%xmm6
+ .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 68,15,92,217 // subps %xmm1,%xmm11
+ .byte 69,15,89,223 // mulps %xmm15,%xmm11
+ .byte 68,15,88,217 // addps %xmm1,%xmm11
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 65,15,89,255 // mulps %xmm15,%xmm7
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,40,68,36,128 // movaps -0x80(%rsp),%xmm0
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 68,15,92,219 // subps %xmm3,%xmm11
+ .byte 68,15,89,216 // mulps %xmm0,%xmm11
+ .byte 68,15,88,219 // addps %xmm3,%xmm11
+ .byte 15,92,253 // subps %xmm5,%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,88,253 // addps %xmm5,%xmm7
+ .byte 15,91,68,36,192 // cvtdq2ps -0x40(%rsp),%xmm0
+ .byte 15,40,76,36,224 // movaps -0x20(%rsp),%xmm1
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,41,76,36,224 // movaps %xmm1,-0x20(%rsp)
+ .byte 65,15,92,240 // subps %xmm8,%xmm6
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 65,15,88,240 // addps %xmm8,%xmm6
+ .byte 69,15,92,218 // subps %xmm10,%xmm11
+ .byte 68,15,89,217 // mulps %xmm1,%xmm11
+ .byte 69,15,88,218 // addps %xmm10,%xmm11
+ .byte 65,15,92,249 // subps %xmm9,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 65,15,88,249 // addps %xmm9,%xmm7
+ .byte 243,15,91,68,36,48 // cvttps2dq 0x30(%rsp),%xmm0
+ .byte 102,15,127,68,36,192 // movdqa %xmm0,-0x40(%rsp)
+ .byte 102,68,15,254,224 // paddd %xmm0,%xmm12
+ .byte 102,15,111,84,36,208 // movdqa -0x30(%rsp),%xmm2
+ .byte 102,65,15,254,212 // paddd %xmm12,%xmm2
+ .byte 102,68,15,111,76,36,176 // movdqa -0x50(%rsp),%xmm9
+ .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
+ .byte 102,15,254,194 // paddd %xmm2,%xmm0
+ .byte 102,15,111,29,184,30,0,0 // movdqa 0x1eb8(%rip),%xmm3 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,15,56,64,195 // pmulld %xmm3,%xmm0
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,69,15,111,213 // movdqa %xmm13,%xmm10
+ .byte 102,65,15,254,202 // paddd %xmm10,%xmm1
+ .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
+ .byte 102,72,15,126,202 // movq %xmm1,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,36,168 // movss (%rax,%rbp,4),%xmm4
+ .byte 102,15,58,33,36,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm4
+ .byte 243,15,16,12,152 // movss (%rax,%rbx,4),%xmm1
+ .byte 102,15,58,33,225,32 // insertps $0x20,%xmm1,%xmm4
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,12,136 // movss (%rax,%rcx,4),%xmm1
+ .byte 102,15,58,33,225,48 // insertps $0x30,%xmm1,%xmm4
+ .byte 102,65,15,126,198 // movd %xmm0,%r14d
+ .byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
+ .byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
+ .byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
+ .byte 102,15,111,45,105,30,0,0 // movdqa 0x1e69(%rip),%xmm5 # 9120 <_sk_clut_4D_sse41+0x2882>
+ .byte 102,15,254,197 // paddd %xmm5,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,4,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm0
+ .byte 243,15,16,12,152 // movss (%rax,%rbx,4),%xmm1
+ .byte 102,15,58,33,193,32 // insertps $0x20,%xmm1,%xmm0
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,12,136 // movss (%rax,%rcx,4),%xmm1
+ .byte 102,15,58,33,193,48 // insertps $0x30,%xmm1,%xmm0
+ .byte 102,68,15,111,68,36,160 // movdqa -0x60(%rsp),%xmm8
+ .byte 102,65,15,254,208 // paddd %xmm8,%xmm2
+ .byte 102,15,56,64,211 // pmulld %xmm3,%xmm2
+ .byte 102,68,15,111,235 // movdqa %xmm3,%xmm13
+ .byte 102,15,111,202 // movdqa %xmm2,%xmm1
+ .byte 102,65,15,254,202 // paddd %xmm10,%xmm1
+ .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
+ .byte 102,72,15,126,202 // movq %xmm1,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,15,16,12,152 // movss (%rax,%rbx,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,28,168 // movss (%rax,%rbp,4),%xmm3
+ .byte 102,15,58,33,203,32 // insertps $0x20,%xmm3,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,28,136 // movss (%rax,%rcx,4),%xmm3
+ .byte 102,15,58,33,203,48 // insertps $0x30,%xmm3,%xmm1
+ .byte 102,15,126,209 // movd %xmm2,%ecx
+ .byte 102,65,15,58,22,215,1 // pextrd $0x1,%xmm2,%r15d
+ .byte 102,65,15,58,22,212,2 // pextrd $0x2,%xmm2,%r12d
+ .byte 102,65,15,58,22,213,3 // pextrd $0x3,%xmm2,%r13d
+ .byte 102,15,254,213 // paddd %xmm5,%xmm2
+ .byte 102,72,15,58,22,210,1 // pextrq $0x1,%xmm2,%rdx
+ .byte 102,72,15,126,211 // movq %xmm2,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,15,16,20,168 // movss (%rax,%rbp,4),%xmm2
+ .byte 102,15,58,33,20,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm2
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,28,152 // movss (%rax,%rbx,4),%xmm3
+ .byte 102,15,58,33,211,32 // insertps $0x20,%xmm3,%xmm2
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,28,144 // movss (%rax,%rdx,4),%xmm3
+ .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
+ .byte 243,66,15,16,44,176 // movss (%rax,%r14,4),%xmm5
+ .byte 102,66,15,58,33,44,136,16 // insertps $0x10,(%rax,%r9,4),%xmm5
+ .byte 102,66,15,58,33,44,144,32 // insertps $0x20,(%rax,%r10,4),%xmm5
+ .byte 102,66,15,58,33,44,152,48 // insertps $0x30,(%rax,%r11,4),%xmm5
+ .byte 243,15,16,28,136 // movss (%rax,%rcx,4),%xmm3
+ .byte 102,66,15,58,33,28,184,16 // insertps $0x10,(%rax,%r15,4),%xmm3
+ .byte 102,66,15,58,33,28,160,32 // insertps $0x20,(%rax,%r12,4),%xmm3
+ .byte 102,66,15,58,33,28,168,48 // insertps $0x30,(%rax,%r13,4),%xmm3
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 65,15,89,223 // mulps %xmm15,%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 15,92,204 // subps %xmm4,%xmm1
+ .byte 65,15,89,207 // mulps %xmm15,%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,92,208 // subps %xmm0,%xmm2
+ .byte 65,15,89,215 // mulps %xmm15,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 102,68,15,254,100,36,144 // paddd -0x70(%rsp),%xmm12
+ .byte 102,65,15,111,228 // movdqa %xmm12,%xmm4
+ .byte 102,65,15,254,225 // paddd %xmm9,%xmm4
+ .byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4
+ .byte 102,15,111,196 // movdqa %xmm4,%xmm0
+ .byte 102,65,15,254,194 // paddd %xmm10,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,4,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm0
+ .byte 243,15,16,44,152 // movss (%rax,%rbx,4),%xmm5
+ .byte 102,15,58,33,197,32 // insertps $0x20,%xmm5,%xmm0
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,44,136 // movss (%rax,%rcx,4),%xmm5
+ .byte 102,15,58,33,197,48 // insertps $0x30,%xmm5,%xmm0
+ .byte 102,65,15,126,230 // movd %xmm4,%r14d
+ .byte 102,65,15,58,22,225,1 // pextrd $0x1,%xmm4,%r9d
+ .byte 102,65,15,58,22,226,2 // pextrd $0x2,%xmm4,%r10d
+ .byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d
+ .byte 102,68,15,111,13,165,28,0,0 // movdqa 0x1ca5(%rip),%xmm9 # 9120 <_sk_clut_4D_sse41+0x2882>
+ .byte 102,65,15,254,225 // paddd %xmm9,%xmm4
+ .byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
+ .byte 102,72,15,126,226 // movq %xmm4,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,44,168 // movss (%rax,%rbp,4),%xmm5
+ .byte 102,15,58,33,44,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm5
+ .byte 243,15,16,36,152 // movss (%rax,%rbx,4),%xmm4
+ .byte 102,15,58,33,236,32 // insertps $0x20,%xmm4,%xmm5
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,36,136 // movss (%rax,%rcx,4),%xmm4
+ .byte 102,15,58,33,236,48 // insertps $0x30,%xmm4,%xmm5
+ .byte 102,69,15,254,224 // paddd %xmm8,%xmm12
+ .byte 102,69,15,56,64,229 // pmulld %xmm13,%xmm12
+ .byte 102,65,15,111,228 // movdqa %xmm12,%xmm4
+ .byte 102,65,15,254,226 // paddd %xmm10,%xmm4
+ .byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
+ .byte 102,72,15,126,226 // movq %xmm4,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,68,15,16,20,152 // movss (%rax,%rbx,4),%xmm10
+ .byte 102,68,15,58,33,20,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm10
+ .byte 243,15,16,36,168 // movss (%rax,%rbp,4),%xmm4
+ .byte 102,68,15,58,33,212,32 // insertps $0x20,%xmm4,%xmm10
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,36,136 // movss (%rax,%rcx,4),%xmm4
+ .byte 102,68,15,58,33,212,48 // insertps $0x30,%xmm4,%xmm10
+ .byte 102,68,15,126,225 // movd %xmm12,%ecx
+ .byte 102,69,15,58,22,231,1 // pextrd $0x1,%xmm12,%r15d
+ .byte 102,69,15,58,22,228,2 // pextrd $0x2,%xmm12,%r12d
+ .byte 102,69,15,58,22,229,3 // pextrd $0x3,%xmm12,%r13d
+ .byte 102,69,15,254,225 // paddd %xmm9,%xmm12
+ .byte 102,76,15,58,22,226,1 // pextrq $0x1,%xmm12,%rdx
+ .byte 102,76,15,126,227 // movq %xmm12,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,68,15,16,4,168 // movss (%rax,%rbp,4),%xmm8
+ .byte 102,68,15,58,33,4,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm8
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,36,152 // movss (%rax,%rbx,4),%xmm4
+ .byte 102,68,15,58,33,196,32 // insertps $0x20,%xmm4,%xmm8
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,36,144 // movss (%rax,%rdx,4),%xmm4
+ .byte 102,68,15,58,33,196,48 // insertps $0x30,%xmm4,%xmm8
+ .byte 243,70,15,16,36,176 // movss (%rax,%r14,4),%xmm12
+ .byte 102,70,15,58,33,36,136,16 // insertps $0x10,(%rax,%r9,4),%xmm12
+ .byte 102,70,15,58,33,36,144,32 // insertps $0x20,(%rax,%r10,4),%xmm12
+ .byte 102,70,15,58,33,36,152,48 // insertps $0x30,(%rax,%r11,4),%xmm12
+ .byte 243,15,16,36,136 // movss (%rax,%rcx,4),%xmm4
+ .byte 102,66,15,58,33,36,184,16 // insertps $0x10,(%rax,%r15,4),%xmm4
+ .byte 102,66,15,58,33,36,160,32 // insertps $0x20,(%rax,%r12,4),%xmm4
+ .byte 102,66,15,58,33,36,168,48 // insertps $0x30,(%rax,%r13,4),%xmm4
+ .byte 65,15,92,228 // subps %xmm12,%xmm4
+ .byte 65,15,89,231 // mulps %xmm15,%xmm4
+ .byte 65,15,88,228 // addps %xmm12,%xmm4
+ .byte 68,15,92,208 // subps %xmm0,%xmm10
+ .byte 69,15,89,215 // mulps %xmm15,%xmm10
+ .byte 68,15,88,208 // addps %xmm0,%xmm10
+ .byte 68,15,92,197 // subps %xmm5,%xmm8
+ .byte 69,15,89,199 // mulps %xmm15,%xmm8
+ .byte 68,15,88,197 // addps %xmm5,%xmm8
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,40,68,36,128 // movaps -0x80(%rsp),%xmm0
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,88,227 // addps %xmm3,%xmm4
+ .byte 68,15,92,209 // subps %xmm1,%xmm10
+ .byte 68,15,89,208 // mulps %xmm0,%xmm10
+ .byte 68,15,88,209 // addps %xmm1,%xmm10
+ .byte 68,15,92,194 // subps %xmm2,%xmm8
+ .byte 68,15,89,192 // mulps %xmm0,%xmm8
+ .byte 68,15,88,194 // addps %xmm2,%xmm8
+ .byte 102,68,15,254,116,36,192 // paddd -0x40(%rsp),%xmm14
+ .byte 102,15,111,68,36,208 // movdqa -0x30(%rsp),%xmm0
+ .byte 102,65,15,254,198 // paddd %xmm14,%xmm0
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,111,232 // movdqa %xmm0,%xmm5
+ .byte 102,15,254,76,36,176 // paddd -0x50(%rsp),%xmm1
+ .byte 102,65,15,56,64,205 // pmulld %xmm13,%xmm1
+ .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,68,15,111,37,238,26,0,0 // movdqa 0x1aee(%rip),%xmm12 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,65,15,254,196 // paddd %xmm12,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,4,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm0
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
+ .byte 102,65,15,126,206 // movd %xmm1,%r14d
+ .byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d
+ .byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d
+ .byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d
+ .byte 102,15,111,29,157,26,0,0 // movdqa 0x1a9d(%rip),%xmm3 # 9120 <_sk_clut_4D_sse41+0x2882>
+ .byte 102,15,254,203 // paddd %xmm3,%xmm1
+ .byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
+ .byte 102,72,15,126,202 // movq %xmm1,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,12,168 // movss (%rax,%rbp,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,15,58,33,202,32 // insertps $0x20,%xmm2,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
+ .byte 102,15,254,108,36,160 // paddd -0x60(%rsp),%xmm5
+ .byte 102,65,15,56,64,237 // pmulld %xmm13,%xmm5
+ .byte 102,15,111,213 // movdqa %xmm5,%xmm2
+ .byte 102,65,15,254,212 // paddd %xmm12,%xmm2
+ .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
+ .byte 102,72,15,126,210 // movq %xmm2,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,68,15,16,12,152 // movss (%rax,%rbx,4),%xmm9
+ .byte 102,68,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm9
+ .byte 243,15,16,20,168 // movss (%rax,%rbp,4),%xmm2
+ .byte 102,68,15,58,33,202,32 // insertps $0x20,%xmm2,%xmm9
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,20,136 // movss (%rax,%rcx,4),%xmm2
+ .byte 102,68,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm9
+ .byte 102,15,111,213 // movdqa %xmm5,%xmm2
+ .byte 102,15,126,209 // movd %xmm2,%ecx
+ .byte 102,65,15,58,22,215,1 // pextrd $0x1,%xmm2,%r15d
+ .byte 102,65,15,58,22,212,2 // pextrd $0x2,%xmm2,%r12d
+ .byte 102,65,15,58,22,213,3 // pextrd $0x3,%xmm2,%r13d
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,15,111,235 // movdqa %xmm3,%xmm5
+ .byte 102,72,15,58,22,210,1 // pextrq $0x1,%xmm2,%rdx
+ .byte 102,72,15,126,211 // movq %xmm2,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,68,15,16,36,168 // movss (%rax,%rbp,4),%xmm12
+ .byte 102,68,15,58,33,36,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm12
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
+ .byte 102,68,15,58,33,226,32 // insertps $0x20,%xmm2,%xmm12
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,20,144 // movss (%rax,%rdx,4),%xmm2
+ .byte 102,68,15,58,33,226,48 // insertps $0x30,%xmm2,%xmm12
+ .byte 243,66,15,16,20,176 // movss (%rax,%r14,4),%xmm2
+ .byte 102,66,15,58,33,20,136,16 // insertps $0x10,(%rax,%r9,4),%xmm2
+ .byte 102,66,15,58,33,20,144,32 // insertps $0x20,(%rax,%r10,4),%xmm2
+ .byte 102,66,15,58,33,20,152,48 // insertps $0x30,(%rax,%r11,4),%xmm2
+ .byte 243,68,15,16,44,136 // movss (%rax,%rcx,4),%xmm13
+ .byte 102,70,15,58,33,44,184,16 // insertps $0x10,(%rax,%r15,4),%xmm13
+ .byte 102,70,15,58,33,44,160,32 // insertps $0x20,(%rax,%r12,4),%xmm13
+ .byte 102,70,15,58,33,44,168,48 // insertps $0x30,(%rax,%r13,4),%xmm13
+ .byte 68,15,92,234 // subps %xmm2,%xmm13
+ .byte 69,15,89,239 // mulps %xmm15,%xmm13
+ .byte 68,15,88,234 // addps %xmm2,%xmm13
+ .byte 68,15,92,200 // subps %xmm0,%xmm9
+ .byte 69,15,89,207 // mulps %xmm15,%xmm9
+ .byte 68,15,88,200 // addps %xmm0,%xmm9
+ .byte 68,15,92,225 // subps %xmm1,%xmm12
+ .byte 69,15,89,231 // mulps %xmm15,%xmm12
+ .byte 68,15,88,225 // addps %xmm1,%xmm12
+ .byte 102,68,15,254,116,36,144 // paddd -0x70(%rsp),%xmm14
+ .byte 102,15,111,68,36,176 // movdqa -0x50(%rsp),%xmm0
+ .byte 102,65,15,254,198 // paddd %xmm14,%xmm0
+ .byte 102,15,56,64,5,14,25,0,0 // pmulld 0x190e(%rip),%xmm0 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,254,5,18,25,0,0 // paddd 0x1912(%rip),%xmm0 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,28,168 // movss (%rax,%rbp,4),%xmm3
+ .byte 102,15,58,33,28,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm3
+ .byte 243,15,16,4,152 // movss (%rax,%rbx,4),%xmm0
+ .byte 102,15,58,33,216,32 // insertps $0x20,%xmm0,%xmm3
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,15,58,33,216,48 // insertps $0x30,%xmm0,%xmm3
+ .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,65,15,126,198 // movd %xmm0,%r14d
+ .byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
+ .byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
+ .byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
+ .byte 102,15,111,213 // movdqa %xmm5,%xmm2
+ .byte 102,15,254,194 // paddd %xmm2,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,213 // mov %edx,%ebp
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,203 // mov %ecx,%ebx
+ .byte 243,15,16,44,168 // movss (%rax,%rbp,4),%xmm5
+ .byte 102,15,58,33,44,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm5
+ .byte 243,15,16,4,152 // movss (%rax,%rbx,4),%xmm0
+ .byte 102,15,58,33,232,32 // insertps $0x20,%xmm0,%xmm5
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
+ .byte 102,68,15,254,116,36,160 // paddd -0x60(%rsp),%xmm14
+ .byte 102,68,15,56,64,53,87,24,0,0 // pmulld 0x1857(%rip),%xmm14 # 9100 <_sk_clut_4D_sse41+0x2862>
+ .byte 102,15,111,5,95,24,0,0 // movdqa 0x185f(%rip),%xmm0 # 9110 <_sk_clut_4D_sse41+0x2872>
+ .byte 102,65,15,254,198 // paddd %xmm14,%xmm0
+ .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
+ .byte 102,72,15,126,194 // movq %xmm0,%rdx
+ .byte 137,211 // mov %edx,%ebx
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 137,205 // mov %ecx,%ebp
+ .byte 243,15,16,12,152 // movss (%rax,%rbx,4),%xmm1
+ .byte 102,15,58,33,12,144,16 // insertps $0x10,(%rax,%rdx,4),%xmm1
+ .byte 243,15,16,4,168 // movss (%rax,%rbp,4),%xmm0
+ .byte 102,15,58,33,200,32 // insertps $0x20,%xmm0,%xmm1
+ .byte 72,193,233,32 // shr $0x20,%rcx
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,15,58,33,200,48 // insertps $0x30,%xmm0,%xmm1
+ .byte 102,68,15,126,241 // movd %xmm14,%ecx
+ .byte 102,69,15,58,22,247,1 // pextrd $0x1,%xmm14,%r15d
+ .byte 102,69,15,58,22,244,2 // pextrd $0x2,%xmm14,%r12d
+ .byte 102,69,15,58,22,245,3 // pextrd $0x3,%xmm14,%r13d
+ .byte 102,68,15,254,242 // paddd %xmm2,%xmm14
+ .byte 102,76,15,58,22,242,1 // pextrq $0x1,%xmm14,%rdx
+ .byte 102,76,15,126,243 // movq %xmm14,%rbx
+ .byte 137,221 // mov %ebx,%ebp
+ .byte 72,193,235,32 // shr $0x20,%rbx
+ .byte 243,15,16,20,168 // movss (%rax,%rbp,4),%xmm2
+ .byte 102,15,58,33,20,152,16 // insertps $0x10,(%rax,%rbx,4),%xmm2
+ .byte 137,211 // mov %edx,%ebx
+ .byte 243,15,16,4,152 // movss (%rax,%rbx,4),%xmm0
+ .byte 102,15,58,33,208,32 // insertps $0x20,%xmm0,%xmm2
+ .byte 72,193,234,32 // shr $0x20,%rdx
+ .byte 243,15,16,4,144 // movss (%rax,%rdx,4),%xmm0
+ .byte 102,15,58,33,208,48 // insertps $0x30,%xmm0,%xmm2
+ .byte 243,70,15,16,52,176 // movss (%rax,%r14,4),%xmm14
+ .byte 102,70,15,58,33,52,136,16 // insertps $0x10,(%rax,%r9,4),%xmm14
+ .byte 102,70,15,58,33,52,144,32 // insertps $0x20,(%rax,%r10,4),%xmm14
+ .byte 102,70,15,58,33,52,152,48 // insertps $0x30,(%rax,%r11,4),%xmm14
+ .byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
+ .byte 102,66,15,58,33,4,184,16 // insertps $0x10,(%rax,%r15,4),%xmm0
+ .byte 102,66,15,58,33,4,160,32 // insertps $0x20,(%rax,%r12,4),%xmm0
+ .byte 102,66,15,58,33,4,168,48 // insertps $0x30,(%rax,%r13,4),%xmm0
+ .byte 65,15,92,198 // subps %xmm14,%xmm0
+ .byte 65,15,89,199 // mulps %xmm15,%xmm0
+ .byte 65,15,88,198 // addps %xmm14,%xmm0
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 65,15,89,207 // mulps %xmm15,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,92,213 // subps %xmm5,%xmm2
+ .byte 65,15,89,215 // mulps %xmm15,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 65,15,92,197 // subps %xmm13,%xmm0
+ .byte 15,40,92,36,128 // movaps -0x80(%rsp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 65,15,88,197 // addps %xmm13,%xmm0
+ .byte 65,15,92,201 // subps %xmm9,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 65,15,88,201 // addps %xmm9,%xmm1
+ .byte 65,15,92,212 // subps %xmm12,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 65,15,88,212 // addps %xmm12,%xmm2
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,40,92,36,224 // movaps -0x20(%rsp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 65,15,92,202 // subps %xmm10,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 65,15,88,202 // addps %xmm10,%xmm1
+ .byte 65,15,92,208 // subps %xmm8,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 65,15,88,208 // addps %xmm8,%xmm2
+ .byte 15,91,28,36 // cvtdq2ps (%rsp),%xmm3
+ .byte 15,40,100,36,64 // movaps 0x40(%rsp),%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,215 // addps %xmm7,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,29,16,23,0,0 // movaps 0x1710(%rip),%xmm3 # 9130 <_sk_clut_4D_sse41+0x2892>
+ .byte 76,137,194 // mov %r8,%rdx
+ .byte 72,139,76,36,240 // mov -0x10(%rsp),%rcx
+ .byte 76,139,68,36,248 // mov -0x8(%rsp),%r8
+ .byte 15,40,100,36,80 // movaps 0x50(%rsp),%xmm4
+ .byte 15,40,108,36,96 // movaps 0x60(%rsp),%xmm5
+ .byte 15,40,116,36,112 // movaps 0x70(%rsp),%xmm6
+ .byte 15,40,188,36,128,0,0,0 // movaps 0x80(%rsp),%xmm7
+ .byte 72,129,196,152,0,0,0 // add $0x98,%rsp
+ .byte 91 // pop %rbx
+ .byte 65,92 // pop %r12
+ .byte 65,93 // pop %r13
+ .byte 65,94 // pop %r14
+ .byte 65,95 // pop %r15
+ .byte 93 // pop %rbp
+ .byte 255,224 // jmpq *%rax
+
BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
@@ -34980,9 +42643,9 @@ BALIGN16
.byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 619c <.literal16+0x1fc>
+ .byte 224,64 // loopne 7c5c <.literal16+0x1fc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 61a0 <.literal16+0x200>
+ .byte 224,64 // loopne 7c60 <.literal16+0x200>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -35002,13 +42665,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 61c1 <.literal16+0x221>
+ .byte 71,225,61 // rex.RXB loope 7c81 <.literal16+0x221>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 61c5 <.literal16+0x225>
+ .byte 71,225,61 // rex.RXB loope 7c85 <.literal16+0x225>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 61c9 <.literal16+0x229>
+ .byte 71,225,61 // rex.RXB loope 7c89 <.literal16+0x229>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 61cd <.literal16+0x22d>
+ .byte 71,225,61 // rex.RXB loope 7c8d <.literal16+0x22d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35033,13 +42696,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6201 <.literal16+0x261>
+ .byte 71,225,61 // rex.RXB loope 7cc1 <.literal16+0x261>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6205 <.literal16+0x265>
+ .byte 71,225,61 // rex.RXB loope 7cc5 <.literal16+0x265>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6209 <.literal16+0x269>
+ .byte 71,225,61 // rex.RXB loope 7cc9 <.literal16+0x269>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 620d <.literal16+0x26d>
+ .byte 71,225,61 // rex.RXB loope 7ccd <.literal16+0x26d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35064,13 +42727,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6241 <.literal16+0x2a1>
+ .byte 71,225,61 // rex.RXB loope 7d01 <.literal16+0x2a1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6245 <.literal16+0x2a5>
+ .byte 71,225,61 // rex.RXB loope 7d05 <.literal16+0x2a5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6249 <.literal16+0x2a9>
+ .byte 71,225,61 // rex.RXB loope 7d09 <.literal16+0x2a9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 624d <.literal16+0x2ad>
+ .byte 71,225,61 // rex.RXB loope 7d0d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35095,13 +42758,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6281 <.literal16+0x2e1>
+ .byte 71,225,61 // rex.RXB loope 7d41 <.literal16+0x2e1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6285 <.literal16+0x2e5>
+ .byte 71,225,61 // rex.RXB loope 7d45 <.literal16+0x2e5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6289 <.literal16+0x2e9>
+ .byte 71,225,61 // rex.RXB loope 7d49 <.literal16+0x2e9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 628d <.literal16+0x2ed>
+ .byte 71,225,61 // rex.RXB loope 7d4d <.literal16+0x2ed>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35118,10 +42781,10 @@ BALIGN16
.byte 0,1 // add %al,(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006278 <_sk_callback_sse41+0xa0003cc>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a007d38 <_sk_clut_4D_sse41+0xa00149a>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006280 <_sk_callback_sse41+0x30003d4>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3007d40 <_sk_clut_4D_sse41+0x30014a2>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35140,11 +42803,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 62eb <.literal16+0x34b>
+ .byte 127,67 // jg 7dab <.literal16+0x34b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 62ef <.literal16+0x34f>
+ .byte 127,67 // jg 7daf <.literal16+0x34f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 62f3 <.literal16+0x353>
+ .byte 127,67 // jg 7db3 <.literal16+0x353>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35431,13 +43094,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6539 <.literal16+0x599>
+ .byte 224,7 // loopne 7ff9 <.literal16+0x599>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 653d <.literal16+0x59d>
+ .byte 224,7 // loopne 7ffd <.literal16+0x59d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6541 <.literal16+0x5a1>
+ .byte 224,7 // loopne 8001 <.literal16+0x5a1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6545 <.literal16+0x5a5>
+ .byte 224,7 // loopne 8005 <.literal16+0x5a5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35471,10 +43134,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006588 <_sk_callback_sse41+0xa0006dc>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a008048 <_sk_clut_4D_sse41+0xa0017aa>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006590 <_sk_callback_sse41+0x30006e4>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3008050 <_sk_clut_4D_sse41+0x30017b2>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35529,11 +43192,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 665b <.literal16+0x6bb>
+ .byte 127,67 // jg 811b <.literal16+0x6bb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 665f <.literal16+0x6bf>
+ .byte 127,67 // jg 811f <.literal16+0x6bf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6663 <.literal16+0x6c3>
+ .byte 127,67 // jg 8123 <.literal16+0x6c3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -35548,16 +43211,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6654 <.literal16+0x6b4>
+ .byte 127,0 // jg 8114 <.literal16+0x6b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6658 <.literal16+0x6b8>
+ .byte 127,0 // jg 8118 <.literal16+0x6b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 665c <.literal16+0x6bc>
+ .byte 127,0 // jg 811c <.literal16+0x6bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6660 <.literal16+0x6c0>
+ .byte 127,0 // jg 8120 <.literal16+0x6c0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35566,7 +43229,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 66e5 <.literal16+0x745>
+ .byte 119,115 // ja 81a5 <.literal16+0x745>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35577,7 +43240,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6649 <.literal16+0x6a9>
+ .byte 117,191 // jne 8109 <.literal16+0x6a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35589,7 +43252,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a68a <_sk_callback_sse41+0xffffffffe9a347de>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3c14a <_sk_clut_4D_sse41+0xffffffffe9a358ac>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35644,16 +43307,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6724 <.literal16+0x784>
+ .byte 127,0 // jg 81e4 <.literal16+0x784>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6728 <.literal16+0x788>
+ .byte 127,0 // jg 81e8 <.literal16+0x788>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 672c <.literal16+0x78c>
+ .byte 127,0 // jg 81ec <.literal16+0x78c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6730 <.literal16+0x790>
+ .byte 127,0 // jg 81f0 <.literal16+0x790>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35662,7 +43325,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 67b5 <.literal16+0x815>
+ .byte 119,115 // ja 8275 <.literal16+0x815>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35673,7 +43336,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6719 <.literal16+0x779>
+ .byte 117,191 // jne 81d9 <.literal16+0x779>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35685,7 +43348,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a75a <_sk_callback_sse41+0xffffffffe9a348ae>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3c21a <_sk_clut_4D_sse41+0xffffffffe9a3597c>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35740,16 +43403,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 67f4 <.literal16+0x854>
+ .byte 127,0 // jg 82b4 <.literal16+0x854>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 67f8 <.literal16+0x858>
+ .byte 127,0 // jg 82b8 <.literal16+0x858>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 67fc <.literal16+0x85c>
+ .byte 127,0 // jg 82bc <.literal16+0x85c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6800 <.literal16+0x860>
+ .byte 127,0 // jg 82c0 <.literal16+0x860>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35758,7 +43421,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6885 <.literal16+0x8e5>
+ .byte 119,115 // ja 8345 <.literal16+0x8e5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35769,7 +43432,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 67e9 <.literal16+0x849>
+ .byte 117,191 // jne 82a9 <.literal16+0x849>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35781,7 +43444,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a82a <_sk_callback_sse41+0xffffffffe9a3497e>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3c2ea <_sk_clut_4D_sse41+0xffffffffe9a35a4c>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35836,16 +43499,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 68c4 <.literal16+0x924>
+ .byte 127,0 // jg 8384 <.literal16+0x924>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 68c8 <.literal16+0x928>
+ .byte 127,0 // jg 8388 <.literal16+0x928>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 68cc <.literal16+0x92c>
+ .byte 127,0 // jg 838c <.literal16+0x92c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 68d0 <.literal16+0x930>
+ .byte 127,0 // jg 8390 <.literal16+0x930>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35854,7 +43517,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6955 <.literal16+0x9b5>
+ .byte 119,115 // ja 8415 <.literal16+0x9b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35865,7 +43528,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 68b9 <.literal16+0x919>
+ .byte 117,191 // jne 8379 <.literal16+0x919>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35877,7 +43540,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a8fa <_sk_callback_sse41+0xffffffffe9a34a4e>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3c3ba <_sk_clut_4D_sse41+0xffffffffe9a35b1c>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35932,16 +43595,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6994 <.literal16+0x9f4>
+ .byte 127,0 // jg 8454 <.literal16+0x9f4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6998 <.literal16+0x9f8>
+ .byte 127,0 // jg 8458 <.literal16+0x9f8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 699c <.literal16+0x9fc>
+ .byte 127,0 // jg 845c <.literal16+0x9fc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 69a0 <.literal16+0xa00>
+ .byte 127,0 // jg 8460 <.literal16+0xa00>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35950,7 +43613,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6a25 <.literal16+0xa85>
+ .byte 119,115 // ja 84e5 <.literal16+0xa85>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35961,7 +43624,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6989 <.literal16+0x9e9>
+ .byte 117,191 // jne 8449 <.literal16+0x9e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35973,7 +43636,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a9ca <_sk_callback_sse41+0xffffffffe9a34b1e>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3c48a <_sk_clut_4D_sse41+0xffffffffe9a35bec>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -36018,13 +43681,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 6a97 <.literal16+0xaf7>
+ .byte 127,67 // jg 8557 <.literal16+0xaf7>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6a9b <.literal16+0xafb>
+ .byte 127,67 // jg 855b <.literal16+0xafb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6a9f <.literal16+0xaff>
+ .byte 127,67 // jg 855f <.literal16+0xaff>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6aa3 <.literal16+0xb03>
+ .byte 127,67 // jg 8563 <.literal16+0xb03>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -36071,16 +43734,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6b23 <.literal16+0xb83>
+ .byte 118,63 // jbe 85e3 <.literal16+0xb83>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6b27 <.literal16+0xb87>
+ .byte 118,63 // jbe 85e7 <.literal16+0xb87>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6b2b <.literal16+0xb8b>
+ .byte 118,63 // jbe 85eb <.literal16+0xb8b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6b2f <.literal16+0xb8f>
+ .byte 118,63 // jbe 85ef <.literal16+0xb8f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -36109,11 +43772,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6b9b <.literal16+0xbfb>
+ .byte 127,67 // jg 865b <.literal16+0xbfb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6b9f <.literal16+0xbff>
+ .byte 127,67 // jg 865f <.literal16+0xbff>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6ba3 <.literal16+0xc03>
+ .byte 127,67 // jg 8663 <.literal16+0xc03>
.byte 0,4,0 // add %al,(%rax,%rax,1)
.byte 0,0 // add %al,(%rax)
.byte 0,0 // add %al,(%rax)
@@ -36173,13 +43836,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6c19 <.literal16+0xc79>
+ .byte 224,7 // loopne 86d9 <.literal16+0xc79>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6c1d <.literal16+0xc7d>
+ .byte 224,7 // loopne 86dd <.literal16+0xc7d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6c21 <.literal16+0xc81>
+ .byte 224,7 // loopne 86e1 <.literal16+0xc81>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6c25 <.literal16+0xc85>
+ .byte 224,7 // loopne 86e5 <.literal16+0xc85>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -36225,13 +43888,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6c89 <.literal16+0xce9>
+ .byte 224,7 // loopne 8749 <.literal16+0xce9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6c8d <.literal16+0xced>
+ .byte 224,7 // loopne 874d <.literal16+0xced>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6c91 <.literal16+0xcf1>
+ .byte 224,7 // loopne 8751 <.literal16+0xcf1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6c95 <.literal16+0xcf5>
+ .byte 224,7 // loopne 8755 <.literal16+0xcf5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -36277,13 +43940,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6cf9 <.literal16+0xd59>
+ .byte 224,7 // loopne 87b9 <.literal16+0xd59>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6cfd <.literal16+0xd5d>
+ .byte 224,7 // loopne 87bd <.literal16+0xd5d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6d01 <.literal16+0xd61>
+ .byte 224,7 // loopne 87c1 <.literal16+0xd61>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6d05 <.literal16+0xd65>
+ .byte 224,7 // loopne 87c5 <.literal16+0xd65>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -36321,13 +43984,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 6d96 <.literal16+0xdf6>
+ .byte 124,66 // jl 8856 <.literal16+0xdf6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6d9a <.literal16+0xdfa>
+ .byte 124,66 // jl 885a <.literal16+0xdfa>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6d9e <.literal16+0xdfe>
+ .byte 124,66 // jl 885e <.literal16+0xdfe>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6da2 <.literal16+0xe02>
+ .byte 124,66 // jl 8862 <.literal16+0xe02>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -36461,13 +44124,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6f25 <.literal16+0xf85>
+ .byte 112,65 // jo 89e5 <.literal16+0xf85>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6f29 <.literal16+0xf89>
+ .byte 112,65 // jo 89e9 <.literal16+0xf89>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6f2d <.literal16+0xf8d>
+ .byte 112,65 // jo 89ed <.literal16+0xf8d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6f31 <.literal16+0xf91>
+ .byte 112,65 // jo 89f1 <.literal16+0xf91>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -36482,7 +44145,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006f20 <_sk_callback_sse41+0x3001074>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30089e0 <_sk_clut_4D_sse41+0x3002142>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -36509,7 +44172,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006f60 <_sk_callback_sse41+0x30010b4>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3008a20 <_sk_clut_4D_sse41+0x3002182>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -36536,7 +44199,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006fa0 <_sk_callback_sse41+0x30010f4>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3008a60 <_sk_clut_4D_sse41+0x30021c2>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -36551,11 +44214,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6ffb <.literal16+0x105b>
+ .byte 127,67 // jg 8abb <.literal16+0x105b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6fff <.literal16+0x105f>
+ .byte 127,67 // jg 8abf <.literal16+0x105f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 7003 <.literal16+0x1063>
+ .byte 127,67 // jg 8ac3 <.literal16+0x1063>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -36570,7 +44233,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ff0 <_sk_callback_sse41+0x3001144>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3008ab0 <_sk_clut_4D_sse41+0x3002212>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -36597,7 +44260,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3007030 <_sk_callback_sse41+0x3001184>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3008af0 <_sk_clut_4D_sse41+0x3002252>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -36624,7 +44287,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3007070 <_sk_callback_sse41+0x30011c4>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3008b30 <_sk_clut_4D_sse41+0x3002292>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -36639,11 +44302,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 70cb <.literal16+0x112b>
+ .byte 127,67 // jg 8b8b <.literal16+0x112b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 70cf <.literal16+0x112f>
+ .byte 127,67 // jg 8b8f <.literal16+0x112f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 70d3 <.literal16+0x1133>
+ .byte 127,67 // jg 8b93 <.literal16+0x1133>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -36738,13 +44401,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 71cb <.literal16+0x122b>
+ .byte 127,71 // jg 8c8b <.literal16+0x122b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 71cf <.literal16+0x122f>
+ .byte 127,71 // jg 8c8f <.literal16+0x122f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 71d3 <.literal16+0x1233>
+ .byte 127,71 // jg 8c93 <.literal16+0x1233>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 71d7 <.literal16+0x1237>
+ .byte 127,71 // jg 8c97 <.literal16+0x1237>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -36790,10 +44453,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0830a <_sk_callback_sse41+0x2dc0245e>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc09dca <_sk_clut_4D_sse41+0x2dc0352c>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 723c <.literal16+0x129c>
+ .byte 120,57 // js 8cfc <.literal16+0x129c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -36974,11 +44637,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7412 <.literal16+0x1472>
+ .byte 62,114,28 // jb,pt 8ed2 <.literal16+0x1472>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7416 <.literal16+0x1476>
+ .byte 62,114,28 // jb,pt 8ed6 <.literal16+0x1476>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 741a <.literal16+0x147a>
+ .byte 62,114,28 // jb,pt 8eda <.literal16+0x147a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37022,7 +44685,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6402a5 <_sk_callback_sse41+0x3d63a3f9>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d641d65 <_sk_clut_4D_sse41+0x3d63b4c7>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -37048,7 +44711,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6402e5 <_sk_callback_sse41+0x3d63a439>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d641da5 <_sk_clut_4D_sse41+0x3d63b507>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -37057,13 +44720,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 74de <.literal16+0x153e>
+ .byte 114,28 // jb 8f9e <.literal16+0x153e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 74e2 <.literal16+0x1542>
+ .byte 62,114,28 // jb,pt 8fa2 <.literal16+0x1542>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 74e6 <.literal16+0x1546>
+ .byte 62,114,28 // jb,pt 8fa6 <.literal16+0x1546>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 74ea <.literal16+0x154a>
+ .byte 62,114,28 // jb,pt 8faa <.literal16+0x154a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37084,11 +44747,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7522 <.literal16+0x1582>
+ .byte 62,114,28 // jb,pt 8fe2 <.literal16+0x1582>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7526 <.literal16+0x1586>
+ .byte 62,114,28 // jb,pt 8fe6 <.literal16+0x1586>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 752a <.literal16+0x158a>
+ .byte 62,114,28 // jb,pt 8fea <.literal16+0x158a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37132,7 +44795,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6403b5 <_sk_callback_sse41+0x3d63a509>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d641e75 <_sk_clut_4D_sse41+0x3d63b5d7>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -37158,7 +44821,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6403f5 <_sk_callback_sse41+0x3d63a549>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d641eb5 <_sk_clut_4D_sse41+0x3d63b617>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -37167,13 +44830,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 75ee <.literal16+0x164e>
+ .byte 114,28 // jb 90ae <.literal16+0x164e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 75f2 <_sk_callback_sse41+0x1746>
+ .byte 62,114,28 // jb,pt 90b2 <.literal16+0x1652>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 75f6 <_sk_callback_sse41+0x174a>
+ .byte 62,114,28 // jb,pt 90b6 <.literal16+0x1656>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 75fa <_sk_callback_sse41+0x174e>
+ .byte 62,114,28 // jb,pt 90ba <.literal16+0x165a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37183,6 +44846,77 @@ BALIGN16
.byte 170 // stos %al,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
.byte 190,171,170,170,190 // mov $0xbeaaaaab,%esi
+ .byte 114,249 // jb 90ab <.literal16+0x164b>
+ .byte 127,63 // jg 90f3 <.literal16+0x1693>
+ .byte 114,249 // jb 90af <.literal16+0x164f>
+ .byte 127,63 // jg 90f7 <.literal16+0x1697>
+ .byte 114,249 // jb 90b3 <.literal16+0x1653>
+ .byte 127,63 // jg 90fb <.literal16+0x169b>
+ .byte 114,249 // jb 90b7 <.literal16+0x1657>
+ .byte 127,63 // jg 90ff <.literal16+0x169f>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 114,249 // jb 90eb <.literal16+0x168b>
+ .byte 127,63 // jg 9133 <.literal16+0x16d3>
+ .byte 114,249 // jb 90ef <.literal16+0x168f>
+ .byte 127,63 // jg 9137 <.literal16+0x16d7>
+ .byte 114,249 // jb 90f3 <.literal16+0x1693>
+ .byte 127,63 // jg 913b <.literal16+0x16db>
+ .byte 114,249 // jb 90f7 <.literal16+0x1697>
+ .byte 127,63 // jg 913f <.literal16+0x16df>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,0 // cmpb $0x0,(%rdi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
+ .byte 63 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128 // .byte 0x80
+ .byte 63 // (bad)
BALIGN4
.byte 0,0 // add %al,(%rax)
@@ -37270,7 +45004,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,236,99,0,0 // movaps 0x63ec(%rip),%xmm2 # 64b0 <_sk_callback_sse2+0xf3>
+ .byte 15,40,21,204,132,0,0 // movaps 0x84cc(%rip),%xmm2 # 8590 <_sk_clut_4D_sse2+0x15e8>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -37279,7 +45013,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,219,99,0,0 // movaps 0x63db(%rip),%xmm2 # 64c0 <_sk_callback_sse2+0x103>
+ .byte 15,40,21,187,132,0,0 // movaps 0x84bb(%rip),%xmm2 # 85a0 <_sk_clut_4D_sse2+0x15f8>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -37299,14 +45033,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,169,99,0,0 // movdqa 0x63a9(%rip),%xmm10 # 64d0 <_sk_callback_sse2+0x113>
+ .byte 102,68,15,111,21,137,132,0,0 // movdqa 0x8489(%rip),%xmm10 # 85b0 <_sk_clut_4D_sse2+0x1608>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,149,99,0,0 // movdqa 0x6395(%rip),%xmm12 # 64e0 <_sk_callback_sse2+0x123>
- .byte 102,68,15,111,45,156,99,0,0 // movdqa 0x639c(%rip),%xmm13 # 64f0 <_sk_callback_sse2+0x133>
+ .byte 102,68,15,111,37,117,132,0,0 // movdqa 0x8475(%rip),%xmm12 # 85c0 <_sk_clut_4D_sse2+0x1618>
+ .byte 102,68,15,111,45,124,132,0,0 // movdqa 0x847c(%rip),%xmm13 # 85d0 <_sk_clut_4D_sse2+0x1628>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -37322,8 +45056,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,87,99,0,0 // mulps 0x6357(%rip),%xmm8 # 6500 <_sk_callback_sse2+0x143>
- .byte 68,15,88,5,95,99,0,0 // addps 0x635f(%rip),%xmm8 # 6510 <_sk_callback_sse2+0x153>
+ .byte 68,15,89,5,55,132,0,0 // mulps 0x8437(%rip),%xmm8 # 85e0 <_sk_clut_4D_sse2+0x1638>
+ .byte 68,15,88,5,63,132,0,0 // addps 0x843f(%rip),%xmm8 # 85f0 <_sk_clut_4D_sse2+0x1648>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -37365,7 +45099,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,245,98,0,0 // movaps 0x62f5(%rip),%xmm3 # 6520 <_sk_callback_sse2+0x163>
+ .byte 15,40,29,213,131,0,0 // movaps 0x83d5(%rip),%xmm3 # 8600 <_sk_clut_4D_sse2+0x1658>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -37376,7 +45110,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,241,98,0,0 // movaps 0x62f1(%rip),%xmm0 # 6530 <_sk_callback_sse2+0x173>
+ .byte 15,40,5,209,131,0,0 // movaps 0x83d1(%rip),%xmm0 # 8610 <_sk_clut_4D_sse2+0x1668>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -37422,7 +45156,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,177,98,0,0 // movaps 0x62b1(%rip),%xmm8 # 6540 <_sk_callback_sse2+0x183>
+ .byte 68,15,40,5,145,131,0,0 // movaps 0x8391(%rip),%xmm8 # 8620 <_sk_clut_4D_sse2+0x1678>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -37447,7 +45181,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,116,98,0,0 // movaps 0x6274(%rip),%xmm9 # 6550 <_sk_callback_sse2+0x193>
+ .byte 68,15,40,13,84,131,0,0 // movaps 0x8354(%rip),%xmm9 # 8630 <_sk_clut_4D_sse2+0x1688>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -37494,7 +45228,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,24,98,0,0 // movaps 0x6218(%rip),%xmm8 # 6560 <_sk_callback_sse2+0x1a3>
+ .byte 68,15,40,5,248,130,0,0 // movaps 0x82f8(%rip),%xmm8 # 8640 <_sk_clut_4D_sse2+0x1698>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -37507,7 +45241,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,8,98,0,0 // movaps 0x6208(%rip),%xmm8 # 6570 <_sk_callback_sse2+0x1b3>
+ .byte 68,15,40,5,232,130,0,0 // movaps 0x82e8(%rip),%xmm8 # 8650 <_sk_clut_4D_sse2+0x16a8>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -37524,7 +45258,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,235,97,0,0 // movaps 0x61eb(%rip),%xmm8 # 6580 <_sk_callback_sse2+0x1c3>
+ .byte 68,15,40,5,203,130,0,0 // movaps 0x82cb(%rip),%xmm8 # 8660 <_sk_clut_4D_sse2+0x16b8>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -37544,7 +45278,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,191,97,0,0 // movaps 0x61bf(%rip),%xmm8 # 6590 <_sk_callback_sse2+0x1d3>
+ .byte 68,15,40,5,159,130,0,0 // movaps 0x829f(%rip),%xmm8 # 8670 <_sk_clut_4D_sse2+0x16c8>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -37572,7 +45306,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,147,97,0,0 // movaps 0x6193(%rip),%xmm8 # 65a0 <_sk_callback_sse2+0x1e3>
+ .byte 68,15,40,5,115,130,0,0 // movaps 0x8273(%rip),%xmm8 # 8680 <_sk_clut_4D_sse2+0x16d8>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -37647,7 +45381,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,200,96,0,0 // movaps 0x60c8(%rip),%xmm3 # 65b0 <_sk_callback_sse2+0x1f3>
+ .byte 15,40,29,168,129,0,0 // movaps 0x81a8(%rip),%xmm3 # 8690 <_sk_clut_4D_sse2+0x16e8>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -37695,7 +45429,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,51,96,0,0 // movaps 0x6033(%rip),%xmm2 # 65c0 <_sk_callback_sse2+0x203>
+ .byte 15,40,21,19,129,0,0 // movaps 0x8113(%rip),%xmm2 # 86a0 <_sk_clut_4D_sse2+0x16f8>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37729,7 +45463,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,216,95,0,0 // movaps 0x5fd8(%rip),%xmm2 # 65d0 <_sk_callback_sse2+0x213>
+ .byte 15,40,21,184,128,0,0 // movaps 0x80b8(%rip),%xmm2 # 86b0 <_sk_clut_4D_sse2+0x1708>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37766,7 +45500,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,114,95,0,0 // movaps 0x5f72(%rip),%xmm2 # 65e0 <_sk_callback_sse2+0x223>
+ .byte 15,40,21,82,128,0,0 // movaps 0x8052(%rip),%xmm2 # 86c0 <_sk_clut_4D_sse2+0x1718>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37794,7 +45528,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,50,95,0,0 // movaps 0x5f32(%rip),%xmm2 # 65f0 <_sk_callback_sse2+0x233>
+ .byte 15,40,21,18,128,0,0 // movaps 0x8012(%rip),%xmm2 # 86d0 <_sk_clut_4D_sse2+0x1728>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37807,7 +45541,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,37,95,0,0 // movaps 0x5f25(%rip),%xmm10 # 6600 <_sk_callback_sse2+0x243>
+ .byte 68,15,40,21,5,128,0,0 // movaps 0x8005(%rip),%xmm10 # 86e0 <_sk_clut_4D_sse2+0x1738>
.byte 69,15,40,202 // movaps %xmm10,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,217 // movaps %xmm9,%xmm11
@@ -37901,7 +45635,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,219,93,0,0 // movaps 0x5ddb(%rip),%xmm10 # 6610 <_sk_callback_sse2+0x253>
+ .byte 68,15,40,21,187,126,0,0 // movaps 0x7ebb(%rip),%xmm10 # 86f0 <_sk_clut_4D_sse2+0x1748>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -37995,7 +45729,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,144,92,0,0 // movaps 0x5c90(%rip),%xmm11 # 6620 <_sk_callback_sse2+0x263>
+ .byte 68,15,40,29,112,125,0,0 // movaps 0x7d70(%rip),%xmm11 # 8700 <_sk_clut_4D_sse2+0x1758>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -38083,7 +45817,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,94,91,0,0 // movaps 0x5b5e(%rip),%xmm9 # 6630 <_sk_callback_sse2+0x273>
+ .byte 68,15,40,13,62,124,0,0 // movaps 0x7c3e(%rip),%xmm9 # 8710 <_sk_clut_4D_sse2+0x1768>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -38174,7 +45908,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,27,90,0,0 // movaps 0x5a1b(%rip),%xmm9 # 6640 <_sk_callback_sse2+0x283>
+ .byte 68,15,40,13,251,122,0,0 // movaps 0x7afb(%rip),%xmm9 # 8720 <_sk_clut_4D_sse2+0x1778>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -38187,10 +45921,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,245,89,0,0 // movaps 0x59f5(%rip),%xmm14 # 6650 <_sk_callback_sse2+0x293>
+ .byte 68,15,40,53,213,122,0,0 // movaps 0x7ad5(%rip),%xmm14 # 8730 <_sk_clut_4D_sse2+0x1788>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,245,89,0,0 // movaps 0x59f5(%rip),%xmm10 # 6660 <_sk_callback_sse2+0x2a3>
+ .byte 68,15,40,21,213,122,0,0 // movaps 0x7ad5(%rip),%xmm10 # 8740 <_sk_clut_4D_sse2+0x1798>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -38335,7 +46069,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,56,88,0,0 // movaps 0x5838(%rip),%xmm8 # 66a0 <_sk_callback_sse2+0x2e3>
+ .byte 68,15,40,5,24,121,0,0 // movaps 0x7918(%rip),%xmm8 # 8780 <_sk_clut_4D_sse2+0x17d8>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -38383,12 +46117,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,69,87,0,0 // movaps 0x5745(%rip),%xmm15 # 6670 <_sk_callback_sse2+0x2b3>
+ .byte 68,15,40,61,37,120,0,0 // movaps 0x7825(%rip),%xmm15 # 8750 <_sk_clut_4D_sse2+0x17a8>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,74,87,0,0 // movaps 0x574a(%rip),%xmm0 # 6680 <_sk_callback_sse2+0x2c3>
+ .byte 15,40,5,42,120,0,0 // movaps 0x782a(%rip),%xmm0 # 8760 <_sk_clut_4D_sse2+0x17b8>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,76,87,0,0 // movaps 0x574c(%rip),%xmm14 # 6690 <_sk_callback_sse2+0x2d3>
+ .byte 68,15,40,53,44,120,0,0 // movaps 0x782c(%rip),%xmm14 # 8770 <_sk_clut_4D_sse2+0x17c8>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -38566,14 +46300,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,222,84,0,0 // movaps 0x54de(%rip),%xmm8 # 66b0 <_sk_callback_sse2+0x2f3>
+ .byte 68,15,40,5,190,117,0,0 // movaps 0x75be(%rip),%xmm8 # 8790 <_sk_clut_4D_sse2+0x17e8>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,224,84,0,0 // movaps 0x54e0(%rip),%xmm1 # 66c0 <_sk_callback_sse2+0x303>
+ .byte 15,40,13,192,117,0,0 // movaps 0x75c0(%rip),%xmm1 # 87a0 <_sk_clut_4D_sse2+0x17f8>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,223,84,0,0 // movaps 0x54df(%rip),%xmm12 # 66d0 <_sk_callback_sse2+0x313>
+ .byte 68,15,40,37,191,117,0,0 // movaps 0x75bf(%rip),%xmm12 # 87b0 <_sk_clut_4D_sse2+0x1808>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -38618,7 +46352,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,68,84,0,0 // movaps 0x5444(%rip),%xmm8 # 66e0 <_sk_callback_sse2+0x323>
+ .byte 68,15,40,5,36,117,0,0 // movaps 0x7524(%rip),%xmm8 # 87c0 <_sk_clut_4D_sse2+0x1818>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -38719,14 +46453,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,226,82,0,0 // movaps 0x52e2(%rip),%xmm13 # 66f0 <_sk_callback_sse2+0x333>
+ .byte 68,15,40,45,194,115,0,0 // movaps 0x73c2(%rip),%xmm13 # 87d0 <_sk_clut_4D_sse2+0x1828>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,226,82,0,0 // movaps 0x52e2(%rip),%xmm14 # 6700 <_sk_callback_sse2+0x343>
+ .byte 68,15,40,53,194,115,0,0 // movaps 0x73c2(%rip),%xmm14 # 87e0 <_sk_clut_4D_sse2+0x1838>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,222,82,0,0 // movaps 0x52de(%rip),%xmm11 # 6710 <_sk_callback_sse2+0x353>
+ .byte 68,15,40,29,190,115,0,0 // movaps 0x73be(%rip),%xmm11 # 87f0 <_sk_clut_4D_sse2+0x1848>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -38734,7 +46468,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,202,82,0,0 // movaps 0x52ca(%rip),%xmm8 # 6720 <_sk_callback_sse2+0x363>
+ .byte 68,15,40,5,170,115,0,0 // movaps 0x73aa(%rip),%xmm8 # 8800 <_sk_clut_4D_sse2+0x1858>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -38870,15 +46604,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,225,80,0,0 // movaps 0x50e1(%rip),%xmm12 # 6730 <_sk_callback_sse2+0x373>
+ .byte 68,15,40,37,193,113,0,0 // movaps 0x71c1(%rip),%xmm12 # 8810 <_sk_clut_4D_sse2+0x1868>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,225,80,0,0 // movaps 0x50e1(%rip),%xmm13 # 6740 <_sk_callback_sse2+0x383>
+ .byte 68,15,40,45,193,113,0,0 // movaps 0x71c1(%rip),%xmm13 # 8820 <_sk_clut_4D_sse2+0x1878>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,221,80,0,0 // movaps 0x50dd(%rip),%xmm11 # 6750 <_sk_callback_sse2+0x393>
- .byte 68,15,40,5,229,80,0,0 // movaps 0x50e5(%rip),%xmm8 # 6760 <_sk_callback_sse2+0x3a3>
+ .byte 68,15,40,29,189,113,0,0 // movaps 0x71bd(%rip),%xmm11 # 8830 <_sk_clut_4D_sse2+0x1888>
+ .byte 68,15,40,5,197,113,0,0 // movaps 0x71c5(%rip),%xmm8 # 8840 <_sk_clut_4D_sse2+0x1898>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -39022,7 +46756,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,133,228,0,0,0 // jne 1966 <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,129 // movdqu (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,53,221,78,0,0 // movdqa 0x4edd(%rip),%xmm6 # 6770 <_sk_callback_sse2+0x3b3>
+ .byte 102,15,111,53,189,111,0,0 // movdqa 0x6fbd(%rip),%xmm6 # 8850 <_sk_clut_4D_sse2+0x18a8>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -39036,9 +46770,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,173,78,0,0 // movaps 0x4ead(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x3c3>
+ .byte 68,15,40,5,141,111,0,0 // movaps 0x6f8d(%rip),%xmm8 # 8860 <_sk_clut_4D_sse2+0x18b8>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,177,78,0,0 // movaps 0x4eb1(%rip),%xmm12 # 6790 <_sk_callback_sse2+0x3d3>
+ .byte 68,15,40,37,145,111,0,0 // movaps 0x6f91(%rip),%xmm12 # 8870 <_sk_clut_4D_sse2+0x18c8>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -39118,7 +46852,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,157,77,0,0 // movaps 0x4d9d(%rip),%xmm8 # 67a0 <_sk_callback_sse2+0x3e3>
+ .byte 68,15,40,5,125,110,0,0 // movaps 0x6e7d(%rip),%xmm8 # 8880 <_sk_clut_4D_sse2+0x18d8>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -39130,7 +46864,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,146,77,0,0 // minps 0x4d92(%rip),%xmm3 # 67b0 <_sk_callback_sse2+0x3f3>
+ .byte 15,93,29,114,110,0,0 // minps 0x6e72(%rip),%xmm3 # 8890 <_sk_clut_4D_sse2+0x18e8>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -39141,7 +46875,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,142,77,0,0 // minps 0x4d8e(%rip),%xmm7 # 67c0 <_sk_callback_sse2+0x403>
+ .byte 15,93,61,110,110,0,0 // minps 0x6e6e(%rip),%xmm7 # 88a0 <_sk_clut_4D_sse2+0x18f8>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -39176,7 +46910,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,90,77,0,0 // movaps 0x4d5a(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x413>
+ .byte 68,15,40,5,58,110,0,0 // movaps 0x6e3a(%rip),%xmm8 # 88b0 <_sk_clut_4D_sse2+0x1908>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -39238,7 +46972,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,244,76,0,0 // movaps 0x4cf4(%rip),%xmm9 # 67e0 <_sk_callback_sse2+0x423>
+ .byte 68,15,40,13,212,109,0,0 // movaps 0x6dd4(%rip),%xmm9 # 88c0 <_sk_clut_4D_sse2+0x1918>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -39252,20 +46986,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,223,76,0,0 // movaps 0x4cdf(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x433>
+ .byte 68,15,40,5,191,109,0,0 // movaps 0x6dbf(%rip),%xmm8 # 88d0 <_sk_clut_4D_sse2+0x1928>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,215,76,0,0 // movaps 0x4cd7(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x443>
+ .byte 68,15,40,13,183,109,0,0 // movaps 0x6db7(%rip),%xmm9 # 88e0 <_sk_clut_4D_sse2+0x1938>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,215,76,0,0 // movaps 0x4cd7(%rip),%xmm10 # 6810 <_sk_callback_sse2+0x453>
+ .byte 68,15,40,21,183,109,0,0 // movaps 0x6db7(%rip),%xmm10 # 88f0 <_sk_clut_4D_sse2+0x1948>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,215,76,0,0 // movaps 0x4cd7(%rip),%xmm11 # 6820 <_sk_callback_sse2+0x463>
+ .byte 68,15,40,29,183,109,0,0 // movaps 0x6db7(%rip),%xmm11 # 8900 <_sk_clut_4D_sse2+0x1958>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,219,76,0,0 // movaps 0x4cdb(%rip),%xmm12 # 6830 <_sk_callback_sse2+0x473>
+ .byte 68,15,40,37,187,109,0,0 // movaps 0x6dbb(%rip),%xmm12 # 8910 <_sk_clut_4D_sse2+0x1968>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -39301,20 +47035,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,108,76,0,0 // movaps 0x4c6c(%rip),%xmm8 # 6840 <_sk_callback_sse2+0x483>
+ .byte 68,15,40,5,76,109,0,0 // movaps 0x6d4c(%rip),%xmm8 # 8920 <_sk_clut_4D_sse2+0x1978>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,100,76,0,0 // movaps 0x4c64(%rip),%xmm9 # 6850 <_sk_callback_sse2+0x493>
+ .byte 68,15,40,13,68,109,0,0 // movaps 0x6d44(%rip),%xmm9 # 8930 <_sk_clut_4D_sse2+0x1988>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,100,76,0,0 // movaps 0x4c64(%rip),%xmm10 # 6860 <_sk_callback_sse2+0x4a3>
+ .byte 68,15,40,21,68,109,0,0 // movaps 0x6d44(%rip),%xmm10 # 8940 <_sk_clut_4D_sse2+0x1998>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,100,76,0,0 // movaps 0x4c64(%rip),%xmm11 # 6870 <_sk_callback_sse2+0x4b3>
+ .byte 68,15,40,29,68,109,0,0 // movaps 0x6d44(%rip),%xmm11 # 8950 <_sk_clut_4D_sse2+0x19a8>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,104,76,0,0 // movaps 0x4c68(%rip),%xmm12 # 6880 <_sk_callback_sse2+0x4c3>
+ .byte 68,15,40,37,72,109,0,0 // movaps 0x6d48(%rip),%xmm12 # 8960 <_sk_clut_4D_sse2+0x19b8>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -39351,22 +47085,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,245,75,0,0 // movaps 0x4bf5(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x4d3>
+ .byte 68,15,40,5,213,108,0,0 // movaps 0x6cd5(%rip),%xmm8 # 8970 <_sk_clut_4D_sse2+0x19c8>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,245,75,0,0 // movaps 0x4bf5(%rip),%xmm9 # 68a0 <_sk_callback_sse2+0x4e3>
+ .byte 68,15,40,13,213,108,0,0 // movaps 0x6cd5(%rip),%xmm9 # 8980 <_sk_clut_4D_sse2+0x19d8>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,245,75,0,0 // movaps 0x4bf5(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x4f3>
+ .byte 68,15,40,21,213,108,0,0 // movaps 0x6cd5(%rip),%xmm10 # 8990 <_sk_clut_4D_sse2+0x19e8>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,245,75,0,0 // movaps 0x4bf5(%rip),%xmm11 # 68c0 <_sk_callback_sse2+0x503>
+ .byte 68,15,40,29,213,108,0,0 // movaps 0x6cd5(%rip),%xmm11 # 89a0 <_sk_clut_4D_sse2+0x19f8>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,249,75,0,0 // movaps 0x4bf9(%rip),%xmm12 # 68d0 <_sk_callback_sse2+0x513>
+ .byte 68,15,40,37,217,108,0,0 // movaps 0x6cd9(%rip),%xmm12 # 89b0 <_sk_clut_4D_sse2+0x1a08>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,245,75,0,0 // movaps 0x4bf5(%rip),%xmm15 # 68e0 <_sk_callback_sse2+0x523>
+ .byte 68,15,40,61,213,108,0,0 // movaps 0x6cd5(%rip),%xmm15 # 89c0 <_sk_clut_4D_sse2+0x1a18>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -39416,7 +47150,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,218 // minps %xmm2,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,78,75,0,0 // movaps 0x4b4e(%rip),%xmm13 # 68f0 <_sk_callback_sse2+0x533>
+ .byte 68,15,40,45,46,108,0,0 // movaps 0x6c2e(%rip),%xmm13 # 89d0 <_sk_clut_4D_sse2+0x1a28>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -39425,30 +47159,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,52,75,0,0 // andps 0x4b34(%rip),%xmm14 # 6900 <_sk_callback_sse2+0x543>
+ .byte 68,15,84,53,20,108,0,0 // andps 0x6c14(%rip),%xmm14 # 89e0 <_sk_clut_4D_sse2+0x1a38>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,39,75,0,0 // movaps 0x4b27(%rip),%xmm12 # 6910 <_sk_callback_sse2+0x553>
+ .byte 68,15,40,37,7,108,0,0 // movaps 0x6c07(%rip),%xmm12 # 89f0 <_sk_clut_4D_sse2+0x1a48>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,35,75,0,0 // addps 0x4b23(%rip),%xmm8 # 6920 <_sk_callback_sse2+0x563>
+ .byte 68,15,88,5,3,108,0,0 // addps 0x6c03(%rip),%xmm8 # 8a00 <_sk_clut_4D_sse2+0x1a58>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,20,75,0,0 // mulps 0x4b14(%rip),%xmm0 # 6930 <_sk_callback_sse2+0x573>
+ .byte 15,89,5,244,107,0,0 // mulps 0x6bf4(%rip),%xmm0 # 8a10 <_sk_clut_4D_sse2+0x1a68>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,7,75,0,0 // movaps 0x4b07(%rip),%xmm9 # 6940 <_sk_callback_sse2+0x583>
+ .byte 68,15,40,13,231,107,0,0 // movaps 0x6be7(%rip),%xmm9 # 8a20 <_sk_clut_4D_sse2+0x1a78>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -39472,7 +47206,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,198,74,0,0 // movaps 0x4ac6(%rip),%xmm9 # 6950 <_sk_callback_sse2+0x593>
+ .byte 68,15,40,13,166,107,0,0 // movaps 0x6ba6(%rip),%xmm9 # 8a30 <_sk_clut_4D_sse2+0x1a88>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -39489,28 +47223,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,143,74,0,0 // movaps 0x4a8f(%rip),%xmm0 # 6960 <_sk_callback_sse2+0x5a3>
+ .byte 15,40,5,111,107,0,0 // movaps 0x6b6f(%rip),%xmm0 # 8a40 <_sk_clut_4D_sse2+0x1a98>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,135,74,0,0 // andps 0x4a87(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
+ .byte 15,84,29,103,107,0,0 // andps 0x6b67(%rip),%xmm3 # 8a50 <_sk_clut_4D_sse2+0x1aa8>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,137,74,0,0 // movaps 0x4a89(%rip),%xmm13 # 6980 <_sk_callback_sse2+0x5c3>
+ .byte 68,15,40,45,105,107,0,0 // movaps 0x6b69(%rip),%xmm13 # 8a60 <_sk_clut_4D_sse2+0x1ab8>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,153,74,0,0 // movaps 0x4a99(%rip),%xmm2 # 69b0 <_sk_callback_sse2+0x5f3>
+ .byte 15,40,21,121,107,0,0 // movaps 0x6b79(%rip),%xmm2 # 8a90 <_sk_clut_4D_sse2+0x1ae8>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,105,74,0,0 // movaps 0x4a69(%rip),%xmm1 # 6990 <_sk_callback_sse2+0x5d3>
+ .byte 15,40,13,73,107,0,0 // movaps 0x6b49(%rip),%xmm1 # 8a70 <_sk_clut_4D_sse2+0x1ac8>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,111,74,0,0 // movaps 0x4a6f(%rip),%xmm5 # 69a0 <_sk_callback_sse2+0x5e3>
+ .byte 15,40,45,79,107,0,0 // movaps 0x6b4f(%rip),%xmm5 # 8a80 <_sk_clut_4D_sse2+0x1ad8>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -39533,7 +47267,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,228,73,0,0 // andps 0x49e4(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
+ .byte 15,84,29,196,106,0,0 // andps 0x6ac4(%rip),%xmm3 # 8a50 <_sk_clut_4D_sse2+0x1aa8>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -39563,12 +47297,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,188,73,0,0 // addps 0x49bc(%rip),%xmm6 # 69c0 <_sk_callback_sse2+0x603>
+ .byte 15,88,53,156,106,0,0 // addps 0x6a9c(%rip),%xmm6 # 8aa0 <_sk_clut_4D_sse2+0x1af8>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,87,73,0,0 // andps 0x4957(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
+ .byte 15,84,29,55,106,0,0 // andps 0x6a37(%rip),%xmm3 # 8a50 <_sk_clut_4D_sse2+0x1aa8>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -39636,9 +47370,9 @@ _sk_scale_u8_sse2:
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,218,72,0,0 // pand 0x48da(%rip),%xmm8 # 69d0 <_sk_callback_sse2+0x613>
+ .byte 102,68,15,219,5,186,105,0,0 // pand 0x69ba(%rip),%xmm8 # 8ab0 <_sk_clut_4D_sse2+0x1b08>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,222,72,0,0 // mulps 0x48de(%rip),%xmm8 # 69e0 <_sk_callback_sse2+0x623>
+ .byte 68,15,89,5,190,105,0,0 // mulps 0x69be(%rip),%xmm8 # 8ac0 <_sk_clut_4D_sse2+0x1b18>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -39705,9 +47439,9 @@ _sk_lerp_u8_sse2:
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,20,72,0,0 // pand 0x4814(%rip),%xmm8 # 69f0 <_sk_callback_sse2+0x633>
+ .byte 102,68,15,219,5,244,104,0,0 // pand 0x68f4(%rip),%xmm8 # 8ad0 <_sk_clut_4D_sse2+0x1b28>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,24,72,0,0 // mulps 0x4818(%rip),%xmm8 # 6a00 <_sk_callback_sse2+0x643>
+ .byte 68,15,89,5,248,104,0,0 // mulps 0x68f8(%rip),%xmm8 # 8ae0 <_sk_clut_4D_sse2+0x1b38>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -39759,17 +47493,17 @@ _sk_lerp_565_sse2:
.byte 15,133,156,0,0,0 // jne 232b <_sk_lerp_565_sse2+0xbb>
.byte 243,71,15,126,12,89 // movq (%r9,%r11,2),%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
- .byte 102,68,15,111,5,109,71,0,0 // movdqa 0x476d(%rip),%xmm8 # 6a10 <_sk_callback_sse2+0x653>
+ .byte 102,68,15,111,5,77,104,0,0 // movdqa 0x684d(%rip),%xmm8 # 8af0 <_sk_clut_4D_sse2+0x1b48>
.byte 102,69,15,219,193 // pand %xmm9,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,108,71,0,0 // mulps 0x476c(%rip),%xmm8 # 6a20 <_sk_callback_sse2+0x663>
- .byte 102,68,15,111,21,115,71,0,0 // movdqa 0x4773(%rip),%xmm10 # 6a30 <_sk_callback_sse2+0x673>
+ .byte 68,15,89,5,76,104,0,0 // mulps 0x684c(%rip),%xmm8 # 8b00 <_sk_clut_4D_sse2+0x1b58>
+ .byte 102,68,15,111,21,83,104,0,0 // movdqa 0x6853(%rip),%xmm10 # 8b10 <_sk_clut_4D_sse2+0x1b68>
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,114,71,0,0 // mulps 0x4772(%rip),%xmm10 # 6a40 <_sk_callback_sse2+0x683>
- .byte 102,68,15,219,13,121,71,0,0 // pand 0x4779(%rip),%xmm9 # 6a50 <_sk_callback_sse2+0x693>
+ .byte 68,15,89,21,82,104,0,0 // mulps 0x6852(%rip),%xmm10 # 8b20 <_sk_clut_4D_sse2+0x1b78>
+ .byte 102,68,15,219,13,89,104,0,0 // pand 0x6859(%rip),%xmm9 # 8b30 <_sk_clut_4D_sse2+0x1b88>
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,125,71,0,0 // mulps 0x477d(%rip),%xmm9 # 6a60 <_sk_callback_sse2+0x6a3>
+ .byte 68,15,89,13,93,104,0,0 // mulps 0x685d(%rip),%xmm9 # 8b40 <_sk_clut_4D_sse2+0x1b98>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -39823,7 +47557,7 @@ _sk_load_tables_sse2:
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,204,70,0,0 // movdqa 0x46cc(%rip),%xmm8 # 6a70 <_sk_callback_sse2+0x6b3>
+ .byte 102,68,15,111,5,172,103,0,0 // movdqa 0x67ac(%rip),%xmm8 # 8b50 <_sk_clut_4D_sse2+0x1ba8>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -39879,7 +47613,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,213,69,0,0 // mulps 0x45d5(%rip),%xmm3 # 6a80 <_sk_callback_sse2+0x6c3>
+ .byte 15,89,29,181,102,0,0 // mulps 0x66b5(%rip),%xmm3 # 8b60 <_sk_clut_4D_sse2+0x1bb8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -39921,7 +47655,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,74,69,0,0 // movdqa 0x454a(%rip),%xmm10 # 6a90 <_sk_callback_sse2+0x6d3>
+ .byte 102,68,15,111,21,42,102,0,0 // movdqa 0x662a(%rip),%xmm10 # 8b70 <_sk_clut_4D_sse2+0x1bc8>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -39983,7 +47717,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,53,68,0,0 // mulps 0x4435(%rip),%xmm3 # 6aa0 <_sk_callback_sse2+0x6e3>
+ .byte 15,89,29,21,101,0,0 // mulps 0x6515(%rip),%xmm3 # 8b80 <_sk_clut_4D_sse2+0x1bd8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -40026,7 +47760,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,164,67,0,0 // movdqa 0x43a4(%rip),%xmm8 # 6ab0 <_sk_callback_sse2+0x6f3>
+ .byte 102,68,15,111,5,132,100,0,0 // movdqa 0x6484(%rip),%xmm8 # 8b90 <_sk_clut_4D_sse2+0x1be8>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -40082,7 +47816,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,175,66,0,0 // movaps 0x42af(%rip),%xmm3 # 6ac0 <_sk_callback_sse2+0x703>
+ .byte 15,40,29,143,99,0,0 // movaps 0x638f(%rip),%xmm3 # 8ba0 <_sk_clut_4D_sse2+0x1bf8>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -40116,7 +47850,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,72,66,0,0 // movaps 0x4248(%rip),%xmm8 # 6ad0 <_sk_callback_sse2+0x713>
+ .byte 68,15,40,5,40,99,0,0 // movaps 0x6328(%rip),%xmm8 # 8bb0 <_sk_clut_4D_sse2+0x1c08>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -40144,7 +47878,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,226,65,0,0 // movaps 0x41e2(%rip),%xmm10 # 6ae0 <_sk_callback_sse2+0x723>
+ .byte 68,15,40,21,194,98,0,0 // movaps 0x62c2(%rip),%xmm10 # 8bc0 <_sk_clut_4D_sse2+0x1c18>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -40265,7 +47999,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,42,64,0,0 // movaps 0x402a(%rip),%xmm10 # 6af0 <_sk_callback_sse2+0x733>
+ .byte 68,15,40,21,10,97,0,0 // movaps 0x610a(%rip),%xmm10 # 8bd0 <_sk_clut_4D_sse2+0x1c28>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -40472,15 +48206,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,94,61,0,0 // mulps 0x3d5e(%rip),%xmm9 # 6b00 <_sk_callback_sse2+0x743>
- .byte 68,15,84,21,102,61,0,0 // andps 0x3d66(%rip),%xmm10 # 6b10 <_sk_callback_sse2+0x753>
- .byte 68,15,86,21,110,61,0,0 // orps 0x3d6e(%rip),%xmm10 # 6b20 <_sk_callback_sse2+0x763>
- .byte 68,15,88,13,118,61,0,0 // addps 0x3d76(%rip),%xmm9 # 6b30 <_sk_callback_sse2+0x773>
- .byte 68,15,40,37,126,61,0,0 // movaps 0x3d7e(%rip),%xmm12 # 6b40 <_sk_callback_sse2+0x783>
+ .byte 68,15,89,13,62,94,0,0 // mulps 0x5e3e(%rip),%xmm9 # 8be0 <_sk_clut_4D_sse2+0x1c38>
+ .byte 68,15,84,21,70,94,0,0 // andps 0x5e46(%rip),%xmm10 # 8bf0 <_sk_clut_4D_sse2+0x1c48>
+ .byte 68,15,86,21,78,94,0,0 // orps 0x5e4e(%rip),%xmm10 # 8c00 <_sk_clut_4D_sse2+0x1c58>
+ .byte 68,15,88,13,86,94,0,0 // addps 0x5e56(%rip),%xmm9 # 8c10 <_sk_clut_4D_sse2+0x1c68>
+ .byte 68,15,40,37,94,94,0,0 // movaps 0x5e5e(%rip),%xmm12 # 8c20 <_sk_clut_4D_sse2+0x1c78>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,126,61,0,0 // addps 0x3d7e(%rip),%xmm10 # 6b50 <_sk_callback_sse2+0x793>
- .byte 68,15,40,37,134,61,0,0 // movaps 0x3d86(%rip),%xmm12 # 6b60 <_sk_callback_sse2+0x7a3>
+ .byte 68,15,88,21,94,94,0,0 // addps 0x5e5e(%rip),%xmm10 # 8c30 <_sk_clut_4D_sse2+0x1c88>
+ .byte 68,15,40,37,102,94,0,0 // movaps 0x5e66(%rip),%xmm12 # 8c40 <_sk_clut_4D_sse2+0x1c98>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -40488,22 +48222,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,112,61,0,0 // movaps 0x3d70(%rip),%xmm10 # 6b70 <_sk_callback_sse2+0x7b3>
+ .byte 68,15,40,21,80,94,0,0 // movaps 0x5e50(%rip),%xmm10 # 8c50 <_sk_clut_4D_sse2+0x1ca8>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,100,61,0,0 // addps 0x3d64(%rip),%xmm9 # 6b80 <_sk_callback_sse2+0x7c3>
- .byte 68,15,40,37,108,61,0,0 // movaps 0x3d6c(%rip),%xmm12 # 6b90 <_sk_callback_sse2+0x7d3>
+ .byte 68,15,88,13,68,94,0,0 // addps 0x5e44(%rip),%xmm9 # 8c60 <_sk_clut_4D_sse2+0x1cb8>
+ .byte 68,15,40,37,76,94,0,0 // movaps 0x5e4c(%rip),%xmm12 # 8c70 <_sk_clut_4D_sse2+0x1cc8>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,108,61,0,0 // movaps 0x3d6c(%rip),%xmm12 # 6ba0 <_sk_callback_sse2+0x7e3>
+ .byte 68,15,40,37,76,94,0,0 // movaps 0x5e4c(%rip),%xmm12 # 8c80 <_sk_clut_4D_sse2+0x1cd8>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,112,61,0,0 // movaps 0x3d70(%rip),%xmm13 # 6bb0 <_sk_callback_sse2+0x7f3>
+ .byte 68,15,40,45,80,94,0,0 // movaps 0x5e50(%rip),%xmm13 # 8c90 <_sk_clut_4D_sse2+0x1ce8>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,112,61,0,0 // mulps 0x3d70(%rip),%xmm13 # 6bc0 <_sk_callback_sse2+0x803>
+ .byte 68,15,89,45,80,94,0,0 // mulps 0x5e50(%rip),%xmm13 # 8ca0 <_sk_clut_4D_sse2+0x1cf8>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -40539,15 +48273,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,240,60,0,0 // mulps 0x3cf0(%rip),%xmm9 # 6bd0 <_sk_callback_sse2+0x813>
- .byte 68,15,84,21,248,60,0,0 // andps 0x3cf8(%rip),%xmm10 # 6be0 <_sk_callback_sse2+0x823>
- .byte 68,15,86,21,0,61,0,0 // orps 0x3d00(%rip),%xmm10 # 6bf0 <_sk_callback_sse2+0x833>
- .byte 68,15,88,13,8,61,0,0 // addps 0x3d08(%rip),%xmm9 # 6c00 <_sk_callback_sse2+0x843>
- .byte 68,15,40,37,16,61,0,0 // movaps 0x3d10(%rip),%xmm12 # 6c10 <_sk_callback_sse2+0x853>
+ .byte 68,15,89,13,208,93,0,0 // mulps 0x5dd0(%rip),%xmm9 # 8cb0 <_sk_clut_4D_sse2+0x1d08>
+ .byte 68,15,84,21,216,93,0,0 // andps 0x5dd8(%rip),%xmm10 # 8cc0 <_sk_clut_4D_sse2+0x1d18>
+ .byte 68,15,86,21,224,93,0,0 // orps 0x5de0(%rip),%xmm10 # 8cd0 <_sk_clut_4D_sse2+0x1d28>
+ .byte 68,15,88,13,232,93,0,0 // addps 0x5de8(%rip),%xmm9 # 8ce0 <_sk_clut_4D_sse2+0x1d38>
+ .byte 68,15,40,37,240,93,0,0 // movaps 0x5df0(%rip),%xmm12 # 8cf0 <_sk_clut_4D_sse2+0x1d48>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,16,61,0,0 // addps 0x3d10(%rip),%xmm10 # 6c20 <_sk_callback_sse2+0x863>
- .byte 68,15,40,37,24,61,0,0 // movaps 0x3d18(%rip),%xmm12 # 6c30 <_sk_callback_sse2+0x873>
+ .byte 68,15,88,21,240,93,0,0 // addps 0x5df0(%rip),%xmm10 # 8d00 <_sk_clut_4D_sse2+0x1d58>
+ .byte 68,15,40,37,248,93,0,0 // movaps 0x5df8(%rip),%xmm12 # 8d10 <_sk_clut_4D_sse2+0x1d68>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -40555,22 +48289,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,2,61,0,0 // movaps 0x3d02(%rip),%xmm10 # 6c40 <_sk_callback_sse2+0x883>
+ .byte 68,15,40,21,226,93,0,0 // movaps 0x5de2(%rip),%xmm10 # 8d20 <_sk_clut_4D_sse2+0x1d78>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,246,60,0,0 // addps 0x3cf6(%rip),%xmm9 # 6c50 <_sk_callback_sse2+0x893>
- .byte 68,15,40,37,254,60,0,0 // movaps 0x3cfe(%rip),%xmm12 # 6c60 <_sk_callback_sse2+0x8a3>
+ .byte 68,15,88,13,214,93,0,0 // addps 0x5dd6(%rip),%xmm9 # 8d30 <_sk_clut_4D_sse2+0x1d88>
+ .byte 68,15,40,37,222,93,0,0 // movaps 0x5dde(%rip),%xmm12 # 8d40 <_sk_clut_4D_sse2+0x1d98>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,254,60,0,0 // movaps 0x3cfe(%rip),%xmm12 # 6c70 <_sk_callback_sse2+0x8b3>
+ .byte 68,15,40,37,222,93,0,0 // movaps 0x5dde(%rip),%xmm12 # 8d50 <_sk_clut_4D_sse2+0x1da8>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,2,61,0,0 // movaps 0x3d02(%rip),%xmm13 # 6c80 <_sk_callback_sse2+0x8c3>
+ .byte 68,15,40,45,226,93,0,0 // movaps 0x5de2(%rip),%xmm13 # 8d60 <_sk_clut_4D_sse2+0x1db8>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,2,61,0,0 // mulps 0x3d02(%rip),%xmm13 # 6c90 <_sk_callback_sse2+0x8d3>
+ .byte 68,15,89,45,226,93,0,0 // mulps 0x5de2(%rip),%xmm13 # 8d70 <_sk_clut_4D_sse2+0x1dc8>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -40606,15 +48340,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,130,60,0,0 // mulps 0x3c82(%rip),%xmm9 # 6ca0 <_sk_callback_sse2+0x8e3>
- .byte 68,15,84,21,138,60,0,0 // andps 0x3c8a(%rip),%xmm10 # 6cb0 <_sk_callback_sse2+0x8f3>
- .byte 68,15,86,21,146,60,0,0 // orps 0x3c92(%rip),%xmm10 # 6cc0 <_sk_callback_sse2+0x903>
- .byte 68,15,88,13,154,60,0,0 // addps 0x3c9a(%rip),%xmm9 # 6cd0 <_sk_callback_sse2+0x913>
- .byte 68,15,40,37,162,60,0,0 // movaps 0x3ca2(%rip),%xmm12 # 6ce0 <_sk_callback_sse2+0x923>
+ .byte 68,15,89,13,98,93,0,0 // mulps 0x5d62(%rip),%xmm9 # 8d80 <_sk_clut_4D_sse2+0x1dd8>
+ .byte 68,15,84,21,106,93,0,0 // andps 0x5d6a(%rip),%xmm10 # 8d90 <_sk_clut_4D_sse2+0x1de8>
+ .byte 68,15,86,21,114,93,0,0 // orps 0x5d72(%rip),%xmm10 # 8da0 <_sk_clut_4D_sse2+0x1df8>
+ .byte 68,15,88,13,122,93,0,0 // addps 0x5d7a(%rip),%xmm9 # 8db0 <_sk_clut_4D_sse2+0x1e08>
+ .byte 68,15,40,37,130,93,0,0 // movaps 0x5d82(%rip),%xmm12 # 8dc0 <_sk_clut_4D_sse2+0x1e18>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,162,60,0,0 // addps 0x3ca2(%rip),%xmm10 # 6cf0 <_sk_callback_sse2+0x933>
- .byte 68,15,40,37,170,60,0,0 // movaps 0x3caa(%rip),%xmm12 # 6d00 <_sk_callback_sse2+0x943>
+ .byte 68,15,88,21,130,93,0,0 // addps 0x5d82(%rip),%xmm10 # 8dd0 <_sk_clut_4D_sse2+0x1e28>
+ .byte 68,15,40,37,138,93,0,0 // movaps 0x5d8a(%rip),%xmm12 # 8de0 <_sk_clut_4D_sse2+0x1e38>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -40622,22 +48356,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,148,60,0,0 // movaps 0x3c94(%rip),%xmm10 # 6d10 <_sk_callback_sse2+0x953>
+ .byte 68,15,40,21,116,93,0,0 // movaps 0x5d74(%rip),%xmm10 # 8df0 <_sk_clut_4D_sse2+0x1e48>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,136,60,0,0 // addps 0x3c88(%rip),%xmm9 # 6d20 <_sk_callback_sse2+0x963>
- .byte 68,15,40,37,144,60,0,0 // movaps 0x3c90(%rip),%xmm12 # 6d30 <_sk_callback_sse2+0x973>
+ .byte 68,15,88,13,104,93,0,0 // addps 0x5d68(%rip),%xmm9 # 8e00 <_sk_clut_4D_sse2+0x1e58>
+ .byte 68,15,40,37,112,93,0,0 // movaps 0x5d70(%rip),%xmm12 # 8e10 <_sk_clut_4D_sse2+0x1e68>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,144,60,0,0 // movaps 0x3c90(%rip),%xmm12 # 6d40 <_sk_callback_sse2+0x983>
+ .byte 68,15,40,37,112,93,0,0 // movaps 0x5d70(%rip),%xmm12 # 8e20 <_sk_clut_4D_sse2+0x1e78>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,148,60,0,0 // movaps 0x3c94(%rip),%xmm13 # 6d50 <_sk_callback_sse2+0x993>
+ .byte 68,15,40,45,116,93,0,0 // movaps 0x5d74(%rip),%xmm13 # 8e30 <_sk_clut_4D_sse2+0x1e88>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,148,60,0,0 // mulps 0x3c94(%rip),%xmm13 # 6d60 <_sk_callback_sse2+0x9a3>
+ .byte 68,15,89,45,116,93,0,0 // mulps 0x5d74(%rip),%xmm13 # 8e40 <_sk_clut_4D_sse2+0x1e98>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -40673,15 +48407,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,20,60,0,0 // mulps 0x3c14(%rip),%xmm9 # 6d70 <_sk_callback_sse2+0x9b3>
- .byte 68,15,84,21,28,60,0,0 // andps 0x3c1c(%rip),%xmm10 # 6d80 <_sk_callback_sse2+0x9c3>
- .byte 68,15,86,21,36,60,0,0 // orps 0x3c24(%rip),%xmm10 # 6d90 <_sk_callback_sse2+0x9d3>
- .byte 68,15,88,13,44,60,0,0 // addps 0x3c2c(%rip),%xmm9 # 6da0 <_sk_callback_sse2+0x9e3>
- .byte 68,15,40,37,52,60,0,0 // movaps 0x3c34(%rip),%xmm12 # 6db0 <_sk_callback_sse2+0x9f3>
+ .byte 68,15,89,13,244,92,0,0 // mulps 0x5cf4(%rip),%xmm9 # 8e50 <_sk_clut_4D_sse2+0x1ea8>
+ .byte 68,15,84,21,252,92,0,0 // andps 0x5cfc(%rip),%xmm10 # 8e60 <_sk_clut_4D_sse2+0x1eb8>
+ .byte 68,15,86,21,4,93,0,0 // orps 0x5d04(%rip),%xmm10 # 8e70 <_sk_clut_4D_sse2+0x1ec8>
+ .byte 68,15,88,13,12,93,0,0 // addps 0x5d0c(%rip),%xmm9 # 8e80 <_sk_clut_4D_sse2+0x1ed8>
+ .byte 68,15,40,37,20,93,0,0 // movaps 0x5d14(%rip),%xmm12 # 8e90 <_sk_clut_4D_sse2+0x1ee8>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,52,60,0,0 // addps 0x3c34(%rip),%xmm10 # 6dc0 <_sk_callback_sse2+0xa03>
- .byte 68,15,40,37,60,60,0,0 // movaps 0x3c3c(%rip),%xmm12 # 6dd0 <_sk_callback_sse2+0xa13>
+ .byte 68,15,88,21,20,93,0,0 // addps 0x5d14(%rip),%xmm10 # 8ea0 <_sk_clut_4D_sse2+0x1ef8>
+ .byte 68,15,40,37,28,93,0,0 // movaps 0x5d1c(%rip),%xmm12 # 8eb0 <_sk_clut_4D_sse2+0x1f08>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -40689,22 +48423,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,38,60,0,0 // movaps 0x3c26(%rip),%xmm10 # 6de0 <_sk_callback_sse2+0xa23>
+ .byte 68,15,40,21,6,93,0,0 // movaps 0x5d06(%rip),%xmm10 # 8ec0 <_sk_clut_4D_sse2+0x1f18>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,26,60,0,0 // addps 0x3c1a(%rip),%xmm9 # 6df0 <_sk_callback_sse2+0xa33>
- .byte 68,15,40,37,34,60,0,0 // movaps 0x3c22(%rip),%xmm12 # 6e00 <_sk_callback_sse2+0xa43>
+ .byte 68,15,88,13,250,92,0,0 // addps 0x5cfa(%rip),%xmm9 # 8ed0 <_sk_clut_4D_sse2+0x1f28>
+ .byte 68,15,40,37,2,93,0,0 // movaps 0x5d02(%rip),%xmm12 # 8ee0 <_sk_clut_4D_sse2+0x1f38>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,34,60,0,0 // movaps 0x3c22(%rip),%xmm12 # 6e10 <_sk_callback_sse2+0xa53>
+ .byte 68,15,40,37,2,93,0,0 // movaps 0x5d02(%rip),%xmm12 # 8ef0 <_sk_clut_4D_sse2+0x1f48>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,38,60,0,0 // movaps 0x3c26(%rip),%xmm13 # 6e20 <_sk_callback_sse2+0xa63>
+ .byte 68,15,40,45,6,93,0,0 // movaps 0x5d06(%rip),%xmm13 # 8f00 <_sk_clut_4D_sse2+0x1f58>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,38,60,0,0 // mulps 0x3c26(%rip),%xmm13 # 6e30 <_sk_callback_sse2+0xa73>
+ .byte 68,15,89,45,6,93,0,0 // mulps 0x5d06(%rip),%xmm13 # 8f10 <_sk_clut_4D_sse2+0x1f68>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -40729,19 +48463,19 @@ _sk_gamma_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,225,59,0,0 // mulps 0x3be1(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
- .byte 15,84,21,234,59,0,0 // andps 0x3bea(%rip),%xmm2 # 6e50 <_sk_callback_sse2+0xa93>
- .byte 68,15,40,53,242,59,0,0 // movaps 0x3bf2(%rip),%xmm14 # 6e60 <_sk_callback_sse2+0xaa3>
+ .byte 15,89,5,193,92,0,0 // mulps 0x5cc1(%rip),%xmm0 # 8f20 <_sk_clut_4D_sse2+0x1f78>
+ .byte 15,84,21,202,92,0,0 // andps 0x5cca(%rip),%xmm2 # 8f30 <_sk_clut_4D_sse2+0x1f88>
+ .byte 68,15,40,53,210,92,0,0 // movaps 0x5cd2(%rip),%xmm14 # 8f40 <_sk_clut_4D_sse2+0x1f98>
.byte 65,15,86,214 // orps %xmm14,%xmm2
- .byte 68,15,40,37,246,59,0,0 // movaps 0x3bf6(%rip),%xmm12 # 6e70 <_sk_callback_sse2+0xab3>
+ .byte 68,15,40,37,214,92,0,0 // movaps 0x5cd6(%rip),%xmm12 # 8f50 <_sk_clut_4D_sse2+0x1fa8>
.byte 65,15,88,196 // addps %xmm12,%xmm0
- .byte 68,15,40,29,250,59,0,0 // movaps 0x3bfa(%rip),%xmm11 # 6e80 <_sk_callback_sse2+0xac3>
+ .byte 68,15,40,29,218,92,0,0 // movaps 0x5cda(%rip),%xmm11 # 8f60 <_sk_clut_4D_sse2+0x1fb8>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,21,248,59,0,0 // movaps 0x3bf8(%rip),%xmm10 # 6e90 <_sk_callback_sse2+0xad3>
+ .byte 68,15,40,21,216,92,0,0 // movaps 0x5cd8(%rip),%xmm10 # 8f70 <_sk_clut_4D_sse2+0x1fc8>
.byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 68,15,40,45,252,59,0,0 // movaps 0x3bfc(%rip),%xmm13 # 6ea0 <_sk_callback_sse2+0xae3>
+ .byte 68,15,40,45,220,92,0,0 // movaps 0x5cdc(%rip),%xmm13 # 8f80 <_sk_clut_4D_sse2+0x1fd8>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40753,27 +48487,27 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,226,1 // cmpltps %xmm2,%xmm4
- .byte 68,15,40,13,220,59,0,0 // movaps 0x3bdc(%rip),%xmm9 # 6eb0 <_sk_callback_sse2+0xaf3>
+ .byte 68,15,40,13,188,92,0,0 // movaps 0x5cbc(%rip),%xmm9 # 8f90 <_sk_clut_4D_sse2+0x1fe8>
.byte 65,15,84,225 // andps %xmm9,%xmm4
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,216,59,0,0 // movaps 0x3bd8(%rip),%xmm6 # 6ec0 <_sk_callback_sse2+0xb03>
+ .byte 15,40,53,184,92,0,0 // movaps 0x5cb8(%rip),%xmm6 # 8fa0 <_sk_clut_4D_sse2+0x1ff8>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,238,59,0,0 // movaps 0x3bee(%rip),%xmm7 # 6ee0 <_sk_callback_sse2+0xb23>
+ .byte 15,40,61,206,92,0,0 // movaps 0x5cce(%rip),%xmm7 # 8fc0 <_sk_clut_4D_sse2+0x2018>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,206,59,0,0 // movaps 0x3bce(%rip),%xmm4 # 6ed0 <_sk_callback_sse2+0xb13>
+ .byte 15,40,37,174,92,0,0 // movaps 0x5cae(%rip),%xmm4 # 8fb0 <_sk_clut_4D_sse2+0x2008>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,224,59,0,0 // movaps 0x3be0(%rip),%xmm15 # 6ef0 <_sk_callback_sse2+0xb33>
+ .byte 68,15,40,61,192,92,0,0 // movaps 0x5cc0(%rip),%xmm15 # 8fd0 <_sk_clut_4D_sse2+0x2028>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,28,59,0,0 // mulps 0x3b1c(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
- .byte 15,84,13,37,59,0,0 // andps 0x3b25(%rip),%xmm1 # 6e50 <_sk_callback_sse2+0xa93>
+ .byte 15,89,5,252,91,0,0 // mulps 0x5bfc(%rip),%xmm0 # 8f20 <_sk_clut_4D_sse2+0x1f78>
+ .byte 15,84,13,5,92,0,0 // andps 0x5c05(%rip),%xmm1 # 8f30 <_sk_clut_4D_sse2+0x1f88>
.byte 65,15,86,206 // orps %xmm14,%xmm1
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
@@ -40803,9 +48537,9 @@ _sk_gamma_sse2:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,171,58,0,0 // mulps 0x3aab(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
- .byte 15,84,29,180,58,0,0 // andps 0x3ab4(%rip),%xmm3 # 6e50 <_sk_callback_sse2+0xa93>
- .byte 15,86,29,189,58,0,0 // orps 0x3abd(%rip),%xmm3 # 6e60 <_sk_callback_sse2+0xaa3>
+ .byte 15,89,5,139,91,0,0 // mulps 0x5b8b(%rip),%xmm0 # 8f20 <_sk_clut_4D_sse2+0x1f78>
+ .byte 15,84,29,148,91,0,0 // andps 0x5b94(%rip),%xmm3 # 8f30 <_sk_clut_4D_sse2+0x1f88>
+ .byte 15,86,29,157,91,0,0 // orps 0x5b9d(%rip),%xmm3 # 8f40 <_sk_clut_4D_sse2+0x1f98>
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
.byte 65,15,92,195 // subps %xmm11,%xmm0
@@ -40827,7 +48561,7 @@ _sk_gamma_sse2:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,10,59,0,0 // movaps 0x3b0a(%rip),%xmm0 # 6f00 <_sk_callback_sse2+0xb43>
+ .byte 15,40,5,234,91,0,0 // movaps 0x5bea(%rip),%xmm0 # 8fe0 <_sk_clut_4D_sse2+0x2038>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -40846,29 +48580,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,223,58,0,0 // mulps 0x3adf(%rip),%xmm0 # 6f10 <_sk_callback_sse2+0xb53>
- .byte 68,15,40,5,231,58,0,0 // movaps 0x3ae7(%rip),%xmm8 # 6f20 <_sk_callback_sse2+0xb63>
+ .byte 15,89,5,191,91,0,0 // mulps 0x5bbf(%rip),%xmm0 # 8ff0 <_sk_clut_4D_sse2+0x2048>
+ .byte 68,15,40,5,199,91,0,0 // movaps 0x5bc7(%rip),%xmm8 # 9000 <_sk_clut_4D_sse2+0x2058>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,235,58,0,0 // movaps 0x3aeb(%rip),%xmm9 # 6f30 <_sk_callback_sse2+0xb73>
+ .byte 68,15,40,13,203,91,0,0 // movaps 0x5bcb(%rip),%xmm9 # 9010 <_sk_clut_4D_sse2+0x2068>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,232,58,0,0 // addps 0x3ae8(%rip),%xmm0 # 6f40 <_sk_callback_sse2+0xb83>
- .byte 15,89,5,241,58,0,0 // mulps 0x3af1(%rip),%xmm0 # 6f50 <_sk_callback_sse2+0xb93>
- .byte 15,89,13,250,58,0,0 // mulps 0x3afa(%rip),%xmm1 # 6f60 <_sk_callback_sse2+0xba3>
+ .byte 15,88,5,200,91,0,0 // addps 0x5bc8(%rip),%xmm0 # 9020 <_sk_clut_4D_sse2+0x2078>
+ .byte 15,89,5,209,91,0,0 // mulps 0x5bd1(%rip),%xmm0 # 9030 <_sk_clut_4D_sse2+0x2088>
+ .byte 15,89,13,218,91,0,0 // mulps 0x5bda(%rip),%xmm1 # 9040 <_sk_clut_4D_sse2+0x2098>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,0,59,0,0 // mulps 0x3b00(%rip),%xmm2 # 6f70 <_sk_callback_sse2+0xbb3>
+ .byte 15,89,21,224,91,0,0 // mulps 0x5be0(%rip),%xmm2 # 9050 <_sk_clut_4D_sse2+0x20a8>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,245,58,0,0 // movaps 0x3af5(%rip),%xmm2 # 6f80 <_sk_callback_sse2+0xbc3>
+ .byte 15,40,21,213,91,0,0 // movaps 0x5bd5(%rip),%xmm2 # 9060 <_sk_clut_4D_sse2+0x20b8>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,244,58,0,0 // movaps 0x3af4(%rip),%xmm10 # 6f90 <_sk_callback_sse2+0xbd3>
+ .byte 68,15,40,21,212,91,0,0 // movaps 0x5bd4(%rip),%xmm10 # 9070 <_sk_clut_4D_sse2+0x20c8>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,248,58,0,0 // movaps 0x3af8(%rip),%xmm11 # 6fa0 <_sk_callback_sse2+0xbe3>
+ .byte 68,15,40,29,216,91,0,0 // movaps 0x5bd8(%rip),%xmm11 # 9080 <_sk_clut_4D_sse2+0x20d8>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -40892,8 +48626,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,168,58,0,0 // mulps 0x3aa8(%rip),%xmm8 # 6fb0 <_sk_callback_sse2+0xbf3>
- .byte 15,89,21,177,58,0,0 // mulps 0x3ab1(%rip),%xmm2 # 6fc0 <_sk_callback_sse2+0xc03>
+ .byte 68,15,89,5,136,91,0,0 // mulps 0x5b88(%rip),%xmm8 # 9090 <_sk_clut_4D_sse2+0x20e8>
+ .byte 15,89,21,145,91,0,0 // mulps 0x5b91(%rip),%xmm2 # 90a0 <_sk_clut_4D_sse2+0x20f8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -40913,9 +48647,9 @@ _sk_load_a8_sse2:
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,139,58,0,0 // pand 0x3a8b(%rip),%xmm0 # 6fd0 <_sk_callback_sse2+0xc13>
+ .byte 102,15,219,5,107,91,0,0 // pand 0x5b6b(%rip),%xmm0 # 90b0 <_sk_clut_4D_sse2+0x2108>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,145,58,0,0 // mulps 0x3a91(%rip),%xmm3 # 6fe0 <_sk_callback_sse2+0xc23>
+ .byte 15,89,29,113,91,0,0 // mulps 0x5b71(%rip),%xmm3 # 90c0 <_sk_clut_4D_sse2+0x2118>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -40958,9 +48692,9 @@ _sk_load_a8_dst_sse2:
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,23,58,0,0 // pand 0x3a17(%rip),%xmm4 # 6ff0 <_sk_callback_sse2+0xc33>
+ .byte 102,15,219,37,247,90,0,0 // pand 0x5af7(%rip),%xmm4 # 90d0 <_sk_clut_4D_sse2+0x2128>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,29,58,0,0 // mulps 0x3a1d(%rip),%xmm7 # 7000 <_sk_callback_sse2+0xc43>
+ .byte 15,89,61,253,90,0,0 // mulps 0x5afd(%rip),%xmm7 # 90e0 <_sk_clut_4D_sse2+0x2138>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -41028,7 +48762,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,62,57,0,0 // mulps 0x393e(%rip),%xmm3 # 7010 <_sk_callback_sse2+0xc53>
+ .byte 15,89,29,30,90,0,0 // mulps 0x5a1e(%rip),%xmm3 # 90f0 <_sk_clut_4D_sse2+0x2148>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -41047,7 +48781,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,34,57,0,0 // movaps 0x3922(%rip),%xmm8 # 7020 <_sk_callback_sse2+0xc63>
+ .byte 68,15,40,5,2,90,0,0 // movaps 0x5a02(%rip),%xmm8 # 9100 <_sk_clut_4D_sse2+0x2158>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -41073,7 +48807,7 @@ _sk_store_a8_sse2:
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,25,2 // mov %al,0x2(%r9,%r11,1)
- .byte 102,68,15,219,5,197,56,0,0 // pand 0x38c5(%rip),%xmm8 # 7030 <_sk_callback_sse2+0xc73>
+ .byte 102,68,15,219,5,165,89,0,0 // pand 0x59a5(%rip),%xmm8 # 9110 <_sk_clut_4D_sse2+0x2168>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
@@ -41099,11 +48833,11 @@ _sk_load_g8_sse2:
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,128,56,0,0 // pand 0x3880(%rip),%xmm0 # 7040 <_sk_callback_sse2+0xc83>
+ .byte 102,15,219,5,96,89,0,0 // pand 0x5960(%rip),%xmm0 # 9120 <_sk_clut_4D_sse2+0x2178>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,134,56,0,0 // mulps 0x3886(%rip),%xmm0 # 7050 <_sk_callback_sse2+0xc93>
+ .byte 15,89,5,102,89,0,0 // mulps 0x5966(%rip),%xmm0 # 9130 <_sk_clut_4D_sse2+0x2188>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,141,56,0,0 // movaps 0x388d(%rip),%xmm3 # 7060 <_sk_callback_sse2+0xca3>
+ .byte 15,40,29,109,89,0,0 // movaps 0x596d(%rip),%xmm3 # 9140 <_sk_clut_4D_sse2+0x2198>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -41144,11 +48878,11 @@ _sk_load_g8_dst_sse2:
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,25,56,0,0 // pand 0x3819(%rip),%xmm4 # 7070 <_sk_callback_sse2+0xcb3>
+ .byte 102,15,219,37,249,88,0,0 // pand 0x58f9(%rip),%xmm4 # 9150 <_sk_clut_4D_sse2+0x21a8>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,31,56,0,0 // mulps 0x381f(%rip),%xmm4 # 7080 <_sk_callback_sse2+0xcc3>
+ .byte 15,89,37,255,88,0,0 // mulps 0x58ff(%rip),%xmm4 # 9160 <_sk_clut_4D_sse2+0x21b8>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,38,56,0,0 // movaps 0x3826(%rip),%xmm7 # 7090 <_sk_callback_sse2+0xcd3>
+ .byte 15,40,61,6,89,0,0 // movaps 0x5906(%rip),%xmm7 # 9170 <_sk_clut_4D_sse2+0x21c8>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
@@ -41214,9 +48948,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,77,55,0,0 // mulps 0x374d(%rip),%xmm0 # 70a0 <_sk_callback_sse2+0xce3>
+ .byte 15,89,5,45,88,0,0 // mulps 0x582d(%rip),%xmm0 # 9180 <_sk_clut_4D_sse2+0x21d8>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,84,55,0,0 // movaps 0x3754(%rip),%xmm3 # 70b0 <_sk_callback_sse2+0xcf3>
+ .byte 15,40,29,52,88,0,0 // movaps 0x5834(%rip),%xmm3 # 9190 <_sk_clut_4D_sse2+0x21e8>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -41238,19 +48972,19 @@ _sk_load_565_sse2:
.byte 117,83 // jne 39d4 <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,89 // movq (%r9,%r11,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,45,55,0,0 // movdqa 0x372d(%rip),%xmm0 # 70c0 <_sk_callback_sse2+0xd03>
+ .byte 102,15,111,5,13,88,0,0 // movdqa 0x580d(%rip),%xmm0 # 91a0 <_sk_clut_4D_sse2+0x21f8>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,47,55,0,0 // mulps 0x372f(%rip),%xmm0 # 70d0 <_sk_callback_sse2+0xd13>
- .byte 102,15,111,13,55,55,0,0 // movdqa 0x3737(%rip),%xmm1 # 70e0 <_sk_callback_sse2+0xd23>
+ .byte 15,89,5,15,88,0,0 // mulps 0x580f(%rip),%xmm0 # 91b0 <_sk_clut_4D_sse2+0x2208>
+ .byte 102,15,111,13,23,88,0,0 // movdqa 0x5817(%rip),%xmm1 # 91c0 <_sk_clut_4D_sse2+0x2218>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,57,55,0,0 // mulps 0x3739(%rip),%xmm1 # 70f0 <_sk_callback_sse2+0xd33>
- .byte 102,15,219,21,65,55,0,0 // pand 0x3741(%rip),%xmm2 # 7100 <_sk_callback_sse2+0xd43>
+ .byte 15,89,13,25,88,0,0 // mulps 0x5819(%rip),%xmm1 # 91d0 <_sk_clut_4D_sse2+0x2228>
+ .byte 102,15,219,21,33,88,0,0 // pand 0x5821(%rip),%xmm2 # 91e0 <_sk_clut_4D_sse2+0x2238>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,71,55,0,0 // mulps 0x3747(%rip),%xmm2 # 7110 <_sk_callback_sse2+0xd53>
+ .byte 15,89,21,39,88,0,0 // mulps 0x5827(%rip),%xmm2 # 91f0 <_sk_clut_4D_sse2+0x2248>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,78,55,0,0 // movaps 0x374e(%rip),%xmm3 # 7120 <_sk_callback_sse2+0xd63>
+ .byte 15,40,29,46,88,0,0 // movaps 0x582e(%rip),%xmm3 # 9200 <_sk_clut_4D_sse2+0x2258>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
@@ -41287,19 +49021,19 @@ _sk_load_565_dst_sse2:
.byte 117,83 // jne 3a8f <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,89 // movq (%r9,%r11,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,226,54,0,0 // movdqa 0x36e2(%rip),%xmm4 # 7130 <_sk_callback_sse2+0xd73>
+ .byte 102,15,111,37,194,87,0,0 // movdqa 0x57c2(%rip),%xmm4 # 9210 <_sk_clut_4D_sse2+0x2268>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,228,54,0,0 // mulps 0x36e4(%rip),%xmm4 # 7140 <_sk_callback_sse2+0xd83>
- .byte 102,15,111,45,236,54,0,0 // movdqa 0x36ec(%rip),%xmm5 # 7150 <_sk_callback_sse2+0xd93>
+ .byte 15,89,37,196,87,0,0 // mulps 0x57c4(%rip),%xmm4 # 9220 <_sk_clut_4D_sse2+0x2278>
+ .byte 102,15,111,45,204,87,0,0 // movdqa 0x57cc(%rip),%xmm5 # 9230 <_sk_clut_4D_sse2+0x2288>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,238,54,0,0 // mulps 0x36ee(%rip),%xmm5 # 7160 <_sk_callback_sse2+0xda3>
- .byte 102,15,219,53,246,54,0,0 // pand 0x36f6(%rip),%xmm6 # 7170 <_sk_callback_sse2+0xdb3>
+ .byte 15,89,45,206,87,0,0 // mulps 0x57ce(%rip),%xmm5 # 9240 <_sk_clut_4D_sse2+0x2298>
+ .byte 102,15,219,53,214,87,0,0 // pand 0x57d6(%rip),%xmm6 # 9250 <_sk_clut_4D_sse2+0x22a8>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,252,54,0,0 // mulps 0x36fc(%rip),%xmm6 # 7180 <_sk_callback_sse2+0xdc3>
+ .byte 15,89,53,220,87,0,0 // mulps 0x57dc(%rip),%xmm6 # 9260 <_sk_clut_4D_sse2+0x22b8>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,3,55,0,0 // movaps 0x3703(%rip),%xmm7 # 7190 <_sk_callback_sse2+0xdd3>
+ .byte 15,40,61,227,87,0,0 // movaps 0x57e3(%rip),%xmm7 # 9270 <_sk_clut_4D_sse2+0x22c8>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
@@ -41354,19 +49088,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,62,54,0,0 // movdqa 0x363e(%rip),%xmm0 # 71a0 <_sk_callback_sse2+0xde3>
+ .byte 102,15,111,5,30,87,0,0 // movdqa 0x571e(%rip),%xmm0 # 9280 <_sk_clut_4D_sse2+0x22d8>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,64,54,0,0 // mulps 0x3640(%rip),%xmm0 # 71b0 <_sk_callback_sse2+0xdf3>
- .byte 102,15,111,13,72,54,0,0 // movdqa 0x3648(%rip),%xmm1 # 71c0 <_sk_callback_sse2+0xe03>
+ .byte 15,89,5,32,87,0,0 // mulps 0x5720(%rip),%xmm0 # 9290 <_sk_clut_4D_sse2+0x22e8>
+ .byte 102,15,111,13,40,87,0,0 // movdqa 0x5728(%rip),%xmm1 # 92a0 <_sk_clut_4D_sse2+0x22f8>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,74,54,0,0 // mulps 0x364a(%rip),%xmm1 # 71d0 <_sk_callback_sse2+0xe13>
- .byte 102,15,219,21,82,54,0,0 // pand 0x3652(%rip),%xmm2 # 71e0 <_sk_callback_sse2+0xe23>
+ .byte 15,89,13,42,87,0,0 // mulps 0x572a(%rip),%xmm1 # 92b0 <_sk_clut_4D_sse2+0x2308>
+ .byte 102,15,219,21,50,87,0,0 // pand 0x5732(%rip),%xmm2 # 92c0 <_sk_clut_4D_sse2+0x2318>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,88,54,0,0 // mulps 0x3658(%rip),%xmm2 # 71f0 <_sk_callback_sse2+0xe33>
+ .byte 15,89,21,56,87,0,0 // mulps 0x5738(%rip),%xmm2 # 92d0 <_sk_clut_4D_sse2+0x2328>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,95,54,0,0 // movaps 0x365f(%rip),%xmm3 # 7200 <_sk_callback_sse2+0xe43>
+ .byte 15,40,29,63,87,0,0 // movaps 0x573f(%rip),%xmm3 # 92e0 <_sk_clut_4D_sse2+0x2338>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -41381,12 +49115,12 @@ _sk_store_565_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,78,54,0,0 // movaps 0x364e(%rip),%xmm8 # 7210 <_sk_callback_sse2+0xe53>
+ .byte 68,15,40,5,46,87,0,0 // movaps 0x572e(%rip),%xmm8 # 92f0 <_sk_clut_4D_sse2+0x2348>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,67,54,0,0 // movaps 0x3643(%rip),%xmm10 # 7220 <_sk_callback_sse2+0xe63>
+ .byte 68,15,40,21,35,87,0,0 // movaps 0x5723(%rip),%xmm10 # 9300 <_sk_clut_4D_sse2+0x2358>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -41435,21 +49169,21 @@ _sk_load_4444_sse2:
.byte 117,98 // jne 3ce0 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,89 // movq (%r9,%r11,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,160,53,0,0 // movdqa 0x35a0(%rip),%xmm0 # 7230 <_sk_callback_sse2+0xe73>
+ .byte 102,15,111,5,128,86,0,0 // movdqa 0x5680(%rip),%xmm0 # 9310 <_sk_clut_4D_sse2+0x2368>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,162,53,0,0 // mulps 0x35a2(%rip),%xmm0 # 7240 <_sk_callback_sse2+0xe83>
- .byte 102,15,111,13,170,53,0,0 // movdqa 0x35aa(%rip),%xmm1 # 7250 <_sk_callback_sse2+0xe93>
+ .byte 15,89,5,130,86,0,0 // mulps 0x5682(%rip),%xmm0 # 9320 <_sk_clut_4D_sse2+0x2378>
+ .byte 102,15,111,13,138,86,0,0 // movdqa 0x568a(%rip),%xmm1 # 9330 <_sk_clut_4D_sse2+0x2388>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,172,53,0,0 // mulps 0x35ac(%rip),%xmm1 # 7260 <_sk_callback_sse2+0xea3>
- .byte 102,15,111,21,180,53,0,0 // movdqa 0x35b4(%rip),%xmm2 # 7270 <_sk_callback_sse2+0xeb3>
+ .byte 15,89,13,140,86,0,0 // mulps 0x568c(%rip),%xmm1 # 9340 <_sk_clut_4D_sse2+0x2398>
+ .byte 102,15,111,21,148,86,0,0 // movdqa 0x5694(%rip),%xmm2 # 9350 <_sk_clut_4D_sse2+0x23a8>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,182,53,0,0 // mulps 0x35b6(%rip),%xmm2 # 7280 <_sk_callback_sse2+0xec3>
- .byte 102,15,219,29,190,53,0,0 // pand 0x35be(%rip),%xmm3 # 7290 <_sk_callback_sse2+0xed3>
+ .byte 15,89,21,150,86,0,0 // mulps 0x5696(%rip),%xmm2 # 9360 <_sk_clut_4D_sse2+0x23b8>
+ .byte 102,15,219,29,158,86,0,0 // pand 0x569e(%rip),%xmm3 # 9370 <_sk_clut_4D_sse2+0x23c8>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,196,53,0,0 // mulps 0x35c4(%rip),%xmm3 # 72a0 <_sk_callback_sse2+0xee3>
+ .byte 15,89,29,164,86,0,0 // mulps 0x56a4(%rip),%xmm3 # 9380 <_sk_clut_4D_sse2+0x23d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -41487,21 +49221,21 @@ _sk_load_4444_dst_sse2:
.byte 117,98 // jne 3daa <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,89 // movq (%r9,%r11,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,86,53,0,0 // movdqa 0x3556(%rip),%xmm4 # 72b0 <_sk_callback_sse2+0xef3>
+ .byte 102,15,111,37,54,86,0,0 // movdqa 0x5636(%rip),%xmm4 # 9390 <_sk_clut_4D_sse2+0x23e8>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,88,53,0,0 // mulps 0x3558(%rip),%xmm4 # 72c0 <_sk_callback_sse2+0xf03>
- .byte 102,15,111,45,96,53,0,0 // movdqa 0x3560(%rip),%xmm5 # 72d0 <_sk_callback_sse2+0xf13>
+ .byte 15,89,37,56,86,0,0 // mulps 0x5638(%rip),%xmm4 # 93a0 <_sk_clut_4D_sse2+0x23f8>
+ .byte 102,15,111,45,64,86,0,0 // movdqa 0x5640(%rip),%xmm5 # 93b0 <_sk_clut_4D_sse2+0x2408>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,98,53,0,0 // mulps 0x3562(%rip),%xmm5 # 72e0 <_sk_callback_sse2+0xf23>
- .byte 102,15,111,53,106,53,0,0 // movdqa 0x356a(%rip),%xmm6 # 72f0 <_sk_callback_sse2+0xf33>
+ .byte 15,89,45,66,86,0,0 // mulps 0x5642(%rip),%xmm5 # 93c0 <_sk_clut_4D_sse2+0x2418>
+ .byte 102,15,111,53,74,86,0,0 // movdqa 0x564a(%rip),%xmm6 # 93d0 <_sk_clut_4D_sse2+0x2428>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,108,53,0,0 // mulps 0x356c(%rip),%xmm6 # 7300 <_sk_callback_sse2+0xf43>
- .byte 102,15,219,61,116,53,0,0 // pand 0x3574(%rip),%xmm7 # 7310 <_sk_callback_sse2+0xf53>
+ .byte 15,89,53,76,86,0,0 // mulps 0x564c(%rip),%xmm6 # 93e0 <_sk_clut_4D_sse2+0x2438>
+ .byte 102,15,219,61,84,86,0,0 // pand 0x5654(%rip),%xmm7 # 93f0 <_sk_clut_4D_sse2+0x2448>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,122,53,0,0 // mulps 0x357a(%rip),%xmm7 # 7320 <_sk_callback_sse2+0xf63>
+ .byte 15,89,61,90,86,0,0 // mulps 0x565a(%rip),%xmm7 # 9400 <_sk_clut_4D_sse2+0x2458>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -41557,21 +49291,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,179,52,0,0 // movdqa 0x34b3(%rip),%xmm0 # 7330 <_sk_callback_sse2+0xf73>
+ .byte 102,15,111,5,147,85,0,0 // movdqa 0x5593(%rip),%xmm0 # 9410 <_sk_clut_4D_sse2+0x2468>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,181,52,0,0 // mulps 0x34b5(%rip),%xmm0 # 7340 <_sk_callback_sse2+0xf83>
- .byte 102,15,111,13,189,52,0,0 // movdqa 0x34bd(%rip),%xmm1 # 7350 <_sk_callback_sse2+0xf93>
+ .byte 15,89,5,149,85,0,0 // mulps 0x5595(%rip),%xmm0 # 9420 <_sk_clut_4D_sse2+0x2478>
+ .byte 102,15,111,13,157,85,0,0 // movdqa 0x559d(%rip),%xmm1 # 9430 <_sk_clut_4D_sse2+0x2488>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,191,52,0,0 // mulps 0x34bf(%rip),%xmm1 # 7360 <_sk_callback_sse2+0xfa3>
- .byte 102,15,111,21,199,52,0,0 // movdqa 0x34c7(%rip),%xmm2 # 7370 <_sk_callback_sse2+0xfb3>
+ .byte 15,89,13,159,85,0,0 // mulps 0x559f(%rip),%xmm1 # 9440 <_sk_clut_4D_sse2+0x2498>
+ .byte 102,15,111,21,167,85,0,0 // movdqa 0x55a7(%rip),%xmm2 # 9450 <_sk_clut_4D_sse2+0x24a8>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,201,52,0,0 // mulps 0x34c9(%rip),%xmm2 # 7380 <_sk_callback_sse2+0xfc3>
- .byte 102,15,219,29,209,52,0,0 // pand 0x34d1(%rip),%xmm3 # 7390 <_sk_callback_sse2+0xfd3>
+ .byte 15,89,21,169,85,0,0 // mulps 0x55a9(%rip),%xmm2 # 9460 <_sk_clut_4D_sse2+0x24b8>
+ .byte 102,15,219,29,177,85,0,0 // pand 0x55b1(%rip),%xmm3 # 9470 <_sk_clut_4D_sse2+0x24c8>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,215,52,0,0 // mulps 0x34d7(%rip),%xmm3 # 73a0 <_sk_callback_sse2+0xfe3>
+ .byte 15,89,29,183,85,0,0 // mulps 0x55b7(%rip),%xmm3 # 9480 <_sk_clut_4D_sse2+0x24d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -41587,7 +49321,7 @@ _sk_store_4444_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,196,52,0,0 // movaps 0x34c4(%rip),%xmm8 # 73b0 <_sk_callback_sse2+0xff3>
+ .byte 68,15,40,5,164,85,0,0 // movaps 0x55a4(%rip),%xmm8 # 9490 <_sk_clut_4D_sse2+0x24e8>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -41645,11 +49379,11 @@ _sk_load_8888_sse2:
.byte 77,133,192 // test %r8,%r8
.byte 117,98 // jne 401f <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,21,245,51,0,0 // movdqa 0x33f5(%rip),%xmm2 # 73c0 <_sk_callback_sse2+0x1003>
+ .byte 102,15,111,21,213,84,0,0 // movdqa 0x54d5(%rip),%xmm2 # 94a0 <_sk_clut_4D_sse2+0x24f8>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,241,51,0,0 // movaps 0x33f1(%rip),%xmm8 # 73d0 <_sk_callback_sse2+0x1013>
+ .byte 68,15,40,5,209,84,0,0 // movaps 0x54d1(%rip),%xmm8 # 94b0 <_sk_clut_4D_sse2+0x2508>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -41696,11 +49430,11 @@ _sk_load_8888_dst_sse2:
.byte 77,133,192 // test %r8,%r8
.byte 117,98 // jne 40de <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,53,86,51,0,0 // movdqa 0x3356(%rip),%xmm6 # 73e0 <_sk_callback_sse2+0x1023>
+ .byte 102,15,111,53,54,84,0,0 // movdqa 0x5436(%rip),%xmm6 # 94c0 <_sk_clut_4D_sse2+0x2518>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,82,51,0,0 // movaps 0x3352(%rip),%xmm8 # 73f0 <_sk_callback_sse2+0x1033>
+ .byte 68,15,40,5,50,84,0,0 // movaps 0x5432(%rip),%xmm8 # 94d0 <_sk_clut_4D_sse2+0x2528>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -41765,11 +49499,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,95,50,0,0 // movdqa 0x325f(%rip),%xmm2 # 7400 <_sk_callback_sse2+0x1043>
+ .byte 102,15,111,21,63,83,0,0 // movdqa 0x533f(%rip),%xmm2 # 94e0 <_sk_clut_4D_sse2+0x2538>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,91,50,0,0 // movaps 0x325b(%rip),%xmm8 # 7410 <_sk_callback_sse2+0x1053>
+ .byte 68,15,40,5,59,83,0,0 // movaps 0x533b(%rip),%xmm8 # 94f0 <_sk_clut_4D_sse2+0x2548>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -41799,7 +49533,7 @@ _sk_store_8888_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,11,50,0,0 // movaps 0x320b(%rip),%xmm8 # 7420 <_sk_callback_sse2+0x1063>
+ .byte 68,15,40,5,235,82,0,0 // movaps 0x52eb(%rip),%xmm8 # 9500 <_sk_clut_4D_sse2+0x2558>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -41851,11 +49585,11 @@ _sk_load_bgra_sse2:
.byte 77,133,192 // test %r8,%r8
.byte 117,98 // jne 4329 <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,5,91,49,0,0 // movdqa 0x315b(%rip),%xmm0 # 7430 <_sk_callback_sse2+0x1073>
+ .byte 102,15,111,5,59,82,0,0 // movdqa 0x523b(%rip),%xmm0 # 9510 <_sk_clut_4D_sse2+0x2568>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,87,49,0,0 // movaps 0x3157(%rip),%xmm8 # 7440 <_sk_callback_sse2+0x1083>
+ .byte 68,15,40,5,55,82,0,0 // movaps 0x5237(%rip),%xmm8 # 9520 <_sk_clut_4D_sse2+0x2578>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -41902,11 +49636,11 @@ _sk_load_bgra_dst_sse2:
.byte 77,133,192 // test %r8,%r8
.byte 117,98 // jne 43e8 <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,37,188,48,0,0 // movdqa 0x30bc(%rip),%xmm4 # 7450 <_sk_callback_sse2+0x1093>
+ .byte 102,15,111,37,156,81,0,0 // movdqa 0x519c(%rip),%xmm4 # 9530 <_sk_clut_4D_sse2+0x2588>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,184,48,0,0 // movaps 0x30b8(%rip),%xmm8 # 7460 <_sk_callback_sse2+0x10a3>
+ .byte 68,15,40,5,152,81,0,0 // movaps 0x5198(%rip),%xmm8 # 9540 <_sk_clut_4D_sse2+0x2598>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -41971,11 +49705,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,197,47,0,0 // movdqa 0x2fc5(%rip),%xmm0 # 7470 <_sk_callback_sse2+0x10b3>
+ .byte 102,15,111,5,165,80,0,0 // movdqa 0x50a5(%rip),%xmm0 # 9550 <_sk_clut_4D_sse2+0x25a8>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,193,47,0,0 // movaps 0x2fc1(%rip),%xmm8 # 7480 <_sk_callback_sse2+0x10c3>
+ .byte 68,15,40,5,161,80,0,0 // movaps 0x50a1(%rip),%xmm8 # 9560 <_sk_clut_4D_sse2+0x25b8>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -42005,7 +49739,7 @@ _sk_store_bgra_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,113,47,0,0 // movaps 0x2f71(%rip),%xmm8 # 7490 <_sk_callback_sse2+0x10d3>
+ .byte 68,15,40,5,81,80,0,0 // movaps 0x5051(%rip),%xmm8 # 9570 <_sk_clut_4D_sse2+0x25c8>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -42067,7 +49801,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,137,46,0,0 // movdqa 0x2e89(%rip),%xmm9 # 74a0 <_sk_callback_sse2+0x10e3>
+ .byte 102,68,15,111,13,105,79,0,0 // movdqa 0x4f69(%rip),%xmm9 # 9580 <_sk_clut_4D_sse2+0x25d8>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -42075,11 +49809,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,110,46,0,0 // movdqa 0x2e6e(%rip),%xmm11 # 74b0 <_sk_callback_sse2+0x10f3>
+ .byte 102,68,15,111,29,78,79,0,0 // movdqa 0x4f4e(%rip),%xmm11 # 9590 <_sk_clut_4D_sse2+0x25e8>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,112,46,0,0 // movdqa 0x2e70(%rip),%xmm12 # 74c0 <_sk_callback_sse2+0x1103>
+ .byte 102,68,15,111,37,80,79,0,0 // movdqa 0x4f50(%rip),%xmm12 # 95a0 <_sk_clut_4D_sse2+0x25f8>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,115,46,0,0 // movdqa 0x2e73(%rip),%xmm3 # 74d0 <_sk_callback_sse2+0x1113>
+ .byte 102,15,111,29,83,79,0,0 // movdqa 0x4f53(%rip),%xmm3 # 95b0 <_sk_clut_4D_sse2+0x2608>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -42163,7 +49897,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,9,45,0,0 // movdqa 0x2d09(%rip),%xmm9 # 74e0 <_sk_callback_sse2+0x1123>
+ .byte 102,68,15,111,13,233,77,0,0 // movdqa 0x4de9(%rip),%xmm9 # 95c0 <_sk_clut_4D_sse2+0x2618>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -42171,11 +49905,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,238,44,0,0 // movdqa 0x2cee(%rip),%xmm11 # 74f0 <_sk_callback_sse2+0x1133>
+ .byte 102,68,15,111,29,206,77,0,0 // movdqa 0x4dce(%rip),%xmm11 # 95d0 <_sk_clut_4D_sse2+0x2628>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,240,44,0,0 // movdqa 0x2cf0(%rip),%xmm12 # 7500 <_sk_callback_sse2+0x1143>
+ .byte 102,68,15,111,37,208,77,0,0 // movdqa 0x4dd0(%rip),%xmm12 # 95e0 <_sk_clut_4D_sse2+0x2638>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,243,44,0,0 // movdqa 0x2cf3(%rip),%xmm7 # 7510 <_sk_callback_sse2+0x1153>
+ .byte 102,15,111,61,211,77,0,0 // movdqa 0x4dd3(%rip),%xmm7 # 95f0 <_sk_clut_4D_sse2+0x2648>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -42275,7 +50009,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,66,43,0,0 // movdqa 0x2b42(%rip),%xmm9 # 7520 <_sk_callback_sse2+0x1163>
+ .byte 102,68,15,111,13,34,76,0,0 // movdqa 0x4c22(%rip),%xmm9 # 9600 <_sk_clut_4D_sse2+0x2658>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -42283,11 +50017,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,39,43,0,0 // movdqa 0x2b27(%rip),%xmm11 # 7530 <_sk_callback_sse2+0x1173>
+ .byte 102,68,15,111,29,7,76,0,0 // movdqa 0x4c07(%rip),%xmm11 # 9610 <_sk_clut_4D_sse2+0x2668>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,41,43,0,0 // movdqa 0x2b29(%rip),%xmm12 # 7540 <_sk_callback_sse2+0x1183>
+ .byte 102,68,15,111,37,9,76,0,0 // movdqa 0x4c09(%rip),%xmm12 # 9620 <_sk_clut_4D_sse2+0x2678>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,44,43,0,0 // movdqa 0x2b2c(%rip),%xmm3 # 7550 <_sk_callback_sse2+0x1193>
+ .byte 102,15,111,29,12,76,0,0 // movdqa 0x4c0c(%rip),%xmm3 # 9630 <_sk_clut_4D_sse2+0x2688>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -42346,17 +50080,17 @@ _sk_store_f16_sse2:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,65,42,0,0 // movdqa 0x2a41(%rip),%xmm10 # 7560 <_sk_callback_sse2+0x11a3>
+ .byte 102,68,15,111,21,33,75,0,0 // movdqa 0x4b21(%rip),%xmm10 # 9640 <_sk_clut_4D_sse2+0x2698>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,52,42,0,0 // movdqa 0x2a34(%rip),%xmm9 # 7570 <_sk_callback_sse2+0x11b3>
+ .byte 102,68,15,111,13,20,75,0,0 // movdqa 0x4b14(%rip),%xmm9 # 9650 <_sk_clut_4D_sse2+0x26a8>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,37,42,0,0 // movdqa 0x2a25(%rip),%xmm11 # 7580 <_sk_callback_sse2+0x11c3>
+ .byte 102,68,15,111,29,5,75,0,0 // movdqa 0x4b05(%rip),%xmm11 # 9660 <_sk_clut_4D_sse2+0x26b8>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -42454,7 +50188,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,116,40,0,0 // movaps 0x2874(%rip),%xmm8 # 7590 <_sk_callback_sse2+0x11d3>
+ .byte 68,15,40,5,84,73,0,0 // movaps 0x4954(%rip),%xmm8 # 9670 <_sk_clut_4D_sse2+0x26c8>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -42530,7 +50264,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,74,39,0,0 // movaps 0x274a(%rip),%xmm9 # 75a0 <_sk_callback_sse2+0x11e3>
+ .byte 68,15,40,13,42,72,0,0 // movaps 0x482a(%rip),%xmm9 # 9680 <_sk_clut_4D_sse2+0x26d8>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -42547,7 +50281,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,17,39,0,0 // movaps 0x2711(%rip),%xmm3 # 75b0 <_sk_callback_sse2+0x11f3>
+ .byte 15,40,29,241,71,0,0 // movaps 0x47f1(%rip),%xmm3 # 9690 <_sk_clut_4D_sse2+0x26e8>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
@@ -42581,7 +50315,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,154,38,0,0 // movaps 0x269a(%rip),%xmm10 # 75c0 <_sk_callback_sse2+0x1203>
+ .byte 68,15,40,21,122,71,0,0 // movaps 0x477a(%rip),%xmm10 # 96a0 <_sk_clut_4D_sse2+0x26f8>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -42820,7 +50554,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,71,35,0,0 // andps 0x2347(%rip),%xmm10 # 75d0 <_sk_callback_sse2+0x1213>
+ .byte 68,15,84,21,39,68,0,0 // andps 0x4427(%rip),%xmm10 # 96b0 <_sk_clut_4D_sse2+0x2708>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -42846,7 +50580,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,253,34,0,0 // andps 0x22fd(%rip),%xmm10 # 75e0 <_sk_callback_sse2+0x1223>
+ .byte 68,15,84,21,221,67,0,0 // andps 0x43dd(%rip),%xmm10 # 96c0 <_sk_clut_4D_sse2+0x2718>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -42872,13 +50606,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,98,39,0,0 // mulss 0x2762(%rip),%xmm11 # 7aa0 <_sk_callback_sse2+0x16e3>
+ .byte 243,68,15,89,29,210,72,0,0 // mulss 0x48d2(%rip),%xmm11 # 9c10 <_sk_clut_4D_sse2+0x2c68>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,147,34,0,0 // andps 0x2293(%rip),%xmm11 # 75f0 <_sk_callback_sse2+0x1233>
+ .byte 68,15,84,29,115,67,0,0 // andps 0x4373(%rip),%xmm11 # 96d0 <_sk_clut_4D_sse2+0x2728>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -42907,13 +50641,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,225,38,0,0 // mulss 0x26e1(%rip),%xmm11 # 7aa4 <_sk_callback_sse2+0x16e7>
+ .byte 243,68,15,89,29,81,72,0,0 // mulss 0x4851(%rip),%xmm11 # 9c14 <_sk_clut_4D_sse2+0x2c6c>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,30,34,0,0 // andps 0x221e(%rip),%xmm11 # 7600 <_sk_callback_sse2+0x1243>
+ .byte 68,15,84,29,254,66,0,0 // andps 0x42fe(%rip),%xmm11 # 96e0 <_sk_clut_4D_sse2+0x2738>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -42936,7 +50670,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,229,33,0,0 // minps 0x21e5(%rip),%xmm8 # 7610 <_sk_callback_sse2+0x1253>
+ .byte 68,15,93,5,197,66,0,0 // minps 0x42c5(%rip),%xmm8 # 96f0 <_sk_clut_4D_sse2+0x2748>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -42949,7 +50683,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,211,33,0,0 // andps 0x21d3(%rip),%xmm9 # 7620 <_sk_callback_sse2+0x1263>
+ .byte 68,15,84,13,179,66,0,0 // andps 0x42b3(%rip),%xmm9 # 9700 <_sk_clut_4D_sse2+0x2758>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -42959,14 +50693,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,207,33,0,0 // movaps 0x21cf(%rip),%xmm8 # 7630 <_sk_callback_sse2+0x1273>
+ .byte 68,15,40,5,175,66,0,0 // movaps 0x42af(%rip),%xmm8 # 9710 <_sk_clut_4D_sse2+0x2768>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,211,33,0,0 // movaps 0x21d3(%rip),%xmm9 # 7640 <_sk_callback_sse2+0x1283>
+ .byte 68,15,40,13,179,66,0,0 // movaps 0x42b3(%rip),%xmm9 # 9720 <_sk_clut_4D_sse2+0x2778>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,201,33,0,0 // andps 0x21c9(%rip),%xmm9 # 7650 <_sk_callback_sse2+0x1293>
+ .byte 68,15,84,13,169,66,0,0 // andps 0x42a9(%rip),%xmm9 # 9730 <_sk_clut_4D_sse2+0x2788>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -42982,10 +50716,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,175,33,0,0 // mulps 0x21af(%rip),%xmm0 # 7660 <_sk_callback_sse2+0x12a3>
- .byte 15,89,13,184,33,0,0 // mulps 0x21b8(%rip),%xmm1 # 7670 <_sk_callback_sse2+0x12b3>
+ .byte 15,89,5,143,66,0,0 // mulps 0x428f(%rip),%xmm0 # 9740 <_sk_clut_4D_sse2+0x2798>
+ .byte 15,89,13,152,66,0,0 // mulps 0x4298(%rip),%xmm1 # 9750 <_sk_clut_4D_sse2+0x27a8>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,190,33,0,0 // mulps 0x21be(%rip),%xmm3 # 7680 <_sk_callback_sse2+0x12c3>
+ .byte 15,89,29,158,66,0,0 // mulps 0x429e(%rip),%xmm3 # 9760 <_sk_clut_4D_sse2+0x27b8>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -43397,15 +51131,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,141,27,0,0 // movaps 0x1b8d(%rip),%xmm0 # 7690 <_sk_callback_sse2+0x12d3>
+ .byte 15,40,5,109,60,0,0 // movaps 0x3c6d(%rip),%xmm0 # 9770 <_sk_clut_4D_sse2+0x27c8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,147,27,0,0 // addps 0x1b93(%rip),%xmm0 # 76a0 <_sk_callback_sse2+0x12e3>
+ .byte 15,88,5,115,60,0,0 // addps 0x3c73(%rip),%xmm0 # 9780 <_sk_clut_4D_sse2+0x27d8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,153,27,0,0 // addps 0x1b99(%rip),%xmm0 # 76b0 <_sk_callback_sse2+0x12f3>
+ .byte 15,88,5,121,60,0,0 // addps 0x3c79(%rip),%xmm0 # 9790 <_sk_clut_4D_sse2+0x27e8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,159,27,0,0 // addps 0x1b9f(%rip),%xmm0 # 76c0 <_sk_callback_sse2+0x1303>
+ .byte 15,88,5,127,60,0,0 // addps 0x3c7f(%rip),%xmm0 # 97a0 <_sk_clut_4D_sse2+0x27f8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,165,27,0,0 // addps 0x1ba5(%rip),%xmm0 # 76d0 <_sk_callback_sse2+0x1313>
+ .byte 15,88,5,133,60,0,0 // addps 0x3c85(%rip),%xmm0 # 97b0 <_sk_clut_4D_sse2+0x2808>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -43428,7 +51162,7 @@ _sk_gradient_sse2:
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,126,27,0,0 // movaps 0x1b7e(%rip),%xmm2 # 76e0 <_sk_callback_sse2+0x1323>
+ .byte 15,40,21,94,60,0,0 // movaps 0x3c5e(%rip),%xmm2 # 97c0 <_sk_clut_4D_sse2+0x2818>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -43575,29 +51309,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,63,25,0,0 // movaps 0x193f(%rip),%xmm13 # 76f0 <_sk_callback_sse2+0x1333>
+ .byte 68,15,40,45,31,58,0,0 // movaps 0x3a1f(%rip),%xmm13 # 97d0 <_sk_clut_4D_sse2+0x2828>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,67,25,0,0 // addps 0x1943(%rip),%xmm13 # 7700 <_sk_callback_sse2+0x1343>
+ .byte 68,15,88,45,35,58,0,0 // addps 0x3a23(%rip),%xmm13 # 97e0 <_sk_clut_4D_sse2+0x2838>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,71,25,0,0 // addps 0x1947(%rip),%xmm13 # 7710 <_sk_callback_sse2+0x1353>
+ .byte 68,15,88,45,39,58,0,0 // addps 0x3a27(%rip),%xmm13 # 97f0 <_sk_clut_4D_sse2+0x2848>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,75,25,0,0 // addps 0x194b(%rip),%xmm13 # 7720 <_sk_callback_sse2+0x1363>
+ .byte 68,15,88,45,43,58,0,0 // addps 0x3a2b(%rip),%xmm13 # 9800 <_sk_clut_4D_sse2+0x2858>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,74,25,0,0 // movaps 0x194a(%rip),%xmm10 # 7730 <_sk_callback_sse2+0x1373>
+ .byte 68,15,40,21,42,58,0,0 // movaps 0x3a2a(%rip),%xmm10 # 9810 <_sk_clut_4D_sse2+0x2868>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,61,25,0,0 // movaps 0x193d(%rip),%xmm10 # 7740 <_sk_callback_sse2+0x1383>
+ .byte 68,15,40,21,29,58,0,0 // movaps 0x3a1d(%rip),%xmm10 # 9820 <_sk_clut_4D_sse2+0x2878>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,44,25,0,0 // movaps 0x192c(%rip),%xmm10 # 7750 <_sk_callback_sse2+0x1393>
+ .byte 68,15,40,21,12,58,0,0 // movaps 0x3a0c(%rip),%xmm10 # 9830 <_sk_clut_4D_sse2+0x2888>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -43632,7 +51366,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,211,24,0,0 // mulps 0x18d3(%rip),%xmm9 # 7760 <_sk_callback_sse2+0x13a3>
+ .byte 68,15,89,13,179,57,0,0 // mulps 0x39b3(%rip),%xmm9 # 9840 <_sk_clut_4D_sse2+0x2898>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -43640,7 +51374,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,190,24,0,0 // mulps 0x18be(%rip),%xmm10 # 7770 <_sk_callback_sse2+0x13b3>
+ .byte 68,15,89,21,158,57,0,0 // mulps 0x399e(%rip),%xmm10 # 9850 <_sk_clut_4D_sse2+0x28a8>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -43649,8 +51383,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,166,24,0,0 // xorps 0x18a6(%rip),%xmm9 # 7780 <_sk_callback_sse2+0x13c3>
- .byte 68,15,89,5,174,24,0,0 // mulps 0x18ae(%rip),%xmm8 # 7790 <_sk_callback_sse2+0x13d3>
+ .byte 68,15,87,13,134,57,0,0 // xorps 0x3986(%rip),%xmm9 # 9860 <_sk_clut_4D_sse2+0x28b8>
+ .byte 68,15,89,5,142,57,0,0 // mulps 0x398e(%rip),%xmm8 # 9870 <_sk_clut_4D_sse2+0x28c8>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -43671,7 +51405,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,117,24,0,0 // mulps 0x1875(%rip),%xmm9 # 77a0 <_sk_callback_sse2+0x13e3>
+ .byte 68,15,89,13,85,57,0,0 // mulps 0x3955(%rip),%xmm9 # 9880 <_sk_clut_4D_sse2+0x28d8>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -43679,7 +51413,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,96,24,0,0 // mulps 0x1860(%rip),%xmm10 # 77b0 <_sk_callback_sse2+0x13f3>
+ .byte 68,15,89,21,64,57,0,0 // mulps 0x3940(%rip),%xmm10 # 9890 <_sk_clut_4D_sse2+0x28e8>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -43688,8 +51422,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,72,24,0,0 // xorps 0x1848(%rip),%xmm9 # 77c0 <_sk_callback_sse2+0x1403>
- .byte 68,15,89,5,80,24,0,0 // mulps 0x1850(%rip),%xmm8 # 77d0 <_sk_callback_sse2+0x1413>
+ .byte 68,15,87,13,40,57,0,0 // xorps 0x3928(%rip),%xmm9 # 98a0 <_sk_clut_4D_sse2+0x28f8>
+ .byte 68,15,89,5,48,57,0,0 // mulps 0x3930(%rip),%xmm8 # 98b0 <_sk_clut_4D_sse2+0x2908>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -43707,7 +51441,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,40,24,0,0 // mulps 0x1828(%rip),%xmm9 # 77e0 <_sk_callback_sse2+0x1423>
+ .byte 68,15,89,13,8,57,0,0 // mulps 0x3908(%rip),%xmm9 # 98c0 <_sk_clut_4D_sse2+0x2918>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -43715,7 +51449,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,20,24,0,0 // xorps 0x1814(%rip),%xmm0 # 77f0 <_sk_callback_sse2+0x1433>
+ .byte 15,87,5,244,56,0,0 // xorps 0x38f4(%rip),%xmm0 # 98d0 <_sk_clut_4D_sse2+0x2928>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43758,7 +51492,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,186,23,0,0 // movaps 0x17ba(%rip),%xmm8 # 7800 <_sk_callback_sse2+0x1443>
+ .byte 68,15,40,5,154,56,0,0 // movaps 0x389a(%rip),%xmm8 # 98e0 <_sk_clut_4D_sse2+0x2938>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -43766,7 +51500,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,165,23,0,0 // movaps 0x17a5(%rip),%xmm12 # 7810 <_sk_callback_sse2+0x1453>
+ .byte 68,15,40,37,133,56,0,0 // movaps 0x3885(%rip),%xmm12 # 98f0 <_sk_clut_4D_sse2+0x2948>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -43813,8 +51547,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,30,23,0,0 // addps 0x171e(%rip),%xmm0 # 7820 <_sk_callback_sse2+0x1463>
- .byte 68,15,40,13,38,23,0,0 // movaps 0x1726(%rip),%xmm9 # 7830 <_sk_callback_sse2+0x1473>
+ .byte 15,88,5,254,55,0,0 // addps 0x37fe(%rip),%xmm0 # 9900 <_sk_clut_4D_sse2+0x2958>
+ .byte 68,15,40,13,6,56,0,0 // movaps 0x3806(%rip),%xmm9 # 9910 <_sk_clut_4D_sse2+0x2968>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43827,7 +51561,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,21,23,0,0 // addps 0x1715(%rip),%xmm0 # 7840 <_sk_callback_sse2+0x1483>
+ .byte 15,88,5,245,55,0,0 // addps 0x37f5(%rip),%xmm0 # 9920 <_sk_clut_4D_sse2+0x2978>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43839,8 +51573,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,7,23,0,0 // addps 0x1707(%rip),%xmm1 # 7850 <_sk_callback_sse2+0x1493>
- .byte 68,15,40,13,15,23,0,0 // movaps 0x170f(%rip),%xmm9 # 7860 <_sk_callback_sse2+0x14a3>
+ .byte 15,88,13,231,55,0,0 // addps 0x37e7(%rip),%xmm1 # 9930 <_sk_clut_4D_sse2+0x2988>
+ .byte 68,15,40,13,239,55,0,0 // movaps 0x37ef(%rip),%xmm9 # 9940 <_sk_clut_4D_sse2+0x2998>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43853,7 +51587,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,253,22,0,0 // addps 0x16fd(%rip),%xmm1 # 7870 <_sk_callback_sse2+0x14b3>
+ .byte 15,88,13,221,55,0,0 // addps 0x37dd(%rip),%xmm1 # 9950 <_sk_clut_4D_sse2+0x29a8>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43865,13 +51599,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,240,22,0,0 // addps 0x16f0(%rip),%xmm0 # 7880 <_sk_callback_sse2+0x14c3>
- .byte 68,15,40,13,248,22,0,0 // movaps 0x16f8(%rip),%xmm9 # 7890 <_sk_callback_sse2+0x14d3>
+ .byte 15,88,5,208,55,0,0 // addps 0x37d0(%rip),%xmm0 # 9960 <_sk_clut_4D_sse2+0x29b8>
+ .byte 68,15,40,13,216,55,0,0 // movaps 0x37d8(%rip),%xmm9 # 9970 <_sk_clut_4D_sse2+0x29c8>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,244,22,0,0 // mulps 0x16f4(%rip),%xmm9 # 78a0 <_sk_callback_sse2+0x14e3>
- .byte 68,15,88,13,252,22,0,0 // addps 0x16fc(%rip),%xmm9 # 78b0 <_sk_callback_sse2+0x14f3>
+ .byte 68,15,89,13,212,55,0,0 // mulps 0x37d4(%rip),%xmm9 # 9980 <_sk_clut_4D_sse2+0x29d8>
+ .byte 68,15,88,13,220,55,0,0 // addps 0x37dc(%rip),%xmm9 # 9990 <_sk_clut_4D_sse2+0x29e8>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43884,16 +51618,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,235,22,0,0 // addps 0x16eb(%rip),%xmm0 # 78c0 <_sk_callback_sse2+0x1503>
- .byte 68,15,40,13,243,22,0,0 // movaps 0x16f3(%rip),%xmm9 # 78d0 <_sk_callback_sse2+0x1513>
+ .byte 15,88,5,203,55,0,0 // addps 0x37cb(%rip),%xmm0 # 99a0 <_sk_clut_4D_sse2+0x29f8>
+ .byte 68,15,40,13,211,55,0,0 // movaps 0x37d3(%rip),%xmm9 # 99b0 <_sk_clut_4D_sse2+0x2a08>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,247,22,0,0 // movaps 0x16f7(%rip),%xmm8 # 78e0 <_sk_callback_sse2+0x1523>
+ .byte 68,15,40,5,215,55,0,0 // movaps 0x37d7(%rip),%xmm8 # 99c0 <_sk_clut_4D_sse2+0x2a18>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,251,22,0,0 // addps 0x16fb(%rip),%xmm8 # 78f0 <_sk_callback_sse2+0x1533>
+ .byte 68,15,88,5,219,55,0,0 // addps 0x37db(%rip),%xmm8 # 99d0 <_sk_clut_4D_sse2+0x2a28>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,255,22,0,0 // addps 0x16ff(%rip),%xmm8 # 7900 <_sk_callback_sse2+0x1543>
+ .byte 68,15,88,5,223,55,0,0 // addps 0x37df(%rip),%xmm8 # 99e0 <_sk_clut_4D_sse2+0x2a38>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,3,23,0,0 // addps 0x1703(%rip),%xmm8 # 7910 <_sk_callback_sse2+0x1553>
+ .byte 68,15,88,5,227,55,0,0 // addps 0x37e3(%rip),%xmm8 # 99f0 <_sk_clut_4D_sse2+0x2a48>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43903,17 +51637,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,253,22,0,0 // movaps 0x16fd(%rip),%xmm8 # 7920 <_sk_callback_sse2+0x1563>
+ .byte 68,15,40,5,221,55,0,0 // movaps 0x37dd(%rip),%xmm8 # 9a00 <_sk_clut_4D_sse2+0x2a58>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,249,22,0,0 // movaps 0x16f9(%rip),%xmm10 # 7930 <_sk_callback_sse2+0x1573>
+ .byte 68,15,40,21,217,55,0,0 // movaps 0x37d9(%rip),%xmm10 # 9a10 <_sk_clut_4D_sse2+0x2a68>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,253,22,0,0 // addps 0x16fd(%rip),%xmm10 # 7940 <_sk_callback_sse2+0x1583>
+ .byte 68,15,88,21,221,55,0,0 // addps 0x37dd(%rip),%xmm10 # 9a20 <_sk_clut_4D_sse2+0x2a78>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,249,22,0,0 // addps 0x16f9(%rip),%xmm10 # 7950 <_sk_callback_sse2+0x1593>
+ .byte 68,15,88,21,217,55,0,0 // addps 0x37d9(%rip),%xmm10 # 9a30 <_sk_clut_4D_sse2+0x2a88>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43925,11 +51659,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,236,22,0,0 // addps 0x16ec(%rip),%xmm0 # 7960 <_sk_callback_sse2+0x15a3>
+ .byte 15,88,5,204,55,0,0 // addps 0x37cc(%rip),%xmm0 # 9a40 <_sk_clut_4D_sse2+0x2a98>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,236,22,0,0 // mulps 0x16ec(%rip),%xmm8 # 7970 <_sk_callback_sse2+0x15b3>
- .byte 68,15,88,5,244,22,0,0 // addps 0x16f4(%rip),%xmm8 # 7980 <_sk_callback_sse2+0x15c3>
+ .byte 68,15,89,5,204,55,0,0 // mulps 0x37cc(%rip),%xmm8 # 9a50 <_sk_clut_4D_sse2+0x2aa8>
+ .byte 68,15,88,5,212,55,0,0 // addps 0x37d4(%rip),%xmm8 # 9a60 <_sk_clut_4D_sse2+0x2ab8>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43942,13 +51676,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,226,22,0,0 // addps 0x16e2(%rip),%xmm1 # 7990 <_sk_callback_sse2+0x15d3>
- .byte 68,15,40,13,234,22,0,0 // movaps 0x16ea(%rip),%xmm9 # 79a0 <_sk_callback_sse2+0x15e3>
+ .byte 15,88,13,194,55,0,0 // addps 0x37c2(%rip),%xmm1 # 9a70 <_sk_clut_4D_sse2+0x2ac8>
+ .byte 68,15,40,13,202,55,0,0 // movaps 0x37ca(%rip),%xmm9 # 9a80 <_sk_clut_4D_sse2+0x2ad8>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,230,22,0,0 // mulps 0x16e6(%rip),%xmm9 # 79b0 <_sk_callback_sse2+0x15f3>
- .byte 68,15,88,13,238,22,0,0 // addps 0x16ee(%rip),%xmm9 # 79c0 <_sk_callback_sse2+0x1603>
+ .byte 68,15,89,13,198,55,0,0 // mulps 0x37c6(%rip),%xmm9 # 9a90 <_sk_clut_4D_sse2+0x2ae8>
+ .byte 68,15,88,13,206,55,0,0 // addps 0x37ce(%rip),%xmm9 # 9aa0 <_sk_clut_4D_sse2+0x2af8>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43961,16 +51695,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,220,22,0,0 // addps 0x16dc(%rip),%xmm1 # 79d0 <_sk_callback_sse2+0x1613>
- .byte 68,15,40,13,228,22,0,0 // movaps 0x16e4(%rip),%xmm9 # 79e0 <_sk_callback_sse2+0x1623>
+ .byte 15,88,13,188,55,0,0 // addps 0x37bc(%rip),%xmm1 # 9ab0 <_sk_clut_4D_sse2+0x2b08>
+ .byte 68,15,40,13,196,55,0,0 // movaps 0x37c4(%rip),%xmm9 # 9ac0 <_sk_clut_4D_sse2+0x2b18>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,232,22,0,0 // movaps 0x16e8(%rip),%xmm8 # 79f0 <_sk_callback_sse2+0x1633>
+ .byte 68,15,40,5,200,55,0,0 // movaps 0x37c8(%rip),%xmm8 # 9ad0 <_sk_clut_4D_sse2+0x2b28>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,236,22,0,0 // addps 0x16ec(%rip),%xmm8 # 7a00 <_sk_callback_sse2+0x1643>
+ .byte 68,15,88,5,204,55,0,0 // addps 0x37cc(%rip),%xmm8 # 9ae0 <_sk_clut_4D_sse2+0x2b38>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,240,22,0,0 // addps 0x16f0(%rip),%xmm8 # 7a10 <_sk_callback_sse2+0x1653>
+ .byte 68,15,88,5,208,55,0,0 // addps 0x37d0(%rip),%xmm8 # 9af0 <_sk_clut_4D_sse2+0x2b48>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,244,22,0,0 // addps 0x16f4(%rip),%xmm8 # 7a20 <_sk_callback_sse2+0x1663>
+ .byte 68,15,88,5,212,55,0,0 // addps 0x37d4(%rip),%xmm8 # 9b00 <_sk_clut_4D_sse2+0x2b58>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43980,17 +51714,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,238,22,0,0 // movaps 0x16ee(%rip),%xmm8 # 7a30 <_sk_callback_sse2+0x1673>
+ .byte 68,15,40,5,206,55,0,0 // movaps 0x37ce(%rip),%xmm8 # 9b10 <_sk_clut_4D_sse2+0x2b68>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,233,22,0,0 // movaps 0x16e9(%rip),%xmm10 # 7a40 <_sk_callback_sse2+0x1683>
+ .byte 68,15,40,21,201,55,0,0 // movaps 0x37c9(%rip),%xmm10 # 9b20 <_sk_clut_4D_sse2+0x2b78>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,237,22,0,0 // addps 0x16ed(%rip),%xmm10 # 7a50 <_sk_callback_sse2+0x1693>
+ .byte 68,15,88,21,205,55,0,0 // addps 0x37cd(%rip),%xmm10 # 9b30 <_sk_clut_4D_sse2+0x2b88>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,233,22,0,0 // addps 0x16e9(%rip),%xmm10 # 7a60 <_sk_callback_sse2+0x16a3>
+ .byte 68,15,88,21,201,55,0,0 // addps 0x37c9(%rip),%xmm10 # 9b40 <_sk_clut_4D_sse2+0x2b98>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -44002,11 +51736,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,219,22,0,0 // addps 0x16db(%rip),%xmm1 # 7a70 <_sk_callback_sse2+0x16b3>
+ .byte 15,88,13,187,55,0,0 // addps 0x37bb(%rip),%xmm1 # 9b50 <_sk_clut_4D_sse2+0x2ba8>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,219,22,0,0 // mulps 0x16db(%rip),%xmm8 # 7a80 <_sk_callback_sse2+0x16c3>
- .byte 68,15,88,5,227,22,0,0 // addps 0x16e3(%rip),%xmm8 # 7a90 <_sk_callback_sse2+0x16d3>
+ .byte 68,15,89,5,187,55,0,0 // mulps 0x37bb(%rip),%xmm8 # 9b60 <_sk_clut_4D_sse2+0x2bb8>
+ .byte 68,15,88,5,195,55,0,0 // addps 0x37c3(%rip),%xmm8 # 9b70 <_sk_clut_4D_sse2+0x2bc8>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44092,6 +51826,1904 @@ _sk_callback_sse2:
.byte 93 // pop %rbp
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_clut_3D_sse2
+.globl _sk_clut_3D_sse2
+FUNCTION(_sk_clut_3D_sse2)
+_sk_clut_3D_sse2:
+ .byte 83 // push %rbx
+ .byte 72,131,236,48 // sub $0x30,%rsp
+ .byte 15,41,124,36,32 // movaps %xmm7,0x20(%rsp)
+ .byte 15,41,116,36,16 // movaps %xmm6,0x10(%rsp)
+ .byte 15,41,44,36 // movaps %xmm5,(%rsp)
+ .byte 15,41,100,36,240 // movaps %xmm4,-0x10(%rsp)
+ .byte 15,41,92,36,224 // movaps %xmm3,-0x20(%rsp)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,16 // mov 0x10(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 102,65,15,110,218 // movd %r10d,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,89,218 // mulps %xmm2,%xmm3
+ .byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 102,65,15,110,209 // movd %r9d,%xmm2
+ .byte 102,68,15,112,250,0 // pshufd $0x0,%xmm2,%xmm15
+ .byte 68,139,72,12 // mov 0xc(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 102,65,15,110,218 // movd %r10d,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 68,15,91,211 // cvtdq2ps %xmm3,%xmm10
+ .byte 68,15,89,209 // mulps %xmm1,%xmm10
+ .byte 243,65,15,91,226 // cvttps2dq %xmm10,%xmm4
+ .byte 102,15,127,100,36,128 // movdqa %xmm4,-0x80(%rsp)
+ .byte 68,15,41,84,36,144 // movaps %xmm10,-0x70(%rsp)
+ .byte 102,15,112,204,245 // pshufd $0xf5,%xmm4,%xmm1
+ .byte 102,15,111,220 // movdqa %xmm4,%xmm3
+ .byte 102,65,15,244,223 // pmuludq %xmm15,%xmm3
+ .byte 102,68,15,112,203,232 // pshufd $0xe8,%xmm3,%xmm9
+ .byte 102,65,15,244,207 // pmuludq %xmm15,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
+ .byte 102,65,15,110,201 // movd %r9d,%xmm1
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,15,112,209,0 // pshufd $0x0,%xmm1,%xmm2
+ .byte 68,139,72,8 // mov 0x8(%rax),%r9d
+ .byte 65,255,201 // dec %r9d
+ .byte 102,65,15,110,201 // movd %r9d,%xmm1
+ .byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
+ .byte 68,15,91,233 // cvtdq2ps %xmm1,%xmm13
+ .byte 68,15,89,232 // mulps %xmm0,%xmm13
+ .byte 243,69,15,91,229 // cvttps2dq %xmm13,%xmm12
+ .byte 102,65,15,112,196,245 // pshufd $0xf5,%xmm12,%xmm0
+ .byte 102,65,15,111,204 // movdqa %xmm12,%xmm1
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,68,15,112,241,232 // pshufd $0xe8,%xmm1,%xmm14
+ .byte 102,68,15,112,194,245 // pshufd $0xf5,%xmm2,%xmm8
+ .byte 102,65,15,244,192 // pmuludq %xmm8,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,68,15,98,240 // punpckldq %xmm0,%xmm14
+ .byte 243,15,91,197 // cvttps2dq %xmm5,%xmm0
+ .byte 102,15,127,68,36,176 // movdqa %xmm0,-0x50(%rsp)
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,41,100,36,208 // movaps %xmm4,-0x30(%rsp)
+ .byte 102,65,15,111,217 // movdqa %xmm9,%xmm3
+ .byte 102,15,254,216 // paddd %xmm0,%xmm3
+ .byte 102,65,15,111,198 // movdqa %xmm14,%xmm0
+ .byte 102,15,254,195 // paddd %xmm3,%xmm0
+ .byte 102,15,111,45,205,53,0,0 // movdqa 0x35cd(%rip),%xmm5 # 9b90 <_sk_clut_4D_sse2+0x2be8>
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,244,197 // pmuludq %xmm5,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,244,205 // pmuludq %xmm5,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,65,15,126,201 // movd %xmm1,%r9d
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,65,15,126,202 // movd %xmm1,%r10d
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,65,15,126,203 // movd %xmm1,%r11d
+ .byte 72,139,24 // mov (%rax),%rbx
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,233 // unpcklps %xmm1,%xmm5
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,12,147 // movss (%rbx,%r10,4),%xmm1
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,254,13,113,53,0,0 // paddd 0x3571(%rip),%xmm1 # 9ba0 <_sk_clut_4D_sse2+0x2bf8>
+ .byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,44,155 // movss (%rbx,%r11,4),%xmm5
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,253 // unpcklps %xmm5,%xmm7
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 102,15,254,5,55,53,0,0 // paddd 0x3537(%rip),%xmm0 # 9bb0 <_sk_clut_4D_sse2+0x2c08>
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,73,15,126,201 // movq %xmm1,%r9
+ .byte 102,73,15,126,194 // movq %xmm0,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 15,40,45,190,52,0,0 // movaps 0x34be(%rip),%xmm5 # 9b80 <_sk_clut_4D_sse2+0x2bd8>
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 15,41,100,36,192 // movaps %xmm4,-0x40(%rsp)
+ .byte 68,15,88,213 // addps %xmm5,%xmm10
+ .byte 65,15,88,237 // addps %xmm13,%xmm5
+ .byte 243,15,91,237 // cvttps2dq %xmm5,%xmm5
+ .byte 102,15,244,213 // pmuludq %xmm5,%xmm2
+ .byte 102,15,112,237,245 // pshufd $0xf5,%xmm5,%xmm5
+ .byte 102,65,15,244,232 // pmuludq %xmm8,%xmm5
+ .byte 102,15,112,194,232 // pshufd $0xe8,%xmm2,%xmm0
+ .byte 102,15,112,213,232 // pshufd $0xe8,%xmm5,%xmm2
+ .byte 102,15,98,194 // punpckldq %xmm2,%xmm0
+ .byte 102,15,127,68,36,160 // movdqa %xmm0,-0x60(%rsp)
+ .byte 102,15,254,216 // paddd %xmm0,%xmm3
+ .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
+ .byte 102,15,111,5,135,52,0,0 // movdqa 0x3487(%rip),%xmm0 # 9b90 <_sk_clut_4D_sse2+0x2be8>
+ .byte 102,15,244,216 // pmuludq %xmm0,%xmm3
+ .byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
+ .byte 102,15,244,224 // pmuludq %xmm0,%xmm4
+ .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8
+ .byte 102,15,112,220,232 // pshufd $0xe8,%xmm4,%xmm3
+ .byte 102,15,98,211 // punpckldq %xmm3,%xmm2
+ .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
+ .byte 102,65,15,126,218 // movd %xmm3,%r10d
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,65,15,126,217 // movd %xmm3,%r9d
+ .byte 102,15,112,218,231 // pshufd $0xe7,%xmm2,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,44,147 // movss (%rbx,%r10,4),%xmm5
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 15,20,229 // unpcklps %xmm5,%xmm4
+ .byte 102,15,111,218 // movdqa %xmm2,%xmm3
+ .byte 102,15,254,29,48,52,0,0 // paddd 0x3430(%rip),%xmm3 # 9ba0 <_sk_clut_4D_sse2+0x2bf8>
+ .byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 15,20,221 // unpcklps %xmm5,%xmm3
+ .byte 102,15,254,21,246,51,0,0 // paddd 0x33f6(%rip),%xmm2 # 9bb0 <_sk_clut_4D_sse2+0x2c08>
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,73,15,126,193 // movq %xmm0,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,194 // unpcklps %xmm2,%xmm0
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
+ .byte 15,20,208 // unpcklps %xmm0,%xmm2
+ .byte 65,15,91,196 // cvtdq2ps %xmm12,%xmm0
+ .byte 68,15,92,232 // subps %xmm0,%xmm13
+ .byte 15,92,230 // subps %xmm6,%xmm4
+ .byte 65,15,89,229 // mulps %xmm13,%xmm4
+ .byte 15,88,230 // addps %xmm6,%xmm4
+ .byte 15,92,223 // subps %xmm7,%xmm3
+ .byte 65,15,89,221 // mulps %xmm13,%xmm3
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 15,92,209 // subps %xmm1,%xmm2
+ .byte 65,15,89,213 // mulps %xmm13,%xmm2
+ .byte 15,88,209 // addps %xmm1,%xmm2
+ .byte 243,65,15,91,194 // cvttps2dq %xmm10,%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,65,15,244,199 // pmuludq %xmm15,%xmm0
+ .byte 102,65,15,244,207 // pmuludq %xmm15,%xmm1
+ .byte 102,68,15,112,224,232 // pshufd $0xe8,%xmm0,%xmm12
+ .byte 102,15,112,193,232 // pshufd $0xe8,%xmm1,%xmm0
+ .byte 102,68,15,98,224 // punpckldq %xmm0,%xmm12
+ .byte 102,65,15,111,244 // movdqa %xmm12,%xmm6
+ .byte 102,15,254,116,36,176 // paddd -0x50(%rsp),%xmm6
+ .byte 102,15,111,198 // movdqa %xmm6,%xmm0
+ .byte 102,65,15,254,198 // paddd %xmm14,%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,65,15,111,232 // movdqa %xmm8,%xmm5
+ .byte 102,15,244,197 // pmuludq %xmm5,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,244,205 // pmuludq %xmm5,%xmm1
+ .byte 102,68,15,111,221 // movdqa %xmm5,%xmm11
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,65,15,126,202 // movd %xmm1,%r10d
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,65,15,126,201 // movd %xmm1,%r9d
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,60,147 // movss (%rbx,%r10,4),%xmm7
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,68,15,16,4,131 // movss (%rbx,%rax,4),%xmm8
+ .byte 243,66,15,16,12,139 // movss (%rbx,%r9,4),%xmm1
+ .byte 68,15,20,193 // unpcklps %xmm1,%xmm8
+ .byte 68,15,20,199 // unpcklps %xmm7,%xmm8
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,68,15,111,21,209,50,0,0 // movdqa 0x32d1(%rip),%xmm10 # 9ba0 <_sk_clut_4D_sse2+0x2bf8>
+ .byte 102,65,15,254,202 // paddd %xmm10,%xmm1
+ .byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7
+ .byte 102,73,15,126,249 // movq %xmm7,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 102,15,111,45,146,50,0,0 // movdqa 0x3292(%rip),%xmm5 # 9bb0 <_sk_clut_4D_sse2+0x2c08>
+ .byte 102,15,254,197 // paddd %xmm5,%xmm0
+ .byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,194 // movq %xmm0,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,4,155 // movss (%rbx,%r11,4),%xmm0
+ .byte 15,20,232 // unpcklps %xmm0,%xmm5
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,20,197 // unpcklps %xmm5,%xmm0
+ .byte 102,15,254,116,36,160 // paddd -0x60(%rsp),%xmm6
+ .byte 102,15,112,238,245 // pshufd $0xf5,%xmm6,%xmm5
+ .byte 102,65,15,111,251 // movdqa %xmm11,%xmm7
+ .byte 102,15,244,247 // pmuludq %xmm7,%xmm6
+ .byte 102,15,112,246,232 // pshufd $0xe8,%xmm6,%xmm6
+ .byte 102,15,244,239 // pmuludq %xmm7,%xmm5
+ .byte 102,15,112,237,232 // pshufd $0xe8,%xmm5,%xmm5
+ .byte 102,15,98,245 // punpckldq %xmm5,%xmm6
+ .byte 102,15,112,238,229 // pshufd $0xe5,%xmm6,%xmm5
+ .byte 102,65,15,126,234 // movd %xmm5,%r10d
+ .byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5
+ .byte 102,65,15,126,233 // movd %xmm5,%r9d
+ .byte 102,15,112,238,231 // pshufd $0xe7,%xmm6,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,60,147 // movss (%rbx,%r10,4),%xmm7
+ .byte 15,20,253 // unpcklps %xmm5,%xmm7
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 243,68,15,16,60,131 // movss (%rbx,%rax,4),%xmm15
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 68,15,20,253 // unpcklps %xmm5,%xmm15
+ .byte 68,15,20,255 // unpcklps %xmm7,%xmm15
+ .byte 102,15,111,238 // movdqa %xmm6,%xmm5
+ .byte 102,65,15,254,234 // paddd %xmm10,%xmm5
+ .byte 102,15,112,253,78 // pshufd $0x4e,%xmm5,%xmm7
+ .byte 102,73,15,126,249 // movq %xmm7,%r9
+ .byte 102,73,15,126,234 // movq %xmm5,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,60,155 // movss (%rbx,%r11,4),%xmm7
+ .byte 15,20,239 // unpcklps %xmm7,%xmm5
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,28,131 // movss (%rbx,%rax,4),%xmm11
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 68,15,20,223 // unpcklps %xmm7,%xmm11
+ .byte 68,15,20,221 // unpcklps %xmm5,%xmm11
+ .byte 102,15,111,45,141,49,0,0 // movdqa 0x318d(%rip),%xmm5 # 9bb0 <_sk_clut_4D_sse2+0x2c08>
+ .byte 102,15,254,245 // paddd %xmm5,%xmm6
+ .byte 102,15,111,253 // movdqa %xmm5,%xmm7
+ .byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,242 // movq %xmm6,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,52,155 // movss (%rbx,%r11,4),%xmm6
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,20,131 // movss (%rbx,%rax,4),%xmm10
+ .byte 243,66,15,16,52,139 // movss (%rbx,%r9,4),%xmm6
+ .byte 68,15,20,214 // unpcklps %xmm6,%xmm10
+ .byte 68,15,20,213 // unpcklps %xmm5,%xmm10
+ .byte 69,15,92,248 // subps %xmm8,%xmm15
+ .byte 69,15,89,253 // mulps %xmm13,%xmm15
+ .byte 69,15,88,248 // addps %xmm8,%xmm15
+ .byte 68,15,92,217 // subps %xmm1,%xmm11
+ .byte 69,15,89,221 // mulps %xmm13,%xmm11
+ .byte 68,15,88,217 // addps %xmm1,%xmm11
+ .byte 68,15,92,208 // subps %xmm0,%xmm10
+ .byte 69,15,89,213 // mulps %xmm13,%xmm10
+ .byte 68,15,88,208 // addps %xmm0,%xmm10
+ .byte 15,91,68,36,128 // cvtdq2ps -0x80(%rsp),%xmm0
+ .byte 15,40,76,36,144 // movaps -0x70(%rsp),%xmm1
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,41,76,36,144 // movaps %xmm1,-0x70(%rsp)
+ .byte 68,15,92,252 // subps %xmm4,%xmm15
+ .byte 68,15,89,249 // mulps %xmm1,%xmm15
+ .byte 68,15,88,252 // addps %xmm4,%xmm15
+ .byte 68,15,92,219 // subps %xmm3,%xmm11
+ .byte 68,15,89,217 // mulps %xmm1,%xmm11
+ .byte 68,15,88,219 // addps %xmm3,%xmm11
+ .byte 68,15,92,210 // subps %xmm2,%xmm10
+ .byte 68,15,89,209 // mulps %xmm1,%xmm10
+ .byte 68,15,88,210 // addps %xmm2,%xmm10
+ .byte 243,15,91,68,36,192 // cvttps2dq -0x40(%rsp),%xmm0
+ .byte 102,15,127,68,36,128 // movdqa %xmm0,-0x80(%rsp)
+ .byte 102,68,15,254,200 // paddd %xmm0,%xmm9
+ .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
+ .byte 102,65,15,254,201 // paddd %xmm9,%xmm1
+ .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
+ .byte 102,15,111,5,158,48,0,0 // movdqa 0x309e(%rip),%xmm0 # 9b90 <_sk_clut_4D_sse2+0x2be8>
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
+ .byte 102,15,244,208 // pmuludq %xmm0,%xmm2
+ .byte 102,15,111,240 // movdqa %xmm0,%xmm6
+ .byte 102,15,112,202,232 // pshufd $0xe8,%xmm2,%xmm1
+ .byte 102,15,98,217 // punpckldq %xmm1,%xmm3
+ .byte 102,15,112,203,229 // pshufd $0xe5,%xmm3,%xmm1
+ .byte 102,65,15,126,202 // movd %xmm1,%r10d
+ .byte 102,15,112,203,78 // pshufd $0x4e,%xmm3,%xmm1
+ .byte 102,65,15,126,201 // movd %xmm1,%r9d
+ .byte 102,15,112,203,231 // pshufd $0xe7,%xmm3,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,20,147 // movss (%rbx,%r10,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 15,20,202 // unpcklps %xmm2,%xmm1
+ .byte 102,15,111,211 // movdqa %xmm3,%xmm2
+ .byte 102,15,111,5,72,48,0,0 // movdqa 0x3048(%rip),%xmm0 # 9ba0 <_sk_clut_4D_sse2+0x2bf8>
+ .byte 102,15,254,208 // paddd %xmm0,%xmm2
+ .byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,226 // unpcklps %xmm2,%xmm4
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
+ .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 102,15,254,223 // paddd %xmm7,%xmm3
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,36,155 // movss (%rbx,%r11,4),%xmm4
+ .byte 15,20,220 // unpcklps %xmm4,%xmm3
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,229 // unpcklps %xmm5,%xmm4
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 102,15,111,124,36,160 // movdqa -0x60(%rsp),%xmm7
+ .byte 102,68,15,254,207 // paddd %xmm7,%xmm9
+ .byte 102,65,15,112,233,245 // pshufd $0xf5,%xmm9,%xmm5
+ .byte 102,68,15,244,206 // pmuludq %xmm6,%xmm9
+ .byte 102,65,15,112,217,232 // pshufd $0xe8,%xmm9,%xmm3
+ .byte 102,15,244,238 // pmuludq %xmm6,%xmm5
+ .byte 102,68,15,111,206 // movdqa %xmm6,%xmm9
+ .byte 102,15,112,237,232 // pshufd $0xe8,%xmm5,%xmm5
+ .byte 102,15,98,221 // punpckldq %xmm5,%xmm3
+ .byte 102,15,112,235,229 // pshufd $0xe5,%xmm3,%xmm5
+ .byte 102,65,15,126,234 // movd %xmm5,%r10d
+ .byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5
+ .byte 102,65,15,126,233 // movd %xmm5,%r9d
+ .byte 102,15,112,235,231 // pshufd $0xe7,%xmm3,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,52,147 // movss (%rbx,%r10,4),%xmm6
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,68,15,16,4,131 // movss (%rbx,%rax,4),%xmm8
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 68,15,20,197 // unpcklps %xmm5,%xmm8
+ .byte 68,15,20,198 // unpcklps %xmm6,%xmm8
+ .byte 102,15,111,235 // movdqa %xmm3,%xmm5
+ .byte 102,15,254,232 // paddd %xmm0,%xmm5
+ .byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
+ .byte 102,73,15,126,241 // movq %xmm6,%r9
+ .byte 102,73,15,126,234 // movq %xmm5,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,52,155 // movss (%rbx,%r11,4),%xmm6
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 102,15,254,29,9,47,0,0 // paddd 0x2f09(%rip),%xmm3 # 9bb0 <_sk_clut_4D_sse2+0x2c08>
+ .byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
+ .byte 102,73,15,126,193 // movq %xmm0,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 15,20,232 // unpcklps %xmm0,%xmm5
+ .byte 68,15,92,193 // subps %xmm1,%xmm8
+ .byte 69,15,89,197 // mulps %xmm13,%xmm8
+ .byte 68,15,88,193 // addps %xmm1,%xmm8
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 65,15,89,245 // mulps %xmm13,%xmm6
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 65,15,89,237 // mulps %xmm13,%xmm5
+ .byte 15,88,236 // addps %xmm4,%xmm5
+ .byte 102,68,15,254,100,36,128 // paddd -0x80(%rsp),%xmm12
+ .byte 102,69,15,254,244 // paddd %xmm12,%xmm14
+ .byte 102,65,15,112,206,245 // pshufd $0xf5,%xmm14,%xmm1
+ .byte 102,65,15,111,209 // movdqa %xmm9,%xmm2
+ .byte 102,68,15,244,242 // pmuludq %xmm2,%xmm14
+ .byte 102,65,15,112,198,232 // pshufd $0xe8,%xmm14,%xmm0
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,15,111,226 // movdqa %xmm2,%xmm4
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,65,15,126,202 // movd %xmm1,%r10d
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,65,15,126,201 // movd %xmm1,%r9d
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,20,147 // movss (%rbx,%r10,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,68,15,16,12,131 // movss (%rbx,%rax,4),%xmm9
+ .byte 243,66,15,16,12,139 // movss (%rbx,%r9,4),%xmm1
+ .byte 68,15,20,201 // unpcklps %xmm1,%xmm9
+ .byte 68,15,20,202 // unpcklps %xmm2,%xmm9
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,254,13,21,46,0,0 // paddd 0x2e15(%rip),%xmm1 # 9ba0 <_sk_clut_4D_sse2+0x2bf8>
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,73,15,126,209 // movq %xmm2,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,202 // unpcklps %xmm2,%xmm1
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,52,131 // movss (%rbx,%rax,4),%xmm14
+ .byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
+ .byte 68,15,20,242 // unpcklps %xmm2,%xmm14
+ .byte 68,15,20,241 // unpcklps %xmm1,%xmm14
+ .byte 102,15,254,5,216,45,0,0 // paddd 0x2dd8(%rip),%xmm0 # 9bb0 <_sk_clut_4D_sse2+0x2c08>
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,73,15,126,201 // movq %xmm1,%r9
+ .byte 102,73,15,126,194 // movq %xmm0,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,12,139 // movss (%rbx,%r9,4),%xmm1
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 102,68,15,254,231 // paddd %xmm7,%xmm12
+ .byte 102,65,15,112,196,245 // pshufd $0xf5,%xmm12,%xmm0
+ .byte 102,68,15,244,228 // pmuludq %xmm4,%xmm12
+ .byte 102,15,244,196 // pmuludq %xmm4,%xmm0
+ .byte 102,65,15,112,212,232 // pshufd $0xe8,%xmm12,%xmm2
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,65,15,126,194 // movd %xmm0,%r10d
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,65,15,126,193 // movd %xmm0,%r9d
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,12,147 // movss (%rbx,%r10,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 102,15,111,37,27,45,0,0 // movdqa 0x2d1b(%rip),%xmm4 # 9ba0 <_sk_clut_4D_sse2+0x2bf8>
+ .byte 102,15,254,226 // paddd %xmm2,%xmm4
+ .byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1
+ .byte 102,73,15,126,201 // movq %xmm1,%r9
+ .byte 102,73,15,126,226 // movq %xmm4,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 102,15,254,21,221,44,0,0 // paddd 0x2cdd(%rip),%xmm2 # 9bb0 <_sk_clut_4D_sse2+0x2c08>
+ .byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,226 // unpcklps %xmm2,%xmm4
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 65,15,92,193 // subps %xmm9,%xmm0
+ .byte 65,15,89,197 // mulps %xmm13,%xmm0
+ .byte 65,15,88,193 // addps %xmm9,%xmm0
+ .byte 65,15,92,206 // subps %xmm14,%xmm1
+ .byte 65,15,89,205 // mulps %xmm13,%xmm1
+ .byte 65,15,88,206 // addps %xmm14,%xmm1
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 65,15,89,213 // mulps %xmm13,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 65,15,92,192 // subps %xmm8,%xmm0
+ .byte 15,40,92,36,144 // movaps -0x70(%rsp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 65,15,88,192 // addps %xmm8,%xmm0
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,92,213 // subps %xmm5,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,91,92,36,176 // cvtdq2ps -0x50(%rsp),%xmm3
+ .byte 15,40,100,36,208 // movaps -0x30(%rsp),%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 65,15,92,199 // subps %xmm15,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 65,15,88,199 // addps %xmm15,%xmm0
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 65,15,92,210 // subps %xmm10,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 65,15,88,210 // addps %xmm10,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,92,36,224 // movaps -0x20(%rsp),%xmm3
+ .byte 15,40,100,36,240 // movaps -0x10(%rsp),%xmm4
+ .byte 15,40,44,36 // movaps (%rsp),%xmm5
+ .byte 15,40,116,36,16 // movaps 0x10(%rsp),%xmm6
+ .byte 15,40,124,36,32 // movaps 0x20(%rsp),%xmm7
+ .byte 72,131,196,48 // add $0x30,%rsp
+ .byte 91 // pop %rbx
+ .byte 255,224 // jmpq *%rax
+
+HIDDEN _sk_clut_4D_sse2
+.globl _sk_clut_4D_sse2
+FUNCTION(_sk_clut_4D_sse2)
+_sk_clut_4D_sse2:
+ .byte 83 // push %rbx
+ .byte 72,129,236,176,0,0,0 // sub $0xb0,%rsp
+ .byte 15,41,188,36,160,0,0,0 // movaps %xmm7,0xa0(%rsp)
+ .byte 15,41,180,36,144,0,0,0 // movaps %xmm6,0x90(%rsp)
+ .byte 15,41,172,36,128,0,0,0 // movaps %xmm5,0x80(%rsp)
+ .byte 15,41,100,36,112 // movaps %xmm4,0x70(%rsp)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 68,139,72,20 // mov 0x14(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 102,65,15,110,226 // movd %r10d,%xmm4
+ .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
+ .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 102,65,15,110,217 // movd %r9d,%xmm3
+ .byte 102,15,112,251,0 // pshufd $0x0,%xmm3,%xmm7
+ .byte 68,139,72,16 // mov 0x10(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 102,65,15,110,226 // movd %r10d,%xmm4
+ .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
+ .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 243,15,91,244 // cvttps2dq %xmm4,%xmm6
+ .byte 102,15,127,116,36,224 // movdqa %xmm6,-0x20(%rsp)
+ .byte 68,15,40,204 // movaps %xmm4,%xmm9
+ .byte 68,15,41,76,36,32 // movaps %xmm9,0x20(%rsp)
+ .byte 102,15,112,214,245 // pshufd $0xf5,%xmm6,%xmm2
+ .byte 102,15,111,230 // movdqa %xmm6,%xmm4
+ .byte 102,15,127,124,36,208 // movdqa %xmm7,-0x30(%rsp)
+ .byte 102,15,244,231 // pmuludq %xmm7,%xmm4
+ .byte 102,15,112,228,232 // pshufd $0xe8,%xmm4,%xmm4
+ .byte 102,15,244,215 // pmuludq %xmm7,%xmm2
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,98,226 // punpckldq %xmm2,%xmm4
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,127,116,36,80 // movdqa %xmm6,0x50(%rsp)
+ .byte 102,65,15,110,209 // movd %r9d,%xmm2
+ .byte 102,15,244,211 // pmuludq %xmm3,%xmm2
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,244,216 // pmuludq %xmm0,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,98,211 // punpckldq %xmm3,%xmm2
+ .byte 102,68,15,112,250,0 // pshufd $0x0,%xmm2,%xmm15
+ .byte 68,139,72,12 // mov 0xc(%rax),%r9d
+ .byte 69,141,81,255 // lea -0x1(%r9),%r10d
+ .byte 102,65,15,110,218 // movd %r10d,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 15,91,227 // cvtdq2ps %xmm3,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 243,15,91,220 // cvttps2dq %xmm4,%xmm3
+ .byte 68,15,40,220 // movaps %xmm4,%xmm11
+ .byte 68,15,41,92,36,144 // movaps %xmm11,-0x70(%rsp)
+ .byte 102,15,127,92,36,192 // movdqa %xmm3,-0x40(%rsp)
+ .byte 102,15,112,203,245 // pshufd $0xf5,%xmm3,%xmm1
+ .byte 102,65,15,244,223 // pmuludq %xmm15,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,65,15,112,231,245 // pshufd $0xf5,%xmm15,%xmm4
+ .byte 102,15,127,100,36,128 // movdqa %xmm4,-0x80(%rsp)
+ .byte 102,15,244,204 // pmuludq %xmm4,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,217 // punpckldq %xmm1,%xmm3
+ .byte 102,15,127,92,36,16 // movdqa %xmm3,0x10(%rsp)
+ .byte 102,65,15,110,201 // movd %r9d,%xmm1
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 68,139,72,8 // mov 0x8(%rax),%r9d
+ .byte 65,255,201 // dec %r9d
+ .byte 102,65,15,110,209 // movd %r9d,%xmm2
+ .byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
+ .byte 68,15,91,242 // cvtdq2ps %xmm2,%xmm14
+ .byte 68,15,89,240 // mulps %xmm0,%xmm14
+ .byte 102,15,112,193,0 // pshufd $0x0,%xmm1,%xmm0
+ .byte 243,69,15,91,230 // cvttps2dq %xmm14,%xmm12
+ .byte 102,65,15,111,204 // movdqa %xmm12,%xmm1
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,225,232 // pshufd $0xe8,%xmm1,%xmm4
+ .byte 102,65,15,112,204,245 // pshufd $0xf5,%xmm12,%xmm1
+ .byte 102,68,15,112,232,245 // pshufd $0xf5,%xmm0,%xmm13
+ .byte 102,65,15,244,205 // pmuludq %xmm13,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,225 // punpckldq %xmm1,%xmm4
+ .byte 102,15,127,100,36,160 // movdqa %xmm4,-0x60(%rsp)
+ .byte 243,15,91,213 // cvttps2dq %xmm5,%xmm2
+ .byte 102,15,127,84,36,48 // movdqa %xmm2,0x30(%rsp)
+ .byte 68,15,40,197 // movaps %xmm5,%xmm8
+ .byte 68,15,41,68,36,96 // movaps %xmm8,0x60(%rsp)
+ .byte 102,15,111,206 // movdqa %xmm6,%xmm1
+ .byte 102,15,254,202 // paddd %xmm2,%xmm1
+ .byte 102,15,111,211 // movdqa %xmm3,%xmm2
+ .byte 102,15,254,209 // paddd %xmm1,%xmm2
+ .byte 102,15,111,220 // movdqa %xmm4,%xmm3
+ .byte 102,15,254,218 // paddd %xmm2,%xmm3
+ .byte 102,68,15,111,21,119,42,0,0 // movdqa 0x2a77(%rip),%xmm10 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,15,112,235,245 // pshufd $0xf5,%xmm3,%xmm5
+ .byte 102,65,15,244,218 // pmuludq %xmm10,%xmm3
+ .byte 102,15,112,227,232 // pshufd $0xe8,%xmm3,%xmm4
+ .byte 102,65,15,244,234 // pmuludq %xmm10,%xmm5
+ .byte 102,15,112,221,232 // pshufd $0xe8,%xmm5,%xmm3
+ .byte 102,15,98,227 // punpckldq %xmm3,%xmm4
+ .byte 102,15,112,220,229 // pshufd $0xe5,%xmm4,%xmm3
+ .byte 102,65,15,126,217 // movd %xmm3,%r9d
+ .byte 102,15,112,220,78 // pshufd $0x4e,%xmm4,%xmm3
+ .byte 102,65,15,126,218 // movd %xmm3,%r10d
+ .byte 102,15,112,220,231 // pshufd $0xe7,%xmm4,%xmm3
+ .byte 102,65,15,126,219 // movd %xmm3,%r11d
+ .byte 72,139,24 // mov (%rax),%rbx
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,52,147 // movss (%rbx,%r10,4),%xmm6
+ .byte 15,20,222 // unpcklps %xmm6,%xmm3
+ .byte 15,20,221 // unpcklps %xmm5,%xmm3
+ .byte 102,15,111,236 // movdqa %xmm4,%xmm5
+ .byte 102,15,254,45,25,42,0,0 // paddd 0x2a19(%rip),%xmm5 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
+ .byte 102,73,15,126,241 // movq %xmm6,%r9
+ .byte 102,73,15,126,234 // movq %xmm5,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,52,155 // movss (%rbx,%r11,4),%xmm6
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,247 // unpcklps %xmm7,%xmm6
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 102,15,254,37,223,41,0,0 // paddd 0x29df(%rip),%xmm4 # 9bf0 <_sk_clut_4D_sse2+0x2c48>
+ .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,226 // movq %xmm4,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,44,155 // movss (%rbx,%r11,4),%xmm5
+ .byte 15,20,229 // unpcklps %xmm5,%xmm4
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,239 // unpcklps %xmm7,%xmm5
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 15,40,61,102,41,0,0 // movaps 0x2966(%rip),%xmm7 # 9bc0 <_sk_clut_4D_sse2+0x2c18>
+ .byte 68,15,88,199 // addps %xmm7,%xmm8
+ .byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
+ .byte 68,15,88,207 // addps %xmm7,%xmm9
+ .byte 68,15,41,76,36,64 // movaps %xmm9,0x40(%rsp)
+ .byte 69,15,40,195 // movaps %xmm11,%xmm8
+ .byte 68,15,88,199 // addps %xmm7,%xmm8
+ .byte 65,15,88,254 // addps %xmm14,%xmm7
+ .byte 243,15,91,255 // cvttps2dq %xmm7,%xmm7
+ .byte 102,15,244,199 // pmuludq %xmm7,%xmm0
+ .byte 102,15,112,255,245 // pshufd $0xf5,%xmm7,%xmm7
+ .byte 102,65,15,244,253 // pmuludq %xmm13,%xmm7
+ .byte 102,68,15,112,216,232 // pshufd $0xe8,%xmm0,%xmm11
+ .byte 102,15,112,199,232 // pshufd $0xe8,%xmm7,%xmm0
+ .byte 102,68,15,98,216 // punpckldq %xmm0,%xmm11
+ .byte 102,65,15,254,211 // paddd %xmm11,%xmm2
+ .byte 102,68,15,127,28,36 // movdqa %xmm11,(%rsp)
+ .byte 102,15,112,250,245 // pshufd $0xf5,%xmm2,%xmm7
+ .byte 102,65,15,244,210 // pmuludq %xmm10,%xmm2
+ .byte 102,15,112,194,232 // pshufd $0xe8,%xmm2,%xmm0
+ .byte 102,65,15,244,250 // pmuludq %xmm10,%xmm7
+ .byte 102,15,112,215,232 // pshufd $0xe8,%xmm7,%xmm2
+ .byte 102,15,98,194 // punpckldq %xmm2,%xmm0
+ .byte 102,15,112,208,229 // pshufd $0xe5,%xmm0,%xmm2
+ .byte 102,65,15,126,210 // movd %xmm2,%r10d
+ .byte 102,15,112,208,78 // pshufd $0x4e,%xmm0,%xmm2
+ .byte 102,65,15,126,209 // movd %xmm2,%r9d
+ .byte 102,15,112,208,231 // pshufd $0xe7,%xmm0,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,60,147 // movss (%rbx,%r10,4),%xmm7
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,68,15,16,44,131 // movss (%rbx,%rax,4),%xmm13
+ .byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
+ .byte 68,15,20,234 // unpcklps %xmm2,%xmm13
+ .byte 68,15,20,239 // unpcklps %xmm7,%xmm13
+ .byte 102,15,111,208 // movdqa %xmm0,%xmm2
+ .byte 102,15,254,21,205,40,0,0 // paddd 0x28cd(%rip),%xmm2 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
+ .byte 102,73,15,126,249 // movq %xmm7,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,70,15,16,12,139 // movss (%rbx,%r9,4),%xmm9
+ .byte 65,15,20,209 // unpcklps %xmm9,%xmm2
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 102,15,254,5,146,40,0,0 // paddd 0x2892(%rip),%xmm0 # 9bf0 <_sk_clut_4D_sse2+0x2c48>
+ .byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7
+ .byte 102,73,15,126,249 // movq %xmm7,%r9
+ .byte 102,73,15,126,194 // movq %xmm0,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,4,155 // movss (%rbx,%r11,4),%xmm0
+ .byte 15,20,248 // unpcklps %xmm0,%xmm7
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,196 // unpcklps %xmm4,%xmm0
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 65,15,91,228 // cvtdq2ps %xmm12,%xmm4
+ .byte 68,15,92,244 // subps %xmm4,%xmm14
+ .byte 68,15,92,235 // subps %xmm3,%xmm13
+ .byte 69,15,89,238 // mulps %xmm14,%xmm13
+ .byte 68,15,88,235 // addps %xmm3,%xmm13
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 65,15,89,214 // mulps %xmm14,%xmm2
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,89,198 // mulps %xmm14,%xmm0
+ .byte 69,15,40,206 // movaps %xmm14,%xmm9
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 243,65,15,91,216 // cvttps2dq %xmm8,%xmm3
+ .byte 102,68,15,244,251 // pmuludq %xmm3,%xmm15
+ .byte 102,15,112,219,245 // pshufd $0xf5,%xmm3,%xmm3
+ .byte 102,15,244,92,36,128 // pmuludq -0x80(%rsp),%xmm3
+ .byte 102,65,15,112,231,232 // pshufd $0xe8,%xmm15,%xmm4
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,98,227 // punpckldq %xmm3,%xmm4
+ .byte 102,15,127,100,36,128 // movdqa %xmm4,-0x80(%rsp)
+ .byte 102,15,254,204 // paddd %xmm4,%xmm1
+ .byte 102,15,111,217 // movdqa %xmm1,%xmm3
+ .byte 102,15,254,92,36,160 // paddd -0x60(%rsp),%xmm3
+ .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
+ .byte 102,68,15,111,53,190,39,0,0 // movdqa 0x27be(%rip),%xmm14 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4
+ .byte 102,15,112,228,232 // pshufd $0xe8,%xmm4,%xmm4
+ .byte 102,15,98,220 // punpckldq %xmm4,%xmm3
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
+ .byte 102,65,15,126,226 // movd %xmm4,%r10d
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,65,15,126,225 // movd %xmm4,%r9d
+ .byte 102,15,112,227,231 // pshufd $0xe7,%xmm3,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,44,147 // movss (%rbx,%r10,4),%xmm5
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,68,15,16,36,131 // movss (%rbx,%rax,4),%xmm12
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 68,15,20,228 // unpcklps %xmm4,%xmm12
+ .byte 68,15,20,229 // unpcklps %xmm5,%xmm12
+ .byte 102,15,111,227 // movdqa %xmm3,%xmm4
+ .byte 102,15,111,61,103,39,0,0 // movdqa 0x2767(%rip),%xmm7 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,254,231 // paddd %xmm7,%xmm4
+ .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,226 // movq %xmm4,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,44,155 // movss (%rbx,%r11,4),%xmm5
+ .byte 15,20,229 // unpcklps %xmm5,%xmm4
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 102,68,15,111,5,40,39,0,0 // movdqa 0x2728(%rip),%xmm8 # 9bf0 <_sk_clut_4D_sse2+0x2c48>
+ .byte 102,65,15,254,216 // paddd %xmm8,%xmm3
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,36,155 // movss (%rbx,%r11,4),%xmm4
+ .byte 15,20,220 // unpcklps %xmm4,%xmm3
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 102,65,15,254,203 // paddd %xmm11,%xmm1
+ .byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
+ .byte 102,65,15,244,206 // pmuludq %xmm14,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,98,203 // punpckldq %xmm3,%xmm1
+ .byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3
+ .byte 102,65,15,126,218 // movd %xmm3,%r10d
+ .byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
+ .byte 102,65,15,126,217 // movd %xmm3,%r9d
+ .byte 102,15,112,217,231 // pshufd $0xe7,%xmm1,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,36,147 // movss (%rbx,%r10,4),%xmm4
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,68,15,16,60,131 // movss (%rbx,%rax,4),%xmm15
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 68,15,20,251 // unpcklps %xmm3,%xmm15
+ .byte 68,15,20,252 // unpcklps %xmm4,%xmm15
+ .byte 102,15,111,217 // movdqa %xmm1,%xmm3
+ .byte 102,15,254,223 // paddd %xmm7,%xmm3
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,52,131 // movss (%rbx,%rax,4),%xmm14
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 68,15,20,247 // unpcklps %xmm7,%xmm14
+ .byte 68,15,20,244 // unpcklps %xmm4,%xmm14
+ .byte 102,65,15,254,200 // paddd %xmm8,%xmm1
+ .byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,36,155 // movss (%rbx,%r11,4),%xmm4
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,20,131 // movss (%rbx,%rax,4),%xmm10
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 68,15,20,215 // unpcklps %xmm7,%xmm10
+ .byte 68,15,20,209 // unpcklps %xmm1,%xmm10
+ .byte 69,15,92,252 // subps %xmm12,%xmm15
+ .byte 68,15,41,76,36,240 // movaps %xmm9,-0x10(%rsp)
+ .byte 69,15,89,249 // mulps %xmm9,%xmm15
+ .byte 69,15,88,252 // addps %xmm12,%xmm15
+ .byte 68,15,92,246 // subps %xmm6,%xmm14
+ .byte 69,15,89,241 // mulps %xmm9,%xmm14
+ .byte 68,15,88,246 // addps %xmm6,%xmm14
+ .byte 68,15,92,213 // subps %xmm5,%xmm10
+ .byte 69,15,89,209 // mulps %xmm9,%xmm10
+ .byte 68,15,88,213 // addps %xmm5,%xmm10
+ .byte 15,91,76,36,192 // cvtdq2ps -0x40(%rsp),%xmm1
+ .byte 15,40,92,36,144 // movaps -0x70(%rsp),%xmm3
+ .byte 15,92,217 // subps %xmm1,%xmm3
+ .byte 15,41,92,36,144 // movaps %xmm3,-0x70(%rsp)
+ .byte 69,15,92,253 // subps %xmm13,%xmm15
+ .byte 68,15,89,251 // mulps %xmm3,%xmm15
+ .byte 69,15,88,253 // addps %xmm13,%xmm15
+ .byte 68,15,92,242 // subps %xmm2,%xmm14
+ .byte 68,15,89,243 // mulps %xmm3,%xmm14
+ .byte 68,15,88,242 // addps %xmm2,%xmm14
+ .byte 68,15,92,208 // subps %xmm0,%xmm10
+ .byte 68,15,89,211 // mulps %xmm3,%xmm10
+ .byte 68,15,88,208 // addps %xmm0,%xmm10
+ .byte 243,15,91,68,36,64 // cvttps2dq 0x40(%rsp),%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,84,36,208 // movdqa -0x30(%rsp),%xmm2
+ .byte 102,15,244,194 // pmuludq %xmm2,%xmm0
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
+ .byte 102,15,112,193,232 // pshufd $0xe8,%xmm1,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,127,84,36,192 // movdqa %xmm2,-0x40(%rsp)
+ .byte 102,68,15,111,218 // movdqa %xmm2,%xmm11
+ .byte 102,68,15,254,92,36,48 // paddd 0x30(%rsp),%xmm11
+ .byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
+ .byte 102,15,254,68,36,16 // paddd 0x10(%rsp),%xmm0
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,68,15,111,108,36,160 // movdqa -0x60(%rsp),%xmm13
+ .byte 102,65,15,254,205 // paddd %xmm13,%xmm1
+ .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
+ .byte 102,15,111,29,4,37,0,0 // movdqa 0x2504(%rip),%xmm3 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,15,244,203 // pmuludq %xmm3,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,244,211 // pmuludq %xmm3,%xmm2
+ .byte 102,15,111,251 // movdqa %xmm3,%xmm7
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,98,202 // punpckldq %xmm2,%xmm1
+ .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
+ .byte 102,65,15,126,210 // movd %xmm2,%r10d
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,65,15,126,209 // movd %xmm2,%r9d
+ .byte 102,15,112,209,231 // pshufd $0xe7,%xmm1,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,44,147 // movss (%rbx,%r10,4),%xmm5
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,68,15,16,12,131 // movss (%rbx,%rax,4),%xmm9
+ .byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
+ .byte 68,15,20,202 // unpcklps %xmm2,%xmm9
+ .byte 68,15,20,205 // unpcklps %xmm5,%xmm9
+ .byte 102,15,111,209 // movdqa %xmm1,%xmm2
+ .byte 102,15,111,29,171,36,0,0 // movdqa 0x24ab(%rip),%xmm3 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,52,139 // movss (%rbx,%r9,4),%xmm6
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
+ .byte 102,69,15,111,224 // movdqa %xmm8,%xmm12
+ .byte 102,65,15,254,204 // paddd %xmm12,%xmm1
+ .byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,44,155 // movss (%rbx,%r11,4),%xmm5
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 102,15,111,36,36 // movdqa (%rsp),%xmm4
+ .byte 102,15,254,196 // paddd %xmm4,%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,244,199 // pmuludq %xmm7,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,244,207 // pmuludq %xmm7,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,65,15,126,202 // movd %xmm1,%r10d
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,65,15,126,201 // movd %xmm1,%r9d
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,44,147 // movss (%rbx,%r10,4),%xmm5
+ .byte 15,20,233 // unpcklps %xmm1,%xmm5
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,68,15,16,4,131 // movss (%rbx,%rax,4),%xmm8
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 68,15,20,199 // unpcklps %xmm7,%xmm8
+ .byte 68,15,20,197 // unpcklps %xmm5,%xmm8
+ .byte 102,15,111,232 // movdqa %xmm0,%xmm5
+ .byte 102,15,254,235 // paddd %xmm3,%xmm5
+ .byte 102,15,112,253,78 // pshufd $0x4e,%xmm5,%xmm7
+ .byte 102,73,15,126,249 // movq %xmm7,%r9
+ .byte 102,73,15,126,234 // movq %xmm5,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,44,155 // movss (%rbx,%r11,4),%xmm5
+ .byte 15,20,253 // unpcklps %xmm5,%xmm7
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 15,20,239 // unpcklps %xmm7,%xmm5
+ .byte 102,65,15,254,196 // paddd %xmm12,%xmm0
+ .byte 102,15,112,216,78 // pshufd $0x4e,%xmm0,%xmm3
+ .byte 102,73,15,126,217 // movq %xmm3,%r9
+ .byte 102,73,15,126,194 // movq %xmm0,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,4,155 // movss (%rbx,%r11,4),%xmm0
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 15,20,203 // unpcklps %xmm3,%xmm1
+ .byte 69,15,92,193 // subps %xmm9,%xmm8
+ .byte 15,40,68,36,240 // movaps -0x10(%rsp),%xmm0
+ .byte 68,15,89,192 // mulps %xmm0,%xmm8
+ .byte 69,15,88,193 // addps %xmm9,%xmm8
+ .byte 15,92,234 // subps %xmm2,%xmm5
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 68,15,40,224 // movaps %xmm0,%xmm12
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 102,68,15,254,92,36,128 // paddd -0x80(%rsp),%xmm11
+ .byte 102,65,15,111,211 // movdqa %xmm11,%xmm2
+ .byte 102,65,15,254,213 // paddd %xmm13,%xmm2
+ .byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
+ .byte 102,15,111,5,204,34,0,0 // movdqa 0x22cc(%rip),%xmm0 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,15,244,208 // pmuludq %xmm0,%xmm2
+ .byte 102,15,112,250,232 // pshufd $0xe8,%xmm2,%xmm7
+ .byte 102,15,244,216 // pmuludq %xmm0,%xmm3
+ .byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
+ .byte 102,15,98,250 // punpckldq %xmm2,%xmm7
+ .byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2
+ .byte 102,65,15,126,210 // movd %xmm2,%r10d
+ .byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
+ .byte 102,65,15,126,209 // movd %xmm2,%r9d
+ .byte 102,15,112,215,231 // pshufd $0xe7,%xmm7,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,28,147 // movss (%rbx,%r10,4),%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 243,68,15,16,12,131 // movss (%rbx,%rax,4),%xmm9
+ .byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
+ .byte 68,15,20,202 // unpcklps %xmm2,%xmm9
+ .byte 68,15,20,203 // unpcklps %xmm3,%xmm9
+ .byte 102,15,111,215 // movdqa %xmm7,%xmm2
+ .byte 102,15,111,5,119,34,0,0 // movdqa 0x2277(%rip),%xmm0 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,254,208 // paddd %xmm0,%xmm2
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,73,15,126,217 // movq %xmm3,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,211 // unpcklps %xmm3,%xmm2
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 15,20,243 // unpcklps %xmm3,%xmm6
+ .byte 15,20,242 // unpcklps %xmm2,%xmm6
+ .byte 102,68,15,111,45,56,34,0,0 // movdqa 0x2238(%rip),%xmm13 # 9bf0 <_sk_clut_4D_sse2+0x2c48>
+ .byte 102,65,15,254,253 // paddd %xmm13,%xmm7
+ .byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
+ .byte 102,73,15,126,209 // movq %xmm2,%r9
+ .byte 102,73,15,126,250 // movq %xmm7,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,211 // unpcklps %xmm3,%xmm2
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 15,20,251 // unpcklps %xmm3,%xmm7
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 102,68,15,254,220 // paddd %xmm4,%xmm11
+ .byte 102,65,15,112,219,245 // pshufd $0xf5,%xmm11,%xmm3
+ .byte 102,15,111,37,190,33,0,0 // movdqa 0x21be(%rip),%xmm4 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,68,15,244,220 // pmuludq %xmm4,%xmm11
+ .byte 102,65,15,112,211,232 // pshufd $0xe8,%xmm11,%xmm2
+ .byte 102,15,244,220 // pmuludq %xmm4,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,98,211 // punpckldq %xmm3,%xmm2
+ .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
+ .byte 102,65,15,126,218 // movd %xmm3,%r10d
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,65,15,126,217 // movd %xmm3,%r9d
+ .byte 102,15,112,218,231 // pshufd $0xe7,%xmm2,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,68,15,16,28,131 // movss (%rbx,%rax,4),%xmm11
+ .byte 243,66,15,16,28,147 // movss (%rbx,%r10,4),%xmm3
+ .byte 65,15,20,219 // unpcklps %xmm11,%xmm3
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,68,15,16,28,131 // movss (%rbx,%rax,4),%xmm11
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 68,15,20,220 // unpcklps %xmm4,%xmm11
+ .byte 68,15,20,219 // unpcklps %xmm3,%xmm11
+ .byte 102,15,111,218 // movdqa %xmm2,%xmm3
+ .byte 102,15,254,216 // paddd %xmm0,%xmm3
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,36,155 // movss (%rbx,%r11,4),%xmm4
+ .byte 15,20,220 // unpcklps %xmm4,%xmm3
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,196 // unpcklps %xmm4,%xmm0
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 102,65,15,254,213 // paddd %xmm13,%xmm2
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,73,15,126,217 // movq %xmm3,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,211 // unpcklps %xmm3,%xmm2
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,44,131 // movss (%rbx,%rax,4),%xmm13
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 68,15,20,235 // unpcklps %xmm3,%xmm13
+ .byte 68,15,20,234 // unpcklps %xmm2,%xmm13
+ .byte 69,15,92,217 // subps %xmm9,%xmm11
+ .byte 69,15,89,220 // mulps %xmm12,%xmm11
+ .byte 69,15,88,217 // addps %xmm9,%xmm11
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 65,15,89,196 // mulps %xmm12,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 68,15,92,239 // subps %xmm7,%xmm13
+ .byte 69,15,89,236 // mulps %xmm12,%xmm13
+ .byte 68,15,88,239 // addps %xmm7,%xmm13
+ .byte 69,15,92,216 // subps %xmm8,%xmm11
+ .byte 15,40,92,36,144 // movaps -0x70(%rsp),%xmm3
+ .byte 68,15,89,219 // mulps %xmm3,%xmm11
+ .byte 69,15,88,216 // addps %xmm8,%xmm11
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 68,15,92,233 // subps %xmm1,%xmm13
+ .byte 68,15,89,235 // mulps %xmm3,%xmm13
+ .byte 68,15,88,233 // addps %xmm1,%xmm13
+ .byte 15,91,68,36,224 // cvtdq2ps -0x20(%rsp),%xmm0
+ .byte 15,40,76,36,32 // movaps 0x20(%rsp),%xmm1
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,41,76,36,32 // movaps %xmm1,0x20(%rsp)
+ .byte 69,15,92,223 // subps %xmm15,%xmm11
+ .byte 68,15,89,217 // mulps %xmm1,%xmm11
+ .byte 69,15,88,223 // addps %xmm15,%xmm11
+ .byte 68,15,41,92,36,224 // movaps %xmm11,-0x20(%rsp)
+ .byte 65,15,92,214 // subps %xmm14,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 65,15,88,214 // addps %xmm14,%xmm2
+ .byte 15,41,84,36,208 // movaps %xmm2,-0x30(%rsp)
+ .byte 69,15,92,234 // subps %xmm10,%xmm13
+ .byte 68,15,89,233 // mulps %xmm1,%xmm13
+ .byte 69,15,88,234 // addps %xmm10,%xmm13
+ .byte 243,15,91,68,36,176 // cvttps2dq -0x50(%rsp),%xmm0
+ .byte 102,15,127,68,36,176 // movdqa %xmm0,-0x50(%rsp)
+ .byte 102,15,111,76,36,80 // movdqa 0x50(%rsp),%xmm1
+ .byte 102,15,254,200 // paddd %xmm0,%xmm1
+ .byte 102,15,111,68,36,16 // movdqa 0x10(%rsp),%xmm0
+ .byte 102,15,254,193 // paddd %xmm1,%xmm0
+ .byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
+ .byte 102,68,15,111,84,36,160 // movdqa -0x60(%rsp),%xmm10
+ .byte 102,65,15,111,202 // movdqa %xmm10,%xmm1
+ .byte 102,15,254,200 // paddd %xmm0,%xmm1
+ .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
+ .byte 102,15,111,29,0,32,0,0 // movdqa 0x2000(%rip),%xmm3 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,15,244,203 // pmuludq %xmm3,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,244,211 // pmuludq %xmm3,%xmm2
+ .byte 102,68,15,111,243 // movdqa %xmm3,%xmm14
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,98,202 // punpckldq %xmm2,%xmm1
+ .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
+ .byte 102,65,15,126,210 // movd %xmm2,%r10d
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,65,15,126,209 // movd %xmm2,%r9d
+ .byte 102,15,112,209,231 // pshufd $0xe7,%xmm1,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,28,147 // movss (%rbx,%r10,4),%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 15,20,211 // unpcklps %xmm3,%xmm2
+ .byte 102,15,111,217 // movdqa %xmm1,%xmm3
+ .byte 102,15,111,61,169,31,0,0 // movdqa 0x1fa9(%rip),%xmm7 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,254,223 // paddd %xmm7,%xmm3
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,221 // unpcklps %xmm5,%xmm3
+ .byte 15,20,220 // unpcklps %xmm4,%xmm3
+ .byte 102,68,15,111,13,106,31,0,0 // movdqa 0x1f6a(%rip),%xmm9 # 9bf0 <_sk_clut_4D_sse2+0x2c48>
+ .byte 102,65,15,254,201 // paddd %xmm9,%xmm1
+ .byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,36,155 // movss (%rbx,%r11,4),%xmm4
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 15,20,229 // unpcklps %xmm5,%xmm4
+ .byte 15,20,225 // unpcklps %xmm1,%xmm4
+ .byte 102,68,15,111,60,36 // movdqa (%rsp),%xmm15
+ .byte 102,65,15,254,199 // paddd %xmm15,%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,65,15,244,198 // pmuludq %xmm14,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,65,15,244,206 // pmuludq %xmm14,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,65,15,126,202 // movd %xmm1,%r10d
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,65,15,126,201 // movd %xmm1,%r9d
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,44,147 // movss (%rbx,%r10,4),%xmm5
+ .byte 15,20,233 // unpcklps %xmm1,%xmm5
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,52,139 // movss (%rbx,%r9,4),%xmm6
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 102,15,111,232 // movdqa %xmm0,%xmm5
+ .byte 102,15,254,239 // paddd %xmm7,%xmm5
+ .byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
+ .byte 102,73,15,126,241 // movq %xmm6,%r9
+ .byte 102,73,15,126,234 // movq %xmm5,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,44,155 // movss (%rbx,%r11,4),%xmm5
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,239 // unpcklps %xmm7,%xmm5
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 102,65,15,254,193 // paddd %xmm9,%xmm0
+ .byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
+ .byte 102,73,15,126,241 // movq %xmm6,%r9
+ .byte 102,73,15,126,194 // movq %xmm0,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,4,155 // movss (%rbx,%r11,4),%xmm0
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,20,198 // unpcklps %xmm6,%xmm0
+ .byte 15,92,202 // subps %xmm2,%xmm1
+ .byte 69,15,40,196 // movaps %xmm12,%xmm8
+ .byte 65,15,89,200 // mulps %xmm8,%xmm1
+ .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 65,15,89,232 // mulps %xmm8,%xmm5
+ .byte 15,88,235 // addps %xmm3,%xmm5
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 102,65,15,111,219 // movdqa %xmm11,%xmm3
+ .byte 102,15,254,92,36,128 // paddd -0x80(%rsp),%xmm3
+ .byte 102,15,111,211 // movdqa %xmm3,%xmm2
+ .byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
+ .byte 102,65,15,254,210 // paddd %xmm10,%xmm2
+ .byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
+ .byte 102,65,15,244,214 // pmuludq %xmm14,%xmm2
+ .byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4
+ .byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
+ .byte 102,69,15,111,230 // movdqa %xmm14,%xmm12
+ .byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
+ .byte 102,15,98,226 // punpckldq %xmm2,%xmm4
+ .byte 102,15,112,212,229 // pshufd $0xe5,%xmm4,%xmm2
+ .byte 102,65,15,126,210 // movd %xmm2,%r10d
+ .byte 102,15,112,212,78 // pshufd $0x4e,%xmm4,%xmm2
+ .byte 102,65,15,126,209 // movd %xmm2,%r9d
+ .byte 102,15,112,212,231 // pshufd $0xe7,%xmm4,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,28,147 // movss (%rbx,%r10,4),%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 243,68,15,16,52,131 // movss (%rbx,%rax,4),%xmm14
+ .byte 243,66,15,16,52,139 // movss (%rbx,%r9,4),%xmm6
+ .byte 68,15,20,246 // unpcklps %xmm6,%xmm14
+ .byte 68,15,20,243 // unpcklps %xmm3,%xmm14
+ .byte 102,15,111,220 // movdqa %xmm4,%xmm3
+ .byte 102,68,15,111,21,109,29,0,0 // movdqa 0x1d6d(%rip),%xmm10 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,65,15,254,218 // paddd %xmm10,%xmm3
+ .byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
+ .byte 102,73,15,126,241 // movq %xmm6,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,28,155 // movss (%rbx,%r11,4),%xmm3
+ .byte 15,20,243 // unpcklps %xmm3,%xmm6
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,223 // unpcklps %xmm7,%xmm3
+ .byte 15,20,222 // unpcklps %xmm6,%xmm3
+ .byte 102,65,15,254,225 // paddd %xmm9,%xmm4
+ .byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
+ .byte 102,73,15,126,241 // movq %xmm6,%r9
+ .byte 102,73,15,126,226 // movq %xmm4,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,52,131 // movss (%rbx,%rax,4),%xmm6
+ .byte 243,66,15,16,36,155 // movss (%rbx,%r11,4),%xmm4
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,231 // unpcklps %xmm7,%xmm4
+ .byte 15,20,230 // unpcklps %xmm6,%xmm4
+ .byte 102,65,15,111,211 // movdqa %xmm11,%xmm2
+ .byte 102,65,15,254,215 // paddd %xmm15,%xmm2
+ .byte 102,15,112,250,245 // pshufd $0xf5,%xmm2,%xmm7
+ .byte 102,65,15,244,212 // pmuludq %xmm12,%xmm2
+ .byte 102,15,112,242,232 // pshufd $0xe8,%xmm2,%xmm6
+ .byte 102,65,15,244,252 // pmuludq %xmm12,%xmm7
+ .byte 102,15,112,255,232 // pshufd $0xe8,%xmm7,%xmm7
+ .byte 102,15,98,247 // punpckldq %xmm7,%xmm6
+ .byte 102,15,112,254,229 // pshufd $0xe5,%xmm6,%xmm7
+ .byte 102,65,15,126,250 // movd %xmm7,%r10d
+ .byte 102,15,112,254,78 // pshufd $0x4e,%xmm6,%xmm7
+ .byte 102,65,15,126,249 // movd %xmm7,%r9d
+ .byte 102,15,112,254,231 // pshufd $0xe7,%xmm6,%xmm7
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,20,147 // movss (%rbx,%r10,4),%xmm2
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 243,68,15,16,36,131 // movss (%rbx,%rax,4),%xmm12
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 68,15,20,231 // unpcklps %xmm7,%xmm12
+ .byte 68,15,20,226 // unpcklps %xmm2,%xmm12
+ .byte 102,15,111,214 // movdqa %xmm6,%xmm2
+ .byte 102,65,15,254,210 // paddd %xmm10,%xmm2
+ .byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
+ .byte 102,73,15,126,249 // movq %xmm7,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,60,155 // movss (%rbx,%r11,4),%xmm7
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,28,131 // movss (%rbx,%rax,4),%xmm11
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 68,15,20,223 // unpcklps %xmm7,%xmm11
+ .byte 68,15,20,218 // unpcklps %xmm2,%xmm11
+ .byte 102,65,15,254,241 // paddd %xmm9,%xmm6
+ .byte 102,15,112,214,78 // pshufd $0x4e,%xmm6,%xmm2
+ .byte 102,73,15,126,209 // movq %xmm2,%r9
+ .byte 102,73,15,126,242 // movq %xmm6,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,52,155 // movss (%rbx,%r11,4),%xmm6
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,20,131 // movss (%rbx,%rax,4),%xmm10
+ .byte 243,66,15,16,52,139 // movss (%rbx,%r9,4),%xmm6
+ .byte 68,15,20,214 // unpcklps %xmm6,%xmm10
+ .byte 68,15,20,210 // unpcklps %xmm2,%xmm10
+ .byte 69,15,92,230 // subps %xmm14,%xmm12
+ .byte 69,15,89,224 // mulps %xmm8,%xmm12
+ .byte 69,15,88,230 // addps %xmm14,%xmm12
+ .byte 68,15,92,219 // subps %xmm3,%xmm11
+ .byte 69,15,89,216 // mulps %xmm8,%xmm11
+ .byte 68,15,88,219 // addps %xmm3,%xmm11
+ .byte 68,15,92,212 // subps %xmm4,%xmm10
+ .byte 69,15,89,208 // mulps %xmm8,%xmm10
+ .byte 68,15,88,212 // addps %xmm4,%xmm10
+ .byte 68,15,92,225 // subps %xmm1,%xmm12
+ .byte 15,40,84,36,144 // movaps -0x70(%rsp),%xmm2
+ .byte 68,15,89,226 // mulps %xmm2,%xmm12
+ .byte 68,15,88,225 // addps %xmm1,%xmm12
+ .byte 68,15,92,221 // subps %xmm5,%xmm11
+ .byte 68,15,89,218 // mulps %xmm2,%xmm11
+ .byte 68,15,88,221 // addps %xmm5,%xmm11
+ .byte 68,15,92,208 // subps %xmm0,%xmm10
+ .byte 68,15,89,210 // mulps %xmm2,%xmm10
+ .byte 68,15,88,208 // addps %xmm0,%xmm10
+ .byte 102,15,111,68,36,192 // movdqa -0x40(%rsp),%xmm0
+ .byte 102,15,254,68,36,176 // paddd -0x50(%rsp),%xmm0
+ .byte 102,15,111,76,36,16 // movdqa 0x10(%rsp),%xmm1
+ .byte 102,15,254,200 // paddd %xmm0,%xmm1
+ .byte 102,15,111,248 // movdqa %xmm0,%xmm7
+ .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,15,111,233 // movdqa %xmm1,%xmm5
+ .byte 102,15,111,116,36,160 // movdqa -0x60(%rsp),%xmm6
+ .byte 102,15,254,198 // paddd %xmm6,%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,29,71,27,0,0 // movdqa 0x1b47(%rip),%xmm3 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,15,244,195 // pmuludq %xmm3,%xmm0
+ .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
+ .byte 102,15,244,203 // pmuludq %xmm3,%xmm1
+ .byte 102,68,15,111,243 // movdqa %xmm3,%xmm14
+ .byte 102,15,112,193,232 // pshufd $0xe8,%xmm1,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,65,15,126,194 // movd %xmm0,%r10d
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,65,15,126,193 // movd %xmm0,%r9d
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,12,147 // movss (%rbx,%r10,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 102,15,111,202 // movdqa %xmm2,%xmm1
+ .byte 102,68,15,111,5,239,26,0,0 // movdqa 0x1aef(%rip),%xmm8 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,65,15,254,200 // paddd %xmm8,%xmm1
+ .byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
+ .byte 102,73,15,126,217 // movq %xmm3,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 15,20,203 // unpcklps %xmm3,%xmm1
+ .byte 102,65,15,254,209 // paddd %xmm9,%xmm2
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,73,15,126,217 // movq %xmm3,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 15,20,211 // unpcklps %xmm3,%xmm2
+ .byte 102,15,111,221 // movdqa %xmm5,%xmm3
+ .byte 102,65,15,254,223 // paddd %xmm15,%xmm3
+ .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
+ .byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4
+ .byte 102,15,112,228,232 // pshufd $0xe8,%xmm4,%xmm4
+ .byte 102,15,98,220 // punpckldq %xmm4,%xmm3
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
+ .byte 102,65,15,126,226 // movd %xmm4,%r10d
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,65,15,126,225 // movd %xmm4,%r9d
+ .byte 102,15,112,227,231 // pshufd $0xe7,%xmm3,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,44,147 // movss (%rbx,%r10,4),%xmm5
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,68,15,16,52,131 // movss (%rbx,%rax,4),%xmm14
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 68,15,20,244 // unpcklps %xmm4,%xmm14
+ .byte 68,15,20,245 // unpcklps %xmm5,%xmm14
+ .byte 102,15,111,227 // movdqa %xmm3,%xmm4
+ .byte 102,65,15,254,224 // paddd %xmm8,%xmm4
+ .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
+ .byte 102,73,15,126,233 // movq %xmm5,%r9
+ .byte 102,73,15,126,226 // movq %xmm4,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,44,155 // movss (%rbx,%r11,4),%xmm5
+ .byte 15,20,229 // unpcklps %xmm5,%xmm4
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,68,15,16,4,131 // movss (%rbx,%rax,4),%xmm8
+ .byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
+ .byte 68,15,20,197 // unpcklps %xmm5,%xmm8
+ .byte 68,15,20,196 // unpcklps %xmm4,%xmm8
+ .byte 102,65,15,254,217 // paddd %xmm9,%xmm3
+ .byte 102,69,15,111,249 // movdqa %xmm9,%xmm15
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,73,15,126,225 // movq %xmm4,%r9
+ .byte 102,73,15,126,218 // movq %xmm3,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,36,155 // movss (%rbx,%r11,4),%xmm4
+ .byte 15,20,220 // unpcklps %xmm4,%xmm3
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,44,131 // movss (%rbx,%rax,4),%xmm5
+ .byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 68,15,92,240 // subps %xmm0,%xmm14
+ .byte 15,40,92,36,240 // movaps -0x10(%rsp),%xmm3
+ .byte 68,15,89,243 // mulps %xmm3,%xmm14
+ .byte 68,15,88,240 // addps %xmm0,%xmm14
+ .byte 68,15,92,193 // subps %xmm1,%xmm8
+ .byte 68,15,89,195 // mulps %xmm3,%xmm8
+ .byte 68,15,88,193 // addps %xmm1,%xmm8
+ .byte 15,92,234 // subps %xmm2,%xmm5
+ .byte 15,89,235 // mulps %xmm3,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 102,15,254,124,36,128 // paddd -0x80(%rsp),%xmm7
+ .byte 102,15,254,247 // paddd %xmm7,%xmm6
+ .byte 102,15,112,206,245 // pshufd $0xf5,%xmm6,%xmm1
+ .byte 102,15,111,21,17,25,0,0 // movdqa 0x1911(%rip),%xmm2 # 9bd0 <_sk_clut_4D_sse2+0x2c28>
+ .byte 102,15,244,242 // pmuludq %xmm2,%xmm6
+ .byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,15,111,242 // movdqa %xmm2,%xmm6
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,65,15,126,202 // movd %xmm1,%r10d
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,65,15,126,201 // movd %xmm1,%r9d
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,20,147 // movss (%rbx,%r10,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,68,15,16,12,131 // movss (%rbx,%rax,4),%xmm9
+ .byte 243,66,15,16,12,139 // movss (%rbx,%r9,4),%xmm1
+ .byte 68,15,20,201 // unpcklps %xmm1,%xmm9
+ .byte 68,15,20,202 // unpcklps %xmm2,%xmm9
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,254,13,184,24,0,0 // paddd 0x18b8(%rip),%xmm1 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,73,15,126,209 // movq %xmm2,%r9
+ .byte 102,73,15,126,202 // movq %xmm1,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,202 // unpcklps %xmm2,%xmm1
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,36,131 // movss (%rbx,%rax,4),%xmm4
+ .byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
+ .byte 15,20,226 // unpcklps %xmm2,%xmm4
+ .byte 15,20,225 // unpcklps %xmm1,%xmm4
+ .byte 102,65,15,254,199 // paddd %xmm15,%xmm0
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,73,15,126,201 // movq %xmm1,%r9
+ .byte 102,73,15,126,194 // movq %xmm0,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,28,131 // movss (%rbx,%rax,4),%xmm3
+ .byte 243,66,15,16,12,139 // movss (%rbx,%r9,4),%xmm1
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 102,68,15,111,255 // movdqa %xmm7,%xmm15
+ .byte 102,68,15,254,60,36 // paddd (%rsp),%xmm15
+ .byte 102,65,15,112,199,245 // pshufd $0xf5,%xmm15,%xmm0
+ .byte 102,68,15,244,254 // pmuludq %xmm6,%xmm15
+ .byte 102,15,244,198 // pmuludq %xmm6,%xmm0
+ .byte 102,65,15,112,215,232 // pshufd $0xe8,%xmm15,%xmm2
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,65,15,126,194 // movd %xmm0,%r10d
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,65,15,126,193 // movd %xmm0,%r9d
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,12,147 // movss (%rbx,%r10,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,4,131 // movss (%rbx,%rax,4),%xmm0
+ .byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 102,15,111,53,190,23,0,0 // movdqa 0x17be(%rip),%xmm6 # 9be0 <_sk_clut_4D_sse2+0x2c38>
+ .byte 102,15,254,242 // paddd %xmm2,%xmm6
+ .byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1
+ .byte 102,73,15,126,201 // movq %xmm1,%r9
+ .byte 102,73,15,126,242 // movq %xmm6,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,12,155 // movss (%rbx,%r11,4),%xmm1
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,12,131 // movss (%rbx,%rax,4),%xmm1
+ .byte 243,70,15,16,60,139 // movss (%rbx,%r9,4),%xmm15
+ .byte 65,15,20,207 // unpcklps %xmm15,%xmm1
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 102,15,254,21,127,23,0,0 // paddd 0x177f(%rip),%xmm2 # 9bf0 <_sk_clut_4D_sse2+0x2c48>
+ .byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
+ .byte 102,73,15,126,249 // movq %xmm7,%r9
+ .byte 102,73,15,126,210 // movq %xmm2,%r10
+ .byte 77,137,203 // mov %r9,%r11
+ .byte 73,193,235,32 // shr $0x20,%r11
+ .byte 76,137,208 // mov %r10,%rax
+ .byte 72,193,232,32 // shr $0x20,%rax
+ .byte 243,15,16,60,131 // movss (%rbx,%rax,4),%xmm7
+ .byte 243,66,15,16,20,155 // movss (%rbx,%r11,4),%xmm2
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 68,137,208 // mov %r10d,%eax
+ .byte 69,137,201 // mov %r9d,%r9d
+ .byte 243,15,16,20,131 // movss (%rbx,%rax,4),%xmm2
+ .byte 243,66,15,16,52,139 // movss (%rbx,%r9,4),%xmm6
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 65,15,92,193 // subps %xmm9,%xmm0
+ .byte 15,40,116,36,240 // movaps -0x10(%rsp),%xmm6
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 65,15,88,193 // addps %xmm9,%xmm0
+ .byte 15,92,204 // subps %xmm4,%xmm1
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 65,15,92,198 // subps %xmm14,%xmm0
+ .byte 15,40,92,36,144 // movaps -0x70(%rsp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 65,15,88,198 // addps %xmm14,%xmm0
+ .byte 65,15,92,200 // subps %xmm8,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 65,15,88,200 // addps %xmm8,%xmm1
+ .byte 15,92,213 // subps %xmm5,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 65,15,92,196 // subps %xmm12,%xmm0
+ .byte 15,40,92,36,32 // movaps 0x20(%rsp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 65,15,92,203 // subps %xmm11,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 65,15,88,203 // addps %xmm11,%xmm1
+ .byte 65,15,92,210 // subps %xmm10,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 65,15,88,210 // addps %xmm10,%xmm2
+ .byte 15,91,92,36,48 // cvtdq2ps 0x30(%rsp),%xmm3
+ .byte 15,40,100,36,96 // movaps 0x60(%rsp),%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,40,92,36,224 // movaps -0x20(%rsp),%xmm3
+ .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,195 // addps %xmm3,%xmm0
+ .byte 15,40,92,36,208 // movaps -0x30(%rsp),%xmm3
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 65,15,92,213 // subps %xmm13,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 65,15,88,213 // addps %xmm13,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,29,164,22,0,0 // movaps 0x16a4(%rip),%xmm3 # 9c00 <_sk_clut_4D_sse2+0x2c58>
+ .byte 15,40,100,36,112 // movaps 0x70(%rsp),%xmm4
+ .byte 15,40,172,36,128,0,0,0 // movaps 0x80(%rsp),%xmm5
+ .byte 15,40,180,36,144,0,0,0 // movaps 0x90(%rsp),%xmm6
+ .byte 15,40,188,36,160,0,0,0 // movaps 0xa0(%rsp),%xmm7
+ .byte 72,129,196,176,0,0,0 // add $0xb0,%rsp
+ .byte 91 // pop %rbx
+ .byte 255,224 // jmpq *%rax
+
BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
@@ -44248,9 +53880,9 @@ BALIGN16
.byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 66ac <.literal16+0x1fc>
+ .byte 224,64 // loopne 878c <.literal16+0x1fc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 66b0 <.literal16+0x200>
+ .byte 224,64 // loopne 8790 <.literal16+0x200>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -44270,13 +53902,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 66d1 <.literal16+0x221>
+ .byte 71,225,61 // rex.RXB loope 87b1 <.literal16+0x221>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 66d5 <.literal16+0x225>
+ .byte 71,225,61 // rex.RXB loope 87b5 <.literal16+0x225>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 66d9 <.literal16+0x229>
+ .byte 71,225,61 // rex.RXB loope 87b9 <.literal16+0x229>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 66dd <.literal16+0x22d>
+ .byte 71,225,61 // rex.RXB loope 87bd <.literal16+0x22d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -44301,13 +53933,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6711 <.literal16+0x261>
+ .byte 71,225,61 // rex.RXB loope 87f1 <.literal16+0x261>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6715 <.literal16+0x265>
+ .byte 71,225,61 // rex.RXB loope 87f5 <.literal16+0x265>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6719 <.literal16+0x269>
+ .byte 71,225,61 // rex.RXB loope 87f9 <.literal16+0x269>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 671d <.literal16+0x26d>
+ .byte 71,225,61 // rex.RXB loope 87fd <.literal16+0x26d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -44332,13 +53964,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6751 <.literal16+0x2a1>
+ .byte 71,225,61 // rex.RXB loope 8831 <.literal16+0x2a1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6755 <.literal16+0x2a5>
+ .byte 71,225,61 // rex.RXB loope 8835 <.literal16+0x2a5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6759 <.literal16+0x2a9>
+ .byte 71,225,61 // rex.RXB loope 8839 <.literal16+0x2a9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 675d <.literal16+0x2ad>
+ .byte 71,225,61 // rex.RXB loope 883d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -44363,13 +53995,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6791 <.literal16+0x2e1>
+ .byte 71,225,61 // rex.RXB loope 8871 <.literal16+0x2e1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6795 <.literal16+0x2e5>
+ .byte 71,225,61 // rex.RXB loope 8875 <.literal16+0x2e5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6799 <.literal16+0x2e9>
+ .byte 71,225,61 // rex.RXB loope 8879 <.literal16+0x2e9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 679d <.literal16+0x2ed>
+ .byte 71,225,61 // rex.RXB loope 887d <.literal16+0x2ed>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -44390,11 +54022,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 67db <.literal16+0x32b>
+ .byte 127,67 // jg 88bb <.literal16+0x32b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 67df <.literal16+0x32f>
+ .byte 127,67 // jg 88bf <.literal16+0x32f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 67e3 <.literal16+0x333>
+ .byte 127,67 // jg 88c3 <.literal16+0x333>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -44686,13 +54318,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6a39 <.literal16+0x589>
+ .byte 224,7 // loopne 8b19 <.literal16+0x589>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a3d <.literal16+0x58d>
+ .byte 224,7 // loopne 8b1d <.literal16+0x58d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a41 <.literal16+0x591>
+ .byte 224,7 // loopne 8b21 <.literal16+0x591>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a45 <.literal16+0x595>
+ .byte 224,7 // loopne 8b25 <.literal16+0x595>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -44757,11 +54389,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6b1b <.literal16+0x66b>
+ .byte 127,67 // jg 8bfb <.literal16+0x66b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6b1f <.literal16+0x66f>
+ .byte 127,67 // jg 8bff <.literal16+0x66f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6b23 <.literal16+0x673>
+ .byte 127,67 // jg 8c03 <.literal16+0x673>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -44776,16 +54408,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6b14 <.literal16+0x664>
+ .byte 127,0 // jg 8bf4 <.literal16+0x664>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6b18 <.literal16+0x668>
+ .byte 127,0 // jg 8bf8 <.literal16+0x668>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6b1c <.literal16+0x66c>
+ .byte 127,0 // jg 8bfc <.literal16+0x66c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6b20 <.literal16+0x670>
+ .byte 127,0 // jg 8c00 <.literal16+0x670>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44794,7 +54426,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6ba5 <.literal16+0x6f5>
+ .byte 119,115 // ja 8c85 <.literal16+0x6f5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44805,7 +54437,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6b09 <.literal16+0x659>
+ .byte 117,191 // jne 8be9 <.literal16+0x659>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44817,7 +54449,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3ab4a <_sk_callback_sse2+0xffffffffe9a3478d>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3cc2a <_sk_clut_4D_sse2+0xffffffffe9a35c82>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44871,16 +54503,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6be4 <.literal16+0x734>
+ .byte 127,0 // jg 8cc4 <.literal16+0x734>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6be8 <.literal16+0x738>
+ .byte 127,0 // jg 8cc8 <.literal16+0x738>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6bec <.literal16+0x73c>
+ .byte 127,0 // jg 8ccc <.literal16+0x73c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6bf0 <.literal16+0x740>
+ .byte 127,0 // jg 8cd0 <.literal16+0x740>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44889,7 +54521,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6c75 <.literal16+0x7c5>
+ .byte 119,115 // ja 8d55 <.literal16+0x7c5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44900,7 +54532,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6bd9 <.literal16+0x729>
+ .byte 117,191 // jne 8cb9 <.literal16+0x729>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44912,7 +54544,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3ac1a <_sk_callback_sse2+0xffffffffe9a3485d>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ccfa <_sk_clut_4D_sse2+0xffffffffe9a35d52>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44966,16 +54598,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6cb4 <.literal16+0x804>
+ .byte 127,0 // jg 8d94 <.literal16+0x804>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6cb8 <.literal16+0x808>
+ .byte 127,0 // jg 8d98 <.literal16+0x808>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6cbc <.literal16+0x80c>
+ .byte 127,0 // jg 8d9c <.literal16+0x80c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6cc0 <.literal16+0x810>
+ .byte 127,0 // jg 8da0 <.literal16+0x810>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44984,7 +54616,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6d45 <.literal16+0x895>
+ .byte 119,115 // ja 8e25 <.literal16+0x895>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44995,7 +54627,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6ca9 <.literal16+0x7f9>
+ .byte 117,191 // jne 8d89 <.literal16+0x7f9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -45007,7 +54639,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3acea <_sk_callback_sse2+0xffffffffe9a3492d>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3cdca <_sk_clut_4D_sse2+0xffffffffe9a35e22>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -45061,16 +54693,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6d84 <.literal16+0x8d4>
+ .byte 127,0 // jg 8e64 <.literal16+0x8d4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6d88 <.literal16+0x8d8>
+ .byte 127,0 // jg 8e68 <.literal16+0x8d8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6d8c <.literal16+0x8dc>
+ .byte 127,0 // jg 8e6c <.literal16+0x8dc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6d90 <.literal16+0x8e0>
+ .byte 127,0 // jg 8e70 <.literal16+0x8e0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -45079,7 +54711,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6e15 <.literal16+0x965>
+ .byte 119,115 // ja 8ef5 <.literal16+0x965>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -45090,7 +54722,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6d79 <.literal16+0x8c9>
+ .byte 117,191 // jne 8e59 <.literal16+0x8c9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -45102,7 +54734,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3adba <_sk_callback_sse2+0xffffffffe9a349fd>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ce9a <_sk_clut_4D_sse2+0xffffffffe9a35ef2>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -45156,16 +54788,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6e54 <.literal16+0x9a4>
+ .byte 127,0 // jg 8f34 <.literal16+0x9a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6e58 <.literal16+0x9a8>
+ .byte 127,0 // jg 8f38 <.literal16+0x9a8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6e5c <.literal16+0x9ac>
+ .byte 127,0 // jg 8f3c <.literal16+0x9ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6e60 <.literal16+0x9b0>
+ .byte 127,0 // jg 8f40 <.literal16+0x9b0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -45174,7 +54806,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6ee5 <.literal16+0xa35>
+ .byte 119,115 // ja 8fc5 <.literal16+0xa35>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -45185,7 +54817,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6e49 <.literal16+0x999>
+ .byte 117,191 // jne 8f29 <.literal16+0x999>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -45197,7 +54829,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3ae8a <_sk_callback_sse2+0xffffffffe9a34acd>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3cf6a <_sk_clut_4D_sse2+0xffffffffe9a35fc2>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -45247,13 +54879,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 6f67 <.literal16+0xab7>
+ .byte 127,67 // jg 9047 <.literal16+0xab7>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6f6b <.literal16+0xabb>
+ .byte 127,67 // jg 904b <.literal16+0xabb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6f6f <.literal16+0xabf>
+ .byte 127,67 // jg 904f <.literal16+0xabf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6f73 <.literal16+0xac3>
+ .byte 127,67 // jg 9053 <.literal16+0xac3>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -45300,16 +54932,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6ff3 <.literal16+0xb43>
+ .byte 118,63 // jbe 90d3 <.literal16+0xb43>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6ff7 <.literal16+0xb47>
+ .byte 118,63 // jbe 90d7 <.literal16+0xb47>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6ffb <.literal16+0xb4b>
+ .byte 118,63 // jbe 90db <.literal16+0xb4b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6fff <.literal16+0xb4f>
+ .byte 118,63 // jbe 90df <.literal16+0xb4f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -45338,11 +54970,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 706b <.literal16+0xbbb>
+ .byte 127,67 // jg 914b <.literal16+0xbbb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 706f <.literal16+0xbbf>
+ .byte 127,67 // jg 914f <.literal16+0xbbf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 7073 <.literal16+0xbc3>
+ .byte 127,67 // jg 9153 <.literal16+0xbc3>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -45404,13 +55036,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 70e9 <.literal16+0xc39>
+ .byte 224,7 // loopne 91c9 <.literal16+0xc39>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 70ed <.literal16+0xc3d>
+ .byte 224,7 // loopne 91cd <.literal16+0xc3d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 70f1 <.literal16+0xc41>
+ .byte 224,7 // loopne 91d1 <.literal16+0xc41>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 70f5 <.literal16+0xc45>
+ .byte 224,7 // loopne 91d5 <.literal16+0xc45>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -45456,13 +55088,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7159 <.literal16+0xca9>
+ .byte 224,7 // loopne 9239 <.literal16+0xca9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 715d <.literal16+0xcad>
+ .byte 224,7 // loopne 923d <.literal16+0xcad>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 7161 <.literal16+0xcb1>
+ .byte 224,7 // loopne 9241 <.literal16+0xcb1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 7165 <.literal16+0xcb5>
+ .byte 224,7 // loopne 9245 <.literal16+0xcb5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -45508,13 +55140,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 71c9 <.literal16+0xd19>
+ .byte 224,7 // loopne 92a9 <.literal16+0xd19>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 71cd <.literal16+0xd1d>
+ .byte 224,7 // loopne 92ad <.literal16+0xd1d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 71d1 <.literal16+0xd21>
+ .byte 224,7 // loopne 92b1 <.literal16+0xd21>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 71d5 <.literal16+0xd25>
+ .byte 224,7 // loopne 92b5 <.literal16+0xd25>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -45552,13 +55184,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 7266 <.literal16+0xdb6>
+ .byte 124,66 // jl 9346 <.literal16+0xdb6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 726a <.literal16+0xdba>
+ .byte 124,66 // jl 934a <.literal16+0xdba>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 726e <.literal16+0xdbe>
+ .byte 124,66 // jl 934e <.literal16+0xdbe>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 7272 <.literal16+0xdc2>
+ .byte 124,66 // jl 9352 <.literal16+0xdc2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -45692,13 +55324,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 73f5 <.literal16+0xf45>
+ .byte 112,65 // jo 94d5 <.literal16+0xf45>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 73f9 <.literal16+0xf49>
+ .byte 112,65 // jo 94d9 <.literal16+0xf49>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 73fd <.literal16+0xf4d>
+ .byte 112,65 // jo 94dd <.literal16+0xf4d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 7401 <.literal16+0xf51>
+ .byte 112,65 // jo 94e1 <.literal16+0xf51>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -45729,11 +55361,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 746b <.literal16+0xfbb>
+ .byte 127,67 // jg 954b <.literal16+0xfbb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 746f <.literal16+0xfbf>
+ .byte 127,67 // jg 954f <.literal16+0xfbf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 7473 <.literal16+0xfc3>
+ .byte 127,67 // jg 9553 <.literal16+0xfc3>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -45764,11 +55396,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 74db <.literal16+0x102b>
+ .byte 127,67 // jg 95bb <.literal16+0x102b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 74df <.literal16+0x102f>
+ .byte 127,67 // jg 95bf <.literal16+0x102f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 74e3 <.literal16+0x1033>
+ .byte 127,67 // jg 95c3 <.literal16+0x1033>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -45864,13 +55496,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 760b <.literal16+0x115b>
+ .byte 127,71 // jg 96eb <.literal16+0x115b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 760f <.literal16+0x115f>
+ .byte 127,71 // jg 96ef <.literal16+0x115f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7613 <.literal16+0x1163>
+ .byte 127,71 // jg 96f3 <.literal16+0x1163>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7617 <.literal16+0x1167>
+ .byte 127,71 // jg 96f7 <.literal16+0x1167>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -45947,10 +55579,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc087aa <_sk_callback_sse2+0x2dc023ed>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0a88a <_sk_clut_4D_sse2+0x2dc038e2>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 76dc <.literal16+0x122c>
+ .byte 120,57 // js 97bc <.literal16+0x122c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -46137,11 +55769,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 78c2 <.literal16+0x1412>
+ .byte 62,114,28 // jb,pt 99a2 <.literal16+0x1412>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 78c6 <.literal16+0x1416>
+ .byte 62,114,28 // jb,pt 99a6 <.literal16+0x1416>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 78ca <.literal16+0x141a>
+ .byte 62,114,28 // jb,pt 99aa <.literal16+0x141a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -46185,7 +55817,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640755 <_sk_callback_sse2+0x3d63a398>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d642835 <_sk_clut_4D_sse2+0x3d63b88d>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -46211,7 +55843,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640795 <_sk_callback_sse2+0x3d63a3d8>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d642875 <_sk_clut_4D_sse2+0x3d63b8cd>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -46220,13 +55852,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 798e <.literal16+0x14de>
+ .byte 114,28 // jb 9a6e <.literal16+0x14de>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7992 <.literal16+0x14e2>
+ .byte 62,114,28 // jb,pt 9a72 <.literal16+0x14e2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7996 <.literal16+0x14e6>
+ .byte 62,114,28 // jb,pt 9a76 <.literal16+0x14e6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 799a <.literal16+0x14ea>
+ .byte 62,114,28 // jb,pt 9a7a <.literal16+0x14ea>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -46247,11 +55879,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 79d2 <.literal16+0x1522>
+ .byte 62,114,28 // jb,pt 9ab2 <.literal16+0x1522>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 79d6 <.literal16+0x1526>
+ .byte 62,114,28 // jb,pt 9ab6 <.literal16+0x1526>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 79da <.literal16+0x152a>
+ .byte 62,114,28 // jb,pt 9aba <.literal16+0x152a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -46295,7 +55927,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640865 <_sk_callback_sse2+0x3d63a4a8>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d642945 <_sk_clut_4D_sse2+0x3d63b99d>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -46321,7 +55953,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6408a5 <_sk_callback_sse2+0x3d63a4e8>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d642985 <_sk_clut_4D_sse2+0x3d63b9dd>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -46330,13 +55962,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 7a9e <.literal16+0x15ee>
+ .byte 114,28 // jb 9b7e <.literal16+0x15ee>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7aa2 <_sk_callback_sse2+0x16e5>
+ .byte 62,114,28 // jb,pt 9b82 <.literal16+0x15f2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7aa6 <_sk_callback_sse2+0x16e9>
+ .byte 62,114,28 // jb,pt 9b86 <.literal16+0x15f6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7aaa <_sk_callback_sse2+0x16ed>
+ .byte 62,114,28 // jb,pt 9b8a <.literal16+0x15fa>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -46346,6 +55978,77 @@ BALIGN16
.byte 170 // stos %al,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
.byte 190,171,170,170,190 // mov $0xbeaaaaab,%esi
+ .byte 114,249 // jb 9b7b <.literal16+0x15eb>
+ .byte 127,63 // jg 9bc3 <.literal16+0x1633>
+ .byte 114,249 // jb 9b7f <.literal16+0x15ef>
+ .byte 127,63 // jg 9bc7 <.literal16+0x1637>
+ .byte 114,249 // jb 9b83 <.literal16+0x15f3>
+ .byte 127,63 // jg 9bcb <.literal16+0x163b>
+ .byte 114,249 // jb 9b87 <.literal16+0x15f7>
+ .byte 127,63 // jg 9bcf <.literal16+0x163f>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 114,249 // jb 9bbb <.literal16+0x162b>
+ .byte 127,63 // jg 9c03 <.literal16+0x1673>
+ .byte 114,249 // jb 9bbf <.literal16+0x162f>
+ .byte 127,63 // jg 9c07 <.literal16+0x1677>
+ .byte 114,249 // jb 9bc3 <.literal16+0x1633>
+ .byte 127,63 // jg 9c0b <.literal16+0x167b>
+ .byte 114,249 // jb 9bc7 <.literal16+0x1637>
+ .byte 127,63 // jg 9c0f <.literal16+0x167f>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,0 // add %eax,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,0 // cmpb $0x0,(%rdi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
+ .byte 63 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128 // .byte 0x80
+ .byte 63 // (bad)
BALIGN4
.byte 0,0 // add %al,(%rax)
@@ -51276,7 +60979,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,144,38,112,0,0 // movaps 0x7026(%eax),%xmm2
+ .byte 15,40,144,6,145,0,0 // movaps 0x9106(%eax),%xmm2
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -51291,7 +60994,7 @@ _sk_seed_shader_sse2:
.byte 15,41,82,32 // movaps %xmm2,0x20(%edx)
.byte 15,41,82,16 // movaps %xmm2,0x10(%edx)
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,144,54,112,0,0 // movaps 0x7036(%eax),%xmm2
+ .byte 15,40,144,22,145,0,0 // movaps 0x9116(%eax),%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 86 // push %esi
.byte 82 // push %edx
@@ -51324,16 +61027,16 @@ _sk_dither_sse2:
.byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,177,201,111,0,0 // movdqa 0x6fc9(%ecx),%xmm6
+ .byte 102,15,111,177,169,144,0,0 // movdqa 0x90a9(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,129,233,111,0,0 // movdqa 0x6fe9(%ecx),%xmm0
+ .byte 102,15,111,129,201,144,0,0 // movdqa 0x90c9(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,219,185,217,111,0,0 // pand 0x6fd9(%ecx),%xmm7
- .byte 102,15,219,169,217,111,0,0 // pand 0x6fd9(%ecx),%xmm5
+ .byte 102,15,219,185,185,144,0,0 // pand 0x90b9(%ecx),%xmm7
+ .byte 102,15,219,169,185,144,0,0 // pand 0x90b9(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
@@ -51348,8 +61051,8 @@ _sk_dither_sse2:
.byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,129,249,111,0,0 // mulps 0x6ff9(%ecx),%xmm0
- .byte 15,88,129,9,112,0,0 // addps 0x7009(%ecx),%xmm0
+ .byte 15,89,129,217,144,0,0 // mulps 0x90d9(%ecx),%xmm0
+ .byte 15,88,129,233,144,0,0 // addps 0x90e9(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -51417,7 +61120,7 @@ _sk_black_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,152,217,110,0,0 // movaps 0x6ed9(%eax),%xmm3
+ .byte 15,40,152,185,143,0,0 // movaps 0x8fb9(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -51440,7 +61143,7 @@ _sk_white_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,128,185,110,0,0 // movaps 0x6eb9(%eax),%xmm0
+ .byte 15,40,128,153,143,0,0 // movaps 0x8f99(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -51530,7 +61233,7 @@ _sk_srcatop_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,170,26,110,0,0 // movaps 0x6e1a(%edx),%xmm5
+ .byte 15,40,170,250,142,0,0 // movaps 0x8efa(%edx),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
@@ -51569,7 +61272,7 @@ _sk_dstatop_sse2:
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,40,162,203,109,0,0 // movaps 0x6dcb(%edx),%xmm4
+ .byte 15,40,162,171,142,0,0 // movaps 0x8eab(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
@@ -51653,7 +61356,7 @@ _sk_srcout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,26,109,0,0 // movaps 0x6d1a(%eax),%xmm4
+ .byte 15,40,160,250,141,0,0 // movaps 0x8dfa(%eax),%xmm4
.byte 15,92,98,64 // subps 0x40(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
@@ -51679,7 +61382,7 @@ _sk_dstout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,242,108,0,0 // movaps 0x6cf2(%eax),%xmm4
+ .byte 15,40,160,210,141,0,0 // movaps 0x8dd2(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -51709,7 +61412,7 @@ _sk_srcover_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,187,108,0,0 // movaps 0x6cbb(%eax),%xmm4
+ .byte 15,40,160,155,141,0,0 // movaps 0x8d9b(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -51743,7 +61446,7 @@ _sk_dstover_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
- .byte 15,40,160,123,108,0,0 // movaps 0x6c7b(%eax),%xmm4
+ .byte 15,40,160,91,141,0,0 // movaps 0x8d5b(%eax),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
@@ -51799,7 +61502,7 @@ _sk_multiply_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,40,129,12,108,0,0 // movaps 0x6c0c(%ecx),%xmm0
+ .byte 15,40,129,236,140,0,0 // movaps 0x8cec(%ecx),%xmm0
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -51924,7 +61627,7 @@ _sk_xor__sse2:
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
- .byte 15,40,154,225,106,0,0 // movaps 0x6ae1(%edx),%xmm3
+ .byte 15,40,154,193,139,0,0 // movaps 0x8bc1(%edx),%xmm3
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,89,198 // mulps %xmm6,%xmm0
@@ -51986,7 +61689,7 @@ _sk_darken_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,95,209 // maxps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,137,106,0,0 // movaps 0x6a89(%edx),%xmm1
+ .byte 15,40,138,105,139,0,0 // movaps 0x8b69(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -52035,7 +61738,7 @@ _sk_lighten_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,93,209 // minps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,25,106,0,0 // movaps 0x6a19(%edx),%xmm1
+ .byte 15,40,138,249,138,0,0 // movaps 0x8af9(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -52088,7 +61791,7 @@ _sk_difference_sse2:
.byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,146,166,105,0,0 // movaps 0x69a6(%edx),%xmm2
+ .byte 15,40,146,134,138,0,0 // movaps 0x8a86(%edx),%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -52132,7 +61835,7 @@ _sk_exclusion_sse2:
.byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,40,138,48,105,0,0 // movaps 0x6930(%edx),%xmm1
+ .byte 15,40,138,16,138,0,0 // movaps 0x8a10(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -52173,7 +61876,7 @@ _sk_colorburn_sse2:
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,92,238 // subps %xmm6,%xmm5
- .byte 15,40,177,189,104,0,0 // movaps 0x68bd(%ecx),%xmm6
+ .byte 15,40,177,157,137,0,0 // movaps 0x899d(%ecx),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
@@ -52295,7 +61998,7 @@ _sk_colordodge_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
- .byte 15,40,177,55,103,0,0 // movaps 0x6737(%ecx),%xmm6
+ .byte 15,40,177,23,136,0,0 // movaps 0x8817(%ecx),%xmm6
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
@@ -52414,7 +62117,7 @@ _sk_hardlight_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
- .byte 15,40,145,219,101,0,0 // movaps 0x65db(%ecx),%xmm2
+ .byte 15,40,145,187,134,0,0 // movaps 0x86bb(%ecx),%xmm2
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
@@ -52524,7 +62227,7 @@ _sk_overlay_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
- .byte 15,40,161,160,100,0,0 // movaps 0x64a0(%ecx),%xmm4
+ .byte 15,40,161,128,133,0,0 // movaps 0x8580(%ecx),%xmm4
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -52652,17 +62355,17 @@ _sk_softlight_sse2:
.byte 232,0,0,0,0 // call f30 <_sk_softlight_sse2+0x52>
.byte 89 // pop %ecx
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,137,48,99,0,0 // movaps 0x6330(%ecx),%xmm1
+ .byte 15,40,137,16,132,0,0 // movaps 0x8410(%ecx),%xmm1
.byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
.byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,185,32,99,0,0 // movaps 0x6320(%ecx),%xmm7
+ .byte 15,40,185,0,132,0,0 // movaps 0x8400(%ecx),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,82,242 // rsqrtps %xmm2,%xmm6
.byte 15,83,206 // rcpps %xmm6,%xmm1
.byte 15,92,202 // subps %xmm2,%xmm1
- .byte 15,40,161,64,99,0,0 // movaps 0x6340(%ecx),%xmm4
+ .byte 15,40,161,32,132,0,0 // movaps 0x8420(%ecx),%xmm4
.byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
@@ -52868,7 +62571,7 @@ _sk_hue_sse2:
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,169,191,96,0,0 // movaps 0x60bf(%ecx),%xmm5
+ .byte 15,40,169,159,129,0,0 // movaps 0x819f(%ecx),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
@@ -52901,17 +62604,17 @@ _sk_hue_sse2:
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,153,143,96,0,0 // movaps 0x608f(%ecx),%xmm3
+ .byte 15,40,153,111,129,0,0 // movaps 0x816f(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,153,159,96,0,0 // movaps 0x609f(%ecx),%xmm3
+ .byte 15,40,153,127,129,0,0 // movaps 0x817f(%ecx),%xmm3
.byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,137,191,96,0,0 // movaps 0x60bf(%ecx),%xmm1
+ .byte 15,40,137,159,129,0,0 // movaps 0x819f(%ecx),%xmm1
.byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
@@ -52921,7 +62624,7 @@ _sk_hue_sse2:
.byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,40,169,175,96,0,0 // movaps 0x60af(%ecx),%xmm5
+ .byte 15,40,169,143,129,0,0 // movaps 0x818f(%ecx),%xmm5
.byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
.byte 15,94,212 // divps %xmm4,%xmm2
@@ -53114,17 +62817,17 @@ _sk_saturation_sse2:
.byte 15,89,253 // mulps %xmm5,%xmm7
.byte 232,0,0,0,0 // call 1545 <_sk_saturation_sse2+0xb0>
.byte 89 // pop %ecx
- .byte 15,40,153,123,93,0,0 // movaps 0x5d7b(%ecx),%xmm3
+ .byte 15,40,153,91,126,0,0 // movaps 0x7e5b(%ecx),%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,153,139,93,0,0 // movaps 0x5d8b(%ecx),%xmm3
+ .byte 15,40,153,107,126,0,0 // movaps 0x7e6b(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,129,171,93,0,0 // movaps 0x5dab(%ecx),%xmm0
+ .byte 15,40,129,139,126,0,0 // movaps 0x7e8b(%ecx),%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -53136,7 +62839,7 @@ _sk_saturation_sse2:
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,129,155,93,0,0 // movaps 0x5d9b(%ecx),%xmm0
+ .byte 15,40,129,123,126,0,0 // movaps 0x7e7b(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
@@ -53295,16 +62998,16 @@ _sk_color_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
.byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
- .byte 15,40,177,96,91,0,0 // movaps 0x5b60(%ecx),%xmm6
+ .byte 15,40,177,64,124,0,0 // movaps 0x7c40(%ecx),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,153,112,91,0,0 // movaps 0x5b70(%ecx),%xmm3
+ .byte 15,40,153,80,124,0,0 // movaps 0x7c50(%ecx),%xmm3
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 15,40,129,144,91,0,0 // movaps 0x5b90(%ecx),%xmm0
+ .byte 15,40,129,112,124,0,0 // movaps 0x7c70(%ecx),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
.byte 15,89,208 // mulps %xmm0,%xmm2
@@ -53314,7 +63017,7 @@ _sk_color_sse2:
.byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
.byte 15,89,194 // mulps %xmm2,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
- .byte 15,40,137,128,91,0,0 // movaps 0x5b80(%ecx),%xmm1
+ .byte 15,40,137,96,124,0,0 // movaps 0x7c60(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
@@ -53473,18 +63176,18 @@ _sk_luminosity_sse2:
.byte 232,0,0,0,0 // call 1a03 <_sk_luminosity_sse2+0x11>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 15,40,161,61,89,0,0 // movaps 0x593d(%ecx),%xmm4
+ .byte 15,40,161,29,122,0,0 // movaps 0x7a1d(%ecx),%xmm4
.byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,161,77,89,0,0 // movaps 0x594d(%ecx),%xmm4
+ .byte 15,40,161,45,122,0,0 // movaps 0x7a2d(%ecx),%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,161,109,89,0,0 // movaps 0x596d(%ecx),%xmm4
+ .byte 15,40,161,77,122,0,0 // movaps 0x7a4d(%ecx),%xmm4
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -53494,7 +63197,7 @@ _sk_luminosity_sse2:
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
.byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,137,93,89,0,0 // movaps 0x595d(%ecx),%xmm1
+ .byte 15,40,137,61,122,0,0 // movaps 0x7a3d(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
@@ -53670,7 +63373,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 139,49 // mov (%ecx),%esi
.byte 15,133,224,0,0,0 // jne 1d70 <_sk_srcover_rgba_8888_sse2+0x119>
.byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
- .byte 102,15,111,167,18,87,0,0 // movdqa 0x5712(%edi),%xmm4
+ .byte 102,15,111,167,242,119,0,0 // movdqa 0x77f2(%edi),%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -53681,9 +63384,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,175,34,87,0,0 // movaps 0x5722(%edi),%xmm5
+ .byte 15,40,175,2,120,0,0 // movaps 0x7802(%edi),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,40,143,50,87,0,0 // movaps 0x5732(%edi),%xmm1
+ .byte 15,40,143,18,120,0,0 // movaps 0x7812(%edi),%xmm1
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
@@ -53797,7 +63500,7 @@ _sk_clamp_1_sse2:
.byte 232,0,0,0,0 // call 1e1a <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,150,85,0,0 // movaps 0x5596(%eax),%xmm4
+ .byte 15,40,160,118,118,0,0 // movaps 0x7676(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,93,204 // minps %xmm4,%xmm1
.byte 15,93,212 // minps %xmm4,%xmm2
@@ -53821,7 +63524,7 @@ _sk_clamp_a_sse2:
.byte 232,0,0,0,0 // call 1e4d <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,93,152,115,85,0,0 // minps 0x5573(%eax),%xmm3
+ .byte 15,93,152,83,118,0,0 // minps 0x7653(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -53846,7 +63549,7 @@ _sk_clamp_a_dst_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
- .byte 15,93,160,83,85,0,0 // minps 0x5553(%eax),%xmm4
+ .byte 15,93,160,51,118,0,0 // minps 0x7633(%eax),%xmm4
.byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
@@ -53920,7 +63623,7 @@ _sk_invert_sse2:
.byte 232,0,0,0,0 // call 1f28 <_sk_invert_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,184,84,0,0 // movaps 0x54b8(%eax),%xmm4
+ .byte 15,40,160,152,117,0,0 // movaps 0x7598(%eax),%xmm4
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
@@ -54043,7 +63746,7 @@ _sk_unpremul_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,168,202,83,0,0 // movaps 0x53ca(%eax),%xmm5
+ .byte 15,40,168,170,116,0,0 // movaps 0x74aa(%eax),%xmm5
.byte 15,94,235 // divps %xmm3,%xmm5
.byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
.byte 15,84,229 // andps %xmm5,%xmm4
@@ -54074,19 +63777,19 @@ _sk_from_srgb_sse2:
.byte 88 // pop %eax
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,201 // mulps %xmm1,%xmm1
- .byte 15,40,160,160,83,0,0 // movaps 0x53a0(%eax),%xmm4
+ .byte 15,40,160,128,116,0,0 // movaps 0x7480(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,176,176,83,0,0 // movaps 0x53b0(%eax),%xmm6
+ .byte 15,40,176,144,116,0,0 // movaps 0x7490(%eax),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,176,144,83,0,0 // movaps 0x5390(%eax),%xmm6
+ .byte 15,40,176,112,116,0,0 // movaps 0x7470(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,184,192,83,0,0 // movaps 0x53c0(%eax),%xmm7
+ .byte 15,40,184,160,116,0,0 // movaps 0x74a0(%eax),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,208,83,0,0 // movaps 0x53d0(%eax),%xmm7
+ .byte 15,40,184,176,116,0,0 // movaps 0x74b0(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -54146,18 +63849,18 @@ _sk_from_srgb_dst_sse2:
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,40,161,21,83,0,0 // movaps 0x5315(%ecx),%xmm4
+ .byte 15,40,161,245,115,0,0 // movaps 0x73f5(%ecx),%xmm4
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,177,37,83,0,0 // movaps 0x5325(%ecx),%xmm6
+ .byte 15,40,177,5,116,0,0 // movaps 0x7405(%ecx),%xmm6
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,169,5,83,0,0 // movaps 0x5305(%ecx),%xmm5
+ .byte 15,40,169,229,115,0,0 // movaps 0x73e5(%ecx),%xmm5
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,185,53,83,0,0 // movaps 0x5335(%ecx),%xmm7
+ .byte 15,40,185,21,116,0,0 // movaps 0x7415(%ecx),%xmm7
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,153,69,83,0,0 // movaps 0x5345(%ecx),%xmm3
+ .byte 15,40,153,37,116,0,0 // movaps 0x7425(%ecx),%xmm3
.byte 15,194,203,1 // cmpltps %xmm3,%xmm1
.byte 15,84,209 // andps %xmm1,%xmm2
.byte 15,85,200 // andnps %xmm0,%xmm1
@@ -54219,25 +63922,25 @@ _sk_to_srgb_sse2:
.byte 232,0,0,0,0 // call 2236 <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,122,82,0,0 // movaps 0x527a(%eax),%xmm4
+ .byte 15,40,160,90,115,0,0 // movaps 0x735a(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,138,82,0,0 // movaps 0x528a(%eax),%xmm0
+ .byte 15,40,128,106,115,0,0 // movaps 0x736a(%eax),%xmm0
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,154,82,0,0 // movaps 0x529a(%eax),%xmm0
+ .byte 15,40,128,122,115,0,0 // movaps 0x737a(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,170,82,0,0 // movaps 0x52aa(%eax),%xmm0
+ .byte 15,40,128,138,115,0,0 // movaps 0x738a(%eax),%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,106,82,0,0 // movaps 0x526a(%eax),%xmm5
+ .byte 15,40,168,74,115,0,0 // movaps 0x734a(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,186,82,0,0 // movaps 0x52ba(%eax),%xmm3
+ .byte 15,40,152,154,115,0,0 // movaps 0x739a(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -54306,14 +64009,14 @@ _sk_rgb_to_hsl_sse2:
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,152,211,81,0,0 // movaps 0x51d3(%eax),%xmm3
+ .byte 15,40,152,179,114,0,0 // movaps 0x72b3(%eax),%xmm3
.byte 15,94,216 // divps %xmm0,%xmm3
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,227,81,0,0 // andps 0x51e3(%eax),%xmm5
+ .byte 15,84,168,195,114,0,0 // andps 0x72c3(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
@@ -54323,9 +64026,9 @@ _sk_rgb_to_hsl_sse2:
.byte 15,92,231 // subps %xmm7,%xmm4
.byte 15,89,211 // mulps %xmm3,%xmm2
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,40,152,243,81,0,0 // movaps 0x51f3(%eax),%xmm3
+ .byte 15,40,152,211,114,0,0 // movaps 0x72d3(%eax),%xmm3
.byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,88,160,3,82,0,0 // addps 0x5203(%eax),%xmm4
+ .byte 15,88,160,227,114,0,0 // addps 0x72e3(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
@@ -54337,7 +64040,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
.byte 15,92,217 // subps %xmm1,%xmm3
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,40,168,35,82,0,0 // movaps 0x5223(%eax),%xmm5
+ .byte 15,40,168,3,115,0,0 // movaps 0x7303(%eax),%xmm5
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
@@ -54347,7 +64050,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,86,235 // orps %xmm3,%xmm5
.byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,89,128,19,82,0,0 // mulps 0x5213(%eax),%xmm0
+ .byte 15,89,128,243,114,0,0 // mulps 0x72f3(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -54372,7 +64075,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 232,0,0,0,0 // call 2422 <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,160,62,81,0,0 // movaps 0x513e(%eax),%xmm4
+ .byte 15,40,160,30,114,0,0 // movaps 0x721e(%eax),%xmm4
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,194,218,2 // cmpleps %xmm2,%xmm3
@@ -54385,13 +64088,13 @@ _sk_hsl_to_rgb_sse2:
.byte 15,84,243 // andps %xmm3,%xmm6
.byte 15,85,217 // andnps %xmm1,%xmm3
.byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,40,168,78,81,0,0 // movaps 0x514e(%eax),%xmm5
+ .byte 15,40,168,46,114,0,0 // movaps 0x722e(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,193,1 // cmpltps %xmm1,%xmm0
- .byte 15,40,176,94,81,0,0 // movaps 0x515e(%eax),%xmm6
+ .byte 15,40,176,62,114,0,0 // movaps 0x723e(%eax),%xmm6
.byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,200 // subps %xmm0,%xmm1
@@ -54401,19 +64104,19 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,184,110,81,0,0 // movaps 0x516e(%eax),%xmm7
+ .byte 15,40,184,78,114,0,0 // movaps 0x724e(%eax),%xmm7
.byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
.byte 15,194,253,2 // cmpleps %xmm5,%xmm7
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,204 // movaps %xmm4,%xmm1
.byte 15,194,205,2 // cmpleps %xmm5,%xmm1
- .byte 15,40,160,158,81,0,0 // movaps 0x519e(%eax),%xmm4
+ .byte 15,40,160,126,114,0,0 // movaps 0x727e(%eax),%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
- .byte 15,40,176,126,81,0,0 // movaps 0x517e(%eax),%xmm6
+ .byte 15,40,176,94,114,0,0 // movaps 0x725e(%eax),%xmm6
.byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,128,142,81,0,0 // movaps 0x518e(%eax),%xmm0
+ .byte 15,40,128,110,114,0,0 // movaps 0x726e(%eax),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
@@ -54439,18 +64142,18 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,94,81,0,0 // andps 0x515e(%eax),%xmm1
+ .byte 15,84,136,62,114,0,0 // andps 0x723e(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,110,81,0,0 // movaps 0x516e(%eax),%xmm0
+ .byte 15,40,128,78,114,0,0 // movaps 0x724e(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,152,62,81,0,0 // movaps 0x513e(%eax),%xmm3
+ .byte 15,40,152,30,114,0,0 // movaps 0x721e(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,40,160,158,81,0,0 // movaps 0x519e(%eax),%xmm4
+ .byte 15,40,160,126,114,0,0 // movaps 0x727e(%eax),%xmm4
.byte 15,194,225,2 // cmpleps %xmm1,%xmm4
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,168,142,81,0,0 // movaps 0x518e(%eax),%xmm5
+ .byte 15,40,168,110,114,0,0 // movaps 0x726e(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
@@ -54470,7 +64173,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,85,252 // andnps %xmm4,%xmm7
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,88,152,174,81,0,0 // addps 0x51ae(%eax),%xmm3
+ .byte 15,88,152,142,114,0,0 // addps 0x728e(%eax),%xmm3
.byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
@@ -54572,9 +64275,9 @@ _sk_scale_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,68,79,0,0 // pand 0x4f44(%edx),%xmm4
+ .byte 102,15,219,162,36,112,0,0 // pand 0x7024(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,84,79,0,0 // mulps 0x4f54(%edx),%xmm4
+ .byte 15,89,162,52,112,0,0 // mulps 0x7034(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
@@ -54674,9 +64377,9 @@ _sk_lerp_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,92,78,0,0 // pand 0x4e5c(%edx),%xmm4
+ .byte 102,15,219,162,60,111,0,0 // pand 0x6f3c(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,108,78,0,0 // mulps 0x4e6c(%edx),%xmm4
+ .byte 15,89,162,76,111,0,0 // mulps 0x6f4c(%edx),%xmm4
.byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
@@ -54750,17 +64453,17 @@ _sk_lerp_565_sse2:
.byte 15,133,163,0,0,0 // jne 2941 <_sk_lerp_565_sse2+0xd2>
.byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,162,163,77,0,0 // movdqa 0x4da3(%edx),%xmm4
+ .byte 102,15,111,162,131,110,0,0 // movdqa 0x6e83(%edx),%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,179,77,0,0 // mulps 0x4db3(%edx),%xmm4
- .byte 102,15,111,170,195,77,0,0 // movdqa 0x4dc3(%edx),%xmm5
+ .byte 15,89,162,147,110,0,0 // mulps 0x6e93(%edx),%xmm4
+ .byte 102,15,111,170,163,110,0,0 // movdqa 0x6ea3(%edx),%xmm5
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,211,77,0,0 // mulps 0x4dd3(%edx),%xmm5
- .byte 102,15,219,178,227,77,0,0 // pand 0x4de3(%edx),%xmm6
+ .byte 15,89,170,179,110,0,0 // mulps 0x6eb3(%edx),%xmm5
+ .byte 102,15,219,178,195,110,0,0 // pand 0x6ec3(%edx),%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,243,77,0,0 // mulps 0x4df3(%edx),%xmm6
+ .byte 15,89,178,211,110,0,0 // mulps 0x6ed3(%edx),%xmm6
.byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7
.byte 15,92,199 // subps %xmm7,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -54835,7 +64538,7 @@ _sk_load_tables_sse2:
.byte 139,30 // mov (%esi),%ebx
.byte 15,133,19,1,0,0 // jne 2ac1 <_sk_load_tables_sse2+0x139>
.byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
- .byte 102,15,111,146,234,76,0,0 // movdqa 0x4cea(%edx),%xmm2
+ .byte 102,15,111,146,202,109,0,0 // movdqa 0x6dca(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
@@ -54891,7 +64594,7 @@ _sk_load_tables_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,250,76,0,0 // mulps 0x4cfa(%edx),%xmm3
+ .byte 15,89,154,218,109,0,0 // mulps 0x6dda(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,194 // mov %eax,%edx
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -55038,7 +64741,7 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,156,75,0,0 // mulps 0x4b9c(%edx),%xmm3
+ .byte 15,89,154,124,108,0,0 // mulps 0x6c7c(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
@@ -55177,7 +64880,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 139,85,240 // mov -0x10(%ebp),%edx
- .byte 15,40,162,172,73,0,0 // movaps 0x49ac(%edx),%xmm4
+ .byte 15,40,162,140,106,0,0 // movaps 0x6a8c(%edx),%xmm4
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 80 // push %eax
@@ -55222,7 +64925,7 @@ _sk_byte_tables_sse2:
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,162,173,71,0,0 // movaps 0x47ad(%edx),%xmm4
+ .byte 15,40,162,141,104,0,0 // movaps 0x688d(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
@@ -55244,7 +64947,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,170,189,71,0,0 // movaps 0x47bd(%edx),%xmm5
+ .byte 15,40,170,157,104,0,0 // movaps 0x689d(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -55374,7 +65077,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,205,69,0,0 // movaps 0x45cd(%edx),%xmm5
+ .byte 15,40,170,173,102,0,0 // movaps 0x66ad(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -55630,15 +65333,15 @@ _sk_parametric_r_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,14,67,0,0 // mulps 0x430e(%edx),%xmm5
- .byte 15,84,178,30,67,0,0 // andps 0x431e(%edx),%xmm6
- .byte 15,86,178,46,67,0,0 // orps 0x432e(%edx),%xmm6
- .byte 15,88,170,62,67,0,0 // addps 0x433e(%edx),%xmm5
- .byte 15,40,186,78,67,0,0 // movaps 0x434e(%edx),%xmm7
+ .byte 15,89,170,238,99,0,0 // mulps 0x63ee(%edx),%xmm5
+ .byte 15,84,178,254,99,0,0 // andps 0x63fe(%edx),%xmm6
+ .byte 15,86,178,14,100,0,0 // orps 0x640e(%edx),%xmm6
+ .byte 15,88,170,30,100,0,0 // addps 0x641e(%edx),%xmm5
+ .byte 15,40,186,46,100,0,0 // movaps 0x642e(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,94,67,0,0 // addps 0x435e(%edx),%xmm6
- .byte 15,40,186,110,67,0,0 // movaps 0x436e(%edx),%xmm7
+ .byte 15,88,178,62,100,0,0 // addps 0x643e(%edx),%xmm6
+ .byte 15,40,186,78,100,0,0 // movaps 0x644e(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -55648,21 +65351,21 @@ _sk_parametric_r_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,126,67,0,0 // movaps 0x437e(%edx),%xmm6
+ .byte 15,40,178,94,100,0,0 // movaps 0x645e(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,142,67,0,0 // addps 0x438e(%edx),%xmm5
- .byte 15,40,186,158,67,0,0 // movaps 0x439e(%edx),%xmm7
+ .byte 15,88,170,110,100,0,0 // addps 0x646e(%edx),%xmm5
+ .byte 15,40,186,126,100,0,0 // movaps 0x647e(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,174,67,0,0 // movaps 0x43ae(%edx),%xmm7
+ .byte 15,40,186,142,100,0,0 // movaps 0x648e(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,190,67,0,0 // movaps 0x43be(%edx),%xmm0
+ .byte 15,40,130,158,100,0,0 // movaps 0x649e(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,206,67,0,0 // mulps 0x43ce(%edx),%xmm0
+ .byte 15,89,130,174,100,0,0 // mulps 0x64ae(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -55716,15 +65419,15 @@ _sk_parametric_g_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,167,66,0,0 // mulps 0x42a7(%edx),%xmm5
- .byte 15,84,178,183,66,0,0 // andps 0x42b7(%edx),%xmm6
- .byte 15,86,178,199,66,0,0 // orps 0x42c7(%edx),%xmm6
- .byte 15,88,170,215,66,0,0 // addps 0x42d7(%edx),%xmm5
- .byte 15,40,186,231,66,0,0 // movaps 0x42e7(%edx),%xmm7
+ .byte 15,89,170,135,99,0,0 // mulps 0x6387(%edx),%xmm5
+ .byte 15,84,178,151,99,0,0 // andps 0x6397(%edx),%xmm6
+ .byte 15,86,178,167,99,0,0 // orps 0x63a7(%edx),%xmm6
+ .byte 15,88,170,183,99,0,0 // addps 0x63b7(%edx),%xmm5
+ .byte 15,40,186,199,99,0,0 // movaps 0x63c7(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,247,66,0,0 // addps 0x42f7(%edx),%xmm6
- .byte 15,40,186,7,67,0,0 // movaps 0x4307(%edx),%xmm7
+ .byte 15,88,178,215,99,0,0 // addps 0x63d7(%edx),%xmm6
+ .byte 15,40,186,231,99,0,0 // movaps 0x63e7(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -55734,21 +65437,21 @@ _sk_parametric_g_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,23,67,0,0 // movaps 0x4317(%edx),%xmm6
+ .byte 15,40,178,247,99,0,0 // movaps 0x63f7(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,39,67,0,0 // addps 0x4327(%edx),%xmm5
- .byte 15,40,186,55,67,0,0 // movaps 0x4337(%edx),%xmm7
+ .byte 15,88,170,7,100,0,0 // addps 0x6407(%edx),%xmm5
+ .byte 15,40,186,23,100,0,0 // movaps 0x6417(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,71,67,0,0 // movaps 0x4347(%edx),%xmm7
+ .byte 15,40,186,39,100,0,0 // movaps 0x6427(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,87,67,0,0 // movaps 0x4357(%edx),%xmm0
+ .byte 15,40,130,55,100,0,0 // movaps 0x6437(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,103,67,0,0 // mulps 0x4367(%edx),%xmm0
+ .byte 15,89,130,71,100,0,0 // mulps 0x6447(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -55801,15 +65504,15 @@ _sk_parametric_b_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,67,66,0,0 // mulps 0x4243(%edx),%xmm5
- .byte 15,84,178,83,66,0,0 // andps 0x4253(%edx),%xmm6
- .byte 15,86,178,99,66,0,0 // orps 0x4263(%edx),%xmm6
- .byte 15,88,170,115,66,0,0 // addps 0x4273(%edx),%xmm5
- .byte 15,40,186,131,66,0,0 // movaps 0x4283(%edx),%xmm7
+ .byte 15,89,170,35,99,0,0 // mulps 0x6323(%edx),%xmm5
+ .byte 15,84,178,51,99,0,0 // andps 0x6333(%edx),%xmm6
+ .byte 15,86,178,67,99,0,0 // orps 0x6343(%edx),%xmm6
+ .byte 15,88,170,83,99,0,0 // addps 0x6353(%edx),%xmm5
+ .byte 15,40,186,99,99,0,0 // movaps 0x6363(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,147,66,0,0 // addps 0x4293(%edx),%xmm6
- .byte 15,40,186,163,66,0,0 // movaps 0x42a3(%edx),%xmm7
+ .byte 15,88,178,115,99,0,0 // addps 0x6373(%edx),%xmm6
+ .byte 15,40,186,131,99,0,0 // movaps 0x6383(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -55819,21 +65522,21 @@ _sk_parametric_b_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,179,66,0,0 // movaps 0x42b3(%edx),%xmm6
+ .byte 15,40,178,147,99,0,0 // movaps 0x6393(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,195,66,0,0 // addps 0x42c3(%edx),%xmm5
- .byte 15,40,186,211,66,0,0 // movaps 0x42d3(%edx),%xmm7
+ .byte 15,88,170,163,99,0,0 // addps 0x63a3(%edx),%xmm5
+ .byte 15,40,186,179,99,0,0 // movaps 0x63b3(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,227,66,0,0 // movaps 0x42e3(%edx),%xmm7
+ .byte 15,40,186,195,99,0,0 // movaps 0x63c3(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,243,66,0,0 // movaps 0x42f3(%edx),%xmm0
+ .byte 15,40,130,211,99,0,0 // movaps 0x63d3(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,3,67,0,0 // mulps 0x4303(%edx),%xmm0
+ .byte 15,89,130,227,99,0,0 // mulps 0x63e3(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -55886,15 +65589,15 @@ _sk_parametric_a_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,223,65,0,0 // mulps 0x41df(%edx),%xmm5
- .byte 15,84,178,239,65,0,0 // andps 0x41ef(%edx),%xmm6
- .byte 15,86,178,255,65,0,0 // orps 0x41ff(%edx),%xmm6
- .byte 15,88,170,15,66,0,0 // addps 0x420f(%edx),%xmm5
- .byte 15,40,186,31,66,0,0 // movaps 0x421f(%edx),%xmm7
+ .byte 15,89,170,191,98,0,0 // mulps 0x62bf(%edx),%xmm5
+ .byte 15,84,178,207,98,0,0 // andps 0x62cf(%edx),%xmm6
+ .byte 15,86,178,223,98,0,0 // orps 0x62df(%edx),%xmm6
+ .byte 15,88,170,239,98,0,0 // addps 0x62ef(%edx),%xmm5
+ .byte 15,40,186,255,98,0,0 // movaps 0x62ff(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,47,66,0,0 // addps 0x422f(%edx),%xmm6
- .byte 15,40,186,63,66,0,0 // movaps 0x423f(%edx),%xmm7
+ .byte 15,88,178,15,99,0,0 // addps 0x630f(%edx),%xmm6
+ .byte 15,40,186,31,99,0,0 // movaps 0x631f(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -55904,21 +65607,21 @@ _sk_parametric_a_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,79,66,0,0 // movaps 0x424f(%edx),%xmm6
+ .byte 15,40,178,47,99,0,0 // movaps 0x632f(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,95,66,0,0 // addps 0x425f(%edx),%xmm5
- .byte 15,40,186,111,66,0,0 // movaps 0x426f(%edx),%xmm7
+ .byte 15,88,170,63,99,0,0 // addps 0x633f(%edx),%xmm5
+ .byte 15,40,186,79,99,0,0 // movaps 0x634f(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,127,66,0,0 // movaps 0x427f(%edx),%xmm7
+ .byte 15,40,186,95,99,0,0 // movaps 0x635f(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,143,66,0,0 // movaps 0x428f(%edx),%xmm0
+ .byte 15,40,130,111,99,0,0 // movaps 0x636f(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,159,66,0,0 // mulps 0x429f(%edx),%xmm0
+ .byte 15,89,130,127,99,0,0 // mulps 0x637f(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -55953,15 +65656,15 @@ _sk_gamma_sse2:
.byte 232,0,0,0,0 // call 38b2 <_sk_gamma_sse2+0x12>
.byte 88 // pop %eax
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
- .byte 15,84,152,142,65,0,0 // andps 0x418e(%eax),%xmm3
- .byte 15,86,152,158,65,0,0 // orps 0x419e(%eax),%xmm3
- .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,89,128,94,98,0,0 // mulps 0x625e(%eax),%xmm0
+ .byte 15,84,152,110,98,0,0 // andps 0x626e(%eax),%xmm3
+ .byte 15,86,152,126,98,0,0 // orps 0x627e(%eax),%xmm3
+ .byte 15,88,128,142,98,0,0 // addps 0x628e(%eax),%xmm0
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,89,160,190,65,0,0 // mulps 0x41be(%eax),%xmm4
+ .byte 15,89,160,158,98,0,0 // mulps 0x629e(%eax),%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,88,152,206,65,0,0 // addps 0x41ce(%eax),%xmm3
- .byte 15,40,160,222,65,0,0 // movaps 0x41de(%eax),%xmm4
+ .byte 15,88,152,174,98,0,0 // addps 0x62ae(%eax),%xmm3
+ .byte 15,40,160,190,98,0,0 // movaps 0x62be(%eax),%xmm4
.byte 15,94,227 // divps %xmm3,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 139,77,12 // mov 0xc(%ebp),%ecx
@@ -55974,30 +65677,30 @@ _sk_gamma_sse2:
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,227,1 // cmpltps %xmm3,%xmm4
- .byte 15,84,160,238,65,0,0 // andps 0x41ee(%eax),%xmm4
+ .byte 15,84,160,206,98,0,0 // andps 0x62ce(%eax),%xmm4
.byte 15,92,220 // subps %xmm4,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
- .byte 15,40,176,30,66,0,0 // movaps 0x421e(%eax),%xmm6
+ .byte 15,88,128,222,98,0,0 // addps 0x62de(%eax),%xmm0
+ .byte 15,40,176,254,98,0,0 // movaps 0x62fe(%eax),%xmm6
.byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,40,168,14,66,0,0 // movaps 0x420e(%eax),%xmm5
+ .byte 15,40,168,238,98,0,0 // movaps 0x62ee(%eax),%xmm5
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,40,152,46,66,0,0 // movaps 0x422e(%eax),%xmm3
+ .byte 15,40,152,14,99,0,0 // movaps 0x630e(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,94,230 // divps %xmm6,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
- .byte 15,84,136,142,65,0,0 // andps 0x418e(%eax),%xmm1
- .byte 15,86,136,158,65,0,0 // orps 0x419e(%eax),%xmm1
- .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,89,128,94,98,0,0 // mulps 0x625e(%eax),%xmm0
+ .byte 15,84,136,110,98,0,0 // andps 0x626e(%eax),%xmm1
+ .byte 15,86,136,126,98,0,0 // orps 0x627e(%eax),%xmm1
+ .byte 15,88,128,142,98,0,0 // addps 0x628e(%eax),%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,89,176,190,65,0,0 // mulps 0x41be(%eax),%xmm6
+ .byte 15,89,176,158,98,0,0 // mulps 0x629e(%eax),%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,136,206,65,0,0 // addps 0x41ce(%eax),%xmm1
- .byte 15,40,176,222,65,0,0 // movaps 0x41de(%eax),%xmm6
+ .byte 15,88,136,174,98,0,0 // addps 0x62ae(%eax),%xmm1
+ .byte 15,40,176,190,98,0,0 // movaps 0x62be(%eax),%xmm6
.byte 15,94,241 // divps %xmm1,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -56005,12 +65708,12 @@ _sk_gamma_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,241,1 // cmpltps %xmm1,%xmm6
- .byte 15,84,176,238,65,0,0 // andps 0x41ee(%eax),%xmm6
+ .byte 15,84,176,206,98,0,0 // andps 0x62ce(%eax),%xmm6
.byte 15,92,206 // subps %xmm6,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
- .byte 15,40,184,30,66,0,0 // movaps 0x421e(%eax),%xmm7
+ .byte 15,88,128,222,98,0,0 // addps 0x62de(%eax),%xmm0
+ .byte 15,40,184,254,98,0,0 // movaps 0x62fe(%eax),%xmm7
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
@@ -56018,15 +65721,15 @@ _sk_gamma_sse2:
.byte 15,94,207 // divps %xmm7,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
- .byte 15,84,144,142,65,0,0 // andps 0x418e(%eax),%xmm2
- .byte 15,86,144,158,65,0,0 // orps 0x419e(%eax),%xmm2
- .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
- .byte 15,40,176,190,65,0,0 // movaps 0x41be(%eax),%xmm6
+ .byte 15,89,128,94,98,0,0 // mulps 0x625e(%eax),%xmm0
+ .byte 15,84,144,110,98,0,0 // andps 0x626e(%eax),%xmm2
+ .byte 15,86,144,126,98,0,0 // orps 0x627e(%eax),%xmm2
+ .byte 15,88,128,142,98,0,0 // addps 0x628e(%eax),%xmm0
+ .byte 15,40,176,158,98,0,0 // movaps 0x629e(%eax),%xmm6
.byte 15,89,242 // mulps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,144,206,65,0,0 // addps 0x41ce(%eax),%xmm2
- .byte 15,40,176,222,65,0,0 // movaps 0x41de(%eax),%xmm6
+ .byte 15,88,144,174,98,0,0 // addps 0x62ae(%eax),%xmm2
+ .byte 15,40,176,190,98,0,0 // movaps 0x62be(%eax),%xmm6
.byte 15,94,242 // divps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
@@ -56034,18 +65737,18 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,242,1 // cmpltps %xmm2,%xmm6
- .byte 15,84,176,238,65,0,0 // andps 0x41ee(%eax),%xmm6
+ .byte 15,84,176,206,98,0,0 // andps 0x62ce(%eax),%xmm6
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
+ .byte 15,88,128,222,98,0,0 // addps 0x62de(%eax),%xmm0
.byte 15,89,238 // mulps %xmm6,%xmm5
.byte 15,92,197 // subps %xmm5,%xmm0
- .byte 15,40,144,30,66,0,0 // movaps 0x421e(%eax),%xmm2
+ .byte 15,40,144,254,98,0,0 // movaps 0x62fe(%eax),%xmm2
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,94,218 // divps %xmm2,%xmm3
.byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,40,128,62,66,0,0 // movaps 0x423e(%eax),%xmm0
+ .byte 15,40,128,30,99,0,0 // movaps 0x631e(%eax),%xmm0
.byte 15,89,224 // mulps %xmm0,%xmm4
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,89,216 // mulps %xmm0,%xmm3
@@ -56074,29 +65777,29 @@ _sk_lab_to_xyz_sse2:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 232,0,0,0,0 // call 3a9a <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,102,64,0,0 // mulps 0x4066(%eax),%xmm2
- .byte 15,40,160,118,64,0,0 // movaps 0x4076(%eax),%xmm4
+ .byte 15,89,144,70,97,0,0 // mulps 0x6146(%eax),%xmm2
+ .byte 15,40,160,86,97,0,0 // movaps 0x6156(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,134,64,0,0 // movaps 0x4086(%eax),%xmm5
+ .byte 15,40,168,102,97,0,0 // movaps 0x6166(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,150,64,0,0 // addps 0x4096(%eax),%xmm2
- .byte 15,89,144,166,64,0,0 // mulps 0x40a6(%eax),%xmm2
- .byte 15,89,136,182,64,0,0 // mulps 0x40b6(%eax),%xmm1
+ .byte 15,88,144,118,97,0,0 // addps 0x6176(%eax),%xmm2
+ .byte 15,89,144,134,97,0,0 // mulps 0x6186(%eax),%xmm2
+ .byte 15,89,136,150,97,0,0 // mulps 0x6196(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,198,64,0,0 // mulps 0x40c6(%eax),%xmm3
+ .byte 15,89,152,166,97,0,0 // mulps 0x61a6(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,214,64,0,0 // movaps 0x40d6(%eax),%xmm3
+ .byte 15,40,152,182,97,0,0 // movaps 0x61b6(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,230,64,0,0 // movaps 0x40e6(%eax),%xmm6
+ .byte 15,40,176,198,97,0,0 // movaps 0x61c6(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,246,64,0,0 // movaps 0x40f6(%eax),%xmm7
+ .byte 15,40,184,214,97,0,0 // movaps 0x61d6(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -56121,8 +65824,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,85,221 // andnps %xmm5,%xmm3
.byte 15,86,216 // orps %xmm0,%xmm3
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,160,6,65,0,0 // mulps 0x4106(%eax),%xmm4
- .byte 15,89,152,22,65,0,0 // mulps 0x4116(%eax),%xmm3
+ .byte 15,89,160,230,97,0,0 // mulps 0x61e6(%eax),%xmm4
+ .byte 15,89,152,246,97,0,0 // mulps 0x61f6(%eax),%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -56160,9 +65863,9 @@ _sk_load_a8_sse2:
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,54,64,0,0 // pand 0x4036(%edx),%xmm0
+ .byte 102,15,219,130,22,97,0,0 // pand 0x6116(%edx),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,154,70,64,0,0 // mulps 0x4046(%edx),%xmm3
+ .byte 15,89,154,38,97,0,0 // mulps 0x6126(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -56227,9 +65930,9 @@ _sk_load_a8_dst_sse2:
.byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,130,63,0,0 // pand 0x3f82(%edx),%xmm4
+ .byte 102,15,219,162,98,96,0,0 // pand 0x6062(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,146,63,0,0 // mulps 0x3f92(%edx),%xmm4
+ .byte 15,89,162,114,96,0,0 // mulps 0x6072(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -56307,7 +66010,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,153,164,62,0,0 // mulps 0x3ea4(%ecx),%xmm3
+ .byte 15,89,153,132,95,0,0 // mulps 0x5f84(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -56341,7 +66044,7 @@ _sk_store_a8_sse2:
.byte 15,175,81,4 // imul 0x4(%ecx),%edx
.byte 3,23 // add (%edi),%edx
.byte 139,89,8 // mov 0x8(%ecx),%ebx
- .byte 15,40,166,112,62,0,0 // movaps 0x3e70(%esi),%xmm4
+ .byte 15,40,166,80,95,0,0 // movaps 0x5f50(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
@@ -56377,7 +66080,7 @@ _sk_store_a8_sse2:
.byte 138,93,208 // mov -0x30(%ebp),%bl
.byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,166,128,62,0,0 // pand 0x3e80(%esi),%xmm4
+ .byte 102,15,219,166,96,95,0,0 // pand 0x5f60(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
@@ -56414,12 +66117,12 @@ _sk_load_g8_sse2:
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,215,61,0,0 // pand 0x3dd7(%edx),%xmm0
+ .byte 102,15,219,130,183,94,0,0 // pand 0x5eb7(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,231,61,0,0 // mulps 0x3de7(%edx),%xmm0
+ .byte 15,89,130,199,94,0,0 // mulps 0x5ec7(%edx),%xmm0
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,247,61,0,0 // movaps 0x3df7(%edx),%xmm3
+ .byte 15,40,154,215,94,0,0 // movaps 0x5ed7(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 86 // push %esi
@@ -56477,13 +66180,13 @@ _sk_load_g8_dst_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,91,61,0,0 // pand 0x3d5b(%edx),%xmm4
+ .byte 102,15,219,162,59,94,0,0 // pand 0x5e3b(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,107,61,0,0 // mulps 0x3d6b(%edx),%xmm4
+ .byte 15,89,162,75,94,0,0 // mulps 0x5e4b(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
.byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,162,123,61,0,0 // movaps 0x3d7b(%edx),%xmm4
+ .byte 15,40,162,91,94,0,0 // movaps 0x5e5b(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -56562,10 +66265,10 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,99,60,0,0 // mulps 0x3c63(%ecx),%xmm0
+ .byte 15,89,129,67,93,0,0 // mulps 0x5d43(%ecx),%xmm0
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,115,60,0,0 // movaps 0x3c73(%ecx),%xmm3
+ .byte 15,40,153,83,93,0,0 // movaps 0x5d53(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 82 // push %edx
@@ -56602,20 +66305,20 @@ _sk_load_565_sse2:
.byte 117,97 // jne 40f6 <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,56,60,0,0 // movdqa 0x3c38(%edx),%xmm0
+ .byte 102,15,111,130,24,93,0,0 // movdqa 0x5d18(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,72,60,0,0 // mulps 0x3c48(%edx),%xmm0
- .byte 102,15,111,138,88,60,0,0 // movdqa 0x3c58(%edx),%xmm1
+ .byte 15,89,130,40,93,0,0 // mulps 0x5d28(%edx),%xmm0
+ .byte 102,15,111,138,56,93,0,0 // movdqa 0x5d38(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,104,60,0,0 // mulps 0x3c68(%edx),%xmm1
- .byte 102,15,219,146,120,60,0,0 // pand 0x3c78(%edx),%xmm2
+ .byte 15,89,138,72,93,0,0 // mulps 0x5d48(%edx),%xmm1
+ .byte 102,15,219,146,88,93,0,0 // pand 0x5d58(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,136,60,0,0 // mulps 0x3c88(%edx),%xmm2
+ .byte 15,89,146,104,93,0,0 // mulps 0x5d68(%edx),%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,152,60,0,0 // movaps 0x3c98(%edx),%xmm3
+ .byte 15,40,154,120,93,0,0 // movaps 0x5d78(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -56669,21 +66372,21 @@ _sk_load_565_dst_sse2:
.byte 117,113 // jne 41d5 <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,217,59,0,0 // movdqa 0x3bd9(%edx),%xmm5
+ .byte 102,15,111,170,185,92,0,0 // movdqa 0x5cb9(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,233,59,0,0 // mulps 0x3be9(%edx),%xmm5
+ .byte 15,89,170,201,92,0,0 // mulps 0x5cc9(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,249,59,0,0 // movdqa 0x3bf9(%edx),%xmm5
+ .byte 102,15,111,170,217,92,0,0 // movdqa 0x5cd9(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,9,60,0,0 // mulps 0x3c09(%edx),%xmm5
+ .byte 15,89,170,233,92,0,0 // mulps 0x5ce9(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,219,162,25,60,0,0 // pand 0x3c19(%edx),%xmm4
+ .byte 102,15,219,162,249,92,0,0 // pand 0x5cf9(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,41,60,0,0 // mulps 0x3c29(%edx),%xmm4
+ .byte 15,89,162,9,93,0,0 // mulps 0x5d09(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
- .byte 15,40,162,57,60,0,0 // movaps 0x3c39(%edx),%xmm4
+ .byte 15,40,162,25,93,0,0 // movaps 0x5d19(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -56753,20 +66456,20 @@ _sk_gather_565_sse2:
.byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,253,58,0,0 // movdqa 0x3afd(%edx),%xmm0
+ .byte 102,15,111,130,221,91,0,0 // movdqa 0x5bdd(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,13,59,0,0 // mulps 0x3b0d(%edx),%xmm0
- .byte 102,15,111,138,29,59,0,0 // movdqa 0x3b1d(%edx),%xmm1
+ .byte 15,89,130,237,91,0,0 // mulps 0x5bed(%edx),%xmm0
+ .byte 102,15,111,138,253,91,0,0 // movdqa 0x5bfd(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,45,59,0,0 // mulps 0x3b2d(%edx),%xmm1
- .byte 102,15,219,146,61,59,0,0 // pand 0x3b3d(%edx),%xmm2
+ .byte 15,89,138,13,92,0,0 // mulps 0x5c0d(%edx),%xmm1
+ .byte 102,15,219,146,29,92,0,0 // pand 0x5c1d(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,77,59,0,0 // mulps 0x3b4d(%edx),%xmm2
+ .byte 15,89,146,45,92,0,0 // mulps 0x5c2d(%edx),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,93,59,0,0 // movaps 0x3b5d(%edx),%xmm3
+ .byte 15,40,154,61,92,0,0 // movaps 0x5c3d(%edx),%xmm3
.byte 81 // push %ecx
.byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
@@ -56794,8 +66497,8 @@ _sk_store_565_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,250,58,0,0 // movaps 0x3afa(%edi),%xmm4
- .byte 15,40,175,10,59,0,0 // movaps 0x3b0a(%edi),%xmm5
+ .byte 15,40,167,218,91,0,0 // movaps 0x5bda(%edi),%xmm4
+ .byte 15,40,175,234,91,0,0 // movaps 0x5bea(%edi),%xmm5
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,89,244 // mulps %xmm4,%xmm6
@@ -56875,21 +66578,21 @@ _sk_load_4444_sse2:
.byte 117,112 // jne 4475 <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,56,58,0,0 // movdqa 0x3a38(%edx),%xmm0
+ .byte 102,15,111,130,24,91,0,0 // movdqa 0x5b18(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,72,58,0,0 // mulps 0x3a48(%edx),%xmm0
- .byte 102,15,111,138,88,58,0,0 // movdqa 0x3a58(%edx),%xmm1
+ .byte 15,89,130,40,91,0,0 // mulps 0x5b28(%edx),%xmm0
+ .byte 102,15,111,138,56,91,0,0 // movdqa 0x5b38(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,104,58,0,0 // mulps 0x3a68(%edx),%xmm1
- .byte 102,15,111,146,120,58,0,0 // movdqa 0x3a78(%edx),%xmm2
+ .byte 15,89,138,72,91,0,0 // mulps 0x5b48(%edx),%xmm1
+ .byte 102,15,111,146,88,91,0,0 // movdqa 0x5b58(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,136,58,0,0 // mulps 0x3a88(%edx),%xmm2
- .byte 102,15,219,154,152,58,0,0 // pand 0x3a98(%edx),%xmm3
+ .byte 15,89,146,104,91,0,0 // mulps 0x5b68(%edx),%xmm2
+ .byte 102,15,219,154,120,91,0,0 // pand 0x5b78(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,168,58,0,0 // mulps 0x3aa8(%edx),%xmm3
+ .byte 15,89,154,136,91,0,0 // mulps 0x5b88(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 82 // push %edx
@@ -56945,24 +66648,24 @@ _sk_load_4444_dst_sse2:
.byte 15,133,128,0,0,0 // jne 4567 <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,218,57,0,0 // movdqa 0x39da(%edx),%xmm5
+ .byte 102,15,111,170,186,90,0,0 // movdqa 0x5aba(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,234,57,0,0 // mulps 0x39ea(%edx),%xmm5
+ .byte 15,89,170,202,90,0,0 // mulps 0x5aca(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,250,57,0,0 // movdqa 0x39fa(%edx),%xmm5
+ .byte 102,15,111,170,218,90,0,0 // movdqa 0x5ada(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,10,58,0,0 // mulps 0x3a0a(%edx),%xmm5
+ .byte 15,89,170,234,90,0,0 // mulps 0x5aea(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,111,170,26,58,0,0 // movdqa 0x3a1a(%edx),%xmm5
+ .byte 102,15,111,170,250,90,0,0 // movdqa 0x5afa(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,42,58,0,0 // mulps 0x3a2a(%edx),%xmm5
+ .byte 15,89,170,10,91,0,0 // mulps 0x5b0a(%edx),%xmm5
.byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
- .byte 102,15,219,162,58,58,0,0 // pand 0x3a3a(%edx),%xmm4
+ .byte 102,15,219,162,26,91,0,0 // pand 0x5b1a(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,74,58,0,0 // mulps 0x3a4a(%edx),%xmm4
+ .byte 15,89,162,42,91,0,0 // mulps 0x5b2a(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -57032,21 +66735,21 @@ _sk_gather_4444_sse2:
.byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,129,242,56,0,0 // movdqa 0x38f2(%ecx),%xmm0
+ .byte 102,15,111,129,210,89,0,0 // movdqa 0x59d2(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,2,57,0,0 // mulps 0x3902(%ecx),%xmm0
- .byte 102,15,111,137,18,57,0,0 // movdqa 0x3912(%ecx),%xmm1
+ .byte 15,89,129,226,89,0,0 // mulps 0x59e2(%ecx),%xmm0
+ .byte 102,15,111,137,242,89,0,0 // movdqa 0x59f2(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,137,34,57,0,0 // mulps 0x3922(%ecx),%xmm1
- .byte 102,15,111,145,50,57,0,0 // movdqa 0x3932(%ecx),%xmm2
+ .byte 15,89,137,2,90,0,0 // mulps 0x5a02(%ecx),%xmm1
+ .byte 102,15,111,145,18,90,0,0 // movdqa 0x5a12(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,145,66,57,0,0 // mulps 0x3942(%ecx),%xmm2
- .byte 102,15,219,153,82,57,0,0 // pand 0x3952(%ecx),%xmm3
+ .byte 15,89,145,34,90,0,0 // mulps 0x5a22(%ecx),%xmm2
+ .byte 102,15,219,153,50,90,0,0 // pand 0x5a32(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,153,98,57,0,0 // mulps 0x3962(%ecx),%xmm3
+ .byte 15,89,153,66,90,0,0 // mulps 0x5a42(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 81 // push %ecx
@@ -57076,7 +66779,7 @@ _sk_store_4444_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,245,56,0,0 // movaps 0x38f5(%edi),%xmm4
+ .byte 15,40,167,213,89,0,0 // movaps 0x59d5(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -57161,11 +66864,11 @@ _sk_load_8888_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,102 // jne 4820 <_sk_load_8888_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,146,20,56,0,0 // movdqa 0x3814(%edx),%xmm2
+ .byte 102,15,111,146,244,88,0,0 // movdqa 0x58f4(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,36,56,0,0 // movaps 0x3824(%edx),%xmm4
+ .byte 15,40,162,4,89,0,0 // movaps 0x5904(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -57230,11 +66933,11 @@ _sk_load_8888_dst_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,118 // jne 48f7 <_sk_load_8888_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,109,55,0,0 // movdqa 0x376d(%edx),%xmm5
+ .byte 102,15,111,170,77,88,0,0 // movdqa 0x584d(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,125,55,0,0 // movaps 0x377d(%edx),%xmm7
+ .byte 15,40,186,93,88,0,0 // movaps 0x585d(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -57316,11 +67019,11 @@ _sk_gather_8888_sse2:
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,145,74,54,0,0 // movdqa 0x364a(%ecx),%xmm2
+ .byte 102,15,111,145,42,87,0,0 // movdqa 0x572a(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,161,90,54,0,0 // movaps 0x365a(%ecx),%xmm4
+ .byte 15,40,161,58,87,0,0 // movaps 0x573a(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -57364,7 +67067,7 @@ _sk_store_8888_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,239,53,0,0 // movaps 0x35ef(%edi),%xmm4
+ .byte 15,40,167,207,86,0,0 // movaps 0x56cf(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -57435,11 +67138,11 @@ _sk_load_bgra_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,102 // jne 4b5b <_sk_load_bgra_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,130,73,53,0,0 // movdqa 0x3549(%edx),%xmm0
+ .byte 102,15,111,130,41,86,0,0 // movdqa 0x5629(%edx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,162,89,53,0,0 // movaps 0x3559(%edx),%xmm4
+ .byte 15,40,162,57,86,0,0 // movaps 0x5639(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -57504,11 +67207,11 @@ _sk_load_bgra_dst_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,118 // jne 4c32 <_sk_load_bgra_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,162,52,0,0 // movdqa 0x34a2(%edx),%xmm5
+ .byte 102,15,111,170,130,85,0,0 // movdqa 0x5582(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,178,52,0,0 // movaps 0x34b2(%edx),%xmm7
+ .byte 15,40,186,146,85,0,0 // movaps 0x5592(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -57590,11 +67293,11 @@ _sk_gather_bgra_sse2:
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,129,127,51,0,0 // movdqa 0x337f(%ecx),%xmm0
+ .byte 102,15,111,129,95,84,0,0 // movdqa 0x545f(%ecx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,161,143,51,0,0 // movaps 0x338f(%ecx),%xmm4
+ .byte 15,40,161,111,84,0,0 // movaps 0x546f(%ecx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -57638,7 +67341,7 @@ _sk_store_bgra_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,36,51,0,0 // movaps 0x3324(%edi),%xmm4
+ .byte 15,40,167,4,84,0,0 // movaps 0x5404(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -57735,7 +67438,7 @@ _sk_load_f16_sse2:
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,154,126,50,0,0 // movdqa 0x327e(%edx),%xmm3
+ .byte 102,15,111,154,94,83,0,0 // movdqa 0x535e(%edx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -57768,15 +67471,15 @@ _sk_load_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,154,142,50,0,0 // movdqa 0x328e(%edx),%xmm3
+ .byte 102,15,111,154,110,83,0,0 // movdqa 0x536e(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,154,158,50,0,0 // movdqa 0x329e(%edx),%xmm3
+ .byte 102,15,111,154,126,83,0,0 // movdqa 0x537e(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,154,174,50,0,0 // movdqa 0x32ae(%edx),%xmm3
+ .byte 102,15,111,154,142,83,0,0 // movdqa 0x538e(%edx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -57869,7 +67572,7 @@ _sk_load_f16_dst_sse2:
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
- .byte 102,15,111,154,168,48,0,0 // movdqa 0x30a8(%edx),%xmm3
+ .byte 102,15,111,154,136,81,0,0 // movdqa 0x5188(%edx),%xmm3
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,239,226 // pxor %xmm2,%xmm4
@@ -57877,13 +67580,13 @@ _sk_load_f16_dst_sse2:
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,146,200,48,0,0 // movdqa 0x30c8(%edx),%xmm2
+ .byte 102,15,111,146,168,81,0,0 // movdqa 0x51a8(%edx),%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
.byte 102,15,239,226 // pxor %xmm2,%xmm4
- .byte 102,15,111,178,216,48,0,0 // movdqa 0x30d8(%edx),%xmm6
+ .byte 102,15,111,178,184,81,0,0 // movdqa 0x51b8(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
- .byte 102,15,111,146,184,48,0,0 // movdqa 0x30b8(%edx),%xmm2
+ .byte 102,15,111,146,152,81,0,0 // movdqa 0x5198(%edx),%xmm2
.byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,223,249 // pandn %xmm1,%xmm7
@@ -58027,7 +67730,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,153,62,46,0,0 // movdqa 0x2e3e(%ecx),%xmm3
+ .byte 102,15,111,153,30,79,0,0 // movdqa 0x4f1e(%ecx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -58060,15 +67763,15 @@ _sk_gather_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,153,78,46,0,0 // movdqa 0x2e4e(%ecx),%xmm3
+ .byte 102,15,111,153,46,79,0,0 // movdqa 0x4f2e(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,153,94,46,0,0 // movdqa 0x2e5e(%ecx),%xmm3
+ .byte 102,15,111,153,62,79,0,0 // movdqa 0x4f3e(%ecx),%xmm3
.byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,153,110,46,0,0 // movdqa 0x2e6e(%ecx),%xmm3
+ .byte 102,15,111,153,78,79,0,0 // movdqa 0x4f4e(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -58109,18 +67812,18 @@ _sk_store_f16_sse2:
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 232,0,0,0,0 // call 5495 <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,187,44,0,0 // movdqa 0x2cbb(%eax),%xmm6
+ .byte 102,15,111,176,155,77,0,0 // movdqa 0x4d9b(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
.byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,203,44,0,0 // movdqa 0x2ccb(%eax),%xmm4
+ .byte 102,15,111,160,171,77,0,0 // movdqa 0x4dab(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,219,44,0,0 // movdqa 0x2cdb(%eax),%xmm7
+ .byte 102,15,111,184,187,77,0,0 // movdqa 0x4dbb(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
@@ -58257,7 +67960,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,37,43,0,0 // movaps 0x2b25(%edx),%xmm4
+ .byte 15,40,162,5,76,0,0 // movaps 0x4c05(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -58361,7 +68064,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,170,206,41,0,0 // movaps 0x29ce(%edx),%xmm5
+ .byte 15,40,170,174,74,0,0 // movaps 0x4aae(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -58387,7 +68090,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,222,41,0,0 // movaps 0x29de(%edx),%xmm3
+ .byte 15,40,154,190,74,0,0 // movaps 0x4abe(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -58428,7 +68131,7 @@ _sk_store_u16_be_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 232,0,0,0,0 // call 591d <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,147,40,0,0 // movaps 0x2893(%eax),%xmm6
+ .byte 15,40,176,115,73,0,0 // movaps 0x4973(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -58771,7 +68474,7 @@ _sk_repeat_x_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,255,36,0,0 // andps 0x24ff(%ecx),%xmm6
+ .byte 15,84,177,223,69,0,0 // andps 0x45df(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -58809,7 +68512,7 @@ _sk_repeat_y_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,169,36,0,0 // andps 0x24a9(%ecx),%xmm6
+ .byte 15,84,177,137,69,0,0 // andps 0x4589(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -58845,13 +68548,13 @@ _sk_mirror_x_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,177,67,41,0,0 // mulss 0x2943(%ecx),%xmm6
+ .byte 243,15,89,177,179,74,0,0 // mulss 0x4ab3(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,83,36,0,0 // andps 0x2453(%ecx),%xmm6
+ .byte 15,84,177,51,69,0,0 // andps 0x4533(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -58891,13 +68594,13 @@ _sk_mirror_y_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,177,194,40,0,0 // mulss 0x28c2(%ecx),%xmm6
+ .byte 243,15,89,177,50,74,0,0 // mulss 0x4a32(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,222,35,0,0 // andps 0x23de(%ecx),%xmm6
+ .byte 15,84,177,190,68,0,0 // andps 0x44be(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -58933,7 +68636,7 @@ _sk_clamp_x_1_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,93,160,105,35,0,0 // minps 0x2369(%eax),%xmm4
+ .byte 15,93,160,73,68,0,0 // minps 0x4449(%eax),%xmm4
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -58958,7 +68661,7 @@ _sk_repeat_x_1_sse2:
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,84,168,73,35,0,0 // andps 0x2349(%eax),%xmm5
+ .byte 15,84,168,41,68,0,0 // andps 0x4429(%eax),%xmm5
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -58980,14 +68683,14 @@ _sk_mirror_x_1_sse2:
.byte 232,0,0,0,0 // call 5f02 <_sk_mirror_x_1_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,161,30,35,0,0 // movaps 0x231e(%ecx),%xmm4
+ .byte 15,40,161,254,67,0,0 // movaps 0x43fe(%ecx),%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,169,46,35,0,0 // movaps 0x232e(%ecx),%xmm5
+ .byte 15,40,169,14,68,0,0 // movaps 0x440e(%ecx),%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,169,62,35,0,0 // andps 0x233e(%ecx),%xmm5
+ .byte 15,84,169,30,68,0,0 // andps 0x441e(%ecx),%xmm5
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
@@ -59015,10 +68718,10 @@ _sk_luminance_to_alpha_sse2:
.byte 232,0,0,0,0 // call 5f60 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,128,240,34,0,0 // mulps 0x22f0(%eax),%xmm0
- .byte 15,89,136,0,35,0,0 // mulps 0x2300(%eax),%xmm1
+ .byte 15,89,128,208,67,0,0 // mulps 0x43d0(%eax),%xmm0
+ .byte 15,89,136,224,67,0,0 // mulps 0x43e0(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,152,16,35,0,0 // mulps 0x2310(%eax),%xmm3
+ .byte 15,89,152,240,67,0,0 // mulps 0x43f0(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59419,12 +69122,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,131,30,0,0 // movdqa 0x1e83(%edx),%xmm2
+ .byte 102,15,111,146,99,63,0,0 // movdqa 0x3f63(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,147,30,0,0 // por 0x1e93(%edx),%xmm2
+ .byte 102,15,235,146,115,63,0,0 // por 0x3f73(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,163,30,0,0 // por 0x1ea3(%edx),%xmm1
- .byte 15,88,138,179,30,0,0 // addps 0x1eb3(%edx),%xmm1
+ .byte 102,15,235,138,131,63,0,0 // por 0x3f83(%edx),%xmm1
+ .byte 15,88,138,147,63,0,0 // addps 0x3f93(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -59534,15 +69237,15 @@ _sk_gauss_a_to_rgba_sse2:
.byte 232,0,0,0,0 // call 65b3 <_sk_gauss_a_to_rgba_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,128,13,29,0,0 // movaps 0x1d0d(%eax),%xmm0
+ .byte 15,40,128,237,61,0,0 // movaps 0x3ded(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,29,29,0,0 // addps 0x1d1d(%eax),%xmm0
+ .byte 15,88,128,253,61,0,0 // addps 0x3dfd(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,45,29,0,0 // addps 0x1d2d(%eax),%xmm0
+ .byte 15,88,128,13,62,0,0 // addps 0x3e0d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,61,29,0,0 // addps 0x1d3d(%eax),%xmm0
+ .byte 15,88,128,29,62,0,0 // addps 0x3e1d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,77,29,0,0 // addps 0x1d4d(%eax),%xmm0
+ .byte 15,88,128,45,62,0,0 // addps 0x3e2d(%eax),%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
@@ -59579,7 +69282,7 @@ _sk_gradient_sse2:
.byte 74 // dec %edx
.byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,151,2,29,0,0 // movaps 0x1d02(%edi),%xmm2
+ .byte 15,40,151,226,61,0,0 // movaps 0x3de2(%edi),%xmm2
.byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -59754,30 +69457,30 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,214,26,0,0 // movaps 0x1ad6(%eax),%xmm0
+ .byte 15,40,128,182,59,0,0 // movaps 0x3bb6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,230,26,0,0 // addps 0x1ae6(%eax),%xmm0
+ .byte 15,88,128,198,59,0,0 // addps 0x3bc6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,246,26,0,0 // addps 0x1af6(%eax),%xmm0
+ .byte 15,88,128,214,59,0,0 // addps 0x3bd6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,6,27,0,0 // addps 0x1b06(%eax),%xmm0
+ .byte 15,88,128,230,59,0,0 // addps 0x3be6(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,176,22,27,0,0 // movaps 0x1b16(%eax),%xmm6
+ .byte 15,40,176,246,59,0,0 // movaps 0x3bf6(%eax),%xmm6
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,38,27,0,0 // movaps 0x1b26(%eax),%xmm0
+ .byte 15,40,128,6,60,0,0 // movaps 0x3c06(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,54,27,0,0 // movaps 0x1b36(%eax),%xmm5
+ .byte 15,40,168,22,60,0,0 // movaps 0x3c16(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
@@ -59845,8 +69548,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,41,26,0,0 // mulps 0x1a29(%edx),%xmm4
- .byte 15,89,130,57,26,0,0 // mulps 0x1a39(%edx),%xmm0
+ .byte 15,89,162,9,59,0,0 // mulps 0x3b09(%edx),%xmm4
+ .byte 15,89,130,25,59,0,0 // mulps 0x3b19(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -59854,11 +69557,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,73,26,0,0 // xorps 0x1a49(%edx),%xmm4
+ .byte 15,87,162,41,59,0,0 // xorps 0x3b29(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,89,26,0,0 // mulps 0x1a59(%edx),%xmm5
+ .byte 15,89,170,57,59,0,0 // mulps 0x3b39(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
@@ -59896,8 +69599,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,203,25,0,0 // mulps 0x19cb(%edx),%xmm4
- .byte 15,89,130,219,25,0,0 // mulps 0x19db(%edx),%xmm0
+ .byte 15,89,162,171,58,0,0 // mulps 0x3aab(%edx),%xmm4
+ .byte 15,89,130,187,58,0,0 // mulps 0x3abb(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -59905,11 +69608,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,235,25,0,0 // xorps 0x19eb(%edx),%xmm4
+ .byte 15,87,162,203,58,0,0 // xorps 0x3acb(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,251,25,0,0 // mulps 0x19fb(%edx),%xmm5
+ .byte 15,89,170,219,58,0,0 // mulps 0x3adb(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
@@ -59938,7 +69641,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,169,147,25,0,0 // mulps 0x1993(%ecx),%xmm5
+ .byte 15,89,169,115,58,0,0 // mulps 0x3a73(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -59946,7 +69649,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,129,163,25,0,0 // xorps 0x19a3(%ecx),%xmm0
+ .byte 15,87,129,131,58,0,0 // xorps 0x3a83(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
@@ -60022,14 +69725,14 @@ _sk_save_xy_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 232,0,0,0,0 // call 6b5a <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,214,24,0,0 // movaps 0x18d6(%eax),%xmm4
+ .byte 15,40,160,182,57,0,0 // movaps 0x39b6(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,230,24,0,0 // movaps 0x18e6(%eax),%xmm2
+ .byte 15,40,144,198,57,0,0 // movaps 0x39c6(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -60111,8 +69814,8 @@ _sk_bilinear_nx_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,20,24,0,0 // addps 0x1814(%eax),%xmm0
- .byte 15,40,168,36,24,0,0 // movaps 0x1824(%eax),%xmm5
+ .byte 15,88,128,244,56,0,0 // addps 0x38f4(%eax),%xmm0
+ .byte 15,40,168,4,57,0,0 // movaps 0x3904(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -60140,7 +69843,7 @@ _sk_bilinear_px_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,241,23,0,0 // addps 0x17f1(%eax),%xmm0
+ .byte 15,88,128,209,56,0,0 // addps 0x38d1(%eax),%xmm0
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -60167,8 +69870,8 @@ _sk_bilinear_ny_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,200,23,0,0 // addps 0x17c8(%eax),%xmm1
- .byte 15,40,168,216,23,0,0 // movaps 0x17d8(%eax),%xmm5
+ .byte 15,88,136,168,56,0,0 // addps 0x38a8(%eax),%xmm1
+ .byte 15,40,168,184,56,0,0 // movaps 0x38b8(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -60196,7 +69899,7 @@ _sk_bilinear_py_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,164,23,0,0 // addps 0x17a4(%eax),%xmm1
+ .byte 15,88,136,132,56,0,0 // addps 0x3884(%eax),%xmm1
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -60223,13 +69926,13 @@ _sk_bicubic_n3x_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,122,23,0,0 // addps 0x177a(%eax),%xmm0
- .byte 15,40,168,138,23,0,0 // movaps 0x178a(%eax),%xmm5
+ .byte 15,88,128,90,56,0,0 // addps 0x385a(%eax),%xmm0
+ .byte 15,40,168,106,56,0,0 // movaps 0x386a(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,154,23,0,0 // mulps 0x179a(%eax),%xmm5
- .byte 15,88,168,170,23,0,0 // addps 0x17aa(%eax),%xmm5
+ .byte 15,89,168,122,56,0,0 // mulps 0x387a(%eax),%xmm5
+ .byte 15,88,168,138,56,0,0 // addps 0x388a(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -60257,16 +69960,16 @@ _sk_bicubic_n1x_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,96,23,0,0 // addps 0x1760(%eax),%xmm0
- .byte 15,40,168,112,23,0,0 // movaps 0x1770(%eax),%xmm5
+ .byte 15,88,128,64,56,0,0 // addps 0x3840(%eax),%xmm0
+ .byte 15,40,168,80,56,0,0 // movaps 0x3850(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,128,23,0,0 // movaps 0x1780(%eax),%xmm4
+ .byte 15,40,160,96,56,0,0 // movaps 0x3860(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,144,23,0,0 // addps 0x1790(%eax),%xmm4
+ .byte 15,88,160,112,56,0,0 // addps 0x3870(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,160,23,0,0 // addps 0x17a0(%eax),%xmm4
+ .byte 15,88,160,128,56,0,0 // addps 0x3880(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,176,23,0,0 // addps 0x17b0(%eax),%xmm4
+ .byte 15,88,160,144,56,0,0 // addps 0x3890(%eax),%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -60291,17 +69994,17 @@ _sk_bicubic_p1x_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,88,23,0,0 // movaps 0x1758(%eax),%xmm4
+ .byte 15,40,160,56,56,0,0 // movaps 0x3838(%eax),%xmm4
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,176,104,23,0,0 // movaps 0x1768(%eax),%xmm6
+ .byte 15,40,176,72,56,0,0 // movaps 0x3848(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,120,23,0,0 // addps 0x1778(%eax),%xmm6
+ .byte 15,88,176,88,56,0,0 // addps 0x3858(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,136,23,0,0 // addps 0x1788(%eax),%xmm6
+ .byte 15,88,176,104,56,0,0 // addps 0x3868(%eax),%xmm6
.byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -60328,11 +70031,11 @@ _sk_bicubic_p3x_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,59,23,0,0 // addps 0x173b(%eax),%xmm0
+ .byte 15,88,128,27,56,0,0 // addps 0x381b(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,75,23,0,0 // mulps 0x174b(%eax),%xmm4
- .byte 15,88,160,91,23,0,0 // addps 0x175b(%eax),%xmm4
+ .byte 15,89,160,43,56,0,0 // mulps 0x382b(%eax),%xmm4
+ .byte 15,88,160,59,56,0,0 // addps 0x383b(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -60360,13 +70063,13 @@ _sk_bicubic_n3y_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,27,23,0,0 // addps 0x171b(%eax),%xmm1
- .byte 15,40,168,43,23,0,0 // movaps 0x172b(%eax),%xmm5
+ .byte 15,88,136,251,55,0,0 // addps 0x37fb(%eax),%xmm1
+ .byte 15,40,168,11,56,0,0 // movaps 0x380b(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,59,23,0,0 // mulps 0x173b(%eax),%xmm5
- .byte 15,88,168,75,23,0,0 // addps 0x174b(%eax),%xmm5
+ .byte 15,89,168,27,56,0,0 // mulps 0x381b(%eax),%xmm5
+ .byte 15,88,168,43,56,0,0 // addps 0x382b(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -60394,16 +70097,16 @@ _sk_bicubic_n1y_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,0,23,0,0 // addps 0x1700(%eax),%xmm1
- .byte 15,40,168,16,23,0,0 // movaps 0x1710(%eax),%xmm5
+ .byte 15,88,136,224,55,0,0 // addps 0x37e0(%eax),%xmm1
+ .byte 15,40,168,240,55,0,0 // movaps 0x37f0(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,32,23,0,0 // movaps 0x1720(%eax),%xmm4
+ .byte 15,40,160,0,56,0,0 // movaps 0x3800(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,48,23,0,0 // addps 0x1730(%eax),%xmm4
+ .byte 15,88,160,16,56,0,0 // addps 0x3810(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,64,23,0,0 // addps 0x1740(%eax),%xmm4
+ .byte 15,88,160,32,56,0,0 // addps 0x3820(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,80,23,0,0 // addps 0x1750(%eax),%xmm4
+ .byte 15,88,160,48,56,0,0 // addps 0x3830(%eax),%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -60428,17 +70131,17 @@ _sk_bicubic_p1y_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,247,22,0,0 // movaps 0x16f7(%eax),%xmm4
+ .byte 15,40,160,215,55,0,0 // movaps 0x37d7(%eax),%xmm4
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,176,7,23,0,0 // movaps 0x1707(%eax),%xmm6
+ .byte 15,40,176,231,55,0,0 // movaps 0x37e7(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,23,23,0,0 // addps 0x1717(%eax),%xmm6
+ .byte 15,88,176,247,55,0,0 // addps 0x37f7(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,39,23,0,0 // addps 0x1727(%eax),%xmm6
+ .byte 15,88,176,7,56,0,0 // addps 0x3807(%eax),%xmm6
.byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -60465,11 +70168,11 @@ _sk_bicubic_p3y_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,217,22,0,0 // addps 0x16d9(%eax),%xmm1
+ .byte 15,88,136,185,55,0,0 // addps 0x37b9(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,233,22,0,0 // mulps 0x16e9(%eax),%xmm4
- .byte 15,88,160,249,22,0,0 // addps 0x16f9(%eax),%xmm4
+ .byte 15,89,160,201,55,0,0 // mulps 0x37c9(%eax),%xmm4
+ .byte 15,88,160,217,55,0,0 // addps 0x37d9(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -60549,6 +70252,1935 @@ _sk_callback_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
+HIDDEN _sk_clut_3D_sse2
+.globl _sk_clut_3D_sse2
+FUNCTION(_sk_clut_3D_sse2)
+_sk_clut_3D_sse2:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 83 // push %ebx
+ .byte 87 // push %edi
+ .byte 86 // push %esi
+ .byte 129,236,44,1,0,0 // sub $0x12c,%esp
+ .byte 15,41,157,200,254,255,255 // movaps %xmm3,-0x138(%ebp)
+ .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 137,141,4,255,255,255 // mov %ecx,-0xfc(%ebp)
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,81,12 // mov 0xc(%ecx),%edx
+ .byte 141,114,255 // lea -0x1(%edx),%esi
+ .byte 102,15,110,198 // movd %esi,%xmm0
+ .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
+ .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 102,15,110,194 // movd %edx,%xmm0
+ .byte 102,15,112,240,0 // pshufd $0x0,%xmm0,%xmm6
+ .byte 102,15,127,117,136 // movdqa %xmm6,-0x78(%ebp)
+ .byte 139,81,8 // mov 0x8(%ecx),%edx
+ .byte 141,114,255 // lea -0x1(%edx),%esi
+ .byte 102,15,110,214 // movd %esi,%xmm2
+ .byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
+ .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,41,149,56,255,255,255 // movaps %xmm2,-0xc8(%ebp)
+ .byte 243,15,91,234 // cvttps2dq %xmm2,%xmm5
+ .byte 102,15,127,173,8,255,255,255 // movdqa %xmm5,-0xf8(%ebp)
+ .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 102,15,244,206 // pmuludq %xmm6,%xmm1
+ .byte 102,15,112,209,232 // pshufd $0xe8,%xmm1,%xmm2
+ .byte 102,15,112,205,245 // pshufd $0xf5,%xmm5,%xmm1
+ .byte 102,15,244,206 // pmuludq %xmm6,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,209 // punpckldq %xmm1,%xmm2
+ .byte 102,15,127,149,24,255,255,255 // movdqa %xmm2,-0xe8(%ebp)
+ .byte 102,15,110,202 // movd %edx,%xmm1
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 139,81,4 // mov 0x4(%ecx),%edx
+ .byte 74 // dec %edx
+ .byte 102,15,110,194 // movd %edx,%xmm0
+ .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
+ .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
+ .byte 102,15,112,217,0 // pshufd $0x0,%xmm1,%xmm3
+ .byte 243,15,91,192 // cvttps2dq %xmm0,%xmm0
+ .byte 102,15,127,69,152 // movdqa %xmm0,-0x68(%ebp)
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,244,203 // pmuludq %xmm3,%xmm1
+ .byte 102,15,112,233,232 // pshufd $0xe8,%xmm1,%xmm5
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,112,195,245 // pshufd $0xf5,%xmm3,%xmm0
+ .byte 102,15,127,133,120,255,255,255 // movdqa %xmm0,-0x88(%ebp)
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,233 // punpckldq %xmm1,%xmm5
+ .byte 102,15,127,173,104,255,255,255 // movdqa %xmm5,-0x98(%ebp)
+ .byte 232,0,0,0,0 // call 71bb <_sk_clut_3D_sse2+0xff>
+ .byte 90 // pop %edx
+ .byte 243,15,91,196 // cvttps2dq %xmm4,%xmm0
+ .byte 102,15,127,133,232,254,255,255 // movdqa %xmm0,-0x118(%ebp)
+ .byte 15,40,244 // movaps %xmm4,%xmm6
+ .byte 15,41,181,216,254,255,255 // movaps %xmm6,-0x128(%ebp)
+ .byte 102,15,254,208 // paddd %xmm0,%xmm2
+ .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 102,15,254,202 // paddd %xmm2,%xmm1
+ .byte 102,15,111,130,5,54,0,0 // movdqa 0x3605(%edx),%xmm0
+ .byte 102,15,127,133,88,255,255,255 // movdqa %xmm0,-0xa8(%ebp)
+ .byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,244,224 // pmuludq %xmm0,%xmm4
+ .byte 102,15,112,228,232 // pshufd $0xe8,%xmm4,%xmm4
+ .byte 102,15,98,204 // punpckldq %xmm4,%xmm1
+ .byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 102,15,112,225,231 // pshufd $0xe7,%xmm1,%xmm4
+ .byte 102,15,126,227 // movd %xmm4,%ebx
+ .byte 139,9 // mov (%ecx),%ecx
+ .byte 243,15,16,36,153 // movss (%ecx,%ebx,4),%xmm4
+ .byte 243,15,16,60,177 // movss (%ecx,%esi,4),%xmm7
+ .byte 15,20,252 // unpcklps %xmm4,%xmm7
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
+ .byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
+ .byte 15,20,196 // unpcklps %xmm4,%xmm0
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
+ .byte 102,15,111,130,21,54,0,0 // movdqa 0x3615(%edx),%xmm0
+ .byte 102,15,127,133,72,255,255,255 // movdqa %xmm0,-0xb8(%ebp)
+ .byte 102,15,111,225 // movdqa %xmm1,%xmm4
+ .byte 102,15,254,224 // paddd %xmm0,%xmm4
+ .byte 102,15,112,252,229 // pshufd $0xe5,%xmm4,%xmm7
+ .byte 102,15,126,254 // movd %xmm7,%esi
+ .byte 102,15,112,252,78 // pshufd $0x4e,%xmm4,%xmm7
+ .byte 102,15,126,255 // movd %xmm7,%edi
+ .byte 102,15,126,227 // movd %xmm4,%ebx
+ .byte 102,15,112,228,231 // pshufd $0xe7,%xmm4,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 243,15,16,36,129 // movss (%ecx,%eax,4),%xmm4
+ .byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
+ .byte 15,20,196 // unpcklps %xmm4,%xmm0
+ .byte 243,15,16,60,153 // movss (%ecx,%ebx,4),%xmm7
+ .byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
+ .byte 15,20,252 // unpcklps %xmm4,%xmm7
+ .byte 15,20,248 // unpcklps %xmm0,%xmm7
+ .byte 102,15,111,130,37,54,0,0 // movdqa 0x3625(%edx),%xmm0
+ .byte 102,15,127,69,216 // movdqa %xmm0,-0x28(%ebp)
+ .byte 102,15,254,200 // paddd %xmm0,%xmm1
+ .byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,193,78 // pshufd $0x4e,%xmm1,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 102,15,112,193,231 // pshufd $0xe7,%xmm1,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,153 // movss (%ecx,%ebx,4),%xmm0
+ .byte 243,15,16,36,129 // movss (%ecx,%eax,4),%xmm4
+ .byte 15,20,224 // unpcklps %xmm0,%xmm4
+ .byte 243,15,16,44,185 // movss (%ecx,%edi,4),%xmm5
+ .byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
+ .byte 15,20,232 // unpcklps %xmm0,%xmm5
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 15,40,130,245,53,0,0 // movaps 0x35f5(%edx),%xmm0
+ .byte 15,88,240 // addps %xmm0,%xmm6
+ .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
+ .byte 15,40,141,56,255,255,255 // movaps -0xc8(%ebp),%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,41,141,40,255,255,255 // movaps %xmm1,-0xd8(%ebp)
+ .byte 15,88,69,200 // addps -0x38(%ebp),%xmm0
+ .byte 243,15,91,192 // cvttps2dq %xmm0,%xmm0
+ .byte 102,15,244,216 // pmuludq %xmm0,%xmm3
+ .byte 102,15,112,192,245 // pshufd $0xf5,%xmm0,%xmm0
+ .byte 102,15,244,133,120,255,255,255 // pmuludq -0x88(%ebp),%xmm0
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,98,216 // punpckldq %xmm0,%xmm3
+ .byte 102,15,127,157,120,255,255,255 // movdqa %xmm3,-0x88(%ebp)
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
+ .byte 102,15,111,141,88,255,255,255 // movdqa -0xa8(%ebp),%xmm1
+ .byte 102,15,244,209 // pmuludq %xmm1,%xmm2
+ .byte 102,15,112,194,232 // pshufd $0xe8,%xmm2,%xmm0
+ .byte 102,15,244,217 // pmuludq %xmm1,%xmm3
+ .byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
+ .byte 102,15,98,194 // punpckldq %xmm2,%xmm0
+ .byte 102,15,112,208,229 // pshufd $0xe5,%xmm0,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,208,78 // pshufd $0x4e,%xmm0,%xmm2
+ .byte 102,15,126,210 // movd %xmm2,%edx
+ .byte 102,15,112,208,231 // pshufd $0xe7,%xmm0,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 243,15,16,20,177 // movss (%ecx,%esi,4),%xmm2
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,242 // unpcklps %xmm2,%xmm6
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,12,129 // movss (%ecx,%eax,4),%xmm1
+ .byte 243,15,16,20,145 // movss (%ecx,%edx,4),%xmm2
+ .byte 15,20,202 // unpcklps %xmm2,%xmm1
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 102,15,111,208 // movdqa %xmm0,%xmm2
+ .byte 102,15,254,149,72,255,255,255 // paddd -0xb8(%ebp),%xmm2
+ .byte 102,15,112,242,229 // pshufd $0xe5,%xmm2,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
+ .byte 102,15,126,242 // movd %xmm6,%edx
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 243,15,16,20,185 // movss (%ecx,%edi,4),%xmm2
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,242 // unpcklps %xmm2,%xmm6
+ .byte 243,15,16,20,177 // movss (%ecx,%esi,4),%xmm2
+ .byte 243,15,16,36,145 // movss (%ecx,%edx,4),%xmm4
+ .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 102,15,254,69,216 // paddd -0x28(%ebp),%xmm0
+ .byte 102,15,112,224,229 // pshufd $0xe5,%xmm0,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
+ .byte 102,15,126,226 // movd %xmm4,%edx
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,185 // movss (%ecx,%edi,4),%xmm0
+ .byte 243,15,16,36,129 // movss (%ecx,%eax,4),%xmm4
+ .byte 15,20,224 // unpcklps %xmm0,%xmm4
+ .byte 243,15,16,28,177 // movss (%ecx,%esi,4),%xmm3
+ .byte 243,15,16,52,145 // movss (%ecx,%edx,4),%xmm6
+ .byte 15,20,222 // unpcklps %xmm6,%xmm3
+ .byte 15,20,220 // unpcklps %xmm4,%xmm3
+ .byte 15,91,101,152 // cvtdq2ps -0x68(%ebp),%xmm4
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
+ .byte 15,40,101,168 // movaps -0x58(%ebp),%xmm4
+ .byte 15,92,204 // subps %xmm4,%xmm1
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,41,77,152 // movaps %xmm1,-0x68(%ebp)
+ .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,88,215 // addps %xmm7,%xmm2
+ .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 243,15,91,141,40,255,255,255 // cvttps2dq -0xd8(%ebp),%xmm1
+ .byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4
+ .byte 102,15,111,69,136 // movdqa -0x78(%ebp),%xmm0
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,244,224 // pmuludq %xmm0,%xmm4
+ .byte 102,15,112,193,232 // pshufd $0xe8,%xmm1,%xmm0
+ .byte 102,15,112,204,232 // pshufd $0xe8,%xmm4,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,127,69,136 // movdqa %xmm0,-0x78(%ebp)
+ .byte 102,15,111,248 // movdqa %xmm0,%xmm7
+ .byte 102,15,254,189,232,254,255,255 // paddd -0x118(%ebp),%xmm7
+ .byte 102,15,111,207 // movdqa %xmm7,%xmm1
+ .byte 102,15,254,141,104,255,255,255 // paddd -0x98(%ebp),%xmm1
+ .byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4
+ .byte 102,15,111,133,88,255,255,255 // movdqa -0xa8(%ebp),%xmm0
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,233,232 // pshufd $0xe8,%xmm1,%xmm5
+ .byte 102,15,244,224 // pmuludq %xmm0,%xmm4
+ .byte 102,15,112,204,232 // pshufd $0xe8,%xmm4,%xmm1
+ .byte 102,15,98,233 // punpckldq %xmm1,%xmm5
+ .byte 102,15,112,205,229 // pshufd $0xe5,%xmm5,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,205,78 // pshufd $0x4e,%xmm5,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,112,205,231 // pshufd $0xe7,%xmm5,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 243,15,16,12,177 // movss (%ecx,%esi,4),%xmm1
+ .byte 243,15,16,36,129 // movss (%ecx,%eax,4),%xmm4
+ .byte 15,20,225 // unpcklps %xmm1,%xmm4
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 243,15,16,12,129 // movss (%ecx,%eax,4),%xmm1
+ .byte 243,15,16,52,145 // movss (%ecx,%edx,4),%xmm6
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 15,41,141,40,255,255,255 // movaps %xmm1,-0xd8(%ebp)
+ .byte 102,15,111,229 // movdqa %xmm5,%xmm4
+ .byte 102,15,111,149,72,255,255,255 // movdqa -0xb8(%ebp),%xmm2
+ .byte 102,15,254,226 // paddd %xmm2,%xmm4
+ .byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
+ .byte 102,15,126,242 // movd %xmm6,%edx
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 102,15,112,228,231 // pshufd $0xe7,%xmm4,%xmm4
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 243,15,16,36,177 // movss (%ecx,%esi,4),%xmm4
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 15,20,225 // unpcklps %xmm1,%xmm4
+ .byte 15,20,230 // unpcklps %xmm6,%xmm4
+ .byte 102,15,254,109,216 // paddd -0x28(%ebp),%xmm5
+ .byte 102,15,112,205,229 // pshufd $0xe5,%xmm5,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,205,78 // pshufd $0x4e,%xmm5,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,112,205,231 // pshufd $0xe7,%xmm5,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,185 // movss (%ecx,%edi,4),%xmm1
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 243,15,16,44,177 // movss (%ecx,%esi,4),%xmm5
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 15,20,233 // unpcklps %xmm1,%xmm5
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 102,15,254,189,120,255,255,255 // paddd -0x88(%ebp),%xmm7
+ .byte 102,15,112,207,245 // pshufd $0xf5,%xmm7,%xmm1
+ .byte 102,15,244,248 // pmuludq %xmm0,%xmm7
+ .byte 102,15,112,255,232 // pshufd $0xe8,%xmm7,%xmm7
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,249 // punpckldq %xmm1,%xmm7
+ .byte 102,15,112,207,229 // pshufd $0xe5,%xmm7,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,207,78 // pshufd $0x4e,%xmm7,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,112,207,231 // pshufd $0xe7,%xmm7,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 243,15,16,12,177 // movss (%ecx,%esi,4),%xmm1
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 243,15,16,4,129 // movss (%ecx,%eax,4),%xmm0
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 15,20,198 // unpcklps %xmm6,%xmm0
+ .byte 102,15,111,207 // movdqa %xmm7,%xmm1
+ .byte 102,15,254,202 // paddd %xmm2,%xmm1
+ .byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
+ .byte 102,15,126,242 // movd %xmm6,%edx
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,185 // movss (%ecx,%edi,4),%xmm1
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 243,15,16,20,177 // movss (%ecx,%esi,4),%xmm2
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 102,15,254,125,216 // paddd -0x28(%ebp),%xmm7
+ .byte 102,15,112,207,229 // pshufd $0xe5,%xmm7,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,207,78 // pshufd $0x4e,%xmm7,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,126,254 // movd %xmm7,%esi
+ .byte 102,15,112,207,231 // pshufd $0xe7,%xmm7,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,185 // movss (%ecx,%edi,4),%xmm1
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 243,15,16,60,177 // movss (%ecx,%esi,4),%xmm7
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 15,20,254 // unpcklps %xmm6,%xmm7
+ .byte 15,40,181,40,255,255,255 // movaps -0xd8(%ebp),%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 15,92,253 // subps %xmm5,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 15,88,253 // addps %xmm5,%xmm7
+ .byte 15,91,141,8,255,255,255 // cvtdq2ps -0xf8(%ebp),%xmm1
+ .byte 15,40,165,56,255,255,255 // movaps -0xc8(%ebp),%xmm4
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,41,165,56,255,255,255 // movaps %xmm4,-0xc8(%ebp)
+ .byte 15,40,77,152 // movaps -0x68(%ebp),%xmm1
+ .byte 15,92,193 // subps %xmm1,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
+ .byte 15,40,69,168 // movaps -0x58(%ebp),%xmm0
+ .byte 15,92,208 // subps %xmm0,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 15,41,189,8,255,255,255 // movaps %xmm7,-0xf8(%ebp)
+ .byte 243,15,91,77,184 // cvttps2dq -0x48(%ebp),%xmm1
+ .byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp)
+ .byte 102,15,111,133,24,255,255,255 // movdqa -0xe8(%ebp),%xmm0
+ .byte 102,15,254,193 // paddd %xmm1,%xmm0
+ .byte 102,15,111,141,104,255,255,255 // movdqa -0x98(%ebp),%xmm1
+ .byte 102,15,254,200 // paddd %xmm0,%xmm1
+ .byte 102,15,111,240 // movdqa %xmm0,%xmm6
+ .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
+ .byte 102,15,111,133,88,255,255,255 // movdqa -0xa8(%ebp),%xmm0
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
+ .byte 102,15,244,208 // pmuludq %xmm0,%xmm2
+ .byte 102,15,112,202,232 // pshufd $0xe8,%xmm2,%xmm1
+ .byte 102,15,98,217 // punpckldq %xmm1,%xmm3
+ .byte 102,15,112,203,229 // pshufd $0xe5,%xmm3,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,203,78 // pshufd $0x4e,%xmm3,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,112,203,231 // pshufd $0xe7,%xmm3,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 243,15,16,12,177 // movss (%ecx,%esi,4),%xmm1
+ .byte 243,15,16,20,129 // movss (%ecx,%eax,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,60,129 // movss (%ecx,%eax,4),%xmm7
+ .byte 243,15,16,36,145 // movss (%ecx,%edx,4),%xmm4
+ .byte 15,20,252 // unpcklps %xmm4,%xmm7
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 102,15,111,211 // movdqa %xmm3,%xmm2
+ .byte 102,15,111,133,72,255,255,255 // movdqa -0xb8(%ebp),%xmm0
+ .byte 102,15,254,208 // paddd %xmm0,%xmm2
+ .byte 102,15,112,226,229 // pshufd $0xe5,%xmm2,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
+ .byte 102,15,126,226 // movd %xmm4,%edx
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 243,15,16,20,185 // movss (%ecx,%edi,4),%xmm2
+ .byte 243,15,16,36,129 // movss (%ecx,%eax,4),%xmm4
+ .byte 15,20,226 // unpcklps %xmm2,%xmm4
+ .byte 243,15,16,20,177 // movss (%ecx,%esi,4),%xmm2
+ .byte 243,15,16,44,145 // movss (%ecx,%edx,4),%xmm5
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
+ .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 102,15,254,93,216 // paddd -0x28(%ebp),%xmm3
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,15,126,226 // movd %xmm4,%edx
+ .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,112,219,231 // pshufd $0xe7,%xmm3,%xmm3
+ .byte 102,15,126,223 // movd %xmm3,%edi
+ .byte 243,15,16,28,185 // movss (%ecx,%edi,4),%xmm3
+ .byte 243,15,16,36,129 // movss (%ecx,%eax,4),%xmm4
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 243,15,16,44,177 // movss (%ecx,%esi,4),%xmm5
+ .byte 243,15,16,28,145 // movss (%ecx,%edx,4),%xmm3
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 102,15,111,222 // movdqa %xmm6,%xmm3
+ .byte 102,15,254,157,120,255,255,255 // paddd -0x88(%ebp),%xmm3
+ .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
+ .byte 102,15,111,141,88,255,255,255 // movdqa -0xa8(%ebp),%xmm1
+ .byte 102,15,244,217 // pmuludq %xmm1,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,244,225 // pmuludq %xmm1,%xmm4
+ .byte 102,15,112,228,232 // pshufd $0xe8,%xmm4,%xmm4
+ .byte 102,15,98,220 // punpckldq %xmm4,%xmm3
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,15,126,226 // movd %xmm4,%edx
+ .byte 102,15,112,227,231 // pshufd $0xe7,%xmm3,%xmm4
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 243,15,16,36,177 // movss (%ecx,%esi,4),%xmm4
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,12,129 // movss (%ecx,%eax,4),%xmm1
+ .byte 243,15,16,36,145 // movss (%ecx,%edx,4),%xmm4
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 102,15,111,227 // movdqa %xmm3,%xmm4
+ .byte 102,15,254,224 // paddd %xmm0,%xmm4
+ .byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
+ .byte 102,15,126,242 // movd %xmm6,%edx
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 102,15,112,228,231 // pshufd $0xe7,%xmm4,%xmm4
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
+ .byte 243,15,16,4,129 // movss (%ecx,%eax,4),%xmm0
+ .byte 15,20,196 // unpcklps %xmm4,%xmm0
+ .byte 243,15,16,52,177 // movss (%ecx,%esi,4),%xmm6
+ .byte 243,15,16,36,145 // movss (%ecx,%edx,4),%xmm4
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 102,15,254,93,216 // paddd -0x28(%ebp),%xmm3
+ .byte 102,15,112,195,229 // pshufd $0xe5,%xmm3,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
+ .byte 102,15,126,194 // movd %xmm0,%edx
+ .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,112,195,231 // pshufd $0xe7,%xmm3,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,185 // movss (%ecx,%edi,4),%xmm0
+ .byte 243,15,16,28,129 // movss (%ecx,%eax,4),%xmm3
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 243,15,16,36,177 // movss (%ecx,%esi,4),%xmm4
+ .byte 243,15,16,4,145 // movss (%ecx,%edx,4),%xmm0
+ .byte 15,20,224 // unpcklps %xmm0,%xmm4
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 15,92,207 // subps %xmm7,%xmm1
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,41,141,24,255,255,255 // movaps %xmm1,-0xe8(%ebp)
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 102,15,111,77,136 // movdqa -0x78(%ebp),%xmm1
+ .byte 102,15,254,77,184 // paddd -0x48(%ebp),%xmm1
+ .byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
+ .byte 102,15,111,133,104,255,255,255 // movdqa -0x98(%ebp),%xmm0
+ .byte 102,15,254,193 // paddd %xmm1,%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,189,88,255,255,255 // movdqa -0xa8(%ebp),%xmm7
+ .byte 102,15,244,199 // pmuludq %xmm7,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,244,207 // pmuludq %xmm7,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 243,15,16,12,177 // movss (%ecx,%esi,4),%xmm1
+ .byte 243,15,16,20,129 // movss (%ecx,%eax,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,28,129 // movss (%ecx,%eax,4),%xmm3
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 15,41,157,104,255,255,255 // movaps %xmm3,-0x98(%ebp)
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,111,173,72,255,255,255 // movdqa -0xb8(%ebp),%xmm5
+ .byte 102,15,254,205 // paddd %xmm5,%xmm1
+ .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,15,126,210 // movd %xmm2,%edx
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,185 // movss (%ecx,%edi,4),%xmm1
+ .byte 243,15,16,20,129 // movss (%ecx,%eax,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 243,15,16,28,177 // movss (%ecx,%esi,4),%xmm3
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
+ .byte 102,15,254,69,216 // paddd -0x28(%ebp),%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,185 // movss (%ecx,%edi,4),%xmm0
+ .byte 243,15,16,12,129 // movss (%ecx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 243,15,16,28,177 // movss (%ecx,%esi,4),%xmm3
+ .byte 243,15,16,4,145 // movss (%ecx,%edx,4),%xmm0
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 102,15,111,77,136 // movdqa -0x78(%ebp),%xmm1
+ .byte 102,15,254,141,120,255,255,255 // paddd -0x88(%ebp),%xmm1
+ .byte 102,15,112,193,245 // pshufd $0xf5,%xmm1,%xmm0
+ .byte 102,15,244,207 // pmuludq %xmm7,%xmm1
+ .byte 102,15,244,199 // pmuludq %xmm7,%xmm0
+ .byte 102,15,112,209,232 // pshufd $0xe8,%xmm1,%xmm2
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,15,126,194 // movd %xmm0,%edx
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
+ .byte 243,15,16,12,129 // movss (%ecx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,4,129 // movss (%ecx,%eax,4),%xmm0
+ .byte 243,15,16,60,145 // movss (%ecx,%edx,4),%xmm7
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 102,15,254,234 // paddd %xmm2,%xmm5
+ .byte 102,15,112,205,229 // pshufd $0xe5,%xmm5,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,205,78 // pshufd $0x4e,%xmm5,%xmm1
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,112,205,231 // pshufd $0xe7,%xmm5,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,185 // movss (%ecx,%edi,4),%xmm1
+ .byte 243,15,16,60,129 // movss (%ecx,%eax,4),%xmm7
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 243,15,16,12,177 // movss (%ecx,%esi,4),%xmm1
+ .byte 243,15,16,44,145 // movss (%ecx,%edx,4),%xmm5
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 102,15,254,85,216 // paddd -0x28(%ebp),%xmm2
+ .byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
+ .byte 102,15,126,234 // movd %xmm5,%edx
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 243,15,16,20,185 // movss (%ecx,%edi,4),%xmm2
+ .byte 243,15,16,44,129 // movss (%ecx,%eax,4),%xmm5
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
+ .byte 243,15,16,20,177 // movss (%ecx,%esi,4),%xmm2
+ .byte 243,15,16,60,145 // movss (%ecx,%edx,4),%xmm7
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
+ .byte 15,40,189,104,255,255,255 // movaps -0x98(%ebp),%xmm7
+ .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,40,109,200 // movaps -0x38(%ebp),%xmm5
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,88,199 // addps %xmm7,%xmm0
+ .byte 15,40,125,184 // movaps -0x48(%ebp),%xmm7
+ .byte 15,92,207 // subps %xmm7,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 15,40,173,24,255,255,255 // movaps -0xe8(%ebp),%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,40,157,56,255,255,255 // movaps -0xc8(%ebp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 15,91,157,232,254,255,255 // cvtdq2ps -0x118(%ebp),%xmm3
+ .byte 15,40,165,216,254,255,255 // movaps -0x128(%ebp),%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,40,93,152 // movaps -0x68(%ebp),%xmm3
+ .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,195 // addps %xmm3,%xmm0
+ .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,40,157,8,255,255,255 // movaps -0xf8(%ebp),%xmm3
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 141,74,8 // lea 0x8(%edx),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,157,200,254,255,255 // movaps -0x138(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 80 // push %eax
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 129,196,60,1,0,0 // add $0x13c,%esp
+ .byte 94 // pop %esi
+ .byte 95 // pop %edi
+ .byte 91 // pop %ebx
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+
+HIDDEN _sk_clut_4D_sse2
+.globl _sk_clut_4D_sse2
+FUNCTION(_sk_clut_4D_sse2)
+_sk_clut_4D_sse2:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 83 // push %ebx
+ .byte 87 // push %edi
+ .byte 86 // push %esi
+ .byte 129,236,124,1,0,0 // sub $0x17c,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 137,141,212,254,255,255 // mov %ecx,-0x12c(%ebp)
+ .byte 139,16 // mov (%eax),%edx
+ .byte 139,74,16 // mov 0x10(%edx),%ecx
+ .byte 141,113,255 // lea -0x1(%ecx),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
+ .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 102,15,110,217 // movd %ecx,%xmm3
+ .byte 102,15,112,251,0 // pshufd $0x0,%xmm3,%xmm7
+ .byte 102,15,127,189,248,254,255,255 // movdqa %xmm7,-0x108(%ebp)
+ .byte 139,74,12 // mov 0xc(%edx),%ecx
+ .byte 141,113,255 // lea -0x1(%ecx),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
+ .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 15,41,165,232,254,255,255 // movaps %xmm4,-0x118(%ebp)
+ .byte 243,15,91,244 // cvttps2dq %xmm4,%xmm6
+ .byte 102,15,127,181,216,254,255,255 // movdqa %xmm6,-0x128(%ebp)
+ .byte 102,15,111,214 // movdqa %xmm6,%xmm2
+ .byte 102,15,244,215 // pmuludq %xmm7,%xmm2
+ .byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4
+ .byte 102,15,112,214,245 // pshufd $0xf5,%xmm6,%xmm2
+ .byte 102,15,244,215 // pmuludq %xmm7,%xmm2
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,98,226 // punpckldq %xmm2,%xmm4
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,127,181,56,255,255,255 // movdqa %xmm6,-0xc8(%ebp)
+ .byte 102,15,110,209 // movd %ecx,%xmm2
+ .byte 102,15,244,211 // pmuludq %xmm3,%xmm2
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,244,216 // pmuludq %xmm0,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,98,211 // punpckldq %xmm3,%xmm2
+ .byte 139,74,8 // mov 0x8(%edx),%ecx
+ .byte 141,113,255 // lea -0x1(%ecx),%esi
+ .byte 102,15,110,222 // movd %esi,%xmm3
+ .byte 102,15,112,219,0 // pshufd $0x0,%xmm3,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,41,157,40,255,255,255 // movaps %xmm3,-0xd8(%ebp)
+ .byte 102,15,112,250,0 // pshufd $0x0,%xmm2,%xmm7
+ .byte 102,15,127,189,104,255,255,255 // movdqa %xmm7,-0x98(%ebp)
+ .byte 243,15,91,227 // cvttps2dq %xmm3,%xmm4
+ .byte 102,15,127,165,8,255,255,255 // movdqa %xmm4,-0xf8(%ebp)
+ .byte 102,15,111,204 // movdqa %xmm4,%xmm1
+ .byte 102,15,244,207 // pmuludq %xmm7,%xmm1
+ .byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
+ .byte 102,15,112,204,245 // pshufd $0xf5,%xmm4,%xmm1
+ .byte 102,15,112,231,245 // pshufd $0xf5,%xmm7,%xmm4
+ .byte 102,15,127,165,88,255,255,255 // movdqa %xmm4,-0xa8(%ebp)
+ .byte 102,15,244,204 // pmuludq %xmm4,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,217 // punpckldq %xmm1,%xmm3
+ .byte 102,15,127,157,72,255,255,255 // movdqa %xmm3,-0xb8(%ebp)
+ .byte 102,15,110,201 // movd %ecx,%xmm1
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 139,74,4 // mov 0x4(%edx),%ecx
+ .byte 73 // dec %ecx
+ .byte 102,15,110,209 // movd %ecx,%xmm2
+ .byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
+ .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
+ .byte 102,15,112,193,0 // pshufd $0x0,%xmm1,%xmm0
+ .byte 243,15,91,226 // cvttps2dq %xmm2,%xmm4
+ .byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp)
+ .byte 102,15,111,204 // movdqa %xmm4,%xmm1
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,209,232 // pshufd $0xe8,%xmm1,%xmm2
+ .byte 102,15,112,204,245 // pshufd $0xf5,%xmm4,%xmm1
+ .byte 102,15,112,224,245 // pshufd $0xf5,%xmm0,%xmm4
+ .byte 102,15,127,101,184 // movdqa %xmm4,-0x48(%ebp)
+ .byte 102,15,244,204 // pmuludq %xmm4,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,209 // punpckldq %xmm1,%xmm2
+ .byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
+ .byte 232,0,0,0,0 // call 7d31 <_sk_clut_4D_sse2+0x179>
+ .byte 89 // pop %ecx
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,41,165,120,254,255,255 // movaps %xmm4,-0x188(%ebp)
+ .byte 243,15,91,204 // cvttps2dq %xmm4,%xmm1
+ .byte 102,15,127,141,184,254,255,255 // movdqa %xmm1,-0x148(%ebp)
+ .byte 102,15,111,238 // movdqa %xmm6,%xmm5
+ .byte 102,15,254,233 // paddd %xmm1,%xmm5
+ .byte 102,15,127,173,24,255,255,255 // movdqa %xmm5,-0xe8(%ebp)
+ .byte 102,15,111,243 // movdqa %xmm3,%xmm6
+ .byte 102,15,254,245 // paddd %xmm5,%xmm6
+ .byte 102,15,111,202 // movdqa %xmm2,%xmm1
+ .byte 102,15,254,206 // paddd %xmm6,%xmm1
+ .byte 102,15,111,153,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm3
+ .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
+ .byte 102,15,244,203 // pmuludq %xmm3,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,244,211 // pmuludq %xmm3,%xmm2
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,98,202 // punpckldq %xmm2,%xmm1
+ .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 102,15,112,209,231 // pshufd $0xe7,%xmm1,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 139,18 // mov (%edx),%edx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 243,15,16,28,178 // movss (%edx,%esi,4),%xmm3
+ .byte 243,15,16,20,186 // movss (%edx,%edi,4),%xmm2
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 15,20,221 // unpcklps %xmm5,%xmm3
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 102,15,111,153,223,42,0,0 // movdqa 0x2adf(%ecx),%xmm3
+ .byte 102,15,111,209 // movdqa %xmm1,%xmm2
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
+ .byte 102,15,126,239 // movd %xmm5,%edi
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,60,186 // movss (%edx,%edi,4),%xmm7
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
+ .byte 15,41,149,136,254,255,255 // movaps %xmm2,-0x178(%ebp)
+ .byte 102,15,254,137,239,42,0,0 // paddd 0x2aef(%ecx),%xmm1
+ .byte 102,15,112,233,229 // pshufd $0xe5,%xmm1,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,12,154 // movss (%edx,%ebx,4),%xmm1
+ .byte 243,15,16,44,130 // movss (%edx,%eax,4),%xmm5
+ .byte 15,20,233 // unpcklps %xmm1,%xmm5
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 15,41,141,152,254,255,255 // movaps %xmm1,-0x168(%ebp)
+ .byte 15,40,185,191,42,0,0 // movaps 0x2abf(%ecx),%xmm7
+ .byte 15,88,231 // addps %xmm7,%xmm4
+ .byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
+ .byte 15,40,141,232,254,255,255 // movaps -0x118(%ebp),%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,41,77,136 // movaps %xmm1,-0x78(%ebp)
+ .byte 15,40,141,40,255,255,255 // movaps -0xd8(%ebp),%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,41,141,168,254,255,255 // movaps %xmm1,-0x158(%ebp)
+ .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4
+ .byte 15,88,252 // addps %xmm4,%xmm7
+ .byte 243,15,91,255 // cvttps2dq %xmm7,%xmm7
+ .byte 102,15,244,199 // pmuludq %xmm7,%xmm0
+ .byte 102,15,112,255,245 // pshufd $0xf5,%xmm7,%xmm7
+ .byte 102,15,244,125,184 // pmuludq -0x48(%ebp),%xmm7
+ .byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
+ .byte 102,15,112,199,232 // pshufd $0xe8,%xmm7,%xmm0
+ .byte 102,15,98,200 // punpckldq %xmm0,%xmm1
+ .byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp)
+ .byte 102,15,254,241 // paddd %xmm1,%xmm6
+ .byte 102,15,112,254,245 // pshufd $0xf5,%xmm6,%xmm7
+ .byte 102,15,111,137,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm1
+ .byte 102,15,244,241 // pmuludq %xmm1,%xmm6
+ .byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
+ .byte 102,15,244,249 // pmuludq %xmm1,%xmm7
+ .byte 102,15,112,247,232 // pshufd $0xe8,%xmm7,%xmm6
+ .byte 102,15,98,198 // punpckldq %xmm6,%xmm0
+ .byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 102,15,112,240,231 // pshufd $0xe7,%xmm0,%xmm6
+ .byte 102,15,126,247 // movd %xmm6,%edi
+ .byte 243,15,16,52,186 // movss (%edx,%edi,4),%xmm6
+ .byte 243,15,16,60,130 // movss (%edx,%eax,4),%xmm7
+ .byte 15,20,254 // unpcklps %xmm6,%xmm7
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 102,15,111,232 // movdqa %xmm0,%xmm5
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
+ .byte 102,15,254,233 // paddd %xmm1,%xmm5
+ .byte 102,15,112,253,229 // pshufd $0xe5,%xmm5,%xmm7
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 102,15,112,253,78 // pshufd $0x4e,%xmm5,%xmm7
+ .byte 102,15,126,254 // movd %xmm7,%esi
+ .byte 102,15,126,239 // movd %xmm5,%edi
+ .byte 102,15,112,237,231 // pshufd $0xe7,%xmm5,%xmm5
+ .byte 102,15,126,235 // movd %xmm5,%ebx
+ .byte 243,15,16,44,154 // movss (%edx,%ebx,4),%xmm5
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 15,20,205 // unpcklps %xmm5,%xmm1
+ .byte 243,15,16,28,186 // movss (%edx,%edi,4),%xmm3
+ .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
+ .byte 15,20,221 // unpcklps %xmm5,%xmm3
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 102,15,111,177,239,42,0,0 // movdqa 0x2aef(%ecx),%xmm6
+ .byte 102,15,254,198 // paddd %xmm6,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 243,15,16,60,186 // movss (%edx,%edi,4),%xmm7
+ .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
+ .byte 15,20,253 // unpcklps %xmm5,%xmm7
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 15,91,77,200 // cvtdq2ps -0x38(%ebp),%xmm1
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
+ .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
+ .byte 15,92,209 // subps %xmm1,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,209 // addps %xmm1,%xmm2
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,40,141,136,254,255,255 // movaps -0x178(%ebp),%xmm1
+ .byte 15,92,217 // subps %xmm1,%xmm3
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,40,141,152,254,255,255 // movaps -0x168(%ebp),%xmm1
+ .byte 15,92,249 // subps %xmm1,%xmm7
+ .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,88,249 // addps %xmm1,%xmm7
+ .byte 243,15,91,141,168,254,255,255 // cvttps2dq -0x158(%ebp),%xmm1
+ .byte 102,15,111,133,104,255,255,255 // movdqa -0x98(%ebp),%xmm0
+ .byte 102,15,244,193 // pmuludq %xmm1,%xmm0
+ .byte 102,15,112,201,245 // pshufd $0xf5,%xmm1,%xmm1
+ .byte 102,15,244,141,88,255,255,255 // pmuludq -0xa8(%ebp),%xmm1
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,127,133,88,255,255,255 // movdqa %xmm0,-0xa8(%ebp)
+ .byte 102,15,111,149,24,255,255,255 // movdqa -0xe8(%ebp),%xmm2
+ .byte 102,15,254,208 // paddd %xmm0,%xmm2
+ .byte 102,15,111,202 // movdqa %xmm2,%xmm1
+ .byte 102,15,111,234 // movdqa %xmm2,%xmm5
+ .byte 102,15,254,77,168 // paddd -0x58(%ebp),%xmm1
+ .byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
+ .byte 102,15,111,129,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm0
+ .byte 102,15,244,200 // pmuludq %xmm0,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,244,208 // pmuludq %xmm0,%xmm2
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,98,202 // punpckldq %xmm2,%xmm1
+ .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,112,209,231 // pshufd $0xe7,%xmm1,%xmm2
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 243,15,16,20,186 // movss (%edx,%edi,4),%xmm2
+ .byte 243,15,16,28,130 // movss (%edx,%eax,4),%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,194 // unpcklps %xmm2,%xmm0
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
+ .byte 102,15,111,209 // movdqa %xmm1,%xmm2
+ .byte 102,15,111,129,223,42,0,0 // movdqa 0x2adf(%ecx),%xmm0
+ .byte 102,15,254,208 // paddd %xmm0,%xmm2
+ .byte 102,15,111,224 // movdqa %xmm0,%xmm4
+ .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,28,130 // movss (%edx,%eax,4),%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 243,15,16,4,186 // movss (%edx,%edi,4),%xmm0
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,194 // unpcklps %xmm2,%xmm0
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 15,41,133,24,255,255,255 // movaps %xmm0,-0xe8(%ebp)
+ .byte 102,15,254,206 // paddd %xmm6,%xmm1
+ .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,12,154 // movss (%edx,%ebx,4),%xmm1
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 243,15,16,52,186 // movss (%edx,%edi,4),%xmm6
+ .byte 243,15,16,28,178 // movss (%edx,%esi,4),%xmm3
+ .byte 15,20,243 // unpcklps %xmm3,%xmm6
+ .byte 15,20,242 // unpcklps %xmm2,%xmm6
+ .byte 102,15,111,197 // movdqa %xmm5,%xmm0
+ .byte 102,15,254,69,184 // paddd -0x48(%ebp),%xmm0
+ .byte 102,15,112,216,245 // pshufd $0xf5,%xmm0,%xmm3
+ .byte 102,15,111,137,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm1
+ .byte 102,15,244,193 // pmuludq %xmm1,%xmm0
+ .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
+ .byte 102,15,244,217 // pmuludq %xmm1,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,98,211 // punpckldq %xmm3,%xmm2
+ .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,112,218,231 // pshufd $0xe7,%xmm2,%xmm3
+ .byte 102,15,126,223 // movd %xmm3,%edi
+ .byte 243,15,16,28,186 // movss (%edx,%edi,4),%xmm3
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,44,130 // movss (%edx,%eax,4),%xmm5
+ .byte 243,15,16,28,178 // movss (%edx,%esi,4),%xmm3
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
+ .byte 15,20,232 // unpcklps %xmm0,%xmm5
+ .byte 102,15,111,194 // movdqa %xmm2,%xmm0
+ .byte 102,15,254,196 // paddd %xmm4,%xmm0
+ .byte 102,15,112,216,229 // pshufd $0xe5,%xmm0,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 102,15,112,216,78 // pshufd $0x4e,%xmm0,%xmm3
+ .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,28,130 // movss (%edx,%eax,4),%xmm3
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 243,15,16,36,186 // movss (%edx,%edi,4),%xmm4
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,224 // unpcklps %xmm0,%xmm4
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 102,15,111,153,239,42,0,0 // movdqa 0x2aef(%ecx),%xmm3
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 243,15,16,20,186 // movss (%edx,%edi,4),%xmm2
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,208 // unpcklps %xmm0,%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,173,104,255,255,255 // movaps -0x98(%ebp),%xmm5
+ .byte 15,92,205 // subps %xmm5,%xmm1
+ .byte 15,40,69,152 // movaps -0x68(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 15,40,141,24,255,255,255 // movaps -0xe8(%ebp),%xmm1
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,91,133,8,255,255,255 // cvtdq2ps -0xf8(%ebp),%xmm0
+ .byte 15,40,141,40,255,255,255 // movaps -0xd8(%ebp),%xmm1
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,41,141,40,255,255,255 // movaps %xmm1,-0xd8(%ebp)
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,92,232 // subps %xmm0,%xmm5
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,41,173,8,255,255,255 // movaps %xmm5,-0xf8(%ebp)
+ .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,92,224 // subps %xmm0,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
+ .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,88,215 // addps %xmm7,%xmm2
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 243,15,91,69,136 // cvttps2dq -0x78(%ebp),%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,149,248,254,255,255 // movdqa -0x108(%ebp),%xmm2
+ .byte 102,15,244,194 // pmuludq %xmm2,%xmm0
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
+ .byte 102,15,112,193,232 // pshufd $0xe8,%xmm1,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,127,149,248,254,255,255 // movdqa %xmm2,-0x108(%ebp)
+ .byte 102,15,254,149,184,254,255,255 // paddd -0x148(%ebp),%xmm2
+ .byte 102,15,127,85,216 // movdqa %xmm2,-0x28(%ebp)
+ .byte 102,15,111,234 // movdqa %xmm2,%xmm5
+ .byte 102,15,254,173,72,255,255,255 // paddd -0xb8(%ebp),%xmm5
+ .byte 102,15,111,197 // movdqa %xmm5,%xmm0
+ .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,145,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm2
+ .byte 102,15,244,194 // pmuludq %xmm2,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 243,15,16,12,178 // movss (%edx,%esi,4),%xmm1
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,111,145,223,42,0,0 // movdqa 0x2adf(%ecx),%xmm2
+ .byte 102,15,254,202 // paddd %xmm2,%xmm1
+ .byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,12,154 // movss (%edx,%ebx,4),%xmm1
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 243,15,16,36,186 // movss (%edx,%edi,4),%xmm4
+ .byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
+ .byte 15,20,231 // unpcklps %xmm7,%xmm4
+ .byte 15,20,230 // unpcklps %xmm6,%xmm4
+ .byte 102,15,254,195 // paddd %xmm3,%xmm0
+ .byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 102,15,254,109,184 // paddd -0x48(%ebp),%xmm5
+ .byte 102,15,112,245,245 // pshufd $0xf5,%xmm5,%xmm6
+ .byte 102,15,111,129,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm0
+ .byte 102,15,244,232 // pmuludq %xmm0,%xmm5
+ .byte 102,15,112,253,232 // pshufd $0xe8,%xmm5,%xmm7
+ .byte 102,15,244,240 // pmuludq %xmm0,%xmm6
+ .byte 102,15,112,238,232 // pshufd $0xe8,%xmm6,%xmm5
+ .byte 102,15,98,253 // punpckldq %xmm5,%xmm7
+ .byte 102,15,112,239,229 // pshufd $0xe5,%xmm7,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 102,15,112,239,78 // pshufd $0x4e,%xmm7,%xmm5
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,112,239,231 // pshufd $0xe7,%xmm7,%xmm5
+ .byte 102,15,126,239 // movd %xmm5,%edi
+ .byte 243,15,16,44,186 // movss (%edx,%edi,4),%xmm5
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,245 // unpcklps %xmm5,%xmm6
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,28,178 // movss (%edx,%esi,4),%xmm3
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 15,20,198 // unpcklps %xmm6,%xmm0
+ .byte 102,15,111,223 // movdqa %xmm7,%xmm3
+ .byte 102,15,254,218 // paddd %xmm2,%xmm3
+ .byte 102,15,112,243,229 // pshufd $0xe5,%xmm3,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 102,15,126,223 // movd %xmm3,%edi
+ .byte 102,15,112,219,231 // pshufd $0xe7,%xmm3,%xmm3
+ .byte 102,15,126,219 // movd %xmm3,%ebx
+ .byte 243,15,16,28,154 // movss (%edx,%ebx,4),%xmm3
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,243 // unpcklps %xmm3,%xmm6
+ .byte 243,15,16,44,186 // movss (%edx,%edi,4),%xmm5
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 102,15,111,153,239,42,0,0 // movdqa 0x2aef(%ecx),%xmm3
+ .byte 102,15,254,251 // paddd %xmm3,%xmm7
+ .byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,255 // movd %xmm7,%edi
+ .byte 102,15,112,215,231 // pshufd $0xe7,%xmm7,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,242 // unpcklps %xmm2,%xmm6
+ .byte 243,15,16,60,186 // movss (%edx,%edi,4),%xmm7
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 15,20,254 // unpcklps %xmm6,%xmm7
+ .byte 15,40,117,136 // movaps -0x78(%ebp),%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,40,85,152 // movaps -0x68(%ebp),%xmm2
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,41,69,136 // movaps %xmm0,-0x78(%ebp)
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,89,234 // mulps %xmm2,%xmm5
+ .byte 15,88,236 // addps %xmm4,%xmm5
+ .byte 15,92,249 // subps %xmm1,%xmm7
+ .byte 15,89,250 // mulps %xmm2,%xmm7
+ .byte 15,88,249 // addps %xmm1,%xmm7
+ .byte 102,15,111,77,216 // movdqa -0x28(%ebp),%xmm1
+ .byte 102,15,254,141,88,255,255,255 // paddd -0xa8(%ebp),%xmm1
+ .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,15,111,225 // movdqa %xmm1,%xmm4
+ .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,177,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm6
+ .byte 102,15,244,198 // pmuludq %xmm6,%xmm0
+ .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
+ .byte 102,15,244,206 // pmuludq %xmm6,%xmm1
+ .byte 102,15,112,193,232 // pshufd $0xe8,%xmm1,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,186 // movss (%edx,%edi,4),%xmm0
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,52,178 // movss (%edx,%esi,4),%xmm6
+ .byte 15,20,198 // unpcklps %xmm6,%xmm0
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 102,15,111,202 // movdqa %xmm2,%xmm1
+ .byte 102,15,254,137,223,42,0,0 // paddd 0x2adf(%ecx),%xmm1
+ .byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,12,154 // movss (%edx,%ebx,4),%xmm1
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,241 // unpcklps %xmm1,%xmm6
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 15,41,141,24,255,255,255 // movaps %xmm1,-0xe8(%ebp)
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 243,15,16,28,186 // movss (%edx,%edi,4),%xmm3
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 15,20,222 // unpcklps %xmm6,%xmm3
+ .byte 102,15,111,212 // movdqa %xmm4,%xmm2
+ .byte 102,15,254,85,184 // paddd -0x48(%ebp),%xmm2
+ .byte 102,15,112,194,245 // pshufd $0xf5,%xmm2,%xmm0
+ .byte 102,15,111,137,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm1
+ .byte 102,15,244,209 // pmuludq %xmm1,%xmm2
+ .byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4
+ .byte 102,15,244,193 // pmuludq %xmm1,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,98,224 // punpckldq %xmm0,%xmm4
+ .byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,196,78 // pshufd $0x4e,%xmm4,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,196,231 // pshufd $0xe7,%xmm4,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,186 // movss (%edx,%edi,4),%xmm0
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 102,15,111,196 // movdqa %xmm4,%xmm0
+ .byte 102,15,254,129,223,42,0,0 // paddd 0x2adf(%ecx),%xmm0
+ .byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 243,15,16,20,186 // movss (%edx,%edi,4),%xmm2
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,208 // unpcklps %xmm0,%xmm2
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 102,15,254,161,239,42,0,0 // paddd 0x2aef(%ecx),%xmm4
+ .byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,196,78 // pshufd $0x4e,%xmm4,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 102,15,112,196,231 // pshufd $0xe7,%xmm4,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,36,130 // movss (%edx,%eax,4),%xmm4
+ .byte 15,20,224 // unpcklps %xmm0,%xmm4
+ .byte 243,15,16,52,186 // movss (%edx,%edi,4),%xmm6
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,240 // unpcklps %xmm0,%xmm6
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 15,40,101,216 // movaps -0x28(%ebp),%xmm4
+ .byte 15,92,204 // subps %xmm4,%xmm1
+ .byte 15,40,69,152 // movaps -0x68(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,40,165,24,255,255,255 // movaps -0xe8(%ebp),%xmm4
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 15,92,243 // subps %xmm3,%xmm6
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,243 // addps %xmm3,%xmm6
+ .byte 15,40,93,136 // movaps -0x78(%ebp),%xmm3
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,40,133,40,255,255,255 // movaps -0xd8(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,40,217 // movaps %xmm1,%xmm3
+ .byte 15,92,213 // subps %xmm5,%xmm2
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,92,247 // subps %xmm7,%xmm6
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,247 // addps %xmm7,%xmm6
+ .byte 15,91,133,216,254,255,255 // cvtdq2ps -0x128(%ebp),%xmm0
+ .byte 15,40,141,232,254,255,255 // movaps -0x118(%ebp),%xmm1
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,41,141,232,254,255,255 // movaps %xmm1,-0x118(%ebp)
+ .byte 15,40,133,8,255,255,255 // movaps -0xf8(%ebp),%xmm0
+ .byte 15,92,216 // subps %xmm0,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,88,216 // addps %xmm0,%xmm3
+ .byte 15,41,157,8,255,255,255 // movaps %xmm3,-0xf8(%ebp)
+ .byte 15,40,133,104,255,255,255 // movaps -0x98(%ebp),%xmm0
+ .byte 15,92,208 // subps %xmm0,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,41,149,104,255,255,255 // movaps %xmm2,-0x98(%ebp)
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,92,240 // subps %xmm0,%xmm6
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,88,240 // addps %xmm0,%xmm6
+ .byte 15,41,181,216,254,255,255 // movaps %xmm6,-0x128(%ebp)
+ .byte 243,15,91,141,120,255,255,255 // cvttps2dq -0x88(%ebp),%xmm1
+ .byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
+ .byte 102,15,111,133,56,255,255,255 // movdqa -0xc8(%ebp),%xmm0
+ .byte 102,15,254,193 // paddd %xmm1,%xmm0
+ .byte 102,15,127,133,56,255,255,255 // movdqa %xmm0,-0xc8(%ebp)
+ .byte 102,15,111,141,72,255,255,255 // movdqa -0xb8(%ebp),%xmm1
+ .byte 102,15,254,200 // paddd %xmm0,%xmm1
+ .byte 102,15,111,69,168 // movdqa -0x58(%ebp),%xmm0
+ .byte 102,15,254,193 // paddd %xmm1,%xmm0
+ .byte 102,15,112,224,245 // pshufd $0xf5,%xmm0,%xmm4
+ .byte 102,15,111,145,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm2
+ .byte 102,15,244,194 // pmuludq %xmm2,%xmm0
+ .byte 102,15,112,216,232 // pshufd $0xe8,%xmm0,%xmm3
+ .byte 102,15,244,226 // pmuludq %xmm2,%xmm4
+ .byte 102,15,111,250 // movdqa %xmm2,%xmm7
+ .byte 102,15,112,196,232 // pshufd $0xe8,%xmm4,%xmm0
+ .byte 102,15,98,216 // punpckldq %xmm0,%xmm3
+ .byte 102,15,112,195,229 // pshufd $0xe5,%xmm3,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,195,231 // pshufd $0xe7,%xmm3,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,186 // movss (%edx,%edi,4),%xmm0
+ .byte 243,15,16,36,130 // movss (%edx,%eax,4),%xmm4
+ .byte 15,20,224 // unpcklps %xmm0,%xmm4
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
+ .byte 15,20,197 // unpcklps %xmm5,%xmm0
+ .byte 15,20,196 // unpcklps %xmm4,%xmm0
+ .byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
+ .byte 102,15,111,227 // movdqa %xmm3,%xmm4
+ .byte 102,15,111,145,223,42,0,0 // movdqa 0x2adf(%ecx),%xmm2
+ .byte 102,15,254,226 // paddd %xmm2,%xmm4
+ .byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 102,15,112,228,231 // pshufd $0xe7,%xmm4,%xmm4
+ .byte 102,15,126,227 // movd %xmm4,%ebx
+ .byte 243,15,16,36,154 // movss (%edx,%ebx,4),%xmm4
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 243,15,16,44,186 // movss (%edx,%edi,4),%xmm5
+ .byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 102,15,254,153,239,42,0,0 // paddd 0x2aef(%ecx),%xmm3
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 102,15,126,223 // movd %xmm3,%edi
+ .byte 102,15,112,219,231 // pshufd $0xe7,%xmm3,%xmm3
+ .byte 102,15,126,219 // movd %xmm3,%ebx
+ .byte 243,15,16,28,154 // movss (%edx,%ebx,4),%xmm3
+ .byte 243,15,16,36,130 // movss (%edx,%eax,4),%xmm4
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 243,15,16,52,186 // movss (%edx,%edi,4),%xmm6
+ .byte 243,15,16,28,178 // movss (%edx,%esi,4),%xmm3
+ .byte 15,20,243 // unpcklps %xmm3,%xmm6
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 102,15,254,77,184 // paddd -0x48(%ebp),%xmm1
+ .byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
+ .byte 102,15,244,207 // pmuludq %xmm7,%xmm1
+ .byte 102,15,112,225,232 // pshufd $0xe8,%xmm1,%xmm4
+ .byte 102,15,244,223 // pmuludq %xmm7,%xmm3
+ .byte 102,15,112,203,232 // pshufd $0xe8,%xmm3,%xmm1
+ .byte 102,15,98,225 // punpckldq %xmm1,%xmm4
+ .byte 102,15,112,204,229 // pshufd $0xe5,%xmm4,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,112,204,231 // pshufd $0xe7,%xmm4,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,28,130 // movss (%edx,%eax,4),%xmm3
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 102,15,111,220 // movdqa %xmm4,%xmm3
+ .byte 102,15,254,218 // paddd %xmm2,%xmm3
+ .byte 102,15,112,251,229 // pshufd $0xe5,%xmm3,%xmm7
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 102,15,112,251,78 // pshufd $0x4e,%xmm3,%xmm7
+ .byte 102,15,126,254 // movd %xmm7,%esi
+ .byte 102,15,126,223 // movd %xmm3,%edi
+ .byte 102,15,112,219,231 // pshufd $0xe7,%xmm3,%xmm3
+ .byte 102,15,126,219 // movd %xmm3,%ebx
+ .byte 243,15,16,28,154 // movss (%edx,%ebx,4),%xmm3
+ .byte 243,15,16,60,130 // movss (%edx,%eax,4),%xmm7
+ .byte 15,20,251 // unpcklps %xmm3,%xmm7
+ .byte 243,15,16,28,186 // movss (%edx,%edi,4),%xmm3
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 15,20,223 // unpcklps %xmm7,%xmm3
+ .byte 102,15,254,161,239,42,0,0 // paddd 0x2aef(%ecx),%xmm4
+ .byte 102,15,112,212,229 // pshufd $0xe5,%xmm4,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,212,78 // pshufd $0x4e,%xmm4,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 102,15,112,212,231 // pshufd $0xe7,%xmm4,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,60,130 // movss (%edx,%eax,4),%xmm7
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 243,15,16,36,186 // movss (%edx,%edi,4),%xmm4
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,226 // unpcklps %xmm2,%xmm4
+ .byte 15,20,231 // unpcklps %xmm7,%xmm4
+ .byte 15,40,149,120,255,255,255 // movaps -0x88(%ebp),%xmm2
+ .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 15,40,77,152 // movaps -0x68(%ebp),%xmm1
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,88,194 // addps %xmm2,%xmm0
+ .byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,92,230 // subps %xmm6,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,88,230 // addps %xmm6,%xmm4
+ .byte 102,15,111,133,56,255,255,255 // movdqa -0xc8(%ebp),%xmm0
+ .byte 102,15,254,133,88,255,255,255 // paddd -0xa8(%ebp),%xmm0
+ .byte 102,15,127,133,56,255,255,255 // movdqa %xmm0,-0xc8(%ebp)
+ .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
+ .byte 102,15,112,208,245 // pshufd $0xf5,%xmm0,%xmm2
+ .byte 102,15,111,137,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm1
+ .byte 102,15,244,193 // pmuludq %xmm1,%xmm0
+ .byte 102,15,112,240,232 // pshufd $0xe8,%xmm0,%xmm6
+ .byte 102,15,244,209 // pmuludq %xmm1,%xmm2
+ .byte 102,15,112,194,232 // pshufd $0xe8,%xmm2,%xmm0
+ .byte 102,15,98,240 // punpckldq %xmm0,%xmm6
+ .byte 102,15,112,198,229 // pshufd $0xe5,%xmm6,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,198,78 // pshufd $0x4e,%xmm6,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,198,231 // pshufd $0xe7,%xmm6,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,186 // movss (%edx,%edi,4),%xmm0
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 15,20,208 // unpcklps %xmm0,%xmm2
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
+ .byte 15,20,197 // unpcklps %xmm5,%xmm0
+ .byte 15,20,194 // unpcklps %xmm2,%xmm0
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 102,15,111,214 // movdqa %xmm6,%xmm2
+ .byte 102,15,111,153,223,42,0,0 // movdqa 0x2adf(%ecx),%xmm3
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
+ .byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,60,130 // movss (%edx,%eax,4),%xmm7
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 243,15,16,44,186 // movss (%edx,%edi,4),%xmm5
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
+ .byte 15,20,239 // unpcklps %xmm7,%xmm5
+ .byte 102,15,254,177,239,42,0,0 // paddd 0x2aef(%ecx),%xmm6
+ .byte 102,15,112,214,229 // pshufd $0xe5,%xmm6,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,214,78 // pshufd $0x4e,%xmm6,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,247 // movd %xmm6,%edi
+ .byte 102,15,112,214,231 // pshufd $0xe7,%xmm6,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,60,130 // movss (%edx,%eax,4),%xmm7
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 243,15,16,52,186 // movss (%edx,%edi,4),%xmm6
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,242 // unpcklps %xmm2,%xmm6
+ .byte 15,20,247 // unpcklps %xmm7,%xmm6
+ .byte 102,15,111,133,56,255,255,255 // movdqa -0xc8(%ebp),%xmm0
+ .byte 102,15,254,69,184 // paddd -0x48(%ebp),%xmm0
+ .byte 102,15,112,208,245 // pshufd $0xf5,%xmm0,%xmm2
+ .byte 102,15,244,193 // pmuludq %xmm1,%xmm0
+ .byte 102,15,112,248,232 // pshufd $0xe8,%xmm0,%xmm7
+ .byte 102,15,244,209 // pmuludq %xmm1,%xmm2
+ .byte 102,15,112,210,232 // pshufd $0xe8,%xmm2,%xmm2
+ .byte 102,15,98,250 // punpckldq %xmm2,%xmm7
+ .byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,112,215,231 // pshufd $0xe7,%xmm7,%xmm2
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 243,15,16,20,186 // movss (%edx,%edi,4),%xmm2
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 15,20,194 // unpcklps %xmm2,%xmm0
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
+ .byte 15,20,202 // unpcklps %xmm2,%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,111,199 // movdqa %xmm7,%xmm0
+ .byte 102,15,254,195 // paddd %xmm3,%xmm0
+ .byte 102,15,112,208,229 // pshufd $0xe5,%xmm0,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,208,78 // pshufd $0x4e,%xmm0,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 15,20,208 // unpcklps %xmm0,%xmm2
+ .byte 243,15,16,28,186 // movss (%edx,%edi,4),%xmm3
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 102,15,254,185,239,42,0,0 // paddd 0x2aef(%ecx),%xmm7
+ .byte 102,15,112,199,229 // pshufd $0xe5,%xmm7,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,199,78 // pshufd $0x4e,%xmm7,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,255 // movd %xmm7,%edi
+ .byte 102,15,112,199,231 // pshufd $0xe7,%xmm7,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 15,20,208 // unpcklps %xmm0,%xmm2
+ .byte 243,15,16,60,186 // movss (%edx,%edi,4),%xmm7
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,248 // unpcklps %xmm0,%xmm7
+ .byte 15,20,250 // unpcklps %xmm2,%xmm7
+ .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
+ .byte 15,92,202 // subps %xmm2,%xmm1
+ .byte 15,40,69,152 // movaps -0x68(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 15,92,254 // subps %xmm6,%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,88,254 // addps %xmm6,%xmm7
+ .byte 15,40,149,120,255,255,255 // movaps -0x88(%ebp),%xmm2
+ .byte 15,92,202 // subps %xmm2,%xmm1
+ .byte 15,40,133,40,255,255,255 // movaps -0xd8(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,41,141,56,255,255,255 // movaps %xmm1,-0xc8(%ebp)
+ .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
+ .byte 15,92,217 // subps %xmm1,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,41,157,120,255,255,255 // movaps %xmm3,-0x88(%ebp)
+ .byte 15,92,252 // subps %xmm4,%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,88,252 // addps %xmm4,%xmm7
+ .byte 15,41,125,200 // movaps %xmm7,-0x38(%ebp)
+ .byte 102,15,111,133,248,254,255,255 // movdqa -0x108(%ebp),%xmm0
+ .byte 102,15,254,69,136 // paddd -0x78(%ebp),%xmm0
+ .byte 102,15,127,133,248,254,255,255 // movdqa %xmm0,-0x108(%ebp)
+ .byte 102,15,111,141,72,255,255,255 // movdqa -0xb8(%ebp),%xmm1
+ .byte 102,15,254,200 // paddd %xmm0,%xmm1
+ .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,15,111,233 // movdqa %xmm1,%xmm5
+ .byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,153,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm3
+ .byte 102,15,244,195 // pmuludq %xmm3,%xmm0
+ .byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
+ .byte 102,15,244,203 // pmuludq %xmm3,%xmm1
+ .byte 102,15,112,193,232 // pshufd $0xe8,%xmm1,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,186 // movss (%edx,%edi,4),%xmm0
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,28,178 // movss (%edx,%esi,4),%xmm3
+ .byte 15,20,195 // unpcklps %xmm3,%xmm0
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
+ .byte 102,15,111,202 // movdqa %xmm2,%xmm1
+ .byte 102,15,111,177,223,42,0,0 // movdqa 0x2adf(%ecx),%xmm6
+ .byte 102,15,254,206 // paddd %xmm6,%xmm1
+ .byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
+ .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,12,154 // movss (%edx,%ebx,4),%xmm1
+ .byte 243,15,16,28,130 // movss (%edx,%eax,4),%xmm3
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
+ .byte 15,20,203 // unpcklps %xmm3,%xmm1
+ .byte 102,15,111,185,239,42,0,0 // movdqa 0x2aef(%ecx),%xmm7
+ .byte 102,15,254,215 // paddd %xmm7,%xmm2
+ .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,28,130 // movss (%edx,%eax,4),%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 243,15,16,20,186 // movss (%edx,%edi,4),%xmm2
+ .byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
+ .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 15,20,211 // unpcklps %xmm3,%xmm2
+ .byte 102,15,111,221 // movdqa %xmm5,%xmm3
+ .byte 102,15,254,93,184 // paddd -0x48(%ebp),%xmm3
+ .byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
+ .byte 102,15,111,129,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm0
+ .byte 102,15,244,216 // pmuludq %xmm0,%xmm3
+ .byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
+ .byte 102,15,244,224 // pmuludq %xmm0,%xmm4
+ .byte 102,15,112,228,232 // pshufd $0xe8,%xmm4,%xmm4
+ .byte 102,15,98,220 // punpckldq %xmm4,%xmm3
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 102,15,112,227,231 // pshufd $0xe7,%xmm3,%xmm4
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 243,15,16,36,186 // movss (%edx,%edi,4),%xmm4
+ .byte 243,15,16,44,130 // movss (%edx,%eax,4),%xmm5
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
+ .byte 15,20,196 // unpcklps %xmm4,%xmm0
+ .byte 15,20,197 // unpcklps %xmm5,%xmm0
+ .byte 102,15,111,227 // movdqa %xmm3,%xmm4
+ .byte 102,15,254,230 // paddd %xmm6,%xmm4
+ .byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,126,231 // movd %xmm4,%edi
+ .byte 102,15,112,228,231 // pshufd $0xe7,%xmm4,%xmm4
+ .byte 102,15,126,227 // movd %xmm4,%ebx
+ .byte 243,15,16,36,154 // movss (%edx,%ebx,4),%xmm4
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,244 // unpcklps %xmm4,%xmm6
+ .byte 243,15,16,44,186 // movss (%edx,%edi,4),%xmm5
+ .byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
+ .byte 15,20,236 // unpcklps %xmm4,%xmm5
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
+ .byte 102,15,254,223 // paddd %xmm7,%xmm3
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 102,15,126,223 // movd %xmm3,%edi
+ .byte 102,15,112,219,231 // pshufd $0xe7,%xmm3,%xmm3
+ .byte 102,15,126,219 // movd %xmm3,%ebx
+ .byte 243,15,16,28,154 // movss (%edx,%ebx,4),%xmm3
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,243 // unpcklps %xmm3,%xmm6
+ .byte 243,15,16,36,186 // movss (%edx,%edi,4),%xmm4
+ .byte 243,15,16,28,178 // movss (%edx,%esi,4),%xmm3
+ .byte 15,20,227 // unpcklps %xmm3,%xmm4
+ .byte 15,20,230 // unpcklps %xmm6,%xmm4
+ .byte 15,40,181,72,255,255,255 // movaps -0xb8(%ebp),%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,40,93,152 // movaps -0x68(%ebp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,89,235 // mulps %xmm3,%xmm5
+ .byte 15,88,233 // addps %xmm1,%xmm5
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,88,226 // addps %xmm2,%xmm4
+ .byte 102,15,111,141,248,254,255,255 // movdqa -0x108(%ebp),%xmm1
+ .byte 102,15,254,141,88,255,255,255 // paddd -0xa8(%ebp),%xmm1
+ .byte 102,15,111,69,168 // movdqa -0x58(%ebp),%xmm0
+ .byte 102,15,254,193 // paddd %xmm1,%xmm0
+ .byte 102,15,111,241 // movdqa %xmm1,%xmm6
+ .byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
+ .byte 102,15,111,145,207,42,0,0 // movdqa 0x2acf(%ecx),%xmm2
+ .byte 102,15,244,194 // pmuludq %xmm2,%xmm0
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,244,202 // pmuludq %xmm2,%xmm1
+ .byte 102,15,111,250 // movdqa %xmm2,%xmm7
+ .byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
+ .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 243,15,16,28,130 // movss (%edx,%eax,4),%xmm3
+ .byte 243,15,16,12,178 // movss (%edx,%esi,4),%xmm1
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,254,137,223,42,0,0 // paddd 0x2adf(%ecx),%xmm1
+ .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,12,154 // movss (%edx,%ebx,4),%xmm1
+ .byte 243,15,16,20,130 // movss (%edx,%eax,4),%xmm2
+ .byte 15,20,209 // unpcklps %xmm1,%xmm2
+ .byte 243,15,16,28,186 // movss (%edx,%edi,4),%xmm3
+ .byte 243,15,16,12,178 // movss (%edx,%esi,4),%xmm1
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
+ .byte 102,15,254,129,239,42,0,0 // paddd 0x2aef(%ecx),%xmm0
+ .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 243,15,16,4,154 // movss (%edx,%ebx,4),%xmm0
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 243,15,16,28,186 // movss (%edx,%edi,4),%xmm3
+ .byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
+ .byte 15,20,216 // unpcklps %xmm0,%xmm3
+ .byte 15,20,217 // unpcklps %xmm1,%xmm3
+ .byte 102,15,111,206 // movdqa %xmm6,%xmm1
+ .byte 102,15,254,77,184 // paddd -0x48(%ebp),%xmm1
+ .byte 102,15,112,193,245 // pshufd $0xf5,%xmm1,%xmm0
+ .byte 102,15,244,207 // pmuludq %xmm7,%xmm1
+ .byte 102,15,244,199 // pmuludq %xmm7,%xmm0
+ .byte 102,15,112,209,232 // pshufd $0xe8,%xmm1,%xmm2
+ .byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
+ .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 243,15,16,4,186 // movss (%edx,%edi,4),%xmm0
+ .byte 243,15,16,12,130 // movss (%edx,%eax,4),%xmm1
+ .byte 15,20,200 // unpcklps %xmm0,%xmm1
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,4,130 // movss (%edx,%eax,4),%xmm0
+ .byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
+ .byte 15,20,193 // unpcklps %xmm1,%xmm0
+ .byte 102,15,111,177,223,42,0,0 // movdqa 0x2adf(%ecx),%xmm6
+ .byte 102,15,254,242 // paddd %xmm2,%xmm6
+ .byte 102,15,112,206,229 // pshufd $0xe5,%xmm6,%xmm1
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1
+ .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,126,247 // movd %xmm6,%edi
+ .byte 102,15,112,206,231 // pshufd $0xe7,%xmm6,%xmm1
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,12,154 // movss (%edx,%ebx,4),%xmm1
+ .byte 243,15,16,60,130 // movss (%edx,%eax,4),%xmm7
+ .byte 15,20,249 // unpcklps %xmm1,%xmm7
+ .byte 243,15,16,12,186 // movss (%edx,%edi,4),%xmm1
+ .byte 243,15,16,52,178 // movss (%edx,%esi,4),%xmm6
+ .byte 15,20,206 // unpcklps %xmm6,%xmm1
+ .byte 15,20,207 // unpcklps %xmm7,%xmm1
+ .byte 102,15,254,145,239,42,0,0 // paddd 0x2aef(%ecx),%xmm2
+ .byte 102,15,112,242,229 // pshufd $0xe5,%xmm2,%xmm6
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 102,15,126,215 // movd %xmm2,%edi
+ .byte 102,15,112,210,231 // pshufd $0xe7,%xmm2,%xmm2
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,154 // movss (%edx,%ebx,4),%xmm2
+ .byte 243,15,16,52,130 // movss (%edx,%eax,4),%xmm6
+ .byte 15,20,242 // unpcklps %xmm2,%xmm6
+ .byte 243,15,16,20,186 // movss (%edx,%edi,4),%xmm2
+ .byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
+ .byte 15,20,215 // unpcklps %xmm7,%xmm2
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 15,40,125,168 // movaps -0x58(%ebp),%xmm7
+ .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,88,199 // addps %xmm7,%xmm0
+ .byte 15,40,189,88,255,255,255 // movaps -0xa8(%ebp),%xmm7
+ .byte 15,92,207 // subps %xmm7,%xmm1
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 15,40,181,72,255,255,255 // movaps -0xb8(%ebp),%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,40,157,40,255,255,255 // movaps -0xd8(%ebp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,92,205 // subps %xmm5,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 15,40,165,56,255,255,255 // movaps -0xc8(%ebp),%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,40,157,232,254,255,255 // movaps -0x118(%ebp),%xmm3
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 15,40,165,120,255,255,255 // movaps -0x88(%ebp),%xmm4
+ .byte 15,92,204 // subps %xmm4,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 15,91,157,184,254,255,255 // cvtdq2ps -0x148(%ebp),%xmm3
+ .byte 15,40,165,120,254,255,255 // movaps -0x188(%ebp),%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,40,157,8,255,255,255 // movaps -0xf8(%ebp),%xmm3
+ .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,195 // addps %xmm3,%xmm0
+ .byte 15,40,157,104,255,255,255 // movaps -0x98(%ebp),%xmm3
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,40,157,216,254,255,255 // movaps -0x128(%ebp),%xmm3
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 139,117,12 // mov 0xc(%ebp),%esi
+ .byte 141,86,8 // lea 0x8(%esi),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,153,255,42,0,0 // movaps 0x2aff(%ecx),%xmm3
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,86,4 // call *0x4(%esi)
+ .byte 129,196,140,1,0,0 // add $0x18c,%esp
+ .byte 94 // pop %esi
+ .byte 95 // pop %edi
+ .byte 91 // pop %ebx
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+
BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
@@ -60706,9 +72338,9 @@ BALIGN16
.byte 0,224 // add %ah,%al
.byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 72bc <.literal16+0x1fc>
+ .byte 224,64 // loopne 939c <.literal16+0x1fc>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 72c0 <.literal16+0x200>
+ .byte 224,64 // loopne 93a0 <.literal16+0x200>
.byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999
.byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999
.byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax
@@ -60719,16 +72351,16 @@ BALIGN16
.byte 63 // aas
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 72e1 <.literal16+0x221>
+ .byte 225,61 // loope 93c1 <.literal16+0x221>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 72e5 <.literal16+0x225>
+ .byte 225,61 // loope 93c5 <.literal16+0x225>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 72e9 <.literal16+0x229>
+ .byte 225,61 // loope 93c9 <.literal16+0x229>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 72ed <.literal16+0x22d>
+ .byte 225,61 // loope 93cd <.literal16+0x22d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60745,16 +72377,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 7321 <.literal16+0x261>
+ .byte 225,61 // loope 9401 <.literal16+0x261>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7325 <.literal16+0x265>
+ .byte 225,61 // loope 9405 <.literal16+0x265>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7329 <.literal16+0x269>
+ .byte 225,61 // loope 9409 <.literal16+0x269>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 732d <.literal16+0x26d>
+ .byte 225,61 // loope 940d <.literal16+0x26d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60771,16 +72403,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 7361 <.literal16+0x2a1>
+ .byte 225,61 // loope 9441 <.literal16+0x2a1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7365 <.literal16+0x2a5>
+ .byte 225,61 // loope 9445 <.literal16+0x2a5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7369 <.literal16+0x2a9>
+ .byte 225,61 // loope 9449 <.literal16+0x2a9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 736d <.literal16+0x2ad>
+ .byte 225,61 // loope 944d <.literal16+0x2ad>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60797,16 +72429,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 73a1 <.literal16+0x2e1>
+ .byte 225,61 // loope 9481 <.literal16+0x2e1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 73a5 <.literal16+0x2e5>
+ .byte 225,61 // loope 9485 <.literal16+0x2e5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 73a9 <.literal16+0x2e9>
+ .byte 225,61 // loope 9489 <.literal16+0x2e9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 73ad <.literal16+0x2ed>
+ .byte 225,61 // loope 948d <.literal16+0x2ed>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60828,11 +72460,11 @@ BALIGN16
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax)
.byte 67 // inc %ebx
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 73eb <.literal16+0x32b>
+ .byte 127,67 // jg 94cb <.literal16+0x32b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 73ef <.literal16+0x32f>
+ .byte 127,67 // jg 94cf <.literal16+0x32f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 73f3 <.literal16+0x333>
+ .byte 127,67 // jg 94d3 <.literal16+0x333>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61106,13 +72738,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7649 <.literal16+0x589>
+ .byte 224,7 // loopne 9729 <.literal16+0x589>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 764d <.literal16+0x58d>
+ .byte 224,7 // loopne 972d <.literal16+0x58d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7651 <.literal16+0x591>
+ .byte 224,7 // loopne 9731 <.literal16+0x591>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7655 <.literal16+0x595>
+ .byte 224,7 // loopne 9735 <.literal16+0x595>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -61161,11 +72793,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 770b <.literal16+0x64b>
+ .byte 127,67 // jg 97eb <.literal16+0x64b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 770f <.literal16+0x64f>
+ .byte 127,67 // jg 97ef <.literal16+0x64f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7713 <.literal16+0x653>
+ .byte 127,67 // jg 97f3 <.literal16+0x653>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax)
@@ -61180,16 +72812,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7704 <.literal16+0x644>
+ .byte 127,0 // jg 97e4 <.literal16+0x644>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7708 <.literal16+0x648>
+ .byte 127,0 // jg 97e8 <.literal16+0x648>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 770c <.literal16+0x64c>
+ .byte 127,0 // jg 97ec <.literal16+0x64c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7710 <.literal16+0x650>
+ .byte 127,0 // jg 97f0 <.literal16+0x650>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -61198,7 +72830,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7795 <.literal16+0x6d5>
+ .byte 119,115 // ja 9875 <.literal16+0x6d5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61209,7 +72841,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 76f9 <.literal16+0x639>
+ .byte 117,191 // jne 97d9 <.literal16+0x639>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61225,7 +72857,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b736 <_sk_callback_sse2+0xe9a34728>
+ .byte 233,220,63,163,233 // jmp e9a3d816 <_sk_clut_4D_sse2+0xe9a35c5e>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61280,16 +72912,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 77d4 <.literal16+0x714>
+ .byte 127,0 // jg 98b4 <.literal16+0x714>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 77d8 <.literal16+0x718>
+ .byte 127,0 // jg 98b8 <.literal16+0x718>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 77dc <.literal16+0x71c>
+ .byte 127,0 // jg 98bc <.literal16+0x71c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 77e0 <.literal16+0x720>
+ .byte 127,0 // jg 98c0 <.literal16+0x720>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -61298,7 +72930,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7865 <.literal16+0x7a5>
+ .byte 119,115 // ja 9945 <.literal16+0x7a5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61309,7 +72941,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 77c9 <.literal16+0x709>
+ .byte 117,191 // jne 98a9 <.literal16+0x709>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61325,7 +72957,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b806 <_sk_callback_sse2+0xe9a347f8>
+ .byte 233,220,63,163,233 // jmp e9a3d8e6 <_sk_clut_4D_sse2+0xe9a35d2e>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61380,16 +73012,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 78a4 <.literal16+0x7e4>
+ .byte 127,0 // jg 9984 <.literal16+0x7e4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 78a8 <.literal16+0x7e8>
+ .byte 127,0 // jg 9988 <.literal16+0x7e8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 78ac <.literal16+0x7ec>
+ .byte 127,0 // jg 998c <.literal16+0x7ec>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 78b0 <.literal16+0x7f0>
+ .byte 127,0 // jg 9990 <.literal16+0x7f0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -61398,7 +73030,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7935 <.literal16+0x875>
+ .byte 119,115 // ja 9a15 <.literal16+0x875>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61409,7 +73041,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 7899 <.literal16+0x7d9>
+ .byte 117,191 // jne 9979 <.literal16+0x7d9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61425,7 +73057,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b8d6 <_sk_callback_sse2+0xe9a348c8>
+ .byte 233,220,63,163,233 // jmp e9a3d9b6 <_sk_clut_4D_sse2+0xe9a35dfe>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61480,16 +73112,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7974 <.literal16+0x8b4>
+ .byte 127,0 // jg 9a54 <.literal16+0x8b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7978 <.literal16+0x8b8>
+ .byte 127,0 // jg 9a58 <.literal16+0x8b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 797c <.literal16+0x8bc>
+ .byte 127,0 // jg 9a5c <.literal16+0x8bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7980 <.literal16+0x8c0>
+ .byte 127,0 // jg 9a60 <.literal16+0x8c0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -61498,7 +73130,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7a05 <.literal16+0x945>
+ .byte 119,115 // ja 9ae5 <.literal16+0x945>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61509,7 +73141,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 7969 <.literal16+0x8a9>
+ .byte 117,191 // jne 9a49 <.literal16+0x8a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61525,7 +73157,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b9a6 <_sk_callback_sse2+0xe9a34998>
+ .byte 233,220,63,163,233 // jmp e9a3da86 <_sk_clut_4D_sse2+0xe9a35ece>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61580,16 +73212,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7a44 <.literal16+0x984>
+ .byte 127,0 // jg 9b24 <.literal16+0x984>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7a48 <.literal16+0x988>
+ .byte 127,0 // jg 9b28 <.literal16+0x988>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7a4c <.literal16+0x98c>
+ .byte 127,0 // jg 9b2c <.literal16+0x98c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7a50 <.literal16+0x990>
+ .byte 127,0 // jg 9b30 <.literal16+0x990>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -61598,7 +73230,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7ad5 <.literal16+0xa15>
+ .byte 119,115 // ja 9bb5 <.literal16+0xa15>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61609,7 +73241,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 7a39 <.literal16+0x979>
+ .byte 117,191 // jne 9b19 <.literal16+0x979>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61625,7 +73257,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3ba76 <_sk_callback_sse2+0xe9a34a68>
+ .byte 233,220,63,163,233 // jmp e9a3db56 <_sk_clut_4D_sse2+0xe9a35f9e>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61676,13 +73308,13 @@ BALIGN16
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
- .byte 127,67 // jg 7b57 <.literal16+0xa97>
+ .byte 127,67 // jg 9c37 <.literal16+0xa97>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7b5b <.literal16+0xa9b>
+ .byte 127,67 // jg 9c3b <.literal16+0xa9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7b5f <.literal16+0xa9f>
+ .byte 127,67 // jg 9c3f <.literal16+0xa9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7b63 <.literal16+0xaa3>
+ .byte 127,67 // jg 9c43 <.literal16+0xaa3>
.byte 0,0 // add %al,(%eax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%eax)
@@ -61733,16 +73365,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%ebx)
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7be3 <.literal16+0xb23>
+ .byte 118,63 // jbe 9cc3 <.literal16+0xb23>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7be7 <.literal16+0xb27>
+ .byte 118,63 // jbe 9cc7 <.literal16+0xb27>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7beb <.literal16+0xb2b>
+ .byte 118,63 // jbe 9ccb <.literal16+0xb2b>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7bef <.literal16+0xb2f>
+ .byte 118,63 // jbe 9ccf <.literal16+0xb2f>
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
@@ -61771,11 +73403,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%ebx)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7c5b <.literal16+0xb9b>
+ .byte 127,67 // jg 9d3b <.literal16+0xb9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7c5f <.literal16+0xb9f>
+ .byte 127,67 // jg 9d3f <.literal16+0xb9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7c63 <.literal16+0xba3>
+ .byte 127,67 // jg 9d43 <.literal16+0xba3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,0 // add %al,(%eax)
@@ -61837,13 +73469,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7cd9 <.literal16+0xc19>
+ .byte 224,7 // loopne 9db9 <.literal16+0xc19>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7cdd <.literal16+0xc1d>
+ .byte 224,7 // loopne 9dbd <.literal16+0xc1d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7ce1 <.literal16+0xc21>
+ .byte 224,7 // loopne 9dc1 <.literal16+0xc21>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7ce5 <.literal16+0xc25>
+ .byte 224,7 // loopne 9dc5 <.literal16+0xc25>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -61889,13 +73521,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7d49 <.literal16+0xc89>
+ .byte 224,7 // loopne 9e29 <.literal16+0xc89>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7d4d <.literal16+0xc8d>
+ .byte 224,7 // loopne 9e2d <.literal16+0xc8d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7d51 <.literal16+0xc91>
+ .byte 224,7 // loopne 9e31 <.literal16+0xc91>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7d55 <.literal16+0xc95>
+ .byte 224,7 // loopne 9e35 <.literal16+0xc95>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -61941,13 +73573,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7db9 <.literal16+0xcf9>
+ .byte 224,7 // loopne 9e99 <.literal16+0xcf9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7dbd <.literal16+0xcfd>
+ .byte 224,7 // loopne 9e9d <.literal16+0xcfd>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7dc1 <.literal16+0xd01>
+ .byte 224,7 // loopne 9ea1 <.literal16+0xd01>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7dc5 <.literal16+0xd05>
+ .byte 224,7 // loopne 9ea5 <.literal16+0xd05>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -61989,13 +73621,13 @@ BALIGN16
.byte 248 // clc
.byte 65 // inc %ecx
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7e56 <.literal16+0xd96>
+ .byte 124,66 // jl 9f36 <.literal16+0xd96>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7e5a <.literal16+0xd9a>
+ .byte 124,66 // jl 9f3a <.literal16+0xd9a>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7e5e <.literal16+0xd9e>
+ .byte 124,66 // jl 9f3e <.literal16+0xd9e>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7e62 <.literal16+0xda2>
+ .byte 124,66 // jl 9f42 <.literal16+0xda2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%eax)
.byte 0,240 // add %dh,%al
@@ -62129,13 +73761,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7fe5 <.literal16+0xf25>
+ .byte 112,65 // jo a0c5 <.literal16+0xf25>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7fe9 <.literal16+0xf29>
+ .byte 112,65 // jo a0c9 <.literal16+0xf29>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7fed <.literal16+0xf2d>
+ .byte 112,65 // jo a0cd <.literal16+0xf2d>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7ff1 <.literal16+0xf31>
+ .byte 112,65 // jo a0d1 <.literal16+0xf31>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -62166,11 +73798,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 805b <.literal16+0xf9b>
+ .byte 127,67 // jg a13b <.literal16+0xf9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 805f <.literal16+0xf9f>
+ .byte 127,67 // jg a13f <.literal16+0xf9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 8063 <.literal16+0xfa3>
+ .byte 127,67 // jg a143 <.literal16+0xfa3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -62201,11 +73833,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 80cb <.literal16+0x100b>
+ .byte 127,67 // jg a1ab <.literal16+0x100b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 80cf <.literal16+0x100f>
+ .byte 127,67 // jg a1af <.literal16+0x100f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 80d3 <.literal16+0x1013>
+ .byte 127,67 // jg a1b3 <.literal16+0x1013>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
@@ -62304,13 +73936,13 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 255 // (bad)
- .byte 127,71 // jg 81fb <.literal16+0x113b>
+ .byte 127,71 // jg a2db <.literal16+0x113b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 81ff <.literal16+0x113f>
+ .byte 127,71 // jg a2df <.literal16+0x113f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 8203 <.literal16+0x1143>
+ .byte 127,71 // jg a2e3 <.literal16+0x1143>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 8207 <.literal16+0x1147>
+ .byte 127,71 // jg a2e7 <.literal16+0x1147>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -62418,7 +74050,7 @@ BALIGN16
.byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 830c <.literal16+0x124c>
+ .byte 120,57 // js a3ec <.literal16+0x124c>
.byte 64 // inc %eax
.byte 18,120,57 // adc 0x39(%eax),%bh
.byte 64 // inc %eax
@@ -62611,11 +74243,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 84f2 <.literal16+0x1432>
+ .byte 62,114,28 // jb,pt a5d2 <.literal16+0x1432>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 84f6 <.literal16+0x1436>
+ .byte 62,114,28 // jb,pt a5d6 <.literal16+0x1436>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 84fa <.literal16+0x143a>
+ .byte 62,114,28 // jb,pt a5da <.literal16+0x143a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -62694,13 +74326,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb 85be <.literal16+0x14fe>
+ .byte 114,28 // jb a69e <.literal16+0x14fe>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 85c2 <.literal16+0x1502>
+ .byte 62,114,28 // jb,pt a6a2 <.literal16+0x1502>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 85c6 <.literal16+0x1506>
+ .byte 62,114,28 // jb,pt a6a6 <.literal16+0x1506>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 85ca <.literal16+0x150a>
+ .byte 62,114,28 // jb,pt a6aa <.literal16+0x150a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -62721,11 +74353,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 8602 <.literal16+0x1542>
+ .byte 62,114,28 // jb,pt a6e2 <.literal16+0x1542>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8606 <.literal16+0x1546>
+ .byte 62,114,28 // jb,pt a6e6 <.literal16+0x1546>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 860a <.literal16+0x154a>
+ .byte 62,114,28 // jb,pt a6ea <.literal16+0x154a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -62804,13 +74436,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb 86ce <.literal16+0x160e>
+ .byte 114,28 // jb a7ae <.literal16+0x160e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 86d2 <_sk_callback_sse2+0x16c4>
+ .byte 62,114,28 // jb,pt a7b2 <.literal16+0x1612>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 86d6 <_sk_callback_sse2+0x16c8>
+ .byte 62,114,28 // jb,pt a7b6 <.literal16+0x1616>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 86da <_sk_callback_sse2+0x16cc>
+ .byte 62,114,28 // jb,pt a7ba <.literal16+0x161a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -62820,6 +74452,77 @@ BALIGN16
.byte 170 // stos %al,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
.byte 190,171,170,170,190 // mov $0xbeaaaaab,%esi
+ .byte 114,249 // jb a7ab <.literal16+0x160b>
+ .byte 127,63 // jg a7f3 <.literal16+0x1653>
+ .byte 114,249 // jb a7af <.literal16+0x160f>
+ .byte 127,63 // jg a7f7 <.literal16+0x1657>
+ .byte 114,249 // jb a7b3 <.literal16+0x1613>
+ .byte 127,63 // jg a7fb <.literal16+0x165b>
+ .byte 114,249 // jb a7b7 <.literal16+0x1617>
+ .byte 127,63 // jg a7ff <.literal16+0x165f>
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 114,249 // jb a7eb <.literal16+0x164b>
+ .byte 127,63 // jg a833 <.literal16+0x1693>
+ .byte 114,249 // jb a7ef <.literal16+0x164f>
+ .byte 127,63 // jg a837 <.literal16+0x1697>
+ .byte 114,249 // jb a7f3 <.literal16+0x1653>
+ .byte 127,63 // jg a83b <.literal16+0x169b>
+ .byte 114,249 // jb a7f7 <.literal16+0x1657>
+ .byte 127,63 // jg a83f <.literal16+0x169f>
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 3,0 // add (%eax),%eax
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 2,0 // add (%eax),%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 128,63,0 // cmpb $0x0,(%edi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
+ .byte 63 // aas
+ .byte 0,0 // add %al,(%eax)
+ .byte 128 // .byte 0x80
+ .byte 63 // aas
BALIGN4
.byte 0,0 // add %al,(%eax)
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 9e7e80709d..4937e80125 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -101,7 +101,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,113,90,0,0 ; vbroadcastss 0x5a71(%rip),%ymm1 # 5bd0 <_sk_callback_hsw+0x12a>
+ DB 196,226,125,24,13,189,103,0,0 ; vbroadcastss 0x67bd(%rip),%ymm1 # 691c <_sk_clut_4D_hsw+0x8c8>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -109,7 +109,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,81,90,0,0 ; vbroadcastss 0x5a51(%rip),%ymm2 # 5bd4 <_sk_callback_hsw+0x12e>
+ DB 196,226,125,24,21,157,103,0,0 ; vbroadcastss 0x679d(%rip),%ymm2 # 6920 <_sk_clut_4D_hsw+0x8cc>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -126,13 +126,13 @@ _sk_dither_hsw LABEL PROC
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,24,90,0,0 ; vpbroadcastd 0x5a18(%rip),%ymm10 # 5bd8 <_sk_callback_hsw+0x132>
+ DB 196,98,125,88,21,100,103,0,0 ; vpbroadcastd 0x6764(%rip),%ymm10 # 6924 <_sk_clut_4D_hsw+0x8d0>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,253,89,0,0 ; vpbroadcastd 0x59fd(%rip),%ymm12 # 5bdc <_sk_callback_hsw+0x136>
- DB 196,98,125,88,45,248,89,0,0 ; vpbroadcastd 0x59f8(%rip),%ymm13 # 5be0 <_sk_callback_hsw+0x13a>
+ DB 196,98,125,88,37,73,103,0,0 ; vpbroadcastd 0x6749(%rip),%ymm12 # 6928 <_sk_clut_4D_hsw+0x8d4>
+ DB 196,98,125,88,45,68,103,0,0 ; vpbroadcastd 0x6744(%rip),%ymm13 # 692c <_sk_clut_4D_hsw+0x8d8>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -147,8 +147,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,170,89,0,0 ; vbroadcastss 0x59aa(%rip),%ymm9 # 5be4 <_sk_callback_hsw+0x13e>
- DB 196,98,125,24,21,165,89,0,0 ; vbroadcastss 0x59a5(%rip),%ymm10 # 5be8 <_sk_callback_hsw+0x142>
+ DB 196,98,125,24,13,246,102,0,0 ; vbroadcastss 0x66f6(%rip),%ymm9 # 6930 <_sk_clut_4D_hsw+0x8dc>
+ DB 196,98,125,24,21,241,102,0,0 ; vbroadcastss 0x66f1(%rip),%ymm10 # 6934 <_sk_clut_4D_hsw+0x8e0>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
@@ -178,7 +178,7 @@ _sk_uniform_color_hsw LABEL PROC
PUBLIC _sk_black_color_hsw
_sk_black_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,69,89,0,0 ; vbroadcastss 0x5945(%rip),%ymm3 # 5bec <_sk_callback_hsw+0x146>
+ DB 196,226,125,24,29,145,102,0,0 ; vbroadcastss 0x6691(%rip),%ymm3 # 6938 <_sk_clut_4D_hsw+0x8e4>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -187,7 +187,7 @@ _sk_black_color_hsw LABEL PROC
PUBLIC _sk_white_color_hsw
_sk_white_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,48,89,0,0 ; vbroadcastss 0x5930(%rip),%ymm0 # 5bf0 <_sk_callback_hsw+0x14a>
+ DB 196,226,125,24,5,124,102,0,0 ; vbroadcastss 0x667c(%rip),%ymm0 # 693c <_sk_clut_4D_hsw+0x8e8>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -225,7 +225,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,211,88,0,0 ; vbroadcastss 0x58d3(%rip),%ymm8 # 5bf4 <_sk_callback_hsw+0x14e>
+ DB 196,98,125,24,5,31,102,0,0 ; vbroadcastss 0x661f(%rip),%ymm8 # 6940 <_sk_clut_4D_hsw+0x8ec>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -239,7 +239,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,166,88,0,0 ; vbroadcastss 0x58a6(%rip),%ymm8 # 5bf8 <_sk_callback_hsw+0x152>
+ DB 196,98,125,24,5,242,101,0,0 ; vbroadcastss 0x65f2(%rip),%ymm8 # 6944 <_sk_clut_4D_hsw+0x8f0>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -272,7 +272,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,77,88,0,0 ; vbroadcastss 0x584d(%rip),%ymm8 # 5bfc <_sk_callback_hsw+0x156>
+ DB 196,98,125,24,5,153,101,0,0 ; vbroadcastss 0x6599(%rip),%ymm8 # 6948 <_sk_clut_4D_hsw+0x8f4>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -283,7 +283,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,48,88,0,0 ; vbroadcastss 0x5830(%rip),%ymm0 # 5c00 <_sk_callback_hsw+0x15a>
+ DB 196,226,125,24,5,124,101,0,0 ; vbroadcastss 0x657c(%rip),%ymm0 # 694c <_sk_clut_4D_hsw+0x8f8>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -294,7 +294,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,19,88,0,0 ; vbroadcastss 0x5813(%rip),%ymm8 # 5c04 <_sk_callback_hsw+0x15e>
+ DB 196,98,125,24,5,95,101,0,0 ; vbroadcastss 0x655f(%rip),%ymm8 # 6950 <_sk_clut_4D_hsw+0x8fc>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -305,7 +305,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,242,87,0,0 ; vbroadcastss 0x57f2(%rip),%ymm8 # 5c08 <_sk_callback_hsw+0x162>
+ DB 196,98,125,24,5,62,101,0,0 ; vbroadcastss 0x653e(%rip),%ymm8 # 6954 <_sk_clut_4D_hsw+0x900>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -325,7 +325,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,189,87,0,0 ; vbroadcastss 0x57bd(%rip),%ymm8 # 5c0c <_sk_callback_hsw+0x166>
+ DB 196,98,125,24,5,9,101,0,0 ; vbroadcastss 0x6509(%rip),%ymm8 # 6958 <_sk_clut_4D_hsw+0x904>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -367,7 +367,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,56,87,0,0 ; vbroadcastss 0x5738(%rip),%ymm8 # 5c10 <_sk_callback_hsw+0x16a>
+ DB 196,98,125,24,5,132,100,0,0 ; vbroadcastss 0x6484(%rip),%ymm8 # 695c <_sk_clut_4D_hsw+0x908>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -399,7 +399,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,192,86,0,0 ; vbroadcastss 0x56c0(%rip),%ymm8 # 5c14 <_sk_callback_hsw+0x16e>
+ DB 196,98,125,24,5,12,100,0,0 ; vbroadcastss 0x640c(%rip),%ymm8 # 6960 <_sk_clut_4D_hsw+0x90c>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -422,7 +422,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,111,86,0,0 ; vbroadcastss 0x566f(%rip),%ymm8 # 5c18 <_sk_callback_hsw+0x172>
+ DB 196,98,125,24,5,187,99,0,0 ; vbroadcastss 0x63bb(%rip),%ymm8 # 6964 <_sk_clut_4D_hsw+0x910>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -448,7 +448,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,18,86,0,0 ; vbroadcastss 0x5612(%rip),%ymm8 # 5c1c <_sk_callback_hsw+0x176>
+ DB 196,98,125,24,5,94,99,0,0 ; vbroadcastss 0x635e(%rip),%ymm8 # 6968 <_sk_clut_4D_hsw+0x914>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -468,7 +468,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,208,85,0,0 ; vbroadcastss 0x55d0(%rip),%ymm8 # 5c20 <_sk_callback_hsw+0x17a>
+ DB 196,98,125,24,5,28,99,0,0 ; vbroadcastss 0x631c(%rip),%ymm8 # 696c <_sk_clut_4D_hsw+0x918>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -476,7 +476,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,190,85,0,0 ; vbroadcastss 0x55be(%rip),%ymm8 # 5c24 <_sk_callback_hsw+0x17e>
+ DB 196,98,125,24,5,10,99,0,0 ; vbroadcastss 0x630a(%rip),%ymm8 # 6970 <_sk_clut_4D_hsw+0x91c>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -532,7 +532,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,201,84,0,0 ; vbroadcastss 0x54c9(%rip),%ymm9 # 5c28 <_sk_callback_hsw+0x182>
+ DB 196,98,125,24,13,21,98,0,0 ; vbroadcastss 0x6215(%rip),%ymm9 # 6974 <_sk_clut_4D_hsw+0x920>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -583,7 +583,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,234,83,0,0 ; vbroadcastss 0x53ea(%rip),%ymm8 # 5c2c <_sk_callback_hsw+0x186>
+ DB 196,98,125,24,5,54,97,0,0 ; vbroadcastss 0x6136(%rip),%ymm8 # 6978 <_sk_clut_4D_hsw+0x924>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -632,7 +632,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,34,83,0,0 ; vbroadcastss 0x5322(%rip),%ymm8 # 5c30 <_sk_callback_hsw+0x18a>
+ DB 196,98,125,24,5,110,96,0,0 ; vbroadcastss 0x606e(%rip),%ymm8 # 697c <_sk_clut_4D_hsw+0x928>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -692,10 +692,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,41,82,0,0 ; vbroadcastss 0x5229(%rip),%ymm11 # 5c38 <_sk_callback_hsw+0x192>
+ DB 196,98,125,24,29,117,95,0,0 ; vbroadcastss 0x5f75(%rip),%ymm11 # 6984 <_sk_clut_4D_hsw+0x930>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,26,82,0,0 ; vbroadcastss 0x521a(%rip),%ymm12 # 5c3c <_sk_callback_hsw+0x196>
+ DB 196,98,125,24,37,102,95,0,0 ; vbroadcastss 0x5f66(%rip),%ymm12 # 6988 <_sk_clut_4D_hsw+0x934>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -705,7 +705,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,221,81,0,0 ; vbroadcastss 0x51dd(%rip),%ymm8 # 5c34 <_sk_callback_hsw+0x18e>
+ DB 196,98,125,24,5,41,95,0,0 ; vbroadcastss 0x5f29(%rip),%ymm8 # 6980 <_sk_clut_4D_hsw+0x92c>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -818,11 +818,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,220,79,0,0 ; vbroadcastss 0x4fdc(%rip),%ymm14 # 5c40 <_sk_callback_hsw+0x19a>
- DB 196,98,125,24,61,215,79,0,0 ; vbroadcastss 0x4fd7(%rip),%ymm15 # 5c44 <_sk_callback_hsw+0x19e>
+ DB 196,98,125,24,53,40,93,0,0 ; vbroadcastss 0x5d28(%rip),%ymm14 # 698c <_sk_clut_4D_hsw+0x938>
+ DB 196,98,125,24,61,35,93,0,0 ; vbroadcastss 0x5d23(%rip),%ymm15 # 6990 <_sk_clut_4D_hsw+0x93c>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,200,79,0,0 ; vbroadcastss 0x4fc8(%rip),%ymm0 # 5c48 <_sk_callback_hsw+0x1a2>
+ DB 196,226,125,24,5,20,93,0,0 ; vbroadcastss 0x5d14(%rip),%ymm0 # 6994 <_sk_clut_4D_hsw+0x940>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -877,7 +877,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,181,78,0,0 ; vbroadcastss 0x4eb5(%rip),%ymm1 # 5c4c <_sk_callback_hsw+0x1a6>
+ DB 196,226,125,24,13,1,92,0,0 ; vbroadcastss 0x5c01(%rip),%ymm1 # 6998 <_sk_clut_4D_hsw+0x944>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -931,11 +931,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,198,77,0,0 ; vbroadcastss 0x4dc6(%rip),%ymm14 # 5c50 <_sk_callback_hsw+0x1aa>
- DB 196,98,125,24,61,193,77,0,0 ; vbroadcastss 0x4dc1(%rip),%ymm15 # 5c54 <_sk_callback_hsw+0x1ae>
+ DB 196,98,125,24,53,18,91,0,0 ; vbroadcastss 0x5b12(%rip),%ymm14 # 699c <_sk_clut_4D_hsw+0x948>
+ DB 196,98,125,24,61,13,91,0,0 ; vbroadcastss 0x5b0d(%rip),%ymm15 # 69a0 <_sk_clut_4D_hsw+0x94c>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,178,77,0,0 ; vbroadcastss 0x4db2(%rip),%ymm0 # 5c58 <_sk_callback_hsw+0x1b2>
+ DB 196,226,125,24,5,254,90,0,0 ; vbroadcastss 0x5afe(%rip),%ymm0 # 69a4 <_sk_clut_4D_hsw+0x950>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -990,7 +990,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,159,76,0,0 ; vbroadcastss 0x4c9f(%rip),%ymm1 # 5c5c <_sk_callback_hsw+0x1b6>
+ DB 196,226,125,24,13,235,89,0,0 ; vbroadcastss 0x59eb(%rip),%ymm1 # 69a8 <_sk_clut_4D_hsw+0x954>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1018,11 +1018,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,50,76,0,0 ; vbroadcastss 0x4c32(%rip),%ymm13 # 5c60 <_sk_callback_hsw+0x1ba>
- DB 196,98,125,24,53,45,76,0,0 ; vbroadcastss 0x4c2d(%rip),%ymm14 # 5c64 <_sk_callback_hsw+0x1be>
+ DB 196,98,125,24,45,126,89,0,0 ; vbroadcastss 0x597e(%rip),%ymm13 # 69ac <_sk_clut_4D_hsw+0x958>
+ DB 196,98,125,24,53,121,89,0,0 ; vbroadcastss 0x5979(%rip),%ymm14 # 69b0 <_sk_clut_4D_hsw+0x95c>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,30,76,0,0 ; vbroadcastss 0x4c1e(%rip),%ymm15 # 5c68 <_sk_callback_hsw+0x1c2>
+ DB 196,98,125,24,61,106,89,0,0 ; vbroadcastss 0x596a(%rip),%ymm15 # 69b4 <_sk_clut_4D_hsw+0x960>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1078,7 +1078,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,0,75,0,0 ; vbroadcastss 0x4b00(%rip),%ymm0 # 5c6c <_sk_callback_hsw+0x1c6>
+ DB 196,226,125,24,5,76,88,0,0 ; vbroadcastss 0x584c(%rip),%ymm0 # 69b8 <_sk_clut_4D_hsw+0x964>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1106,11 +1106,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,147,74,0,0 ; vbroadcastss 0x4a93(%rip),%ymm13 # 5c70 <_sk_callback_hsw+0x1ca>
- DB 196,98,125,24,53,142,74,0,0 ; vbroadcastss 0x4a8e(%rip),%ymm14 # 5c74 <_sk_callback_hsw+0x1ce>
+ DB 196,98,125,24,45,223,87,0,0 ; vbroadcastss 0x57df(%rip),%ymm13 # 69bc <_sk_clut_4D_hsw+0x968>
+ DB 196,98,125,24,53,218,87,0,0 ; vbroadcastss 0x57da(%rip),%ymm14 # 69c0 <_sk_clut_4D_hsw+0x96c>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,127,74,0,0 ; vbroadcastss 0x4a7f(%rip),%ymm15 # 5c78 <_sk_callback_hsw+0x1d2>
+ DB 196,98,125,24,61,203,87,0,0 ; vbroadcastss 0x57cb(%rip),%ymm15 # 69c4 <_sk_clut_4D_hsw+0x970>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1166,7 +1166,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,97,73,0,0 ; vbroadcastss 0x4961(%rip),%ymm0 # 5c7c <_sk_callback_hsw+0x1d6>
+ DB 196,226,125,24,5,173,86,0,0 ; vbroadcastss 0x56ad(%rip),%ymm0 # 69c8 <_sk_clut_4D_hsw+0x974>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1198,17 +1198,17 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,178,0,0,0 ; jne 1439 <_sk_srcover_rgba_8888_hsw+0xd9>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,196,84,37,45,77,0,0 ; vandps 0x4d2d(%rip),%ymm7,%ymm4 # 60c0 <_sk_callback_hsw+0x61a>
+ DB 197,196,84,37,173,90,0,0 ; vandps 0x5aad(%rip),%ymm7,%ymm4 # 6e40 <_sk_clut_4D_hsw+0xdec>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,64,77,0,0 ; vpshufb 0x4d40(%rip),%ymm7,%ymm5 # 60e0 <_sk_callback_hsw+0x63a>
+ DB 196,226,69,0,45,192,90,0,0 ; vpshufb 0x5ac0(%rip),%ymm7,%ymm5 # 6e60 <_sk_clut_4D_hsw+0xe0c>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,83,77,0,0 ; vpshufb 0x4d53(%rip),%ymm7,%ymm6 # 6100 <_sk_callback_hsw+0x65a>
+ DB 196,226,69,0,53,211,90,0,0 ; vpshufb 0x5ad3(%rip),%ymm7,%ymm6 # 6e80 <_sk_clut_4D_hsw+0xe2c>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,189,72,0,0 ; vbroadcastss 0x48bd(%rip),%ymm8 # 5c80 <_sk_callback_hsw+0x1da>
+ DB 196,98,125,24,5,9,86,0,0 ; vbroadcastss 0x5609(%rip),%ymm8 # 69cc <_sk_clut_4D_hsw+0x978>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,180,72,0,0 ; vbroadcastss 0x48b4(%rip),%ymm9 # 5c84 <_sk_callback_hsw+0x1de>
+ DB 196,98,125,24,13,0,86,0,0 ; vbroadcastss 0x5600(%rip),%ymm9 # 69d0 <_sk_clut_4D_hsw+0x97c>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1264,7 +1264,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,218,71,0,0 ; vbroadcastss 0x47da(%rip),%ymm8 # 5c88 <_sk_callback_hsw+0x1e2>
+ DB 196,98,125,24,5,38,85,0,0 ; vbroadcastss 0x5526(%rip),%ymm8 # 69d4 <_sk_clut_4D_hsw+0x980>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1274,7 +1274,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,189,71,0,0 ; vbroadcastss 0x47bd(%rip),%ymm8 # 5c8c <_sk_callback_hsw+0x1e6>
+ DB 196,98,125,24,5,9,85,0,0 ; vbroadcastss 0x5509(%rip),%ymm8 # 69d8 <_sk_clut_4D_hsw+0x984>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1284,7 +1284,7 @@ _sk_clamp_a_hsw LABEL PROC
PUBLIC _sk_clamp_a_dst_hsw
_sk_clamp_a_dst_hsw LABEL PROC
- DB 196,98,125,24,5,163,71,0,0 ; vbroadcastss 0x47a3(%rip),%ymm8 # 5c90 <_sk_callback_hsw+0x1ea>
+ DB 196,98,125,24,5,239,84,0,0 ; vbroadcastss 0x54ef(%rip),%ymm8 # 69dc <_sk_clut_4D_hsw+0x988>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -1311,7 +1311,7 @@ _sk_swap_rb_hsw LABEL PROC
PUBLIC _sk_invert_hsw
_sk_invert_hsw LABEL PROC
- DB 196,98,125,24,5,98,71,0,0 ; vbroadcastss 0x4762(%rip),%ymm8 # 5c94 <_sk_callback_hsw+0x1ee>
+ DB 196,98,125,24,5,174,84,0,0 ; vbroadcastss 0x54ae(%rip),%ymm8 # 69e0 <_sk_clut_4D_hsw+0x98c>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -1357,7 +1357,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,246,70,0,0 ; vbroadcastss 0x46f6(%rip),%ymm10 # 5c98 <_sk_callback_hsw+0x1f2>
+ DB 196,98,125,24,21,66,84,0,0 ; vbroadcastss 0x5442(%rip),%ymm10 # 69e4 <_sk_clut_4D_hsw+0x990>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1368,16 +1368,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,215,70,0,0 ; vbroadcastss 0x46d7(%rip),%ymm8 # 5c9c <_sk_callback_hsw+0x1f6>
+ DB 196,98,125,24,5,35,84,0,0 ; vbroadcastss 0x5423(%rip),%ymm8 # 69e8 <_sk_clut_4D_hsw+0x994>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,201,70,0,0 ; vbroadcastss 0x46c9(%rip),%ymm11 # 5ca0 <_sk_callback_hsw+0x1fa>
- DB 196,98,125,24,37,196,70,0,0 ; vbroadcastss 0x46c4(%rip),%ymm12 # 5ca4 <_sk_callback_hsw+0x1fe>
+ DB 196,98,125,24,29,21,84,0,0 ; vbroadcastss 0x5415(%rip),%ymm11 # 69ec <_sk_clut_4D_hsw+0x998>
+ DB 196,98,125,24,37,16,84,0,0 ; vbroadcastss 0x5410(%rip),%ymm12 # 69f0 <_sk_clut_4D_hsw+0x99c>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,181,70,0,0 ; vbroadcastss 0x46b5(%rip),%ymm14 # 5ca8 <_sk_callback_hsw+0x202>
+ DB 196,98,125,24,53,1,84,0,0 ; vbroadcastss 0x5401(%rip),%ymm14 # 69f4 <_sk_clut_4D_hsw+0x9a0>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,171,70,0,0 ; vbroadcastss 0x46ab(%rip),%ymm10 # 5cac <_sk_callback_hsw+0x206>
+ DB 196,98,125,24,21,247,83,0,0 ; vbroadcastss 0x53f7(%rip),%ymm10 # 69f8 <_sk_clut_4D_hsw+0x9a4>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1398,16 +1398,16 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_from_srgb_dst_hsw
_sk_from_srgb_dst_hsw LABEL PROC
- DB 196,98,125,24,5,83,70,0,0 ; vbroadcastss 0x4653(%rip),%ymm8 # 5cb0 <_sk_callback_hsw+0x20a>
+ DB 196,98,125,24,5,159,83,0,0 ; vbroadcastss 0x539f(%rip),%ymm8 # 69fc <_sk_clut_4D_hsw+0x9a8>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,69,70,0,0 ; vbroadcastss 0x4645(%rip),%ymm11 # 5cb4 <_sk_callback_hsw+0x20e>
- DB 196,98,125,24,37,64,70,0,0 ; vbroadcastss 0x4640(%rip),%ymm12 # 5cb8 <_sk_callback_hsw+0x212>
+ DB 196,98,125,24,29,145,83,0,0 ; vbroadcastss 0x5391(%rip),%ymm11 # 6a00 <_sk_clut_4D_hsw+0x9ac>
+ DB 196,98,125,24,37,140,83,0,0 ; vbroadcastss 0x538c(%rip),%ymm12 # 6a04 <_sk_clut_4D_hsw+0x9b0>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13
- DB 196,98,125,24,53,49,70,0,0 ; vbroadcastss 0x4631(%rip),%ymm14 # 5cbc <_sk_callback_hsw+0x216>
+ DB 196,98,125,24,53,125,83,0,0 ; vbroadcastss 0x537d(%rip),%ymm14 # 6a08 <_sk_clut_4D_hsw+0x9b4>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,39,70,0,0 ; vbroadcastss 0x4627(%rip),%ymm10 # 5cc0 <_sk_callback_hsw+0x21a>
+ DB 196,98,125,24,21,115,83,0,0 ; vbroadcastss 0x5373(%rip),%ymm10 # 6a0c <_sk_clut_4D_hsw+0x9b8>
DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4
DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -1429,19 +1429,19 @@ _sk_from_srgb_dst_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,203,69,0,0 ; vbroadcastss 0x45cb(%rip),%ymm8 # 5cc4 <_sk_callback_hsw+0x21e>
+ DB 196,98,125,24,5,23,83,0,0 ; vbroadcastss 0x5317(%rip),%ymm8 # 6a10 <_sk_clut_4D_hsw+0x9bc>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,193,69,0,0 ; vbroadcastss 0x45c1(%rip),%ymm11 # 5cc8 <_sk_callback_hsw+0x222>
- DB 196,98,125,24,37,188,69,0,0 ; vbroadcastss 0x45bc(%rip),%ymm12 # 5ccc <_sk_callback_hsw+0x226>
+ DB 196,98,125,24,29,13,83,0,0 ; vbroadcastss 0x530d(%rip),%ymm11 # 6a14 <_sk_clut_4D_hsw+0x9c0>
+ DB 196,98,125,24,37,8,83,0,0 ; vbroadcastss 0x5308(%rip),%ymm12 # 6a18 <_sk_clut_4D_hsw+0x9c4>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,173,69,0,0 ; vbroadcastss 0x45ad(%rip),%ymm14 # 5cd0 <_sk_callback_hsw+0x22a>
+ DB 196,98,125,24,53,249,82,0,0 ; vbroadcastss 0x52f9(%rip),%ymm14 # 6a1c <_sk_clut_4D_hsw+0x9c8>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,163,69,0,0 ; vbroadcastss 0x45a3(%rip),%ymm15 # 5cd4 <_sk_callback_hsw+0x22e>
+ DB 196,98,125,24,61,239,82,0,0 ; vbroadcastss 0x52ef(%rip),%ymm15 # 6a20 <_sk_clut_4D_hsw+0x9cc>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,143,69,0,0 ; vbroadcastss 0x458f(%rip),%ymm13 # 5cd8 <_sk_callback_hsw+0x232>
+ DB 196,98,125,24,45,219,82,0,0 ; vbroadcastss 0x52db(%rip),%ymm13 # 6a24 <_sk_clut_4D_hsw+0x9d0>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1473,26 +1473,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,4,69,0,0 ; vbroadcastss 0x4504(%rip),%ymm11 # 5cdc <_sk_callback_hsw+0x236>
+ DB 196,98,125,24,29,80,82,0,0 ; vbroadcastss 0x5250(%rip),%ymm11 # 6a28 <_sk_clut_4D_hsw+0x9d4>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,241,68,0,0 ; vbroadcastss 0x44f1(%rip),%ymm14 # 5ce0 <_sk_callback_hsw+0x23a>
+ DB 196,98,125,24,53,61,82,0,0 ; vbroadcastss 0x523d(%rip),%ymm14 # 6a2c <_sk_clut_4D_hsw+0x9d8>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,216,68,0,0 ; vbroadcastss 0x44d8(%rip),%ymm14 # 5ce8 <_sk_callback_hsw+0x242>
+ DB 196,98,125,24,53,36,82,0,0 ; vbroadcastss 0x5224(%rip),%ymm14 # 6a34 <_sk_clut_4D_hsw+0x9e0>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,198,68,0,0 ; vbroadcastss 0x44c6(%rip),%ymm14 # 5ce4 <_sk_callback_hsw+0x23e>
+ DB 196,98,125,24,53,18,82,0,0 ; vbroadcastss 0x5212(%rip),%ymm14 # 6a30 <_sk_clut_4D_hsw+0x9dc>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,169,68,0,0 ; vbroadcastss 0x44a9(%rip),%ymm11 # 5cf0 <_sk_callback_hsw+0x24a>
+ DB 196,98,125,24,29,245,81,0,0 ; vbroadcastss 0x51f5(%rip),%ymm11 # 6a3c <_sk_clut_4D_hsw+0x9e8>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1502,7 +1502,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,108,68,0,0 ; vbroadcastss 0x446c(%rip),%ymm8 # 5cec <_sk_callback_hsw+0x246>
+ DB 196,98,125,24,5,184,81,0,0 ; vbroadcastss 0x51b8(%rip),%ymm8 # 6a38 <_sk_clut_4D_hsw+0x9e4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1517,30 +1517,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,51,68,0,0 ; vbroadcastss 0x4433(%rip),%ymm8 # 5cf4 <_sk_callback_hsw+0x24e>
+ DB 196,98,125,24,5,127,81,0,0 ; vbroadcastss 0x517f(%rip),%ymm8 # 6a40 <_sk_clut_4D_hsw+0x9ec>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,22,68,0,0 ; vbroadcastss 0x4416(%rip),%ymm9 # 5cf8 <_sk_callback_hsw+0x252>
+ DB 196,98,125,24,13,98,81,0,0 ; vbroadcastss 0x5162(%rip),%ymm9 # 6a44 <_sk_clut_4D_hsw+0x9f0>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,12,68,0,0 ; vbroadcastss 0x440c(%rip),%ymm11 # 5cfc <_sk_callback_hsw+0x256>
+ DB 196,98,125,24,29,88,81,0,0 ; vbroadcastss 0x5158(%rip),%ymm11 # 6a48 <_sk_clut_4D_hsw+0x9f4>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,246,67,0,0 ; vbroadcastss 0x43f6(%rip),%ymm13 # 5d04 <_sk_callback_hsw+0x25e>
+ DB 196,98,125,24,45,66,81,0,0 ; vbroadcastss 0x5142(%rip),%ymm13 # 6a50 <_sk_clut_4D_hsw+0x9fc>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,236,67,0,0 ; vbroadcastss 0x43ec(%rip),%ymm14 # 5d08 <_sk_callback_hsw+0x262>
+ DB 196,98,125,24,53,56,81,0,0 ; vbroadcastss 0x5138(%rip),%ymm14 # 6a54 <_sk_clut_4D_hsw+0xa00>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,210,67,0,0 ; vbroadcastss 0x43d2(%rip),%ymm3 # 5d00 <_sk_callback_hsw+0x25a>
+ DB 196,226,125,24,29,30,81,0,0 ; vbroadcastss 0x511e(%rip),%ymm3 # 6a4c <_sk_clut_4D_hsw+0x9f8>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,189,67,0,0 ; vbroadcastss 0x43bd(%rip),%ymm12 # 5d0c <_sk_callback_hsw+0x266>
+ DB 196,98,125,24,37,9,81,0,0 ; vbroadcastss 0x5109(%rip),%ymm12 # 6a58 <_sk_clut_4D_hsw+0xa04>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1556,7 +1556,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,105,67,0,0 ; vbroadcastss 0x4369(%rip),%ymm0 # 5d10 <_sk_callback_hsw+0x26a>
+ DB 196,226,125,24,5,181,80,0,0 ; vbroadcastss 0x50b5(%rip),%ymm0 # 6a5c <_sk_clut_4D_hsw+0xa08>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1607,10 +1607,10 @@ _sk_scale_u8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,59 ; jne 1a9e <_sk_scale_u8_hsw+0x54>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,79,73,0,0 ; vpand 0x494f(%rip),%xmm8,%xmm8 # 63c0 <_sk_callback_hsw+0x91a>
+ DB 197,57,219,5,207,86,0,0 ; vpand 0x56cf(%rip),%xmm8,%xmm8 # 7140 <_sk_clut_4D_hsw+0x10ec>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,144,66,0,0 ; vbroadcastss 0x4290(%rip),%ymm9 # 5d14 <_sk_callback_hsw+0x26e>
+ DB 196,98,125,24,13,220,79,0,0 ; vbroadcastss 0x4fdc(%rip),%ymm9 # 6a60 <_sk_clut_4D_hsw+0xa0c>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1660,7 +1660,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf001b48 <_sk_callback_hsw+0xffffffffdeffc0a2>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf001b48 <_sk_clut_4D_hsw+0xffffffffdeffbaf4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -1698,10 +1698,10 @@ _sk_lerp_u8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,79 ; jne 1beb <_sk_lerp_u8_hsw+0x68>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,38,72,0,0 ; vpand 0x4826(%rip),%xmm8,%xmm8 # 63d0 <_sk_callback_hsw+0x92a>
+ DB 197,57,219,5,166,85,0,0 ; vpand 0x55a6(%rip),%xmm8,%xmm8 # 7150 <_sk_clut_4D_hsw+0x10fc>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,91,65,0,0 ; vbroadcastss 0x415b(%rip),%ymm9 # 5d18 <_sk_callback_hsw+0x272>
+ DB 196,98,125,24,13,167,78,0,0 ; vbroadcastss 0x4ea7(%rip),%ymm9 # 6a64 <_sk_clut_4D_hsw+0xa10>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1782,20 +1782,20 @@ _sk_lerp_565_hsw LABEL PROC
DB 15,133,170,0,0,0 ; jne 1d6a <_sk_lerp_565_hsw+0xca>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,72,64,0,0 ; vpbroadcastd 0x4048(%rip),%ymm9 # 5d1c <_sk_callback_hsw+0x276>
+ DB 196,98,125,88,13,148,77,0,0 ; vpbroadcastd 0x4d94(%rip),%ymm9 # 6a68 <_sk_clut_4D_hsw+0xa14>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,57,64,0,0 ; vbroadcastss 0x4039(%rip),%ymm10 # 5d20 <_sk_callback_hsw+0x27a>
+ DB 196,98,125,24,21,133,77,0,0 ; vbroadcastss 0x4d85(%rip),%ymm10 # 6a6c <_sk_clut_4D_hsw+0xa18>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,47,64,0,0 ; vpbroadcastd 0x402f(%rip),%ymm10 # 5d24 <_sk_callback_hsw+0x27e>
+ DB 196,98,125,88,21,123,77,0,0 ; vpbroadcastd 0x4d7b(%rip),%ymm10 # 6a70 <_sk_clut_4D_hsw+0xa1c>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,32,64,0,0 ; vbroadcastss 0x4020(%rip),%ymm11 # 5d28 <_sk_callback_hsw+0x282>
+ DB 196,98,125,24,29,108,77,0,0 ; vbroadcastss 0x4d6c(%rip),%ymm11 # 6a74 <_sk_clut_4D_hsw+0xa20>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,22,64,0,0 ; vpbroadcastd 0x4016(%rip),%ymm11 # 5d2c <_sk_callback_hsw+0x286>
+ DB 196,98,125,88,29,98,77,0,0 ; vpbroadcastd 0x4d62(%rip),%ymm11 # 6a78 <_sk_clut_4D_hsw+0xa24>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,7,64,0,0 ; vbroadcastss 0x4007(%rip),%ymm11 # 5d30 <_sk_callback_hsw+0x28a>
+ DB 196,98,125,24,29,83,77,0,0 ; vbroadcastss 0x4d53(%rip),%ymm11 # 6a7c <_sk_clut_4D_hsw+0xa28>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -1866,21 +1866,21 @@ _sk_load_tables_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,105 ; jne 1e8e <_sk_load_tables_hsw+0x7e>
DB 196,193,124,16,26 ; vmovups (%r10),%ymm3
- DB 197,228,84,13,238,66,0,0 ; vandps 0x42ee(%rip),%ymm3,%ymm1 # 6120 <_sk_callback_hsw+0x67a>
+ DB 197,228,84,13,110,80,0,0 ; vandps 0x506e(%rip),%ymm3,%ymm1 # 6ea0 <_sk_clut_4D_hsw+0xe4c>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 72,139,72,8 ; mov 0x8(%rax),%rcx
DB 76,139,80,16 ; mov 0x10(%rax),%r10
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,226,109,146,4,137 ; vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- DB 196,226,101,0,21,238,66,0,0 ; vpshufb 0x42ee(%rip),%ymm3,%ymm2 # 6140 <_sk_callback_hsw+0x69a>
+ DB 196,226,101,0,21,110,80,0,0 ; vpshufb 0x506e(%rip),%ymm3,%ymm2 # 6ec0 <_sk_clut_4D_hsw+0xe6c>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,246,66,0,0 ; vpshufb 0x42f6(%rip),%ymm3,%ymm9 # 6160 <_sk_callback_hsw+0x6ba>
+ DB 196,98,101,0,13,118,80,0,0 ; vpshufb 0x5076(%rip),%ymm3,%ymm9 # 6ee0 <_sk_clut_4D_hsw+0xe8c>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,178,62,0,0 ; vbroadcastss 0x3eb2(%rip),%ymm8 # 5d34 <_sk_callback_hsw+0x28e>
+ DB 196,98,125,24,5,254,75,0,0 ; vbroadcastss 0x4bfe(%rip),%ymm8 # 6a80 <_sk_clut_4D_hsw+0xa2c>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -1917,7 +1917,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,194,68,0,0 ; vmovdqa 0x44c2(%rip),%xmm10 # 63e0 <_sk_callback_hsw+0x93a>
+ DB 197,121,111,21,66,82,0,0 ; vmovdqa 0x5242(%rip),%xmm10 # 7160 <_sk_clut_4D_hsw+0x110c>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -1939,7 +1939,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,171,61,0,0 ; vbroadcastss 0x3dab(%rip),%ymm8 # 5d38 <_sk_callback_hsw+0x292>
+ DB 196,98,125,24,5,247,74,0,0 ; vbroadcastss 0x4af7(%rip),%ymm8 # 6a84 <_sk_clut_4D_hsw+0xa30>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1997,7 +1997,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,98,67,0,0 ; vmovdqa 0x4362(%rip),%xmm9 # 63f0 <_sk_callback_hsw+0x94a>
+ DB 197,121,111,13,226,80,0,0 ; vmovdqa 0x50e2(%rip),%xmm9 # 7170 <_sk_clut_4D_hsw+0x111c>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -2014,7 +2014,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8
DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,89,60,0,0 ; vbroadcastss 0x3c59(%rip),%ymm3 # 5d3c <_sk_callback_hsw+0x296>
+ DB 196,226,125,24,29,165,73,0,0 ; vbroadcastss 0x49a5(%rip),%ymm3 # 6a88 <_sk_clut_4D_hsw+0xa34>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
@@ -2053,7 +2053,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,161,59,0,0 ; vbroadcastss 0x3ba1(%rip),%ymm8 # 5d40 <_sk_callback_hsw+0x29a>
+ DB 196,98,125,24,5,237,72,0,0 ; vbroadcastss 0x48ed(%rip),%ymm8 # 6a8c <_sk_clut_4D_hsw+0xa38>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -2175,7 +2175,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,70,57,0,0 ; vbroadcastss 0x3946(%rip),%ymm8 # 5d44 <_sk_callback_hsw+0x29e>
+ DB 196,98,125,24,5,146,70,0,0 ; vbroadcastss 0x4692(%rip),%ymm8 # 6a90 <_sk_clut_4D_hsw+0xa3c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2289,7 +2289,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,50,55,0,0 ; vbroadcastss 0x3732(%rip),%ymm8 # 5d48 <_sk_callback_hsw+0x2a2>
+ DB 196,98,125,24,5,126,68,0,0 ; vbroadcastss 0x447e(%rip),%ymm8 # 6a94 <_sk_clut_4D_hsw+0xa40>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2378,33 +2378,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,12,54,0,0 ; vbroadcastss 0x360c(%rip),%ymm12 # 5d4c <_sk_callback_hsw+0x2a6>
- DB 196,98,125,24,45,7,54,0,0 ; vbroadcastss 0x3607(%rip),%ymm13 # 5d50 <_sk_callback_hsw+0x2aa>
+ DB 196,98,125,24,37,88,67,0,0 ; vbroadcastss 0x4358(%rip),%ymm12 # 6a98 <_sk_clut_4D_hsw+0xa44>
+ DB 196,98,125,24,45,83,67,0,0 ; vbroadcastss 0x4353(%rip),%ymm13 # 6a9c <_sk_clut_4D_hsw+0xa48>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,253,53,0,0 ; vbroadcastss 0x35fd(%rip),%ymm13 # 5d54 <_sk_callback_hsw+0x2ae>
+ DB 196,98,125,24,45,73,67,0,0 ; vbroadcastss 0x4349(%rip),%ymm13 # 6aa0 <_sk_clut_4D_hsw+0xa4c>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,243,53,0,0 ; vbroadcastss 0x35f3(%rip),%ymm13 # 5d58 <_sk_callback_hsw+0x2b2>
+ DB 196,98,125,24,45,63,67,0,0 ; vbroadcastss 0x433f(%rip),%ymm13 # 6aa4 <_sk_clut_4D_hsw+0xa50>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,233,53,0,0 ; vbroadcastss 0x35e9(%rip),%ymm11 # 5d5c <_sk_callback_hsw+0x2b6>
+ DB 196,98,125,24,29,53,67,0,0 ; vbroadcastss 0x4335(%rip),%ymm11 # 6aa8 <_sk_clut_4D_hsw+0xa54>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,223,53,0,0 ; vbroadcastss 0x35df(%rip),%ymm12 # 5d60 <_sk_callback_hsw+0x2ba>
+ DB 196,98,125,24,37,43,67,0,0 ; vbroadcastss 0x432b(%rip),%ymm12 # 6aac <_sk_clut_4D_hsw+0xa58>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,213,53,0,0 ; vbroadcastss 0x35d5(%rip),%ymm12 # 5d64 <_sk_callback_hsw+0x2be>
+ DB 196,98,125,24,37,33,67,0,0 ; vbroadcastss 0x4321(%rip),%ymm12 # 6ab0 <_sk_clut_4D_hsw+0xa5c>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,182,53,0,0 ; vbroadcastss 0x35b6(%rip),%ymm11 # 5d68 <_sk_callback_hsw+0x2c2>
+ DB 196,98,125,24,29,2,67,0,0 ; vbroadcastss 0x4302(%rip),%ymm11 # 6ab4 <_sk_clut_4D_hsw+0xa60>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,172,53,0,0 ; vbroadcastss 0x35ac(%rip),%ymm11 # 5d6c <_sk_callback_hsw+0x2c6>
+ DB 196,98,125,24,29,248,66,0,0 ; vbroadcastss 0x42f8(%rip),%ymm11 # 6ab8 <_sk_clut_4D_hsw+0xa64>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,162,53,0,0 ; vbroadcastss 0x35a2(%rip),%ymm0 # 5d70 <_sk_callback_hsw+0x2ca>
+ DB 196,226,125,24,5,238,66,0,0 ; vbroadcastss 0x42ee(%rip),%ymm0 # 6abc <_sk_clut_4D_hsw+0xa68>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,152,53,0,0 ; vbroadcastss 0x3598(%rip),%ymm10 # 5d74 <_sk_callback_hsw+0x2ce>
+ DB 196,98,125,24,21,228,66,0,0 ; vbroadcastss 0x42e4(%rip),%ymm10 # 6ac0 <_sk_clut_4D_hsw+0xa6c>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,139,53,0,0 ; vbroadcastss 0x358b(%rip),%ymm10 # 5d78 <_sk_callback_hsw+0x2d2>
+ DB 196,98,125,24,21,215,66,0,0 ; vbroadcastss 0x42d7(%rip),%ymm10 # 6ac4 <_sk_clut_4D_hsw+0xa70>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2412,7 +2412,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,98,53,0,0 ; vbroadcastss 0x3562(%rip),%ymm8 # 5d7c <_sk_callback_hsw+0x2d6>
+ DB 196,98,125,24,5,174,66,0,0 ; vbroadcastss 0x42ae(%rip),%ymm8 # 6ac8 <_sk_clut_4D_hsw+0xa74>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2430,33 +2430,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,26,53,0,0 ; vbroadcastss 0x351a(%rip),%ymm12 # 5d80 <_sk_callback_hsw+0x2da>
- DB 196,98,125,24,45,21,53,0,0 ; vbroadcastss 0x3515(%rip),%ymm13 # 5d84 <_sk_callback_hsw+0x2de>
+ DB 196,98,125,24,37,102,66,0,0 ; vbroadcastss 0x4266(%rip),%ymm12 # 6acc <_sk_clut_4D_hsw+0xa78>
+ DB 196,98,125,24,45,97,66,0,0 ; vbroadcastss 0x4261(%rip),%ymm13 # 6ad0 <_sk_clut_4D_hsw+0xa7c>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,11,53,0,0 ; vbroadcastss 0x350b(%rip),%ymm13 # 5d88 <_sk_callback_hsw+0x2e2>
+ DB 196,98,125,24,45,87,66,0,0 ; vbroadcastss 0x4257(%rip),%ymm13 # 6ad4 <_sk_clut_4D_hsw+0xa80>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,1,53,0,0 ; vbroadcastss 0x3501(%rip),%ymm13 # 5d8c <_sk_callback_hsw+0x2e6>
+ DB 196,98,125,24,45,77,66,0,0 ; vbroadcastss 0x424d(%rip),%ymm13 # 6ad8 <_sk_clut_4D_hsw+0xa84>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,247,52,0,0 ; vbroadcastss 0x34f7(%rip),%ymm11 # 5d90 <_sk_callback_hsw+0x2ea>
+ DB 196,98,125,24,29,67,66,0,0 ; vbroadcastss 0x4243(%rip),%ymm11 # 6adc <_sk_clut_4D_hsw+0xa88>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,237,52,0,0 ; vbroadcastss 0x34ed(%rip),%ymm12 # 5d94 <_sk_callback_hsw+0x2ee>
+ DB 196,98,125,24,37,57,66,0,0 ; vbroadcastss 0x4239(%rip),%ymm12 # 6ae0 <_sk_clut_4D_hsw+0xa8c>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,227,52,0,0 ; vbroadcastss 0x34e3(%rip),%ymm12 # 5d98 <_sk_callback_hsw+0x2f2>
+ DB 196,98,125,24,37,47,66,0,0 ; vbroadcastss 0x422f(%rip),%ymm12 # 6ae4 <_sk_clut_4D_hsw+0xa90>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,196,52,0,0 ; vbroadcastss 0x34c4(%rip),%ymm11 # 5d9c <_sk_callback_hsw+0x2f6>
+ DB 196,98,125,24,29,16,66,0,0 ; vbroadcastss 0x4210(%rip),%ymm11 # 6ae8 <_sk_clut_4D_hsw+0xa94>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,186,52,0,0 ; vbroadcastss 0x34ba(%rip),%ymm11 # 5da0 <_sk_callback_hsw+0x2fa>
+ DB 196,98,125,24,29,6,66,0,0 ; vbroadcastss 0x4206(%rip),%ymm11 # 6aec <_sk_clut_4D_hsw+0xa98>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,176,52,0,0 ; vbroadcastss 0x34b0(%rip),%ymm1 # 5da4 <_sk_callback_hsw+0x2fe>
+ DB 196,226,125,24,13,252,65,0,0 ; vbroadcastss 0x41fc(%rip),%ymm1 # 6af0 <_sk_clut_4D_hsw+0xa9c>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,166,52,0,0 ; vbroadcastss 0x34a6(%rip),%ymm10 # 5da8 <_sk_callback_hsw+0x302>
+ DB 196,98,125,24,21,242,65,0,0 ; vbroadcastss 0x41f2(%rip),%ymm10 # 6af4 <_sk_clut_4D_hsw+0xaa0>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,153,52,0,0 ; vbroadcastss 0x3499(%rip),%ymm10 # 5dac <_sk_callback_hsw+0x306>
+ DB 196,98,125,24,21,229,65,0,0 ; vbroadcastss 0x41e5(%rip),%ymm10 # 6af8 <_sk_clut_4D_hsw+0xaa4>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2464,7 +2464,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,112,52,0,0 ; vbroadcastss 0x3470(%rip),%ymm8 # 5db0 <_sk_callback_hsw+0x30a>
+ DB 196,98,125,24,5,188,65,0,0 ; vbroadcastss 0x41bc(%rip),%ymm8 # 6afc <_sk_clut_4D_hsw+0xaa8>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2482,33 +2482,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,40,52,0,0 ; vbroadcastss 0x3428(%rip),%ymm12 # 5db4 <_sk_callback_hsw+0x30e>
- DB 196,98,125,24,45,35,52,0,0 ; vbroadcastss 0x3423(%rip),%ymm13 # 5db8 <_sk_callback_hsw+0x312>
+ DB 196,98,125,24,37,116,65,0,0 ; vbroadcastss 0x4174(%rip),%ymm12 # 6b00 <_sk_clut_4D_hsw+0xaac>
+ DB 196,98,125,24,45,111,65,0,0 ; vbroadcastss 0x416f(%rip),%ymm13 # 6b04 <_sk_clut_4D_hsw+0xab0>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,25,52,0,0 ; vbroadcastss 0x3419(%rip),%ymm13 # 5dbc <_sk_callback_hsw+0x316>
+ DB 196,98,125,24,45,101,65,0,0 ; vbroadcastss 0x4165(%rip),%ymm13 # 6b08 <_sk_clut_4D_hsw+0xab4>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,15,52,0,0 ; vbroadcastss 0x340f(%rip),%ymm13 # 5dc0 <_sk_callback_hsw+0x31a>
+ DB 196,98,125,24,45,91,65,0,0 ; vbroadcastss 0x415b(%rip),%ymm13 # 6b0c <_sk_clut_4D_hsw+0xab8>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,5,52,0,0 ; vbroadcastss 0x3405(%rip),%ymm11 # 5dc4 <_sk_callback_hsw+0x31e>
+ DB 196,98,125,24,29,81,65,0,0 ; vbroadcastss 0x4151(%rip),%ymm11 # 6b10 <_sk_clut_4D_hsw+0xabc>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,251,51,0,0 ; vbroadcastss 0x33fb(%rip),%ymm12 # 5dc8 <_sk_callback_hsw+0x322>
+ DB 196,98,125,24,37,71,65,0,0 ; vbroadcastss 0x4147(%rip),%ymm12 # 6b14 <_sk_clut_4D_hsw+0xac0>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,241,51,0,0 ; vbroadcastss 0x33f1(%rip),%ymm12 # 5dcc <_sk_callback_hsw+0x326>
+ DB 196,98,125,24,37,61,65,0,0 ; vbroadcastss 0x413d(%rip),%ymm12 # 6b18 <_sk_clut_4D_hsw+0xac4>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,210,51,0,0 ; vbroadcastss 0x33d2(%rip),%ymm11 # 5dd0 <_sk_callback_hsw+0x32a>
+ DB 196,98,125,24,29,30,65,0,0 ; vbroadcastss 0x411e(%rip),%ymm11 # 6b1c <_sk_clut_4D_hsw+0xac8>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,200,51,0,0 ; vbroadcastss 0x33c8(%rip),%ymm11 # 5dd4 <_sk_callback_hsw+0x32e>
+ DB 196,98,125,24,29,20,65,0,0 ; vbroadcastss 0x4114(%rip),%ymm11 # 6b20 <_sk_clut_4D_hsw+0xacc>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,190,51,0,0 ; vbroadcastss 0x33be(%rip),%ymm2 # 5dd8 <_sk_callback_hsw+0x332>
+ DB 196,226,125,24,21,10,65,0,0 ; vbroadcastss 0x410a(%rip),%ymm2 # 6b24 <_sk_clut_4D_hsw+0xad0>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,180,51,0,0 ; vbroadcastss 0x33b4(%rip),%ymm10 # 5ddc <_sk_callback_hsw+0x336>
+ DB 196,98,125,24,21,0,65,0,0 ; vbroadcastss 0x4100(%rip),%ymm10 # 6b28 <_sk_clut_4D_hsw+0xad4>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,167,51,0,0 ; vbroadcastss 0x33a7(%rip),%ymm10 # 5de0 <_sk_callback_hsw+0x33a>
+ DB 196,98,125,24,21,243,64,0,0 ; vbroadcastss 0x40f3(%rip),%ymm10 # 6b2c <_sk_clut_4D_hsw+0xad8>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2516,7 +2516,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,126,51,0,0 ; vbroadcastss 0x337e(%rip),%ymm8 # 5de4 <_sk_callback_hsw+0x33e>
+ DB 196,98,125,24,5,202,64,0,0 ; vbroadcastss 0x40ca(%rip),%ymm8 # 6b30 <_sk_clut_4D_hsw+0xadc>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2534,33 +2534,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,54,51,0,0 ; vbroadcastss 0x3336(%rip),%ymm12 # 5de8 <_sk_callback_hsw+0x342>
- DB 196,98,125,24,45,49,51,0,0 ; vbroadcastss 0x3331(%rip),%ymm13 # 5dec <_sk_callback_hsw+0x346>
+ DB 196,98,125,24,37,130,64,0,0 ; vbroadcastss 0x4082(%rip),%ymm12 # 6b34 <_sk_clut_4D_hsw+0xae0>
+ DB 196,98,125,24,45,125,64,0,0 ; vbroadcastss 0x407d(%rip),%ymm13 # 6b38 <_sk_clut_4D_hsw+0xae4>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,39,51,0,0 ; vbroadcastss 0x3327(%rip),%ymm13 # 5df0 <_sk_callback_hsw+0x34a>
+ DB 196,98,125,24,45,115,64,0,0 ; vbroadcastss 0x4073(%rip),%ymm13 # 6b3c <_sk_clut_4D_hsw+0xae8>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,29,51,0,0 ; vbroadcastss 0x331d(%rip),%ymm13 # 5df4 <_sk_callback_hsw+0x34e>
+ DB 196,98,125,24,45,105,64,0,0 ; vbroadcastss 0x4069(%rip),%ymm13 # 6b40 <_sk_clut_4D_hsw+0xaec>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,19,51,0,0 ; vbroadcastss 0x3313(%rip),%ymm11 # 5df8 <_sk_callback_hsw+0x352>
+ DB 196,98,125,24,29,95,64,0,0 ; vbroadcastss 0x405f(%rip),%ymm11 # 6b44 <_sk_clut_4D_hsw+0xaf0>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,9,51,0,0 ; vbroadcastss 0x3309(%rip),%ymm12 # 5dfc <_sk_callback_hsw+0x356>
+ DB 196,98,125,24,37,85,64,0,0 ; vbroadcastss 0x4055(%rip),%ymm12 # 6b48 <_sk_clut_4D_hsw+0xaf4>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,255,50,0,0 ; vbroadcastss 0x32ff(%rip),%ymm12 # 5e00 <_sk_callback_hsw+0x35a>
+ DB 196,98,125,24,37,75,64,0,0 ; vbroadcastss 0x404b(%rip),%ymm12 # 6b4c <_sk_clut_4D_hsw+0xaf8>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,224,50,0,0 ; vbroadcastss 0x32e0(%rip),%ymm11 # 5e04 <_sk_callback_hsw+0x35e>
+ DB 196,98,125,24,29,44,64,0,0 ; vbroadcastss 0x402c(%rip),%ymm11 # 6b50 <_sk_clut_4D_hsw+0xafc>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,214,50,0,0 ; vbroadcastss 0x32d6(%rip),%ymm11 # 5e08 <_sk_callback_hsw+0x362>
+ DB 196,98,125,24,29,34,64,0,0 ; vbroadcastss 0x4022(%rip),%ymm11 # 6b54 <_sk_clut_4D_hsw+0xb00>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,204,50,0,0 ; vbroadcastss 0x32cc(%rip),%ymm3 # 5e0c <_sk_callback_hsw+0x366>
+ DB 196,226,125,24,29,24,64,0,0 ; vbroadcastss 0x4018(%rip),%ymm3 # 6b58 <_sk_clut_4D_hsw+0xb04>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,194,50,0,0 ; vbroadcastss 0x32c2(%rip),%ymm10 # 5e10 <_sk_callback_hsw+0x36a>
+ DB 196,98,125,24,21,14,64,0,0 ; vbroadcastss 0x400e(%rip),%ymm10 # 6b5c <_sk_clut_4D_hsw+0xb08>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,181,50,0,0 ; vbroadcastss 0x32b5(%rip),%ymm10 # 5e14 <_sk_callback_hsw+0x36e>
+ DB 196,98,125,24,21,1,64,0,0 ; vbroadcastss 0x4001(%rip),%ymm10 # 6b60 <_sk_clut_4D_hsw+0xb0c>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2568,7 +2568,7 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,140,50,0,0 ; vbroadcastss 0x328c(%rip),%ymm8 # 5e18 <_sk_callback_hsw+0x372>
+ DB 196,98,125,24,5,216,63,0,0 ; vbroadcastss 0x3fd8(%rip),%ymm8 # 6b64 <_sk_clut_4D_hsw+0xb10>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2585,35 +2585,35 @@ _sk_gamma_hsw LABEL PROC
DB 197,252,40,241 ; vmovaps %ymm1,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10
- DB 196,98,125,24,29,73,50,0,0 ; vbroadcastss 0x3249(%rip),%ymm11 # 5e1c <_sk_callback_hsw+0x376>
- DB 196,226,125,24,45,68,50,0,0 ; vbroadcastss 0x3244(%rip),%ymm5 # 5e20 <_sk_callback_hsw+0x37a>
+ DB 196,98,125,24,29,149,63,0,0 ; vbroadcastss 0x3f95(%rip),%ymm11 # 6b68 <_sk_clut_4D_hsw+0xb14>
+ DB 196,226,125,24,45,144,63,0,0 ; vbroadcastss 0x3f90(%rip),%ymm5 # 6b6c <_sk_clut_4D_hsw+0xb18>
DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9
- DB 196,226,125,24,37,59,50,0,0 ; vbroadcastss 0x323b(%rip),%ymm4 # 5e24 <_sk_callback_hsw+0x37e>
+ DB 196,226,125,24,37,135,63,0,0 ; vbroadcastss 0x3f87(%rip),%ymm4 # 6b70 <_sk_clut_4D_hsw+0xb1c>
DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12
- DB 196,98,125,24,45,50,50,0,0 ; vbroadcastss 0x3232(%rip),%ymm13 # 5e28 <_sk_callback_hsw+0x382>
+ DB 196,98,125,24,45,126,63,0,0 ; vbroadcastss 0x3f7e(%rip),%ymm13 # 6b74 <_sk_clut_4D_hsw+0xb20>
DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10
- DB 196,98,125,24,13,40,50,0,0 ; vbroadcastss 0x3228(%rip),%ymm9 # 5e2c <_sk_callback_hsw+0x386>
+ DB 196,98,125,24,13,116,63,0,0 ; vbroadcastss 0x3f74(%rip),%ymm9 # 6b78 <_sk_clut_4D_hsw+0xb24>
DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10
DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14
DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14
DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15
DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15
- DB 196,98,125,24,29,12,50,0,0 ; vbroadcastss 0x320c(%rip),%ymm11 # 5e30 <_sk_callback_hsw+0x38a>
+ DB 196,98,125,24,29,88,63,0,0 ; vbroadcastss 0x3f58(%rip),%ymm11 # 6b7c <_sk_clut_4D_hsw+0xb28>
DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12
- DB 196,98,125,24,45,2,50,0,0 ; vbroadcastss 0x3202(%rip),%ymm13 # 5e34 <_sk_callback_hsw+0x38e>
+ DB 196,98,125,24,45,78,63,0,0 ; vbroadcastss 0x3f4e(%rip),%ymm13 # 6b80 <_sk_clut_4D_hsw+0xb2c>
DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12
DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10
DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8
DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8
- DB 196,226,125,24,21,222,49,0,0 ; vbroadcastss 0x31de(%rip),%ymm2 # 5e38 <_sk_callback_hsw+0x392>
+ DB 196,226,125,24,21,42,63,0,0 ; vbroadcastss 0x3f2a(%rip),%ymm2 # 6b84 <_sk_clut_4D_hsw+0xb30>
DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10
- DB 196,226,125,24,29,213,49,0,0 ; vbroadcastss 0x31d5(%rip),%ymm3 # 5e3c <_sk_callback_hsw+0x396>
+ DB 196,226,125,24,29,33,63,0,0 ; vbroadcastss 0x3f21(%rip),%ymm3 # 6b88 <_sk_clut_4D_hsw+0xb34>
DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10
- DB 196,226,125,24,13,203,49,0,0 ; vbroadcastss 0x31cb(%rip),%ymm1 # 5e40 <_sk_callback_hsw+0x39a>
+ DB 196,226,125,24,13,23,63,0,0 ; vbroadcastss 0x3f17(%rip),%ymm1 # 6b8c <_sk_clut_4D_hsw+0xb38>
DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,5,193,49,0,0 ; vbroadcastss 0x31c1(%rip),%ymm0 # 5e44 <_sk_callback_hsw+0x39e>
+ DB 196,226,125,24,5,13,63,0,0 ; vbroadcastss 0x3f0d(%rip),%ymm0 # 6b90 <_sk_clut_4D_hsw+0xb3c>
DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6
@@ -2644,7 +2644,7 @@ _sk_gamma_hsw LABEL PROC
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
- DB 196,226,125,24,13,50,49,0,0 ; vbroadcastss 0x3132(%rip),%ymm1 # 5e48 <_sk_callback_hsw+0x3a2>
+ DB 196,226,125,24,13,126,62,0,0 ; vbroadcastss 0x3e7e(%rip),%ymm1 # 6b94 <_sk_clut_4D_hsw+0xb40>
DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2
DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3
DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4
@@ -2662,26 +2662,26 @@ _sk_gamma_hsw LABEL PROC
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,234,48,0,0 ; vbroadcastss 0x30ea(%rip),%ymm8 # 5e4c <_sk_callback_hsw+0x3a6>
- DB 196,98,125,24,13,229,48,0,0 ; vbroadcastss 0x30e5(%rip),%ymm9 # 5e50 <_sk_callback_hsw+0x3aa>
- DB 196,98,125,24,21,224,48,0,0 ; vbroadcastss 0x30e0(%rip),%ymm10 # 5e54 <_sk_callback_hsw+0x3ae>
+ DB 196,98,125,24,5,54,62,0,0 ; vbroadcastss 0x3e36(%rip),%ymm8 # 6b98 <_sk_clut_4D_hsw+0xb44>
+ DB 196,98,125,24,13,49,62,0,0 ; vbroadcastss 0x3e31(%rip),%ymm9 # 6b9c <_sk_clut_4D_hsw+0xb48>
+ DB 196,98,125,24,21,44,62,0,0 ; vbroadcastss 0x3e2c(%rip),%ymm10 # 6ba0 <_sk_clut_4D_hsw+0xb4c>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,209,48,0,0 ; vbroadcastss 0x30d1(%rip),%ymm9 # 5e58 <_sk_callback_hsw+0x3b2>
+ DB 196,98,125,24,13,29,62,0,0 ; vbroadcastss 0x3e1d(%rip),%ymm9 # 6ba4 <_sk_clut_4D_hsw+0xb50>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,199,48,0,0 ; vbroadcastss 0x30c7(%rip),%ymm0 # 5e5c <_sk_callback_hsw+0x3b6>
+ DB 196,226,125,24,5,19,62,0,0 ; vbroadcastss 0x3e13(%rip),%ymm0 # 6ba8 <_sk_clut_4D_hsw+0xb54>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,190,48,0,0 ; vbroadcastss 0x30be(%rip),%ymm8 # 5e60 <_sk_callback_hsw+0x3ba>
+ DB 196,98,125,24,5,10,62,0,0 ; vbroadcastss 0x3e0a(%rip),%ymm8 # 6bac <_sk_clut_4D_hsw+0xb58>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,180,48,0,0 ; vbroadcastss 0x30b4(%rip),%ymm9 # 5e64 <_sk_callback_hsw+0x3be>
+ DB 196,98,125,24,13,0,62,0,0 ; vbroadcastss 0x3e00(%rip),%ymm9 # 6bb0 <_sk_clut_4D_hsw+0xb5c>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,161,48,0,0 ; vbroadcastss 0x30a1(%rip),%ymm2 # 5e68 <_sk_callback_hsw+0x3c2>
+ DB 196,226,125,24,21,237,61,0,0 ; vbroadcastss 0x3ded(%rip),%ymm2 # 6bb4 <_sk_clut_4D_hsw+0xb60>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,151,48,0,0 ; vbroadcastss 0x3097(%rip),%ymm11 # 5e6c <_sk_callback_hsw+0x3c6>
+ DB 196,98,125,24,29,227,61,0,0 ; vbroadcastss 0x3de3(%rip),%ymm11 # 6bb8 <_sk_clut_4D_hsw+0xb64>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,141,48,0,0 ; vbroadcastss 0x308d(%rip),%ymm12 # 5e70 <_sk_callback_hsw+0x3ca>
+ DB 196,98,125,24,37,217,61,0,0 ; vbroadcastss 0x3dd9(%rip),%ymm12 # 6bbc <_sk_clut_4D_hsw+0xb68>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2696,9 +2696,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,66,48,0,0 ; vbroadcastss 0x3042(%rip),%ymm0 # 5e74 <_sk_callback_hsw+0x3ce>
+ DB 196,226,125,24,5,142,61,0,0 ; vbroadcastss 0x3d8e(%rip),%ymm0 # 6bc0 <_sk_clut_4D_hsw+0xb6c>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,57,48,0,0 ; vbroadcastss 0x3039(%rip),%ymm8 # 5e78 <_sk_callback_hsw+0x3d2>
+ DB 196,98,125,24,5,133,61,0,0 ; vbroadcastss 0x3d85(%rip),%ymm8 # 6bc4 <_sk_clut_4D_hsw+0xb70>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2715,10 +2715,10 @@ _sk_load_a8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,53 ; jne 2e96 <_sk_load_a8_hsw+0x4e>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,145,53,0,0 ; vpand 0x3591(%rip),%xmm0,%xmm0 # 6400 <_sk_callback_hsw+0x95a>
+ DB 197,249,219,5,17,67,0,0 ; vpand 0x4311(%rip),%xmm0,%xmm0 # 7180 <_sk_clut_4D_hsw+0x112c>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,251,47,0,0 ; vbroadcastss 0x2ffb(%rip),%ymm1 # 5e7c <_sk_callback_hsw+0x3d6>
+ DB 196,226,125,24,13,71,61,0,0 ; vbroadcastss 0x3d47(%rip),%ymm1 # 6bc8 <_sk_clut_4D_hsw+0xb74>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2791,10 +2791,10 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,53 ; jne 2f96 <_sk_load_a8_dst_hsw+0x4e>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,161,52,0,0 ; vpand 0x34a1(%rip),%xmm4,%xmm4 # 6410 <_sk_callback_hsw+0x96a>
+ DB 197,217,219,37,33,66,0,0 ; vpand 0x4221(%rip),%xmm4,%xmm4 # 7190 <_sk_clut_4D_hsw+0x113c>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,255,46,0,0 ; vbroadcastss 0x2eff(%rip),%ymm5 # 5e80 <_sk_callback_hsw+0x3da>
+ DB 196,226,125,24,45,75,60,0,0 ; vbroadcastss 0x3c4b(%rip),%ymm5 # 6bcc <_sk_clut_4D_hsw+0xb78>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -2893,7 +2893,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,134,45,0,0 ; vbroadcastss 0x2d86(%rip),%ymm1 # 5e84 <_sk_callback_hsw+0x3de>
+ DB 196,226,125,24,13,210,58,0,0 ; vbroadcastss 0x3ad2(%rip),%ymm1 # 6bd0 <_sk_clut_4D_hsw+0xb7c>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2910,7 +2910,7 @@ _sk_store_a8_hsw LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,89,45,0,0 ; vbroadcastss 0x2d59(%rip),%ymm8 # 5e88 <_sk_callback_hsw+0x3e2>
+ DB 196,98,125,24,5,165,58,0,0 ; vbroadcastss 0x3aa5(%rip),%ymm8 # 6bd4 <_sk_clut_4D_hsw+0xb80>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -2936,13 +2936,13 @@ _sk_store_a8_hsw LABEL PROC
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
DB 235,201 ; jmp 3154 <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,132,50,0,0 ; vpshufb 0x3284(%rip),%xmm8,%xmm8 # 6420 <_sk_callback_hsw+0x97a>
+ DB 196,98,57,0,5,4,64,0,0 ; vpshufb 0x4004(%rip),%xmm8,%xmm8 # 71a0 <_sk_clut_4D_hsw+0x114c>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
DB 235,175 ; jmp 3154 <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,106,50,0,0 ; vpshufb 0x326a(%rip),%xmm8,%xmm8 # 6430 <_sk_callback_hsw+0x98a>
+ DB 196,98,57,0,5,234,63,0,0 ; vpshufb 0x3fea(%rip),%xmm8,%xmm8 # 71b0 <_sk_clut_4D_hsw+0x115c>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
DB 235,134 ; jmp 3154 <_sk_store_a8_hsw+0x42>
DB 102,144 ; xchg %ax,%ax
@@ -2978,13 +2978,13 @@ _sk_load_g8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,58 ; jne 323f <_sk_load_g8_hsw+0x53>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,45,50,0,0 ; vpand 0x322d(%rip),%xmm0,%xmm0 # 6440 <_sk_callback_hsw+0x99a>
+ DB 197,249,219,5,173,63,0,0 ; vpand 0x3fad(%rip),%xmm0,%xmm0 # 71c0 <_sk_clut_4D_hsw+0x116c>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,103,44,0,0 ; vbroadcastss 0x2c67(%rip),%ymm1 # 5e8c <_sk_callback_hsw+0x3e6>
+ DB 196,226,125,24,13,179,57,0,0 ; vbroadcastss 0x39b3(%rip),%ymm1 # 6bd8 <_sk_clut_4D_hsw+0xb84>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,92,44,0,0 ; vbroadcastss 0x2c5c(%rip),%ymm3 # 5e90 <_sk_callback_hsw+0x3ea>
+ DB 196,226,125,24,29,168,57,0,0 ; vbroadcastss 0x39a8(%rip),%ymm3 # 6bdc <_sk_clut_4D_hsw+0xb88>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -3055,13 +3055,13 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,58 ; jne 3347 <_sk_load_g8_dst_hsw+0x53>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,53,49,0,0 ; vpand 0x3135(%rip),%xmm4,%xmm4 # 6450 <_sk_callback_hsw+0x9aa>
+ DB 197,217,219,37,181,62,0,0 ; vpand 0x3eb5(%rip),%xmm4,%xmm4 # 71d0 <_sk_clut_4D_hsw+0x117c>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,103,43,0,0 ; vbroadcastss 0x2b67(%rip),%ymm5 # 5e94 <_sk_callback_hsw+0x3ee>
+ DB 196,226,125,24,45,179,56,0,0 ; vbroadcastss 0x38b3(%rip),%ymm5 # 6be0 <_sk_clut_4D_hsw+0xb8c>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,92,43,0,0 ; vbroadcastss 0x2b5c(%rip),%ymm7 # 5e98 <_sk_callback_hsw+0x3f2>
+ DB 196,226,125,24,61,168,56,0,0 ; vbroadcastss 0x38a8(%rip),%ymm7 # 6be4 <_sk_clut_4D_hsw+0xb90>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -3158,10 +3158,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,234,41,0,0 ; vbroadcastss 0x29ea(%rip),%ymm1 # 5e9c <_sk_callback_hsw+0x3f6>
+ DB 196,226,125,24,13,54,55,0,0 ; vbroadcastss 0x3736(%rip),%ymm1 # 6be8 <_sk_clut_4D_hsw+0xb94>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,223,41,0,0 ; vbroadcastss 0x29df(%rip),%ymm3 # 5ea0 <_sk_callback_hsw+0x3fa>
+ DB 196,226,125,24,29,43,55,0,0 ; vbroadcastss 0x372b(%rip),%ymm3 # 6bec <_sk_clut_4D_hsw+0xb98>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -3180,23 +3180,23 @@ _sk_load_565_hsw LABEL PROC
DB 117,115 ; jne 355a <_sk_load_565_hsw+0x8f>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,169,41,0,0 ; vpbroadcastd 0x29a9(%rip),%ymm0 # 5ea4 <_sk_callback_hsw+0x3fe>
+ DB 196,226,125,88,5,245,54,0,0 ; vpbroadcastd 0x36f5(%rip),%ymm0 # 6bf0 <_sk_clut_4D_hsw+0xb9c>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,156,41,0,0 ; vbroadcastss 0x299c(%rip),%ymm1 # 5ea8 <_sk_callback_hsw+0x402>
+ DB 196,226,125,24,13,232,54,0,0 ; vbroadcastss 0x36e8(%rip),%ymm1 # 6bf4 <_sk_clut_4D_hsw+0xba0>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,147,41,0,0 ; vpbroadcastd 0x2993(%rip),%ymm1 # 5eac <_sk_callback_hsw+0x406>
+ DB 196,226,125,88,13,223,54,0,0 ; vpbroadcastd 0x36df(%rip),%ymm1 # 6bf8 <_sk_clut_4D_hsw+0xba4>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,134,41,0,0 ; vbroadcastss 0x2986(%rip),%ymm3 # 5eb0 <_sk_callback_hsw+0x40a>
+ DB 196,226,125,24,29,210,54,0,0 ; vbroadcastss 0x36d2(%rip),%ymm3 # 6bfc <_sk_clut_4D_hsw+0xba8>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,125,41,0,0 ; vpbroadcastd 0x297d(%rip),%ymm3 # 5eb4 <_sk_callback_hsw+0x40e>
+ DB 196,226,125,88,29,201,54,0,0 ; vpbroadcastd 0x36c9(%rip),%ymm3 # 6c00 <_sk_clut_4D_hsw+0xbac>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,112,41,0,0 ; vbroadcastss 0x2970(%rip),%ymm3 # 5eb8 <_sk_callback_hsw+0x412>
+ DB 196,226,125,24,29,188,54,0,0 ; vbroadcastss 0x36bc(%rip),%ymm3 # 6c04 <_sk_clut_4D_hsw+0xbb0>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,101,41,0,0 ; vbroadcastss 0x2965(%rip),%ymm3 # 5ebc <_sk_callback_hsw+0x416>
+ DB 196,226,125,24,29,177,54,0,0 ; vbroadcastss 0x36b1(%rip),%ymm3 # 6c08 <_sk_clut_4D_hsw+0xbb4>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3259,23 +3259,23 @@ _sk_load_565_dst_hsw LABEL PROC
DB 117,115 ; jne 368b <_sk_load_565_dst_hsw+0x8f>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6
- DB 196,226,125,88,37,148,40,0,0 ; vpbroadcastd 0x2894(%rip),%ymm4 # 5ec0 <_sk_callback_hsw+0x41a>
+ DB 196,226,125,88,37,224,53,0,0 ; vpbroadcastd 0x35e0(%rip),%ymm4 # 6c0c <_sk_clut_4D_hsw+0xbb8>
DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,135,40,0,0 ; vbroadcastss 0x2887(%rip),%ymm5 # 5ec4 <_sk_callback_hsw+0x41e>
+ DB 196,226,125,24,45,211,53,0,0 ; vbroadcastss 0x35d3(%rip),%ymm5 # 6c10 <_sk_clut_4D_hsw+0xbbc>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,126,40,0,0 ; vpbroadcastd 0x287e(%rip),%ymm5 # 5ec8 <_sk_callback_hsw+0x422>
+ DB 196,226,125,88,45,202,53,0,0 ; vpbroadcastd 0x35ca(%rip),%ymm5 # 6c14 <_sk_clut_4D_hsw+0xbc0>
DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,113,40,0,0 ; vbroadcastss 0x2871(%rip),%ymm7 # 5ecc <_sk_callback_hsw+0x426>
+ DB 196,226,125,24,61,189,53,0,0 ; vbroadcastss 0x35bd(%rip),%ymm7 # 6c18 <_sk_clut_4D_hsw+0xbc4>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,88,61,104,40,0,0 ; vpbroadcastd 0x2868(%rip),%ymm7 # 5ed0 <_sk_callback_hsw+0x42a>
+ DB 196,226,125,88,61,180,53,0,0 ; vpbroadcastd 0x35b4(%rip),%ymm7 # 6c1c <_sk_clut_4D_hsw+0xbc8>
DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,91,40,0,0 ; vbroadcastss 0x285b(%rip),%ymm7 # 5ed4 <_sk_callback_hsw+0x42e>
+ DB 196,226,125,24,61,167,53,0,0 ; vbroadcastss 0x35a7(%rip),%ymm7 # 6c20 <_sk_clut_4D_hsw+0xbcc>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,80,40,0,0 ; vbroadcastss 0x2850(%rip),%ymm7 # 5ed8 <_sk_callback_hsw+0x432>
+ DB 196,226,125,24,61,156,53,0,0 ; vbroadcastss 0x359c(%rip),%ymm7 # 6c24 <_sk_clut_4D_hsw+0xbd0>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3364,23 +3364,23 @@ _sk_gather_565_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,255,38,0,0 ; vpbroadcastd 0x26ff(%rip),%ymm0 # 5edc <_sk_callback_hsw+0x436>
+ DB 196,226,125,88,5,75,52,0,0 ; vpbroadcastd 0x344b(%rip),%ymm0 # 6c28 <_sk_clut_4D_hsw+0xbd4>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,242,38,0,0 ; vbroadcastss 0x26f2(%rip),%ymm1 # 5ee0 <_sk_callback_hsw+0x43a>
+ DB 196,226,125,24,13,62,52,0,0 ; vbroadcastss 0x343e(%rip),%ymm1 # 6c2c <_sk_clut_4D_hsw+0xbd8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,233,38,0,0 ; vpbroadcastd 0x26e9(%rip),%ymm1 # 5ee4 <_sk_callback_hsw+0x43e>
+ DB 196,226,125,88,13,53,52,0,0 ; vpbroadcastd 0x3435(%rip),%ymm1 # 6c30 <_sk_clut_4D_hsw+0xbdc>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,220,38,0,0 ; vbroadcastss 0x26dc(%rip),%ymm3 # 5ee8 <_sk_callback_hsw+0x442>
+ DB 196,226,125,24,29,40,52,0,0 ; vbroadcastss 0x3428(%rip),%ymm3 # 6c34 <_sk_clut_4D_hsw+0xbe0>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,211,38,0,0 ; vpbroadcastd 0x26d3(%rip),%ymm3 # 5eec <_sk_callback_hsw+0x446>
+ DB 196,226,125,88,29,31,52,0,0 ; vpbroadcastd 0x341f(%rip),%ymm3 # 6c38 <_sk_clut_4D_hsw+0xbe4>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,198,38,0,0 ; vbroadcastss 0x26c6(%rip),%ymm3 # 5ef0 <_sk_callback_hsw+0x44a>
+ DB 196,226,125,24,29,18,52,0,0 ; vbroadcastss 0x3412(%rip),%ymm3 # 6c3c <_sk_clut_4D_hsw+0xbe8>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,187,38,0,0 ; vbroadcastss 0x26bb(%rip),%ymm3 # 5ef4 <_sk_callback_hsw+0x44e>
+ DB 196,226,125,24,29,7,52,0,0 ; vbroadcastss 0x3407(%rip),%ymm3 # 6c40 <_sk_clut_4D_hsw+0xbec>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_hsw
@@ -3393,11 +3393,11 @@ _sk_store_565_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,157,38,0,0 ; vbroadcastss 0x269d(%rip),%ymm8 # 5ef8 <_sk_callback_hsw+0x452>
+ DB 196,98,125,24,5,233,51,0,0 ; vbroadcastss 0x33e9(%rip),%ymm8 # 6c44 <_sk_clut_4D_hsw+0xbf0>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,136,38,0,0 ; vbroadcastss 0x2688(%rip),%ymm10 # 5efc <_sk_callback_hsw+0x456>
+ DB 196,98,125,24,21,212,51,0,0 ; vbroadcastss 0x33d4(%rip),%ymm10 # 6c48 <_sk_clut_4D_hsw+0xbf4>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3450,7 +3450,7 @@ _sk_store_565_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003928 <_sk_callback_hsw+0xffffffffe0ffde82>
+ DB 232,255,255,255,224 ; callq ffffffffe1003928 <_sk_clut_4D_hsw+0xffffffffe0ffd8d4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3469,25 +3469,25 @@ _sk_load_4444_hsw LABEL PROC
DB 15,133,139,0,0,0 ; jne 39d7 <_sk_load_4444_hsw+0xab>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,160,37,0,0 ; vpbroadcastd 0x25a0(%rip),%ymm0 # 5f00 <_sk_callback_hsw+0x45a>
+ DB 196,226,125,88,5,236,50,0,0 ; vpbroadcastd 0x32ec(%rip),%ymm0 # 6c4c <_sk_clut_4D_hsw+0xbf8>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,147,37,0,0 ; vbroadcastss 0x2593(%rip),%ymm1 # 5f04 <_sk_callback_hsw+0x45e>
+ DB 196,226,125,24,13,223,50,0,0 ; vbroadcastss 0x32df(%rip),%ymm1 # 6c50 <_sk_clut_4D_hsw+0xbfc>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,138,37,0,0 ; vpbroadcastd 0x258a(%rip),%ymm1 # 5f08 <_sk_callback_hsw+0x462>
+ DB 196,226,125,88,13,214,50,0,0 ; vpbroadcastd 0x32d6(%rip),%ymm1 # 6c54 <_sk_clut_4D_hsw+0xc00>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,125,37,0,0 ; vbroadcastss 0x257d(%rip),%ymm2 # 5f0c <_sk_callback_hsw+0x466>
+ DB 196,226,125,24,21,201,50,0,0 ; vbroadcastss 0x32c9(%rip),%ymm2 # 6c58 <_sk_clut_4D_hsw+0xc04>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,116,37,0,0 ; vpbroadcastd 0x2574(%rip),%ymm2 # 5f10 <_sk_callback_hsw+0x46a>
+ DB 196,226,125,88,21,192,50,0,0 ; vpbroadcastd 0x32c0(%rip),%ymm2 # 6c5c <_sk_clut_4D_hsw+0xc08>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,103,37,0,0 ; vbroadcastss 0x2567(%rip),%ymm8 # 5f14 <_sk_callback_hsw+0x46e>
+ DB 196,98,125,24,5,179,50,0,0 ; vbroadcastss 0x32b3(%rip),%ymm8 # 6c60 <_sk_clut_4D_hsw+0xc0c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,93,37,0,0 ; vpbroadcastd 0x255d(%rip),%ymm8 # 5f18 <_sk_callback_hsw+0x472>
+ DB 196,98,125,88,5,169,50,0,0 ; vpbroadcastd 0x32a9(%rip),%ymm8 # 6c64 <_sk_clut_4D_hsw+0xc10>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,79,37,0,0 ; vbroadcastss 0x254f(%rip),%ymm8 # 5f1c <_sk_callback_hsw+0x476>
+ DB 196,98,125,24,5,155,50,0,0 ; vbroadcastss 0x329b(%rip),%ymm8 # 6c68 <_sk_clut_4D_hsw+0xc14>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3553,25 +3553,25 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 15,133,139,0,0,0 ; jne 3b23 <_sk_load_4444_dst_hsw+0xab>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7
- DB 196,226,125,88,37,116,36,0,0 ; vpbroadcastd 0x2474(%rip),%ymm4 # 5f20 <_sk_callback_hsw+0x47a>
+ DB 196,226,125,88,37,192,49,0,0 ; vpbroadcastd 0x31c0(%rip),%ymm4 # 6c6c <_sk_clut_4D_hsw+0xc18>
DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,103,36,0,0 ; vbroadcastss 0x2467(%rip),%ymm5 # 5f24 <_sk_callback_hsw+0x47e>
+ DB 196,226,125,24,45,179,49,0,0 ; vbroadcastss 0x31b3(%rip),%ymm5 # 6c70 <_sk_clut_4D_hsw+0xc1c>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,94,36,0,0 ; vpbroadcastd 0x245e(%rip),%ymm5 # 5f28 <_sk_callback_hsw+0x482>
+ DB 196,226,125,88,45,170,49,0,0 ; vpbroadcastd 0x31aa(%rip),%ymm5 # 6c74 <_sk_clut_4D_hsw+0xc20>
DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,81,36,0,0 ; vbroadcastss 0x2451(%rip),%ymm6 # 5f2c <_sk_callback_hsw+0x486>
+ DB 196,226,125,24,53,157,49,0,0 ; vbroadcastss 0x319d(%rip),%ymm6 # 6c78 <_sk_clut_4D_hsw+0xc24>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,88,53,72,36,0,0 ; vpbroadcastd 0x2448(%rip),%ymm6 # 5f30 <_sk_callback_hsw+0x48a>
+ DB 196,226,125,88,53,148,49,0,0 ; vpbroadcastd 0x3194(%rip),%ymm6 # 6c7c <_sk_clut_4D_hsw+0xc28>
DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,59,36,0,0 ; vbroadcastss 0x243b(%rip),%ymm8 # 5f34 <_sk_callback_hsw+0x48e>
+ DB 196,98,125,24,5,135,49,0,0 ; vbroadcastss 0x3187(%rip),%ymm8 # 6c80 <_sk_clut_4D_hsw+0xc2c>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,49,36,0,0 ; vpbroadcastd 0x2431(%rip),%ymm8 # 5f38 <_sk_callback_hsw+0x492>
+ DB 196,98,125,88,5,125,49,0,0 ; vpbroadcastd 0x317d(%rip),%ymm8 # 6c84 <_sk_clut_4D_hsw+0xc30>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,35,36,0,0 ; vbroadcastss 0x2423(%rip),%ymm8 # 5f3c <_sk_callback_hsw+0x496>
+ DB 196,98,125,24,5,111,49,0,0 ; vbroadcastss 0x316f(%rip),%ymm8 # 6c88 <_sk_clut_4D_hsw+0xc34>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3662,25 +3662,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,203,34,0,0 ; vpbroadcastd 0x22cb(%rip),%ymm0 # 5f40 <_sk_callback_hsw+0x49a>
+ DB 196,226,125,88,5,23,48,0,0 ; vpbroadcastd 0x3017(%rip),%ymm0 # 6c8c <_sk_clut_4D_hsw+0xc38>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,190,34,0,0 ; vbroadcastss 0x22be(%rip),%ymm1 # 5f44 <_sk_callback_hsw+0x49e>
+ DB 196,226,125,24,13,10,48,0,0 ; vbroadcastss 0x300a(%rip),%ymm1 # 6c90 <_sk_clut_4D_hsw+0xc3c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,181,34,0,0 ; vpbroadcastd 0x22b5(%rip),%ymm1 # 5f48 <_sk_callback_hsw+0x4a2>
+ DB 196,226,125,88,13,1,48,0,0 ; vpbroadcastd 0x3001(%rip),%ymm1 # 6c94 <_sk_clut_4D_hsw+0xc40>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,168,34,0,0 ; vbroadcastss 0x22a8(%rip),%ymm2 # 5f4c <_sk_callback_hsw+0x4a6>
+ DB 196,226,125,24,21,244,47,0,0 ; vbroadcastss 0x2ff4(%rip),%ymm2 # 6c98 <_sk_clut_4D_hsw+0xc44>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,159,34,0,0 ; vpbroadcastd 0x229f(%rip),%ymm2 # 5f50 <_sk_callback_hsw+0x4aa>
+ DB 196,226,125,88,21,235,47,0,0 ; vpbroadcastd 0x2feb(%rip),%ymm2 # 6c9c <_sk_clut_4D_hsw+0xc48>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,146,34,0,0 ; vbroadcastss 0x2292(%rip),%ymm8 # 5f54 <_sk_callback_hsw+0x4ae>
+ DB 196,98,125,24,5,222,47,0,0 ; vbroadcastss 0x2fde(%rip),%ymm8 # 6ca0 <_sk_clut_4D_hsw+0xc4c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,136,34,0,0 ; vpbroadcastd 0x2288(%rip),%ymm8 # 5f58 <_sk_callback_hsw+0x4b2>
+ DB 196,98,125,88,5,212,47,0,0 ; vpbroadcastd 0x2fd4(%rip),%ymm8 # 6ca4 <_sk_clut_4D_hsw+0xc50>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,122,34,0,0 ; vbroadcastss 0x227a(%rip),%ymm8 # 5f5c <_sk_callback_hsw+0x4b6>
+ DB 196,98,125,24,5,198,47,0,0 ; vbroadcastss 0x2fc6(%rip),%ymm8 # 6ca8 <_sk_clut_4D_hsw+0xc54>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3695,7 +3695,7 @@ _sk_store_4444_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,85,34,0,0 ; vbroadcastss 0x2255(%rip),%ymm8 # 5f60 <_sk_callback_hsw+0x4ba>
+ DB 196,98,125,24,5,161,47,0,0 ; vbroadcastss 0x2fa1(%rip),%ymm8 # 6cac <_sk_clut_4D_hsw+0xc58>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3755,7 +3755,7 @@ _sk_store_4444_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003de4 <_sk_callback_hsw+0xffffffffe0ffe33e>
+ DB 232,255,255,255,224 ; callq ffffffffe1003de4 <_sk_clut_4D_hsw+0xffffffffe0ffdd90>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3774,14 +3774,14 @@ _sk_load_8888_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,87 ; jne 3e62 <_sk_load_8888_hsw+0x7a>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,228,84,5,105,35,0,0 ; vandps 0x2369(%rip),%ymm3,%ymm0 # 6180 <_sk_callback_hsw+0x6da>
+ DB 197,228,84,5,233,48,0,0 ; vandps 0x30e9(%rip),%ymm3,%ymm0 # 6f00 <_sk_clut_4D_hsw+0xeac>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,64,33,0,0 ; vbroadcastss 0x2140(%rip),%ymm8 # 5f64 <_sk_callback_hsw+0x4be>
+ DB 196,98,125,24,5,140,46,0,0 ; vbroadcastss 0x2e8c(%rip),%ymm8 # 6cb0 <_sk_clut_4D_hsw+0xc5c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,110,35,0,0 ; vpshufb 0x236e(%rip),%ymm3,%ymm1 # 61a0 <_sk_callback_hsw+0x6fa>
+ DB 196,226,101,0,13,238,48,0,0 ; vpshufb 0x30ee(%rip),%ymm3,%ymm1 # 6f20 <_sk_clut_4D_hsw+0xecc>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,124,35,0,0 ; vpshufb 0x237c(%rip),%ymm3,%ymm2 # 61c0 <_sk_callback_hsw+0x71a>
+ DB 196,226,101,0,21,252,48,0,0 ; vpshufb 0x30fc(%rip),%ymm3,%ymm2 # 6f40 <_sk_clut_4D_hsw+0xeec>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3814,14 +3814,14 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,87 ; jne 3f02 <_sk_load_8888_dst_hsw+0x7a>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,196,84,37,41,35,0,0 ; vandps 0x2329(%rip),%ymm7,%ymm4 # 61e0 <_sk_callback_hsw+0x73a>
+ DB 197,196,84,37,169,48,0,0 ; vandps 0x30a9(%rip),%ymm7,%ymm4 # 6f60 <_sk_clut_4D_hsw+0xf0c>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,164,32,0,0 ; vbroadcastss 0x20a4(%rip),%ymm8 # 5f68 <_sk_callback_hsw+0x4c2>
+ DB 196,98,125,24,5,240,45,0,0 ; vbroadcastss 0x2df0(%rip),%ymm8 # 6cb4 <_sk_clut_4D_hsw+0xc60>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
- DB 196,226,69,0,45,46,35,0,0 ; vpshufb 0x232e(%rip),%ymm7,%ymm5 # 6200 <_sk_callback_hsw+0x75a>
+ DB 196,226,69,0,45,174,48,0,0 ; vpshufb 0x30ae(%rip),%ymm7,%ymm5 # 6f80 <_sk_clut_4D_hsw+0xf2c>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5
- DB 196,226,69,0,53,60,35,0,0 ; vpshufb 0x233c(%rip),%ymm7,%ymm6 # 6220 <_sk_callback_hsw+0x77a>
+ DB 196,226,69,0,53,188,48,0,0 ; vpshufb 0x30bc(%rip),%ymm7,%ymm6 # 6fa0 <_sk_clut_4D_hsw+0xf4c>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -3851,14 +3851,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,234,34,0,0 ; vpand 0x22ea(%rip),%ymm3,%ymm0 # 6240 <_sk_callback_hsw+0x79a>
+ DB 197,229,219,5,106,48,0,0 ; vpand 0x306a(%rip),%ymm3,%ymm0 # 6fc0 <_sk_clut_4D_hsw+0xf6c>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,9,32,0,0 ; vbroadcastss 0x2009(%rip),%ymm8 # 5f6c <_sk_callback_hsw+0x4c6>
+ DB 196,98,125,24,5,85,45,0,0 ; vbroadcastss 0x2d55(%rip),%ymm8 # 6cb8 <_sk_clut_4D_hsw+0xc64>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,239,34,0,0 ; vpshufb 0x22ef(%rip),%ymm3,%ymm1 # 6260 <_sk_callback_hsw+0x7ba>
+ DB 196,226,101,0,13,111,48,0,0 ; vpshufb 0x306f(%rip),%ymm3,%ymm1 # 6fe0 <_sk_clut_4D_hsw+0xf8c>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,253,34,0,0 ; vpshufb 0x22fd(%rip),%ymm3,%ymm2 # 6280 <_sk_callback_hsw+0x7da>
+ DB 196,226,101,0,21,125,48,0,0 ; vpshufb 0x307d(%rip),%ymm3,%ymm2 # 7000 <_sk_clut_4D_hsw+0xfac>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3878,7 +3878,7 @@ _sk_store_8888_hsw LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,171,31,0,0 ; vbroadcastss 0x1fab(%rip),%ymm8 # 5f70 <_sk_callback_hsw+0x4ca>
+ DB 196,98,125,24,5,247,44,0,0 ; vbroadcastss 0x2cf7(%rip),%ymm8 # 6cbc <_sk_clut_4D_hsw+0xc68>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -3923,14 +3923,14 @@ _sk_load_bgra_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,87 ; jne 40be <_sk_load_bgra_hsw+0x7a>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,228,84,5,45,34,0,0 ; vandps 0x222d(%rip),%ymm3,%ymm0 # 62a0 <_sk_callback_hsw+0x7fa>
+ DB 197,228,84,5,173,47,0,0 ; vandps 0x2fad(%rip),%ymm3,%ymm0 # 7020 <_sk_clut_4D_hsw+0xfcc>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,244,30,0,0 ; vbroadcastss 0x1ef4(%rip),%ymm8 # 5f74 <_sk_callback_hsw+0x4ce>
+ DB 196,98,125,24,5,64,44,0,0 ; vbroadcastss 0x2c40(%rip),%ymm8 # 6cc0 <_sk_clut_4D_hsw+0xc6c>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,50,34,0,0 ; vpshufb 0x2232(%rip),%ymm3,%ymm0 # 62c0 <_sk_callback_hsw+0x81a>
+ DB 196,226,101,0,5,178,47,0,0 ; vpshufb 0x2fb2(%rip),%ymm3,%ymm0 # 7040 <_sk_clut_4D_hsw+0xfec>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,64,34,0,0 ; vpshufb 0x2240(%rip),%ymm3,%ymm0 # 62e0 <_sk_callback_hsw+0x83a>
+ DB 196,226,101,0,5,192,47,0,0 ; vpshufb 0x2fc0(%rip),%ymm3,%ymm0 # 7060 <_sk_clut_4D_hsw+0x100c>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3963,14 +3963,14 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,87 ; jne 415e <_sk_load_bgra_dst_hsw+0x7a>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,196,84,37,237,33,0,0 ; vandps 0x21ed(%rip),%ymm7,%ymm4 # 6300 <_sk_callback_hsw+0x85a>
+ DB 197,196,84,37,109,47,0,0 ; vandps 0x2f6d(%rip),%ymm7,%ymm4 # 7080 <_sk_clut_4D_hsw+0x102c>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,88,30,0,0 ; vbroadcastss 0x1e58(%rip),%ymm8 # 5f78 <_sk_callback_hsw+0x4d2>
+ DB 196,98,125,24,5,164,43,0,0 ; vbroadcastss 0x2ba4(%rip),%ymm8 # 6cc4 <_sk_clut_4D_hsw+0xc70>
DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6
- DB 196,226,69,0,37,242,33,0,0 ; vpshufb 0x21f2(%rip),%ymm7,%ymm4 # 6320 <_sk_callback_hsw+0x87a>
+ DB 196,226,69,0,37,114,47,0,0 ; vpshufb 0x2f72(%rip),%ymm7,%ymm4 # 70a0 <_sk_clut_4D_hsw+0x104c>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5
- DB 196,226,69,0,37,0,34,0,0 ; vpshufb 0x2200(%rip),%ymm7,%ymm4 # 6340 <_sk_callback_hsw+0x89a>
+ DB 196,226,69,0,37,128,47,0,0 ; vpshufb 0x2f80(%rip),%ymm7,%ymm4 # 70c0 <_sk_clut_4D_hsw+0x106c>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4000,14 +4000,14 @@ _sk_gather_bgra_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,174,33,0,0 ; vpand 0x21ae(%rip),%ymm3,%ymm0 # 6360 <_sk_callback_hsw+0x8ba>
+ DB 197,229,219,5,46,47,0,0 ; vpand 0x2f2e(%rip),%ymm3,%ymm0 # 70e0 <_sk_clut_4D_hsw+0x108c>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,189,29,0,0 ; vbroadcastss 0x1dbd(%rip),%ymm8 # 5f7c <_sk_callback_hsw+0x4d6>
+ DB 196,98,125,24,5,9,43,0,0 ; vbroadcastss 0x2b09(%rip),%ymm8 # 6cc8 <_sk_clut_4D_hsw+0xc74>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,179,33,0,0 ; vpshufb 0x21b3(%rip),%ymm3,%ymm0 # 6380 <_sk_callback_hsw+0x8da>
+ DB 196,226,101,0,5,51,47,0,0 ; vpshufb 0x2f33(%rip),%ymm3,%ymm0 # 7100 <_sk_clut_4D_hsw+0x10ac>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,193,33,0,0 ; vpshufb 0x21c1(%rip),%ymm3,%ymm0 # 63a0 <_sk_callback_hsw+0x8fa>
+ DB 196,226,101,0,5,65,47,0,0 ; vpshufb 0x2f41(%rip),%ymm3,%ymm0 # 7120 <_sk_clut_4D_hsw+0x10cc>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4027,7 +4027,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,95,29,0,0 ; vbroadcastss 0x1d5f(%rip),%ymm8 # 5f80 <_sk_callback_hsw+0x4da>
+ DB 196,98,125,24,5,171,42,0,0 ; vbroadcastss 0x2aab(%rip),%ymm8 # 6ccc <_sk_clut_4D_hsw+0xc78>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4291,7 +4291,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,15,25,0,0 ; vbroadcastss 0x190f(%rip),%ymm10 # 5f84 <_sk_callback_hsw+0x4de>
+ DB 196,98,125,24,21,91,38,0,0 ; vbroadcastss 0x265b(%rip),%ymm10 # 6cd0 <_sk_clut_4D_hsw+0xc7c>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4380,7 +4380,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,135,23,0,0 ; vbroadcastss 0x1787(%rip),%ymm10 # 5f88 <_sk_callback_hsw+0x4e2>
+ DB 196,98,125,24,21,211,36,0,0 ; vbroadcastss 0x24d3(%rip),%ymm10 # 6cd4 <_sk_clut_4D_hsw+0xc80>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4397,7 +4397,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,59,23,0,0 ; vbroadcastss 0x173b(%rip),%ymm3 # 5f8c <_sk_callback_hsw+0x4e6>
+ DB 196,226,125,24,29,135,36,0,0 ; vbroadcastss 0x2487(%rip),%ymm3 # 6cd8 <_sk_clut_4D_hsw+0xc84>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
@@ -4443,7 +4443,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,103,22,0,0 ; vbroadcastss 0x1667(%rip),%ymm8 # 5f90 <_sk_callback_hsw+0x4ea>
+ DB 196,98,125,24,5,179,35,0,0 ; vbroadcastss 0x23b3(%rip),%ymm8 # 6cdc <_sk_clut_4D_hsw+0xc88>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -4730,7 +4730,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,227,17,0,0 ; vmulss 0x11e3(%rip),%xmm9,%xmm0 # 5f94 <_sk_callback_hsw+0x4ee>
+ DB 197,178,89,5,47,31,0,0 ; vmulss 0x1f2f(%rip),%xmm9,%xmm0 # 6ce0 <_sk_clut_4D_hsw+0xc8c>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -4755,7 +4755,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,131,17,0,0 ; vmulss 0x1183(%rip),%xmm9,%xmm1 # 5f98 <_sk_callback_hsw+0x4f2>
+ DB 197,178,89,13,207,30,0,0 ; vmulss 0x1ecf(%rip),%xmm9,%xmm1 # 6ce4 <_sk_clut_4D_hsw+0xc90>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -4775,7 +4775,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,56,17,0,0 ; vbroadcastss 0x1138(%rip),%ymm8 # 5f9c <_sk_callback_hsw+0x4f6>
+ DB 196,98,125,24,5,132,30,0,0 ; vbroadcastss 0x1e84(%rip),%ymm8 # 6ce8 <_sk_clut_4D_hsw+0xc94>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -4789,9 +4789,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,27,17,0,0 ; vbroadcastss 0x111b(%rip),%ymm8 # 5fa0 <_sk_callback_hsw+0x4fa>
+ DB 196,98,125,24,5,103,30,0,0 ; vbroadcastss 0x1e67(%rip),%ymm8 # 6cec <_sk_clut_4D_hsw+0xc98>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,17,17,0,0 ; vbroadcastss 0x1111(%rip),%ymm9 # 5fa4 <_sk_callback_hsw+0x4fe>
+ DB 196,98,125,24,13,93,30,0,0 ; vbroadcastss 0x1e5d(%rip),%ymm9 # 6cf0 <_sk_clut_4D_hsw+0xc9c>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -4805,11 +4805,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,225,16,0,0 ; vbroadcastss 0x10e1(%rip),%ymm3 # 5fa8 <_sk_callback_hsw+0x502>
- DB 196,98,125,24,5,220,16,0,0 ; vbroadcastss 0x10dc(%rip),%ymm8 # 5fac <_sk_callback_hsw+0x506>
+ DB 196,226,125,24,29,45,30,0,0 ; vbroadcastss 0x1e2d(%rip),%ymm3 # 6cf4 <_sk_clut_4D_hsw+0xca0>
+ DB 196,98,125,24,5,40,30,0,0 ; vbroadcastss 0x1e28(%rip),%ymm8 # 6cf8 <_sk_clut_4D_hsw+0xca4>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,205,16,0,0 ; vbroadcastss 0x10cd(%rip),%ymm3 # 5fb0 <_sk_callback_hsw+0x50a>
+ DB 196,226,125,24,29,25,30,0,0 ; vbroadcastss 0x1e19(%rip),%ymm3 # 6cfc <_sk_clut_4D_hsw+0xca8>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -5057,14 +5057,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,213,12,0,0 ; vbroadcastss 0xcd5(%rip),%ymm0 # 5fb4 <_sk_callback_hsw+0x50e>
- DB 196,226,125,24,13,208,12,0,0 ; vbroadcastss 0xcd0(%rip),%ymm1 # 5fb8 <_sk_callback_hsw+0x512>
+ DB 196,226,125,24,5,33,26,0,0 ; vbroadcastss 0x1a21(%rip),%ymm0 # 6d00 <_sk_clut_4D_hsw+0xcac>
+ DB 196,226,125,24,13,28,26,0,0 ; vbroadcastss 0x1a1c(%rip),%ymm1 # 6d04 <_sk_clut_4D_hsw+0xcb0>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,198,12,0,0 ; vbroadcastss 0xcc6(%rip),%ymm0 # 5fbc <_sk_callback_hsw+0x516>
+ DB 196,226,125,24,5,18,26,0,0 ; vbroadcastss 0x1a12(%rip),%ymm0 # 6d08 <_sk_clut_4D_hsw+0xcb4>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,188,12,0,0 ; vbroadcastss 0xcbc(%rip),%ymm1 # 5fc0 <_sk_callback_hsw+0x51a>
+ DB 196,226,125,24,13,8,26,0,0 ; vbroadcastss 0x1a08(%rip),%ymm1 # 6d0c <_sk_clut_4D_hsw+0xcb8>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,178,12,0,0 ; vbroadcastss 0xcb2(%rip),%ymm0 # 5fc4 <_sk_callback_hsw+0x51e>
+ DB 196,226,125,24,5,254,25,0,0 ; vbroadcastss 0x19fe(%rip),%ymm0 # 6d10 <_sk_clut_4D_hsw+0xcbc>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -5081,7 +5081,7 @@ _sk_gradient_hsw LABEL PROC
DB 76,139,80,72 ; mov 0x48(%rax),%r10
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,187,1,0,0,0 ; mov $0x1,%r11d
- DB 196,226,125,24,21,123,12,0,0 ; vbroadcastss 0xc7b(%rip),%ymm2 # 5fc8 <_sk_callback_hsw+0x522>
+ DB 196,226,125,24,21,199,25,0,0 ; vbroadcastss 0x19c7(%rip),%ymm2 # 6d14 <_sk_clut_4D_hsw+0xcc0>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -5172,24 +5172,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,250,10,0,0 ; vbroadcastss 0xafa(%rip),%ymm13 # 5fcc <_sk_callback_hsw+0x526>
- DB 196,98,125,24,53,245,10,0,0 ; vbroadcastss 0xaf5(%rip),%ymm14 # 5fd0 <_sk_callback_hsw+0x52a>
+ DB 196,98,125,24,45,70,24,0,0 ; vbroadcastss 0x1846(%rip),%ymm13 # 6d18 <_sk_clut_4D_hsw+0xcc4>
+ DB 196,98,125,24,53,65,24,0,0 ; vbroadcastss 0x1841(%rip),%ymm14 # 6d1c <_sk_clut_4D_hsw+0xcc8>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,235,10,0,0 ; vbroadcastss 0xaeb(%rip),%ymm13 # 5fd4 <_sk_callback_hsw+0x52e>
+ DB 196,98,125,24,45,55,24,0,0 ; vbroadcastss 0x1837(%rip),%ymm13 # 6d20 <_sk_clut_4D_hsw+0xccc>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,225,10,0,0 ; vbroadcastss 0xae1(%rip),%ymm14 # 5fd8 <_sk_callback_hsw+0x532>
+ DB 196,98,125,24,53,45,24,0,0 ; vbroadcastss 0x182d(%rip),%ymm14 # 6d24 <_sk_clut_4D_hsw+0xcd0>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,204,10,0,0 ; vbroadcastss 0xacc(%rip),%ymm10 # 5fdc <_sk_callback_hsw+0x536>
+ DB 196,98,125,24,21,24,24,0,0 ; vbroadcastss 0x1818(%rip),%ymm10 # 6d28 <_sk_clut_4D_hsw+0xcd4>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,182,10,0,0 ; vbroadcastss 0xab6(%rip),%ymm10 # 5fe0 <_sk_callback_hsw+0x53a>
+ DB 196,98,125,24,21,2,24,0,0 ; vbroadcastss 0x1802(%rip),%ymm10 # 6d2c <_sk_clut_4D_hsw+0xcd8>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,160,10,0,0 ; vbroadcastss 0xaa0(%rip),%ymm10 # 5fe4 <_sk_callback_hsw+0x53e>
+ DB 196,98,125,24,21,236,23,0,0 ; vbroadcastss 0x17ec(%rip),%ymm10 # 6d30 <_sk_clut_4D_hsw+0xcdc>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -5213,23 +5213,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,84,10,0,0 ; vbroadcastss 0xa54(%rip),%ymm11 # 5fe8 <_sk_callback_hsw+0x542>
+ DB 196,98,125,24,29,160,23,0,0 ; vbroadcastss 0x17a0(%rip),%ymm11 # 6d34 <_sk_clut_4D_hsw+0xce0>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,51,10,0,0 ; vbroadcastss 0xa33(%rip),%ymm9 # 5fec <_sk_callback_hsw+0x546>
+ DB 196,98,125,24,13,127,23,0,0 ; vbroadcastss 0x177f(%rip),%ymm9 # 6d38 <_sk_clut_4D_hsw+0xce4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,22,10,0,0 ; vbroadcastss 0xa16(%rip),%ymm9 # 5ff0 <_sk_callback_hsw+0x54a>
+ DB 196,98,125,24,13,98,23,0,0 ; vbroadcastss 0x1762(%rip),%ymm9 # 6d3c <_sk_clut_4D_hsw+0xce8>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,7,10,0,0 ; vbroadcastss 0xa07(%rip),%ymm11 # 5ff4 <_sk_callback_hsw+0x54e>
+ DB 196,98,125,24,29,83,23,0,0 ; vbroadcastss 0x1753(%rip),%ymm11 # 6d40 <_sk_clut_4D_hsw+0xcec>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5246,23 +5246,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,204,9,0,0 ; vbroadcastss 0x9cc(%rip),%ymm11 # 5ff8 <_sk_callback_hsw+0x552>
+ DB 196,98,125,24,29,24,23,0,0 ; vbroadcastss 0x1718(%rip),%ymm11 # 6d44 <_sk_clut_4D_hsw+0xcf0>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,171,9,0,0 ; vbroadcastss 0x9ab(%rip),%ymm9 # 5ffc <_sk_callback_hsw+0x556>
+ DB 196,98,125,24,13,247,22,0,0 ; vbroadcastss 0x16f7(%rip),%ymm9 # 6d48 <_sk_clut_4D_hsw+0xcf4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,142,9,0,0 ; vbroadcastss 0x98e(%rip),%ymm9 # 6000 <_sk_callback_hsw+0x55a>
+ DB 196,98,125,24,13,218,22,0,0 ; vbroadcastss 0x16da(%rip),%ymm9 # 6d4c <_sk_clut_4D_hsw+0xcf8>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,127,9,0,0 ; vbroadcastss 0x97f(%rip),%ymm11 # 6004 <_sk_callback_hsw+0x55e>
+ DB 196,98,125,24,29,203,22,0,0 ; vbroadcastss 0x16cb(%rip),%ymm11 # 6d50 <_sk_clut_4D_hsw+0xcfc>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5278,14 +5278,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC
DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9
DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,74,9,0,0 ; vbroadcastss 0x94a(%rip),%ymm10 # 6008 <_sk_callback_hsw+0x562>
+ DB 196,98,125,24,21,150,22,0,0 ; vbroadcastss 0x1696(%rip),%ymm10 # 6d54 <_sk_clut_4D_hsw+0xd00>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10
DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,41,9,0,0 ; vbroadcastss 0x929(%rip),%ymm8 # 600c <_sk_callback_hsw+0x566>
+ DB 196,98,125,24,5,117,22,0,0 ; vbroadcastss 0x1675(%rip),%ymm8 # 6d58 <_sk_clut_4D_hsw+0xd04>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5319,7 +5319,7 @@ _sk_apply_vector_mask_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,201,8,0,0 ; vbroadcastss 0x8c9(%rip),%ymm8 # 6010 <_sk_callback_hsw+0x56a>
+ DB 196,98,125,24,5,21,22,0,0 ; vbroadcastss 0x1615(%rip),%ymm8 # 6d5c <_sk_clut_4D_hsw+0xd08>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -5349,9 +5349,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,93,8,0,0 ; vbroadcastss 0x85d(%rip),%ymm0 # 6014 <_sk_callback_hsw+0x56e>
+ DB 196,226,125,24,5,169,21,0,0 ; vbroadcastss 0x15a9(%rip),%ymm0 # 6d60 <_sk_clut_4D_hsw+0xd0c>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,84,8,0,0 ; vbroadcastss 0x854(%rip),%ymm8 # 6018 <_sk_callback_hsw+0x572>
+ DB 196,98,125,24,5,160,21,0,0 ; vbroadcastss 0x15a0(%rip),%ymm8 # 6d64 <_sk_clut_4D_hsw+0xd10>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5360,7 +5360,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,60,8,0,0 ; vbroadcastss 0x83c(%rip),%ymm0 # 601c <_sk_callback_hsw+0x576>
+ DB 196,226,125,24,5,136,21,0,0 ; vbroadcastss 0x1588(%rip),%ymm0 # 6d68 <_sk_clut_4D_hsw+0xd14>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5370,9 +5370,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,32,8,0,0 ; vbroadcastss 0x820(%rip),%ymm1 # 6020 <_sk_callback_hsw+0x57a>
+ DB 196,226,125,24,13,108,21,0,0 ; vbroadcastss 0x156c(%rip),%ymm1 # 6d6c <_sk_clut_4D_hsw+0xd18>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,22,8,0,0 ; vbroadcastss 0x816(%rip),%ymm8 # 6024 <_sk_callback_hsw+0x57e>
+ DB 196,98,125,24,5,98,21,0,0 ; vbroadcastss 0x1562(%rip),%ymm8 # 6d70 <_sk_clut_4D_hsw+0xd1c>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5381,7 +5381,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,254,7,0,0 ; vbroadcastss 0x7fe(%rip),%ymm1 # 6028 <_sk_callback_hsw+0x582>
+ DB 196,226,125,24,13,74,21,0,0 ; vbroadcastss 0x154a(%rip),%ymm1 # 6d74 <_sk_clut_4D_hsw+0xd20>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5391,13 +5391,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,225,7,0,0 ; vbroadcastss 0x7e1(%rip),%ymm0 # 602c <_sk_callback_hsw+0x586>
+ DB 196,226,125,24,5,45,21,0,0 ; vbroadcastss 0x152d(%rip),%ymm0 # 6d78 <_sk_clut_4D_hsw+0xd24>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,216,7,0,0 ; vbroadcastss 0x7d8(%rip),%ymm8 # 6030 <_sk_callback_hsw+0x58a>
+ DB 196,98,125,24,5,36,21,0,0 ; vbroadcastss 0x1524(%rip),%ymm8 # 6d7c <_sk_clut_4D_hsw+0xd28>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,201,7,0,0 ; vbroadcastss 0x7c9(%rip),%ymm10 # 6034 <_sk_callback_hsw+0x58e>
- DB 196,98,125,24,29,196,7,0,0 ; vbroadcastss 0x7c4(%rip),%ymm11 # 6038 <_sk_callback_hsw+0x592>
+ DB 196,98,125,24,21,21,21,0,0 ; vbroadcastss 0x1515(%rip),%ymm10 # 6d80 <_sk_clut_4D_hsw+0xd2c>
+ DB 196,98,125,24,29,16,21,0,0 ; vbroadcastss 0x1510(%rip),%ymm11 # 6d84 <_sk_clut_4D_hsw+0xd30>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5407,16 +5407,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,167,7,0,0 ; vbroadcastss 0x7a7(%rip),%ymm0 # 603c <_sk_callback_hsw+0x596>
+ DB 196,226,125,24,5,243,20,0,0 ; vbroadcastss 0x14f3(%rip),%ymm0 # 6d88 <_sk_clut_4D_hsw+0xd34>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,158,7,0,0 ; vbroadcastss 0x79e(%rip),%ymm8 # 6040 <_sk_callback_hsw+0x59a>
+ DB 196,98,125,24,5,234,20,0,0 ; vbroadcastss 0x14ea(%rip),%ymm8 # 6d8c <_sk_clut_4D_hsw+0xd38>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,148,7,0,0 ; vbroadcastss 0x794(%rip),%ymm9 # 6044 <_sk_callback_hsw+0x59e>
- DB 196,98,125,24,21,143,7,0,0 ; vbroadcastss 0x78f(%rip),%ymm10 # 6048 <_sk_callback_hsw+0x5a2>
+ DB 196,98,125,24,13,224,20,0,0 ; vbroadcastss 0x14e0(%rip),%ymm9 # 6d90 <_sk_clut_4D_hsw+0xd3c>
+ DB 196,98,125,24,21,219,20,0,0 ; vbroadcastss 0x14db(%rip),%ymm10 # 6d94 <_sk_clut_4D_hsw+0xd40>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,133,7,0,0 ; vbroadcastss 0x785(%rip),%ymm9 # 604c <_sk_callback_hsw+0x5a6>
+ DB 196,98,125,24,13,209,20,0,0 ; vbroadcastss 0x14d1(%rip),%ymm9 # 6d98 <_sk_clut_4D_hsw+0xd44>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,123,7,0,0 ; vbroadcastss 0x77b(%rip),%ymm10 # 6050 <_sk_callback_hsw+0x5aa>
+ DB 196,98,125,24,21,199,20,0,0 ; vbroadcastss 0x14c7(%rip),%ymm10 # 6d9c <_sk_clut_4D_hsw+0xd48>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5425,14 +5425,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,99,7,0,0 ; vbroadcastss 0x763(%rip),%ymm8 # 6054 <_sk_callback_hsw+0x5ae>
+ DB 196,98,125,24,5,175,20,0,0 ; vbroadcastss 0x14af(%rip),%ymm8 # 6da0 <_sk_clut_4D_hsw+0xd4c>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,85,7,0,0 ; vbroadcastss 0x755(%rip),%ymm10 # 6058 <_sk_callback_hsw+0x5b2>
- DB 196,98,125,24,29,80,7,0,0 ; vbroadcastss 0x750(%rip),%ymm11 # 605c <_sk_callback_hsw+0x5b6>
+ DB 196,98,125,24,21,161,20,0,0 ; vbroadcastss 0x14a1(%rip),%ymm10 # 6da4 <_sk_clut_4D_hsw+0xd50>
+ DB 196,98,125,24,29,156,20,0,0 ; vbroadcastss 0x149c(%rip),%ymm11 # 6da8 <_sk_clut_4D_hsw+0xd54>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,65,7,0,0 ; vbroadcastss 0x741(%rip),%ymm8 # 6060 <_sk_callback_hsw+0x5ba>
+ DB 196,98,125,24,5,141,20,0,0 ; vbroadcastss 0x148d(%rip),%ymm8 # 6dac <_sk_clut_4D_hsw+0xd58>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5441,12 +5441,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,41,7,0,0 ; vbroadcastss 0x729(%rip),%ymm0 # 6064 <_sk_callback_hsw+0x5be>
+ DB 196,226,125,24,5,117,20,0,0 ; vbroadcastss 0x1475(%rip),%ymm0 # 6db0 <_sk_clut_4D_hsw+0xd5c>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,22,7,0,0 ; vbroadcastss 0x716(%rip),%ymm10 # 6068 <_sk_callback_hsw+0x5c2>
- DB 196,98,125,24,29,17,7,0,0 ; vbroadcastss 0x711(%rip),%ymm11 # 606c <_sk_callback_hsw+0x5c6>
+ DB 196,98,125,24,21,98,20,0,0 ; vbroadcastss 0x1462(%rip),%ymm10 # 6db4 <_sk_clut_4D_hsw+0xd60>
+ DB 196,98,125,24,29,93,20,0,0 ; vbroadcastss 0x145d(%rip),%ymm11 # 6db8 <_sk_clut_4D_hsw+0xd64>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5456,13 +5456,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,244,6,0,0 ; vbroadcastss 0x6f4(%rip),%ymm1 # 6070 <_sk_callback_hsw+0x5ca>
+ DB 196,226,125,24,13,64,20,0,0 ; vbroadcastss 0x1440(%rip),%ymm1 # 6dbc <_sk_clut_4D_hsw+0xd68>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,234,6,0,0 ; vbroadcastss 0x6ea(%rip),%ymm8 # 6074 <_sk_callback_hsw+0x5ce>
+ DB 196,98,125,24,5,54,20,0,0 ; vbroadcastss 0x1436(%rip),%ymm8 # 6dc0 <_sk_clut_4D_hsw+0xd6c>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,219,6,0,0 ; vbroadcastss 0x6db(%rip),%ymm10 # 6078 <_sk_callback_hsw+0x5d2>
- DB 196,98,125,24,29,214,6,0,0 ; vbroadcastss 0x6d6(%rip),%ymm11 # 607c <_sk_callback_hsw+0x5d6>
+ DB 196,98,125,24,21,39,20,0,0 ; vbroadcastss 0x1427(%rip),%ymm10 # 6dc4 <_sk_clut_4D_hsw+0xd70>
+ DB 196,98,125,24,29,34,20,0,0 ; vbroadcastss 0x1422(%rip),%ymm11 # 6dc8 <_sk_clut_4D_hsw+0xd74>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5472,16 +5472,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,185,6,0,0 ; vbroadcastss 0x6b9(%rip),%ymm1 # 6080 <_sk_callback_hsw+0x5da>
+ DB 196,226,125,24,13,5,20,0,0 ; vbroadcastss 0x1405(%rip),%ymm1 # 6dcc <_sk_clut_4D_hsw+0xd78>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,175,6,0,0 ; vbroadcastss 0x6af(%rip),%ymm8 # 6084 <_sk_callback_hsw+0x5de>
+ DB 196,98,125,24,5,251,19,0,0 ; vbroadcastss 0x13fb(%rip),%ymm8 # 6dd0 <_sk_clut_4D_hsw+0xd7c>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,165,6,0,0 ; vbroadcastss 0x6a5(%rip),%ymm9 # 6088 <_sk_callback_hsw+0x5e2>
- DB 196,98,125,24,21,160,6,0,0 ; vbroadcastss 0x6a0(%rip),%ymm10 # 608c <_sk_callback_hsw+0x5e6>
+ DB 196,98,125,24,13,241,19,0,0 ; vbroadcastss 0x13f1(%rip),%ymm9 # 6dd4 <_sk_clut_4D_hsw+0xd80>
+ DB 196,98,125,24,21,236,19,0,0 ; vbroadcastss 0x13ec(%rip),%ymm10 # 6dd8 <_sk_clut_4D_hsw+0xd84>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,150,6,0,0 ; vbroadcastss 0x696(%rip),%ymm9 # 6090 <_sk_callback_hsw+0x5ea>
+ DB 196,98,125,24,13,226,19,0,0 ; vbroadcastss 0x13e2(%rip),%ymm9 # 6ddc <_sk_clut_4D_hsw+0xd88>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,140,6,0,0 ; vbroadcastss 0x68c(%rip),%ymm10 # 6094 <_sk_callback_hsw+0x5ee>
+ DB 196,98,125,24,21,216,19,0,0 ; vbroadcastss 0x13d8(%rip),%ymm10 # 6de0 <_sk_clut_4D_hsw+0xd8c>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5490,14 +5490,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,116,6,0,0 ; vbroadcastss 0x674(%rip),%ymm8 # 6098 <_sk_callback_hsw+0x5f2>
+ DB 196,98,125,24,5,192,19,0,0 ; vbroadcastss 0x13c0(%rip),%ymm8 # 6de4 <_sk_clut_4D_hsw+0xd90>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,101,6,0,0 ; vbroadcastss 0x665(%rip),%ymm10 # 609c <_sk_callback_hsw+0x5f6>
- DB 196,98,125,24,29,96,6,0,0 ; vbroadcastss 0x660(%rip),%ymm11 # 60a0 <_sk_callback_hsw+0x5fa>
+ DB 196,98,125,24,21,177,19,0,0 ; vbroadcastss 0x13b1(%rip),%ymm10 # 6de8 <_sk_clut_4D_hsw+0xd94>
+ DB 196,98,125,24,29,172,19,0,0 ; vbroadcastss 0x13ac(%rip),%ymm11 # 6dec <_sk_clut_4D_hsw+0xd98>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,81,6,0,0 ; vbroadcastss 0x651(%rip),%ymm8 # 60a4 <_sk_callback_hsw+0x5fe>
+ DB 196,98,125,24,5,157,19,0,0 ; vbroadcastss 0x139d(%rip),%ymm8 # 6df0 <_sk_clut_4D_hsw+0xd9c>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5506,12 +5506,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,57,6,0,0 ; vbroadcastss 0x639(%rip),%ymm1 # 60a8 <_sk_callback_hsw+0x602>
+ DB 196,226,125,24,13,133,19,0,0 ; vbroadcastss 0x1385(%rip),%ymm1 # 6df4 <_sk_clut_4D_hsw+0xda0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,37,6,0,0 ; vbroadcastss 0x625(%rip),%ymm10 # 60ac <_sk_callback_hsw+0x606>
- DB 196,98,125,24,29,32,6,0,0 ; vbroadcastss 0x620(%rip),%ymm11 # 60b0 <_sk_callback_hsw+0x60a>
+ DB 196,98,125,24,21,113,19,0,0 ; vbroadcastss 0x1371(%rip),%ymm10 # 6df8 <_sk_clut_4D_hsw+0xda4>
+ DB 196,98,125,24,29,108,19,0,0 ; vbroadcastss 0x136c(%rip),%ymm11 # 6dfc <_sk_clut_4D_hsw+0xda8>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5592,6 +5592,630 @@ _sk_callback_hsw LABEL PROC
DB 93 ; pop %rbp
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_clut_3D_hsw
+_sk_clut_3D_hsw LABEL PROC
+ DB 72,129,236,88,2,0,0 ; sub $0x258,%rsp
+ DB 197,252,17,188,36,32,2,0,0 ; vmovups %ymm7,0x220(%rsp)
+ DB 197,254,127,180,36,0,2,0,0 ; vmovdqu %ymm6,0x200(%rsp)
+ DB 197,252,17,172,36,224,1,0,0 ; vmovups %ymm5,0x1e0(%rsp)
+ DB 197,252,17,164,36,192,1,0,0 ; vmovups %ymm4,0x1c0(%rsp)
+ DB 197,252,17,156,36,160,1,0,0 ; vmovups %ymm3,0x1a0(%rsp)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,16 ; mov 0x10(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,218 ; vmovd %r10d,%xmm3
+ DB 196,226,125,88,219 ; vpbroadcastd %xmm3,%ymm3
+ DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,252,17,84,36,96 ; vmovups %ymm2,0x60(%rsp)
+ DB 197,254,91,234 ; vcvttps2dq %ymm2,%ymm5
+ DB 196,193,121,110,209 ; vmovd %r9d,%xmm2
+ DB 196,193,121,110,217 ; vmovd %r9d,%xmm3
+ DB 196,226,125,88,219 ; vpbroadcastd %xmm3,%ymm3
+ DB 197,254,127,28,36 ; vmovdqu %ymm3,(%rsp)
+ DB 68,139,72,12 ; mov 0xc(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,226 ; vmovd %r10d,%xmm4
+ DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4
+ DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
+ DB 197,220,89,201 ; vmulps %ymm1,%ymm4,%ymm1
+ DB 197,252,17,76,36,64 ; vmovups %ymm1,0x40(%rsp)
+ DB 197,254,91,201 ; vcvttps2dq %ymm1,%ymm1
+ DB 197,254,127,140,36,128,1,0,0 ; vmovdqu %ymm1,0x180(%rsp)
+ DB 196,226,117,64,203 ; vpmulld %ymm3,%ymm1,%ymm1
+ DB 197,254,127,140,36,224,0,0,0 ; vmovdqu %ymm1,0xe0(%rsp)
+ DB 197,117,254,229 ; vpaddd %ymm5,%ymm1,%ymm12
+ DB 197,125,111,205 ; vmovdqa %ymm5,%ymm9
+ DB 197,126,127,140,36,96,1,0,0 ; vmovdqu %ymm9,0x160(%rsp)
+ DB 196,193,121,110,201 ; vmovd %r9d,%xmm1
+ DB 196,226,117,64,202 ; vpmulld %ymm2,%ymm1,%ymm1
+ DB 196,226,125,88,233 ; vpbroadcastd %xmm1,%ymm5
+ DB 68,139,72,8 ; mov 0x8(%rax),%r9d
+ DB 65,255,201 ; dec %r9d
+ DB 196,193,121,110,201 ; vmovd %r9d,%xmm1
+ DB 196,226,125,88,201 ; vpbroadcastd %xmm1,%ymm1
+ DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
+ DB 197,244,89,192 ; vmulps %ymm0,%ymm1,%ymm0
+ DB 197,254,91,208 ; vcvttps2dq %ymm0,%ymm2
+ DB 196,226,109,64,205 ; vpmulld %ymm5,%ymm2,%ymm1
+ DB 197,254,127,76,36,32 ; vmovdqu %ymm1,0x20(%rsp)
+ DB 72,139,0 ; mov (%rax),%rax
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 196,226,125,88,61,51,17,0,0 ; vpbroadcastd 0x1133(%rip),%ymm7 # 6e04 <_sk_clut_4D_hsw+0xdb0>
+ DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
+ DB 196,98,125,88,21,31,17,0,0 ; vpbroadcastd 0x111f(%rip),%ymm10 # 6e08 <_sk_clut_4D_hsw+0xdb4>
+ DB 196,193,117,254,242 ; vpaddd %ymm10,%ymm1,%ymm6
+ DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
+ DB 196,226,37,146,28,176 ; vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
+ DB 196,98,125,88,29,10,17,0,0 ; vpbroadcastd 0x110a(%rip),%ymm11 # 6e0c <_sk_clut_4D_hsw+0xdb8>
+ DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,226,77,146,36,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
+ DB 196,98,125,24,45,230,16,0,0 ; vbroadcastss 0x10e6(%rip),%ymm13 # 6e00 <_sk_clut_4D_hsw+0xdac>
+ DB 196,193,124,88,245 ; vaddps %ymm13,%ymm0,%ymm6
+ DB 197,254,91,246 ; vcvttps2dq %ymm6,%ymm6
+ DB 196,226,77,64,205 ; vpmulld %ymm5,%ymm6,%ymm1
+ DB 197,254,127,140,36,128,0,0,0 ; vmovdqu %ymm1,0x80(%rsp)
+ DB 196,193,117,254,236 ; vpaddd %ymm12,%ymm1,%ymm5
+ DB 196,226,85,64,239 ; vpmulld %ymm7,%ymm5,%ymm5
+ DB 196,65,29,118,228 ; vpcmpeqd %ymm12,%ymm12,%ymm12
+ DB 196,98,29,146,60,168 ; vgatherdps %ymm12,(%rax,%ymm5,4),%ymm15
+ DB 196,65,85,254,226 ; vpaddd %ymm10,%ymm5,%ymm12
+ DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
+ DB 196,162,13,146,12,160 ; vgatherdps %ymm14,(%rax,%ymm12,4),%ymm1
+ DB 196,193,85,254,235 ; vpaddd %ymm11,%ymm5,%ymm5
+ DB 196,65,29,118,228 ; vpcmpeqd %ymm12,%ymm12,%ymm12
+ DB 196,226,29,146,52,168 ; vgatherdps %ymm12,(%rax,%ymm5,4),%ymm6
+ DB 197,252,91,234 ; vcvtdq2ps %ymm2,%ymm5
+ DB 197,124,92,245 ; vsubps %ymm5,%ymm0,%ymm14
+ DB 196,193,4,92,192 ; vsubps %ymm8,%ymm15,%ymm0
+ DB 196,194,13,168,192 ; vfmadd213ps %ymm8,%ymm14,%ymm0
+ DB 197,252,17,132,36,64,1,0,0 ; vmovups %ymm0,0x140(%rsp)
+ DB 197,244,92,195 ; vsubps %ymm3,%ymm1,%ymm0
+ DB 196,226,13,168,195 ; vfmadd213ps %ymm3,%ymm14,%ymm0
+ DB 197,252,17,132,36,32,1,0,0 ; vmovups %ymm0,0x120(%rsp)
+ DB 197,204,92,196 ; vsubps %ymm4,%ymm6,%ymm0
+ DB 196,226,13,168,196 ; vfmadd213ps %ymm4,%ymm14,%ymm0
+ DB 197,252,17,132,36,0,1,0,0 ; vmovups %ymm0,0x100(%rsp)
+ DB 197,148,88,68,36,64 ; vaddps 0x40(%rsp),%ymm13,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 196,226,125,64,4,36 ; vpmulld (%rsp),%ymm0,%ymm0
+ DB 197,254,127,132,36,160,0,0,0 ; vmovdqu %ymm0,0xa0(%rsp)
+ DB 196,193,125,254,193 ; vpaddd %ymm9,%ymm0,%ymm0
+ DB 197,126,111,76,36,32 ; vmovdqu 0x20(%rsp),%ymm9
+ DB 196,193,125,254,201 ; vpaddd %ymm9,%ymm0,%ymm1
+ DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,36,136 ; vgatherdps %ymm3,(%rax,%ymm1,4),%ymm4
+ DB 196,193,117,254,218 ; vpaddd %ymm10,%ymm1,%ymm3
+ DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
+ DB 196,226,85,146,52,152 ; vgatherdps %ymm5,(%rax,%ymm3,4),%ymm6
+ DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,20,136 ; vgatherdps %ymm3,(%rax,%ymm1,4),%ymm2
+ DB 197,126,111,164,36,128,0,0,0 ; vmovdqu 0x80(%rsp),%ymm12
+ DB 197,157,254,192 ; vpaddd %ymm0,%ymm12,%ymm0
+ DB 196,226,125,64,199 ; vpmulld %ymm7,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,28,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm3
+ DB 196,193,125,254,202 ; vpaddd %ymm10,%ymm0,%ymm1
+ DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
+ DB 196,98,85,146,4,136 ; vgatherdps %ymm5,(%rax,%ymm1,4),%ymm8
+ DB 196,193,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,44,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm5
+ DB 197,228,92,196 ; vsubps %ymm4,%ymm3,%ymm0
+ DB 196,226,13,168,196 ; vfmadd213ps %ymm4,%ymm14,%ymm0
+ DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
+ DB 197,188,92,198 ; vsubps %ymm6,%ymm8,%ymm0
+ DB 196,226,13,168,198 ; vfmadd213ps %ymm6,%ymm14,%ymm0
+ DB 197,252,17,132,36,192,0,0,0 ; vmovups %ymm0,0xc0(%rsp)
+ DB 197,84,92,250 ; vsubps %ymm2,%ymm5,%ymm15
+ DB 196,98,13,168,250 ; vfmadd213ps %ymm2,%ymm14,%ymm15
+ DB 197,148,88,68,36,96 ; vaddps 0x60(%rsp),%ymm13,%ymm0
+ DB 197,126,91,232 ; vcvttps2dq %ymm0,%ymm13
+ DB 197,149,254,132,36,224,0,0,0 ; vpaddd 0xe0(%rsp),%ymm13,%ymm0
+ DB 197,181,254,200 ; vpaddd %ymm0,%ymm9,%ymm1
+ DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,44,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm5
+ DB 196,193,117,254,210 ; vpaddd %ymm10,%ymm1,%ymm2
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,226,77,146,28,144 ; vgatherdps %ymm6,(%rax,%ymm2,4),%ymm3
+ DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,52,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm6
+ DB 197,157,254,192 ; vpaddd %ymm0,%ymm12,%ymm0
+ DB 196,226,125,64,199 ; vpmulld %ymm7,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,20,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ DB 196,193,125,254,202 ; vpaddd %ymm10,%ymm0,%ymm1
+ DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
+ DB 196,226,53,146,36,136 ; vgatherdps %ymm9,(%rax,%ymm1,4),%ymm4
+ DB 196,193,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,98,117,146,4,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm8
+ DB 197,236,92,205 ; vsubps %ymm5,%ymm2,%ymm1
+ DB 196,226,13,168,205 ; vfmadd213ps %ymm5,%ymm14,%ymm1
+ DB 197,92,92,203 ; vsubps %ymm3,%ymm4,%ymm9
+ DB 196,98,13,168,203 ; vfmadd213ps %ymm3,%ymm14,%ymm9
+ DB 197,188,92,198 ; vsubps %ymm6,%ymm8,%ymm0
+ DB 196,226,13,168,198 ; vfmadd213ps %ymm6,%ymm14,%ymm0
+ DB 197,149,254,148,36,160,0,0,0 ; vpaddd 0xa0(%rsp),%ymm13,%ymm2
+ DB 197,237,254,92,36,32 ; vpaddd 0x20(%rsp),%ymm2,%ymm3
+ DB 196,226,101,64,223 ; vpmulld %ymm7,%ymm3,%ymm3
+ DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
+ DB 196,226,93,146,44,152 ; vgatherdps %ymm4,(%rax,%ymm3,4),%ymm5
+ DB 196,193,101,254,226 ; vpaddd %ymm10,%ymm3,%ymm4
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,98,77,146,4,160 ; vgatherdps %ymm6,(%rax,%ymm4,4),%ymm8
+ DB 196,193,101,254,219 ; vpaddd %ymm11,%ymm3,%ymm3
+ DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
+ DB 196,226,93,146,52,152 ; vgatherdps %ymm4,(%rax,%ymm3,4),%ymm6
+ DB 197,157,254,210 ; vpaddd %ymm2,%ymm12,%ymm2
+ DB 196,226,109,64,215 ; vpmulld %ymm7,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,36,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm4
+ DB 196,193,109,254,218 ; vpaddd %ymm10,%ymm2,%ymm3
+ DB 197,197,118,255 ; vpcmpeqd %ymm7,%ymm7,%ymm7
+ DB 196,98,69,146,20,152 ; vgatherdps %ymm7,(%rax,%ymm3,4),%ymm10
+ DB 196,193,109,254,211 ; vpaddd %ymm11,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,60,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm7
+ DB 197,220,92,213 ; vsubps %ymm5,%ymm4,%ymm2
+ DB 196,226,13,168,213 ; vfmadd213ps %ymm5,%ymm14,%ymm2
+ DB 196,193,44,92,216 ; vsubps %ymm8,%ymm10,%ymm3
+ DB 196,194,13,168,216 ; vfmadd213ps %ymm8,%ymm14,%ymm3
+ DB 197,196,92,230 ; vsubps %ymm6,%ymm7,%ymm4
+ DB 196,226,13,168,230 ; vfmadd213ps %ymm6,%ymm14,%ymm4
+ DB 197,252,91,172,36,128,1,0,0 ; vcvtdq2ps 0x180(%rsp),%ymm5
+ DB 197,252,16,116,36,64 ; vmovups 0x40(%rsp),%ymm6
+ DB 197,204,92,237 ; vsubps %ymm5,%ymm6,%ymm5
+ DB 197,252,16,188,36,64,1,0,0 ; vmovups 0x140(%rsp),%ymm7
+ DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
+ DB 197,204,92,247 ; vsubps %ymm7,%ymm6,%ymm6
+ DB 196,226,85,168,247 ; vfmadd213ps %ymm7,%ymm5,%ymm6
+ DB 197,124,16,132,36,32,1,0,0 ; vmovups 0x120(%rsp),%ymm8
+ DB 197,252,16,188,36,192,0,0,0 ; vmovups 0xc0(%rsp),%ymm7
+ DB 196,193,68,92,248 ; vsubps %ymm8,%ymm7,%ymm7
+ DB 196,194,85,168,248 ; vfmadd213ps %ymm8,%ymm5,%ymm7
+ DB 197,124,16,148,36,0,1,0,0 ; vmovups 0x100(%rsp),%ymm10
+ DB 196,65,4,92,194 ; vsubps %ymm10,%ymm15,%ymm8
+ DB 196,66,85,168,194 ; vfmadd213ps %ymm10,%ymm5,%ymm8
+ DB 197,236,92,209 ; vsubps %ymm1,%ymm2,%ymm2
+ DB 196,226,85,168,209 ; vfmadd213ps %ymm1,%ymm5,%ymm2
+ DB 196,193,100,92,201 ; vsubps %ymm9,%ymm3,%ymm1
+ DB 196,194,85,168,201 ; vfmadd213ps %ymm9,%ymm5,%ymm1
+ DB 197,220,92,216 ; vsubps %ymm0,%ymm4,%ymm3
+ DB 196,226,85,168,216 ; vfmadd213ps %ymm0,%ymm5,%ymm3
+ DB 197,252,91,132,36,96,1,0,0 ; vcvtdq2ps 0x160(%rsp),%ymm0
+ DB 197,252,16,100,36,96 ; vmovups 0x60(%rsp),%ymm4
+ DB 197,220,92,224 ; vsubps %ymm0,%ymm4,%ymm4
+ DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
+ DB 196,226,93,168,198 ; vfmadd213ps %ymm6,%ymm4,%ymm0
+ DB 197,244,92,207 ; vsubps %ymm7,%ymm1,%ymm1
+ DB 196,226,93,168,207 ; vfmadd213ps %ymm7,%ymm4,%ymm1
+ DB 196,193,100,92,208 ; vsubps %ymm8,%ymm3,%ymm2
+ DB 196,194,93,168,208 ; vfmadd213ps %ymm8,%ymm4,%ymm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,252,16,156,36,160,1,0,0 ; vmovups 0x1a0(%rsp),%ymm3
+ DB 197,252,16,164,36,192,1,0,0 ; vmovups 0x1c0(%rsp),%ymm4
+ DB 197,252,16,172,36,224,1,0,0 ; vmovups 0x1e0(%rsp),%ymm5
+ DB 197,252,16,180,36,0,2,0,0 ; vmovups 0x200(%rsp),%ymm6
+ DB 197,252,16,188,36,32,2,0,0 ; vmovups 0x220(%rsp),%ymm7
+ DB 72,129,196,88,2,0,0 ; add $0x258,%rsp
+ DB 255,224 ; jmpq *%rax
+
+PUBLIC _sk_clut_4D_hsw
+_sk_clut_4D_hsw LABEL PROC
+ DB 72,129,236,56,4,0,0 ; sub $0x438,%rsp
+ DB 197,252,17,188,36,0,4,0,0 ; vmovups %ymm7,0x400(%rsp)
+ DB 197,252,17,180,36,224,3,0,0 ; vmovups %ymm6,0x3e0(%rsp)
+ DB 197,252,17,172,36,192,3,0,0 ; vmovups %ymm5,0x3c0(%rsp)
+ DB 197,252,17,164,36,160,3,0,0 ; vmovups %ymm4,0x3a0(%rsp)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,20 ; mov 0x14(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,226 ; vmovd %r10d,%xmm4
+ DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4
+ DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
+ DB 197,220,89,219 ; vmulps %ymm3,%ymm4,%ymm3
+ DB 197,252,17,156,36,32,1,0,0 ; vmovups %ymm3,0x120(%rsp)
+ DB 197,254,91,243 ; vcvttps2dq %ymm3,%ymm6
+ DB 197,254,127,180,36,0,1,0,0 ; vmovdqu %ymm6,0x100(%rsp)
+ DB 196,193,121,110,225 ; vmovd %r9d,%xmm4
+ DB 196,193,121,110,217 ; vmovd %r9d,%xmm3
+ DB 196,226,125,88,219 ; vpbroadcastd %xmm3,%ymm3
+ DB 197,254,127,92,36,64 ; vmovdqu %ymm3,0x40(%rsp)
+ DB 68,139,72,16 ; mov 0x10(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,234 ; vmovd %r10d,%xmm5
+ DB 196,226,125,88,237 ; vpbroadcastd %xmm5,%ymm5
+ DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
+ DB 197,212,89,210 ; vmulps %ymm2,%ymm5,%ymm2
+ DB 197,252,17,148,36,224,0,0,0 ; vmovups %ymm2,0xe0(%rsp)
+ DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2
+ DB 197,254,127,148,36,128,3,0,0 ; vmovdqu %ymm2,0x380(%rsp)
+ DB 196,226,109,64,211 ; vpmulld %ymm3,%ymm2,%ymm2
+ DB 197,254,127,84,36,96 ; vmovdqu %ymm2,0x60(%rsp)
+ DB 197,237,254,222 ; vpaddd %ymm6,%ymm2,%ymm3
+ DB 197,254,127,156,36,128,0,0,0 ; vmovdqu %ymm3,0x80(%rsp)
+ DB 196,193,121,110,233 ; vmovd %r9d,%xmm5
+ DB 196,226,85,64,236 ; vpmulld %ymm4,%ymm5,%ymm5
+ DB 196,226,125,88,253 ; vpbroadcastd %xmm5,%ymm7
+ DB 197,254,127,188,36,160,0,0,0 ; vmovdqu %ymm7,0xa0(%rsp)
+ DB 68,139,72,12 ; mov 0xc(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,242 ; vmovd %r10d,%xmm6
+ DB 196,226,125,88,246 ; vpbroadcastd %xmm6,%ymm6
+ DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
+ DB 197,204,89,225 ; vmulps %ymm1,%ymm6,%ymm4
+ DB 196,193,121,110,201 ; vmovd %r9d,%xmm1
+ DB 196,226,117,64,205 ; vpmulld %ymm5,%ymm1,%ymm1
+ DB 68,139,72,8 ; mov 0x8(%rax),%r9d
+ DB 65,255,201 ; dec %r9d
+ DB 196,193,121,110,233 ; vmovd %r9d,%xmm5
+ DB 196,226,125,88,237 ; vpbroadcastd %xmm5,%ymm5
+ DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
+ DB 197,212,89,232 ; vmulps %ymm0,%ymm5,%ymm5
+ DB 197,254,91,196 ; vcvttps2dq %ymm4,%ymm0
+ DB 197,254,127,132,36,96,3,0,0 ; vmovdqu %ymm0,0x360(%rsp)
+ DB 197,252,17,164,36,224,2,0,0 ; vmovups %ymm4,0x2e0(%rsp)
+ DB 196,226,125,88,201 ; vpbroadcastd %xmm1,%ymm1
+ DB 72,139,0 ; mov (%rax),%rax
+ DB 196,226,125,64,199 ; vpmulld %ymm7,%ymm0,%ymm0
+ DB 197,254,127,4,36 ; vmovdqu %ymm0,(%rsp)
+ DB 197,253,254,243 ; vpaddd %ymm3,%ymm0,%ymm6
+ DB 197,126,91,245 ; vcvttps2dq %ymm5,%ymm14
+ DB 196,98,13,64,233 ; vpmulld %ymm1,%ymm14,%ymm13
+ DB 197,149,254,198 ; vpaddd %ymm6,%ymm13,%ymm0
+ DB 196,98,125,88,21,111,12,0,0 ; vpbroadcastd 0xc6f(%rip),%ymm10 # 6e14 <_sk_clut_4D_hsw+0xdc0>
+ DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
+ DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
+ DB 196,98,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
+ DB 196,98,125,88,29,90,12,0,0 ; vpbroadcastd 0xc5a(%rip),%ymm11 # 6e18 <_sk_clut_4D_hsw+0xdc4>
+ DB 196,65,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm8
+ DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
+ DB 196,162,53,146,20,128 ; vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
+ DB 196,98,125,88,37,69,12,0,0 ; vpbroadcastd 0xc45(%rip),%ymm12 # 6e1c <_sk_clut_4D_hsw+0xdc8>
+ DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
+ DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
+ DB 196,226,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
+ DB 196,98,125,24,13,32,12,0,0 ; vbroadcastss 0xc20(%rip),%ymm9 # 6e10 <_sk_clut_4D_hsw+0xdbc>
+ DB 196,65,84,88,193 ; vaddps %ymm9,%ymm5,%ymm8
+ DB 196,65,126,91,192 ; vcvttps2dq %ymm8,%ymm8
+ DB 196,226,61,64,193 ; vpmulld %ymm1,%ymm8,%ymm0
+ DB 197,254,127,132,36,192,0,0,0 ; vmovdqu %ymm0,0xc0(%rsp)
+ DB 197,253,254,206 ; vpaddd %ymm6,%ymm0,%ymm1
+ DB 196,194,117,64,202 ; vpmulld %ymm10,%ymm1,%ymm1
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
+ DB 196,193,117,254,243 ; vpaddd %ymm11,%ymm1,%ymm6
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,4,176 ; vgatherdps %ymm3,(%rax,%ymm6,4),%ymm0
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,52,136 ; vgatherdps %ymm3,(%rax,%ymm1,4),%ymm6
+ DB 196,193,124,91,206 ; vcvtdq2ps %ymm14,%ymm1
+ DB 197,84,92,241 ; vsubps %ymm1,%ymm5,%ymm14
+ DB 196,193,60,92,207 ; vsubps %ymm15,%ymm8,%ymm1
+ DB 196,194,13,168,207 ; vfmadd213ps %ymm15,%ymm14,%ymm1
+ DB 197,252,17,140,36,64,3,0,0 ; vmovups %ymm1,0x340(%rsp)
+ DB 197,252,92,194 ; vsubps %ymm2,%ymm0,%ymm0
+ DB 196,226,13,168,194 ; vfmadd213ps %ymm2,%ymm14,%ymm0
+ DB 197,252,17,132,36,32,3,0,0 ; vmovups %ymm0,0x320(%rsp)
+ DB 197,204,92,199 ; vsubps %ymm7,%ymm6,%ymm0
+ DB 196,226,13,168,199 ; vfmadd213ps %ymm7,%ymm14,%ymm0
+ DB 197,252,17,132,36,0,3,0,0 ; vmovups %ymm0,0x300(%rsp)
+ DB 197,124,17,76,36,32 ; vmovups %ymm9,0x20(%rsp)
+ DB 196,193,92,88,193 ; vaddps %ymm9,%ymm4,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 196,226,125,64,140,36,160,0,0,0 ; vpmulld 0xa0(%rsp),%ymm0,%ymm1
+ DB 197,245,254,132,36,128,0,0,0 ; vpaddd 0x80(%rsp),%ymm1,%ymm0
+ DB 197,125,111,249 ; vmovdqa %ymm1,%ymm15
+ DB 196,193,125,254,205 ; vpaddd %ymm13,%ymm0,%ymm1
+ DB 196,194,117,64,202 ; vpmulld %ymm10,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,28,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ DB 196,193,117,254,211 ; vpaddd %ymm11,%ymm1,%ymm2
+ DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
+ DB 196,226,85,146,52,144 ; vgatherdps %ymm5,(%rax,%ymm2,4),%ymm6
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,44,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm5
+ DB 197,254,111,164,36,192,0,0,0 ; vmovdqu 0xc0(%rsp),%ymm4
+ DB 197,221,254,192 ; vpaddd %ymm0,%ymm4,%ymm0
+ DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,20,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ DB 196,193,125,254,203 ; vpaddd %ymm11,%ymm0,%ymm1
+ DB 197,197,118,255 ; vpcmpeqd %ymm7,%ymm7,%ymm7
+ DB 196,98,69,146,4,136 ; vgatherdps %ymm7,(%rax,%ymm1,4),%ymm8
+ DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,60,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm7
+ DB 197,236,92,195 ; vsubps %ymm3,%ymm2,%ymm0
+ DB 196,226,13,168,195 ; vfmadd213ps %ymm3,%ymm14,%ymm0
+ DB 197,252,17,132,36,160,0,0,0 ; vmovups %ymm0,0xa0(%rsp)
+ DB 197,188,92,198 ; vsubps %ymm6,%ymm8,%ymm0
+ DB 196,226,13,168,198 ; vfmadd213ps %ymm6,%ymm14,%ymm0
+ DB 197,252,17,132,36,128,0,0,0 ; vmovups %ymm0,0x80(%rsp)
+ DB 197,196,92,197 ; vsubps %ymm5,%ymm7,%ymm0
+ DB 196,226,13,168,197 ; vfmadd213ps %ymm5,%ymm14,%ymm0
+ DB 197,252,17,132,36,192,2,0,0 ; vmovups %ymm0,0x2c0(%rsp)
+ DB 197,180,88,132,36,224,0,0,0 ; vaddps 0xe0(%rsp),%ymm9,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 196,226,125,64,68,36,64 ; vpmulld 0x40(%rsp),%ymm0,%ymm0
+ DB 197,254,127,132,36,0,2,0,0 ; vmovdqu %ymm0,0x200(%rsp)
+ DB 197,253,254,132,36,0,1,0,0 ; vpaddd 0x100(%rsp),%ymm0,%ymm0
+ DB 197,253,254,12,36 ; vpaddd (%rsp),%ymm0,%ymm1
+ DB 196,193,117,254,213 ; vpaddd %ymm13,%ymm1,%ymm2
+ DB 196,65,125,111,205 ; vmovdqa %ymm13,%ymm9
+ DB 196,194,109,64,210 ; vpmulld %ymm10,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,44,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm5
+ DB 196,193,109,254,219 ; vpaddd %ymm11,%ymm2,%ymm3
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,226,77,146,60,152 ; vgatherdps %ymm6,(%rax,%ymm3,4),%ymm7
+ DB 196,193,109,254,212 ; vpaddd %ymm12,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,52,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm6
+ DB 197,221,254,201 ; vpaddd %ymm1,%ymm4,%ymm1
+ DB 196,194,117,64,202 ; vpmulld %ymm10,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,28,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ DB 196,193,117,254,211 ; vpaddd %ymm11,%ymm1,%ymm2
+ DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
+ DB 196,98,61,146,44,144 ; vgatherdps %ymm8,(%rax,%ymm2,4),%ymm13
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,98,109,146,4,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm8
+ DB 197,228,92,205 ; vsubps %ymm5,%ymm3,%ymm1
+ DB 196,226,13,168,205 ; vfmadd213ps %ymm5,%ymm14,%ymm1
+ DB 197,252,17,76,36,64 ; vmovups %ymm1,0x40(%rsp)
+ DB 197,148,92,207 ; vsubps %ymm7,%ymm13,%ymm1
+ DB 196,226,13,168,207 ; vfmadd213ps %ymm7,%ymm14,%ymm1
+ DB 197,252,17,140,36,160,2,0,0 ; vmovups %ymm1,0x2a0(%rsp)
+ DB 197,188,92,206 ; vsubps %ymm6,%ymm8,%ymm1
+ DB 196,226,13,168,206 ; vfmadd213ps %ymm6,%ymm14,%ymm1
+ DB 197,252,17,140,36,128,2,0,0 ; vmovups %ymm1,0x280(%rsp)
+ DB 197,126,127,188,36,128,1,0,0 ; vmovdqu %ymm15,0x180(%rsp)
+ DB 197,133,254,192 ; vpaddd %ymm0,%ymm15,%ymm0
+ DB 196,193,125,254,201 ; vpaddd %ymm9,%ymm0,%ymm1
+ DB 196,194,117,64,202 ; vpmulld %ymm10,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,28,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ DB 196,193,117,254,211 ; vpaddd %ymm11,%ymm1,%ymm2
+ DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
+ DB 196,226,85,146,52,144 ; vgatherdps %ymm5,(%rax,%ymm2,4),%ymm6
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,44,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm5
+ DB 197,221,254,192 ; vpaddd %ymm0,%ymm4,%ymm0
+ DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,20,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ DB 196,193,125,254,203 ; vpaddd %ymm11,%ymm0,%ymm1
+ DB 197,197,118,255 ; vpcmpeqd %ymm7,%ymm7,%ymm7
+ DB 196,98,69,146,4,136 ; vgatherdps %ymm7,(%rax,%ymm1,4),%ymm8
+ DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,60,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm7
+ DB 197,236,92,195 ; vsubps %ymm3,%ymm2,%ymm0
+ DB 196,226,13,168,195 ; vfmadd213ps %ymm3,%ymm14,%ymm0
+ DB 197,252,17,132,36,96,2,0,0 ; vmovups %ymm0,0x260(%rsp)
+ DB 197,188,92,198 ; vsubps %ymm6,%ymm8,%ymm0
+ DB 196,226,13,168,198 ; vfmadd213ps %ymm6,%ymm14,%ymm0
+ DB 197,252,17,132,36,64,2,0,0 ; vmovups %ymm0,0x240(%rsp)
+ DB 197,196,92,197 ; vsubps %ymm5,%ymm7,%ymm0
+ DB 196,226,13,168,197 ; vfmadd213ps %ymm5,%ymm14,%ymm0
+ DB 197,252,17,132,36,32,2,0,0 ; vmovups %ymm0,0x220(%rsp)
+ DB 197,252,16,68,36,32 ; vmovups 0x20(%rsp),%ymm0
+ DB 197,252,88,132,36,32,1,0,0 ; vaddps 0x120(%rsp),%ymm0,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 197,254,127,132,36,160,1,0,0 ; vmovdqu %ymm0,0x1a0(%rsp)
+ DB 197,125,254,68,36,96 ; vpaddd 0x60(%rsp),%ymm0,%ymm8
+ DB 197,189,254,12,36 ; vpaddd (%rsp),%ymm8,%ymm1
+ DB 197,181,254,209 ; vpaddd %ymm1,%ymm9,%ymm2
+ DB 197,125,127,207 ; vmovdqa %ymm9,%ymm7
+ DB 196,194,109,64,210 ; vpmulld %ymm10,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,36,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm4
+ DB 196,193,109,254,219 ; vpaddd %ymm11,%ymm2,%ymm3
+ DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
+ DB 196,98,85,146,44,152 ; vgatherdps %ymm5,(%rax,%ymm3,4),%ymm13
+ DB 196,193,109,254,212 ; vpaddd %ymm12,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,44,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm5
+ DB 197,126,111,140,36,192,0,0,0 ; vmovdqu 0xc0(%rsp),%ymm9
+ DB 197,181,254,201 ; vpaddd %ymm1,%ymm9,%ymm1
+ DB 196,194,117,64,202 ; vpmulld %ymm10,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,28,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ DB 196,193,117,254,211 ; vpaddd %ymm11,%ymm1,%ymm2
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,226,77,146,4,144 ; vgatherdps %ymm6,(%rax,%ymm2,4),%ymm0
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,52,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm6
+ DB 197,228,92,204 ; vsubps %ymm4,%ymm3,%ymm1
+ DB 196,226,13,168,204 ; vfmadd213ps %ymm4,%ymm14,%ymm1
+ DB 197,252,17,76,36,96 ; vmovups %ymm1,0x60(%rsp)
+ DB 196,193,124,92,197 ; vsubps %ymm13,%ymm0,%ymm0
+ DB 196,194,13,168,197 ; vfmadd213ps %ymm13,%ymm14,%ymm0
+ DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
+ DB 197,204,92,197 ; vsubps %ymm5,%ymm6,%ymm0
+ DB 196,226,13,168,197 ; vfmadd213ps %ymm5,%ymm14,%ymm0
+ DB 197,252,17,132,36,224,1,0,0 ; vmovups %ymm0,0x1e0(%rsp)
+ DB 196,193,5,254,192 ; vpaddd %ymm8,%ymm15,%ymm0
+ DB 197,253,254,207 ; vpaddd %ymm7,%ymm0,%ymm1
+ DB 197,125,111,255 ; vmovdqa %ymm7,%ymm15
+ DB 196,194,117,64,202 ; vpmulld %ymm10,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,28,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm3
+ DB 196,193,117,254,211 ; vpaddd %ymm11,%ymm1,%ymm2
+ DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
+ DB 196,226,85,146,52,144 ; vgatherdps %ymm5,(%rax,%ymm2,4),%ymm6
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,226,109,146,60,136 ; vgatherdps %ymm2,(%rax,%ymm1,4),%ymm7
+ DB 197,181,254,192 ; vpaddd %ymm0,%ymm9,%ymm0
+ DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,20,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm2
+ DB 196,193,125,254,203 ; vpaddd %ymm11,%ymm0,%ymm1
+ DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
+ DB 196,98,85,146,44,136 ; vgatherdps %ymm5,(%rax,%ymm1,4),%ymm13
+ DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,36,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm4
+ DB 197,236,92,195 ; vsubps %ymm3,%ymm2,%ymm0
+ DB 196,226,13,168,195 ; vfmadd213ps %ymm3,%ymm14,%ymm0
+ DB 197,252,17,132,36,192,1,0,0 ; vmovups %ymm0,0x1c0(%rsp)
+ DB 197,148,92,198 ; vsubps %ymm6,%ymm13,%ymm0
+ DB 196,226,13,168,198 ; vfmadd213ps %ymm6,%ymm14,%ymm0
+ DB 197,252,17,132,36,64,1,0,0 ; vmovups %ymm0,0x140(%rsp)
+ DB 197,220,92,199 ; vsubps %ymm7,%ymm4,%ymm0
+ DB 196,226,13,168,199 ; vfmadd213ps %ymm7,%ymm14,%ymm0
+ DB 197,252,17,132,36,96,1,0,0 ; vmovups %ymm0,0x160(%rsp)
+ DB 197,254,111,132,36,160,1,0,0 ; vmovdqu 0x1a0(%rsp),%ymm0
+ DB 197,253,254,172,36,0,2,0,0 ; vpaddd 0x200(%rsp),%ymm0,%ymm5
+ DB 197,213,254,4,36 ; vpaddd (%rsp),%ymm5,%ymm0
+ DB 196,193,125,254,207 ; vpaddd %ymm15,%ymm0,%ymm1
+ DB 196,194,117,64,202 ; vpmulld %ymm10,%ymm1,%ymm1
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,226,77,146,60,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm7
+ DB 196,193,117,254,243 ; vpaddd %ymm11,%ymm1,%ymm6
+ DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
+ DB 196,98,61,146,44,176 ; vgatherdps %ymm8,(%rax,%ymm6,4),%ymm13
+ DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,226,77,146,20,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm2
+ DB 197,181,254,192 ; vpaddd %ymm0,%ymm9,%ymm0
+ DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,52,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm6
+ DB 196,193,125,254,203 ; vpaddd %ymm11,%ymm0,%ymm1
+ DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
+ DB 196,226,61,146,28,136 ; vgatherdps %ymm8,(%rax,%ymm1,4),%ymm3
+ DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
+ DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
+ DB 196,226,117,146,36,128 ; vgatherdps %ymm1,(%rax,%ymm0,4),%ymm4
+ DB 197,204,92,199 ; vsubps %ymm7,%ymm6,%ymm0
+ DB 196,226,13,168,199 ; vfmadd213ps %ymm7,%ymm14,%ymm0
+ DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
+ DB 196,193,100,92,205 ; vsubps %ymm13,%ymm3,%ymm1
+ DB 196,194,13,168,205 ; vfmadd213ps %ymm13,%ymm14,%ymm1
+ DB 197,92,92,194 ; vsubps %ymm2,%ymm4,%ymm8
+ DB 196,98,13,168,194 ; vfmadd213ps %ymm2,%ymm14,%ymm8
+ DB 197,213,254,148,36,128,1,0,0 ; vpaddd 0x180(%rsp),%ymm5,%ymm2
+ DB 196,193,109,254,223 ; vpaddd %ymm15,%ymm2,%ymm3
+ DB 196,194,101,64,218 ; vpmulld %ymm10,%ymm3,%ymm3
+ DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
+ DB 196,226,93,146,44,152 ; vgatherdps %ymm4,(%rax,%ymm3,4),%ymm5
+ DB 196,193,101,254,227 ; vpaddd %ymm11,%ymm3,%ymm4
+ DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
+ DB 196,226,77,146,60,160 ; vgatherdps %ymm6,(%rax,%ymm4,4),%ymm7
+ DB 196,193,101,254,220 ; vpaddd %ymm12,%ymm3,%ymm3
+ DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
+ DB 196,226,93,146,52,152 ; vgatherdps %ymm4,(%rax,%ymm3,4),%ymm6
+ DB 197,181,254,210 ; vpaddd %ymm2,%ymm9,%ymm2
+ DB 196,194,109,64,210 ; vpmulld %ymm10,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,226,101,146,36,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm4
+ DB 196,193,109,254,219 ; vpaddd %ymm11,%ymm2,%ymm3
+ DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
+ DB 196,98,45,146,28,152 ; vgatherdps %ymm10,(%rax,%ymm3,4),%ymm11
+ DB 196,193,109,254,212 ; vpaddd %ymm12,%ymm2,%ymm2
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,98,101,146,20,144 ; vgatherdps %ymm3,(%rax,%ymm2,4),%ymm10
+ DB 197,220,92,213 ; vsubps %ymm5,%ymm4,%ymm2
+ DB 196,226,13,168,213 ; vfmadd213ps %ymm5,%ymm14,%ymm2
+ DB 197,164,92,223 ; vsubps %ymm7,%ymm11,%ymm3
+ DB 196,226,13,168,223 ; vfmadd213ps %ymm7,%ymm14,%ymm3
+ DB 197,172,92,230 ; vsubps %ymm6,%ymm10,%ymm4
+ DB 196,226,13,168,230 ; vfmadd213ps %ymm6,%ymm14,%ymm4
+ DB 197,252,91,172,36,96,3,0,0 ; vcvtdq2ps 0x360(%rsp),%ymm5
+ DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6
+ DB 197,204,92,237 ; vsubps %ymm5,%ymm6,%ymm5
+ DB 197,252,16,188,36,64,3,0,0 ; vmovups 0x340(%rsp),%ymm7
+ DB 197,252,16,180,36,160,0,0,0 ; vmovups 0xa0(%rsp),%ymm6
+ DB 197,204,92,247 ; vsubps %ymm7,%ymm6,%ymm6
+ DB 196,226,85,168,247 ; vfmadd213ps %ymm7,%ymm5,%ymm6
+ DB 197,124,16,148,36,32,3,0,0 ; vmovups 0x320(%rsp),%ymm10
+ DB 197,252,16,188,36,128,0,0,0 ; vmovups 0x80(%rsp),%ymm7
+ DB 196,193,68,92,250 ; vsubps %ymm10,%ymm7,%ymm7
+ DB 196,194,85,168,250 ; vfmadd213ps %ymm10,%ymm5,%ymm7
+ DB 197,124,16,156,36,0,3,0,0 ; vmovups 0x300(%rsp),%ymm11
+ DB 197,124,16,148,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm10
+ DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
+ DB 196,66,85,168,211 ; vfmadd213ps %ymm11,%ymm5,%ymm10
+ DB 197,124,16,100,36,64 ; vmovups 0x40(%rsp),%ymm12
+ DB 197,124,16,156,36,96,2,0,0 ; vmovups 0x260(%rsp),%ymm11
+ DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
+ DB 196,66,85,168,220 ; vfmadd213ps %ymm12,%ymm5,%ymm11
+ DB 197,124,16,172,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm13
+ DB 197,124,16,164,36,64,2,0,0 ; vmovups 0x240(%rsp),%ymm12
+ DB 196,65,28,92,229 ; vsubps %ymm13,%ymm12,%ymm12
+ DB 196,66,85,168,229 ; vfmadd213ps %ymm13,%ymm5,%ymm12
+ DB 197,124,16,180,36,128,2,0,0 ; vmovups 0x280(%rsp),%ymm14
+ DB 197,124,16,172,36,32,2,0,0 ; vmovups 0x220(%rsp),%ymm13
+ DB 196,65,20,92,238 ; vsubps %ymm14,%ymm13,%ymm13
+ DB 196,66,85,168,238 ; vfmadd213ps %ymm14,%ymm5,%ymm13
+ DB 197,252,16,68,36,96 ; vmovups 0x60(%rsp),%ymm0
+ DB 197,124,16,180,36,192,1,0,0 ; vmovups 0x1c0(%rsp),%ymm14
+ DB 197,12,92,240 ; vsubps %ymm0,%ymm14,%ymm14
+ DB 196,98,85,168,240 ; vfmadd213ps %ymm0,%ymm5,%ymm14
+ DB 197,252,16,68,36,32 ; vmovups 0x20(%rsp),%ymm0
+ DB 197,124,16,140,36,64,1,0,0 ; vmovups 0x140(%rsp),%ymm9
+ DB 197,52,92,248 ; vsubps %ymm0,%ymm9,%ymm15
+ DB 196,98,85,168,248 ; vfmadd213ps %ymm0,%ymm5,%ymm15
+ DB 197,252,16,132,36,224,1,0,0 ; vmovups 0x1e0(%rsp),%ymm0
+ DB 197,124,16,140,36,96,1,0,0 ; vmovups 0x160(%rsp),%ymm9
+ DB 197,52,92,200 ; vsubps %ymm0,%ymm9,%ymm9
+ DB 196,98,85,168,200 ; vfmadd213ps %ymm0,%ymm5,%ymm9
+ DB 197,252,16,4,36 ; vmovups (%rsp),%ymm0
+ DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
+ DB 196,226,85,168,208 ; vfmadd213ps %ymm0,%ymm5,%ymm2
+ DB 197,228,92,217 ; vsubps %ymm1,%ymm3,%ymm3
+ DB 196,226,85,168,217 ; vfmadd213ps %ymm1,%ymm5,%ymm3
+ DB 196,193,92,92,200 ; vsubps %ymm8,%ymm4,%ymm1
+ DB 196,194,85,168,200 ; vfmadd213ps %ymm8,%ymm5,%ymm1
+ DB 197,252,91,132,36,128,3,0,0 ; vcvtdq2ps 0x380(%rsp),%ymm0
+ DB 197,252,16,164,36,224,0,0,0 ; vmovups 0xe0(%rsp),%ymm4
+ DB 197,220,92,192 ; vsubps %ymm0,%ymm4,%ymm0
+ DB 197,164,92,230 ; vsubps %ymm6,%ymm11,%ymm4
+ DB 196,226,125,168,230 ; vfmadd213ps %ymm6,%ymm0,%ymm4
+ DB 197,156,92,239 ; vsubps %ymm7,%ymm12,%ymm5
+ DB 196,226,125,168,239 ; vfmadd213ps %ymm7,%ymm0,%ymm5
+ DB 196,193,20,92,242 ; vsubps %ymm10,%ymm13,%ymm6
+ DB 196,194,125,168,242 ; vfmadd213ps %ymm10,%ymm0,%ymm6
+ DB 196,193,108,92,214 ; vsubps %ymm14,%ymm2,%ymm2
+ DB 196,194,125,168,214 ; vfmadd213ps %ymm14,%ymm0,%ymm2
+ DB 196,193,100,92,223 ; vsubps %ymm15,%ymm3,%ymm3
+ DB 196,194,125,168,223 ; vfmadd213ps %ymm15,%ymm0,%ymm3
+ DB 196,193,116,92,249 ; vsubps %ymm9,%ymm1,%ymm7
+ DB 196,194,125,168,249 ; vfmadd213ps %ymm9,%ymm0,%ymm7
+ DB 197,252,91,132,36,0,1,0,0 ; vcvtdq2ps 0x100(%rsp),%ymm0
+ DB 197,252,16,140,36,32,1,0,0 ; vmovups 0x120(%rsp),%ymm1
+ DB 197,116,92,192 ; vsubps %ymm0,%ymm1,%ymm8
+ DB 197,236,92,196 ; vsubps %ymm4,%ymm2,%ymm0
+ DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
+ DB 197,228,92,205 ; vsubps %ymm5,%ymm3,%ymm1
+ DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
+ DB 197,196,92,214 ; vsubps %ymm6,%ymm7,%ymm2
+ DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 196,226,125,24,29,51,5,0,0 ; vbroadcastss 0x533(%rip),%ymm3 # 6e20 <_sk_clut_4D_hsw+0xdcc>
+ DB 197,252,16,164,36,160,3,0,0 ; vmovups 0x3a0(%rsp),%ymm4
+ DB 197,252,16,172,36,192,3,0,0 ; vmovups 0x3c0(%rsp),%ymm5
+ DB 197,252,16,180,36,224,3,0,0 ; vmovups 0x3e0(%rsp),%ymm6
+ DB 197,252,16,188,36,0,4,0,0 ; vmovups 0x400(%rsp),%ymm7
+ DB 72,129,196,56,4,0,0 ; add $0x438,%rsp
+ DB 255,224 ; jmpq *%rax
+
ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
@@ -5635,25 +6259,25 @@ ALIGN 4
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5c89 <.literal4+0xb9>
+ DB 71,225,61 ; rex.RXB loope 69d5 <.literal4+0xb9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5c99 <.literal4+0xc9>
+ DB 71,225,61 ; rex.RXB loope 69e5 <.literal4+0xc9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5ca9 <.literal4+0xd9>
+ DB 71,225,61 ; rex.RXB loope 69f5 <.literal4+0xd9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5cb9 <.literal4+0xe9>
+ DB 71,225,61 ; rex.RXB loope 6a05 <.literal4+0xe9>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
@@ -5716,7 +6340,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5d2d <.literal4+0x15d>
+ DB 224,7 ; loopne 6a79 <.literal4+0x15d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -5732,10 +6356,10 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 5d54 <.literal4+0x184>
+ DB 127,0 ; jg 6aa0 <.literal4+0x184>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5dcd <.literal4+0x1fd>
+ DB 119,115 ; ja 6b19 <.literal4+0x1fd>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5749,10 +6373,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5d88 <.literal4+0x1b8>
+ DB 127,0 ; jg 6ad4 <.literal4+0x1b8>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5e01 <.literal4+0x231>
+ DB 119,115 ; ja 6b4d <.literal4+0x231>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5766,10 +6390,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5dbc <.literal4+0x1ec>
+ DB 127,0 ; jg 6b08 <.literal4+0x1ec>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5e35 <.literal4+0x265>
+ DB 119,115 ; ja 6b81 <.literal4+0x265>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5783,10 +6407,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5df0 <.literal4+0x220>
+ DB 127,0 ; jg 6b3c <.literal4+0x220>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5e69 <.literal4+0x299>
+ DB 119,115 ; ja 6bb5 <.literal4+0x299>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5800,10 +6424,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5e24 <.literal4+0x254>
+ DB 127,0 ; jg 6b70 <.literal4+0x254>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5e9d <.literal4+0x2cd>
+ DB 119,115 ; ja 6be9 <.literal4+0x2cd>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5816,7 +6440,7 @@ ALIGN 4
DB 0,75,0 ; add %cl,0x0(%rbx)
DB 0,200 ; add %cl,%al
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 5e97 <.literal4+0x2c7>
+ DB 127,67 ; jg 6be3 <.literal4+0x2c7>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -5828,7 +6452,7 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5eb7 <.literal4+0x2e7>
+ DB 118,63 ; jbe 6c03 <.literal4+0x2e7>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
@@ -5850,7 +6474,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5ed1 <.literal4+0x301>
+ DB 224,7 ; loopne 6c1d <.literal4+0x301>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -5862,7 +6486,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5eed <.literal4+0x31d>
+ DB 224,7 ; loopne 6c39 <.literal4+0x31d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -5873,7 +6497,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 5f42 <.literal4+0x372>
+ DB 124,66 ; jl 6c8e <.literal4+0x372>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -5899,7 +6523,7 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 5fa5 <.literal4+0x3d5>
+ DB 112,65 ; jo 6cf1 <.literal4+0x3d5>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
@@ -5913,7 +6537,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 5fdb <.literal4+0x40b>
+ DB 127,71 ; jg 6d27 <.literal4+0x40b>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -6020,6 +6644,25 @@ ALIGN 4
DB 170 ; stos %al,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
DB 190,114,28,199,62 ; mov $0x3ec71c72,%esi
+ DB 114,249 ; jb 6dfb <.literal4+0x4df>
+ DB 127,63 ; jg 6e43 <_sk_clut_4D_hsw+0xdef>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 114,249 ; jb 6e0b <.literal4+0x4ef>
+ DB 127,63 ; jg 6e53 <_sk_clut_4D_hsw+0xdff>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 128 ; .byte 0x80
+ DB 63 ; (bad)
ALIGN 32
DB 255,0 ; incl (%rax)
@@ -6040,16 +6683,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_hsw+0xa000642>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006e68 <_sk_clut_4D_hsw+0xa000e14>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120060f0 <_sk_callback_hsw+0x1200064a>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006e70 <_sk_clut_4D_hsw+0x12000e1c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0060f8 <_sk_callback_hsw+0x1a000652>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006e78 <_sk_clut_4D_hsw+0x1a000e24>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006100 <_sk_callback_hsw+0x300065a>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006e80 <_sk_clut_4D_hsw+0x3000e2c>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6092,16 +6735,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006148 <_sk_callback_hsw+0xa0006a2>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006ec8 <_sk_clut_4D_hsw+0xa000e74>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006150 <_sk_callback_hsw+0x120006aa>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006ed0 <_sk_clut_4D_hsw+0x12000e7c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006158 <_sk_callback_hsw+0x1a0006b2>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006ed8 <_sk_clut_4D_hsw+0x1a000e84>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006160 <_sk_callback_hsw+0x30006ba>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006ee0 <_sk_clut_4D_hsw+0x3000e8c>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6144,16 +6787,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0061a8 <_sk_callback_hsw+0xa000702>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006f28 <_sk_clut_4D_hsw+0xa000ed4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120061b0 <_sk_callback_hsw+0x1200070a>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006f30 <_sk_clut_4D_hsw+0x12000edc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0061b8 <_sk_callback_hsw+0x1a000712>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006f38 <_sk_clut_4D_hsw+0x1a000ee4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30061c0 <_sk_callback_hsw+0x300071a>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006f40 <_sk_clut_4D_hsw+0x3000eec>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6196,16 +6839,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006208 <_sk_callback_hsw+0xa000762>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006f88 <_sk_clut_4D_hsw+0xa000f34>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006210 <_sk_callback_hsw+0x1200076a>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006f90 <_sk_clut_4D_hsw+0x12000f3c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006218 <_sk_callback_hsw+0x1a000772>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006f98 <_sk_clut_4D_hsw+0x1a000f44>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006220 <_sk_callback_hsw+0x300077a>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006fa0 <_sk_clut_4D_hsw+0x3000f4c>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6248,16 +6891,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006268 <_sk_callback_hsw+0xa0007c2>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006fe8 <_sk_clut_4D_hsw+0xa000f94>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006270 <_sk_callback_hsw+0x120007ca>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006ff0 <_sk_clut_4D_hsw+0x12000f9c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006278 <_sk_callback_hsw+0x1a0007d2>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006ff8 <_sk_clut_4D_hsw+0x1a000fa4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006280 <_sk_callback_hsw+0x30007da>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3007000 <_sk_clut_4D_hsw+0x3000fac>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6300,16 +6943,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0062c8 <_sk_callback_hsw+0xa000822>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a007048 <_sk_clut_4D_hsw+0xa000ff4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120062d0 <_sk_callback_hsw+0x1200082a>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12007050 <_sk_clut_4D_hsw+0x12000ffc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0062d8 <_sk_callback_hsw+0x1a000832>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a007058 <_sk_clut_4D_hsw+0x1a001004>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30062e0 <_sk_callback_hsw+0x300083a>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3007060 <_sk_clut_4D_hsw+0x300100c>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6352,16 +6995,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006328 <_sk_callback_hsw+0xa000882>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0070a8 <_sk_clut_4D_hsw+0xa001054>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006330 <_sk_callback_hsw+0x1200088a>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120070b0 <_sk_clut_4D_hsw+0x1200105c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006338 <_sk_callback_hsw+0x1a000892>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0070b8 <_sk_clut_4D_hsw+0x1a001064>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006340 <_sk_callback_hsw+0x300089a>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30070c0 <_sk_clut_4D_hsw+0x300106c>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6404,16 +7047,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006388 <_sk_callback_hsw+0xa0008e2>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a007108 <_sk_clut_4D_hsw+0xa0010b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006390 <_sk_callback_hsw+0x120008ea>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12007110 <_sk_clut_4D_hsw+0x120010bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006398 <_sk_callback_hsw+0x1a0008f2>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a007118 <_sk_clut_4D_hsw+0x1a0010c4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30063a0 <_sk_callback_hsw+0x30008fa>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3007120 <_sk_clut_4D_hsw+0x30010cc>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6614,7 +7257,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,95,123,0,0 ; vbroadcastss 0x7b5f(%rip),%ymm1 # 7cc4 <_sk_callback_avx+0x12c>
+ DB 196,226,125,24,13,231,173,0,0 ; vbroadcastss 0xade7(%rip),%ymm1 # af4c <_sk_clut_4D_avx+0x2173>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -6623,7 +7266,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,57,123,0,0 ; vbroadcastss 0x7b39(%rip),%ymm2 # 7cc8 <_sk_callback_avx+0x130>
+ DB 196,226,125,24,21,193,173,0,0 ; vbroadcastss 0xadc1(%rip),%ymm2 # af50 <_sk_clut_4D_avx+0x2177>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -6645,7 +7288,7 @@ _sk_dither_avx LABEL PROC
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,226,122,0,0 ; vbroadcastss 0x7ae2(%rip),%ymm11 # 7ccc <_sk_callback_avx+0x134>
+ DB 196,98,125,24,29,106,173,0,0 ; vbroadcastss 0xad6a(%rip),%ymm11 # af54 <_sk_clut_4D_avx+0x217b>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -6656,8 +7299,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,163,122,0,0 ; vbroadcastss 0x7aa3(%rip),%ymm12 # 7cd0 <_sk_callback_avx+0x138>
- DB 196,98,125,24,45,158,122,0,0 ; vbroadcastss 0x7a9e(%rip),%ymm13 # 7cd4 <_sk_callback_avx+0x13c>
+ DB 196,98,125,24,37,43,173,0,0 ; vbroadcastss 0xad2b(%rip),%ymm12 # af58 <_sk_clut_4D_avx+0x217f>
+ DB 196,98,125,24,45,38,173,0,0 ; vbroadcastss 0xad26(%rip),%ymm13 # af5c <_sk_clut_4D_avx+0x2183>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -6684,9 +7327,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,9,122,0,0 ; vbroadcastss 0x7a09(%rip),%ymm9 # 7cd8 <_sk_callback_avx+0x140>
+ DB 196,98,125,24,13,145,172,0,0 ; vbroadcastss 0xac91(%rip),%ymm9 # af60 <_sk_clut_4D_avx+0x2187>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,255,121,0,0 ; vbroadcastss 0x79ff(%rip),%ymm9 # 7cdc <_sk_callback_avx+0x144>
+ DB 196,98,125,24,13,135,172,0,0 ; vbroadcastss 0xac87(%rip),%ymm9 # af64 <_sk_clut_4D_avx+0x218b>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
@@ -6716,7 +7359,7 @@ _sk_uniform_color_avx LABEL PROC
PUBLIC _sk_black_color_avx
_sk_black_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,159,121,0,0 ; vbroadcastss 0x799f(%rip),%ymm3 # 7ce0 <_sk_callback_avx+0x148>
+ DB 196,226,125,24,29,39,172,0,0 ; vbroadcastss 0xac27(%rip),%ymm3 # af68 <_sk_clut_4D_avx+0x218f>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -6725,7 +7368,7 @@ _sk_black_color_avx LABEL PROC
PUBLIC _sk_white_color_avx
_sk_white_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,138,121,0,0 ; vbroadcastss 0x798a(%rip),%ymm0 # 7ce4 <_sk_callback_avx+0x14c>
+ DB 196,226,125,24,5,18,172,0,0 ; vbroadcastss 0xac12(%rip),%ymm0 # af6c <_sk_clut_4D_avx+0x2193>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -6763,7 +7406,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,45,121,0,0 ; vbroadcastss 0x792d(%rip),%ymm8 # 7ce8 <_sk_callback_avx+0x150>
+ DB 196,98,125,24,5,181,171,0,0 ; vbroadcastss 0xabb5(%rip),%ymm8 # af70 <_sk_clut_4D_avx+0x2197>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6782,7 +7425,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,239,120,0,0 ; vbroadcastss 0x78ef(%rip),%ymm9 # 7cec <_sk_callback_avx+0x154>
+ DB 196,98,125,24,13,119,171,0,0 ; vbroadcastss 0xab77(%rip),%ymm9 # af74 <_sk_clut_4D_avx+0x219b>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -6818,7 +7461,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,142,120,0,0 ; vbroadcastss 0x788e(%rip),%ymm8 # 7cf0 <_sk_callback_avx+0x158>
+ DB 196,98,125,24,5,22,171,0,0 ; vbroadcastss 0xab16(%rip),%ymm8 # af78 <_sk_clut_4D_avx+0x219f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -6829,7 +7472,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,113,120,0,0 ; vbroadcastss 0x7871(%rip),%ymm0 # 7cf4 <_sk_callback_avx+0x15c>
+ DB 196,226,125,24,5,249,170,0,0 ; vbroadcastss 0xaaf9(%rip),%ymm0 # af7c <_sk_clut_4D_avx+0x21a3>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -6840,7 +7483,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,84,120,0,0 ; vbroadcastss 0x7854(%rip),%ymm8 # 7cf8 <_sk_callback_avx+0x160>
+ DB 196,98,125,24,5,220,170,0,0 ; vbroadcastss 0xaadc(%rip),%ymm8 # af80 <_sk_clut_4D_avx+0x21a7>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6855,7 +7498,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,39,120,0,0 ; vbroadcastss 0x7827(%rip),%ymm8 # 7cfc <_sk_callback_avx+0x164>
+ DB 196,98,125,24,5,175,170,0,0 ; vbroadcastss 0xaaaf(%rip),%ymm8 # af84 <_sk_clut_4D_avx+0x21ab>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -6879,7 +7522,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,230,119,0,0 ; vbroadcastss 0x77e6(%rip),%ymm8 # 7d00 <_sk_callback_avx+0x168>
+ DB 196,98,125,24,5,110,170,0,0 ; vbroadcastss 0xaa6e(%rip),%ymm8 # af88 <_sk_clut_4D_avx+0x21af>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6933,7 +7576,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,53,119,0,0 ; vbroadcastss 0x7735(%rip),%ymm8 # 7d04 <_sk_callback_avx+0x16c>
+ DB 196,98,125,24,5,189,169,0,0 ; vbroadcastss 0xa9bd(%rip),%ymm8 # af8c <_sk_clut_4D_avx+0x21b3>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6968,7 +7611,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,181,118,0,0 ; vbroadcastss 0x76b5(%rip),%ymm8 # 7d08 <_sk_callback_avx+0x170>
+ DB 196,98,125,24,5,61,169,0,0 ; vbroadcastss 0xa93d(%rip),%ymm8 # af90 <_sk_clut_4D_avx+0x21b7>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -6992,7 +7635,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,97,118,0,0 ; vbroadcastss 0x7661(%rip),%ymm8 # 7d0c <_sk_callback_avx+0x174>
+ DB 196,98,125,24,5,233,168,0,0 ; vbroadcastss 0xa8e9(%rip),%ymm8 # af94 <_sk_clut_4D_avx+0x21bb>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7019,7 +7662,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,1,118,0,0 ; vbroadcastss 0x7601(%rip),%ymm8 # 7d10 <_sk_callback_avx+0x178>
+ DB 196,98,125,24,5,137,168,0,0 ; vbroadcastss 0xa889(%rip),%ymm8 # af98 <_sk_clut_4D_avx+0x21bf>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7040,7 +7683,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,188,117,0,0 ; vbroadcastss 0x75bc(%rip),%ymm8 # 7d14 <_sk_callback_avx+0x17c>
+ DB 196,98,125,24,5,68,168,0,0 ; vbroadcastss 0xa844(%rip),%ymm8 # af9c <_sk_clut_4D_avx+0x21c3>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7049,7 +7692,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,167,117,0,0 ; vbroadcastss 0x75a7(%rip),%ymm8 # 7d18 <_sk_callback_avx+0x180>
+ DB 196,98,125,24,5,47,168,0,0 ; vbroadcastss 0xa82f(%rip),%ymm8 # afa0 <_sk_clut_4D_avx+0x21c7>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -7109,7 +7752,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,163,116,0,0 ; vbroadcastss 0x74a3(%rip),%ymm9 # 7d1c <_sk_callback_avx+0x184>
+ DB 196,98,125,24,13,43,167,0,0 ; vbroadcastss 0xa72b(%rip),%ymm9 # afa4 <_sk_clut_4D_avx+0x21cb>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -7164,7 +7807,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,181,115,0,0 ; vbroadcastss 0x73b5(%rip),%ymm8 # 7d20 <_sk_callback_avx+0x188>
+ DB 196,98,125,24,5,61,166,0,0 ; vbroadcastss 0xa63d(%rip),%ymm8 # afa8 <_sk_clut_4D_avx+0x21cf>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7217,7 +7860,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,222,114,0,0 ; vbroadcastss 0x72de(%rip),%ymm8 # 7d24 <_sk_callback_avx+0x18c>
+ DB 196,98,125,24,5,102,165,0,0 ; vbroadcastss 0xa566(%rip),%ymm8 # afac <_sk_clut_4D_avx+0x21d3>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7282,10 +7925,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,209,113,0,0 ; vbroadcastss 0x71d1(%rip),%ymm11 # 7d2c <_sk_callback_avx+0x194>
+ DB 196,98,125,24,29,89,164,0,0 ; vbroadcastss 0xa459(%rip),%ymm11 # afb4 <_sk_clut_4D_avx+0x21db>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,194,113,0,0 ; vbroadcastss 0x71c2(%rip),%ymm13 # 7d30 <_sk_callback_avx+0x198>
+ DB 196,98,125,24,45,74,164,0,0 ; vbroadcastss 0xa44a(%rip),%ymm13 # afb8 <_sk_clut_4D_avx+0x21df>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -7296,7 +7939,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,128,113,0,0 ; vbroadcastss 0x7180(%rip),%ymm8 # 7d28 <_sk_callback_avx+0x190>
+ DB 196,98,125,24,5,8,164,0,0 ; vbroadcastss 0xa408(%rip),%ymm8 # afb0 <_sk_clut_4D_avx+0x21d7>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -7423,12 +8066,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,74,111,0,0 ; vbroadcastss 0x6f4a(%rip),%ymm14 # 7d34 <_sk_callback_avx+0x19c>
+ DB 196,98,125,24,53,210,161,0,0 ; vbroadcastss 0xa1d2(%rip),%ymm14 # afbc <_sk_clut_4D_avx+0x21e3>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,64,111,0,0 ; vbroadcastss 0x6f40(%rip),%ymm15 # 7d38 <_sk_callback_avx+0x1a0>
+ DB 196,98,125,24,61,200,161,0,0 ; vbroadcastss 0xa1c8(%rip),%ymm15 # afc0 <_sk_clut_4D_avx+0x21e7>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,49,111,0,0 ; vbroadcastss 0x6f31(%rip),%ymm0 # 7d3c <_sk_callback_avx+0x1a4>
+ DB 196,226,125,24,5,185,161,0,0 ; vbroadcastss 0xa1b9(%rip),%ymm0 # afc4 <_sk_clut_4D_avx+0x21eb>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7489,7 +8132,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,10,110,0,0 ; vbroadcastss 0x6e0a(%rip),%ymm8 # 7d40 <_sk_callback_avx+0x1a8>
+ DB 196,98,125,24,5,146,160,0,0 ; vbroadcastss 0xa092(%rip),%ymm8 # afc8 <_sk_clut_4D_avx+0x21ef>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7546,12 +8189,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,18,109,0,0 ; vbroadcastss 0x6d12(%rip),%ymm14 # 7d44 <_sk_callback_avx+0x1ac>
+ DB 196,98,125,24,53,154,159,0,0 ; vbroadcastss 0x9f9a(%rip),%ymm14 # afcc <_sk_clut_4D_avx+0x21f3>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,8,109,0,0 ; vbroadcastss 0x6d08(%rip),%ymm15 # 7d48 <_sk_callback_avx+0x1b0>
+ DB 196,98,125,24,61,144,159,0,0 ; vbroadcastss 0x9f90(%rip),%ymm15 # afd0 <_sk_clut_4D_avx+0x21f7>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,249,108,0,0 ; vbroadcastss 0x6cf9(%rip),%ymm0 # 7d4c <_sk_callback_avx+0x1b4>
+ DB 196,226,125,24,5,129,159,0,0 ; vbroadcastss 0x9f81(%rip),%ymm0 # afd4 <_sk_clut_4D_avx+0x21fb>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7612,7 +8255,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,210,107,0,0 ; vbroadcastss 0x6bd2(%rip),%ymm8 # 7d50 <_sk_callback_avx+0x1b8>
+ DB 196,98,125,24,5,90,158,0,0 ; vbroadcastss 0x9e5a(%rip),%ymm8 # afd8 <_sk_clut_4D_avx+0x21ff>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7641,12 +8284,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,98,107,0,0 ; vbroadcastss 0x6b62(%rip),%ymm13 # 7d54 <_sk_callback_avx+0x1bc>
+ DB 196,98,125,24,45,234,157,0,0 ; vbroadcastss 0x9dea(%rip),%ymm13 # afdc <_sk_clut_4D_avx+0x2203>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,88,107,0,0 ; vbroadcastss 0x6b58(%rip),%ymm14 # 7d58 <_sk_callback_avx+0x1c0>
+ DB 196,98,125,24,53,224,157,0,0 ; vbroadcastss 0x9de0(%rip),%ymm14 # afe0 <_sk_clut_4D_avx+0x2207>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,73,107,0,0 ; vbroadcastss 0x6b49(%rip),%ymm15 # 7d5c <_sk_callback_avx+0x1c4>
+ DB 196,98,125,24,61,209,157,0,0 ; vbroadcastss 0x9dd1(%rip),%ymm15 # afe4 <_sk_clut_4D_avx+0x220b>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7709,7 +8352,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,16,106,0,0 ; vbroadcastss 0x6a10(%rip),%ymm0 # 7d60 <_sk_callback_avx+0x1c8>
+ DB 196,226,125,24,5,152,156,0,0 ; vbroadcastss 0x9c98(%rip),%ymm0 # afe8 <_sk_clut_4D_avx+0x220f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7739,12 +8382,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,156,105,0,0 ; vbroadcastss 0x699c(%rip),%ymm13 # 7d64 <_sk_callback_avx+0x1cc>
+ DB 196,98,125,24,45,36,156,0,0 ; vbroadcastss 0x9c24(%rip),%ymm13 # afec <_sk_clut_4D_avx+0x2213>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,146,105,0,0 ; vbroadcastss 0x6992(%rip),%ymm14 # 7d68 <_sk_callback_avx+0x1d0>
+ DB 196,98,125,24,53,26,156,0,0 ; vbroadcastss 0x9c1a(%rip),%ymm14 # aff0 <_sk_clut_4D_avx+0x2217>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,131,105,0,0 ; vbroadcastss 0x6983(%rip),%ymm15 # 7d6c <_sk_callback_avx+0x1d4>
+ DB 196,98,125,24,61,11,156,0,0 ; vbroadcastss 0x9c0b(%rip),%ymm15 # aff4 <_sk_clut_4D_avx+0x221b>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7807,7 +8450,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,74,104,0,0 ; vbroadcastss 0x684a(%rip),%ymm0 # 7d70 <_sk_callback_avx+0x1d8>
+ DB 196,226,125,24,5,210,154,0,0 ; vbroadcastss 0x9ad2(%rip),%ymm0 # aff8 <_sk_clut_4D_avx+0x221f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7843,7 +8486,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,45,1,0,0 ; jne 16cc <_sk_srcover_rgba_8888_avx+0x158>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,124,40,13,213,109,0,0 ; vmovaps 0x6dd5(%rip),%ymm9 # 8380 <_sk_callback_avx+0x7e8>
+ DB 197,124,40,13,149,160,0,0 ; vmovaps 0xa095(%rip),%ymm9 # b640 <_sk_clut_4D_avx+0x2867>
DB 196,193,68,84,225 ; vandps %ymm9,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5
@@ -7861,9 +8504,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7
DB 196,227,53,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,104,103,0,0 ; vbroadcastss 0x6768(%rip),%ymm8 # 7d74 <_sk_callback_avx+0x1dc>
+ DB 196,98,125,24,5,240,153,0,0 ; vbroadcastss 0x99f0(%rip),%ymm8 # affc <_sk_clut_4D_avx+0x2223>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,95,103,0,0 ; vbroadcastss 0x675f(%rip),%ymm9 # 7d78 <_sk_callback_avx+0x1e0>
+ DB 196,98,125,24,13,231,153,0,0 ; vbroadcastss 0x99e7(%rip),%ymm9 # b000 <_sk_clut_4D_avx+0x2227>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -7909,9 +8552,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4
- DB 196,226,89,0,45,236,106,0,0 ; vpshufb 0x6aec(%rip),%xmm4,%xmm5 # 81e0 <_sk_callback_avx+0x648>
+ DB 196,226,89,0,45,156,157,0,0 ; vpshufb 0x9d9c(%rip),%xmm4,%xmm5 # b490 <_sk_clut_4D_avx+0x26b7>
DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5
- DB 196,226,89,0,37,238,106,0,0 ; vpshufb 0x6aee(%rip),%xmm4,%xmm4 # 81f0 <_sk_callback_avx+0x658>
+ DB 196,226,89,0,37,158,157,0,0 ; vpshufb 0x9d9e(%rip),%xmm4,%xmm4 # b4a0 <_sk_clut_4D_avx+0x26c7>
DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4
DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
@@ -7923,9 +8566,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,161,106,0,0 ; vpshufb 0x6aa1(%rip),%xmm9,%xmm10 # 81e0 <_sk_callback_avx+0x648>
+ DB 196,98,49,0,21,81,157,0,0 ; vpshufb 0x9d51(%rip),%xmm9,%xmm10 # b490 <_sk_clut_4D_avx+0x26b7>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,163,106,0,0 ; vpshufb 0x6aa3(%rip),%xmm9,%xmm9 # 81f0 <_sk_callback_avx+0x658>
+ DB 196,98,49,0,13,83,157,0,0 ; vpshufb 0x9d53(%rip),%xmm9,%xmm9 # b4a0 <_sk_clut_4D_avx+0x26c7>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
@@ -7943,7 +8586,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,244,101,0,0 ; vbroadcastss 0x65f4(%rip),%ymm8 # 7d7c <_sk_callback_avx+0x1e4>
+ DB 196,98,125,24,5,124,152,0,0 ; vbroadcastss 0x987c(%rip),%ymm8 # b004 <_sk_clut_4D_avx+0x222b>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -7953,7 +8596,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,215,101,0,0 ; vbroadcastss 0x65d7(%rip),%ymm8 # 7d80 <_sk_callback_avx+0x1e8>
+ DB 196,98,125,24,5,95,152,0,0 ; vbroadcastss 0x985f(%rip),%ymm8 # b008 <_sk_clut_4D_avx+0x222f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -7963,7 +8606,7 @@ _sk_clamp_a_avx LABEL PROC
PUBLIC _sk_clamp_a_dst_avx
_sk_clamp_a_dst_avx LABEL PROC
- DB 196,98,125,24,5,189,101,0,0 ; vbroadcastss 0x65bd(%rip),%ymm8 # 7d84 <_sk_callback_avx+0x1ec>
+ DB 196,98,125,24,5,69,152,0,0 ; vbroadcastss 0x9845(%rip),%ymm8 # b00c <_sk_clut_4D_avx+0x2233>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -7990,7 +8633,7 @@ _sk_swap_rb_avx LABEL PROC
PUBLIC _sk_invert_avx
_sk_invert_avx LABEL PROC
- DB 196,98,125,24,5,124,101,0,0 ; vbroadcastss 0x657c(%rip),%ymm8 # 7d88 <_sk_callback_avx+0x1f0>
+ DB 196,98,125,24,5,4,152,0,0 ; vbroadcastss 0x9804(%rip),%ymm8 # b010 <_sk_clut_4D_avx+0x2237>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -8036,7 +8679,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,16,101,0,0 ; vbroadcastss 0x6510(%rip),%ymm10 # 7d8c <_sk_callback_avx+0x1f4>
+ DB 196,98,125,24,21,152,151,0,0 ; vbroadcastss 0x9798(%rip),%ymm10 # b014 <_sk_clut_4D_avx+0x223b>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -8047,17 +8690,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,241,100,0,0 ; vbroadcastss 0x64f1(%rip),%ymm8 # 7d90 <_sk_callback_avx+0x1f8>
+ DB 196,98,125,24,5,121,151,0,0 ; vbroadcastss 0x9779(%rip),%ymm8 # b018 <_sk_clut_4D_avx+0x223f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,227,100,0,0 ; vbroadcastss 0x64e3(%rip),%ymm11 # 7d94 <_sk_callback_avx+0x1fc>
+ DB 196,98,125,24,29,107,151,0,0 ; vbroadcastss 0x976b(%rip),%ymm11 # b01c <_sk_clut_4D_avx+0x2243>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,217,100,0,0 ; vbroadcastss 0x64d9(%rip),%ymm13 # 7d98 <_sk_callback_avx+0x200>
+ DB 196,98,125,24,45,97,151,0,0 ; vbroadcastss 0x9761(%rip),%ymm13 # b020 <_sk_clut_4D_avx+0x2247>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,202,100,0,0 ; vbroadcastss 0x64ca(%rip),%ymm12 # 7d9c <_sk_callback_avx+0x204>
+ DB 196,98,125,24,37,82,151,0,0 ; vbroadcastss 0x9752(%rip),%ymm12 # b024 <_sk_clut_4D_avx+0x224b>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,192,100,0,0 ; vbroadcastss 0x64c0(%rip),%ymm14 # 7da0 <_sk_callback_avx+0x208>
+ DB 196,98,125,24,53,72,151,0,0 ; vbroadcastss 0x9748(%rip),%ymm14 # b028 <_sk_clut_4D_avx+0x224f>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -8081,17 +8724,17 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_from_srgb_dst_avx
_sk_from_srgb_dst_avx LABEL PROC
- DB 196,98,125,24,5,89,100,0,0 ; vbroadcastss 0x6459(%rip),%ymm8 # 7da4 <_sk_callback_avx+0x20c>
+ DB 196,98,125,24,5,225,150,0,0 ; vbroadcastss 0x96e1(%rip),%ymm8 # b02c <_sk_clut_4D_avx+0x2253>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,75,100,0,0 ; vbroadcastss 0x644b(%rip),%ymm11 # 7da8 <_sk_callback_avx+0x210>
+ DB 196,98,125,24,29,211,150,0,0 ; vbroadcastss 0x96d3(%rip),%ymm11 # b030 <_sk_clut_4D_avx+0x2257>
DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12
- DB 196,98,125,24,45,65,100,0,0 ; vbroadcastss 0x6441(%rip),%ymm13 # 7dac <_sk_callback_avx+0x214>
+ DB 196,98,125,24,45,201,150,0,0 ; vbroadcastss 0x96c9(%rip),%ymm13 # b034 <_sk_clut_4D_avx+0x225b>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,50,100,0,0 ; vbroadcastss 0x6432(%rip),%ymm12 # 7db0 <_sk_callback_avx+0x218>
+ DB 196,98,125,24,37,186,150,0,0 ; vbroadcastss 0x96ba(%rip),%ymm12 # b038 <_sk_clut_4D_avx+0x225f>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,40,100,0,0 ; vbroadcastss 0x6428(%rip),%ymm14 # 7db4 <_sk_callback_avx+0x21c>
+ DB 196,98,125,24,53,176,150,0,0 ; vbroadcastss 0x96b0(%rip),%ymm14 # b03c <_sk_clut_4D_avx+0x2263>
DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4
DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -8116,20 +8759,20 @@ _sk_from_srgb_dst_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,189,99,0,0 ; vbroadcastss 0x63bd(%rip),%ymm8 # 7db8 <_sk_callback_avx+0x220>
+ DB 196,98,125,24,5,69,150,0,0 ; vbroadcastss 0x9645(%rip),%ymm8 # b040 <_sk_clut_4D_avx+0x2267>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,179,99,0,0 ; vbroadcastss 0x63b3(%rip),%ymm11 # 7dbc <_sk_callback_avx+0x224>
+ DB 196,98,125,24,29,59,150,0,0 ; vbroadcastss 0x963b(%rip),%ymm11 # b044 <_sk_clut_4D_avx+0x226b>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,169,99,0,0 ; vbroadcastss 0x63a9(%rip),%ymm13 # 7dc0 <_sk_callback_avx+0x228>
+ DB 196,98,125,24,45,49,150,0,0 ; vbroadcastss 0x9631(%rip),%ymm13 # b048 <_sk_clut_4D_avx+0x226f>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,154,99,0,0 ; vbroadcastss 0x639a(%rip),%ymm14 # 7dc4 <_sk_callback_avx+0x22c>
+ DB 196,98,125,24,53,34,150,0,0 ; vbroadcastss 0x9622(%rip),%ymm14 # b04c <_sk_clut_4D_avx+0x2273>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,144,99,0,0 ; vbroadcastss 0x6390(%rip),%ymm15 # 7dc8 <_sk_callback_avx+0x230>
+ DB 196,98,125,24,61,24,150,0,0 ; vbroadcastss 0x9618(%rip),%ymm15 # b050 <_sk_clut_4D_avx+0x2277>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,124,99,0,0 ; vbroadcastss 0x637c(%rip),%ymm12 # 7dcc <_sk_callback_avx+0x234>
+ DB 196,98,125,24,37,4,150,0,0 ; vbroadcastss 0x9604(%rip),%ymm12 # b054 <_sk_clut_4D_avx+0x227b>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -8164,7 +8807,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,226,98,0,0 ; vbroadcastss 0x62e2(%rip),%ymm11 # 7dd0 <_sk_callback_avx+0x238>
+ DB 196,98,125,24,29,106,149,0,0 ; vbroadcastss 0x956a(%rip),%ymm11 # b058 <_sk_clut_4D_avx+0x227f>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -8174,19 +8817,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,187,98,0,0 ; vbroadcastss 0x62bb(%rip),%ymm11 # 7ddc <_sk_callback_avx+0x244>
+ DB 196,98,125,24,29,67,149,0,0 ; vbroadcastss 0x9543(%rip),%ymm11 # b064 <_sk_clut_4D_avx+0x228b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,169,98,0,0 ; vbroadcastss 0x62a9(%rip),%ymm11 # 7dd8 <_sk_callback_avx+0x240>
+ DB 196,98,125,24,29,49,149,0,0 ; vbroadcastss 0x9531(%rip),%ymm11 # b060 <_sk_clut_4D_avx+0x2287>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,145,98,0,0 ; vbroadcastss 0x6291(%rip),%ymm2 # 7dd4 <_sk_callback_avx+0x23c>
+ DB 196,226,125,24,21,25,149,0,0 ; vbroadcastss 0x9519(%rip),%ymm2 # b05c <_sk_clut_4D_avx+0x2283>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,120,98,0,0 ; vbroadcastss 0x6278(%rip),%ymm12 # 7de4 <_sk_callback_avx+0x24c>
+ DB 196,98,125,24,37,0,149,0,0 ; vbroadcastss 0x9500(%rip),%ymm12 # b06c <_sk_clut_4D_avx+0x2293>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -8196,7 +8839,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,59,98,0,0 ; vbroadcastss 0x623b(%rip),%ymm8 # 7de0 <_sk_callback_avx+0x248>
+ DB 196,98,125,24,5,195,148,0,0 ; vbroadcastss 0x94c3(%rip),%ymm8 # b068 <_sk_clut_4D_avx+0x228f>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8211,7 +8854,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,2,98,0,0 ; vbroadcastss 0x6202(%rip),%ymm8 # 7de8 <_sk_callback_avx+0x250>
+ DB 196,98,125,24,5,138,148,0,0 ; vbroadcastss 0x948a(%rip),%ymm8 # b070 <_sk_clut_4D_avx+0x2297>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -8219,23 +8862,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,220,97,0,0 ; vbroadcastss 0x61dc(%rip),%ymm11 # 7dec <_sk_callback_avx+0x254>
+ DB 196,98,125,24,29,100,148,0,0 ; vbroadcastss 0x9464(%rip),%ymm11 # b074 <_sk_clut_4D_avx+0x229b>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,198,97,0,0 ; vbroadcastss 0x61c6(%rip),%ymm12 # 7df4 <_sk_callback_avx+0x25c>
+ DB 196,98,125,24,37,78,148,0,0 ; vbroadcastss 0x944e(%rip),%ymm12 # b07c <_sk_clut_4D_avx+0x22a3>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,188,97,0,0 ; vbroadcastss 0x61bc(%rip),%ymm13 # 7df8 <_sk_callback_avx+0x260>
+ DB 196,98,125,24,45,68,148,0,0 ; vbroadcastss 0x9444(%rip),%ymm13 # b080 <_sk_clut_4D_avx+0x22a7>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,157,97,0,0 ; vbroadcastss 0x619d(%rip),%ymm1 # 7df0 <_sk_callback_avx+0x258>
+ DB 196,226,125,24,13,37,148,0,0 ; vbroadcastss 0x9425(%rip),%ymm1 # b078 <_sk_clut_4D_avx+0x229f>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,136,97,0,0 ; vbroadcastss 0x6188(%rip),%ymm14 # 7dfc <_sk_callback_avx+0x264>
+ DB 196,98,125,24,53,16,148,0,0 ; vbroadcastss 0x9410(%rip),%ymm14 # b084 <_sk_clut_4D_avx+0x22ab>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -8254,7 +8897,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,42,97,0,0 ; vbroadcastss 0x612a(%rip),%ymm0 # 7e00 <_sk_callback_avx+0x268>
+ DB 196,226,125,24,5,178,147,0,0 ; vbroadcastss 0x93b2(%rip),%ymm0 # b088 <_sk_clut_4D_avx+0x22af>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -8307,13 +8950,13 @@ _sk_scale_u8_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,75 ; jne 1de3 <_sk_scale_u8_avx+0x64>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,90,100,0,0 ; vpand 0x645a(%rip),%xmm8,%xmm8 # 8200 <_sk_callback_avx+0x668>
+ DB 197,57,219,5,10,151,0,0 ; vpand 0x970a(%rip),%xmm8,%xmm8 # b4b0 <_sk_clut_4D_avx+0x26d7>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,59,96,0,0 ; vbroadcastss 0x603b(%rip),%ymm9 # 7e04 <_sk_callback_avx+0x26c>
+ DB 196,98,125,24,13,195,146,0,0 ; vbroadcastss 0x92c3(%rip),%ymm9 # b08c <_sk_clut_4D_avx+0x22b3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -8407,13 +9050,13 @@ _sk_lerp_u8_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,111 ; jne 1f5f <_sk_lerp_u8_avx+0x88>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,18,99,0,0 ; vpand 0x6312(%rip),%xmm8,%xmm8 # 8210 <_sk_callback_avx+0x678>
+ DB 197,57,219,5,194,149,0,0 ; vpand 0x95c2(%rip),%xmm8,%xmm8 # b4c0 <_sk_clut_4D_avx+0x26e7>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,231,94,0,0 ; vbroadcastss 0x5ee7(%rip),%ymm9 # 7e08 <_sk_callback_avx+0x270>
+ DB 196,98,125,24,13,111,145,0,0 ; vbroadcastss 0x916f(%rip),%ymm9 # b090 <_sk_clut_4D_avx+0x22b7>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -8470,7 +9113,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00200c <_sk_callback_avx+0xffffffffdeffa474>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00200c <_sk_clut_4D_avx+0xffffffffdeff9233>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -8498,20 +9141,20 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,176,93,0,0 ; vbroadcastss 0x5db0(%rip),%ymm9 # 7e0c <_sk_callback_avx+0x274>
+ DB 196,98,125,24,13,56,144,0,0 ; vbroadcastss 0x9038(%rip),%ymm9 # b094 <_sk_clut_4D_avx+0x22bb>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,161,93,0,0 ; vbroadcastss 0x5da1(%rip),%ymm10 # 7e10 <_sk_callback_avx+0x278>
+ DB 196,98,125,24,21,41,144,0,0 ; vbroadcastss 0x9029(%rip),%ymm10 # b098 <_sk_clut_4D_avx+0x22bf>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,151,93,0,0 ; vbroadcastss 0x5d97(%rip),%ymm10 # 7e14 <_sk_callback_avx+0x27c>
+ DB 196,98,125,24,21,31,144,0,0 ; vbroadcastss 0x901f(%rip),%ymm10 # b09c <_sk_clut_4D_avx+0x22c3>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,136,93,0,0 ; vbroadcastss 0x5d88(%rip),%ymm11 # 7e18 <_sk_callback_avx+0x280>
+ DB 196,98,125,24,29,16,144,0,0 ; vbroadcastss 0x9010(%rip),%ymm11 # b0a0 <_sk_clut_4D_avx+0x22c7>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,126,93,0,0 ; vbroadcastss 0x5d7e(%rip),%ymm11 # 7e1c <_sk_callback_avx+0x284>
+ DB 196,98,125,24,29,6,144,0,0 ; vbroadcastss 0x9006(%rip),%ymm11 # b0a4 <_sk_clut_4D_avx+0x22cb>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,111,93,0,0 ; vbroadcastss 0x5d6f(%rip),%ymm11 # 7e20 <_sk_callback_avx+0x288>
+ DB 196,98,125,24,29,247,143,0,0 ; vbroadcastss 0x8ff7(%rip),%ymm11 # b0a8 <_sk_clut_4D_avx+0x22cf>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
@@ -8591,7 +9234,7 @@ _sk_load_tables_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,251,1,0,0 ; jne 23ca <_sk_load_tables_avx+0x21e>
DB 196,65,124,16,18 ; vmovups (%r10),%ymm10
- DB 197,124,40,13,196,97,0,0 ; vmovaps 0x61c4(%rip),%ymm9 # 83a0 <_sk_callback_avx+0x808>
+ DB 197,124,40,13,132,148,0,0 ; vmovaps 0x9484(%rip),%ymm9 # b660 <_sk_clut_4D_avx+0x2887>
DB 196,193,44,84,201 ; vandps %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,195 ; vmovq %xmm0,%r11
@@ -8683,7 +9326,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,111,90,0,0 ; vbroadcastss 0x5a6f(%rip),%ymm7 # 7e24 <_sk_callback_avx+0x28c>
+ DB 196,226,125,24,61,247,140,0,0 ; vbroadcastss 0x8cf7(%rip),%ymm7 # b0ac <_sk_clut_4D_avx+0x22d3>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -8698,9 +9341,9 @@ _sk_load_tables_avx LABEL PROC
DB 73,211,235 ; shr %cl,%r11
DB 196,193,249,110,195 ; vmovq %r11,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,46,94,0,0 ; vpshufb 0x5e2e(%rip),%xmm0,%xmm1 # 8220 <_sk_callback_avx+0x688>
+ DB 196,226,121,0,13,222,144,0,0 ; vpshufb 0x90de(%rip),%xmm0,%xmm1 # b4d0 <_sk_clut_4D_avx+0x26f7>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,48,94,0,0 ; vpshufb 0x5e30(%rip),%xmm0,%xmm0 # 8230 <_sk_callback_avx+0x698>
+ DB 196,226,121,0,5,224,144,0,0 ; vpshufb 0x90e0(%rip),%xmm0,%xmm0 # b4e0 <_sk_clut_4D_avx+0x2707>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,66,125,44,18 ; vmaskmovps (%r10),%ymm0,%ymm10
@@ -8729,7 +9372,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,191,93,0,0 ; vmovdqa 0x5dbf(%rip),%xmm10 # 8240 <_sk_callback_avx+0x6a8>
+ DB 197,121,111,21,111,144,0,0 ; vmovdqa 0x906f(%rip),%xmm10 # b4f0 <_sk_clut_4D_avx+0x2717>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -8827,7 +9470,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,174,87,0,0 ; vbroadcastss 0x57ae(%rip),%ymm7 # 7e28 <_sk_callback_avx+0x290>
+ DB 196,226,125,24,61,54,138,0,0 ; vbroadcastss 0x8a36(%rip),%ymm7 # b0b0 <_sk_clut_4D_avx+0x22d7>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -8890,7 +9533,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,190,90,0,0 ; vmovdqa 0x5abe(%rip),%xmm9 # 8250 <_sk_callback_avx+0x6b8>
+ DB 197,121,111,13,110,141,0,0 ; vmovdqa 0x8d6e(%rip),%xmm9 # b500 <_sk_clut_4D_avx+0x2727>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -8980,7 +9623,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,203,84,0,0 ; vbroadcastss 0x54cb(%rip),%ymm3 # 7e2c <_sk_callback_avx+0x294>
+ DB 196,226,125,24,29,83,135,0,0 ; vbroadcastss 0x8753(%rip),%ymm3 # b0b4 <_sk_clut_4D_avx+0x22db>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
@@ -9022,7 +9665,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,4,84,0,0 ; vbroadcastss 0x5404(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x298>
+ DB 196,98,125,24,5,140,134,0,0 ; vbroadcastss 0x868c(%rip),%ymm8 # b0b8 <_sk_clut_4D_avx+0x22df>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -9141,7 +9784,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,174,81,0,0 ; vbroadcastss 0x51ae(%rip),%ymm9 # 7e34 <_sk_callback_avx+0x29c>
+ DB 196,98,125,24,13,54,132,0,0 ; vbroadcastss 0x8436(%rip),%ymm9 # b0bc <_sk_clut_4D_avx+0x22e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -9255,7 +9898,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,143,79,0,0 ; vbroadcastss 0x4f8f(%rip),%ymm9 # 7e38 <_sk_callback_avx+0x2a0>
+ DB 196,98,125,24,13,23,130,0,0 ; vbroadcastss 0x8217(%rip),%ymm9 # b0c0 <_sk_clut_4D_avx+0x22e7>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -9450,36 +10093,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,60,76,0,0 ; vbroadcastss 0x4c3c(%rip),%ymm12 # 7e3c <_sk_callback_avx+0x2a4>
+ DB 196,98,125,24,37,196,126,0,0 ; vbroadcastss 0x7ec4(%rip),%ymm12 # b0c4 <_sk_clut_4D_avx+0x22eb>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,50,76,0,0 ; vbroadcastss 0x4c32(%rip),%ymm12 # 7e40 <_sk_callback_avx+0x2a8>
+ DB 196,98,125,24,37,186,126,0,0 ; vbroadcastss 0x7eba(%rip),%ymm12 # b0c8 <_sk_clut_4D_avx+0x22ef>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,40,76,0,0 ; vbroadcastss 0x4c28(%rip),%ymm12 # 7e44 <_sk_callback_avx+0x2ac>
+ DB 196,98,125,24,37,176,126,0,0 ; vbroadcastss 0x7eb0(%rip),%ymm12 # b0cc <_sk_clut_4D_avx+0x22f3>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,30,76,0,0 ; vbroadcastss 0x4c1e(%rip),%ymm12 # 7e48 <_sk_callback_avx+0x2b0>
+ DB 196,98,125,24,37,166,126,0,0 ; vbroadcastss 0x7ea6(%rip),%ymm12 # b0d0 <_sk_clut_4D_avx+0x22f7>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,20,76,0,0 ; vbroadcastss 0x4c14(%rip),%ymm12 # 7e4c <_sk_callback_avx+0x2b4>
+ DB 196,98,125,24,37,156,126,0,0 ; vbroadcastss 0x7e9c(%rip),%ymm12 # b0d4 <_sk_clut_4D_avx+0x22fb>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,5,76,0,0 ; vbroadcastss 0x4c05(%rip),%ymm12 # 7e50 <_sk_callback_avx+0x2b8>
+ DB 196,98,125,24,37,141,126,0,0 ; vbroadcastss 0x7e8d(%rip),%ymm12 # b0d8 <_sk_clut_4D_avx+0x22ff>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,251,75,0,0 ; vbroadcastss 0x4bfb(%rip),%ymm12 # 7e54 <_sk_callback_avx+0x2bc>
+ DB 196,98,125,24,37,131,126,0,0 ; vbroadcastss 0x7e83(%rip),%ymm12 # b0dc <_sk_clut_4D_avx+0x2303>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,223,75,0,0 ; vbroadcastss 0x4bdf(%rip),%ymm11 # 7e58 <_sk_callback_avx+0x2c0>
+ DB 196,98,125,24,29,103,126,0,0 ; vbroadcastss 0x7e67(%rip),%ymm11 # b0e0 <_sk_clut_4D_avx+0x2307>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,213,75,0,0 ; vbroadcastss 0x4bd5(%rip),%ymm11 # 7e5c <_sk_callback_avx+0x2c4>
+ DB 196,98,125,24,29,93,126,0,0 ; vbroadcastss 0x7e5d(%rip),%ymm11 # b0e4 <_sk_clut_4D_avx+0x230b>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,198,75,0,0 ; vbroadcastss 0x4bc6(%rip),%ymm11 # 7e60 <_sk_callback_avx+0x2c8>
+ DB 196,98,125,24,29,78,126,0,0 ; vbroadcastss 0x7e4e(%rip),%ymm11 # b0e8 <_sk_clut_4D_avx+0x230f>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,188,75,0,0 ; vbroadcastss 0x4bbc(%rip),%ymm11 # 7e64 <_sk_callback_avx+0x2cc>
+ DB 196,98,125,24,29,68,126,0,0 ; vbroadcastss 0x7e44(%rip),%ymm11 # b0ec <_sk_clut_4D_avx+0x2313>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,173,75,0,0 ; vbroadcastss 0x4bad(%rip),%ymm10 # 7e68 <_sk_callback_avx+0x2d0>
+ DB 196,98,125,24,21,53,126,0,0 ; vbroadcastss 0x7e35(%rip),%ymm10 # b0f0 <_sk_clut_4D_avx+0x2317>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9487,7 +10130,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,132,75,0,0 ; vbroadcastss 0x4b84(%rip),%ymm8 # 7e6c <_sk_callback_avx+0x2d4>
+ DB 196,98,125,24,5,12,126,0,0 ; vbroadcastss 0x7e0c(%rip),%ymm8 # b0f4 <_sk_clut_4D_avx+0x231b>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9507,36 +10150,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,53,75,0,0 ; vbroadcastss 0x4b35(%rip),%ymm12 # 7e70 <_sk_callback_avx+0x2d8>
+ DB 196,98,125,24,37,189,125,0,0 ; vbroadcastss 0x7dbd(%rip),%ymm12 # b0f8 <_sk_clut_4D_avx+0x231f>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,43,75,0,0 ; vbroadcastss 0x4b2b(%rip),%ymm12 # 7e74 <_sk_callback_avx+0x2dc>
+ DB 196,98,125,24,37,179,125,0,0 ; vbroadcastss 0x7db3(%rip),%ymm12 # b0fc <_sk_clut_4D_avx+0x2323>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,33,75,0,0 ; vbroadcastss 0x4b21(%rip),%ymm12 # 7e78 <_sk_callback_avx+0x2e0>
+ DB 196,98,125,24,37,169,125,0,0 ; vbroadcastss 0x7da9(%rip),%ymm12 # b100 <_sk_clut_4D_avx+0x2327>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,23,75,0,0 ; vbroadcastss 0x4b17(%rip),%ymm12 # 7e7c <_sk_callback_avx+0x2e4>
+ DB 196,98,125,24,37,159,125,0,0 ; vbroadcastss 0x7d9f(%rip),%ymm12 # b104 <_sk_clut_4D_avx+0x232b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,13,75,0,0 ; vbroadcastss 0x4b0d(%rip),%ymm12 # 7e80 <_sk_callback_avx+0x2e8>
+ DB 196,98,125,24,37,149,125,0,0 ; vbroadcastss 0x7d95(%rip),%ymm12 # b108 <_sk_clut_4D_avx+0x232f>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,254,74,0,0 ; vbroadcastss 0x4afe(%rip),%ymm12 # 7e84 <_sk_callback_avx+0x2ec>
+ DB 196,98,125,24,37,134,125,0,0 ; vbroadcastss 0x7d86(%rip),%ymm12 # b10c <_sk_clut_4D_avx+0x2333>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,244,74,0,0 ; vbroadcastss 0x4af4(%rip),%ymm12 # 7e88 <_sk_callback_avx+0x2f0>
+ DB 196,98,125,24,37,124,125,0,0 ; vbroadcastss 0x7d7c(%rip),%ymm12 # b110 <_sk_clut_4D_avx+0x2337>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,216,74,0,0 ; vbroadcastss 0x4ad8(%rip),%ymm11 # 7e8c <_sk_callback_avx+0x2f4>
+ DB 196,98,125,24,29,96,125,0,0 ; vbroadcastss 0x7d60(%rip),%ymm11 # b114 <_sk_clut_4D_avx+0x233b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,206,74,0,0 ; vbroadcastss 0x4ace(%rip),%ymm11 # 7e90 <_sk_callback_avx+0x2f8>
+ DB 196,98,125,24,29,86,125,0,0 ; vbroadcastss 0x7d56(%rip),%ymm11 # b118 <_sk_clut_4D_avx+0x233f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,191,74,0,0 ; vbroadcastss 0x4abf(%rip),%ymm11 # 7e94 <_sk_callback_avx+0x2fc>
+ DB 196,98,125,24,29,71,125,0,0 ; vbroadcastss 0x7d47(%rip),%ymm11 # b11c <_sk_clut_4D_avx+0x2343>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,181,74,0,0 ; vbroadcastss 0x4ab5(%rip),%ymm11 # 7e98 <_sk_callback_avx+0x300>
+ DB 196,98,125,24,29,61,125,0,0 ; vbroadcastss 0x7d3d(%rip),%ymm11 # b120 <_sk_clut_4D_avx+0x2347>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,166,74,0,0 ; vbroadcastss 0x4aa6(%rip),%ymm10 # 7e9c <_sk_callback_avx+0x304>
+ DB 196,98,125,24,21,46,125,0,0 ; vbroadcastss 0x7d2e(%rip),%ymm10 # b124 <_sk_clut_4D_avx+0x234b>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9544,7 +10187,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,125,74,0,0 ; vbroadcastss 0x4a7d(%rip),%ymm8 # 7ea0 <_sk_callback_avx+0x308>
+ DB 196,98,125,24,5,5,125,0,0 ; vbroadcastss 0x7d05(%rip),%ymm8 # b128 <_sk_clut_4D_avx+0x234f>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9564,36 +10207,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,46,74,0,0 ; vbroadcastss 0x4a2e(%rip),%ymm12 # 7ea4 <_sk_callback_avx+0x30c>
+ DB 196,98,125,24,37,182,124,0,0 ; vbroadcastss 0x7cb6(%rip),%ymm12 # b12c <_sk_clut_4D_avx+0x2353>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,36,74,0,0 ; vbroadcastss 0x4a24(%rip),%ymm12 # 7ea8 <_sk_callback_avx+0x310>
+ DB 196,98,125,24,37,172,124,0,0 ; vbroadcastss 0x7cac(%rip),%ymm12 # b130 <_sk_clut_4D_avx+0x2357>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,26,74,0,0 ; vbroadcastss 0x4a1a(%rip),%ymm12 # 7eac <_sk_callback_avx+0x314>
+ DB 196,98,125,24,37,162,124,0,0 ; vbroadcastss 0x7ca2(%rip),%ymm12 # b134 <_sk_clut_4D_avx+0x235b>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,16,74,0,0 ; vbroadcastss 0x4a10(%rip),%ymm12 # 7eb0 <_sk_callback_avx+0x318>
+ DB 196,98,125,24,37,152,124,0,0 ; vbroadcastss 0x7c98(%rip),%ymm12 # b138 <_sk_clut_4D_avx+0x235f>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,6,74,0,0 ; vbroadcastss 0x4a06(%rip),%ymm12 # 7eb4 <_sk_callback_avx+0x31c>
+ DB 196,98,125,24,37,142,124,0,0 ; vbroadcastss 0x7c8e(%rip),%ymm12 # b13c <_sk_clut_4D_avx+0x2363>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,247,73,0,0 ; vbroadcastss 0x49f7(%rip),%ymm12 # 7eb8 <_sk_callback_avx+0x320>
+ DB 196,98,125,24,37,127,124,0,0 ; vbroadcastss 0x7c7f(%rip),%ymm12 # b140 <_sk_clut_4D_avx+0x2367>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,237,73,0,0 ; vbroadcastss 0x49ed(%rip),%ymm12 # 7ebc <_sk_callback_avx+0x324>
+ DB 196,98,125,24,37,117,124,0,0 ; vbroadcastss 0x7c75(%rip),%ymm12 # b144 <_sk_clut_4D_avx+0x236b>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,209,73,0,0 ; vbroadcastss 0x49d1(%rip),%ymm11 # 7ec0 <_sk_callback_avx+0x328>
+ DB 196,98,125,24,29,89,124,0,0 ; vbroadcastss 0x7c59(%rip),%ymm11 # b148 <_sk_clut_4D_avx+0x236f>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,199,73,0,0 ; vbroadcastss 0x49c7(%rip),%ymm11 # 7ec4 <_sk_callback_avx+0x32c>
+ DB 196,98,125,24,29,79,124,0,0 ; vbroadcastss 0x7c4f(%rip),%ymm11 # b14c <_sk_clut_4D_avx+0x2373>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,184,73,0,0 ; vbroadcastss 0x49b8(%rip),%ymm11 # 7ec8 <_sk_callback_avx+0x330>
+ DB 196,98,125,24,29,64,124,0,0 ; vbroadcastss 0x7c40(%rip),%ymm11 # b150 <_sk_clut_4D_avx+0x2377>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,174,73,0,0 ; vbroadcastss 0x49ae(%rip),%ymm11 # 7ecc <_sk_callback_avx+0x334>
+ DB 196,98,125,24,29,54,124,0,0 ; vbroadcastss 0x7c36(%rip),%ymm11 # b154 <_sk_clut_4D_avx+0x237b>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,159,73,0,0 ; vbroadcastss 0x499f(%rip),%ymm10 # 7ed0 <_sk_callback_avx+0x338>
+ DB 196,98,125,24,21,39,124,0,0 ; vbroadcastss 0x7c27(%rip),%ymm10 # b158 <_sk_clut_4D_avx+0x237f>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9601,7 +10244,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,118,73,0,0 ; vbroadcastss 0x4976(%rip),%ymm8 # 7ed4 <_sk_callback_avx+0x33c>
+ DB 196,98,125,24,5,254,123,0,0 ; vbroadcastss 0x7bfe(%rip),%ymm8 # b15c <_sk_clut_4D_avx+0x2383>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9621,36 +10264,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,39,73,0,0 ; vbroadcastss 0x4927(%rip),%ymm12 # 7ed8 <_sk_callback_avx+0x340>
+ DB 196,98,125,24,37,175,123,0,0 ; vbroadcastss 0x7baf(%rip),%ymm12 # b160 <_sk_clut_4D_avx+0x2387>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,29,73,0,0 ; vbroadcastss 0x491d(%rip),%ymm12 # 7edc <_sk_callback_avx+0x344>
+ DB 196,98,125,24,37,165,123,0,0 ; vbroadcastss 0x7ba5(%rip),%ymm12 # b164 <_sk_clut_4D_avx+0x238b>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,19,73,0,0 ; vbroadcastss 0x4913(%rip),%ymm12 # 7ee0 <_sk_callback_avx+0x348>
+ DB 196,98,125,24,37,155,123,0,0 ; vbroadcastss 0x7b9b(%rip),%ymm12 # b168 <_sk_clut_4D_avx+0x238f>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,9,73,0,0 ; vbroadcastss 0x4909(%rip),%ymm12 # 7ee4 <_sk_callback_avx+0x34c>
+ DB 196,98,125,24,37,145,123,0,0 ; vbroadcastss 0x7b91(%rip),%ymm12 # b16c <_sk_clut_4D_avx+0x2393>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,255,72,0,0 ; vbroadcastss 0x48ff(%rip),%ymm12 # 7ee8 <_sk_callback_avx+0x350>
+ DB 196,98,125,24,37,135,123,0,0 ; vbroadcastss 0x7b87(%rip),%ymm12 # b170 <_sk_clut_4D_avx+0x2397>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,240,72,0,0 ; vbroadcastss 0x48f0(%rip),%ymm12 # 7eec <_sk_callback_avx+0x354>
+ DB 196,98,125,24,37,120,123,0,0 ; vbroadcastss 0x7b78(%rip),%ymm12 # b174 <_sk_clut_4D_avx+0x239b>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,230,72,0,0 ; vbroadcastss 0x48e6(%rip),%ymm12 # 7ef0 <_sk_callback_avx+0x358>
+ DB 196,98,125,24,37,110,123,0,0 ; vbroadcastss 0x7b6e(%rip),%ymm12 # b178 <_sk_clut_4D_avx+0x239f>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,202,72,0,0 ; vbroadcastss 0x48ca(%rip),%ymm11 # 7ef4 <_sk_callback_avx+0x35c>
+ DB 196,98,125,24,29,82,123,0,0 ; vbroadcastss 0x7b52(%rip),%ymm11 # b17c <_sk_clut_4D_avx+0x23a3>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,192,72,0,0 ; vbroadcastss 0x48c0(%rip),%ymm11 # 7ef8 <_sk_callback_avx+0x360>
+ DB 196,98,125,24,29,72,123,0,0 ; vbroadcastss 0x7b48(%rip),%ymm11 # b180 <_sk_clut_4D_avx+0x23a7>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,177,72,0,0 ; vbroadcastss 0x48b1(%rip),%ymm11 # 7efc <_sk_callback_avx+0x364>
+ DB 196,98,125,24,29,57,123,0,0 ; vbroadcastss 0x7b39(%rip),%ymm11 # b184 <_sk_clut_4D_avx+0x23ab>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,167,72,0,0 ; vbroadcastss 0x48a7(%rip),%ymm11 # 7f00 <_sk_callback_avx+0x368>
+ DB 196,98,125,24,29,47,123,0,0 ; vbroadcastss 0x7b2f(%rip),%ymm11 # b188 <_sk_clut_4D_avx+0x23af>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,152,72,0,0 ; vbroadcastss 0x4898(%rip),%ymm10 # 7f04 <_sk_callback_avx+0x36c>
+ DB 196,98,125,24,21,32,123,0,0 ; vbroadcastss 0x7b20(%rip),%ymm10 # b18c <_sk_clut_4D_avx+0x23b3>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9658,7 +10301,7 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,111,72,0,0 ; vbroadcastss 0x486f(%rip),%ymm8 # 7f08 <_sk_callback_avx+0x370>
+ DB 196,98,125,24,5,247,122,0,0 ; vbroadcastss 0x7af7(%rip),%ymm8 # b190 <_sk_clut_4D_avx+0x23b7>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9675,34 +10318,34 @@ _sk_gamma_avx LABEL PROC
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1
- DB 196,98,125,24,5,40,72,0,0 ; vbroadcastss 0x4828(%rip),%ymm8 # 7f0c <_sk_callback_avx+0x374>
+ DB 196,98,125,24,5,176,122,0,0 ; vbroadcastss 0x7ab0(%rip),%ymm8 # b194 <_sk_clut_4D_avx+0x23bb>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,30,72,0,0 ; vbroadcastss 0x481e(%rip),%ymm9 # 7f10 <_sk_callback_avx+0x378>
+ DB 196,98,125,24,13,166,122,0,0 ; vbroadcastss 0x7aa6(%rip),%ymm9 # b198 <_sk_clut_4D_avx+0x23bf>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
- DB 196,226,125,24,37,20,72,0,0 ; vbroadcastss 0x4814(%rip),%ymm4 # 7f14 <_sk_callback_avx+0x37c>
+ DB 196,226,125,24,37,156,122,0,0 ; vbroadcastss 0x7a9c(%rip),%ymm4 # b19c <_sk_clut_4D_avx+0x23c3>
DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,21,11,72,0,0 ; vbroadcastss 0x480b(%rip),%ymm10 # 7f18 <_sk_callback_avx+0x380>
+ DB 196,98,125,24,21,147,122,0,0 ; vbroadcastss 0x7a93(%rip),%ymm10 # b1a0 <_sk_clut_4D_avx+0x23c7>
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,29,1,72,0,0 ; vbroadcastss 0x4801(%rip),%ymm11 # 7f1c <_sk_callback_avx+0x384>
+ DB 196,98,125,24,29,137,122,0,0 ; vbroadcastss 0x7a89(%rip),%ymm11 # b1a4 <_sk_clut_4D_avx+0x23cb>
DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2
DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
- DB 196,98,125,24,37,243,71,0,0 ; vbroadcastss 0x47f3(%rip),%ymm12 # 7f20 <_sk_callback_avx+0x388>
+ DB 196,98,125,24,37,123,122,0,0 ; vbroadcastss 0x7a7b(%rip),%ymm12 # b1a8 <_sk_clut_4D_avx+0x23cf>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,45,233,71,0,0 ; vbroadcastss 0x47e9(%rip),%ymm13 # 7f24 <_sk_callback_avx+0x38c>
+ DB 196,98,125,24,45,113,122,0,0 ; vbroadcastss 0x7a71(%rip),%ymm13 # b1ac <_sk_clut_4D_avx+0x23d3>
DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0
DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14
DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6
- DB 196,98,125,24,61,200,71,0,0 ; vbroadcastss 0x47c8(%rip),%ymm15 # 7f28 <_sk_callback_avx+0x390>
+ DB 196,98,125,24,61,80,122,0,0 ; vbroadcastss 0x7a50(%rip),%ymm15 # b1b0 <_sk_clut_4D_avx+0x23d7>
DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
- DB 196,226,125,24,29,190,71,0,0 ; vbroadcastss 0x47be(%rip),%ymm3 # 7f2c <_sk_callback_avx+0x394>
+ DB 196,226,125,24,29,70,122,0,0 ; vbroadcastss 0x7a46(%rip),%ymm3 # b1b4 <_sk_clut_4D_avx+0x23db>
DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
- DB 196,226,125,24,21,177,71,0,0 ; vbroadcastss 0x47b1(%rip),%ymm2 # 7f30 <_sk_callback_avx+0x398>
+ DB 196,226,125,24,21,57,122,0,0 ; vbroadcastss 0x7a39(%rip),%ymm2 # b1b8 <_sk_clut_4D_avx+0x23df>
DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
- DB 196,226,125,24,53,168,71,0,0 ; vbroadcastss 0x47a8(%rip),%ymm6 # 7f34 <_sk_callback_avx+0x39c>
+ DB 196,226,125,24,53,48,122,0,0 ; vbroadcastss 0x7a30(%rip),%ymm6 # b1bc <_sk_clut_4D_avx+0x23e3>
DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0
DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
@@ -9744,7 +10387,7 @@ _sk_gamma_avx LABEL PROC
DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2
DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,236,70,0,0 ; vbroadcastss 0x46ec(%rip),%ymm2 # 7f38 <_sk_callback_avx+0x3a0>
+ DB 196,226,125,24,21,116,121,0,0 ; vbroadcastss 0x7974(%rip),%ymm2 # b1c0 <_sk_clut_4D_avx+0x23e7>
DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3
DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4
DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2
@@ -9762,31 +10405,31 @@ _sk_gamma_avx LABEL PROC
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,159,70,0,0 ; vbroadcastss 0x469f(%rip),%ymm8 # 7f3c <_sk_callback_avx+0x3a4>
+ DB 196,98,125,24,5,39,121,0,0 ; vbroadcastss 0x7927(%rip),%ymm8 # b1c4 <_sk_clut_4D_avx+0x23eb>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,149,70,0,0 ; vbroadcastss 0x4695(%rip),%ymm8 # 7f40 <_sk_callback_avx+0x3a8>
+ DB 196,98,125,24,5,29,121,0,0 ; vbroadcastss 0x791d(%rip),%ymm8 # b1c8 <_sk_clut_4D_avx+0x23ef>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,139,70,0,0 ; vbroadcastss 0x468b(%rip),%ymm9 # 7f44 <_sk_callback_avx+0x3ac>
+ DB 196,98,125,24,13,19,121,0,0 ; vbroadcastss 0x7913(%rip),%ymm9 # b1cc <_sk_clut_4D_avx+0x23f3>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,119,70,0,0 ; vbroadcastss 0x4677(%rip),%ymm8 # 7f48 <_sk_callback_avx+0x3b0>
+ DB 196,98,125,24,5,255,120,0,0 ; vbroadcastss 0x78ff(%rip),%ymm8 # b1d0 <_sk_clut_4D_avx+0x23f7>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,109,70,0,0 ; vbroadcastss 0x466d(%rip),%ymm8 # 7f4c <_sk_callback_avx+0x3b4>
+ DB 196,98,125,24,5,245,120,0,0 ; vbroadcastss 0x78f5(%rip),%ymm8 # b1d4 <_sk_clut_4D_avx+0x23fb>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,99,70,0,0 ; vbroadcastss 0x4663(%rip),%ymm8 # 7f50 <_sk_callback_avx+0x3b8>
+ DB 196,98,125,24,5,235,120,0,0 ; vbroadcastss 0x78eb(%rip),%ymm8 # b1d8 <_sk_clut_4D_avx+0x23ff>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,85,70,0,0 ; vbroadcastss 0x4655(%rip),%ymm8 # 7f54 <_sk_callback_avx+0x3bc>
+ DB 196,98,125,24,5,221,120,0,0 ; vbroadcastss 0x78dd(%rip),%ymm8 # b1dc <_sk_clut_4D_avx+0x2403>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,62,70,0,0 ; vbroadcastss 0x463e(%rip),%ymm9 # 7f58 <_sk_callback_avx+0x3c0>
+ DB 196,98,125,24,13,198,120,0,0 ; vbroadcastss 0x78c6(%rip),%ymm9 # b1e0 <_sk_clut_4D_avx+0x2407>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,51,70,0,0 ; vbroadcastss 0x4633(%rip),%ymm11 # 7f5c <_sk_callback_avx+0x3c4>
+ DB 196,98,125,24,29,187,120,0,0 ; vbroadcastss 0x78bb(%rip),%ymm11 # b1e4 <_sk_clut_4D_avx+0x240b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,41,70,0,0 ; vbroadcastss 0x4629(%rip),%ymm12 # 7f60 <_sk_callback_avx+0x3c8>
+ DB 196,98,125,24,37,177,120,0,0 ; vbroadcastss 0x78b1(%rip),%ymm12 # b1e8 <_sk_clut_4D_avx+0x240f>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -9801,9 +10444,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,223,69,0,0 ; vbroadcastss 0x45df(%rip),%ymm0 # 7f64 <_sk_callback_avx+0x3cc>
+ DB 196,226,125,24,5,103,120,0,0 ; vbroadcastss 0x7867(%rip),%ymm0 # b1ec <_sk_clut_4D_avx+0x2413>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,214,69,0,0 ; vbroadcastss 0x45d6(%rip),%ymm8 # 7f68 <_sk_callback_avx+0x3d0>
+ DB 196,98,125,24,5,94,120,0,0 ; vbroadcastss 0x785e(%rip),%ymm8 # b1f0 <_sk_clut_4D_avx+0x2417>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9820,13 +10463,13 @@ _sk_load_a8_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,67 ; jne 39f7 <_sk_load_a8_avx+0x5c>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,158,72,0,0 ; vpand 0x489e(%rip),%xmm0,%xmm0 # 8260 <_sk_callback_avx+0x6c8>
+ DB 197,249,219,5,78,123,0,0 ; vpand 0x7b4e(%rip),%xmm0,%xmm0 # b510 <_sk_clut_4D_avx+0x2737>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,138,69,0,0 ; vbroadcastss 0x458a(%rip),%ymm1 # 7f6c <_sk_callback_avx+0x3d4>
+ DB 196,226,125,24,13,18,120,0,0 ; vbroadcastss 0x7812(%rip),%ymm1 # b1f4 <_sk_clut_4D_avx+0x241b>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -9900,13 +10543,13 @@ _sk_load_a8_dst_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,67 ; jne 3b08 <_sk_load_a8_dst_avx+0x5c>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,157,71,0,0 ; vpand 0x479d(%rip),%xmm4,%xmm4 # 8270 <_sk_callback_avx+0x6d8>
+ DB 197,217,219,37,77,122,0,0 ; vpand 0x7a4d(%rip),%xmm4,%xmm4 # b520 <_sk_clut_4D_avx+0x2747>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,125,68,0,0 ; vbroadcastss 0x447d(%rip),%ymm5 # 7f70 <_sk_callback_avx+0x3d8>
+ DB 196,226,125,24,45,5,119,0,0 ; vbroadcastss 0x7705(%rip),%ymm5 # b1f8 <_sk_clut_4D_avx+0x241f>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -9955,7 +10598,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde003bb0 <_sk_callback_avx+0xffffffffddffc018>
+ DB 232,255,255,255,221 ; callq ffffffffde003bb0 <_sk_clut_4D_avx+0xffffffffddffadd7>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -10008,7 +10651,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,236,66,0,0 ; vbroadcastss 0x42ec(%rip),%ymm1 # 7f74 <_sk_callback_avx+0x3dc>
+ DB 196,226,125,24,13,116,117,0,0 ; vbroadcastss 0x7574(%rip),%ymm1 # b1fc <_sk_clut_4D_avx+0x2423>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10025,7 +10668,7 @@ _sk_store_a8_avx LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,191,66,0,0 ; vbroadcastss 0x42bf(%rip),%ymm8 # 7f78 <_sk_callback_avx+0x3e0>
+ DB 196,98,125,24,5,71,117,0,0 ; vbroadcastss 0x7547(%rip),%ymm8 # b200 <_sk_clut_4D_avx+0x2427>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -10051,13 +10694,13 @@ _sk_store_a8_avx LABEL PROC
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
DB 235,201 ; jmp 3cde <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,90,69,0,0 ; vpshufb 0x455a(%rip),%xmm8,%xmm8 # 8280 <_sk_callback_avx+0x6e8>
+ DB 196,98,57,0,5,10,120,0,0 ; vpshufb 0x780a(%rip),%xmm8,%xmm8 # b530 <_sk_clut_4D_avx+0x2757>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
DB 235,175 ; jmp 3cde <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,64,69,0,0 ; vpshufb 0x4540(%rip),%xmm8,%xmm8 # 8290 <_sk_callback_avx+0x6f8>
+ DB 196,98,57,0,5,240,119,0,0 ; vpshufb 0x77f0(%rip),%xmm8,%xmm8 # b540 <_sk_clut_4D_avx+0x2767>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
DB 235,134 ; jmp 3cde <_sk_store_a8_avx+0x42>
DB 180,255 ; mov $0xff,%ah
@@ -10092,16 +10735,16 @@ _sk_load_g8_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,72 ; jne 3dd5 <_sk_load_g8_avx+0x61>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,5,69,0,0 ; vpand 0x4505(%rip),%xmm0,%xmm0 # 82a0 <_sk_callback_avx+0x708>
+ DB 197,249,219,5,181,119,0,0 ; vpand 0x77b5(%rip),%xmm0,%xmm0 # b550 <_sk_clut_4D_avx+0x2777>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,193,65,0,0 ; vbroadcastss 0x41c1(%rip),%ymm1 # 7f7c <_sk_callback_avx+0x3e4>
+ DB 196,226,125,24,13,73,116,0,0 ; vbroadcastss 0x7449(%rip),%ymm1 # b204 <_sk_clut_4D_avx+0x242b>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,182,65,0,0 ; vbroadcastss 0x41b6(%rip),%ymm3 # 7f80 <_sk_callback_avx+0x3e8>
+ DB 196,226,125,24,29,62,116,0,0 ; vbroadcastss 0x743e(%rip),%ymm3 # b208 <_sk_clut_4D_avx+0x242f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -10147,7 +10790,7 @@ _sk_load_g8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003e7c <_sk_callback_avx+0xffffffffdeffc2e4>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003e7c <_sk_clut_4D_avx+0xffffffffdeffb0a3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10170,16 +10813,16 @@ _sk_load_g8_dst_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,72 ; jne 3ee9 <_sk_load_g8_dst_avx+0x61>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,1,68,0,0 ; vpand 0x4401(%rip),%xmm4,%xmm4 # 82b0 <_sk_callback_avx+0x718>
+ DB 197,217,219,37,177,118,0,0 ; vpand 0x76b1(%rip),%xmm4,%xmm4 # b560 <_sk_clut_4D_avx+0x2787>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,181,64,0,0 ; vbroadcastss 0x40b5(%rip),%ymm5 # 7f84 <_sk_callback_avx+0x3ec>
+ DB 196,226,125,24,45,61,115,0,0 ; vbroadcastss 0x733d(%rip),%ymm5 # b20c <_sk_clut_4D_avx+0x2433>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,170,64,0,0 ; vbroadcastss 0x40aa(%rip),%ymm7 # 7f88 <_sk_callback_avx+0x3f0>
+ DB 196,226,125,24,61,50,115,0,0 ; vbroadcastss 0x7332(%rip),%ymm7 # b210 <_sk_clut_4D_avx+0x2437>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -10225,7 +10868,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003f90 <_sk_callback_avx+0xffffffffdeffc3f8>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003f90 <_sk_clut_4D_avx+0xffffffffdeffb1b7>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10278,10 +10921,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,36,63,0,0 ; vbroadcastss 0x3f24(%rip),%ymm1 # 7f8c <_sk_callback_avx+0x3f4>
+ DB 196,226,125,24,13,172,113,0,0 ; vbroadcastss 0x71ac(%rip),%ymm1 # b214 <_sk_clut_4D_avx+0x243b>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,25,63,0,0 ; vbroadcastss 0x3f19(%rip),%ymm3 # 7f90 <_sk_callback_avx+0x3f8>
+ DB 196,226,125,24,29,161,113,0,0 ; vbroadcastss 0x71a1(%rip),%ymm3 # b218 <_sk_clut_4D_avx+0x243f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -10303,23 +10946,23 @@ _sk_load_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,209,62,0,0 ; vbroadcastss 0x3ed1(%rip),%ymm0 # 7f94 <_sk_callback_avx+0x3fc>
+ DB 196,226,125,24,5,89,113,0,0 ; vbroadcastss 0x7159(%rip),%ymm0 # b21c <_sk_clut_4D_avx+0x2443>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,196,62,0,0 ; vbroadcastss 0x3ec4(%rip),%ymm1 # 7f98 <_sk_callback_avx+0x400>
+ DB 196,226,125,24,13,76,113,0,0 ; vbroadcastss 0x714c(%rip),%ymm1 # b220 <_sk_clut_4D_avx+0x2447>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,187,62,0,0 ; vbroadcastss 0x3ebb(%rip),%ymm1 # 7f9c <_sk_callback_avx+0x404>
+ DB 196,226,125,24,13,67,113,0,0 ; vbroadcastss 0x7143(%rip),%ymm1 # b224 <_sk_clut_4D_avx+0x244b>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,174,62,0,0 ; vbroadcastss 0x3eae(%rip),%ymm3 # 7fa0 <_sk_callback_avx+0x408>
+ DB 196,226,125,24,29,54,113,0,0 ; vbroadcastss 0x7136(%rip),%ymm3 # b228 <_sk_clut_4D_avx+0x244f>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,165,62,0,0 ; vbroadcastss 0x3ea5(%rip),%ymm3 # 7fa4 <_sk_callback_avx+0x40c>
+ DB 196,226,125,24,29,45,113,0,0 ; vbroadcastss 0x712d(%rip),%ymm3 # b22c <_sk_clut_4D_avx+0x2453>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,152,62,0,0 ; vbroadcastss 0x3e98(%rip),%ymm3 # 7fa8 <_sk_callback_avx+0x410>
+ DB 196,226,125,24,29,32,113,0,0 ; vbroadcastss 0x7120(%rip),%ymm3 # b230 <_sk_clut_4D_avx+0x2457>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,141,62,0,0 ; vbroadcastss 0x3e8d(%rip),%ymm3 # 7fac <_sk_callback_avx+0x414>
+ DB 196,226,125,24,29,21,113,0,0 ; vbroadcastss 0x7115(%rip),%ymm3 # b234 <_sk_clut_4D_avx+0x245b>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10385,23 +11028,23 @@ _sk_load_565_dst_avx LABEL PROC
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- DB 196,226,125,24,37,170,61,0,0 ; vbroadcastss 0x3daa(%rip),%ymm4 # 7fb0 <_sk_callback_avx+0x418>
+ DB 196,226,125,24,37,50,112,0,0 ; vbroadcastss 0x7032(%rip),%ymm4 # b238 <_sk_clut_4D_avx+0x245f>
DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,157,61,0,0 ; vbroadcastss 0x3d9d(%rip),%ymm5 # 7fb4 <_sk_callback_avx+0x41c>
+ DB 196,226,125,24,45,37,112,0,0 ; vbroadcastss 0x7025(%rip),%ymm5 # b23c <_sk_clut_4D_avx+0x2463>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,148,61,0,0 ; vbroadcastss 0x3d94(%rip),%ymm5 # 7fb8 <_sk_callback_avx+0x420>
+ DB 196,226,125,24,45,28,112,0,0 ; vbroadcastss 0x701c(%rip),%ymm5 # b240 <_sk_clut_4D_avx+0x2467>
DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,135,61,0,0 ; vbroadcastss 0x3d87(%rip),%ymm7 # 7fbc <_sk_callback_avx+0x424>
+ DB 196,226,125,24,61,15,112,0,0 ; vbroadcastss 0x700f(%rip),%ymm7 # b244 <_sk_clut_4D_avx+0x246b>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,24,61,126,61,0,0 ; vbroadcastss 0x3d7e(%rip),%ymm7 # 7fc0 <_sk_callback_avx+0x428>
+ DB 196,226,125,24,61,6,112,0,0 ; vbroadcastss 0x7006(%rip),%ymm7 # b248 <_sk_clut_4D_avx+0x246f>
DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,113,61,0,0 ; vbroadcastss 0x3d71(%rip),%ymm7 # 7fc4 <_sk_callback_avx+0x42c>
+ DB 196,226,125,24,61,249,111,0,0 ; vbroadcastss 0x6ff9(%rip),%ymm7 # b24c <_sk_clut_4D_avx+0x2473>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,102,61,0,0 ; vbroadcastss 0x3d66(%rip),%ymm7 # 7fc8 <_sk_callback_avx+0x430>
+ DB 196,226,125,24,61,238,111,0,0 ; vbroadcastss 0x6fee(%rip),%ymm7 # b250 <_sk_clut_4D_avx+0x2477>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10499,23 +11142,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,242,59,0,0 ; vbroadcastss 0x3bf2(%rip),%ymm0 # 7fcc <_sk_callback_avx+0x434>
+ DB 196,226,125,24,5,122,110,0,0 ; vbroadcastss 0x6e7a(%rip),%ymm0 # b254 <_sk_clut_4D_avx+0x247b>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,229,59,0,0 ; vbroadcastss 0x3be5(%rip),%ymm1 # 7fd0 <_sk_callback_avx+0x438>
+ DB 196,226,125,24,13,109,110,0,0 ; vbroadcastss 0x6e6d(%rip),%ymm1 # b258 <_sk_clut_4D_avx+0x247f>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,220,59,0,0 ; vbroadcastss 0x3bdc(%rip),%ymm1 # 7fd4 <_sk_callback_avx+0x43c>
+ DB 196,226,125,24,13,100,110,0,0 ; vbroadcastss 0x6e64(%rip),%ymm1 # b25c <_sk_clut_4D_avx+0x2483>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,207,59,0,0 ; vbroadcastss 0x3bcf(%rip),%ymm3 # 7fd8 <_sk_callback_avx+0x440>
+ DB 196,226,125,24,29,87,110,0,0 ; vbroadcastss 0x6e57(%rip),%ymm3 # b260 <_sk_clut_4D_avx+0x2487>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,198,59,0,0 ; vbroadcastss 0x3bc6(%rip),%ymm3 # 7fdc <_sk_callback_avx+0x444>
+ DB 196,226,125,24,29,78,110,0,0 ; vbroadcastss 0x6e4e(%rip),%ymm3 # b264 <_sk_clut_4D_avx+0x248b>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,185,59,0,0 ; vbroadcastss 0x3bb9(%rip),%ymm3 # 7fe0 <_sk_callback_avx+0x448>
+ DB 196,226,125,24,29,65,110,0,0 ; vbroadcastss 0x6e41(%rip),%ymm3 # b268 <_sk_clut_4D_avx+0x248f>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,174,59,0,0 ; vbroadcastss 0x3bae(%rip),%ymm3 # 7fe4 <_sk_callback_avx+0x44c>
+ DB 196,226,125,24,29,54,110,0,0 ; vbroadcastss 0x6e36(%rip),%ymm3 # b26c <_sk_clut_4D_avx+0x2493>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_avx
@@ -10528,14 +11171,14 @@ _sk_store_565_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,144,59,0,0 ; vbroadcastss 0x3b90(%rip),%ymm8 # 7fe8 <_sk_callback_avx+0x450>
+ DB 196,98,125,24,5,24,110,0,0 ; vbroadcastss 0x6e18(%rip),%ymm8 # b270 <_sk_clut_4D_avx+0x2497>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,105,59,0,0 ; vbroadcastss 0x3b69(%rip),%ymm10 # 7fec <_sk_callback_avx+0x454>
+ DB 196,98,125,24,21,241,109,0,0 ; vbroadcastss 0x6df1(%rip),%ymm10 # b274 <_sk_clut_4D_avx+0x249b>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -10616,25 +11259,25 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,94,58,0,0 ; vbroadcastss 0x3a5e(%rip),%ymm0 # 7ff0 <_sk_callback_avx+0x458>
+ DB 196,226,125,24,5,230,108,0,0 ; vbroadcastss 0x6ce6(%rip),%ymm0 # b278 <_sk_clut_4D_avx+0x249f>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,81,58,0,0 ; vbroadcastss 0x3a51(%rip),%ymm1 # 7ff4 <_sk_callback_avx+0x45c>
+ DB 196,226,125,24,13,217,108,0,0 ; vbroadcastss 0x6cd9(%rip),%ymm1 # b27c <_sk_clut_4D_avx+0x24a3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,72,58,0,0 ; vbroadcastss 0x3a48(%rip),%ymm1 # 7ff8 <_sk_callback_avx+0x460>
+ DB 196,226,125,24,13,208,108,0,0 ; vbroadcastss 0x6cd0(%rip),%ymm1 # b280 <_sk_clut_4D_avx+0x24a7>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,59,58,0,0 ; vbroadcastss 0x3a3b(%rip),%ymm2 # 7ffc <_sk_callback_avx+0x464>
+ DB 196,226,125,24,21,195,108,0,0 ; vbroadcastss 0x6cc3(%rip),%ymm2 # b284 <_sk_clut_4D_avx+0x24ab>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,50,58,0,0 ; vbroadcastss 0x3a32(%rip),%ymm2 # 8000 <_sk_callback_avx+0x468>
+ DB 196,226,125,24,21,186,108,0,0 ; vbroadcastss 0x6cba(%rip),%ymm2 # b288 <_sk_clut_4D_avx+0x24af>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,37,58,0,0 ; vbroadcastss 0x3a25(%rip),%ymm8 # 8004 <_sk_callback_avx+0x46c>
+ DB 196,98,125,24,5,173,108,0,0 ; vbroadcastss 0x6cad(%rip),%ymm8 # b28c <_sk_clut_4D_avx+0x24b3>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,27,58,0,0 ; vbroadcastss 0x3a1b(%rip),%ymm8 # 8008 <_sk_callback_avx+0x470>
+ DB 196,98,125,24,5,163,108,0,0 ; vbroadcastss 0x6ca3(%rip),%ymm8 # b290 <_sk_clut_4D_avx+0x24b7>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,13,58,0,0 ; vbroadcastss 0x3a0d(%rip),%ymm8 # 800c <_sk_callback_avx+0x474>
+ DB 196,98,125,24,5,149,108,0,0 ; vbroadcastss 0x6c95(%rip),%ymm8 # b294 <_sk_clut_4D_avx+0x24bb>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10705,25 +11348,25 @@ _sk_load_4444_dst_avx LABEL PROC
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- DB 196,226,125,24,37,34,57,0,0 ; vbroadcastss 0x3922(%rip),%ymm4 # 8010 <_sk_callback_avx+0x478>
+ DB 196,226,125,24,37,170,107,0,0 ; vbroadcastss 0x6baa(%rip),%ymm4 # b298 <_sk_clut_4D_avx+0x24bf>
DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,21,57,0,0 ; vbroadcastss 0x3915(%rip),%ymm5 # 8014 <_sk_callback_avx+0x47c>
+ DB 196,226,125,24,45,157,107,0,0 ; vbroadcastss 0x6b9d(%rip),%ymm5 # b29c <_sk_clut_4D_avx+0x24c3>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,12,57,0,0 ; vbroadcastss 0x390c(%rip),%ymm5 # 8018 <_sk_callback_avx+0x480>
+ DB 196,226,125,24,45,148,107,0,0 ; vbroadcastss 0x6b94(%rip),%ymm5 # b2a0 <_sk_clut_4D_avx+0x24c7>
DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,255,56,0,0 ; vbroadcastss 0x38ff(%rip),%ymm6 # 801c <_sk_callback_avx+0x484>
+ DB 196,226,125,24,53,135,107,0,0 ; vbroadcastss 0x6b87(%rip),%ymm6 # b2a4 <_sk_clut_4D_avx+0x24cb>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,24,53,246,56,0,0 ; vbroadcastss 0x38f6(%rip),%ymm6 # 8020 <_sk_callback_avx+0x488>
+ DB 196,226,125,24,53,126,107,0,0 ; vbroadcastss 0x6b7e(%rip),%ymm6 # b2a8 <_sk_clut_4D_avx+0x24cf>
DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,233,56,0,0 ; vbroadcastss 0x38e9(%rip),%ymm8 # 8024 <_sk_callback_avx+0x48c>
+ DB 196,98,125,24,5,113,107,0,0 ; vbroadcastss 0x6b71(%rip),%ymm8 # b2ac <_sk_clut_4D_avx+0x24d3>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,24,5,223,56,0,0 ; vbroadcastss 0x38df(%rip),%ymm8 # 8028 <_sk_callback_avx+0x490>
+ DB 196,98,125,24,5,103,107,0,0 ; vbroadcastss 0x6b67(%rip),%ymm8 # b2b0 <_sk_clut_4D_avx+0x24d7>
DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,209,56,0,0 ; vbroadcastss 0x38d1(%rip),%ymm8 # 802c <_sk_callback_avx+0x494>
+ DB 196,98,125,24,5,89,107,0,0 ; vbroadcastss 0x6b59(%rip),%ymm8 # b2b4 <_sk_clut_4D_avx+0x24db>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10823,25 +11466,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,86,55,0,0 ; vbroadcastss 0x3756(%rip),%ymm0 # 8030 <_sk_callback_avx+0x498>
+ DB 196,226,125,24,5,222,105,0,0 ; vbroadcastss 0x69de(%rip),%ymm0 # b2b8 <_sk_clut_4D_avx+0x24df>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,73,55,0,0 ; vbroadcastss 0x3749(%rip),%ymm1 # 8034 <_sk_callback_avx+0x49c>
+ DB 196,226,125,24,13,209,105,0,0 ; vbroadcastss 0x69d1(%rip),%ymm1 # b2bc <_sk_clut_4D_avx+0x24e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,64,55,0,0 ; vbroadcastss 0x3740(%rip),%ymm1 # 8038 <_sk_callback_avx+0x4a0>
+ DB 196,226,125,24,13,200,105,0,0 ; vbroadcastss 0x69c8(%rip),%ymm1 # b2c0 <_sk_clut_4D_avx+0x24e7>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,51,55,0,0 ; vbroadcastss 0x3733(%rip),%ymm2 # 803c <_sk_callback_avx+0x4a4>
+ DB 196,226,125,24,21,187,105,0,0 ; vbroadcastss 0x69bb(%rip),%ymm2 # b2c4 <_sk_clut_4D_avx+0x24eb>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,42,55,0,0 ; vbroadcastss 0x372a(%rip),%ymm2 # 8040 <_sk_callback_avx+0x4a8>
+ DB 196,226,125,24,21,178,105,0,0 ; vbroadcastss 0x69b2(%rip),%ymm2 # b2c8 <_sk_clut_4D_avx+0x24ef>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,29,55,0,0 ; vbroadcastss 0x371d(%rip),%ymm8 # 8044 <_sk_callback_avx+0x4ac>
+ DB 196,98,125,24,5,165,105,0,0 ; vbroadcastss 0x69a5(%rip),%ymm8 # b2cc <_sk_clut_4D_avx+0x24f3>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,19,55,0,0 ; vbroadcastss 0x3713(%rip),%ymm8 # 8048 <_sk_callback_avx+0x4b0>
+ DB 196,98,125,24,5,155,105,0,0 ; vbroadcastss 0x699b(%rip),%ymm8 # b2d0 <_sk_clut_4D_avx+0x24f7>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,5,55,0,0 ; vbroadcastss 0x3705(%rip),%ymm8 # 804c <_sk_callback_avx+0x4b4>
+ DB 196,98,125,24,5,141,105,0,0 ; vbroadcastss 0x698d(%rip),%ymm8 # b2d4 <_sk_clut_4D_avx+0x24fb>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10856,7 +11499,7 @@ _sk_store_4444_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,224,54,0,0 ; vbroadcastss 0x36e0(%rip),%ymm8 # 8050 <_sk_callback_avx+0x4b8>
+ DB 196,98,125,24,5,104,105,0,0 ; vbroadcastss 0x6968(%rip),%ymm8 # b2d8 <_sk_clut_4D_avx+0x24ff>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -10948,10 +11591,10 @@ _sk_load_8888_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,138,0,0,0 ; jne 4b36 <_sk_load_8888_avx+0xb2>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,124,40,21,8,57,0,0 ; vmovaps 0x3908(%rip),%ymm10 # 83c0 <_sk_callback_avx+0x828>
+ DB 197,124,40,21,200,107,0,0 ; vmovaps 0x6bc8(%rip),%ymm10 # b680 <_sk_clut_4D_avx+0x28a7>
DB 196,193,100,84,194 ; vandps %ymm10,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,138,53,0,0 ; vbroadcastss 0x358a(%rip),%ymm8 # 8054 <_sk_callback_avx+0x4bc>
+ DB 196,98,125,24,5,18,104,0,0 ; vbroadcastss 0x6812(%rip),%ymm8 # b2dc <_sk_clut_4D_avx+0x2503>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9
@@ -10982,9 +11625,9 @@ _sk_load_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,194 ; vmovq %r10,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,98,55,0,0 ; vpshufb 0x3762(%rip),%xmm0,%xmm1 # 82c0 <_sk_callback_avx+0x728>
+ DB 196,226,121,0,13,18,106,0,0 ; vpshufb 0x6a12(%rip),%xmm0,%xmm1 # b570 <_sk_clut_4D_avx+0x2797>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,100,55,0,0 ; vpshufb 0x3764(%rip),%xmm0,%xmm0 # 82d0 <_sk_callback_avx+0x738>
+ DB 196,226,121,0,5,20,106,0,0 ; vpshufb 0x6a14(%rip),%xmm0,%xmm0 # b580 <_sk_clut_4D_avx+0x27a7>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,226,125,44,24 ; vmaskmovps (%rax),%ymm0,%ymm3
@@ -11005,10 +11648,10 @@ _sk_load_8888_dst_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,138,0,0,0 ; jne 4c33 <_sk_load_8888_dst_avx+0xb2>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,124,40,21,43,56,0,0 ; vmovaps 0x382b(%rip),%ymm10 # 83e0 <_sk_callback_avx+0x848>
+ DB 197,124,40,21,235,106,0,0 ; vmovaps 0x6aeb(%rip),%ymm10 # b6a0 <_sk_clut_4D_avx+0x28c7>
DB 196,193,68,84,226 ; vandps %ymm10,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,145,52,0,0 ; vbroadcastss 0x3491(%rip),%ymm8 # 8058 <_sk_callback_avx+0x4c0>
+ DB 196,98,125,24,5,25,103,0,0 ; vbroadcastss 0x6719(%rip),%ymm8 # b2e0 <_sk_clut_4D_avx+0x2507>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5
DB 196,195,125,25,249,1 ; vextractf128 $0x1,%ymm7,%xmm9
@@ -11039,9 +11682,9 @@ _sk_load_8888_dst_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4
- DB 196,226,89,0,45,133,54,0,0 ; vpshufb 0x3685(%rip),%xmm4,%xmm5 # 82e0 <_sk_callback_avx+0x748>
+ DB 196,226,89,0,45,53,105,0,0 ; vpshufb 0x6935(%rip),%xmm4,%xmm5 # b590 <_sk_clut_4D_avx+0x27b7>
DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5
- DB 196,226,89,0,37,135,54,0,0 ; vpshufb 0x3687(%rip),%xmm4,%xmm4 # 82f0 <_sk_callback_avx+0x758>
+ DB 196,226,89,0,37,55,105,0,0 ; vpshufb 0x6937(%rip),%xmm4,%xmm4 # b5a0 <_sk_clut_4D_avx+0x27c7>
DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4
DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
@@ -11082,10 +11725,10 @@ _sk_gather_8888_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,215,54,0,0 ; vmovaps 0x36d7(%rip),%ymm10 # 8400 <_sk_callback_avx+0x868>
+ DB 197,124,40,21,151,105,0,0 ; vmovaps 0x6997(%rip),%ymm10 # b6c0 <_sk_clut_4D_avx+0x28e7>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,33,51,0,0 ; vbroadcastss 0x3321(%rip),%ymm9 # 805c <_sk_callback_avx+0x4c4>
+ DB 196,98,125,24,13,169,101,0,0 ; vbroadcastss 0x65a9(%rip),%ymm9 # b2e4 <_sk_clut_4D_avx+0x250b>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -11119,7 +11762,7 @@ _sk_store_8888_avx LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,156,50,0,0 ; vbroadcastss 0x329c(%rip),%ymm8 # 8060 <_sk_callback_avx+0x4c8>
+ DB 196,98,125,24,5,36,101,0,0 ; vbroadcastss 0x6524(%rip),%ymm8 # b2e8 <_sk_clut_4D_avx+0x250f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11157,9 +11800,9 @@ _sk_store_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,131,52,0,0 ; vpshufb 0x3483(%rip),%xmm9,%xmm10 # 8300 <_sk_callback_avx+0x768>
+ DB 196,98,49,0,21,51,103,0,0 ; vpshufb 0x6733(%rip),%xmm9,%xmm10 # b5b0 <_sk_clut_4D_avx+0x27d7>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,133,52,0,0 ; vpshufb 0x3485(%rip),%xmm9,%xmm9 # 8310 <_sk_callback_avx+0x778>
+ DB 196,98,49,0,13,53,103,0,0 ; vpshufb 0x6735(%rip),%xmm9,%xmm9 # b5c0 <_sk_clut_4D_avx+0x27e7>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
@@ -11180,10 +11823,10 @@ _sk_load_bgra_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,138,0,0,0 ; jne 4f4f <_sk_load_bgra_avx+0xb2>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,124,40,21,79,53,0,0 ; vmovaps 0x354f(%rip),%ymm10 # 8420 <_sk_callback_avx+0x888>
+ DB 197,124,40,21,15,104,0,0 ; vmovaps 0x680f(%rip),%ymm10 # b6e0 <_sk_clut_4D_avx+0x2907>
DB 196,193,100,84,202 ; vandps %ymm10,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,98,125,24,5,129,49,0,0 ; vbroadcastss 0x3181(%rip),%ymm8 # 8064 <_sk_callback_avx+0x4cc>
+ DB 196,98,125,24,5,9,100,0,0 ; vbroadcastss 0x6409(%rip),%ymm8 # b2ec <_sk_clut_4D_avx+0x2513>
DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9
@@ -11214,9 +11857,9 @@ _sk_load_bgra_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,194 ; vmovq %r10,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,169,51,0,0 ; vpshufb 0x33a9(%rip),%xmm0,%xmm1 # 8320 <_sk_callback_avx+0x788>
+ DB 196,226,121,0,13,89,102,0,0 ; vpshufb 0x6659(%rip),%xmm0,%xmm1 # b5d0 <_sk_clut_4D_avx+0x27f7>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,171,51,0,0 ; vpshufb 0x33ab(%rip),%xmm0,%xmm0 # 8330 <_sk_callback_avx+0x798>
+ DB 196,226,121,0,5,91,102,0,0 ; vpshufb 0x665b(%rip),%xmm0,%xmm0 # b5e0 <_sk_clut_4D_avx+0x2807>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,226,125,44,24 ; vmaskmovps (%rax),%ymm0,%ymm3
@@ -11237,10 +11880,10 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,138,0,0,0 ; jne 504c <_sk_load_bgra_dst_avx+0xb2>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,124,40,21,114,52,0,0 ; vmovaps 0x3472(%rip),%ymm10 # 8440 <_sk_callback_avx+0x8a8>
+ DB 197,124,40,21,50,103,0,0 ; vmovaps 0x6732(%rip),%ymm10 # b700 <_sk_clut_4D_avx+0x2927>
DB 196,193,68,84,234 ; vandps %ymm10,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,98,125,24,5,136,48,0,0 ; vbroadcastss 0x3088(%rip),%ymm8 # 8068 <_sk_callback_avx+0x4d0>
+ DB 196,98,125,24,5,16,99,0,0 ; vbroadcastss 0x6310(%rip),%ymm8 # b2f0 <_sk_clut_4D_avx+0x2517>
DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6
DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5
DB 196,195,125,25,249,1 ; vextractf128 $0x1,%ymm7,%xmm9
@@ -11271,9 +11914,9 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4
- DB 196,226,89,0,45,204,50,0,0 ; vpshufb 0x32cc(%rip),%xmm4,%xmm5 # 8340 <_sk_callback_avx+0x7a8>
+ DB 196,226,89,0,45,124,101,0,0 ; vpshufb 0x657c(%rip),%xmm4,%xmm5 # b5f0 <_sk_clut_4D_avx+0x2817>
DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5
- DB 196,226,89,0,37,206,50,0,0 ; vpshufb 0x32ce(%rip),%xmm4,%xmm4 # 8350 <_sk_callback_avx+0x7b8>
+ DB 196,226,89,0,37,126,101,0,0 ; vpshufb 0x657e(%rip),%xmm4,%xmm4 # b600 <_sk_clut_4D_avx+0x2827>
DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4
DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
@@ -11314,10 +11957,10 @@ _sk_gather_bgra_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,13,30,51,0,0 ; vmovaps 0x331e(%rip),%ymm9 # 8460 <_sk_callback_avx+0x8c8>
+ DB 197,124,40,13,222,101,0,0 ; vmovaps 0x65de(%rip),%ymm9 # b720 <_sk_clut_4D_avx+0x2947>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,24,47,0,0 ; vbroadcastss 0x2f18(%rip),%ymm10 # 806c <_sk_callback_avx+0x4d4>
+ DB 196,98,125,24,21,160,97,0,0 ; vbroadcastss 0x61a0(%rip),%ymm10 # b2f4 <_sk_clut_4D_avx+0x251b>
DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2
DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
@@ -11351,7 +11994,7 @@ _sk_store_bgra_avx LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,147,46,0,0 ; vbroadcastss 0x2e93(%rip),%ymm8 # 8070 <_sk_callback_avx+0x4d8>
+ DB 196,98,125,24,5,27,97,0,0 ; vbroadcastss 0x611b(%rip),%ymm8 # b2f8 <_sk_clut_4D_avx+0x251f>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11389,9 +12032,9 @@ _sk_store_bgra_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,202,48,0,0 ; vpshufb 0x30ca(%rip),%xmm9,%xmm10 # 8360 <_sk_callback_avx+0x7c8>
+ DB 196,98,49,0,21,122,99,0,0 ; vpshufb 0x637a(%rip),%xmm9,%xmm10 # b610 <_sk_clut_4D_avx+0x2837>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,204,48,0,0 ; vpshufb 0x30cc(%rip),%xmm9,%xmm9 # 8370 <_sk_callback_avx+0x7d8>
+ DB 196,98,49,0,13,124,99,0,0 ; vpshufb 0x637c(%rip),%xmm9,%xmm9 # b620 <_sk_clut_4D_avx+0x2847>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
@@ -11430,13 +12073,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,35,45,0,0 ; vbroadcastss 0x2d23(%rip),%ymm12 # 8074 <_sk_callback_avx+0x4dc>
+ DB 196,98,125,24,37,171,95,0,0 ; vbroadcastss 0x5fab(%rip),%ymm12 # b2fc <_sk_clut_4D_avx+0x2523>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,15,45,0,0 ; vbroadcastss 0x2d0f(%rip),%xmm11 # 8078 <_sk_callback_avx+0x4e0>
+ DB 196,98,121,24,29,151,95,0,0 ; vbroadcastss 0x5f97(%rip),%xmm11 # b300 <_sk_clut_4D_avx+0x2527>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,5,45,0,0 ; vbroadcastss 0x2d05(%rip),%xmm13 # 807c <_sk_callback_avx+0x4e4>
+ DB 196,98,121,24,45,141,95,0,0 ; vbroadcastss 0x5f8d(%rip),%xmm13 # b304 <_sk_clut_4D_avx+0x252b>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11450,7 +12093,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,187,44,0,0 ; vbroadcastss 0x2cbb(%rip),%xmm3 # 8080 <_sk_callback_avx+0x4e8>
+ DB 196,226,121,24,29,67,95,0,0 ; vbroadcastss 0x5f43(%rip),%xmm3 # b308 <_sk_clut_4D_avx+0x252f>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -11600,13 +12243,13 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- DB 196,98,125,24,37,230,41,0,0 ; vbroadcastss 0x29e6(%rip),%ymm12 # 8084 <_sk_callback_avx+0x4ec>
+ DB 196,98,125,24,37,110,92,0,0 ; vbroadcastss 0x5c6e(%rip),%ymm12 # b30c <_sk_clut_4D_avx+0x2533>
DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5
DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4
DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14
- DB 196,98,121,24,29,210,41,0,0 ; vbroadcastss 0x29d2(%rip),%xmm11 # 8088 <_sk_callback_avx+0x4f0>
+ DB 196,98,121,24,29,90,92,0,0 ; vbroadcastss 0x5c5a(%rip),%xmm11 # b310 <_sk_clut_4D_avx+0x2537>
DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7
- DB 196,98,121,24,45,200,41,0,0 ; vbroadcastss 0x29c8(%rip),%xmm13 # 808c <_sk_callback_avx+0x4f4>
+ DB 196,98,121,24,45,80,92,0,0 ; vbroadcastss 0x5c50(%rip),%xmm13 # b314 <_sk_clut_4D_avx+0x253b>
DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7
DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11620,7 +12263,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4
DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5
- DB 196,226,121,24,61,126,41,0,0 ; vbroadcastss 0x297e(%rip),%xmm7 # 8090 <_sk_callback_avx+0x4f8>
+ DB 196,226,121,24,61,6,92,0,0 ; vbroadcastss 0x5c06(%rip),%xmm7 # b318 <_sk_clut_4D_avx+0x253f>
DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5
DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -11794,13 +12437,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,56,38,0,0 ; vbroadcastss 0x2638(%rip),%ymm12 # 8094 <_sk_callback_avx+0x4fc>
+ DB 196,98,125,24,37,192,88,0,0 ; vbroadcastss 0x58c0(%rip),%ymm12 # b31c <_sk_clut_4D_avx+0x2543>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,36,38,0,0 ; vbroadcastss 0x2624(%rip),%xmm11 # 8098 <_sk_callback_avx+0x500>
+ DB 196,98,121,24,29,172,88,0,0 ; vbroadcastss 0x58ac(%rip),%xmm11 # b320 <_sk_clut_4D_avx+0x2547>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,26,38,0,0 ; vbroadcastss 0x261a(%rip),%xmm13 # 809c <_sk_callback_avx+0x504>
+ DB 196,98,121,24,45,162,88,0,0 ; vbroadcastss 0x58a2(%rip),%xmm13 # b324 <_sk_clut_4D_avx+0x254b>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11814,7 +12457,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,208,37,0,0 ; vbroadcastss 0x25d0(%rip),%xmm3 # 80a0 <_sk_callback_avx+0x508>
+ DB 196,226,121,24,29,88,88,0,0 ; vbroadcastss 0x5858(%rip),%xmm3 # b328 <_sk_clut_4D_avx+0x254f>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -11912,12 +12555,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,228,35,0,0 ; vbroadcastss 0x23e4(%rip),%ymm9 # 80a4 <_sk_callback_avx+0x50c>
+ DB 196,98,125,24,13,108,86,0,0 ; vbroadcastss 0x566c(%rip),%ymm9 # b32c <_sk_clut_4D_avx+0x2553>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,202,35,0,0 ; vbroadcastss 0x23ca(%rip),%xmm8 # 80a8 <_sk_callback_avx+0x510>
+ DB 196,98,121,24,5,82,86,0,0 ; vbroadcastss 0x5652(%rip),%xmm8 # b330 <_sk_clut_4D_avx+0x2557>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -11927,7 +12570,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,145,35,0,0 ; vbroadcastss 0x2391(%rip),%ymm10 # 80ac <_sk_callback_avx+0x514>
+ DB 196,98,125,24,21,25,86,0,0 ; vbroadcastss 0x5619(%rip),%ymm10 # b334 <_sk_clut_4D_avx+0x255b>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -12080,7 +12723,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,175,32,0,0 ; vbroadcastss 0x20af(%rip),%ymm11 # 80b0 <_sk_callback_avx+0x518>
+ DB 196,98,125,24,29,55,83,0,0 ; vbroadcastss 0x5337(%rip),%ymm11 # b338 <_sk_clut_4D_avx+0x255f>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12178,7 +12821,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,246,30,0,0 ; vbroadcastss 0x1ef6(%rip),%ymm11 # 80b4 <_sk_callback_avx+0x51c>
+ DB 196,98,125,24,29,126,81,0,0 ; vbroadcastss 0x517e(%rip),%ymm11 # b33c <_sk_clut_4D_avx+0x2563>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12199,7 +12842,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,147,30,0,0 ; vbroadcastss 0x1e93(%rip),%ymm3 # 80b8 <_sk_callback_avx+0x520>
+ DB 196,226,125,24,29,27,81,0,0 ; vbroadcastss 0x511b(%rip),%ymm3 # b340 <_sk_clut_4D_avx+0x2567>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
@@ -12245,7 +12888,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,191,29,0,0 ; vbroadcastss 0x1dbf(%rip),%ymm8 # 80bc <_sk_callback_avx+0x524>
+ DB 196,98,125,24,5,71,80,0,0 ; vbroadcastss 0x5047(%rip),%ymm8 # b344 <_sk_clut_4D_avx+0x256b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -12548,7 +13191,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,227,24,0,0 ; vmulss 0x18e3(%rip),%xmm9,%xmm0 # 80c0 <_sk_callback_avx+0x528>
+ DB 197,178,89,5,107,75,0,0 ; vmulss 0x4b6b(%rip),%xmm9,%xmm0 # b348 <_sk_clut_4D_avx+0x256f>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -12580,7 +13223,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,90,24,0,0 ; vmulss 0x185a(%rip),%xmm9,%xmm1 # 80c4 <_sk_callback_avx+0x52c>
+ DB 197,178,89,13,226,74,0,0 ; vmulss 0x4ae2(%rip),%xmm9,%xmm1 # b34c <_sk_clut_4D_avx+0x2573>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -12605,7 +13248,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,244,23,0,0 ; vbroadcastss 0x17f4(%rip),%ymm8 # 80c8 <_sk_callback_avx+0x530>
+ DB 196,98,125,24,5,124,74,0,0 ; vbroadcastss 0x4a7c(%rip),%ymm8 # b350 <_sk_clut_4D_avx+0x2577>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -12619,9 +13262,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,215,23,0,0 ; vbroadcastss 0x17d7(%rip),%ymm8 # 80cc <_sk_callback_avx+0x534>
+ DB 196,98,125,24,5,95,74,0,0 ; vbroadcastss 0x4a5f(%rip),%ymm8 # b354 <_sk_clut_4D_avx+0x257b>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,205,23,0,0 ; vbroadcastss 0x17cd(%rip),%ymm9 # 80d0 <_sk_callback_avx+0x538>
+ DB 196,98,125,24,13,85,74,0,0 ; vbroadcastss 0x4a55(%rip),%ymm9 # b358 <_sk_clut_4D_avx+0x257f>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -12635,12 +13278,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,157,23,0,0 ; vbroadcastss 0x179d(%rip),%ymm3 # 80d4 <_sk_callback_avx+0x53c>
+ DB 196,226,125,24,29,37,74,0,0 ; vbroadcastss 0x4a25(%rip),%ymm3 # b35c <_sk_clut_4D_avx+0x2583>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,148,23,0,0 ; vbroadcastss 0x1794(%rip),%ymm3 # 80d8 <_sk_callback_avx+0x540>
+ DB 196,226,125,24,29,28,74,0,0 ; vbroadcastss 0x4a1c(%rip),%ymm3 # b360 <_sk_clut_4D_avx+0x2587>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,135,23,0,0 ; vbroadcastss 0x1787(%rip),%ymm1 # 80dc <_sk_callback_avx+0x544>
+ DB 196,226,125,24,13,15,74,0,0 ; vbroadcastss 0x4a0f(%rip),%ymm1 # b364 <_sk_clut_4D_avx+0x258b>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13032,18 +13675,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,104,16,0,0 ; vbroadcastss 0x1068(%rip),%ymm0 # 80e0 <_sk_callback_avx+0x548>
+ DB 196,226,125,24,5,240,66,0,0 ; vbroadcastss 0x42f0(%rip),%ymm0 # b368 <_sk_clut_4D_avx+0x258f>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,95,16,0,0 ; vbroadcastss 0x105f(%rip),%ymm1 # 80e4 <_sk_callback_avx+0x54c>
+ DB 196,226,125,24,13,231,66,0,0 ; vbroadcastss 0x42e7(%rip),%ymm1 # b36c <_sk_clut_4D_avx+0x2593>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,82,16,0,0 ; vbroadcastss 0x1052(%rip),%ymm1 # 80e8 <_sk_callback_avx+0x550>
+ DB 196,226,125,24,13,218,66,0,0 ; vbroadcastss 0x42da(%rip),%ymm1 # b370 <_sk_clut_4D_avx+0x2597>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,69,16,0,0 ; vbroadcastss 0x1045(%rip),%ymm1 # 80ec <_sk_callback_avx+0x554>
+ DB 196,226,125,24,13,205,66,0,0 ; vbroadcastss 0x42cd(%rip),%ymm1 # b374 <_sk_clut_4D_avx+0x259b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,56,16,0,0 ; vbroadcastss 0x1038(%rip),%ymm1 # 80f0 <_sk_callback_avx+0x558>
+ DB 196,226,125,24,13,192,66,0,0 ; vbroadcastss 0x42c0(%rip),%ymm1 # b378 <_sk_clut_4D_avx+0x259f>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -13070,7 +13713,7 @@ _sk_gradient_avx LABEL PROC
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,237,15,0,0 ; vbroadcastss 0xfed(%rip),%ymm10 # 80f4 <_sk_callback_avx+0x55c>
+ DB 196,98,125,24,21,117,66,0,0 ; vbroadcastss 0x4275(%rip),%ymm10 # b37c <_sk_clut_4D_avx+0x25a3>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -13262,27 +13905,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,224,11,0,0 ; vbroadcastss 0xbe0(%rip),%ymm13 # 80f8 <_sk_callback_avx+0x560>
+ DB 196,98,125,24,45,104,62,0,0 ; vbroadcastss 0x3e68(%rip),%ymm13 # b380 <_sk_clut_4D_avx+0x25a7>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,214,11,0,0 ; vbroadcastss 0xbd6(%rip),%ymm14 # 80fc <_sk_callback_avx+0x564>
+ DB 196,98,125,24,53,94,62,0,0 ; vbroadcastss 0x3e5e(%rip),%ymm14 # b384 <_sk_clut_4D_avx+0x25ab>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,199,11,0,0 ; vbroadcastss 0xbc7(%rip),%ymm14 # 8100 <_sk_callback_avx+0x568>
+ DB 196,98,125,24,53,79,62,0,0 ; vbroadcastss 0x3e4f(%rip),%ymm14 # b388 <_sk_clut_4D_avx+0x25af>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,184,11,0,0 ; vbroadcastss 0xbb8(%rip),%ymm13 # 8104 <_sk_callback_avx+0x56c>
+ DB 196,98,125,24,45,64,62,0,0 ; vbroadcastss 0x3e40(%rip),%ymm13 # b38c <_sk_clut_4D_avx+0x25b3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,163,11,0,0 ; vbroadcastss 0xba3(%rip),%ymm10 # 8108 <_sk_callback_avx+0x570>
+ DB 196,98,125,24,21,43,62,0,0 ; vbroadcastss 0x3e2b(%rip),%ymm10 # b390 <_sk_clut_4D_avx+0x25b7>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,141,11,0,0 ; vbroadcastss 0xb8d(%rip),%ymm10 # 810c <_sk_callback_avx+0x574>
+ DB 196,98,125,24,21,21,62,0,0 ; vbroadcastss 0x3e15(%rip),%ymm10 # b394 <_sk_clut_4D_avx+0x25bb>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,119,11,0,0 ; vbroadcastss 0xb77(%rip),%ymm10 # 8110 <_sk_callback_avx+0x578>
+ DB 196,98,125,24,21,255,61,0,0 ; vbroadcastss 0x3dff(%rip),%ymm10 # b398 <_sk_clut_4D_avx+0x25bf>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -13308,7 +13951,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,33,11,0,0 ; vbroadcastss 0xb21(%rip),%ymm11 # 8114 <_sk_callback_avx+0x57c>
+ DB 196,98,125,24,29,169,61,0,0 ; vbroadcastss 0x3da9(%rip),%ymm11 # b39c <_sk_clut_4D_avx+0x25c3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13317,17 +13960,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,245,10,0,0 ; vbroadcastss 0xaf5(%rip),%ymm9 # 8118 <_sk_callback_avx+0x580>
+ DB 196,98,125,24,13,125,61,0,0 ; vbroadcastss 0x3d7d(%rip),%ymm9 # b3a0 <_sk_clut_4D_avx+0x25c7>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,211,10,0,0 ; vbroadcastss 0xad3(%rip),%ymm9 # 811c <_sk_callback_avx+0x584>
+ DB 196,98,125,24,13,91,61,0,0 ; vbroadcastss 0x3d5b(%rip),%ymm9 # b3a4 <_sk_clut_4D_avx+0x25cb>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,196,10,0,0 ; vbroadcastss 0xac4(%rip),%ymm11 # 8120 <_sk_callback_avx+0x588>
+ DB 196,98,125,24,29,76,61,0,0 ; vbroadcastss 0x3d4c(%rip),%ymm11 # b3a8 <_sk_clut_4D_avx+0x25cf>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13345,7 +13988,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,131,10,0,0 ; vbroadcastss 0xa83(%rip),%ymm11 # 8124 <_sk_callback_avx+0x58c>
+ DB 196,98,125,24,29,11,61,0,0 ; vbroadcastss 0x3d0b(%rip),%ymm11 # b3ac <_sk_clut_4D_avx+0x25d3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13354,17 +13997,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,87,10,0,0 ; vbroadcastss 0xa57(%rip),%ymm9 # 8128 <_sk_callback_avx+0x590>
+ DB 196,98,125,24,13,223,60,0,0 ; vbroadcastss 0x3cdf(%rip),%ymm9 # b3b0 <_sk_clut_4D_avx+0x25d7>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,53,10,0,0 ; vbroadcastss 0xa35(%rip),%ymm9 # 812c <_sk_callback_avx+0x594>
+ DB 196,98,125,24,13,189,60,0,0 ; vbroadcastss 0x3cbd(%rip),%ymm9 # b3b4 <_sk_clut_4D_avx+0x25db>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,38,10,0,0 ; vbroadcastss 0xa26(%rip),%ymm11 # 8130 <_sk_callback_avx+0x598>
+ DB 196,98,125,24,29,174,60,0,0 ; vbroadcastss 0x3cae(%rip),%ymm11 # b3b8 <_sk_clut_4D_avx+0x25df>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13381,7 +14024,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,235,9,0,0 ; vbroadcastss 0x9eb(%rip),%ymm10 # 8134 <_sk_callback_avx+0x59c>
+ DB 196,98,125,24,21,115,60,0,0 ; vbroadcastss 0x3c73(%rip),%ymm10 # b3bc <_sk_clut_4D_avx+0x25e3>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
@@ -13390,7 +14033,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,191,9,0,0 ; vbroadcastss 0x9bf(%rip),%ymm8 # 8138 <_sk_callback_avx+0x5a0>
+ DB 196,98,125,24,5,71,60,0,0 ; vbroadcastss 0x3c47(%rip),%ymm8 # b3c0 <_sk_clut_4D_avx+0x25e7>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13425,7 +14068,7 @@ _sk_apply_vector_mask_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,91,9,0,0 ; vbroadcastss 0x95b(%rip),%ymm8 # 813c <_sk_callback_avx+0x5a4>
+ DB 196,98,125,24,5,227,59,0,0 ; vbroadcastss 0x3be3(%rip),%ymm8 # b3c4 <_sk_clut_4D_avx+0x25eb>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -13458,9 +14101,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,231,8,0,0 ; vbroadcastss 0x8e7(%rip),%ymm0 # 8140 <_sk_callback_avx+0x5a8>
+ DB 196,226,125,24,5,111,59,0,0 ; vbroadcastss 0x3b6f(%rip),%ymm0 # b3c8 <_sk_clut_4D_avx+0x25ef>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,222,8,0,0 ; vbroadcastss 0x8de(%rip),%ymm8 # 8144 <_sk_callback_avx+0x5ac>
+ DB 196,98,125,24,5,102,59,0,0 ; vbroadcastss 0x3b66(%rip),%ymm8 # b3cc <_sk_clut_4D_avx+0x25f3>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13469,7 +14112,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,198,8,0,0 ; vbroadcastss 0x8c6(%rip),%ymm0 # 8148 <_sk_callback_avx+0x5b0>
+ DB 196,226,125,24,5,78,59,0,0 ; vbroadcastss 0x3b4e(%rip),%ymm0 # b3d0 <_sk_clut_4D_avx+0x25f7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13479,9 +14122,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,170,8,0,0 ; vbroadcastss 0x8aa(%rip),%ymm1 # 814c <_sk_callback_avx+0x5b4>
+ DB 196,226,125,24,13,50,59,0,0 ; vbroadcastss 0x3b32(%rip),%ymm1 # b3d4 <_sk_clut_4D_avx+0x25fb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,160,8,0,0 ; vbroadcastss 0x8a0(%rip),%ymm8 # 8150 <_sk_callback_avx+0x5b8>
+ DB 196,98,125,24,5,40,59,0,0 ; vbroadcastss 0x3b28(%rip),%ymm8 # b3d8 <_sk_clut_4D_avx+0x25ff>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13490,7 +14133,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,136,8,0,0 ; vbroadcastss 0x888(%rip),%ymm1 # 8154 <_sk_callback_avx+0x5bc>
+ DB 196,226,125,24,13,16,59,0,0 ; vbroadcastss 0x3b10(%rip),%ymm1 # b3dc <_sk_clut_4D_avx+0x2603>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13500,14 +14143,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,107,8,0,0 ; vbroadcastss 0x86b(%rip),%ymm0 # 8158 <_sk_callback_avx+0x5c0>
+ DB 196,226,125,24,5,243,58,0,0 ; vbroadcastss 0x3af3(%rip),%ymm0 # b3e0 <_sk_clut_4D_avx+0x2607>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,98,8,0,0 ; vbroadcastss 0x862(%rip),%ymm8 # 815c <_sk_callback_avx+0x5c4>
+ DB 196,98,125,24,5,234,58,0,0 ; vbroadcastss 0x3aea(%rip),%ymm8 # b3e4 <_sk_clut_4D_avx+0x260b>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,83,8,0,0 ; vbroadcastss 0x853(%rip),%ymm10 # 8160 <_sk_callback_avx+0x5c8>
+ DB 196,98,125,24,21,219,58,0,0 ; vbroadcastss 0x3adb(%rip),%ymm10 # b3e8 <_sk_clut_4D_avx+0x260f>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,73,8,0,0 ; vbroadcastss 0x849(%rip),%ymm10 # 8164 <_sk_callback_avx+0x5cc>
+ DB 196,98,125,24,21,209,58,0,0 ; vbroadcastss 0x3ad1(%rip),%ymm10 # b3ec <_sk_clut_4D_avx+0x2613>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13517,19 +14160,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,44,8,0,0 ; vbroadcastss 0x82c(%rip),%ymm0 # 8168 <_sk_callback_avx+0x5d0>
+ DB 196,226,125,24,5,180,58,0,0 ; vbroadcastss 0x3ab4(%rip),%ymm0 # b3f0 <_sk_clut_4D_avx+0x2617>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,35,8,0,0 ; vbroadcastss 0x823(%rip),%ymm8 # 816c <_sk_callback_avx+0x5d4>
+ DB 196,98,125,24,5,171,58,0,0 ; vbroadcastss 0x3aab(%rip),%ymm8 # b3f4 <_sk_clut_4D_avx+0x261b>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,25,8,0,0 ; vbroadcastss 0x819(%rip),%ymm9 # 8170 <_sk_callback_avx+0x5d8>
+ DB 196,98,125,24,13,161,58,0,0 ; vbroadcastss 0x3aa1(%rip),%ymm9 # b3f8 <_sk_clut_4D_avx+0x261f>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,15,8,0,0 ; vbroadcastss 0x80f(%rip),%ymm10 # 8174 <_sk_callback_avx+0x5dc>
+ DB 196,98,125,24,21,151,58,0,0 ; vbroadcastss 0x3a97(%rip),%ymm10 # b3fc <_sk_clut_4D_avx+0x2623>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,0,8,0,0 ; vbroadcastss 0x800(%rip),%ymm10 # 8178 <_sk_callback_avx+0x5e0>
+ DB 196,98,125,24,21,136,58,0,0 ; vbroadcastss 0x3a88(%rip),%ymm10 # b400 <_sk_clut_4D_avx+0x2627>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,241,7,0,0 ; vbroadcastss 0x7f1(%rip),%ymm9 # 817c <_sk_callback_avx+0x5e4>
+ DB 196,98,125,24,13,121,58,0,0 ; vbroadcastss 0x3a79(%rip),%ymm9 # b404 <_sk_clut_4D_avx+0x262b>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13538,17 +14181,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,217,7,0,0 ; vbroadcastss 0x7d9(%rip),%ymm8 # 8180 <_sk_callback_avx+0x5e8>
+ DB 196,98,125,24,5,97,58,0,0 ; vbroadcastss 0x3a61(%rip),%ymm8 # b408 <_sk_clut_4D_avx+0x262f>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,203,7,0,0 ; vbroadcastss 0x7cb(%rip),%ymm10 # 8184 <_sk_callback_avx+0x5ec>
+ DB 196,98,125,24,21,83,58,0,0 ; vbroadcastss 0x3a53(%rip),%ymm10 # b40c <_sk_clut_4D_avx+0x2633>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,193,7,0,0 ; vbroadcastss 0x7c1(%rip),%ymm11 # 8188 <_sk_callback_avx+0x5f0>
+ DB 196,98,125,24,29,73,58,0,0 ; vbroadcastss 0x3a49(%rip),%ymm11 # b410 <_sk_clut_4D_avx+0x2637>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,168,7,0,0 ; vbroadcastss 0x7a8(%rip),%ymm9 # 818c <_sk_callback_avx+0x5f4>
+ DB 196,98,125,24,13,48,58,0,0 ; vbroadcastss 0x3a30(%rip),%ymm9 # b414 <_sk_clut_4D_avx+0x263b>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13557,13 +14200,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,144,7,0,0 ; vbroadcastss 0x790(%rip),%ymm0 # 8190 <_sk_callback_avx+0x5f8>
+ DB 196,226,125,24,5,24,58,0,0 ; vbroadcastss 0x3a18(%rip),%ymm0 # b418 <_sk_clut_4D_avx+0x263f>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,125,7,0,0 ; vbroadcastss 0x77d(%rip),%ymm10 # 8194 <_sk_callback_avx+0x5fc>
+ DB 196,98,125,24,21,5,58,0,0 ; vbroadcastss 0x3a05(%rip),%ymm10 # b41c <_sk_clut_4D_avx+0x2643>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,115,7,0,0 ; vbroadcastss 0x773(%rip),%ymm10 # 8198 <_sk_callback_avx+0x600>
+ DB 196,98,125,24,21,251,57,0,0 ; vbroadcastss 0x39fb(%rip),%ymm10 # b420 <_sk_clut_4D_avx+0x2647>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13573,14 +14216,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,86,7,0,0 ; vbroadcastss 0x756(%rip),%ymm1 # 819c <_sk_callback_avx+0x604>
+ DB 196,226,125,24,13,222,57,0,0 ; vbroadcastss 0x39de(%rip),%ymm1 # b424 <_sk_clut_4D_avx+0x264b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,76,7,0,0 ; vbroadcastss 0x74c(%rip),%ymm8 # 81a0 <_sk_callback_avx+0x608>
+ DB 196,98,125,24,5,212,57,0,0 ; vbroadcastss 0x39d4(%rip),%ymm8 # b428 <_sk_clut_4D_avx+0x264f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm10 # 81a4 <_sk_callback_avx+0x60c>
+ DB 196,98,125,24,21,197,57,0,0 ; vbroadcastss 0x39c5(%rip),%ymm10 # b42c <_sk_clut_4D_avx+0x2653>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,51,7,0,0 ; vbroadcastss 0x733(%rip),%ymm10 # 81a8 <_sk_callback_avx+0x610>
+ DB 196,98,125,24,21,187,57,0,0 ; vbroadcastss 0x39bb(%rip),%ymm10 # b430 <_sk_clut_4D_avx+0x2657>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13590,19 +14233,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,22,7,0,0 ; vbroadcastss 0x716(%rip),%ymm1 # 81ac <_sk_callback_avx+0x614>
+ DB 196,226,125,24,13,158,57,0,0 ; vbroadcastss 0x399e(%rip),%ymm1 # b434 <_sk_clut_4D_avx+0x265b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,12,7,0,0 ; vbroadcastss 0x70c(%rip),%ymm8 # 81b0 <_sk_callback_avx+0x618>
+ DB 196,98,125,24,5,148,57,0,0 ; vbroadcastss 0x3994(%rip),%ymm8 # b438 <_sk_clut_4D_avx+0x265f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,2,7,0,0 ; vbroadcastss 0x702(%rip),%ymm9 # 81b4 <_sk_callback_avx+0x61c>
+ DB 196,98,125,24,13,138,57,0,0 ; vbroadcastss 0x398a(%rip),%ymm9 # b43c <_sk_clut_4D_avx+0x2663>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,248,6,0,0 ; vbroadcastss 0x6f8(%rip),%ymm10 # 81b8 <_sk_callback_avx+0x620>
+ DB 196,98,125,24,21,128,57,0,0 ; vbroadcastss 0x3980(%rip),%ymm10 # b440 <_sk_clut_4D_avx+0x2667>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,233,6,0,0 ; vbroadcastss 0x6e9(%rip),%ymm10 # 81bc <_sk_callback_avx+0x624>
+ DB 196,98,125,24,21,113,57,0,0 ; vbroadcastss 0x3971(%rip),%ymm10 # b444 <_sk_clut_4D_avx+0x266b>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,218,6,0,0 ; vbroadcastss 0x6da(%rip),%ymm9 # 81c0 <_sk_callback_avx+0x628>
+ DB 196,98,125,24,13,98,57,0,0 ; vbroadcastss 0x3962(%rip),%ymm9 # b448 <_sk_clut_4D_avx+0x266f>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13611,17 +14254,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm8 # 81c4 <_sk_callback_avx+0x62c>
+ DB 196,98,125,24,5,74,57,0,0 ; vbroadcastss 0x394a(%rip),%ymm8 # b44c <_sk_clut_4D_avx+0x2673>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,179,6,0,0 ; vbroadcastss 0x6b3(%rip),%ymm10 # 81c8 <_sk_callback_avx+0x630>
+ DB 196,98,125,24,21,59,57,0,0 ; vbroadcastss 0x393b(%rip),%ymm10 # b450 <_sk_clut_4D_avx+0x2677>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,169,6,0,0 ; vbroadcastss 0x6a9(%rip),%ymm11 # 81cc <_sk_callback_avx+0x634>
+ DB 196,98,125,24,29,49,57,0,0 ; vbroadcastss 0x3931(%rip),%ymm11 # b454 <_sk_clut_4D_avx+0x267b>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,144,6,0,0 ; vbroadcastss 0x690(%rip),%ymm9 # 81d0 <_sk_callback_avx+0x638>
+ DB 196,98,125,24,13,24,57,0,0 ; vbroadcastss 0x3918(%rip),%ymm9 # b458 <_sk_clut_4D_avx+0x267f>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13630,13 +14273,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,120,6,0,0 ; vbroadcastss 0x678(%rip),%ymm1 # 81d4 <_sk_callback_avx+0x63c>
+ DB 196,226,125,24,13,0,57,0,0 ; vbroadcastss 0x3900(%rip),%ymm1 # b45c <_sk_clut_4D_avx+0x2683>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,100,6,0,0 ; vbroadcastss 0x664(%rip),%ymm10 # 81d8 <_sk_callback_avx+0x640>
+ DB 196,98,125,24,21,236,56,0,0 ; vbroadcastss 0x38ec(%rip),%ymm10 # b460 <_sk_clut_4D_avx+0x2687>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,90,6,0,0 ; vbroadcastss 0x65a(%rip),%ymm10 # 81dc <_sk_callback_avx+0x644>
+ DB 196,98,125,24,21,226,56,0,0 ; vbroadcastss 0x38e2(%rip),%ymm10 # b464 <_sk_clut_4D_avx+0x268b>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13717,6 +14360,2439 @@ _sk_callback_avx LABEL PROC
DB 93 ; pop %rbp
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_clut_3D_avx
+_sk_clut_3D_avx LABEL PROC
+ DB 65,87 ; push %r15
+ DB 65,86 ; push %r14
+ DB 83 ; push %rbx
+ DB 72,129,236,128,2,0,0 ; sub $0x280,%rsp
+ DB 197,252,17,188,36,96,2,0,0 ; vmovups %ymm7,0x260(%rsp)
+ DB 197,252,17,180,36,64,2,0,0 ; vmovups %ymm6,0x240(%rsp)
+ DB 197,252,17,172,36,32,2,0,0 ; vmovups %ymm5,0x220(%rsp)
+ DB 197,252,17,164,36,0,2,0,0 ; vmovups %ymm4,0x200(%rsp)
+ DB 197,252,17,156,36,224,1,0,0 ; vmovups %ymm3,0x1e0(%rsp)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,16 ; mov 0x10(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,218 ; vmovd %r10d,%xmm3
+ DB 197,249,112,219,0 ; vpshufd $0x0,%xmm3,%xmm3
+ DB 196,227,101,24,219,1 ; vinsertf128 $0x1,%xmm3,%ymm3,%ymm3
+ DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,252,17,148,36,128,1,0,0 ; vmovups %ymm2,0x180(%rsp)
+ DB 197,254,91,218 ; vcvttps2dq %ymm2,%ymm3
+ DB 68,139,80,12 ; mov 0xc(%rax),%r10d
+ DB 69,141,90,255 ; lea -0x1(%r10),%r11d
+ DB 196,193,121,110,211 ; vmovd %r11d,%xmm2
+ DB 197,249,112,210,0 ; vpshufd $0x0,%xmm2,%xmm2
+ DB 196,227,109,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
+ DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
+ DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
+ DB 197,252,17,140,36,128,0,0,0 ; vmovups %ymm1,0x80(%rsp)
+ DB 197,254,91,225 ; vcvttps2dq %ymm1,%ymm4
+ DB 196,193,121,110,201 ; vmovd %r9d,%xmm1
+ DB 197,121,112,233,0 ; vpshufd $0x0,%xmm1,%xmm13
+ DB 196,194,89,64,213 ; vpmulld %xmm13,%xmm4,%xmm2
+ DB 197,253,111,236 ; vmovdqa %ymm4,%ymm5
+ DB 197,254,127,172,36,224,0,0,0 ; vmovdqu %ymm5,0xe0(%rsp)
+ DB 197,249,127,148,36,32,1,0,0 ; vmovdqa %xmm2,0x120(%rsp)
+ DB 197,105,254,211 ; vpaddd %xmm3,%xmm2,%xmm10
+ DB 197,254,127,156,36,96,1,0,0 ; vmovdqu %ymm3,0x160(%rsp)
+ DB 196,193,121,110,210 ; vmovd %r10d,%xmm2
+ DB 196,226,105,64,201 ; vpmulld %xmm1,%xmm2,%xmm1
+ DB 197,121,112,241,0 ; vpshufd $0x0,%xmm1,%xmm14
+ DB 68,139,72,8 ; mov 0x8(%rax),%r9d
+ DB 65,255,201 ; dec %r9d
+ DB 196,193,121,110,201 ; vmovd %r9d,%xmm1
+ DB 197,249,112,201,0 ; vpshufd $0x0,%xmm1,%xmm1
+ DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
+ DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
+ DB 197,116,89,192 ; vmulps %ymm0,%ymm1,%ymm8
+ DB 196,193,126,91,200 ; vcvttps2dq %ymm8,%ymm1
+ DB 196,194,113,64,198 ; vpmulld %xmm14,%xmm1,%xmm0
+ DB 197,253,111,241 ; vmovdqa %ymm1,%ymm6
+ DB 197,254,127,116,36,32 ; vmovdqu %ymm6,0x20(%rsp)
+ DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp)
+ DB 72,139,0 ; mov (%rax),%rax
+ DB 196,193,121,254,194 ; vpaddd %xmm10,%xmm0,%xmm0
+ DB 196,98,121,24,29,139,54,0,0 ; vbroadcastss 0x368b(%rip),%xmm11 # b46c <_sk_clut_4D_avx+0x2693>
+ DB 196,194,121,64,203 ; vpmulld %xmm11,%xmm0,%xmm1
+ DB 196,193,249,126,201 ; vmovq %xmm1,%r9
+ DB 69,137,202 ; mov %r9d,%r10d
+ DB 196,195,249,22,203,1 ; vpextrq $0x1,%xmm1,%r11
+ DB 68,137,219 ; mov %r11d,%ebx
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,4,144 ; vmovss (%rax,%r10,4),%xmm0
+ DB 196,163,121,33,4,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm0,%xmm0
+ DB 196,227,121,33,4,152,32 ; vinsertps $0x20,(%rax,%rbx,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,152 ; vmovss (%rax,%r11,4),%xmm2
+ DB 196,227,121,33,226,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm4
+ DB 196,227,125,25,232,1 ; vextractf128 $0x1,%ymm5,%xmm0
+ DB 196,194,121,64,213 ; vpmulld %xmm13,%xmm0,%xmm2
+ DB 197,249,127,148,36,0,1,0,0 ; vmovdqa %xmm2,0x100(%rsp)
+ DB 196,227,125,25,240,1 ; vextractf128 $0x1,%ymm6,%xmm0
+ DB 196,194,121,64,238 ; vpmulld %xmm14,%xmm0,%xmm5
+ DB 197,249,127,108,36,80 ; vmovdqa %xmm5,0x50(%rsp)
+ DB 196,227,125,25,216,1 ; vextractf128 $0x1,%ymm3,%xmm0
+ DB 197,248,41,4,36 ; vmovaps %xmm0,(%rsp)
+ DB 197,233,254,192 ; vpaddd %xmm0,%xmm2,%xmm0
+ DB 197,209,254,208 ; vpaddd %xmm0,%xmm5,%xmm2
+ DB 196,194,105,64,211 ; vpmulld %xmm11,%xmm2,%xmm2
+ DB 197,249,126,211 ; vmovd %xmm2,%ebx
+ DB 196,195,121,22,209,1 ; vpextrd $0x1,%xmm2,%r9d
+ DB 196,195,121,22,210,2 ; vpextrd $0x2,%xmm2,%r10d
+ DB 196,195,121,22,211,3 ; vpextrd $0x3,%xmm2,%r11d
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,163,65,33,60,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm7,%xmm7
+ DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
+ DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,227,93,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
+ DB 197,252,17,156,36,192,0,0,0 ; vmovups %ymm3,0xc0(%rsp)
+ DB 196,98,121,24,13,204,53,0,0 ; vbroadcastss 0x35cc(%rip),%xmm9 # b470 <_sk_clut_4D_avx+0x2697>
+ DB 196,193,105,254,249 ; vpaddd %xmm9,%xmm2,%xmm7
+ DB 196,195,249,22,249,1 ; vpextrq $0x1,%xmm7,%r9
+ DB 196,193,249,126,250 ; vmovq %xmm7,%r10
+ DB 196,193,113,254,249 ; vpaddd %xmm9,%xmm1,%xmm7
+ DB 196,225,249,126,251 ; vmovq %xmm7,%rbx
+ DB 196,195,249,22,251,1 ; vpextrq $0x1,%xmm7,%r11
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,60,176 ; vmovss (%rax,%r14,4),%xmm7
+ DB 196,163,65,33,60,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm7,%xmm7
+ DB 196,161,122,16,52,184 ; vmovss (%rax,%r15,4),%xmm6
+ DB 196,227,65,33,246,32 ; vinsertps $0x20,%xmm6,%xmm7,%xmm6
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,73,33,247,48 ; vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ DB 65,137,217 ; mov %ebx,%r9d
+ DB 69,137,218 ; mov %r11d,%r10d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,65,33,60,152,16 ; vinsertps $0x10,(%rax,%rbx,4),%xmm7,%xmm7
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,65,33,237,32 ; vinsertps $0x20,%xmm5,%xmm7,%xmm5
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
+ DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
+ DB 196,99,85,24,254,1 ; vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
+ DB 196,98,121,24,37,59,53,0,0 ; vbroadcastss 0x353b(%rip),%xmm12 # b474 <_sk_clut_4D_avx+0x269b>
+ DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,113,254,204 ; vpaddd %xmm12,%xmm1,%xmm1
+ DB 196,193,249,126,203 ; vmovq %xmm1,%r11
+ DB 196,227,249,22,203,1 ; vpextrq $0x1,%xmm1,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,12,176 ; vmovss (%rax,%r14,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,113,33,202,32 ; vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,113,33,202,48 ; vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,105,33,213,32 ; vinsertps $0x20,%xmm5,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
+ DB 196,227,105,33,213,48 ; vinsertps $0x30,%xmm5,%xmm2,%xmm2
+ DB 196,227,109,24,225,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
+ DB 196,226,125,24,13,155,52,0,0 ; vbroadcastss 0x349b(%rip),%ymm1 # b468 <_sk_clut_4D_avx+0x268f>
+ DB 197,188,88,209 ; vaddps %ymm1,%ymm8,%ymm2
+ DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp)
+ DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2
+ DB 196,227,125,25,213,1 ; vextractf128 $0x1,%ymm2,%xmm5
+ DB 196,194,81,64,222 ; vpmulld %xmm14,%xmm5,%xmm3
+ DB 197,249,127,92,36,112 ; vmovdqa %xmm3,0x70(%rsp)
+ DB 196,194,105,64,214 ; vpmulld %xmm14,%xmm2,%xmm2
+ DB 197,249,127,84,36,64 ; vmovdqa %xmm2,0x40(%rsp)
+ DB 196,193,105,254,210 ; vpaddd %xmm10,%xmm2,%xmm2
+ DB 196,194,105,64,235 ; vpmulld %xmm11,%xmm2,%xmm5
+ DB 196,193,249,126,234 ; vmovq %xmm5,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,235,1 ; vpextrq $0x1,%xmm5,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,105,33,214,48 ; vinsertps $0x30,%xmm6,%xmm2,%xmm2
+ DB 197,225,254,192 ; vpaddd %xmm0,%xmm3,%xmm0
+ DB 196,194,121,64,195 ; vpmulld %xmm11,%xmm0,%xmm0
+ DB 197,249,126,195 ; vmovd %xmm0,%ebx
+ DB 196,195,121,22,193,1 ; vpextrd $0x1,%xmm0,%r9d
+ DB 196,195,121,22,194,2 ; vpextrd $0x2,%xmm0,%r10d
+ DB 196,195,121,22,195,3 ; vpextrd $0x3,%xmm0,%r11d
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,163,73,33,52,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm6,%xmm6
+ DB 196,163,73,33,52,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm6,%xmm6
+ DB 196,163,73,33,52,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm6,%xmm6
+ DB 196,227,109,24,214,1 ; vinsertf128 $0x1,%xmm6,%ymm2,%ymm2
+ DB 196,193,121,254,241 ; vpaddd %xmm9,%xmm0,%xmm6
+ DB 196,195,249,22,241,1 ; vpextrq $0x1,%xmm6,%r9
+ DB 196,193,249,126,242 ; vmovq %xmm6,%r10
+ DB 196,193,81,254,241 ; vpaddd %xmm9,%xmm5,%xmm6
+ DB 196,193,249,126,243 ; vmovq %xmm6,%r11
+ DB 196,227,249,22,243,1 ; vpextrq $0x1,%xmm6,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,52,176 ; vmovss (%rax,%r14,4),%xmm6
+ DB 196,163,73,33,52,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm6,%xmm6
+ DB 196,161,122,16,60,184 ; vmovss (%rax,%r15,4),%xmm7
+ DB 196,227,73,33,247,32 ; vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,73,33,247,48 ; vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,163,65,33,60,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,65,33,219,32 ; vinsertps $0x20,%xmm3,%xmm7,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,97,33,223,48 ; vinsertps $0x30,%xmm7,%xmm3,%xmm3
+ DB 196,99,101,24,214,1 ; vinsertf128 $0x1,%xmm6,%ymm3,%ymm10
+ DB 196,193,121,254,196 ; vpaddd %xmm12,%xmm0,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,81,254,196 ; vpaddd %xmm12,%xmm5,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,97,33,221,32 ; vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
+ DB 196,227,97,33,221,48 ; vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ DB 196,227,101,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ DB 197,252,91,92,36,32 ; vcvtdq2ps 0x20(%rsp),%ymm3
+ DB 197,60,92,243 ; vsubps %ymm3,%ymm8,%ymm14
+ DB 197,252,16,156,36,192,0,0,0 ; vmovups 0xc0(%rsp),%ymm3
+ DB 197,236,92,211 ; vsubps %ymm3,%ymm2,%ymm2
+ DB 197,140,89,210 ; vmulps %ymm2,%ymm14,%ymm2
+ DB 197,228,88,210 ; vaddps %ymm2,%ymm3,%ymm2
+ DB 197,252,17,84,36,32 ; vmovups %ymm2,0x20(%rsp)
+ DB 196,193,44,92,215 ; vsubps %ymm15,%ymm10,%ymm2
+ DB 197,140,89,210 ; vmulps %ymm2,%ymm14,%ymm2
+ DB 197,132,88,210 ; vaddps %ymm2,%ymm15,%ymm2
+ DB 197,252,17,148,36,192,1,0,0 ; vmovups %ymm2,0x1c0(%rsp)
+ DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
+ DB 197,140,89,192 ; vmulps %ymm0,%ymm14,%ymm0
+ DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
+ DB 197,252,17,132,36,160,1,0,0 ; vmovups %ymm0,0x1a0(%rsp)
+ DB 197,244,88,132,36,128,0,0,0 ; vaddps 0x80(%rsp),%ymm1,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 196,194,121,64,205 ; vpmulld %xmm13,%xmm0,%xmm1
+ DB 197,249,127,140,36,192,0,0,0 ; vmovdqa %xmm1,0xc0(%rsp)
+ DB 196,227,125,25,192,1 ; vextractf128 $0x1,%ymm0,%xmm0
+ DB 196,194,121,64,213 ; vpmulld %xmm13,%xmm0,%xmm2
+ DB 197,249,127,148,36,80,1,0,0 ; vmovdqa %xmm2,0x150(%rsp)
+ DB 197,241,254,180,36,96,1,0,0 ; vpaddd 0x160(%rsp),%xmm1,%xmm6
+ DB 197,249,111,100,36,96 ; vmovdqa 0x60(%rsp),%xmm4
+ DB 197,201,254,196 ; vpaddd %xmm4,%xmm6,%xmm0
+ DB 196,194,121,64,235 ; vpmulld %xmm11,%xmm0,%xmm5
+ DB 196,193,249,126,234 ; vmovq %xmm5,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,235,1 ; vpextrq $0x1,%xmm5,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,227,121,33,201,48 ; vinsertps $0x30,%xmm1,%xmm0,%xmm1
+ DB 197,233,254,60,36 ; vpaddd (%rsp),%xmm2,%xmm7
+ DB 197,121,111,108,36,80 ; vmovdqa 0x50(%rsp),%xmm13
+ DB 196,193,65,254,197 ; vpaddd %xmm13,%xmm7,%xmm0
+ DB 196,194,121,64,195 ; vpmulld %xmm11,%xmm0,%xmm0
+ DB 197,249,126,195 ; vmovd %xmm0,%ebx
+ DB 196,195,121,22,193,1 ; vpextrd $0x1,%xmm0,%r9d
+ DB 196,195,121,22,194,2 ; vpextrd $0x2,%xmm0,%r10d
+ DB 196,195,121,22,195,3 ; vpextrd $0x3,%xmm0,%r11d
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,163,105,33,20,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
+ DB 197,252,17,12,36 ; vmovups %ymm1,(%rsp)
+ DB 196,193,121,254,201 ; vpaddd %xmm9,%xmm0,%xmm1
+ DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
+ DB 196,193,249,126,202 ; vmovq %xmm1,%r10
+ DB 196,193,81,254,201 ; vpaddd %xmm9,%xmm5,%xmm1
+ DB 196,193,249,126,203 ; vmovq %xmm1,%r11
+ DB 196,227,249,22,203,1 ; vpextrq $0x1,%xmm1,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,12,176 ; vmovss (%rax,%r14,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,113,33,202,32 ; vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,113,33,202,48 ; vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,99,109,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm10
+ DB 196,193,121,254,196 ; vpaddd %xmm12,%xmm0,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,81,254,196 ; vpaddd %xmm12,%xmm5,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,227,109,24,232,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm5
+ DB 197,121,111,124,36,64 ; vmovdqa 0x40(%rsp),%xmm15
+ DB 197,129,254,198 ; vpaddd %xmm6,%xmm15,%xmm0
+ DB 196,194,121,64,243 ; vpmulld %xmm11,%xmm0,%xmm6
+ DB 196,193,249,126,242 ; vmovq %xmm6,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,243,1 ; vpextrq $0x1,%xmm6,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,227,121,33,210,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm2
+ DB 197,193,254,68,36,112 ; vpaddd 0x70(%rsp),%xmm7,%xmm0
+ DB 196,194,121,64,195 ; vpmulld %xmm11,%xmm0,%xmm0
+ DB 197,249,126,195 ; vmovd %xmm0,%ebx
+ DB 196,195,121,22,193,1 ; vpextrd $0x1,%xmm0,%r9d
+ DB 196,195,121,22,194,2 ; vpextrd $0x2,%xmm0,%r10d
+ DB 196,195,121,22,195,3 ; vpextrd $0x3,%xmm0,%r11d
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,163,97,33,28,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,227,109,24,251,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm7
+ DB 196,193,121,254,209 ; vpaddd %xmm9,%xmm0,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,73,254,209 ; vpaddd %xmm9,%xmm6,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,12,144 ; vmovss (%rax,%r10,4),%xmm1
+ DB 196,227,97,33,201,32 ; vinsertps $0x20,%xmm1,%xmm3,%xmm1
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,113,33,203,48 ; vinsertps $0x30,%xmm3,%xmm1,%xmm1
+ DB 196,99,117,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm8
+ DB 196,193,121,254,196 ; vpaddd %xmm12,%xmm0,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,73,254,196 ; vpaddd %xmm12,%xmm6,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,12,184 ; vmovss (%rax,%r15,4),%xmm1
+ DB 196,227,121,33,193,32 ; vinsertps $0x20,%xmm1,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,12,136 ; vmovss (%rax,%r9,4),%xmm1
+ DB 196,227,121,33,193,48 ; vinsertps $0x30,%xmm1,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,12,136 ; vmovss (%rax,%r9,4),%xmm1
+ DB 196,163,113,33,12,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,161,122,16,20,144 ; vmovss (%rax,%r10,4),%xmm2
+ DB 196,227,113,33,202,32 ; vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,227,113,33,202,48 ; vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
+ DB 197,252,16,20,36 ; vmovups (%rsp),%ymm2
+ DB 197,196,92,202 ; vsubps %ymm2,%ymm7,%ymm1
+ DB 197,140,89,201 ; vmulps %ymm1,%ymm14,%ymm1
+ DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
+ DB 196,193,60,92,210 ; vsubps %ymm10,%ymm8,%ymm2
+ DB 197,140,89,210 ; vmulps %ymm2,%ymm14,%ymm2
+ DB 197,172,88,210 ; vaddps %ymm2,%ymm10,%ymm2
+ DB 197,252,92,197 ; vsubps %ymm5,%ymm0,%ymm0
+ DB 197,140,89,192 ; vmulps %ymm0,%ymm14,%ymm0
+ DB 197,212,88,192 ; vaddps %ymm0,%ymm5,%ymm0
+ DB 197,252,91,156,36,224,0,0,0 ; vcvtdq2ps 0xe0(%rsp),%ymm3
+ DB 197,252,16,172,36,128,0,0,0 ; vmovups 0x80(%rsp),%ymm5
+ DB 197,212,92,219 ; vsubps %ymm3,%ymm5,%ymm3
+ DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
+ DB 197,252,16,108,36,32 ; vmovups 0x20(%rsp),%ymm5
+ DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,212,88,201 ; vaddps %ymm1,%ymm5,%ymm1
+ DB 197,252,17,140,36,128,0,0,0 ; vmovups %ymm1,0x80(%rsp)
+ DB 197,252,16,172,36,192,1,0,0 ; vmovups 0x1c0(%rsp),%ymm5
+ DB 197,236,92,205 ; vsubps %ymm5,%ymm2,%ymm1
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,212,88,201 ; vaddps %ymm1,%ymm5,%ymm1
+ DB 197,252,17,140,36,224,0,0,0 ; vmovups %ymm1,0xe0(%rsp)
+ DB 197,252,16,140,36,160,1,0,0 ; vmovups 0x1a0(%rsp),%ymm1
+ DB 197,252,92,193 ; vsubps %ymm1,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
+ DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
+ DB 197,252,16,132,36,160,0,0,0 ; vmovups 0xa0(%rsp),%ymm0
+ DB 197,252,88,132,36,128,1,0,0 ; vaddps 0x180(%rsp),%ymm0,%ymm0
+ DB 197,126,91,192 ; vcvttps2dq %ymm0,%ymm8
+ DB 197,185,254,188,36,32,1,0,0 ; vpaddd 0x120(%rsp),%xmm8,%xmm7
+ DB 197,217,254,199 ; vpaddd %xmm7,%xmm4,%xmm0
+ DB 196,194,121,64,243 ; vpmulld %xmm11,%xmm0,%xmm6
+ DB 196,193,249,126,242 ; vmovq %xmm6,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,243,1 ; vpextrq $0x1,%xmm6,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,227,121,33,217,48 ; vinsertps $0x30,%xmm1,%xmm0,%xmm3
+ DB 196,99,125,25,192,1 ; vextractf128 $0x1,%ymm8,%xmm0
+ DB 197,248,41,132,36,160,0,0,0 ; vmovaps %xmm0,0xa0(%rsp)
+ DB 197,249,254,140,36,0,1,0,0 ; vpaddd 0x100(%rsp),%xmm0,%xmm1
+ DB 197,145,254,193 ; vpaddd %xmm1,%xmm13,%xmm0
+ DB 196,194,121,64,195 ; vpmulld %xmm11,%xmm0,%xmm0
+ DB 197,249,126,195 ; vmovd %xmm0,%ebx
+ DB 196,195,121,22,193,1 ; vpextrd $0x1,%xmm0,%r9d
+ DB 196,195,121,22,194,2 ; vpextrd $0x2,%xmm0,%r10d
+ DB 196,195,121,22,195,3 ; vpextrd $0x3,%xmm0,%r11d
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,163,105,33,20,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,227,101,24,226,1 ; vinsertf128 $0x1,%xmm2,%ymm3,%ymm4
+ DB 196,193,121,254,209 ; vpaddd %xmm9,%xmm0,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,73,254,209 ; vpaddd %xmm9,%xmm6,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,97,33,221,32 ; vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
+ DB 196,227,97,33,221,48 ; vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ DB 196,99,101,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm3,%ymm10
+ DB 196,193,121,254,196 ; vpaddd %xmm12,%xmm0,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,73,254,196 ; vpaddd %xmm12,%xmm6,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,99,109,24,232,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm13
+ DB 197,129,254,199 ; vpaddd %xmm7,%xmm15,%xmm0
+ DB 196,194,121,64,243 ; vpmulld %xmm11,%xmm0,%xmm6
+ DB 196,193,249,126,242 ; vmovq %xmm6,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,243,1 ; vpextrq $0x1,%xmm6,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 197,121,111,124,36,112 ; vmovdqa 0x70(%rsp),%xmm15
+ DB 197,129,254,201 ; vpaddd %xmm1,%xmm15,%xmm1
+ DB 196,194,113,64,251 ; vpmulld %xmm11,%xmm1,%xmm7
+ DB 197,249,126,251 ; vmovd %xmm7,%ebx
+ DB 196,195,121,22,249,1 ; vpextrd $0x1,%xmm7,%r9d
+ DB 196,195,121,22,250,2 ; vpextrd $0x2,%xmm7,%r10d
+ DB 196,195,121,22,251,3 ; vpextrd $0x3,%xmm7,%r11d
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,227,125,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm1
+ DB 196,193,65,254,193 ; vpaddd %xmm9,%xmm7,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,73,254,193 ; vpaddd %xmm9,%xmm6,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,227,109,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ DB 196,193,65,254,212 ; vpaddd %xmm12,%xmm7,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,73,254,212 ; vpaddd %xmm12,%xmm6,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,97,33,221,32 ; vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
+ DB 196,227,97,33,221,48 ; vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ DB 196,227,101,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm3,%ymm2
+ DB 197,244,92,204 ; vsubps %ymm4,%ymm1,%ymm1
+ DB 197,140,89,201 ; vmulps %ymm1,%ymm14,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 197,252,17,140,36,32,1,0,0 ; vmovups %ymm1,0x120(%rsp)
+ DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
+ DB 197,140,89,192 ; vmulps %ymm0,%ymm14,%ymm0
+ DB 197,172,88,192 ; vaddps %ymm0,%ymm10,%ymm0
+ DB 197,252,17,132,36,0,1,0,0 ; vmovups %ymm0,0x100(%rsp)
+ DB 196,193,108,92,197 ; vsubps %ymm13,%ymm2,%ymm0
+ DB 197,140,89,192 ; vmulps %ymm0,%ymm14,%ymm0
+ DB 197,20,88,208 ; vaddps %ymm0,%ymm13,%ymm10
+ DB 197,249,111,132,36,160,0,0,0 ; vmovdqa 0xa0(%rsp),%xmm0
+ DB 197,249,254,180,36,80,1,0,0 ; vpaddd 0x150(%rsp),%xmm0,%xmm6
+ DB 197,185,254,132,36,192,0,0,0 ; vpaddd 0xc0(%rsp),%xmm8,%xmm0
+ DB 197,249,254,76,36,96 ; vpaddd 0x60(%rsp),%xmm0,%xmm1
+ DB 196,66,113,64,235 ; vpmulld %xmm11,%xmm1,%xmm13
+ DB 196,65,249,126,234 ; vmovq %xmm13,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,99,249,22,235,1 ; vpextrq $0x1,%xmm13,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,12,136 ; vmovss (%rax,%r9,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,227,113,33,202,48 ; vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ DB 197,201,254,84,36,80 ; vpaddd 0x50(%rsp),%xmm6,%xmm2
+ DB 196,194,105,64,211 ; vpmulld %xmm11,%xmm2,%xmm2
+ DB 197,249,126,211 ; vmovd %xmm2,%ebx
+ DB 196,195,121,22,209,1 ; vpextrd $0x1,%xmm2,%r9d
+ DB 196,195,121,22,210,2 ; vpextrd $0x2,%xmm2,%r10d
+ DB 196,195,121,22,211,3 ; vpextrd $0x3,%xmm2,%r11d
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,163,97,33,28,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,227,117,24,203,1 ; vinsertf128 $0x1,%xmm3,%ymm1,%ymm1
+ DB 196,193,105,254,217 ; vpaddd %xmm9,%xmm2,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,17,254,217 ; vpaddd %xmm9,%xmm13,%xmm3
+ DB 196,193,249,126,219 ; vmovq %xmm3,%r11
+ DB 196,227,249,22,219,1 ; vpextrq $0x1,%xmm3,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,28,176 ; vmovss (%rax,%r14,4),%xmm3
+ DB 196,163,97,33,28,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,161,122,16,44,184 ; vmovss (%rax,%r15,4),%xmm5
+ DB 196,227,97,33,221,32 ; vinsertps $0x20,%xmm5,%xmm3,%xmm3
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,44,136 ; vmovss (%rax,%r9,4),%xmm5
+ DB 196,227,97,33,221,48 ; vinsertps $0x30,%xmm5,%xmm3,%xmm3
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,44,136 ; vmovss (%rax,%r9,4),%xmm5
+ DB 196,163,81,33,44,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm5,%xmm5
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,81,33,239,32 ; vinsertps $0x20,%xmm7,%xmm5,%xmm5
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
+ DB 196,227,85,24,235,1 ; vinsertf128 $0x1,%xmm3,%ymm5,%ymm5
+ DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,17,254,212 ; vpaddd %xmm12,%xmm13,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,97,33,223,32 ; vinsertps $0x20,%xmm7,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,97,33,223,48 ; vinsertps $0x30,%xmm7,%xmm3,%xmm3
+ DB 196,99,101,24,234,1 ; vinsertf128 $0x1,%xmm2,%ymm3,%ymm13
+ DB 197,249,254,68,36,64 ; vpaddd 0x40(%rsp),%xmm0,%xmm0
+ DB 197,129,254,214 ; vpaddd %xmm6,%xmm15,%xmm2
+ DB 196,194,105,64,243 ; vpmulld %xmm11,%xmm2,%xmm6
+ DB 196,194,121,64,195 ; vpmulld %xmm11,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 197,249,126,243 ; vmovd %xmm6,%ebx
+ DB 196,195,121,22,241,1 ; vpextrd $0x1,%xmm6,%r9d
+ DB 196,195,121,22,242,2 ; vpextrd $0x2,%xmm6,%r10d
+ DB 196,195,121,22,243,3 ; vpextrd $0x3,%xmm6,%r11d
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,163,97,33,28,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,227,109,24,219,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm3
+ DB 196,193,73,254,209 ; vpaddd %xmm9,%xmm6,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,121,254,209 ; vpaddd %xmm9,%xmm0,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,105,33,212,32 ; vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,105,33,212,48 ; vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,89,33,231,32 ; vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,89,33,231,48 ; vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ DB 196,227,93,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ DB 196,193,73,254,228 ; vpaddd %xmm12,%xmm6,%xmm4
+ DB 196,195,249,22,225,1 ; vpextrq $0x1,%xmm4,%r9
+ DB 196,193,249,126,226 ; vmovq %xmm4,%r10
+ DB 196,193,121,254,196 ; vpaddd %xmm12,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,195,249,22,199,1 ; vpextrq $0x1,%xmm0,%r15
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 68,137,203 ; mov %r9d,%ebx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,121,33,196,32 ; vinsertps $0x20,%xmm4,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,121,33,196,48 ; vinsertps $0x30,%xmm4,%xmm0,%xmm0
+ DB 68,137,219 ; mov %r11d,%ebx
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 68,137,251 ; mov %r15d,%ebx
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 73,193,239,32 ; shr $0x20,%r15
+ DB 196,161,122,16,52,184 ; vmovss (%rax,%r15,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 196,227,93,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm4,%ymm0
+ DB 197,228,92,217 ; vsubps %ymm1,%ymm3,%ymm3
+ DB 197,140,89,219 ; vmulps %ymm3,%ymm14,%ymm3
+ DB 197,244,88,203 ; vaddps %ymm3,%ymm1,%ymm1
+ DB 197,236,92,213 ; vsubps %ymm5,%ymm2,%ymm2
+ DB 197,140,89,210 ; vmulps %ymm2,%ymm14,%ymm2
+ DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
+ DB 196,193,124,92,197 ; vsubps %ymm13,%ymm0,%ymm0
+ DB 197,140,89,192 ; vmulps %ymm0,%ymm14,%ymm0
+ DB 197,148,88,192 ; vaddps %ymm0,%ymm13,%ymm0
+ DB 197,252,16,164,36,32,1,0,0 ; vmovups 0x120(%rsp),%ymm4
+ DB 197,244,92,204 ; vsubps %ymm4,%ymm1,%ymm1
+ DB 197,252,16,28,36 ; vmovups (%rsp),%ymm3
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 197,252,16,164,36,0,1,0,0 ; vmovups 0x100(%rsp),%ymm4
+ DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,220,88,210 ; vaddps %ymm2,%ymm4,%ymm2
+ DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,172,88,216 ; vaddps %ymm0,%ymm10,%ymm3
+ DB 197,252,91,132,36,96,1,0,0 ; vcvtdq2ps 0x160(%rsp),%ymm0
+ DB 197,252,16,164,36,128,1,0,0 ; vmovups 0x180(%rsp),%ymm4
+ DB 197,220,92,224 ; vsubps %ymm0,%ymm4,%ymm4
+ DB 197,252,16,172,36,128,0,0,0 ; vmovups 0x80(%rsp),%ymm5
+ DB 197,244,92,197 ; vsubps %ymm5,%ymm1,%ymm0
+ DB 197,220,89,192 ; vmulps %ymm0,%ymm4,%ymm0
+ DB 197,212,88,192 ; vaddps %ymm0,%ymm5,%ymm0
+ DB 197,252,16,172,36,224,0,0,0 ; vmovups 0xe0(%rsp),%ymm5
+ DB 197,236,92,205 ; vsubps %ymm5,%ymm2,%ymm1
+ DB 197,220,89,201 ; vmulps %ymm1,%ymm4,%ymm1
+ DB 197,212,88,201 ; vaddps %ymm1,%ymm5,%ymm1
+ DB 197,252,16,108,36,32 ; vmovups 0x20(%rsp),%ymm5
+ DB 197,228,92,213 ; vsubps %ymm5,%ymm3,%ymm2
+ DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2
+ DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,252,16,156,36,224,1,0,0 ; vmovups 0x1e0(%rsp),%ymm3
+ DB 197,252,16,164,36,0,2,0,0 ; vmovups 0x200(%rsp),%ymm4
+ DB 197,252,16,172,36,32,2,0,0 ; vmovups 0x220(%rsp),%ymm5
+ DB 197,252,16,180,36,64,2,0,0 ; vmovups 0x240(%rsp),%ymm6
+ DB 197,252,16,188,36,96,2,0,0 ; vmovups 0x260(%rsp),%ymm7
+ DB 72,129,196,128,2,0,0 ; add $0x280,%rsp
+ DB 91 ; pop %rbx
+ DB 65,94 ; pop %r14
+ DB 65,95 ; pop %r15
+ DB 255,224 ; jmpq *%rax
+
+PUBLIC _sk_clut_4D_avx
+_sk_clut_4D_avx LABEL PROC
+ DB 65,87 ; push %r15
+ DB 65,86 ; push %r14
+ DB 83 ; push %rbx
+ DB 72,129,236,32,3,0,0 ; sub $0x320,%rsp
+ DB 197,252,17,188,36,0,3,0,0 ; vmovups %ymm7,0x300(%rsp)
+ DB 197,252,17,180,36,224,2,0,0 ; vmovups %ymm6,0x2e0(%rsp)
+ DB 197,252,17,172,36,192,2,0,0 ; vmovups %ymm5,0x2c0(%rsp)
+ DB 197,252,17,164,36,160,2,0,0 ; vmovups %ymm4,0x2a0(%rsp)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,20 ; mov 0x14(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,226 ; vmovd %r10d,%xmm4
+ DB 197,249,112,228,0 ; vpshufd $0x0,%xmm4,%xmm4
+ DB 196,227,93,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm4,%ymm4
+ DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
+ DB 197,220,89,219 ; vmulps %ymm3,%ymm4,%ymm3
+ DB 197,252,17,156,36,128,2,0,0 ; vmovups %ymm3,0x280(%rsp)
+ DB 197,254,91,227 ; vcvttps2dq %ymm3,%ymm4
+ DB 68,139,80,16 ; mov 0x10(%rax),%r10d
+ DB 69,141,90,255 ; lea -0x1(%r10),%r11d
+ DB 196,193,121,110,219 ; vmovd %r11d,%xmm3
+ DB 197,249,112,219,0 ; vpshufd $0x0,%xmm3,%xmm3
+ DB 196,227,101,24,219,1 ; vinsertf128 $0x1,%xmm3,%ymm3,%ymm3
+ DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,252,17,148,36,160,1,0,0 ; vmovups %ymm2,0x1a0(%rsp)
+ DB 197,254,91,234 ; vcvttps2dq %ymm2,%ymm5
+ DB 196,193,121,110,209 ; vmovd %r9d,%xmm2
+ DB 197,249,112,242,0 ; vpshufd $0x0,%xmm2,%xmm6
+ DB 196,226,81,64,222 ; vpmulld %xmm6,%xmm5,%xmm3
+ DB 197,249,111,254 ; vmovdqa %xmm6,%xmm7
+ DB 197,249,127,124,36,96 ; vmovdqa %xmm7,0x60(%rsp)
+ DB 197,254,127,172,36,0,2,0,0 ; vmovdqu %ymm5,0x200(%rsp)
+ DB 197,249,127,156,36,64,1,0,0 ; vmovdqa %xmm3,0x140(%rsp)
+ DB 197,225,254,244 ; vpaddd %xmm4,%xmm3,%xmm6
+ DB 197,249,127,180,36,224,0,0,0 ; vmovdqa %xmm6,0xe0(%rsp)
+ DB 197,254,127,164,36,96,2,0,0 ; vmovdqu %ymm4,0x260(%rsp)
+ DB 196,193,121,110,218 ; vmovd %r10d,%xmm3
+ DB 196,226,97,64,210 ; vpmulld %xmm2,%xmm3,%xmm2
+ DB 197,121,112,194,0 ; vpshufd $0x0,%xmm2,%xmm8
+ DB 68,139,72,12 ; mov 0xc(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 196,193,121,110,218 ; vmovd %r10d,%xmm3
+ DB 197,249,112,219,0 ; vpshufd $0x0,%xmm3,%xmm3
+ DB 196,227,101,24,219,1 ; vinsertf128 $0x1,%xmm3,%ymm3,%ymm3
+ DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
+ DB 197,228,89,217 ; vmulps %ymm1,%ymm3,%ymm3
+ DB 197,252,17,156,36,0,1,0,0 ; vmovups %ymm3,0x100(%rsp)
+ DB 196,193,121,110,201 ; vmovd %r9d,%xmm1
+ DB 196,226,113,64,202 ; vpmulld %xmm2,%xmm1,%xmm1
+ DB 68,139,72,8 ; mov 0x8(%rax),%r9d
+ DB 65,255,201 ; dec %r9d
+ DB 196,193,121,110,209 ; vmovd %r9d,%xmm2
+ DB 197,249,112,210,0 ; vpshufd $0x0,%xmm2,%xmm2
+ DB 196,227,109,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
+ DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
+ DB 197,108,89,232 ; vmulps %ymm0,%ymm2,%ymm13
+ DB 197,254,91,211 ; vcvttps2dq %ymm3,%ymm2
+ DB 197,249,112,193,0 ; vpshufd $0x0,%xmm1,%xmm0
+ DB 72,139,0 ; mov (%rax),%rax
+ DB 196,194,105,64,200 ; vpmulld %xmm8,%xmm2,%xmm1
+ DB 197,125,111,210 ; vmovdqa %ymm2,%ymm10
+ DB 197,126,127,148,36,96,1,0,0 ; vmovdqu %ymm10,0x160(%rsp)
+ DB 197,249,127,140,36,128,1,0,0 ; vmovdqa %xmm1,0x180(%rsp)
+ DB 197,241,254,214 ; vpaddd %xmm6,%xmm1,%xmm2
+ DB 196,65,126,91,229 ; vcvttps2dq %ymm13,%ymm12
+ DB 196,226,25,64,200 ; vpmulld %xmm0,%xmm12,%xmm1
+ DB 197,249,127,12,36 ; vmovdqa %xmm1,(%rsp)
+ DB 197,241,254,202 ; vpaddd %xmm2,%xmm1,%xmm1
+ DB 196,98,121,24,61,46,37,0,0 ; vbroadcastss 0x252e(%rip),%xmm15 # b47c <_sk_clut_4D_avx+0x26a3>
+ DB 196,194,113,64,247 ; vpmulld %xmm15,%xmm1,%xmm6
+ DB 196,193,249,126,241 ; vmovq %xmm6,%r9
+ DB 69,137,202 ; mov %r9d,%r10d
+ DB 196,195,249,22,243,1 ; vpextrq $0x1,%xmm6,%r11
+ DB 68,137,219 ; mov %r11d,%ebx
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,12,144 ; vmovss (%rax,%r10,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,227,113,33,12,152,32 ; vinsertps $0x20,(%rax,%rbx,4),%xmm1,%xmm1
+ DB 196,161,122,16,28,152 ; vmovss (%rax,%r11,4),%xmm3
+ DB 196,99,113,33,203,48 ; vinsertps $0x30,%xmm3,%xmm1,%xmm9
+ DB 196,227,125,25,233,1 ; vextractf128 $0x1,%ymm5,%xmm1
+ DB 196,226,113,64,239 ; vpmulld %xmm7,%xmm1,%xmm5
+ DB 197,249,127,172,36,32,1,0,0 ; vmovdqa %xmm5,0x120(%rsp)
+ DB 196,99,125,25,209,1 ; vextractf128 $0x1,%ymm10,%xmm1
+ DB 196,194,113,64,216 ; vpmulld %xmm8,%xmm1,%xmm3
+ DB 197,249,127,156,36,144,0,0,0 ; vmovdqa %xmm3,0x90(%rsp)
+ DB 196,99,125,25,225,1 ; vextractf128 $0x1,%ymm12,%xmm1
+ DB 196,226,113,64,248 ; vpmulld %xmm0,%xmm1,%xmm7
+ DB 197,249,127,124,36,48 ; vmovdqa %xmm7,0x30(%rsp)
+ DB 196,227,125,25,225,1 ; vextractf128 $0x1,%ymm4,%xmm1
+ DB 197,248,41,76,36,64 ; vmovaps %xmm1,0x40(%rsp)
+ DB 197,209,254,201 ; vpaddd %xmm1,%xmm5,%xmm1
+ DB 197,249,127,140,36,192,1,0,0 ; vmovdqa %xmm1,0x1c0(%rsp)
+ DB 197,225,254,201 ; vpaddd %xmm1,%xmm3,%xmm1
+ DB 197,193,254,217 ; vpaddd %xmm1,%xmm7,%xmm3
+ DB 196,194,97,64,223 ; vpmulld %xmm15,%xmm3,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,163,65,33,60,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm7,%xmm7
+ DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
+ DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,99,53,24,247,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
+ DB 196,98,121,24,21,86,36,0,0 ; vbroadcastss 0x2456(%rip),%xmm10 # b480 <_sk_clut_4D_avx+0x26a7>
+ DB 196,65,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm9
+ DB 196,67,249,22,201,1 ; vpextrq $0x1,%xmm9,%r9
+ DB 196,65,249,126,202 ; vmovq %xmm9,%r10
+ DB 196,65,73,254,202 ; vpaddd %xmm10,%xmm6,%xmm9
+ DB 196,97,249,126,203 ; vmovq %xmm9,%rbx
+ DB 196,67,249,22,203,1 ; vpextrq $0x1,%xmm9,%r11
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,60,176 ; vmovss (%rax,%r14,4),%xmm7
+ DB 196,163,65,33,60,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm7,%xmm7
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,65,33,228,32 ; vinsertps $0x20,%xmm4,%xmm7,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,89,33,231,48 ; vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ DB 65,137,217 ; mov %ebx,%r9d
+ DB 69,137,218 ; mov %r11d,%r10d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,65,33,60,152,16 ; vinsertps $0x10,(%rax,%rbx,4),%xmm7,%xmm7
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,65,33,237,32 ; vinsertps $0x20,%xmm5,%xmm7,%xmm5
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
+ DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
+ DB 196,99,85,24,220,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
+ DB 196,98,121,24,13,197,35,0,0 ; vbroadcastss 0x23c5(%rip),%xmm9 # b484 <_sk_clut_4D_avx+0x26ab>
+ DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,73,254,217 ; vpaddd %xmm9,%xmm6,%xmm3
+ DB 196,193,249,126,219 ; vmovq %xmm3,%r11
+ DB 196,227,249,22,219,1 ; vpextrq $0x1,%xmm3,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,28,176 ; vmovss (%rax,%r14,4),%xmm3
+ DB 196,163,97,33,28,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,89,33,229,32 ; vinsertps $0x20,%xmm5,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
+ DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4
+ DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
+ DB 196,226,125,24,37,37,35,0,0 ; vbroadcastss 0x2325(%rip),%ymm4 # b478 <_sk_clut_4D_avx+0x269f>
+ DB 197,148,88,220 ; vaddps %ymm4,%ymm13,%ymm3
+ DB 197,252,40,252 ; vmovaps %ymm4,%ymm7
+ DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp)
+ DB 197,254,91,219 ; vcvttps2dq %ymm3,%ymm3
+ DB 196,227,125,25,220,1 ; vextractf128 $0x1,%ymm3,%xmm4
+ DB 196,226,89,64,224 ; vpmulld %xmm0,%xmm4,%xmm4
+ DB 197,249,127,100,36,32 ; vmovdqa %xmm4,0x20(%rsp)
+ DB 196,226,97,64,192 ; vpmulld %xmm0,%xmm3,%xmm0
+ DB 197,249,127,68,36,16 ; vmovdqa %xmm0,0x10(%rsp)
+ DB 197,249,254,194 ; vpaddd %xmm2,%xmm0,%xmm0
+ DB 196,194,121,64,215 ; vpmulld %xmm15,%xmm0,%xmm2
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,121,33,219,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm3
+ DB 197,217,254,193 ; vpaddd %xmm1,%xmm4,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 197,249,126,195 ; vmovd %xmm0,%ebx
+ DB 196,195,121,22,193,1 ; vpextrd $0x1,%xmm0,%r9d
+ DB 196,195,121,22,194,2 ; vpextrd $0x2,%xmm0,%r10d
+ DB 196,195,121,22,195,3 ; vpextrd $0x3,%xmm0,%r11d
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,227,101,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm3,%ymm3
+ DB 196,193,121,254,202 ; vpaddd %xmm10,%xmm0,%xmm1
+ DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
+ DB 196,193,249,126,202 ; vmovq %xmm1,%r10
+ DB 196,193,105,254,202 ; vpaddd %xmm10,%xmm2,%xmm1
+ DB 196,193,249,126,203 ; vmovq %xmm1,%r11
+ DB 196,227,249,22,203,1 ; vpextrq $0x1,%xmm1,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,12,176 ; vmovss (%rax,%r14,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,113,33,204,32 ; vinsertps $0x20,%xmm4,%xmm1,%xmm1
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,113,33,204,48 ; vinsertps $0x30,%xmm4,%xmm1,%xmm1
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,44,144 ; vmovss (%rax,%r10,4),%xmm5
+ DB 196,227,89,33,229,32 ; vinsertps $0x20,%xmm5,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
+ DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4
+ DB 196,227,93,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm4,%ymm1
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,105,254,193 ; vpaddd %xmm9,%xmm2,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,105,33,212,32 ; vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,105,33,212,48 ; vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ DB 196,227,109,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ DB 196,193,124,91,212 ; vcvtdq2ps %ymm12,%ymm2
+ DB 197,148,92,234 ; vsubps %ymm2,%ymm13,%ymm5
+ DB 196,193,100,92,214 ; vsubps %ymm14,%ymm3,%ymm2
+ DB 197,212,89,210 ; vmulps %ymm2,%ymm5,%ymm2
+ DB 197,12,88,234 ; vaddps %ymm2,%ymm14,%ymm13
+ DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
+ DB 197,212,89,201 ; vmulps %ymm1,%ymm5,%ymm1
+ DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
+ DB 197,252,17,140,36,224,1,0,0 ; vmovups %ymm1,0x1e0(%rsp)
+ DB 197,252,92,198 ; vsubps %ymm6,%ymm0,%ymm0
+ DB 197,212,89,192 ; vmulps %ymm0,%ymm5,%ymm0
+ DB 197,204,88,192 ; vaddps %ymm0,%ymm6,%ymm0
+ DB 197,252,17,132,36,192,0,0,0 ; vmovups %ymm0,0xc0(%rsp)
+ DB 197,124,16,156,36,0,1,0,0 ; vmovups 0x100(%rsp),%ymm11
+ DB 197,164,88,199 ; vaddps %ymm7,%ymm11,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 196,194,121,64,200 ; vpmulld %xmm8,%xmm0,%xmm1
+ DB 197,249,127,140,36,128,0,0,0 ; vmovdqa %xmm1,0x80(%rsp)
+ DB 196,227,125,25,192,1 ; vextractf128 $0x1,%ymm0,%xmm0
+ DB 196,194,121,64,216 ; vpmulld %xmm8,%xmm0,%xmm3
+ DB 197,249,127,92,36,112 ; vmovdqa %xmm3,0x70(%rsp)
+ DB 197,241,254,188,36,224,0,0,0 ; vpaddd 0xe0(%rsp),%xmm1,%xmm7
+ DB 197,193,254,4,36 ; vpaddd (%rsp),%xmm7,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,12,136 ; vmovss (%rax,%r9,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,227,113,33,202,48 ; vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ DB 197,225,254,148,36,192,1,0,0 ; vpaddd 0x1c0(%rsp),%xmm3,%xmm2
+ DB 197,233,254,92,36,48 ; vpaddd 0x30(%rsp),%xmm2,%xmm3
+ DB 196,194,97,64,223 ; vpmulld %xmm15,%xmm3,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,163,89,33,36,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,99,117,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm1,%ymm12
+ DB 196,193,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm1
+ DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
+ DB 196,193,249,126,202 ; vmovq %xmm1,%r10
+ DB 196,193,121,254,202 ; vpaddd %xmm10,%xmm0,%xmm1
+ DB 196,193,249,126,203 ; vmovq %xmm1,%r11
+ DB 196,227,249,22,203,1 ; vpextrq $0x1,%xmm1,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,12,176 ; vmovss (%rax,%r14,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,113,33,204,32 ; vinsertps $0x20,%xmm4,%xmm1,%xmm1
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,113,33,204,48 ; vinsertps $0x30,%xmm4,%xmm1,%xmm1
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,52,144 ; vmovss (%rax,%r10,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 196,227,93,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm4,%ymm1
+ DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,99,101,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm8
+ DB 197,121,111,116,36,16 ; vmovdqa 0x10(%rsp),%xmm14
+ DB 197,137,254,199 ; vpaddd %xmm7,%xmm14,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm3,%xmm3
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,228,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm4
+ DB 197,233,254,84,36,32 ; vpaddd 0x20(%rsp),%xmm2,%xmm2
+ DB 196,194,105,64,223 ; vpmulld %xmm15,%xmm2,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,163,105,33,20,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,227,93,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ DB 196,193,97,254,226 ; vpaddd %xmm10,%xmm3,%xmm4
+ DB 196,195,249,22,225,1 ; vpextrq $0x1,%xmm4,%r9
+ DB 196,193,249,126,226 ; vmovq %xmm4,%r10
+ DB 196,193,121,254,226 ; vpaddd %xmm10,%xmm0,%xmm4
+ DB 196,193,249,126,227 ; vmovq %xmm4,%r11
+ DB 196,227,249,22,227,1 ; vpextrq $0x1,%xmm4,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,36,176 ; vmovss (%rax,%r14,4),%xmm4
+ DB 196,163,89,33,36,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,161,122,16,52,184 ; vmovss (%rax,%r15,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,163,73,33,52,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm6,%xmm6
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,73,33,247,32 ; vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,73,33,247,48 ; vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ DB 196,227,77,24,252,1 ; vinsertf128 $0x1,%xmm4,%ymm6,%ymm7
+ DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,227,101,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ DB 196,193,108,92,212 ; vsubps %ymm12,%ymm2,%ymm2
+ DB 197,212,89,210 ; vmulps %ymm2,%ymm5,%ymm2
+ DB 197,156,88,210 ; vaddps %ymm2,%ymm12,%ymm2
+ DB 197,196,92,217 ; vsubps %ymm1,%ymm7,%ymm3
+ DB 197,212,89,219 ; vmulps %ymm3,%ymm5,%ymm3
+ DB 197,244,88,203 ; vaddps %ymm3,%ymm1,%ymm1
+ DB 196,193,124,92,192 ; vsubps %ymm8,%ymm0,%ymm0
+ DB 197,212,89,192 ; vmulps %ymm0,%ymm5,%ymm0
+ DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
+ DB 197,252,91,156,36,96,1,0,0 ; vcvtdq2ps 0x160(%rsp),%ymm3
+ DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
+ DB 197,252,17,156,36,96,1,0,0 ; vmovups %ymm3,0x160(%rsp)
+ DB 196,193,108,92,213 ; vsubps %ymm13,%ymm2,%ymm2
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,148,88,210 ; vaddps %ymm2,%ymm13,%ymm2
+ DB 197,252,17,148,36,0,1,0,0 ; vmovups %ymm2,0x100(%rsp)
+ DB 197,252,16,148,36,224,1,0,0 ; vmovups 0x1e0(%rsp),%ymm2
+ DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
+ DB 197,252,17,140,36,224,0,0,0 ; vmovups %ymm1,0xe0(%rsp)
+ DB 197,252,16,140,36,192,0,0,0 ; vmovups 0xc0(%rsp),%ymm1
+ DB 197,252,92,193 ; vsubps %ymm1,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
+ DB 197,252,17,132,36,192,0,0,0 ; vmovups %ymm0,0xc0(%rsp)
+ DB 197,252,16,132,36,160,0,0,0 ; vmovups 0xa0(%rsp),%ymm0
+ DB 197,252,88,132,36,160,1,0,0 ; vaddps 0x1a0(%rsp),%ymm0,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
+ DB 197,249,111,84,36,96 ; vmovdqa 0x60(%rsp),%xmm2
+ DB 196,226,113,64,218 ; vpmulld %xmm2,%xmm1,%xmm3
+ DB 197,249,127,156,36,224,1,0,0 ; vmovdqa %xmm3,0x1e0(%rsp)
+ DB 196,226,121,64,194 ; vpmulld %xmm2,%xmm0,%xmm0
+ DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp)
+ DB 197,249,254,132,36,96,2,0,0 ; vpaddd 0x260(%rsp),%xmm0,%xmm0
+ DB 197,249,127,132,36,80,2,0,0 ; vmovdqa %xmm0,0x250(%rsp)
+ DB 197,249,254,148,36,128,1,0,0 ; vpaddd 0x180(%rsp),%xmm0,%xmm2
+ DB 197,233,254,4,36 ; vpaddd (%rsp),%xmm2,%xmm0
+ DB 196,194,121,64,247 ; vpmulld %xmm15,%xmm0,%xmm6
+ DB 196,193,249,126,242 ; vmovq %xmm6,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,243,1 ; vpextrq $0x1,%xmm6,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,227,121,33,225,48 ; vinsertps $0x30,%xmm1,%xmm0,%xmm4
+ DB 197,225,254,68,36,64 ; vpaddd 0x40(%rsp),%xmm3,%xmm0
+ DB 197,249,127,132,36,64,2,0,0 ; vmovdqa %xmm0,0x240(%rsp)
+ DB 197,249,254,140,36,144,0,0,0 ; vpaddd 0x90(%rsp),%xmm0,%xmm1
+ DB 197,121,111,108,36,48 ; vmovdqa 0x30(%rsp),%xmm13
+ DB 196,193,113,254,221 ; vpaddd %xmm13,%xmm1,%xmm3
+ DB 196,194,97,64,223 ; vpmulld %xmm15,%xmm3,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,163,65,33,60,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm7,%xmm7
+ DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
+ DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,227,93,24,199,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm0
+ DB 197,252,17,68,36,64 ; vmovups %ymm0,0x40(%rsp)
+ DB 196,193,97,254,250 ; vpaddd %xmm10,%xmm3,%xmm7
+ DB 196,195,249,22,249,1 ; vpextrq $0x1,%xmm7,%r9
+ DB 196,193,249,126,250 ; vmovq %xmm7,%r10
+ DB 196,193,73,254,250 ; vpaddd %xmm10,%xmm6,%xmm7
+ DB 196,193,249,126,251 ; vmovq %xmm7,%r11
+ DB 196,227,249,22,251,1 ; vpextrq $0x1,%xmm7,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,60,176 ; vmovss (%rax,%r14,4),%xmm7
+ DB 196,163,65,33,60,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm7,%xmm7
+ DB 196,161,122,16,4,184 ; vmovss (%rax,%r15,4),%xmm0
+ DB 196,227,65,33,192,32 ; vinsertps $0x20,%xmm0,%xmm7,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,121,33,199,48 ; vinsertps $0x30,%xmm7,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,163,65,33,60,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,65,33,228,32 ; vinsertps $0x20,%xmm4,%xmm7,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,89,33,231,48 ; vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ DB 196,99,93,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm4,%ymm8
+ DB 196,193,97,254,193 ; vpaddd %xmm9,%xmm3,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,73,254,193 ; vpaddd %xmm9,%xmm6,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,99,101,24,224,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm12
+ DB 197,137,254,194 ; vpaddd %xmm2,%xmm14,%xmm0
+ DB 196,194,121,64,215 ; vpmulld %xmm15,%xmm0,%xmm2
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 197,121,111,92,36,32 ; vmovdqa 0x20(%rsp),%xmm11
+ DB 197,161,254,201 ; vpaddd %xmm1,%xmm11,%xmm1
+ DB 196,194,113,64,223 ; vpmulld %xmm15,%xmm1,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,227,125,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm1
+ DB 196,193,97,254,194 ; vpaddd %xmm10,%xmm3,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,105,254,194 ; vpaddd %xmm10,%xmm2,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,121,33,196,32 ; vinsertps $0x20,%xmm4,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,121,33,196,48 ; vinsertps $0x30,%xmm4,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,52,144 ; vmovss (%rax,%r10,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 196,227,93,24,240,1 ; vinsertf128 $0x1,%xmm0,%ymm4,%ymm6
+ DB 196,193,97,254,193 ; vpaddd %xmm9,%xmm3,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,105,254,193 ; vpaddd %xmm9,%xmm2,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,227,109,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ DB 197,252,16,84,36,64 ; vmovups 0x40(%rsp),%ymm2
+ DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
+ DB 197,212,89,201 ; vmulps %ymm1,%ymm5,%ymm1
+ DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
+ DB 197,252,17,76,36,64 ; vmovups %ymm1,0x40(%rsp)
+ DB 196,193,76,92,200 ; vsubps %ymm8,%ymm6,%ymm1
+ DB 197,212,89,201 ; vmulps %ymm1,%ymm5,%ymm1
+ DB 197,188,88,201 ; vaddps %ymm1,%ymm8,%ymm1
+ DB 197,252,17,140,36,192,1,0,0 ; vmovups %ymm1,0x1c0(%rsp)
+ DB 196,193,124,92,196 ; vsubps %ymm12,%ymm0,%ymm0
+ DB 197,212,89,192 ; vmulps %ymm0,%ymm5,%ymm0
+ DB 197,28,88,192 ; vaddps %ymm0,%ymm12,%ymm8
+ DB 197,249,111,132,36,80,2,0,0 ; vmovdqa 0x250(%rsp),%xmm0
+ DB 197,249,254,180,36,128,0,0,0 ; vpaddd 0x80(%rsp),%xmm0,%xmm6
+ DB 197,201,254,4,36 ; vpaddd (%rsp),%xmm6,%xmm0
+ DB 196,194,121,64,215 ; vpmulld %xmm15,%xmm0,%xmm2
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,227,121,33,217,48 ; vinsertps $0x30,%xmm1,%xmm0,%xmm3
+ DB 197,249,111,132,36,64,2,0,0 ; vmovdqa 0x240(%rsp),%xmm0
+ DB 197,249,254,76,36,112 ; vpaddd 0x70(%rsp),%xmm0,%xmm1
+ DB 196,193,113,254,197 ; vpaddd %xmm13,%xmm1,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 197,249,126,195 ; vmovd %xmm0,%ebx
+ DB 196,195,121,22,193,1 ; vpextrd $0x1,%xmm0,%r9d
+ DB 196,195,121,22,194,2 ; vpextrd $0x2,%xmm0,%r10d
+ DB 196,195,121,22,195,3 ; vpextrd $0x3,%xmm0,%r11d
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,163,89,33,36,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,99,101,24,236,1 ; vinsertf128 $0x1,%xmm4,%ymm3,%ymm13
+ DB 196,193,121,254,226 ; vpaddd %xmm10,%xmm0,%xmm4
+ DB 196,195,249,22,225,1 ; vpextrq $0x1,%xmm4,%r9
+ DB 196,193,249,126,226 ; vmovq %xmm4,%r10
+ DB 196,193,105,254,226 ; vpaddd %xmm10,%xmm2,%xmm4
+ DB 196,193,249,126,227 ; vmovq %xmm4,%r11
+ DB 196,227,249,22,227,1 ; vpextrq $0x1,%xmm4,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,36,176 ; vmovss (%rax,%r14,4),%xmm4
+ DB 196,163,89,33,36,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,161,122,16,60,184 ; vmovss (%rax,%r15,4),%xmm7
+ DB 196,227,89,33,231,32 ; vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,89,33,231,48 ; vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,163,65,33,60,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,65,33,219,32 ; vinsertps $0x20,%xmm3,%xmm7,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,97,33,223,48 ; vinsertps $0x30,%xmm7,%xmm3,%xmm3
+ DB 196,99,101,24,244,1 ; vinsertf128 $0x1,%xmm4,%ymm3,%ymm14
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,105,254,193 ; vpaddd %xmm9,%xmm2,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,99,109,24,224,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm12
+ DB 197,201,254,68,36,16 ; vpaddd 0x10(%rsp),%xmm6,%xmm0
+ DB 196,194,121,64,215 ; vpmulld %xmm15,%xmm0,%xmm2
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,121,33,219,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm3
+ DB 197,161,254,193 ; vpaddd %xmm1,%xmm11,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 197,249,126,195 ; vmovd %xmm0,%ebx
+ DB 196,195,121,22,193,1 ; vpextrd $0x1,%xmm0,%r9d
+ DB 196,195,121,22,194,2 ; vpextrd $0x2,%xmm0,%r10d
+ DB 196,195,121,22,195,3 ; vpextrd $0x3,%xmm0,%r11d
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,227,101,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm3,%ymm1
+ DB 196,193,121,254,218 ; vpaddd %xmm10,%xmm0,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,105,254,218 ; vpaddd %xmm10,%xmm2,%xmm3
+ DB 196,193,249,126,219 ; vmovq %xmm3,%r11
+ DB 196,227,249,22,219,1 ; vpextrq $0x1,%xmm3,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,28,176 ; vmovss (%rax,%r14,4),%xmm3
+ DB 196,163,97,33,28,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,52,144 ; vmovss (%rax,%r10,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,105,254,193 ; vpaddd %xmm9,%xmm2,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,227,109,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ DB 196,193,116,92,205 ; vsubps %ymm13,%ymm1,%ymm1
+ DB 197,252,17,172,36,32,2,0,0 ; vmovups %ymm5,0x220(%rsp)
+ DB 197,212,89,201 ; vmulps %ymm1,%ymm5,%ymm1
+ DB 197,148,88,201 ; vaddps %ymm1,%ymm13,%ymm1
+ DB 196,193,76,92,214 ; vsubps %ymm14,%ymm6,%ymm2
+ DB 197,212,89,210 ; vmulps %ymm2,%ymm5,%ymm2
+ DB 197,140,88,210 ; vaddps %ymm2,%ymm14,%ymm2
+ DB 196,193,124,92,196 ; vsubps %ymm12,%ymm0,%ymm0
+ DB 197,212,89,192 ; vmulps %ymm0,%ymm5,%ymm0
+ DB 197,156,88,192 ; vaddps %ymm0,%ymm12,%ymm0
+ DB 197,252,16,100,36,64 ; vmovups 0x40(%rsp),%ymm4
+ DB 197,244,92,204 ; vsubps %ymm4,%ymm1,%ymm1
+ DB 197,252,16,156,36,96,1,0,0 ; vmovups 0x160(%rsp),%ymm3
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 197,252,16,164,36,192,1,0,0 ; vmovups 0x1c0(%rsp),%ymm4
+ DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,220,88,210 ; vaddps %ymm2,%ymm4,%ymm2
+ DB 196,193,124,92,192 ; vsubps %ymm8,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
+ DB 197,252,91,156,36,0,2,0,0 ; vcvtdq2ps 0x200(%rsp),%ymm3
+ DB 197,252,16,164,36,160,1,0,0 ; vmovups 0x1a0(%rsp),%ymm4
+ DB 197,220,92,219 ; vsubps %ymm3,%ymm4,%ymm3
+ DB 197,252,17,92,36,64 ; vmovups %ymm3,0x40(%rsp)
+ DB 197,252,16,164,36,0,1,0,0 ; vmovups 0x100(%rsp),%ymm4
+ DB 197,244,92,204 ; vsubps %ymm4,%ymm1,%ymm1
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 197,252,17,140,36,160,1,0,0 ; vmovups %ymm1,0x1a0(%rsp)
+ DB 197,252,16,164,36,224,0,0,0 ; vmovups 0xe0(%rsp),%ymm4
+ DB 197,236,92,204 ; vsubps %ymm4,%ymm2,%ymm1
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 197,252,17,140,36,0,2,0,0 ; vmovups %ymm1,0x200(%rsp)
+ DB 197,252,16,140,36,192,0,0,0 ; vmovups 0xc0(%rsp),%ymm1
+ DB 197,252,92,193 ; vsubps %ymm1,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
+ DB 197,252,17,132,36,0,1,0,0 ; vmovups %ymm0,0x100(%rsp)
+ DB 197,252,16,132,36,160,0,0,0 ; vmovups 0xa0(%rsp),%ymm0
+ DB 197,252,88,132,36,128,2,0,0 ; vaddps 0x280(%rsp),%ymm0,%ymm0
+ DB 197,254,91,192 ; vcvttps2dq %ymm0,%ymm0
+ DB 197,249,254,140,36,64,1,0,0 ; vpaddd 0x140(%rsp),%xmm0,%xmm1
+ DB 197,249,127,140,36,160,0,0,0 ; vmovdqa %xmm1,0xa0(%rsp)
+ DB 197,253,111,224 ; vmovdqa %ymm0,%ymm4
+ DB 197,254,127,164,36,192,0,0,0 ; vmovdqu %ymm4,0xc0(%rsp)
+ DB 197,241,254,148,36,128,1,0,0 ; vpaddd 0x180(%rsp),%xmm1,%xmm2
+ DB 197,249,111,44,36 ; vmovdqa (%rsp),%xmm5
+ DB 197,209,254,194 ; vpaddd %xmm2,%xmm5,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,12,136 ; vmovss (%rax,%r9,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,113,33,251,48 ; vinsertps $0x30,%xmm3,%xmm1,%xmm7
+ DB 196,227,125,25,225,1 ; vextractf128 $0x1,%ymm4,%xmm1
+ DB 197,248,41,140,36,224,0,0,0 ; vmovaps %xmm1,0xe0(%rsp)
+ DB 197,113,254,180,36,32,1,0,0 ; vpaddd 0x120(%rsp),%xmm1,%xmm14
+ DB 197,137,254,140,36,144,0,0,0 ; vpaddd 0x90(%rsp),%xmm14,%xmm1
+ DB 197,241,254,92,36,48 ; vpaddd 0x30(%rsp),%xmm1,%xmm3
+ DB 196,194,97,64,223 ; vpmulld %xmm15,%xmm3,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,163,89,33,36,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,99,69,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm7,%ymm12
+ DB 196,193,97,254,226 ; vpaddd %xmm10,%xmm3,%xmm4
+ DB 196,195,249,22,225,1 ; vpextrq $0x1,%xmm4,%r9
+ DB 196,193,249,126,226 ; vmovq %xmm4,%r10
+ DB 196,193,121,254,226 ; vpaddd %xmm10,%xmm0,%xmm4
+ DB 196,225,249,126,227 ; vmovq %xmm4,%rbx
+ DB 196,195,249,22,227,1 ; vpextrq $0x1,%xmm4,%r11
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,36,176 ; vmovss (%rax,%r14,4),%xmm4
+ DB 196,163,89,33,36,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,161,122,16,52,184 ; vmovss (%rax,%r15,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 65,137,217 ; mov %ebx,%r9d
+ DB 69,137,218 ; mov %r11d,%r10d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,227,73,33,52,152,16 ; vinsertps $0x10,(%rax,%rbx,4),%xmm6,%xmm6
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,73,33,247,32 ; vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
+ DB 196,227,73,33,247,48 ; vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ DB 196,99,77,24,196,1 ; vinsertf128 $0x1,%xmm4,%ymm6,%ymm8
+ DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,99,101,24,232,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm13
+ DB 197,121,111,92,36,16 ; vmovdqa 0x10(%rsp),%xmm11
+ DB 197,161,254,194 ; vpaddd %xmm2,%xmm11,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 197,241,254,76,36,32 ; vpaddd 0x20(%rsp),%xmm1,%xmm1
+ DB 196,194,113,64,223 ; vpmulld %xmm15,%xmm1,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,227,109,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm1
+ DB 196,193,97,254,210 ; vpaddd %xmm10,%xmm3,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,121,254,210 ; vpaddd %xmm10,%xmm0,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,105,33,212,32 ; vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,105,33,212,48 ; vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,52,144 ; vmovss (%rax,%r10,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 196,227,93,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,227,101,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ DB 196,193,116,92,204 ; vsubps %ymm12,%ymm1,%ymm1
+ DB 197,252,16,156,36,32,2,0,0 ; vmovups 0x220(%rsp),%ymm3
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,28,88,225 ; vaddps %ymm1,%ymm12,%ymm12
+ DB 196,193,108,92,200 ; vsubps %ymm8,%ymm2,%ymm1
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,188,88,201 ; vaddps %ymm1,%ymm8,%ymm1
+ DB 197,252,17,140,36,64,1,0,0 ; vmovups %ymm1,0x140(%rsp)
+ DB 196,193,124,92,197 ; vsubps %ymm13,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,148,88,192 ; vaddps %ymm0,%ymm13,%ymm0
+ DB 197,252,17,132,36,32,1,0,0 ; vmovups %ymm0,0x120(%rsp)
+ DB 197,249,111,132,36,160,0,0,0 ; vmovdqa 0xa0(%rsp),%xmm0
+ DB 197,249,254,148,36,128,0,0,0 ; vpaddd 0x80(%rsp),%xmm0,%xmm2
+ DB 197,233,254,197 ; vpaddd %xmm5,%xmm2,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,12,136 ; vmovss (%rax,%r9,4),%xmm1
+ DB 196,163,113,33,12,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm1,%xmm1
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,113,33,227,48 ; vinsertps $0x30,%xmm3,%xmm1,%xmm4
+ DB 197,137,254,76,36,112 ; vpaddd 0x70(%rsp),%xmm14,%xmm1
+ DB 197,121,111,68,36,48 ; vmovdqa 0x30(%rsp),%xmm8
+ DB 196,193,113,254,216 ; vpaddd %xmm8,%xmm1,%xmm3
+ DB 196,194,97,64,223 ; vpmulld %xmm15,%xmm3,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,163,73,33,52,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm6,%xmm6
+ DB 196,163,73,33,52,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm6,%xmm6
+ DB 196,163,73,33,52,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm6,%xmm6
+ DB 196,99,93,24,246,1 ; vinsertf128 $0x1,%xmm6,%ymm4,%ymm14
+ DB 196,193,97,254,226 ; vpaddd %xmm10,%xmm3,%xmm4
+ DB 196,195,249,22,225,1 ; vpextrq $0x1,%xmm4,%r9
+ DB 196,193,249,126,226 ; vmovq %xmm4,%r10
+ DB 196,193,121,254,226 ; vpaddd %xmm10,%xmm0,%xmm4
+ DB 196,193,249,126,227 ; vmovq %xmm4,%r11
+ DB 196,227,249,22,227,1 ; vpextrq $0x1,%xmm4,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,36,176 ; vmovss (%rax,%r14,4),%xmm4
+ DB 196,163,89,33,36,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,161,122,16,52,184 ; vmovss (%rax,%r15,4),%xmm6
+ DB 196,227,89,33,230,32 ; vinsertps $0x20,%xmm6,%xmm4,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,227,89,33,230,48 ; vinsertps $0x30,%xmm6,%xmm4,%xmm4
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,163,73,33,52,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm6,%xmm6
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,73,33,247,32 ; vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,73,33,247,48 ; vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ DB 196,227,77,24,244,1 ; vinsertf128 $0x1,%xmm4,%ymm6,%ymm6
+ DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,99,101,24,232,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm13
+ DB 197,161,254,194 ; vpaddd %xmm2,%xmm11,%xmm0
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 197,249,111,108,36,32 ; vmovdqa 0x20(%rsp),%xmm5
+ DB 197,209,254,201 ; vpaddd %xmm1,%xmm5,%xmm1
+ DB 196,194,113,64,223 ; vpmulld %xmm15,%xmm1,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,227,109,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm1
+ DB 196,193,97,254,210 ; vpaddd %xmm10,%xmm3,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,121,254,210 ; vpaddd %xmm10,%xmm0,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,36,184 ; vmovss (%rax,%r15,4),%xmm4
+ DB 196,227,105,33,212,32 ; vinsertps $0x20,%xmm4,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,227,105,33,212,48 ; vinsertps $0x30,%xmm4,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,36,136 ; vmovss (%rax,%r9,4),%xmm4
+ DB 196,163,89,33,36,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,89,33,231,32 ; vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,89,33,231,48 ; vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ DB 196,227,93,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm4,%ymm2
+ DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
+ DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
+ DB 196,193,249,126,218 ; vmovq %xmm3,%r10
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,227,101,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm0
+ DB 196,193,116,92,206 ; vsubps %ymm14,%ymm1,%ymm1
+ DB 197,252,16,156,36,32,2,0,0 ; vmovups 0x220(%rsp),%ymm3
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,140,88,201 ; vaddps %ymm1,%ymm14,%ymm1
+ DB 197,236,92,214 ; vsubps %ymm6,%ymm2,%ymm2
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,204,88,210 ; vaddps %ymm2,%ymm6,%ymm2
+ DB 196,193,124,92,197 ; vsubps %ymm13,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,148,88,192 ; vaddps %ymm0,%ymm13,%ymm0
+ DB 196,193,116,92,204 ; vsubps %ymm12,%ymm1,%ymm1
+ DB 197,252,16,156,36,96,1,0,0 ; vmovups 0x160(%rsp),%ymm3
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,156,88,201 ; vaddps %ymm1,%ymm12,%ymm1
+ DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp)
+ DB 197,252,16,164,36,64,1,0,0 ; vmovups 0x140(%rsp),%ymm4
+ DB 197,236,92,204 ; vsubps %ymm4,%ymm2,%ymm1
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 197,252,17,140,36,64,1,0,0 ; vmovups %ymm1,0x140(%rsp)
+ DB 197,252,16,140,36,32,1,0,0 ; vmovups 0x120(%rsp),%ymm1
+ DB 197,252,92,193 ; vsubps %ymm1,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
+ DB 197,252,17,132,36,32,1,0,0 ; vmovups %ymm0,0x120(%rsp)
+ DB 197,254,111,132,36,192,0,0,0 ; vmovdqu 0xc0(%rsp),%ymm0
+ DB 197,121,254,116,36,96 ; vpaddd 0x60(%rsp),%xmm0,%xmm14
+ DB 197,249,111,132,36,224,0,0,0 ; vmovdqa 0xe0(%rsp),%xmm0
+ DB 197,121,254,172,36,224,1,0,0 ; vpaddd 0x1e0(%rsp),%xmm0,%xmm13
+ DB 197,137,254,148,36,128,1,0,0 ; vpaddd 0x180(%rsp),%xmm14,%xmm2
+ DB 197,233,254,4,36 ; vpaddd (%rsp),%xmm2,%xmm0
+ DB 196,194,121,64,247 ; vpmulld %xmm15,%xmm0,%xmm6
+ DB 196,193,249,126,242 ; vmovq %xmm6,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,243,1 ; vpextrq $0x1,%xmm6,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,227,121,33,193,48 ; vinsertps $0x30,%xmm1,%xmm0,%xmm0
+ DB 197,145,254,140,36,144,0,0,0 ; vpaddd 0x90(%rsp),%xmm13,%xmm1
+ DB 196,193,113,254,216 ; vpaddd %xmm8,%xmm1,%xmm3
+ DB 196,194,97,64,223 ; vpmulld %xmm15,%xmm3,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,163,89,33,36,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,163,89,33,36,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm4,%xmm4
+ DB 196,99,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm12
+ DB 196,193,97,254,226 ; vpaddd %xmm10,%xmm3,%xmm4
+ DB 196,195,249,22,225,1 ; vpextrq $0x1,%xmm4,%r9
+ DB 196,193,249,126,226 ; vmovq %xmm4,%r10
+ DB 196,193,73,254,226 ; vpaddd %xmm10,%xmm6,%xmm4
+ DB 196,193,249,126,227 ; vmovq %xmm4,%r11
+ DB 196,227,249,22,227,1 ; vpextrq $0x1,%xmm4,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,36,176 ; vmovss (%rax,%r14,4),%xmm4
+ DB 196,163,89,33,36,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,161,122,16,60,184 ; vmovss (%rax,%r15,4),%xmm7
+ DB 196,227,89,33,231,32 ; vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,89,33,231,48 ; vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,163,65,33,60,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,161,122,16,4,144 ; vmovss (%rax,%r10,4),%xmm0
+ DB 196,227,65,33,192,32 ; vinsertps $0x20,%xmm0,%xmm7,%xmm0
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,121,33,199,48 ; vinsertps $0x30,%xmm7,%xmm0,%xmm0
+ DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
+ DB 196,193,97,254,193 ; vpaddd %xmm9,%xmm3,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,73,254,193 ; vpaddd %xmm9,%xmm6,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,121,33,195,32 ; vinsertps $0x20,%xmm3,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,52,144 ; vmovss (%rax,%r10,4),%xmm6
+ DB 196,227,97,33,222,32 ; vinsertps $0x20,%xmm6,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,97,33,222,48 ; vinsertps $0x30,%xmm6,%xmm3,%xmm3
+ DB 196,99,101,24,216,1 ; vinsertf128 $0x1,%xmm0,%ymm3,%ymm11
+ DB 197,233,254,68,36,16 ; vpaddd 0x10(%rsp),%xmm2,%xmm0
+ DB 196,194,121,64,215 ; vpmulld %xmm15,%xmm0,%xmm2
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,136 ; vmovss (%rax,%r9,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,163,121,33,4,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm0,%xmm0
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,121,33,195,48 ; vinsertps $0x30,%xmm3,%xmm0,%xmm0
+ DB 197,209,254,201 ; vpaddd %xmm1,%xmm5,%xmm1
+ DB 196,194,113,64,223 ; vpmulld %xmm15,%xmm1,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm1,%xmm1
+ DB 196,163,113,33,12,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm1,%xmm1
+ DB 196,227,125,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm1
+ DB 196,193,97,254,194 ; vpaddd %xmm10,%xmm3,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,105,254,194 ; vpaddd %xmm10,%xmm2,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,52,184 ; vmovss (%rax,%r15,4),%xmm6
+ DB 196,227,121,33,198,32 ; vinsertps $0x20,%xmm6,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,227,121,33,198,48 ; vinsertps $0x30,%xmm6,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,52,136 ; vmovss (%rax,%r9,4),%xmm6
+ DB 196,163,73,33,52,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm6,%xmm6
+ DB 196,161,122,16,60,144 ; vmovss (%rax,%r10,4),%xmm7
+ DB 196,227,73,33,247,32 ; vinsertps $0x20,%xmm7,%xmm6,%xmm6
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,73,33,247,48 ; vinsertps $0x30,%xmm7,%xmm6,%xmm6
+ DB 196,227,77,24,240,1 ; vinsertf128 $0x1,%xmm0,%ymm6,%ymm6
+ DB 196,193,97,254,193 ; vpaddd %xmm9,%xmm3,%xmm0
+ DB 196,195,249,22,193,1 ; vpextrq $0x1,%xmm0,%r9
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 196,193,105,254,193 ; vpaddd %xmm9,%xmm2,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,121,33,194,32 ; vinsertps $0x20,%xmm2,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,227,121,33,194,48 ; vinsertps $0x30,%xmm2,%xmm0,%xmm0
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,144 ; vmovss (%rax,%r10,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 196,227,109,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm2,%ymm0
+ DB 196,193,116,92,204 ; vsubps %ymm12,%ymm1,%ymm1
+ DB 197,252,16,148,36,32,2,0,0 ; vmovups 0x220(%rsp),%ymm2
+ DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
+ DB 197,156,88,201 ; vaddps %ymm1,%ymm12,%ymm1
+ DB 197,252,17,140,36,128,1,0,0 ; vmovups %ymm1,0x180(%rsp)
+ DB 197,204,92,204 ; vsubps %ymm4,%ymm6,%ymm1
+ DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
+ DB 197,92,88,225 ; vaddps %ymm1,%ymm4,%ymm12
+ DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
+ DB 197,236,89,192 ; vmulps %ymm0,%ymm2,%ymm0
+ DB 197,252,40,234 ; vmovaps %ymm2,%ymm5
+ DB 197,36,88,216 ; vaddps %ymm0,%ymm11,%ymm11
+ DB 197,145,254,76,36,112 ; vpaddd 0x70(%rsp),%xmm13,%xmm1
+ DB 197,137,254,132,36,128,0,0,0 ; vpaddd 0x80(%rsp),%xmm14,%xmm0
+ DB 197,249,254,28,36 ; vpaddd (%rsp),%xmm0,%xmm3
+ DB 196,66,97,64,247 ; vpmulld %xmm15,%xmm3,%xmm14
+ DB 196,65,249,126,242 ; vmovq %xmm14,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,99,249,22,243,1 ; vpextrq $0x1,%xmm14,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm3,%xmm3
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,228,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm4
+ DB 196,193,113,254,216 ; vpaddd %xmm8,%xmm1,%xmm3
+ DB 196,194,97,64,223 ; vpmulld %xmm15,%xmm3,%xmm3
+ DB 197,249,126,219 ; vmovd %xmm3,%ebx
+ DB 196,195,121,22,217,1 ; vpextrd $0x1,%xmm3,%r9d
+ DB 196,195,121,22,218,2 ; vpextrd $0x2,%xmm3,%r10d
+ DB 196,195,121,22,219,3 ; vpextrd $0x3,%xmm3,%r11d
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,163,73,33,52,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm6,%xmm6
+ DB 196,163,73,33,52,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm6,%xmm6
+ DB 196,163,73,33,52,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm6,%xmm6
+ DB 196,99,93,24,198,1 ; vinsertf128 $0x1,%xmm6,%ymm4,%ymm8
+ DB 196,193,97,254,226 ; vpaddd %xmm10,%xmm3,%xmm4
+ DB 196,195,249,22,225,1 ; vpextrq $0x1,%xmm4,%r9
+ DB 196,193,249,126,226 ; vmovq %xmm4,%r10
+ DB 196,193,9,254,226 ; vpaddd %xmm10,%xmm14,%xmm4
+ DB 196,193,249,126,227 ; vmovq %xmm4,%r11
+ DB 196,227,249,22,227,1 ; vpextrq $0x1,%xmm4,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,36,176 ; vmovss (%rax,%r14,4),%xmm4
+ DB 196,163,89,33,36,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm4,%xmm4
+ DB 196,161,122,16,60,184 ; vmovss (%rax,%r15,4),%xmm7
+ DB 196,227,89,33,231,32 ; vinsertps $0x20,%xmm7,%xmm4,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,227,89,33,231,48 ; vinsertps $0x30,%xmm7,%xmm4,%xmm4
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,60,136 ; vmovss (%rax,%r9,4),%xmm7
+ DB 196,163,65,33,60,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm7,%xmm7
+ DB 196,161,122,16,20,144 ; vmovss (%rax,%r10,4),%xmm2
+ DB 196,227,65,33,210,32 ; vinsertps $0x20,%xmm2,%xmm7,%xmm2
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,60,152 ; vmovss (%rax,%rbx,4),%xmm7
+ DB 196,227,105,33,215,48 ; vinsertps $0x30,%xmm7,%xmm2,%xmm2
+ DB 196,227,109,24,252,1 ; vinsertf128 $0x1,%xmm4,%ymm2,%ymm7
+ DB 196,193,97,254,209 ; vpaddd %xmm9,%xmm3,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,9,254,209 ; vpaddd %xmm9,%xmm14,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,36,144 ; vmovss (%rax,%r10,4),%xmm4
+ DB 196,227,97,33,220,32 ; vinsertps $0x20,%xmm4,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,36,152 ; vmovss (%rax,%rbx,4),%xmm4
+ DB 196,227,97,33,220,48 ; vinsertps $0x30,%xmm4,%xmm3,%xmm3
+ DB 196,99,101,24,242,1 ; vinsertf128 $0x1,%xmm2,%ymm3,%ymm14
+ DB 197,249,254,68,36,16 ; vpaddd 0x10(%rsp),%xmm0,%xmm0
+ DB 197,241,254,76,36,32 ; vpaddd 0x20(%rsp),%xmm1,%xmm1
+ DB 196,194,113,64,207 ; vpmulld %xmm15,%xmm1,%xmm1
+ DB 196,194,121,64,199 ; vpmulld %xmm15,%xmm0,%xmm0
+ DB 196,193,249,126,194 ; vmovq %xmm0,%r10
+ DB 69,137,209 ; mov %r10d,%r9d
+ DB 196,227,249,22,195,1 ; vpextrq $0x1,%xmm0,%rbx
+ DB 65,137,219 ; mov %ebx,%r11d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,20,136 ; vmovss (%rax,%r9,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,163,105,33,20,152,32 ; vinsertps $0x20,(%rax,%r11,4),%xmm2,%xmm2
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 197,249,126,203 ; vmovd %xmm1,%ebx
+ DB 196,195,121,22,201,1 ; vpextrd $0x1,%xmm1,%r9d
+ DB 196,195,121,22,202,2 ; vpextrd $0x2,%xmm1,%r10d
+ DB 196,195,121,22,203,3 ; vpextrd $0x3,%xmm1,%r11d
+ DB 197,250,16,28,152 ; vmovss (%rax,%rbx,4),%xmm3
+ DB 196,163,97,33,28,136,16 ; vinsertps $0x10,(%rax,%r9,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm3,%xmm3
+ DB 196,163,97,33,28,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,227,109,24,227,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm4
+ DB 196,193,113,254,210 ; vpaddd %xmm10,%xmm1,%xmm2
+ DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
+ DB 196,193,249,126,210 ; vmovq %xmm2,%r10
+ DB 196,193,121,254,210 ; vpaddd %xmm10,%xmm0,%xmm2
+ DB 196,193,249,126,211 ; vmovq %xmm2,%r11
+ DB 196,227,249,22,211,1 ; vpextrq $0x1,%xmm2,%rbx
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 69,137,207 ; mov %r9d,%r15d
+ DB 196,161,122,16,20,176 ; vmovss (%rax,%r14,4),%xmm2
+ DB 196,163,105,33,20,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm2,%xmm2
+ DB 196,161,122,16,28,184 ; vmovss (%rax,%r15,4),%xmm3
+ DB 196,227,105,33,211,32 ; vinsertps $0x20,%xmm3,%xmm2,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,227,105,33,211,48 ; vinsertps $0x30,%xmm3,%xmm2,%xmm2
+ DB 69,137,217 ; mov %r11d,%r9d
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 196,161,122,16,28,136 ; vmovss (%rax,%r9,4),%xmm3
+ DB 196,163,97,33,28,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm3,%xmm3
+ DB 196,161,122,16,52,144 ; vmovss (%rax,%r10,4),%xmm6
+ DB 196,227,97,33,222,32 ; vinsertps $0x20,%xmm6,%xmm3,%xmm3
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 197,250,16,52,152 ; vmovss (%rax,%rbx,4),%xmm6
+ DB 196,227,97,33,222,48 ; vinsertps $0x30,%xmm6,%xmm3,%xmm3
+ DB 196,227,101,24,218,1 ; vinsertf128 $0x1,%xmm2,%ymm3,%ymm3
+ DB 196,193,113,254,201 ; vpaddd %xmm9,%xmm1,%xmm1
+ DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
+ DB 196,193,249,126,202 ; vmovq %xmm1,%r10
+ DB 196,193,121,254,193 ; vpaddd %xmm9,%xmm0,%xmm0
+ DB 196,193,249,126,195 ; vmovq %xmm0,%r11
+ DB 196,195,249,22,199,1 ; vpextrq $0x1,%xmm0,%r15
+ DB 69,137,214 ; mov %r10d,%r14d
+ DB 73,193,234,32 ; shr $0x20,%r10
+ DB 196,161,122,16,4,176 ; vmovss (%rax,%r14,4),%xmm0
+ DB 196,163,121,33,4,144,16 ; vinsertps $0x10,(%rax,%r10,4),%xmm0,%xmm0
+ DB 68,137,203 ; mov %r9d,%ebx
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,227,121,33,193,32 ; vinsertps $0x20,%xmm1,%xmm0,%xmm0
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 196,161,122,16,12,136 ; vmovss (%rax,%r9,4),%xmm1
+ DB 196,227,121,33,193,48 ; vinsertps $0x30,%xmm1,%xmm0,%xmm0
+ DB 68,137,219 ; mov %r11d,%ebx
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 197,250,16,12,152 ; vmovss (%rax,%rbx,4),%xmm1
+ DB 196,163,113,33,12,152,16 ; vinsertps $0x10,(%rax,%r11,4),%xmm1,%xmm1
+ DB 68,137,251 ; mov %r15d,%ebx
+ DB 197,250,16,20,152 ; vmovss (%rax,%rbx,4),%xmm2
+ DB 196,227,113,33,202,32 ; vinsertps $0x20,%xmm2,%xmm1,%xmm1
+ DB 73,193,239,32 ; shr $0x20,%r15
+ DB 196,161,122,16,20,184 ; vmovss (%rax,%r15,4),%xmm2
+ DB 196,227,113,33,202,48 ; vinsertps $0x30,%xmm2,%xmm1,%xmm1
+ DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
+ DB 196,193,92,92,200 ; vsubps %ymm8,%ymm4,%ymm1
+ DB 197,212,89,201 ; vmulps %ymm1,%ymm5,%ymm1
+ DB 197,188,88,201 ; vaddps %ymm1,%ymm8,%ymm1
+ DB 197,228,92,215 ; vsubps %ymm7,%ymm3,%ymm2
+ DB 197,212,89,210 ; vmulps %ymm2,%ymm5,%ymm2
+ DB 197,196,88,210 ; vaddps %ymm2,%ymm7,%ymm2
+ DB 196,193,124,92,198 ; vsubps %ymm14,%ymm0,%ymm0
+ DB 197,212,89,192 ; vmulps %ymm0,%ymm5,%ymm0
+ DB 197,140,88,192 ; vaddps %ymm0,%ymm14,%ymm0
+ DB 197,252,16,164,36,128,1,0,0 ; vmovups 0x180(%rsp),%ymm4
+ DB 197,244,92,204 ; vsubps %ymm4,%ymm1,%ymm1
+ DB 197,252,16,156,36,96,1,0,0 ; vmovups 0x160(%rsp),%ymm3
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 196,193,108,92,212 ; vsubps %ymm12,%ymm2,%ymm2
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,156,88,210 ; vaddps %ymm2,%ymm12,%ymm2
+ DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
+ DB 197,252,16,164,36,160,0,0,0 ; vmovups 0xa0(%rsp),%ymm4
+ DB 197,244,92,204 ; vsubps %ymm4,%ymm1,%ymm1
+ DB 197,252,16,92,36,64 ; vmovups 0x40(%rsp),%ymm3
+ DB 197,228,89,201 ; vmulps %ymm1,%ymm3,%ymm1
+ DB 197,220,88,201 ; vaddps %ymm1,%ymm4,%ymm1
+ DB 197,252,16,164,36,64,1,0,0 ; vmovups 0x140(%rsp),%ymm4
+ DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
+ DB 197,220,88,210 ; vaddps %ymm2,%ymm4,%ymm2
+ DB 197,252,16,164,36,32,1,0,0 ; vmovups 0x120(%rsp),%ymm4
+ DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
+ DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
+ DB 197,220,88,216 ; vaddps %ymm0,%ymm4,%ymm3
+ DB 197,252,91,132,36,96,2,0,0 ; vcvtdq2ps 0x260(%rsp),%ymm0
+ DB 197,252,16,164,36,128,2,0,0 ; vmovups 0x280(%rsp),%ymm4
+ DB 197,220,92,224 ; vsubps %ymm0,%ymm4,%ymm4
+ DB 197,252,16,172,36,160,1,0,0 ; vmovups 0x1a0(%rsp),%ymm5
+ DB 197,244,92,197 ; vsubps %ymm5,%ymm1,%ymm0
+ DB 197,220,89,192 ; vmulps %ymm0,%ymm4,%ymm0
+ DB 197,212,88,192 ; vaddps %ymm0,%ymm5,%ymm0
+ DB 197,252,16,172,36,0,2,0,0 ; vmovups 0x200(%rsp),%ymm5
+ DB 197,236,92,205 ; vsubps %ymm5,%ymm2,%ymm1
+ DB 197,220,89,201 ; vmulps %ymm1,%ymm4,%ymm1
+ DB 197,212,88,201 ; vaddps %ymm1,%ymm5,%ymm1
+ DB 197,252,16,172,36,0,1,0,0 ; vmovups 0x100(%rsp),%ymm5
+ DB 197,228,92,213 ; vsubps %ymm5,%ymm3,%ymm2
+ DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2
+ DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 196,226,125,24,29,112,5,0,0 ; vbroadcastss 0x570(%rip),%ymm3 # b488 <_sk_clut_4D_avx+0x26af>
+ DB 197,252,16,164,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm4
+ DB 197,252,16,172,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm5
+ DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6
+ DB 197,252,16,188,36,0,3,0,0 ; vmovups 0x300(%rsp),%ymm7
+ DB 72,129,196,32,3,0,0 ; add $0x320,%rsp
+ DB 91 ; pop %rbx
+ DB 65,94 ; pop %r14
+ DB 65,95 ; pop %r15
+ DB 255,224 ; jmpq *%rax
+
ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
@@ -13760,25 +16836,25 @@ ALIGN 4
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7d7d <.literal4+0xb9>
+ DB 71,225,61 ; rex.RXB loope b005 <.literal4+0xb9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7d8d <.literal4+0xc9>
+ DB 71,225,61 ; rex.RXB loope b015 <.literal4+0xc9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7d9d <.literal4+0xd9>
+ DB 71,225,61 ; rex.RXB loope b025 <.literal4+0xd9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7dad <.literal4+0xe9>
+ DB 71,225,61 ; rex.RXB loope b035 <.literal4+0xe9>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
@@ -13843,7 +16919,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7e1d <.literal4+0x159>
+ DB 224,7 ; loopne b0a5 <.literal4+0x159>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -13859,10 +16935,10 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 7e44 <.literal4+0x180>
+ DB 127,0 ; jg b0cc <.literal4+0x180>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7ebd <.literal4+0x1f9>
+ DB 119,115 ; ja b145 <.literal4+0x1f9>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13876,10 +16952,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7e78 <.literal4+0x1b4>
+ DB 127,0 ; jg b100 <.literal4+0x1b4>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7ef1 <.literal4+0x22d>
+ DB 119,115 ; ja b179 <.literal4+0x22d>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13893,10 +16969,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7eac <.literal4+0x1e8>
+ DB 127,0 ; jg b134 <.literal4+0x1e8>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7f25 <.literal4+0x261>
+ DB 119,115 ; ja b1ad <.literal4+0x261>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13910,10 +16986,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7ee0 <.literal4+0x21c>
+ DB 127,0 ; jg b168 <.literal4+0x21c>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7f59 <.literal4+0x295>
+ DB 119,115 ; ja b1e1 <.literal4+0x295>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13927,10 +17003,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7f14 <.literal4+0x250>
+ DB 127,0 ; jg b19c <.literal4+0x250>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7f8d <.literal4+0x2c9>
+ DB 119,115 ; ja b215 <.literal4+0x2c9>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13943,7 +17019,7 @@ ALIGN 4
DB 0,75,0 ; add %cl,0x0(%rbx)
DB 0,200 ; add %cl,%al
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 7f87 <.literal4+0x2c3>
+ DB 127,67 ; jg b20f <.literal4+0x2c3>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -13955,7 +17031,7 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 7fa7 <.literal4+0x2e3>
+ DB 118,63 ; jbe b22f <.literal4+0x2e3>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
@@ -13977,7 +17053,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7fc1 <.literal4+0x2fd>
+ DB 224,7 ; loopne b249 <.literal4+0x2fd>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -13989,7 +17065,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7fdd <.literal4+0x319>
+ DB 224,7 ; loopne b265 <.literal4+0x319>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -14000,7 +17076,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 8032 <.literal4+0x36e>
+ DB 124,66 ; jl b2ba <.literal4+0x36e>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -14026,7 +17102,7 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 8095 <.literal4+0x3d1>
+ DB 112,65 ; jo b31d <.literal4+0x3d1>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
@@ -14052,7 +17128,7 @@ ALIGN 4
DB 0,128,55,0,0,128 ; add %al,-0x7fffffc9(%rax)
DB 63 ; (bad)
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 8107 <.literal4+0x443>
+ DB 127,71 ; jg b38f <.literal4+0x443>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -14165,7 +17241,24 @@ ALIGN 4
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
- DB 190 ; .byte 0xbe
+ DB 190,114,249,127,63 ; mov $0x3f7ff972,%esi
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 114,249 ; jb b473 <.literal4+0x527>
+ DB 127,63 ; jg b4bb <_sk_clut_4D_avx+0x26e2>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 128 ; .byte 0x80
+ DB 63 ; (bad)
ALIGN 16
DB 0,2 ; add %al,(%rdx)
@@ -14598,7 +17691,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,251,94,0,0 ; movaps 0x5efb(%rip),%xmm2 # 6050 <_sk_callback_sse41+0xd5>
+ DB 15,40,21,251,121,0,0 ; movaps 0x79fb(%rip),%xmm2 # 7b50 <_sk_clut_4D_sse41+0x11ed>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -14607,7 +17700,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,234,94,0,0 ; movaps 0x5eea(%rip),%xmm2 # 6060 <_sk_callback_sse41+0xe5>
+ DB 15,40,21,234,121,0,0 ; movaps 0x79ea(%rip),%xmm2 # 7b60 <_sk_clut_4D_sse41+0x11fd>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -14625,14 +17718,14 @@ _sk_dither_sse41 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,184,94,0,0 ; movdqa 0x5eb8(%rip),%xmm10 # 6070 <_sk_callback_sse41+0xf5>
+ DB 102,68,15,111,21,184,121,0,0 ; movdqa 0x79b8(%rip),%xmm10 # 7b70 <_sk_clut_4D_sse41+0x120d>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,164,94,0,0 ; movdqa 0x5ea4(%rip),%xmm12 # 6080 <_sk_callback_sse41+0x105>
- DB 102,68,15,111,45,171,94,0,0 ; movdqa 0x5eab(%rip),%xmm13 # 6090 <_sk_callback_sse41+0x115>
+ DB 102,68,15,111,37,164,121,0,0 ; movdqa 0x79a4(%rip),%xmm12 # 7b80 <_sk_clut_4D_sse41+0x121d>
+ DB 102,68,15,111,45,171,121,0,0 ; movdqa 0x79ab(%rip),%xmm13 # 7b90 <_sk_clut_4D_sse41+0x122d>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -14648,8 +17741,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,102,94,0,0 ; mulps 0x5e66(%rip),%xmm8 # 60a0 <_sk_callback_sse41+0x125>
- DB 68,15,88,5,110,94,0,0 ; addps 0x5e6e(%rip),%xmm8 # 60b0 <_sk_callback_sse41+0x135>
+ DB 68,15,89,5,102,121,0,0 ; mulps 0x7966(%rip),%xmm8 # 7ba0 <_sk_clut_4D_sse41+0x123d>
+ DB 68,15,88,5,110,121,0,0 ; addps 0x796e(%rip),%xmm8 # 7bb0 <_sk_clut_4D_sse41+0x124d>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -14687,7 +17780,7 @@ _sk_uniform_color_sse41 LABEL PROC
PUBLIC _sk_black_color_sse41
_sk_black_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,4,94,0,0 ; movaps 0x5e04(%rip),%xmm3 # 60c0 <_sk_callback_sse41+0x145>
+ DB 15,40,29,4,121,0,0 ; movaps 0x7904(%rip),%xmm3 # 7bc0 <_sk_clut_4D_sse41+0x125d>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -14696,7 +17789,7 @@ _sk_black_color_sse41 LABEL PROC
PUBLIC _sk_white_color_sse41
_sk_white_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,0,94,0,0 ; movaps 0x5e00(%rip),%xmm0 # 60d0 <_sk_callback_sse41+0x155>
+ DB 15,40,5,0,121,0,0 ; movaps 0x7900(%rip),%xmm0 # 7bd0 <_sk_clut_4D_sse41+0x126d>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -14734,7 +17827,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,192,93,0,0 ; movaps 0x5dc0(%rip),%xmm8 # 60e0 <_sk_callback_sse41+0x165>
+ DB 68,15,40,5,192,120,0,0 ; movaps 0x78c0(%rip),%xmm8 # 7be0 <_sk_clut_4D_sse41+0x127d>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -14757,7 +17850,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,131,93,0,0 ; movaps 0x5d83(%rip),%xmm9 # 60f0 <_sk_callback_sse41+0x175>
+ DB 68,15,40,13,131,120,0,0 ; movaps 0x7883(%rip),%xmm9 # 7bf0 <_sk_clut_4D_sse41+0x128d>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -14798,7 +17891,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,39,93,0,0 ; movaps 0x5d27(%rip),%xmm8 # 6100 <_sk_callback_sse41+0x185>
+ DB 68,15,40,5,39,120,0,0 ; movaps 0x7827(%rip),%xmm8 # 7c00 <_sk_clut_4D_sse41+0x129d>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -14809,7 +17902,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,23,93,0,0 ; movaps 0x5d17(%rip),%xmm8 # 6110 <_sk_callback_sse41+0x195>
+ DB 68,15,40,5,23,120,0,0 ; movaps 0x7817(%rip),%xmm8 # 7c10 <_sk_clut_4D_sse41+0x12ad>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -14824,7 +17917,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,250,92,0,0 ; movaps 0x5cfa(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x1a5>
+ DB 68,15,40,5,250,119,0,0 ; movaps 0x77fa(%rip),%xmm8 # 7c20 <_sk_clut_4D_sse41+0x12bd>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -14842,7 +17935,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,206,92,0,0 ; movaps 0x5cce(%rip),%xmm8 # 6130 <_sk_callback_sse41+0x1b5>
+ DB 68,15,40,5,206,119,0,0 ; movaps 0x77ce(%rip),%xmm8 # 7c30 <_sk_clut_4D_sse41+0x12cd>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -14866,7 +17959,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,162,92,0,0 ; movaps 0x5ca2(%rip),%xmm8 # 6140 <_sk_callback_sse41+0x1c5>
+ DB 68,15,40,5,162,119,0,0 ; movaps 0x77a2(%rip),%xmm8 # 7c40 <_sk_clut_4D_sse41+0x12dd>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -14935,7 +18028,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,215,91,0,0 ; movaps 0x5bd7(%rip),%xmm3 # 6150 <_sk_callback_sse41+0x1d5>
+ DB 15,40,29,215,118,0,0 ; movaps 0x76d7(%rip),%xmm3 # 7c50 <_sk_clut_4D_sse41+0x12ed>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -14981,7 +18074,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,66,91,0,0 ; movaps 0x5b42(%rip),%xmm2 # 6160 <_sk_callback_sse41+0x1e5>
+ DB 15,40,21,66,118,0,0 ; movaps 0x7642(%rip),%xmm2 # 7c60 <_sk_clut_4D_sse41+0x12fd>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -15013,7 +18106,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,231,90,0,0 ; movaps 0x5ae7(%rip),%xmm2 # 6170 <_sk_callback_sse41+0x1f5>
+ DB 15,40,21,231,117,0,0 ; movaps 0x75e7(%rip),%xmm2 # 7c70 <_sk_clut_4D_sse41+0x130d>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -15048,7 +18141,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,129,90,0,0 ; movaps 0x5a81(%rip),%xmm2 # 6180 <_sk_callback_sse41+0x205>
+ DB 15,40,21,129,117,0,0 ; movaps 0x7581(%rip),%xmm2 # 7c80 <_sk_clut_4D_sse41+0x131d>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -15074,7 +18167,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,65,90,0,0 ; movaps 0x5a41(%rip),%xmm2 # 6190 <_sk_callback_sse41+0x215>
+ DB 15,40,21,65,117,0,0 ; movaps 0x7541(%rip),%xmm2 # 7c90 <_sk_clut_4D_sse41+0x132d>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -15085,7 +18178,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,52,90,0,0 ; movaps 0x5a34(%rip),%xmm10 # 61a0 <_sk_callback_sse41+0x225>
+ DB 68,15,40,21,52,117,0,0 ; movaps 0x7534(%rip),%xmm10 # 7ca0 <_sk_clut_4D_sse41+0x133d>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,203 ; movaps %xmm11,%xmm9
@@ -15165,7 +18258,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,18,89,0,0 ; movaps 0x5912(%rip),%xmm10 # 61b0 <_sk_callback_sse41+0x235>
+ DB 68,15,40,21,18,116,0,0 ; movaps 0x7412(%rip),%xmm10 # 7cb0 <_sk_clut_4D_sse41+0x134d>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -15246,7 +18339,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,232,87,0,0 ; movaps 0x57e8(%rip),%xmm10 # 61c0 <_sk_callback_sse41+0x245>
+ DB 68,15,40,21,232,114,0,0 ; movaps 0x72e8(%rip),%xmm10 # 7cc0 <_sk_clut_4D_sse41+0x135d>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -15328,7 +18421,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,202,86,0,0 ; movaps 0x56ca(%rip),%xmm10 # 61d0 <_sk_callback_sse41+0x255>
+ DB 68,15,40,21,202,113,0,0 ; movaps 0x71ca(%rip),%xmm10 # 7cd0 <_sk_clut_4D_sse41+0x136d>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -15412,7 +18505,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,157,85,0,0 ; movaps 0x559d(%rip),%xmm1 # 61e0 <_sk_callback_sse41+0x265>
+ DB 15,40,13,157,112,0,0 ; movaps 0x709d(%rip),%xmm1 # 7ce0 <_sk_clut_4D_sse41+0x137d>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -15425,10 +18518,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,123,85,0,0 ; movaps 0x557b(%rip),%xmm13 # 61f0 <_sk_callback_sse41+0x275>
+ DB 68,15,40,45,123,112,0,0 ; movaps 0x707b(%rip),%xmm13 # 7cf0 <_sk_clut_4D_sse41+0x138d>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,123,85,0,0 ; movaps 0x557b(%rip),%xmm12 # 6200 <_sk_callback_sse41+0x285>
+ DB 68,15,40,37,123,112,0,0 ; movaps 0x707b(%rip),%xmm12 # 7d00 <_sk_clut_4D_sse41+0x139d>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -15614,12 +18707,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,225,82,0,0 ; movaps 0x52e1(%rip),%xmm0 # 6210 <_sk_callback_sse41+0x295>
+ DB 15,40,5,225,109,0,0 ; movaps 0x6de1(%rip),%xmm0 # 7d10 <_sk_clut_4D_sse41+0x13ad>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,230,82,0,0 ; movaps 0x52e6(%rip),%xmm2 # 6220 <_sk_callback_sse41+0x2a5>
+ DB 15,40,21,230,109,0,0 ; movaps 0x6de6(%rip),%xmm2 # 7d20 <_sk_clut_4D_sse41+0x13bd>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,231,82,0,0 ; movaps 0x52e7(%rip),%xmm14 # 6230 <_sk_callback_sse41+0x2b5>
+ DB 68,15,40,53,231,109,0,0 ; movaps 0x6de7(%rip),%xmm14 # 7d30 <_sk_clut_4D_sse41+0x13cd>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -15702,7 +18795,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,172,81,0,0 ; movaps 0x51ac(%rip),%xmm9 # 6240 <_sk_callback_sse41+0x2c5>
+ DB 68,15,40,13,172,108,0,0 ; movaps 0x6cac(%rip),%xmm9 # 7d40 <_sk_clut_4D_sse41+0x13dd>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -15796,14 +18889,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,95,80,0,0 ; movaps 0x505f(%rip),%xmm2 # 6250 <_sk_callback_sse41+0x2d5>
+ DB 15,40,21,95,107,0,0 ; movaps 0x6b5f(%rip),%xmm2 # 7d50 <_sk_clut_4D_sse41+0x13ed>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,98,80,0,0 ; movaps 0x5062(%rip),%xmm1 # 6260 <_sk_callback_sse41+0x2e5>
+ DB 15,40,13,98,107,0,0 ; movaps 0x6b62(%rip),%xmm1 # 7d60 <_sk_clut_4D_sse41+0x13fd>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,97,80,0,0 ; movaps 0x5061(%rip),%xmm13 # 6270 <_sk_callback_sse41+0x2f5>
+ DB 68,15,40,45,97,107,0,0 ; movaps 0x6b61(%rip),%xmm13 # 7d70 <_sk_clut_4D_sse41+0x140d>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -15884,7 +18977,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,39,79,0,0 ; movaps 0x4f27(%rip),%xmm9 # 6280 <_sk_callback_sse41+0x305>
+ DB 68,15,40,13,39,106,0,0 ; movaps 0x6a27(%rip),%xmm9 # 7d80 <_sk_clut_4D_sse41+0x141d>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -15939,14 +19032,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,108,78,0,0 ; movaps 0x4e6c(%rip),%xmm9 # 6290 <_sk_callback_sse41+0x315>
+ DB 68,15,40,13,108,105,0,0 ; movaps 0x696c(%rip),%xmm9 # 7d90 <_sk_clut_4D_sse41+0x142d>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,108,78,0,0 ; movaps 0x4e6c(%rip),%xmm10 # 62a0 <_sk_callback_sse41+0x325>
+ DB 68,15,40,21,108,105,0,0 ; movaps 0x696c(%rip),%xmm10 # 7da0 <_sk_clut_4D_sse41+0x143d>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,105,78,0,0 ; movaps 0x4e69(%rip),%xmm11 # 62b0 <_sk_callback_sse41+0x335>
+ DB 68,15,40,29,105,105,0,0 ; movaps 0x6969(%rip),%xmm11 # 7db0 <_sk_clut_4D_sse41+0x144d>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -16031,7 +19124,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,37,77,0,0 ; movaps 0x4d25(%rip),%xmm9 # 62c0 <_sk_callback_sse41+0x345>
+ DB 68,15,40,13,37,104,0,0 ; movaps 0x6825(%rip),%xmm9 # 7dc0 <_sk_clut_4D_sse41+0x145d>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -16083,13 +19176,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,119,76,0,0 ; movaps 0x4c77(%rip),%xmm8 # 62d0 <_sk_callback_sse41+0x355>
+ DB 68,15,40,5,119,103,0,0 ; movaps 0x6777(%rip),%xmm8 # 7dd0 <_sk_clut_4D_sse41+0x146d>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,123,76,0,0 ; movaps 0x4c7b(%rip),%xmm10 # 62e0 <_sk_callback_sse41+0x365>
+ DB 68,15,40,21,123,103,0,0 ; movaps 0x677b(%rip),%xmm10 # 7de0 <_sk_clut_4D_sse41+0x147d>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,121,76,0,0 ; movaps 0x4c79(%rip),%xmm12 # 62f0 <_sk_callback_sse41+0x375>
+ DB 68,15,40,37,121,103,0,0 ; movaps 0x6779(%rip),%xmm12 # 7df0 <_sk_clut_4D_sse41+0x148d>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -16174,7 +19267,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,47,75,0,0 ; movaps 0x4b2f(%rip),%xmm0 # 6300 <_sk_callback_sse41+0x385>
+ DB 15,40,5,47,102,0,0 ; movaps 0x662f(%rip),%xmm0 # 7e00 <_sk_clut_4D_sse41+0x149d>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -16221,20 +19314,20 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 15,133,219,0,0,0 ; jne 193c <_sk_srcover_rgba_8888_sse41+0xfb>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,158,74,0,0 ; movdqa 0x4a9e(%rip),%xmm4 # 6310 <_sk_callback_sse41+0x395>
+ DB 102,15,111,37,158,101,0,0 ; movdqa 0x659e(%rip),%xmm4 # 7e10 <_sk_clut_4D_sse41+0x14ad>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,154,74,0,0 ; pshufb 0x4a9a(%rip),%xmm5 # 6320 <_sk_callback_sse41+0x3a5>
+ DB 102,15,56,0,45,154,101,0,0 ; pshufb 0x659a(%rip),%xmm5 # 7e20 <_sk_clut_4D_sse41+0x14bd>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,154,74,0,0 ; pshufb 0x4a9a(%rip),%xmm6 # 6330 <_sk_callback_sse41+0x3b5>
+ DB 102,15,56,0,53,154,101,0,0 ; pshufb 0x659a(%rip),%xmm6 # 7e30 <_sk_clut_4D_sse41+0x14cd>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,151,74,0,0 ; movaps 0x4a97(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x3c5>
+ DB 68,15,40,5,151,101,0,0 ; movaps 0x6597(%rip),%xmm8 # 7e40 <_sk_clut_4D_sse41+0x14dd>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,155,74,0,0 ; movaps 0x4a9b(%rip),%xmm12 # 6350 <_sk_callback_sse41+0x3d5>
+ DB 68,15,40,37,155,101,0,0 ; movaps 0x659b(%rip),%xmm12 # 7e50 <_sk_clut_4D_sse41+0x14ed>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -16310,7 +19403,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,134,73,0,0 ; movaps 0x4986(%rip),%xmm8 # 6360 <_sk_callback_sse41+0x3e5>
+ DB 68,15,40,5,134,100,0,0 ; movaps 0x6486(%rip),%xmm8 # 7e60 <_sk_clut_4D_sse41+0x14fd>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -16320,7 +19413,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,123,73,0,0 ; minps 0x497b(%rip),%xmm3 # 6370 <_sk_callback_sse41+0x3f5>
+ DB 15,93,29,123,100,0,0 ; minps 0x647b(%rip),%xmm3 # 7e70 <_sk_clut_4D_sse41+0x150d>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -16329,7 +19422,7 @@ _sk_clamp_a_sse41 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse41
_sk_clamp_a_dst_sse41 LABEL PROC
- DB 15,93,61,119,73,0,0 ; minps 0x4977(%rip),%xmm7 # 6380 <_sk_callback_sse41+0x405>
+ DB 15,93,61,119,100,0,0 ; minps 0x6477(%rip),%xmm7 # 7e80 <_sk_clut_4D_sse41+0x151d>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -16358,7 +19451,7 @@ _sk_swap_rb_sse41 LABEL PROC
PUBLIC _sk_invert_sse41
_sk_invert_sse41 LABEL PROC
- DB 68,15,40,5,67,73,0,0 ; movaps 0x4943(%rip),%xmm8 # 6390 <_sk_callback_sse41+0x415>
+ DB 68,15,40,5,67,100,0,0 ; movaps 0x6443(%rip),%xmm8 # 7e90 <_sk_clut_4D_sse41+0x152d>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -16410,7 +19503,7 @@ _sk_premul_dst_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,221,72,0,0 ; movaps 0x48dd(%rip),%xmm9 # 63a0 <_sk_callback_sse41+0x425>
+ DB 68,15,40,13,221,99,0,0 ; movaps 0x63dd(%rip),%xmm9 # 7ea0 <_sk_clut_4D_sse41+0x153d>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -16422,20 +19515,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,200,72,0,0 ; movaps 0x48c8(%rip),%xmm11 # 63b0 <_sk_callback_sse41+0x435>
+ DB 68,15,40,29,200,99,0,0 ; movaps 0x63c8(%rip),%xmm11 # 7eb0 <_sk_clut_4D_sse41+0x154d>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,192,72,0,0 ; movaps 0x48c0(%rip),%xmm12 # 63c0 <_sk_callback_sse41+0x445>
+ DB 68,15,40,37,192,99,0,0 ; movaps 0x63c0(%rip),%xmm12 # 7ec0 <_sk_clut_4D_sse41+0x155d>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,192,72,0,0 ; movaps 0x48c0(%rip),%xmm13 # 63d0 <_sk_callback_sse41+0x455>
+ DB 68,15,40,45,192,99,0,0 ; movaps 0x63c0(%rip),%xmm13 # 7ed0 <_sk_clut_4D_sse41+0x156d>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,192,72,0,0 ; movaps 0x48c0(%rip),%xmm14 # 63e0 <_sk_callback_sse41+0x465>
+ DB 68,15,40,53,192,99,0,0 ; movaps 0x63c0(%rip),%xmm14 # 7ee0 <_sk_clut_4D_sse41+0x157d>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,196,72,0,0 ; movaps 0x48c4(%rip),%xmm15 # 63f0 <_sk_callback_sse41+0x475>
+ DB 68,15,40,61,196,99,0,0 ; movaps 0x63c4(%rip),%xmm15 # 7ef0 <_sk_clut_4D_sse41+0x158d>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -16470,19 +19563,19 @@ PUBLIC _sk_from_srgb_dst_sse41
_sk_from_srgb_dst_sse41 LABEL PROC
DB 68,15,40,204 ; movaps %xmm4,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,29,79,72,0,0 ; movaps 0x484f(%rip),%xmm11 # 6400 <_sk_callback_sse41+0x485>
+ DB 68,15,40,29,79,99,0,0 ; movaps 0x634f(%rip),%xmm11 # 7f00 <_sk_clut_4D_sse41+0x159d>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 68,15,40,37,72,72,0,0 ; movaps 0x4848(%rip),%xmm12 # 6410 <_sk_callback_sse41+0x495>
+ DB 68,15,40,37,72,99,0,0 ; movaps 0x6348(%rip),%xmm12 # 7f10 <_sk_clut_4D_sse41+0x15ad>
DB 65,15,89,228 ; mulps %xmm12,%xmm4
- DB 68,15,40,45,76,72,0,0 ; movaps 0x484c(%rip),%xmm13 # 6420 <_sk_callback_sse41+0x4a5>
+ DB 68,15,40,45,76,99,0,0 ; movaps 0x634c(%rip),%xmm13 # 7f20 <_sk_clut_4D_sse41+0x15bd>
DB 65,15,88,229 ; addps %xmm13,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 68,15,40,53,77,72,0,0 ; movaps 0x484d(%rip),%xmm14 # 6430 <_sk_callback_sse41+0x4b5>
+ DB 68,15,40,53,77,99,0,0 ; movaps 0x634d(%rip),%xmm14 # 7f30 <_sk_clut_4D_sse41+0x15cd>
DB 65,15,88,230 ; addps %xmm14,%xmm4
- DB 68,15,40,61,81,72,0,0 ; movaps 0x4851(%rip),%xmm15 # 6440 <_sk_callback_sse41+0x4c5>
+ DB 68,15,40,61,81,99,0,0 ; movaps 0x6351(%rip),%xmm15 # 7f40 <_sk_clut_4D_sse41+0x15dd>
DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4
@@ -16525,22 +19618,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,194,71,0,0 ; movaps 0x47c2(%rip),%xmm11 # 6450 <_sk_callback_sse41+0x4d5>
+ DB 68,15,40,29,194,98,0,0 ; movaps 0x62c2(%rip),%xmm11 # 7f50 <_sk_clut_4D_sse41+0x15ed>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,194,71,0,0 ; movaps 0x47c2(%rip),%xmm12 # 6460 <_sk_callback_sse41+0x4e5>
+ DB 68,15,40,37,194,98,0,0 ; movaps 0x62c2(%rip),%xmm12 # 7f60 <_sk_clut_4D_sse41+0x15fd>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,194,71,0,0 ; movaps 0x47c2(%rip),%xmm10 # 6470 <_sk_callback_sse41+0x4f5>
+ DB 68,15,40,21,194,98,0,0 ; movaps 0x62c2(%rip),%xmm10 # 7f70 <_sk_clut_4D_sse41+0x160d>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,194,71,0,0 ; movaps 0x47c2(%rip),%xmm13 # 6480 <_sk_callback_sse41+0x505>
+ DB 68,15,40,45,194,98,0,0 ; movaps 0x62c2(%rip),%xmm13 # 7f80 <_sk_clut_4D_sse41+0x161d>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,198,71,0,0 ; movaps 0x47c6(%rip),%xmm14 # 6490 <_sk_callback_sse41+0x515>
+ DB 68,15,40,53,198,98,0,0 ; movaps 0x62c6(%rip),%xmm14 # 7f90 <_sk_clut_4D_sse41+0x162d>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,194,71,0,0 ; movaps 0x47c2(%rip),%xmm15 # 64a0 <_sk_callback_sse41+0x525>
+ DB 68,15,40,61,194,98,0,0 ; movaps 0x62c2(%rip),%xmm15 # 7fa0 <_sk_clut_4D_sse41+0x163d>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -16592,7 +19685,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,93,226 ; minps %xmm2,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,12,71,0,0 ; movaps 0x470c(%rip),%xmm14 # 64b0 <_sk_callback_sse41+0x535>
+ DB 68,15,40,53,12,98,0,0 ; movaps 0x620c(%rip),%xmm14 # 7fb0 <_sk_clut_4D_sse41+0x164d>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -16601,27 +19694,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,243,70,0,0 ; andps 0x46f3(%rip),%xmm15 # 64c0 <_sk_callback_sse41+0x545>
+ DB 68,15,84,61,243,97,0,0 ; andps 0x61f3(%rip),%xmm15 # 7fc0 <_sk_clut_4D_sse41+0x165d>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,230,70,0,0 ; movaps 0x46e6(%rip),%xmm13 # 64d0 <_sk_callback_sse41+0x555>
+ DB 68,15,40,45,230,97,0,0 ; movaps 0x61e6(%rip),%xmm13 # 7fd0 <_sk_clut_4D_sse41+0x166d>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,226,70,0,0 ; addps 0x46e2(%rip),%xmm8 # 64e0 <_sk_callback_sse41+0x565>
+ DB 68,15,88,5,226,97,0,0 ; addps 0x61e2(%rip),%xmm8 # 7fe0 <_sk_clut_4D_sse41+0x167d>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,218,70,0,0 ; mulps 0x46da(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0x575>
+ DB 68,15,89,5,218,97,0,0 ; mulps 0x61da(%rip),%xmm8 # 7ff0 <_sk_clut_4D_sse41+0x168d>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,206,70,0,0 ; movaps 0x46ce(%rip),%xmm0 # 6500 <_sk_callback_sse41+0x585>
+ DB 15,40,5,206,97,0,0 ; movaps 0x61ce(%rip),%xmm0 # 8000 <_sk_clut_4D_sse41+0x169d>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -16642,7 +19735,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,144,70,0,0 ; movaps 0x4690(%rip),%xmm9 # 6510 <_sk_callback_sse41+0x595>
+ DB 68,15,40,13,144,97,0,0 ; movaps 0x6190(%rip),%xmm9 # 8010 <_sk_clut_4D_sse41+0x16ad>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -16655,19 +19748,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,108,70,0,0 ; movaps 0x466c(%rip),%xmm14 # 6520 <_sk_callback_sse41+0x5a5>
+ DB 68,15,40,53,108,97,0,0 ; movaps 0x616c(%rip),%xmm14 # 8020 <_sk_clut_4D_sse41+0x16bd>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,101,70,0,0 ; movaps 0x4665(%rip),%xmm11 # 6530 <_sk_callback_sse41+0x5b5>
+ DB 68,15,40,29,101,97,0,0 ; movaps 0x6165(%rip),%xmm11 # 8030 <_sk_clut_4D_sse41+0x16cd>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,94,70,0,0 ; movaps 0x465e(%rip),%xmm7 # 6540 <_sk_callback_sse41+0x5c5>
+ DB 15,40,61,94,97,0,0 ; movaps 0x615e(%rip),%xmm7 # 8040 <_sk_clut_4D_sse41+0x16dd>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,95,70,0,0 ; movaps 0x465f(%rip),%xmm3 # 6550 <_sk_callback_sse41+0x5d5>
+ DB 15,40,29,95,97,0,0 ; movaps 0x615f(%rip),%xmm3 # 8050 <_sk_clut_4D_sse41+0x16ed>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -16677,7 +19770,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,62,70,0,0 ; movaps 0x463e(%rip),%xmm12 # 6560 <_sk_callback_sse41+0x5e5>
+ DB 68,15,40,37,62,97,0,0 ; movaps 0x613e(%rip),%xmm12 # 8060 <_sk_clut_4D_sse41+0x16fd>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -16711,7 +19804,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,183,69,0,0 ; addps 0x45b7(%rip),%xmm10 # 6570 <_sk_callback_sse41+0x5f5>
+ DB 68,15,88,21,183,96,0,0 ; addps 0x60b7(%rip),%xmm10 # 8070 <_sk_clut_4D_sse41+0x170d>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -16765,9 +19858,9 @@ _sk_scale_u8_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,52 ; jne 20a4 <_sk_scale_u8_sse41+0x4c>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,0,69,0,0 ; pand 0x4500(%rip),%xmm8 # 6580 <_sk_callback_sse41+0x605>
+ DB 102,68,15,219,5,0,96,0,0 ; pand 0x6000(%rip),%xmm8 # 8080 <_sk_clut_4D_sse41+0x171d>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,4,69,0,0 ; mulps 0x4504(%rip),%xmm8 # 6590 <_sk_callback_sse41+0x615>
+ DB 68,15,89,5,4,96,0,0 ; mulps 0x6004(%rip),%xmm8 # 8090 <_sk_clut_4D_sse41+0x172d>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -16827,9 +19920,9 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,72 ; jne 2193 <_sk_lerp_u8_sse41+0x60>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,69,68,0,0 ; pand 0x4445(%rip),%xmm8 # 65a0 <_sk_callback_sse41+0x625>
+ DB 102,68,15,219,5,69,95,0,0 ; pand 0x5f45(%rip),%xmm8 # 80a0 <_sk_clut_4D_sse41+0x173d>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,73,68,0,0 ; mulps 0x4449(%rip),%xmm8 # 65b0 <_sk_callback_sse41+0x635>
+ DB 68,15,89,5,73,95,0,0 ; mulps 0x5f49(%rip),%xmm8 # 80b0 <_sk_clut_4D_sse41+0x174d>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -16877,17 +19970,17 @@ _sk_lerp_565_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,152,0,0,0 ; jne 22a4 <_sk_lerp_565_sse41+0xb7>
DB 102,71,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm10
- DB 102,68,15,111,5,164,67,0,0 ; movdqa 0x43a4(%rip),%xmm8 # 65c0 <_sk_callback_sse41+0x645>
+ DB 102,68,15,111,5,164,94,0,0 ; movdqa 0x5ea4(%rip),%xmm8 # 80c0 <_sk_clut_4D_sse41+0x175d>
DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,163,67,0,0 ; mulps 0x43a3(%rip),%xmm8 # 65d0 <_sk_callback_sse41+0x655>
- DB 102,68,15,111,13,170,67,0,0 ; movdqa 0x43aa(%rip),%xmm9 # 65e0 <_sk_callback_sse41+0x665>
+ DB 68,15,89,5,163,94,0,0 ; mulps 0x5ea3(%rip),%xmm8 # 80d0 <_sk_clut_4D_sse41+0x176d>
+ DB 102,68,15,111,13,170,94,0,0 ; movdqa 0x5eaa(%rip),%xmm9 # 80e0 <_sk_clut_4D_sse41+0x177d>
DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,169,67,0,0 ; mulps 0x43a9(%rip),%xmm9 # 65f0 <_sk_callback_sse41+0x675>
- DB 102,68,15,219,21,176,67,0,0 ; pand 0x43b0(%rip),%xmm10 # 6600 <_sk_callback_sse41+0x685>
+ DB 68,15,89,13,169,94,0,0 ; mulps 0x5ea9(%rip),%xmm9 # 80f0 <_sk_clut_4D_sse41+0x178d>
+ DB 102,68,15,219,21,176,94,0,0 ; pand 0x5eb0(%rip),%xmm10 # 8100 <_sk_clut_4D_sse41+0x179d>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,180,67,0,0 ; mulps 0x43b4(%rip),%xmm10 # 6610 <_sk_callback_sse41+0x695>
+ DB 68,15,89,21,180,94,0,0 ; mulps 0x5eb4(%rip),%xmm10 # 8110 <_sk_clut_4D_sse41+0x17ad>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -16939,7 +20032,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,1,67,0,0 ; movdqa 0x4301(%rip),%xmm0 # 6620 <_sk_callback_sse41+0x6a5>
+ DB 102,15,111,5,1,94,0,0 ; movdqa 0x5e01(%rip),%xmm0 # 8120 <_sk_clut_4D_sse41+0x17bd>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -16954,7 +20047,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0
DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,188,66,0,0 ; pshufb 0x42bc(%rip),%xmm1 # 6630 <_sk_callback_sse41+0x6b5>
+ DB 102,15,56,0,13,188,93,0,0 ; pshufb 0x5dbc(%rip),%xmm1 # 8130 <_sk_clut_4D_sse41+0x17cd>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,211 ; movzbl %bl,%r10d
@@ -16969,7 +20062,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,72,24 ; mov 0x18(%rax),%r9
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,120,66,0,0 ; pshufb 0x4278(%rip),%xmm2 # 6640 <_sk_callback_sse41+0x6c5>
+ DB 102,15,56,0,21,120,93,0,0 ; pshufb 0x5d78(%rip),%xmm2 # 8140 <_sk_clut_4D_sse41+0x17dd>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,208 ; movzbl %al,%r10d
@@ -16984,7 +20077,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,53,66,0,0 ; mulps 0x4235(%rip),%xmm3 # 6650 <_sk_callback_sse41+0x6d5>
+ DB 15,89,29,53,93,0,0 ; mulps 0x5d35(%rip),%xmm3 # 8150 <_sk_clut_4D_sse41+0x17ed>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -17025,7 +20118,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,163,65,0,0 ; movdqa 0x41a3(%rip),%xmm8 # 6660 <_sk_callback_sse41+0x6e5>
+ DB 102,68,15,111,5,163,92,0,0 ; movdqa 0x5ca3(%rip),%xmm8 # 8160 <_sk_clut_4D_sse41+0x17fd>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -17043,7 +20136,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,82,65,0,0 ; pshufb 0x4152(%rip),%xmm1 # 6670 <_sk_callback_sse41+0x6f5>
+ DB 102,15,56,0,13,82,92,0,0 ; pshufb 0x5c52(%rip),%xmm1 # 8170 <_sk_clut_4D_sse41+0x180d>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -17079,7 +20172,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,160,64,0,0 ; mulps 0x40a0(%rip),%xmm3 # 6680 <_sk_callback_sse41+0x705>
+ DB 15,89,29,160,91,0,0 ; mulps 0x5ba0(%rip),%xmm3 # 8180 <_sk_clut_4D_sse41+0x181d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -17119,7 +20212,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,21,64,0,0 ; movdqa 0x4015(%rip),%xmm8 # 6690 <_sk_callback_sse41+0x715>
+ DB 102,68,15,111,5,21,91,0,0 ; movdqa 0x5b15(%rip),%xmm8 # 8190 <_sk_clut_4D_sse41+0x182d>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -17137,7 +20230,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,196,63,0,0 ; pshufb 0x3fc4(%rip),%xmm1 # 66a0 <_sk_callback_sse41+0x725>
+ DB 102,15,56,0,13,196,90,0,0 ; pshufb 0x5ac4(%rip),%xmm1 # 81a0 <_sk_clut_4D_sse41+0x183d>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -17168,7 +20261,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,47,63,0,0 ; movaps 0x3f2f(%rip),%xmm3 # 66b0 <_sk_callback_sse41+0x735>
+ DB 15,40,29,47,90,0,0 ; movaps 0x5a2f(%rip),%xmm3 # 81b0 <_sk_clut_4D_sse41+0x184d>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -17200,7 +20293,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,199,62,0,0 ; movaps 0x3ec7(%rip),%xmm8 # 66c0 <_sk_callback_sse41+0x745>
+ DB 68,15,40,5,199,89,0,0 ; movaps 0x59c7(%rip),%xmm8 # 81c0 <_sk_clut_4D_sse41+0x185d>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
@@ -17219,7 +20312,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,120,62,0,0 ; movaps 0x3e78(%rip),%xmm9 # 66d0 <_sk_callback_sse41+0x755>
+ DB 68,15,40,13,120,89,0,0 ; movaps 0x5978(%rip),%xmm9 # 81d0 <_sk_clut_4D_sse41+0x186d>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -17313,7 +20406,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,240,60,0,0 ; movaps 0x3cf0(%rip),%xmm9 # 66e0 <_sk_callback_sse41+0x765>
+ DB 68,15,40,13,240,87,0,0 ; movaps 0x57f0(%rip),%xmm9 # 81e0 <_sk_clut_4D_sse41+0x187d>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -17490,31 +20583,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,56,58,0,0 ; mulps 0x3a38(%rip),%xmm8 # 66f0 <_sk_callback_sse41+0x775>
- DB 68,15,84,21,64,58,0,0 ; andps 0x3a40(%rip),%xmm10 # 6700 <_sk_callback_sse41+0x785>
- DB 68,15,86,21,72,58,0,0 ; orps 0x3a48(%rip),%xmm10 # 6710 <_sk_callback_sse41+0x795>
- DB 68,15,88,5,80,58,0,0 ; addps 0x3a50(%rip),%xmm8 # 6720 <_sk_callback_sse41+0x7a5>
- DB 68,15,40,37,88,58,0,0 ; movaps 0x3a58(%rip),%xmm12 # 6730 <_sk_callback_sse41+0x7b5>
+ DB 68,15,89,5,56,85,0,0 ; mulps 0x5538(%rip),%xmm8 # 81f0 <_sk_clut_4D_sse41+0x188d>
+ DB 68,15,84,21,64,85,0,0 ; andps 0x5540(%rip),%xmm10 # 8200 <_sk_clut_4D_sse41+0x189d>
+ DB 68,15,86,21,72,85,0,0 ; orps 0x5548(%rip),%xmm10 # 8210 <_sk_clut_4D_sse41+0x18ad>
+ DB 68,15,88,5,80,85,0,0 ; addps 0x5550(%rip),%xmm8 # 8220 <_sk_clut_4D_sse41+0x18bd>
+ DB 68,15,40,37,88,85,0,0 ; movaps 0x5558(%rip),%xmm12 # 8230 <_sk_clut_4D_sse41+0x18cd>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,88,58,0,0 ; addps 0x3a58(%rip),%xmm10 # 6740 <_sk_callback_sse41+0x7c5>
- DB 68,15,40,37,96,58,0,0 ; movaps 0x3a60(%rip),%xmm12 # 6750 <_sk_callback_sse41+0x7d5>
+ DB 68,15,88,21,88,85,0,0 ; addps 0x5558(%rip),%xmm10 # 8240 <_sk_clut_4D_sse41+0x18dd>
+ DB 68,15,40,37,96,85,0,0 ; movaps 0x5560(%rip),%xmm12 # 8250 <_sk_clut_4D_sse41+0x18ed>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,77,58,0,0 ; addps 0x3a4d(%rip),%xmm8 # 6760 <_sk_callback_sse41+0x7e5>
- DB 68,15,40,21,85,58,0,0 ; movaps 0x3a55(%rip),%xmm10 # 6770 <_sk_callback_sse41+0x7f5>
+ DB 68,15,88,5,77,85,0,0 ; addps 0x554d(%rip),%xmm8 # 8260 <_sk_clut_4D_sse41+0x18fd>
+ DB 68,15,40,21,85,85,0,0 ; movaps 0x5555(%rip),%xmm10 # 8270 <_sk_clut_4D_sse41+0x190d>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,85,58,0,0 ; movaps 0x3a55(%rip),%xmm10 # 6780 <_sk_callback_sse41+0x805>
+ DB 68,15,40,21,85,85,0,0 ; movaps 0x5555(%rip),%xmm10 # 8280 <_sk_clut_4D_sse41+0x191d>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,89,58,0,0 ; movaps 0x3a59(%rip),%xmm11 # 6790 <_sk_callback_sse41+0x815>
+ DB 68,15,40,29,89,85,0,0 ; movaps 0x5559(%rip),%xmm11 # 8290 <_sk_clut_4D_sse41+0x192d>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,89,58,0,0 ; mulps 0x3a59(%rip),%xmm11 # 67a0 <_sk_callback_sse41+0x825>
+ DB 68,15,89,29,89,85,0,0 ; mulps 0x5559(%rip),%xmm11 # 82a0 <_sk_clut_4D_sse41+0x193d>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -17522,7 +20615,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,64,58,0,0 ; minps 0x3a40(%rip),%xmm8 # 67b0 <_sk_callback_sse41+0x835>
+ DB 68,15,93,5,64,85,0,0 ; minps 0x5540(%rip),%xmm8 # 82b0 <_sk_clut_4D_sse41+0x194d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -17550,31 +20643,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,225,57,0,0 ; mulps 0x39e1(%rip),%xmm12 # 67c0 <_sk_callback_sse41+0x845>
- DB 68,15,84,29,233,57,0,0 ; andps 0x39e9(%rip),%xmm11 # 67d0 <_sk_callback_sse41+0x855>
- DB 68,15,86,29,241,57,0,0 ; orps 0x39f1(%rip),%xmm11 # 67e0 <_sk_callback_sse41+0x865>
- DB 68,15,88,37,249,57,0,0 ; addps 0x39f9(%rip),%xmm12 # 67f0 <_sk_callback_sse41+0x875>
- DB 15,40,13,2,58,0,0 ; movaps 0x3a02(%rip),%xmm1 # 6800 <_sk_callback_sse41+0x885>
+ DB 68,15,89,37,225,84,0,0 ; mulps 0x54e1(%rip),%xmm12 # 82c0 <_sk_clut_4D_sse41+0x195d>
+ DB 68,15,84,29,233,84,0,0 ; andps 0x54e9(%rip),%xmm11 # 82d0 <_sk_clut_4D_sse41+0x196d>
+ DB 68,15,86,29,241,84,0,0 ; orps 0x54f1(%rip),%xmm11 # 82e0 <_sk_clut_4D_sse41+0x197d>
+ DB 68,15,88,37,249,84,0,0 ; addps 0x54f9(%rip),%xmm12 # 82f0 <_sk_clut_4D_sse41+0x198d>
+ DB 15,40,13,2,85,0,0 ; movaps 0x5502(%rip),%xmm1 # 8300 <_sk_clut_4D_sse41+0x199d>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,2,58,0,0 ; addps 0x3a02(%rip),%xmm11 # 6810 <_sk_callback_sse41+0x895>
- DB 15,40,13,11,58,0,0 ; movaps 0x3a0b(%rip),%xmm1 # 6820 <_sk_callback_sse41+0x8a5>
+ DB 68,15,88,29,2,85,0,0 ; addps 0x5502(%rip),%xmm11 # 8310 <_sk_clut_4D_sse41+0x19ad>
+ DB 15,40,13,11,85,0,0 ; movaps 0x550b(%rip),%xmm1 # 8320 <_sk_clut_4D_sse41+0x19bd>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,248,57,0,0 ; addps 0x39f8(%rip),%xmm12 # 6830 <_sk_callback_sse41+0x8b5>
- DB 15,40,13,1,58,0,0 ; movaps 0x3a01(%rip),%xmm1 # 6840 <_sk_callback_sse41+0x8c5>
+ DB 68,15,88,37,248,84,0,0 ; addps 0x54f8(%rip),%xmm12 # 8330 <_sk_clut_4D_sse41+0x19cd>
+ DB 15,40,13,1,85,0,0 ; movaps 0x5501(%rip),%xmm1 # 8340 <_sk_clut_4D_sse41+0x19dd>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,1,58,0,0 ; movaps 0x3a01(%rip),%xmm10 # 6850 <_sk_callback_sse41+0x8d5>
+ DB 68,15,40,21,1,85,0,0 ; movaps 0x5501(%rip),%xmm10 # 8350 <_sk_clut_4D_sse41+0x19ed>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,6,58,0,0 ; movaps 0x3a06(%rip),%xmm1 # 6860 <_sk_callback_sse41+0x8e5>
+ DB 15,40,13,6,85,0,0 ; movaps 0x5506(%rip),%xmm1 # 8360 <_sk_clut_4D_sse41+0x19fd>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,7,58,0,0 ; mulps 0x3a07(%rip),%xmm1 # 6870 <_sk_callback_sse41+0x8f5>
+ DB 15,89,13,7,85,0,0 ; mulps 0x5507(%rip),%xmm1 # 8370 <_sk_clut_4D_sse41+0x1a0d>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -17582,7 +20675,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,242,57,0,0 ; minps 0x39f2(%rip),%xmm1 # 6880 <_sk_callback_sse41+0x905>
+ DB 15,93,13,242,84,0,0 ; minps 0x54f2(%rip),%xmm1 # 8380 <_sk_clut_4D_sse41+0x1a1d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -17610,31 +20703,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,147,57,0,0 ; mulps 0x3993(%rip),%xmm12 # 6890 <_sk_callback_sse41+0x915>
- DB 68,15,84,29,155,57,0,0 ; andps 0x399b(%rip),%xmm11 # 68a0 <_sk_callback_sse41+0x925>
- DB 68,15,86,29,163,57,0,0 ; orps 0x39a3(%rip),%xmm11 # 68b0 <_sk_callback_sse41+0x935>
- DB 68,15,88,37,171,57,0,0 ; addps 0x39ab(%rip),%xmm12 # 68c0 <_sk_callback_sse41+0x945>
- DB 15,40,21,180,57,0,0 ; movaps 0x39b4(%rip),%xmm2 # 68d0 <_sk_callback_sse41+0x955>
+ DB 68,15,89,37,147,84,0,0 ; mulps 0x5493(%rip),%xmm12 # 8390 <_sk_clut_4D_sse41+0x1a2d>
+ DB 68,15,84,29,155,84,0,0 ; andps 0x549b(%rip),%xmm11 # 83a0 <_sk_clut_4D_sse41+0x1a3d>
+ DB 68,15,86,29,163,84,0,0 ; orps 0x54a3(%rip),%xmm11 # 83b0 <_sk_clut_4D_sse41+0x1a4d>
+ DB 68,15,88,37,171,84,0,0 ; addps 0x54ab(%rip),%xmm12 # 83c0 <_sk_clut_4D_sse41+0x1a5d>
+ DB 15,40,21,180,84,0,0 ; movaps 0x54b4(%rip),%xmm2 # 83d0 <_sk_clut_4D_sse41+0x1a6d>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,180,57,0,0 ; addps 0x39b4(%rip),%xmm11 # 68e0 <_sk_callback_sse41+0x965>
- DB 15,40,21,189,57,0,0 ; movaps 0x39bd(%rip),%xmm2 # 68f0 <_sk_callback_sse41+0x975>
+ DB 68,15,88,29,180,84,0,0 ; addps 0x54b4(%rip),%xmm11 # 83e0 <_sk_clut_4D_sse41+0x1a7d>
+ DB 15,40,21,189,84,0,0 ; movaps 0x54bd(%rip),%xmm2 # 83f0 <_sk_clut_4D_sse41+0x1a8d>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,170,57,0,0 ; addps 0x39aa(%rip),%xmm12 # 6900 <_sk_callback_sse41+0x985>
- DB 15,40,21,179,57,0,0 ; movaps 0x39b3(%rip),%xmm2 # 6910 <_sk_callback_sse41+0x995>
+ DB 68,15,88,37,170,84,0,0 ; addps 0x54aa(%rip),%xmm12 # 8400 <_sk_clut_4D_sse41+0x1a9d>
+ DB 15,40,21,179,84,0,0 ; movaps 0x54b3(%rip),%xmm2 # 8410 <_sk_clut_4D_sse41+0x1aad>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,179,57,0,0 ; movaps 0x39b3(%rip),%xmm10 # 6920 <_sk_callback_sse41+0x9a5>
+ DB 68,15,40,21,179,84,0,0 ; movaps 0x54b3(%rip),%xmm10 # 8420 <_sk_clut_4D_sse41+0x1abd>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,184,57,0,0 ; movaps 0x39b8(%rip),%xmm2 # 6930 <_sk_callback_sse41+0x9b5>
+ DB 15,40,21,184,84,0,0 ; movaps 0x54b8(%rip),%xmm2 # 8430 <_sk_clut_4D_sse41+0x1acd>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,185,57,0,0 ; mulps 0x39b9(%rip),%xmm2 # 6940 <_sk_callback_sse41+0x9c5>
+ DB 15,89,21,185,84,0,0 ; mulps 0x54b9(%rip),%xmm2 # 8440 <_sk_clut_4D_sse41+0x1add>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -17642,7 +20735,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,164,57,0,0 ; minps 0x39a4(%rip),%xmm2 # 6950 <_sk_callback_sse41+0x9d5>
+ DB 15,93,21,164,84,0,0 ; minps 0x54a4(%rip),%xmm2 # 8450 <_sk_clut_4D_sse41+0x1aed>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -17670,31 +20763,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,69,57,0,0 ; mulps 0x3945(%rip),%xmm12 # 6960 <_sk_callback_sse41+0x9e5>
- DB 68,15,84,29,77,57,0,0 ; andps 0x394d(%rip),%xmm11 # 6970 <_sk_callback_sse41+0x9f5>
- DB 68,15,86,29,85,57,0,0 ; orps 0x3955(%rip),%xmm11 # 6980 <_sk_callback_sse41+0xa05>
- DB 68,15,88,37,93,57,0,0 ; addps 0x395d(%rip),%xmm12 # 6990 <_sk_callback_sse41+0xa15>
- DB 15,40,29,102,57,0,0 ; movaps 0x3966(%rip),%xmm3 # 69a0 <_sk_callback_sse41+0xa25>
+ DB 68,15,89,37,69,84,0,0 ; mulps 0x5445(%rip),%xmm12 # 8460 <_sk_clut_4D_sse41+0x1afd>
+ DB 68,15,84,29,77,84,0,0 ; andps 0x544d(%rip),%xmm11 # 8470 <_sk_clut_4D_sse41+0x1b0d>
+ DB 68,15,86,29,85,84,0,0 ; orps 0x5455(%rip),%xmm11 # 8480 <_sk_clut_4D_sse41+0x1b1d>
+ DB 68,15,88,37,93,84,0,0 ; addps 0x545d(%rip),%xmm12 # 8490 <_sk_clut_4D_sse41+0x1b2d>
+ DB 15,40,29,102,84,0,0 ; movaps 0x5466(%rip),%xmm3 # 84a0 <_sk_clut_4D_sse41+0x1b3d>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,102,57,0,0 ; addps 0x3966(%rip),%xmm11 # 69b0 <_sk_callback_sse41+0xa35>
- DB 15,40,29,111,57,0,0 ; movaps 0x396f(%rip),%xmm3 # 69c0 <_sk_callback_sse41+0xa45>
+ DB 68,15,88,29,102,84,0,0 ; addps 0x5466(%rip),%xmm11 # 84b0 <_sk_clut_4D_sse41+0x1b4d>
+ DB 15,40,29,111,84,0,0 ; movaps 0x546f(%rip),%xmm3 # 84c0 <_sk_clut_4D_sse41+0x1b5d>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,92,57,0,0 ; addps 0x395c(%rip),%xmm12 # 69d0 <_sk_callback_sse41+0xa55>
- DB 15,40,29,101,57,0,0 ; movaps 0x3965(%rip),%xmm3 # 69e0 <_sk_callback_sse41+0xa65>
+ DB 68,15,88,37,92,84,0,0 ; addps 0x545c(%rip),%xmm12 # 84d0 <_sk_clut_4D_sse41+0x1b6d>
+ DB 15,40,29,101,84,0,0 ; movaps 0x5465(%rip),%xmm3 # 84e0 <_sk_clut_4D_sse41+0x1b7d>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,101,57,0,0 ; movaps 0x3965(%rip),%xmm10 # 69f0 <_sk_callback_sse41+0xa75>
+ DB 68,15,40,21,101,84,0,0 ; movaps 0x5465(%rip),%xmm10 # 84f0 <_sk_clut_4D_sse41+0x1b8d>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,106,57,0,0 ; movaps 0x396a(%rip),%xmm3 # 6a00 <_sk_callback_sse41+0xa85>
+ DB 15,40,29,106,84,0,0 ; movaps 0x546a(%rip),%xmm3 # 8500 <_sk_clut_4D_sse41+0x1b9d>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,107,57,0,0 ; mulps 0x396b(%rip),%xmm3 # 6a10 <_sk_callback_sse41+0xa95>
+ DB 15,89,29,107,84,0,0 ; mulps 0x546b(%rip),%xmm3 # 8510 <_sk_clut_4D_sse41+0x1bad>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -17702,7 +20795,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,86,57,0,0 ; minps 0x3956(%rip),%xmm3 # 6a20 <_sk_callback_sse41+0xaa5>
+ DB 15,93,29,86,84,0,0 ; minps 0x5456(%rip),%xmm3 # 8520 <_sk_clut_4D_sse41+0x1bbd>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -17718,20 +20811,20 @@ _sk_gamma_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,50,57,0,0 ; mulps 0x3932(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xab5>
- DB 68,15,40,53,58,57,0,0 ; movaps 0x393a(%rip),%xmm14 # 6a40 <_sk_callback_sse41+0xac5>
+ DB 15,89,5,50,84,0,0 ; mulps 0x5432(%rip),%xmm0 # 8530 <_sk_clut_4D_sse41+0x1bcd>
+ DB 68,15,40,53,58,84,0,0 ; movaps 0x543a(%rip),%xmm14 # 8540 <_sk_clut_4D_sse41+0x1bdd>
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,37,62,57,0,0 ; movaps 0x393e(%rip),%xmm12 # 6a50 <_sk_callback_sse41+0xad5>
+ DB 68,15,40,37,62,84,0,0 ; movaps 0x543e(%rip),%xmm12 # 8550 <_sk_clut_4D_sse41+0x1bed>
DB 65,15,86,212 ; orps %xmm12,%xmm2
- DB 68,15,40,21,66,57,0,0 ; movaps 0x3942(%rip),%xmm10 # 6a60 <_sk_callback_sse41+0xae5>
+ DB 68,15,40,21,66,84,0,0 ; movaps 0x5442(%rip),%xmm10 # 8560 <_sk_clut_4D_sse41+0x1bfd>
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,29,70,57,0,0 ; movaps 0x3946(%rip),%xmm11 # 6a70 <_sk_callback_sse41+0xaf5>
+ DB 68,15,40,29,70,84,0,0 ; movaps 0x5446(%rip),%xmm11 # 8570 <_sk_clut_4D_sse41+0x1c0d>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,13,68,57,0,0 ; movaps 0x3944(%rip),%xmm9 # 6a80 <_sk_callback_sse41+0xb05>
+ DB 68,15,40,13,68,84,0,0 ; movaps 0x5444(%rip),%xmm9 # 8580 <_sk_clut_4D_sse41+0x1c1d>
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 68,15,40,45,72,57,0,0 ; movaps 0x3948(%rip),%xmm13 # 6a90 <_sk_callback_sse41+0xb15>
+ DB 68,15,40,45,72,84,0,0 ; movaps 0x5448(%rip),%xmm13 # 8590 <_sk_clut_4D_sse41+0x1c2d>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -17742,21 +20835,21 @@ _sk_gamma_sse41 LABEL PROC
DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,43,57,0,0 ; movaps 0x392b(%rip),%xmm6 # 6aa0 <_sk_callback_sse41+0xb25>
+ DB 15,40,53,43,84,0,0 ; movaps 0x542b(%rip),%xmm6 # 85a0 <_sk_clut_4D_sse41+0x1c3d>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,65,57,0,0 ; movaps 0x3941(%rip),%xmm7 # 6ac0 <_sk_callback_sse41+0xb45>
+ DB 15,40,61,65,84,0,0 ; movaps 0x5441(%rip),%xmm7 # 85c0 <_sk_clut_4D_sse41+0x1c5d>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,33,57,0,0 ; movaps 0x3921(%rip),%xmm4 # 6ab0 <_sk_callback_sse41+0xb35>
+ DB 15,40,37,33,84,0,0 ; movaps 0x5421(%rip),%xmm4 # 85b0 <_sk_clut_4D_sse41+0x1c4d>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,51,57,0,0 ; movaps 0x3933(%rip),%xmm15 # 6ad0 <_sk_callback_sse41+0xb55>
+ DB 68,15,40,61,51,84,0,0 ; movaps 0x5433(%rip),%xmm15 # 85d0 <_sk_clut_4D_sse41+0x1c6d>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,127,56,0,0 ; mulps 0x387f(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xab5>
+ DB 15,89,5,127,83,0,0 ; mulps 0x537f(%rip),%xmm0 # 8530 <_sk_clut_4D_sse41+0x1bcd>
DB 65,15,84,206 ; andps %xmm14,%xmm1
DB 65,15,86,204 ; orps %xmm12,%xmm1
DB 65,15,88,194 ; addps %xmm10,%xmm0
@@ -17782,8 +20875,8 @@ _sk_gamma_sse41 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,32,56,0,0 ; mulps 0x3820(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xab5>
- DB 15,84,29,41,56,0,0 ; andps 0x3829(%rip),%xmm3 # 6a40 <_sk_callback_sse41+0xac5>
+ DB 15,89,5,32,83,0,0 ; mulps 0x5320(%rip),%xmm0 # 8530 <_sk_clut_4D_sse41+0x1bcd>
+ DB 15,84,29,41,83,0,0 ; andps 0x5329(%rip),%xmm3 # 8540 <_sk_clut_4D_sse41+0x1bdd>
DB 65,15,86,220 ; orps %xmm12,%xmm3
DB 65,15,88,194 ; addps %xmm10,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
@@ -17801,7 +20894,7 @@ _sk_gamma_sse41 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,129,56,0,0 ; movaps 0x3881(%rip),%xmm0 # 6ae0 <_sk_callback_sse41+0xb65>
+ DB 15,40,5,129,83,0,0 ; movaps 0x5381(%rip),%xmm0 # 85e0 <_sk_clut_4D_sse41+0x1c7d>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -17820,29 +20913,29 @@ _sk_gamma_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,78,56,0,0 ; mulps 0x384e(%rip),%xmm8 # 6af0 <_sk_callback_sse41+0xb75>
- DB 68,15,40,13,86,56,0,0 ; movaps 0x3856(%rip),%xmm9 # 6b00 <_sk_callback_sse41+0xb85>
+ DB 68,15,89,5,78,83,0,0 ; mulps 0x534e(%rip),%xmm8 # 85f0 <_sk_clut_4D_sse41+0x1c8d>
+ DB 68,15,40,13,86,83,0,0 ; movaps 0x5356(%rip),%xmm9 # 8600 <_sk_clut_4D_sse41+0x1c9d>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,91,56,0,0 ; movaps 0x385b(%rip),%xmm0 # 6b10 <_sk_callback_sse41+0xb95>
+ DB 15,40,5,91,83,0,0 ; movaps 0x535b(%rip),%xmm0 # 8610 <_sk_clut_4D_sse41+0x1cad>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,89,56,0,0 ; addps 0x3859(%rip),%xmm8 # 6b20 <_sk_callback_sse41+0xba5>
- DB 68,15,89,5,97,56,0,0 ; mulps 0x3861(%rip),%xmm8 # 6b30 <_sk_callback_sse41+0xbb5>
- DB 15,89,13,106,56,0,0 ; mulps 0x386a(%rip),%xmm1 # 6b40 <_sk_callback_sse41+0xbc5>
+ DB 68,15,88,5,89,83,0,0 ; addps 0x5359(%rip),%xmm8 # 8620 <_sk_clut_4D_sse41+0x1cbd>
+ DB 68,15,89,5,97,83,0,0 ; mulps 0x5361(%rip),%xmm8 # 8630 <_sk_clut_4D_sse41+0x1ccd>
+ DB 15,89,13,106,83,0,0 ; mulps 0x536a(%rip),%xmm1 # 8640 <_sk_clut_4D_sse41+0x1cdd>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,111,56,0,0 ; mulps 0x386f(%rip),%xmm2 # 6b50 <_sk_callback_sse41+0xbd5>
+ DB 15,89,21,111,83,0,0 ; mulps 0x536f(%rip),%xmm2 # 8650 <_sk_clut_4D_sse41+0x1ced>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,99,56,0,0 ; movaps 0x3863(%rip),%xmm9 # 6b60 <_sk_callback_sse41+0xbe5>
+ DB 68,15,40,13,99,83,0,0 ; movaps 0x5363(%rip),%xmm9 # 8660 <_sk_clut_4D_sse41+0x1cfd>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,99,56,0,0 ; movaps 0x3863(%rip),%xmm2 # 6b70 <_sk_callback_sse41+0xbf5>
+ DB 15,40,21,99,83,0,0 ; movaps 0x5363(%rip),%xmm2 # 8670 <_sk_clut_4D_sse41+0x1d0d>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,104,56,0,0 ; movaps 0x3868(%rip),%xmm12 # 6b80 <_sk_callback_sse41+0xc05>
+ DB 68,15,40,37,104,83,0,0 ; movaps 0x5368(%rip),%xmm12 # 8680 <_sk_clut_4D_sse41+0x1d1d>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -17861,8 +20954,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,33,56,0,0 ; mulps 0x3821(%rip),%xmm1 # 6b90 <_sk_callback_sse41+0xc15>
- DB 15,89,21,42,56,0,0 ; mulps 0x382a(%rip),%xmm2 # 6ba0 <_sk_callback_sse41+0xc25>
+ DB 15,89,13,33,83,0,0 ; mulps 0x5321(%rip),%xmm1 # 8690 <_sk_clut_4D_sse41+0x1d2d>
+ DB 15,89,21,42,83,0,0 ; mulps 0x532a(%rip),%xmm2 # 86a0 <_sk_clut_4D_sse41+0x1d3d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -17879,9 +20972,9 @@ _sk_load_a8_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,39 ; jne 33c0 <_sk_load_a8_sse41+0x3f>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,8,56,0,0 ; pand 0x3808(%rip),%xmm0 # 6bb0 <_sk_callback_sse41+0xc35>
+ DB 102,15,219,5,8,83,0,0 ; pand 0x5308(%rip),%xmm0 # 86b0 <_sk_clut_4D_sse41+0x1d4d>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,14,56,0,0 ; mulps 0x380e(%rip),%xmm3 # 6bc0 <_sk_callback_sse41+0xc45>
+ DB 15,89,29,14,83,0,0 ; mulps 0x530e(%rip),%xmm3 # 86c0 <_sk_clut_4D_sse41+0x1d5d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -17919,9 +21012,9 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,39 ; jne 344c <_sk_load_a8_dst_sse41+0x3f>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,156,55,0,0 ; pand 0x379c(%rip),%xmm4 # 6bd0 <_sk_callback_sse41+0xc55>
+ DB 102,15,219,37,156,82,0,0 ; pand 0x529c(%rip),%xmm4 # 86d0 <_sk_clut_4D_sse41+0x1d6d>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,162,55,0,0 ; mulps 0x37a2(%rip),%xmm7 # 6be0 <_sk_callback_sse41+0xc65>
+ DB 15,89,61,162,82,0,0 ; mulps 0x52a2(%rip),%xmm7 # 86e0 <_sk_clut_4D_sse41+0x1d7d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
@@ -17973,7 +21066,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,231,54,0,0 ; mulps 0x36e7(%rip),%xmm3 # 6bf0 <_sk_callback_sse41+0xc75>
+ DB 15,89,29,231,81,0,0 ; mulps 0x51e7(%rip),%xmm3 # 86f0 <_sk_clut_4D_sse41+0x1d8d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -17990,7 +21083,7 @@ _sk_store_a8_sse41 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,200,54,0,0 ; movaps 0x36c8(%rip),%xmm8 # 6c00 <_sk_callback_sse41+0xc85>
+ DB 68,15,40,5,200,81,0,0 ; movaps 0x51c8(%rip),%xmm8 # 8700 <_sk_clut_4D_sse41+0x1d9d>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
@@ -18012,7 +21105,7 @@ _sk_store_a8_sse41 LABEL PROC
DB 65,128,250,3 ; cmp $0x3,%r10b
DB 117,217 ; jne 355a <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,68,25,2,8 ; pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- DB 102,68,15,56,0,5,124,54,0,0 ; pshufb 0x367c(%rip),%xmm8 # 6c10 <_sk_callback_sse41+0xc95>
+ DB 102,68,15,56,0,5,124,81,0,0 ; pshufb 0x517c(%rip),%xmm8 # 8710 <_sk_clut_4D_sse41+0x1dad>
DB 102,71,15,58,21,4,25,0 ; pextrw $0x0,%xmm8,(%r9,%r11,1)
DB 235,188 ; jmp 355a <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,4,25,0 ; pextrb $0x0,%xmm8,(%r9,%r11,1)
@@ -18029,11 +21122,11 @@ _sk_load_g8_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,42 ; jne 35ea <_sk_load_g8_sse41+0x42>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,81,54,0,0 ; pand 0x3651(%rip),%xmm0 # 6c20 <_sk_callback_sse41+0xca5>
+ DB 102,15,219,5,81,81,0,0 ; pand 0x5151(%rip),%xmm0 # 8720 <_sk_clut_4D_sse41+0x1dbd>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,87,54,0,0 ; mulps 0x3657(%rip),%xmm0 # 6c30 <_sk_callback_sse41+0xcb5>
+ DB 15,89,5,87,81,0,0 ; mulps 0x5157(%rip),%xmm0 # 8730 <_sk_clut_4D_sse41+0x1dcd>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,94,54,0,0 ; movaps 0x365e(%rip),%xmm3 # 6c40 <_sk_callback_sse41+0xcc5>
+ DB 15,40,29,94,81,0,0 ; movaps 0x515e(%rip),%xmm3 # 8740 <_sk_clut_4D_sse41+0x1ddd>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -18069,11 +21162,11 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,42 ; jne 3679 <_sk_load_g8_dst_sse41+0x42>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,242,53,0,0 ; pand 0x35f2(%rip),%xmm4 # 6c50 <_sk_callback_sse41+0xcd5>
+ DB 102,15,219,37,242,80,0,0 ; pand 0x50f2(%rip),%xmm4 # 8750 <_sk_clut_4D_sse41+0x1ded>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,248,53,0,0 ; mulps 0x35f8(%rip),%xmm4 # 6c60 <_sk_callback_sse41+0xce5>
+ DB 15,89,37,248,80,0,0 ; mulps 0x50f8(%rip),%xmm4 # 8760 <_sk_clut_4D_sse41+0x1dfd>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,255,53,0,0 ; movaps 0x35ff(%rip),%xmm7 # 6c70 <_sk_callback_sse41+0xcf5>
+ DB 15,40,61,255,80,0,0 ; movaps 0x50ff(%rip),%xmm7 # 8770 <_sk_clut_4D_sse41+0x1e0d>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
@@ -18123,9 +21216,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,74,53,0,0 ; mulps 0x354a(%rip),%xmm0 # 6c80 <_sk_callback_sse41+0xd05>
+ DB 15,89,5,74,80,0,0 ; mulps 0x504a(%rip),%xmm0 # 8780 <_sk_clut_4D_sse41+0x1e1d>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,81,53,0,0 ; movaps 0x3551(%rip),%xmm3 # 6c90 <_sk_callback_sse41+0xd15>
+ DB 15,40,29,81,80,0,0 ; movaps 0x5051(%rip),%xmm3 # 8790 <_sk_clut_4D_sse41+0x1e2d>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -18143,19 +21236,19 @@ _sk_load_565_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,80 ; jne 37b3 <_sk_load_565_sse41+0x6b>
DB 102,67,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm2
- DB 102,15,111,5,46,53,0,0 ; movdqa 0x352e(%rip),%xmm0 # 6ca0 <_sk_callback_sse41+0xd25>
+ DB 102,15,111,5,46,80,0,0 ; movdqa 0x502e(%rip),%xmm0 # 87a0 <_sk_clut_4D_sse41+0x1e3d>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,48,53,0,0 ; mulps 0x3530(%rip),%xmm0 # 6cb0 <_sk_callback_sse41+0xd35>
- DB 102,15,111,13,56,53,0,0 ; movdqa 0x3538(%rip),%xmm1 # 6cc0 <_sk_callback_sse41+0xd45>
+ DB 15,89,5,48,80,0,0 ; mulps 0x5030(%rip),%xmm0 # 87b0 <_sk_clut_4D_sse41+0x1e4d>
+ DB 102,15,111,13,56,80,0,0 ; movdqa 0x5038(%rip),%xmm1 # 87c0 <_sk_clut_4D_sse41+0x1e5d>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,58,53,0,0 ; mulps 0x353a(%rip),%xmm1 # 6cd0 <_sk_callback_sse41+0xd55>
- DB 102,15,219,21,66,53,0,0 ; pand 0x3542(%rip),%xmm2 # 6ce0 <_sk_callback_sse41+0xd65>
+ DB 15,89,13,58,80,0,0 ; mulps 0x503a(%rip),%xmm1 # 87d0 <_sk_clut_4D_sse41+0x1e6d>
+ DB 102,15,219,21,66,80,0,0 ; pand 0x5042(%rip),%xmm2 # 87e0 <_sk_clut_4D_sse41+0x1e7d>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,72,53,0,0 ; mulps 0x3548(%rip),%xmm2 # 6cf0 <_sk_callback_sse41+0xd75>
+ DB 15,89,21,72,80,0,0 ; mulps 0x5048(%rip),%xmm2 # 87f0 <_sk_clut_4D_sse41+0x1e8d>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,79,53,0,0 ; movaps 0x354f(%rip),%xmm3 # 6d00 <_sk_callback_sse41+0xd85>
+ DB 15,40,29,79,80,0,0 ; movaps 0x504f(%rip),%xmm3 # 8800 <_sk_clut_4D_sse41+0x1e9d>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
@@ -18189,19 +21282,19 @@ _sk_load_565_dst_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,80 ; jne 386e <_sk_load_565_dst_sse41+0x6b>
DB 102,67,15,56,51,52,89 ; pmovzxwd (%r9,%r11,2),%xmm6
- DB 102,15,111,37,227,52,0,0 ; movdqa 0x34e3(%rip),%xmm4 # 6d10 <_sk_callback_sse41+0xd95>
+ DB 102,15,111,37,227,79,0,0 ; movdqa 0x4fe3(%rip),%xmm4 # 8810 <_sk_clut_4D_sse41+0x1ead>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,229,52,0,0 ; mulps 0x34e5(%rip),%xmm4 # 6d20 <_sk_callback_sse41+0xda5>
- DB 102,15,111,45,237,52,0,0 ; movdqa 0x34ed(%rip),%xmm5 # 6d30 <_sk_callback_sse41+0xdb5>
+ DB 15,89,37,229,79,0,0 ; mulps 0x4fe5(%rip),%xmm4 # 8820 <_sk_clut_4D_sse41+0x1ebd>
+ DB 102,15,111,45,237,79,0,0 ; movdqa 0x4fed(%rip),%xmm5 # 8830 <_sk_clut_4D_sse41+0x1ecd>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,239,52,0,0 ; mulps 0x34ef(%rip),%xmm5 # 6d40 <_sk_callback_sse41+0xdc5>
- DB 102,15,219,53,247,52,0,0 ; pand 0x34f7(%rip),%xmm6 # 6d50 <_sk_callback_sse41+0xdd5>
+ DB 15,89,45,239,79,0,0 ; mulps 0x4fef(%rip),%xmm5 # 8840 <_sk_clut_4D_sse41+0x1edd>
+ DB 102,15,219,53,247,79,0,0 ; pand 0x4ff7(%rip),%xmm6 # 8850 <_sk_clut_4D_sse41+0x1eed>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,253,52,0,0 ; mulps 0x34fd(%rip),%xmm6 # 6d60 <_sk_callback_sse41+0xde5>
+ DB 15,89,53,253,79,0,0 ; mulps 0x4ffd(%rip),%xmm6 # 8860 <_sk_clut_4D_sse41+0x1efd>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,4,53,0,0 ; movaps 0x3504(%rip),%xmm7 # 6d70 <_sk_callback_sse41+0xdf5>
+ DB 15,40,61,4,80,0,0 ; movaps 0x5004(%rip),%xmm7 # 8870 <_sk_clut_4D_sse41+0x1f0d>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
@@ -18247,19 +21340,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,88,52,0,0 ; movdqa 0x3458(%rip),%xmm0 # 6d80 <_sk_callback_sse41+0xe05>
+ DB 102,15,111,5,88,79,0,0 ; movdqa 0x4f58(%rip),%xmm0 # 8880 <_sk_clut_4D_sse41+0x1f1d>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,90,52,0,0 ; mulps 0x345a(%rip),%xmm0 # 6d90 <_sk_callback_sse41+0xe15>
- DB 102,15,111,13,98,52,0,0 ; movdqa 0x3462(%rip),%xmm1 # 6da0 <_sk_callback_sse41+0xe25>
+ DB 15,89,5,90,79,0,0 ; mulps 0x4f5a(%rip),%xmm0 # 8890 <_sk_clut_4D_sse41+0x1f2d>
+ DB 102,15,111,13,98,79,0,0 ; movdqa 0x4f62(%rip),%xmm1 # 88a0 <_sk_clut_4D_sse41+0x1f3d>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,100,52,0,0 ; mulps 0x3464(%rip),%xmm1 # 6db0 <_sk_callback_sse41+0xe35>
- DB 102,15,219,21,108,52,0,0 ; pand 0x346c(%rip),%xmm2 # 6dc0 <_sk_callback_sse41+0xe45>
+ DB 15,89,13,100,79,0,0 ; mulps 0x4f64(%rip),%xmm1 # 88b0 <_sk_clut_4D_sse41+0x1f4d>
+ DB 102,15,219,21,108,79,0,0 ; pand 0x4f6c(%rip),%xmm2 # 88c0 <_sk_clut_4D_sse41+0x1f5d>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,114,52,0,0 ; mulps 0x3472(%rip),%xmm2 # 6dd0 <_sk_callback_sse41+0xe55>
+ DB 15,89,21,114,79,0,0 ; mulps 0x4f72(%rip),%xmm2 # 88d0 <_sk_clut_4D_sse41+0x1f6d>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,121,52,0,0 ; movaps 0x3479(%rip),%xmm3 # 6de0 <_sk_callback_sse41+0xe65>
+ DB 15,40,29,121,79,0,0 ; movaps 0x4f79(%rip),%xmm3 # 88e0 <_sk_clut_4D_sse41+0x1f7d>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -18272,12 +21365,12 @@ _sk_store_565_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,104,52,0,0 ; movaps 0x3468(%rip),%xmm8 # 6df0 <_sk_callback_sse41+0xe75>
+ DB 68,15,40,5,104,79,0,0 ; movaps 0x4f68(%rip),%xmm8 # 88f0 <_sk_clut_4D_sse41+0x1f8d>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,93,52,0,0 ; movaps 0x345d(%rip),%xmm10 # 6e00 <_sk_callback_sse41+0xe85>
+ DB 68,15,40,21,93,79,0,0 ; movaps 0x4f5d(%rip),%xmm10 # 8900 <_sk_clut_4D_sse41+0x1f9d>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -18319,21 +21412,21 @@ _sk_load_4444_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,95 ; jne 3a94 <_sk_load_4444_sse41+0x7a>
DB 102,67,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm3
- DB 102,15,111,5,204,51,0,0 ; movdqa 0x33cc(%rip),%xmm0 # 6e10 <_sk_callback_sse41+0xe95>
+ DB 102,15,111,5,204,78,0,0 ; movdqa 0x4ecc(%rip),%xmm0 # 8910 <_sk_clut_4D_sse41+0x1fad>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,206,51,0,0 ; mulps 0x33ce(%rip),%xmm0 # 6e20 <_sk_callback_sse41+0xea5>
- DB 102,15,111,13,214,51,0,0 ; movdqa 0x33d6(%rip),%xmm1 # 6e30 <_sk_callback_sse41+0xeb5>
+ DB 15,89,5,206,78,0,0 ; mulps 0x4ece(%rip),%xmm0 # 8920 <_sk_clut_4D_sse41+0x1fbd>
+ DB 102,15,111,13,214,78,0,0 ; movdqa 0x4ed6(%rip),%xmm1 # 8930 <_sk_clut_4D_sse41+0x1fcd>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,216,51,0,0 ; mulps 0x33d8(%rip),%xmm1 # 6e40 <_sk_callback_sse41+0xec5>
- DB 102,15,111,21,224,51,0,0 ; movdqa 0x33e0(%rip),%xmm2 # 6e50 <_sk_callback_sse41+0xed5>
+ DB 15,89,13,216,78,0,0 ; mulps 0x4ed8(%rip),%xmm1 # 8940 <_sk_clut_4D_sse41+0x1fdd>
+ DB 102,15,111,21,224,78,0,0 ; movdqa 0x4ee0(%rip),%xmm2 # 8950 <_sk_clut_4D_sse41+0x1fed>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,226,51,0,0 ; mulps 0x33e2(%rip),%xmm2 # 6e60 <_sk_callback_sse41+0xee5>
- DB 102,15,219,29,234,51,0,0 ; pand 0x33ea(%rip),%xmm3 # 6e70 <_sk_callback_sse41+0xef5>
+ DB 15,89,21,226,78,0,0 ; mulps 0x4ee2(%rip),%xmm2 # 8960 <_sk_clut_4D_sse41+0x1ffd>
+ DB 102,15,219,29,234,78,0,0 ; pand 0x4eea(%rip),%xmm3 # 8970 <_sk_clut_4D_sse41+0x200d>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,240,51,0,0 ; mulps 0x33f0(%rip),%xmm3 # 6e80 <_sk_callback_sse41+0xf05>
+ DB 15,89,29,240,78,0,0 ; mulps 0x4ef0(%rip),%xmm3 # 8980 <_sk_clut_4D_sse41+0x201d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -18368,21 +21461,21 @@ _sk_load_4444_dst_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,95 ; jne 3b5e <_sk_load_4444_dst_sse41+0x7a>
DB 102,67,15,56,51,60,89 ; pmovzxwd (%r9,%r11,2),%xmm7
- DB 102,15,111,37,130,51,0,0 ; movdqa 0x3382(%rip),%xmm4 # 6e90 <_sk_callback_sse41+0xf15>
+ DB 102,15,111,37,130,78,0,0 ; movdqa 0x4e82(%rip),%xmm4 # 8990 <_sk_clut_4D_sse41+0x202d>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,132,51,0,0 ; mulps 0x3384(%rip),%xmm4 # 6ea0 <_sk_callback_sse41+0xf25>
- DB 102,15,111,45,140,51,0,0 ; movdqa 0x338c(%rip),%xmm5 # 6eb0 <_sk_callback_sse41+0xf35>
+ DB 15,89,37,132,78,0,0 ; mulps 0x4e84(%rip),%xmm4 # 89a0 <_sk_clut_4D_sse41+0x203d>
+ DB 102,15,111,45,140,78,0,0 ; movdqa 0x4e8c(%rip),%xmm5 # 89b0 <_sk_clut_4D_sse41+0x204d>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,142,51,0,0 ; mulps 0x338e(%rip),%xmm5 # 6ec0 <_sk_callback_sse41+0xf45>
- DB 102,15,111,53,150,51,0,0 ; movdqa 0x3396(%rip),%xmm6 # 6ed0 <_sk_callback_sse41+0xf55>
+ DB 15,89,45,142,78,0,0 ; mulps 0x4e8e(%rip),%xmm5 # 89c0 <_sk_clut_4D_sse41+0x205d>
+ DB 102,15,111,53,150,78,0,0 ; movdqa 0x4e96(%rip),%xmm6 # 89d0 <_sk_clut_4D_sse41+0x206d>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,152,51,0,0 ; mulps 0x3398(%rip),%xmm6 # 6ee0 <_sk_callback_sse41+0xf65>
- DB 102,15,219,61,160,51,0,0 ; pand 0x33a0(%rip),%xmm7 # 6ef0 <_sk_callback_sse41+0xf75>
+ DB 15,89,53,152,78,0,0 ; mulps 0x4e98(%rip),%xmm6 # 89e0 <_sk_clut_4D_sse41+0x207d>
+ DB 102,15,219,61,160,78,0,0 ; pand 0x4ea0(%rip),%xmm7 # 89f0 <_sk_clut_4D_sse41+0x208d>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,166,51,0,0 ; mulps 0x33a6(%rip),%xmm7 # 6f00 <_sk_callback_sse41+0xf85>
+ DB 15,89,61,166,78,0,0 ; mulps 0x4ea6(%rip),%xmm7 # 8a00 <_sk_clut_4D_sse41+0x209d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -18429,21 +21522,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,248,50,0,0 ; movdqa 0x32f8(%rip),%xmm0 # 6f10 <_sk_callback_sse41+0xf95>
+ DB 102,15,111,5,248,77,0,0 ; movdqa 0x4df8(%rip),%xmm0 # 8a10 <_sk_clut_4D_sse41+0x20ad>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,250,50,0,0 ; mulps 0x32fa(%rip),%xmm0 # 6f20 <_sk_callback_sse41+0xfa5>
- DB 102,15,111,13,2,51,0,0 ; movdqa 0x3302(%rip),%xmm1 # 6f30 <_sk_callback_sse41+0xfb5>
+ DB 15,89,5,250,77,0,0 ; mulps 0x4dfa(%rip),%xmm0 # 8a20 <_sk_clut_4D_sse41+0x20bd>
+ DB 102,15,111,13,2,78,0,0 ; movdqa 0x4e02(%rip),%xmm1 # 8a30 <_sk_clut_4D_sse41+0x20cd>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,4,51,0,0 ; mulps 0x3304(%rip),%xmm1 # 6f40 <_sk_callback_sse41+0xfc5>
- DB 102,15,111,21,12,51,0,0 ; movdqa 0x330c(%rip),%xmm2 # 6f50 <_sk_callback_sse41+0xfd5>
+ DB 15,89,13,4,78,0,0 ; mulps 0x4e04(%rip),%xmm1 # 8a40 <_sk_clut_4D_sse41+0x20dd>
+ DB 102,15,111,21,12,78,0,0 ; movdqa 0x4e0c(%rip),%xmm2 # 8a50 <_sk_clut_4D_sse41+0x20ed>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,14,51,0,0 ; mulps 0x330e(%rip),%xmm2 # 6f60 <_sk_callback_sse41+0xfe5>
- DB 102,15,219,29,22,51,0,0 ; pand 0x3316(%rip),%xmm3 # 6f70 <_sk_callback_sse41+0xff5>
+ DB 15,89,21,14,78,0,0 ; mulps 0x4e0e(%rip),%xmm2 # 8a60 <_sk_clut_4D_sse41+0x20fd>
+ DB 102,15,219,29,22,78,0,0 ; pand 0x4e16(%rip),%xmm3 # 8a70 <_sk_clut_4D_sse41+0x210d>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,28,51,0,0 ; mulps 0x331c(%rip),%xmm3 # 6f80 <_sk_callback_sse41+0x1005>
+ DB 15,89,29,28,78,0,0 ; mulps 0x4e1c(%rip),%xmm3 # 8a80 <_sk_clut_4D_sse41+0x211d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -18457,7 +21550,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,9,51,0,0 ; movaps 0x3309(%rip),%xmm8 # 6f90 <_sk_callback_sse41+0x1015>
+ DB 68,15,40,5,9,78,0,0 ; movaps 0x4e09(%rip),%xmm8 # 8a90 <_sk_clut_4D_sse41+0x212d>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -18509,17 +21602,17 @@ _sk_load_8888_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,89 ; jne 3da2 <_sk_load_8888_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,73,50,0,0 ; movdqa 0x3249(%rip),%xmm0 # 6fa0 <_sk_callback_sse41+0x1025>
+ DB 102,15,111,5,73,77,0,0 ; movdqa 0x4d49(%rip),%xmm0 # 8aa0 <_sk_clut_4D_sse41+0x213d>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,74,50,0,0 ; movaps 0x324a(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x1035>
+ DB 68,15,40,5,74,77,0,0 ; movaps 0x4d4a(%rip),%xmm8 # 8ab0 <_sk_clut_4D_sse41+0x214d>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,73,50,0,0 ; pshufb 0x3249(%rip),%xmm1 # 6fc0 <_sk_callback_sse41+0x1045>
+ DB 102,15,56,0,13,73,77,0,0 ; pshufb 0x4d49(%rip),%xmm1 # 8ac0 <_sk_clut_4D_sse41+0x215d>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,69,50,0,0 ; pshufb 0x3245(%rip),%xmm2 # 6fd0 <_sk_callback_sse41+0x1055>
+ DB 102,15,56,0,21,69,77,0,0 ; pshufb 0x4d45(%rip),%xmm2 # 8ad0 <_sk_clut_4D_sse41+0x216d>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18556,17 +21649,17 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,89 ; jne 3e5c <_sk_load_8888_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,207,49,0,0 ; movdqa 0x31cf(%rip),%xmm4 # 6fe0 <_sk_callback_sse41+0x1065>
+ DB 102,15,111,37,207,76,0,0 ; movdqa 0x4ccf(%rip),%xmm4 # 8ae0 <_sk_clut_4D_sse41+0x217d>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,208,49,0,0 ; movaps 0x31d0(%rip),%xmm8 # 6ff0 <_sk_callback_sse41+0x1075>
+ DB 68,15,40,5,208,76,0,0 ; movaps 0x4cd0(%rip),%xmm8 # 8af0 <_sk_clut_4D_sse41+0x218d>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,207,49,0,0 ; pshufb 0x31cf(%rip),%xmm5 # 7000 <_sk_callback_sse41+0x1085>
+ DB 102,15,56,0,45,207,76,0,0 ; pshufb 0x4ccf(%rip),%xmm5 # 8b00 <_sk_clut_4D_sse41+0x219d>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,203,49,0,0 ; pshufb 0x31cb(%rip),%xmm6 # 7010 <_sk_callback_sse41+0x1095>
+ DB 102,15,56,0,53,203,76,0,0 ; pshufb 0x4ccb(%rip),%xmm6 # 8b10 <_sk_clut_4D_sse41+0x21ad>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -18612,17 +21705,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,30,49,0,0 ; movdqa 0x311e(%rip),%xmm0 # 7020 <_sk_callback_sse41+0x10a5>
+ DB 102,15,111,5,30,76,0,0 ; movdqa 0x4c1e(%rip),%xmm0 # 8b20 <_sk_clut_4D_sse41+0x21bd>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,31,49,0,0 ; movaps 0x311f(%rip),%xmm8 # 7030 <_sk_callback_sse41+0x10b5>
+ DB 68,15,40,5,31,76,0,0 ; movaps 0x4c1f(%rip),%xmm8 # 8b30 <_sk_clut_4D_sse41+0x21cd>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,30,49,0,0 ; pshufb 0x311e(%rip),%xmm1 # 7040 <_sk_callback_sse41+0x10c5>
+ DB 102,15,56,0,13,30,76,0,0 ; pshufb 0x4c1e(%rip),%xmm1 # 8b40 <_sk_clut_4D_sse41+0x21dd>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,26,49,0,0 ; pshufb 0x311a(%rip),%xmm2 # 7050 <_sk_callback_sse41+0x10d5>
+ DB 102,15,56,0,21,26,76,0,0 ; pshufb 0x4c1a(%rip),%xmm2 # 8b50 <_sk_clut_4D_sse41+0x21ed>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18641,7 +21734,7 @@ _sk_store_8888_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,243,48,0,0 ; movaps 0x30f3(%rip),%xmm8 # 7060 <_sk_callback_sse41+0x10e5>
+ DB 68,15,40,5,243,75,0,0 ; movaps 0x4bf3(%rip),%xmm8 # 8b60 <_sk_clut_4D_sse41+0x21fd>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -18690,17 +21783,17 @@ _sk_load_bgra_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,89 ; jne 4074 <_sk_load_bgra_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,71,48,0,0 ; movdqa 0x3047(%rip),%xmm0 # 7070 <_sk_callback_sse41+0x10f5>
+ DB 102,15,111,5,71,75,0,0 ; movdqa 0x4b47(%rip),%xmm0 # 8b70 <_sk_clut_4D_sse41+0x220d>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,72,48,0,0 ; movaps 0x3048(%rip),%xmm8 # 7080 <_sk_callback_sse41+0x1105>
+ DB 68,15,40,5,72,75,0,0 ; movaps 0x4b48(%rip),%xmm8 # 8b80 <_sk_clut_4D_sse41+0x221d>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,71,48,0,0 ; pshufb 0x3047(%rip),%xmm0 # 7090 <_sk_callback_sse41+0x1115>
+ DB 102,15,56,0,5,71,75,0,0 ; pshufb 0x4b47(%rip),%xmm0 # 8b90 <_sk_clut_4D_sse41+0x222d>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,67,48,0,0 ; pshufb 0x3043(%rip),%xmm0 # 70a0 <_sk_callback_sse41+0x1125>
+ DB 102,15,56,0,5,67,75,0,0 ; pshufb 0x4b43(%rip),%xmm0 # 8ba0 <_sk_clut_4D_sse41+0x223d>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18737,17 +21830,17 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,89 ; jne 412e <_sk_load_bgra_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,205,47,0,0 ; movdqa 0x2fcd(%rip),%xmm4 # 70b0 <_sk_callback_sse41+0x1135>
+ DB 102,15,111,37,205,74,0,0 ; movdqa 0x4acd(%rip),%xmm4 # 8bb0 <_sk_clut_4D_sse41+0x224d>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6
- DB 68,15,40,5,206,47,0,0 ; movaps 0x2fce(%rip),%xmm8 # 70c0 <_sk_callback_sse41+0x1145>
+ DB 68,15,40,5,206,74,0,0 ; movaps 0x4ace(%rip),%xmm8 # 8bc0 <_sk_clut_4D_sse41+0x225d>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,205,47,0,0 ; pshufb 0x2fcd(%rip),%xmm4 # 70d0 <_sk_callback_sse41+0x1155>
+ DB 102,15,56,0,37,205,74,0,0 ; pshufb 0x4acd(%rip),%xmm4 # 8bd0 <_sk_clut_4D_sse41+0x226d>
DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,201,47,0,0 ; pshufb 0x2fc9(%rip),%xmm4 # 70e0 <_sk_callback_sse41+0x1165>
+ DB 102,15,56,0,37,201,74,0,0 ; pshufb 0x4ac9(%rip),%xmm4 # 8be0 <_sk_clut_4D_sse41+0x227d>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -18793,17 +21886,17 @@ _sk_gather_bgra_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,28,47,0,0 ; movdqa 0x2f1c(%rip),%xmm0 # 70f0 <_sk_callback_sse41+0x1175>
+ DB 102,15,111,5,28,74,0,0 ; movdqa 0x4a1c(%rip),%xmm0 # 8bf0 <_sk_clut_4D_sse41+0x228d>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,29,47,0,0 ; movaps 0x2f1d(%rip),%xmm8 # 7100 <_sk_callback_sse41+0x1185>
+ DB 68,15,40,5,29,74,0,0 ; movaps 0x4a1d(%rip),%xmm8 # 8c00 <_sk_clut_4D_sse41+0x229d>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,28,47,0,0 ; pshufb 0x2f1c(%rip),%xmm0 # 7110 <_sk_callback_sse41+0x1195>
+ DB 102,15,56,0,5,28,74,0,0 ; pshufb 0x4a1c(%rip),%xmm0 # 8c10 <_sk_clut_4D_sse41+0x22ad>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,24,47,0,0 ; pshufb 0x2f18(%rip),%xmm0 # 7120 <_sk_callback_sse41+0x11a5>
+ DB 102,15,56,0,5,24,74,0,0 ; pshufb 0x4a18(%rip),%xmm0 # 8c20 <_sk_clut_4D_sse41+0x22bd>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18822,7 +21915,7 @@ _sk_store_bgra_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,241,46,0,0 ; movaps 0x2ef1(%rip),%xmm8 # 7130 <_sk_callback_sse41+0x11b5>
+ DB 68,15,40,5,241,73,0,0 ; movaps 0x49f1(%rip),%xmm8 # 8c30 <_sk_clut_4D_sse41+0x22cd>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -18879,18 +21972,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,22,46,0,0 ; movdqa 0x2e16(%rip),%xmm8 # 7140 <_sk_callback_sse41+0x11c5>
+ DB 102,68,15,111,5,22,73,0,0 ; movdqa 0x4916(%rip),%xmm8 # 8c40 <_sk_clut_4D_sse41+0x22dd>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,17,46,0,0 ; movdqa 0x2e11(%rip),%xmm3 # 7150 <_sk_callback_sse41+0x11d5>
+ DB 102,15,111,29,17,73,0,0 ; movdqa 0x4911(%rip),%xmm3 # 8c50 <_sk_clut_4D_sse41+0x22ed>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,253,45,0,0 ; movdqa 0x2dfd(%rip),%xmm10 # 7160 <_sk_callback_sse41+0x11e5>
+ DB 102,68,15,111,21,253,72,0,0 ; movdqa 0x48fd(%rip),%xmm10 # 8c60 <_sk_clut_4D_sse41+0x22fd>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -18964,18 +22057,18 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11
DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9
DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5
- DB 102,68,15,111,5,174,44,0,0 ; movdqa 0x2cae(%rip),%xmm8 # 7170 <_sk_callback_sse41+0x11f5>
+ DB 102,68,15,111,5,174,71,0,0 ; movdqa 0x47ae(%rip),%xmm8 # 8c70 <_sk_clut_4D_sse41+0x230d>
DB 102,15,111,245 ; movdqa %xmm5,%xmm6
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,239,238 ; pxor %xmm6,%xmm5
- DB 102,15,111,61,169,44,0,0 ; movdqa 0x2ca9(%rip),%xmm7 # 7180 <_sk_callback_sse41+0x1205>
+ DB 102,15,111,61,169,71,0,0 ; movdqa 0x47a9(%rip),%xmm7 # 8c80 <_sk_clut_4D_sse41+0x231d>
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4
DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4
DB 102,15,114,245,13 ; pslld $0xd,%xmm5
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,68,15,111,21,149,44,0,0 ; movdqa 0x2c95(%rip),%xmm10 # 7190 <_sk_callback_sse41+0x1215>
+ DB 102,68,15,111,21,149,71,0,0 ; movdqa 0x4795(%rip),%xmm10 # 8c90 <_sk_clut_4D_sse41+0x232d>
DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -19059,18 +22152,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,24,43,0,0 ; movdqa 0x2b18(%rip),%xmm8 # 71a0 <_sk_callback_sse41+0x1225>
+ DB 102,68,15,111,5,24,70,0,0 ; movdqa 0x4618(%rip),%xmm8 # 8ca0 <_sk_clut_4D_sse41+0x233d>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,19,43,0,0 ; movdqa 0x2b13(%rip),%xmm3 # 71b0 <_sk_callback_sse41+0x1235>
+ DB 102,15,111,29,19,70,0,0 ; movdqa 0x4613(%rip),%xmm3 # 8cb0 <_sk_clut_4D_sse41+0x234d>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,255,42,0,0 ; movdqa 0x2aff(%rip),%xmm10 # 71c0 <_sk_callback_sse41+0x1245>
+ DB 102,68,15,111,21,255,69,0,0 ; movdqa 0x45ff(%rip),%xmm10 # 8cc0 <_sk_clut_4D_sse41+0x235d>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -19122,17 +22215,17 @@ _sk_store_f16_sse41 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,34,42,0,0 ; movdqa 0x2a22(%rip),%xmm10 # 71d0 <_sk_callback_sse41+0x1255>
+ DB 102,68,15,111,21,34,69,0,0 ; movdqa 0x4522(%rip),%xmm10 # 8cd0 <_sk_clut_4D_sse41+0x236d>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,21,42,0,0 ; movdqa 0x2a15(%rip),%xmm9 # 71e0 <_sk_callback_sse41+0x1265>
+ DB 102,68,15,111,13,21,69,0,0 ; movdqa 0x4515(%rip),%xmm9 # 8ce0 <_sk_clut_4D_sse41+0x237d>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,6,42,0,0 ; movdqa 0x2a06(%rip),%xmm12 # 71f0 <_sk_callback_sse41+0x1275>
+ DB 102,68,15,111,37,6,69,0,0 ; movdqa 0x4506(%rip),%xmm12 # 8cf0 <_sk_clut_4D_sse41+0x238d>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -19219,7 +22312,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,134,40,0,0 ; movaps 0x2886(%rip),%xmm8 # 7200 <_sk_callback_sse41+0x1285>
+ DB 68,15,40,5,134,67,0,0 ; movaps 0x4386(%rip),%xmm8 # 8d00 <_sk_clut_4D_sse41+0x239d>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -19291,7 +22384,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,101,39,0,0 ; movaps 0x2765(%rip),%xmm8 # 7210 <_sk_callback_sse41+0x1295>
+ DB 68,15,40,5,101,66,0,0 ; movaps 0x4265(%rip),%xmm8 # 8d10 <_sk_clut_4D_sse41+0x23ad>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -19308,7 +22401,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,44,39,0,0 ; movaps 0x272c(%rip),%xmm3 # 7220 <_sk_callback_sse41+0x12a5>
+ DB 15,40,29,44,66,0,0 ; movaps 0x422c(%rip),%xmm3 # 8d20 <_sk_clut_4D_sse41+0x23bd>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
@@ -19340,7 +22433,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,181,38,0,0 ; movaps 0x26b5(%rip),%xmm10 # 7230 <_sk_callback_sse41+0x12b5>
+ DB 68,15,40,21,181,65,0,0 ; movaps 0x41b5(%rip),%xmm10 # 8d30 <_sk_clut_4D_sse41+0x23cd>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -19599,7 +22692,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,95,39,0,0 ; mulss 0x275f(%rip),%xmm9 # 76a0 <_sk_callback_sse41+0x1725>
+ DB 243,68,15,89,13,239,66,0,0 ; mulss 0x42ef(%rip),%xmm9 # 9230 <_sk_clut_4D_sse41+0x28cd>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -19628,7 +22721,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,241,38,0,0 ; mulss 0x26f1(%rip),%xmm9 # 76a4 <_sk_callback_sse41+0x1729>
+ DB 243,68,15,89,13,129,66,0,0 ; mulss 0x4281(%rip),%xmm9 # 9234 <_sk_clut_4D_sse41+0x28d1>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -19651,7 +22744,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,56,34,0,0 ; minps 0x2238(%rip),%xmm8 # 7240 <_sk_callback_sse41+0x12c5>
+ DB 68,15,93,5,56,61,0,0 ; minps 0x3d38(%rip),%xmm8 # 8d40 <_sk_clut_4D_sse41+0x23dd>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19665,9 +22758,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,41,34,0,0 ; movaps 0x2229(%rip),%xmm8 # 7250 <_sk_callback_sse41+0x12d5>
+ DB 68,15,40,5,41,61,0,0 ; movaps 0x3d29(%rip),%xmm8 # 8d50 <_sk_clut_4D_sse41+0x23ed>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,45,34,0,0 ; movaps 0x222d(%rip),%xmm9 # 7260 <_sk_callback_sse41+0x12e5>
+ DB 68,15,40,13,45,61,0,0 ; movaps 0x3d2d(%rip),%xmm9 # 8d60 <_sk_clut_4D_sse41+0x23fd>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -19682,10 +22775,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,12,34,0,0 ; mulps 0x220c(%rip),%xmm0 # 7270 <_sk_callback_sse41+0x12f5>
- DB 15,89,13,21,34,0,0 ; mulps 0x2215(%rip),%xmm1 # 7280 <_sk_callback_sse41+0x1305>
+ DB 15,89,5,12,61,0,0 ; mulps 0x3d0c(%rip),%xmm0 # 8d70 <_sk_clut_4D_sse41+0x240d>
+ DB 15,89,13,21,61,0,0 ; mulps 0x3d15(%rip),%xmm1 # 8d80 <_sk_clut_4D_sse41+0x241d>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,27,34,0,0 ; mulps 0x221b(%rip),%xmm3 # 7290 <_sk_callback_sse41+0x1315>
+ DB 15,89,29,27,61,0,0 ; mulps 0x3d1b(%rip),%xmm3 # 8d90 <_sk_clut_4D_sse41+0x242d>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -20072,15 +23165,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,198,27,0,0 ; movaps 0x1bc6(%rip),%xmm0 # 72a0 <_sk_callback_sse41+0x1325>
+ DB 15,40,5,198,54,0,0 ; movaps 0x36c6(%rip),%xmm0 # 8da0 <_sk_clut_4D_sse41+0x243d>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,204,27,0,0 ; addps 0x1bcc(%rip),%xmm0 # 72b0 <_sk_callback_sse41+0x1335>
+ DB 15,88,5,204,54,0,0 ; addps 0x36cc(%rip),%xmm0 # 8db0 <_sk_clut_4D_sse41+0x244d>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,210,27,0,0 ; addps 0x1bd2(%rip),%xmm0 # 72c0 <_sk_callback_sse41+0x1345>
+ DB 15,88,5,210,54,0,0 ; addps 0x36d2(%rip),%xmm0 # 8dc0 <_sk_clut_4D_sse41+0x245d>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,216,27,0,0 ; addps 0x1bd8(%rip),%xmm0 # 72d0 <_sk_callback_sse41+0x1355>
+ DB 15,88,5,216,54,0,0 ; addps 0x36d8(%rip),%xmm0 # 8dd0 <_sk_clut_4D_sse41+0x246d>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,222,27,0,0 ; addps 0x1bde(%rip),%xmm0 # 72e0 <_sk_callback_sse41+0x1365>
+ DB 15,88,5,222,54,0,0 ; addps 0x36de(%rip),%xmm0 # 8de0 <_sk_clut_4D_sse41+0x247d>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -20101,7 +23194,7 @@ _sk_gradient_sse41 LABEL PROC
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,183,27,0,0 ; movaps 0x1bb7(%rip),%xmm2 # 72f0 <_sk_callback_sse41+0x1375>
+ DB 15,40,21,183,54,0,0 ; movaps 0x36b7(%rip),%xmm2 # 8df0 <_sk_clut_4D_sse41+0x248d>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -20235,26 +23328,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,88,25,0,0 ; movaps 0x1958(%rip),%xmm10 # 7300 <_sk_callback_sse41+0x1385>
+ DB 68,15,40,21,88,52,0,0 ; movaps 0x3458(%rip),%xmm10 # 8e00 <_sk_clut_4D_sse41+0x249d>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,92,25,0,0 ; addps 0x195c(%rip),%xmm10 # 7310 <_sk_callback_sse41+0x1395>
+ DB 68,15,88,21,92,52,0,0 ; addps 0x345c(%rip),%xmm10 # 8e10 <_sk_clut_4D_sse41+0x24ad>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,96,25,0,0 ; addps 0x1960(%rip),%xmm10 # 7320 <_sk_callback_sse41+0x13a5>
+ DB 68,15,88,21,96,52,0,0 ; addps 0x3460(%rip),%xmm10 # 8e20 <_sk_clut_4D_sse41+0x24bd>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,100,25,0,0 ; addps 0x1964(%rip),%xmm10 # 7330 <_sk_callback_sse41+0x13b5>
+ DB 68,15,88,21,100,52,0,0 ; addps 0x3464(%rip),%xmm10 # 8e30 <_sk_clut_4D_sse41+0x24cd>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,99,25,0,0 ; movaps 0x1963(%rip),%xmm11 # 7340 <_sk_callback_sse41+0x13c5>
+ DB 68,15,40,29,99,52,0,0 ; movaps 0x3463(%rip),%xmm11 # 8e40 <_sk_clut_4D_sse41+0x24dd>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,92,25,0,0 ; movaps 0x195c(%rip),%xmm11 # 7350 <_sk_callback_sse41+0x13d5>
+ DB 68,15,40,29,92,52,0,0 ; movaps 0x345c(%rip),%xmm11 # 8e50 <_sk_clut_4D_sse41+0x24ed>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,78,25,0,0 ; movaps 0x194e(%rip),%xmm9 # 7360 <_sk_callback_sse41+0x13e5>
+ DB 68,15,40,13,78,52,0,0 ; movaps 0x344e(%rip),%xmm9 # 8e60 <_sk_clut_4D_sse41+0x24fd>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -20284,7 +23377,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,247,24,0,0 ; mulps 0x18f7(%rip),%xmm9 # 7370 <_sk_callback_sse41+0x13f5>
+ DB 68,15,89,13,247,51,0,0 ; mulps 0x33f7(%rip),%xmm9 # 8e70 <_sk_clut_4D_sse41+0x250d>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -20292,7 +23385,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,226,24,0,0 ; mulps 0x18e2(%rip),%xmm10 # 7380 <_sk_callback_sse41+0x1405>
+ DB 68,15,89,21,226,51,0,0 ; mulps 0x33e2(%rip),%xmm10 # 8e80 <_sk_clut_4D_sse41+0x251d>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -20301,8 +23394,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,202,24,0,0 ; xorps 0x18ca(%rip),%xmm9 # 7390 <_sk_callback_sse41+0x1415>
- DB 68,15,89,5,210,24,0,0 ; mulps 0x18d2(%rip),%xmm8 # 73a0 <_sk_callback_sse41+0x1425>
+ DB 68,15,87,13,202,51,0,0 ; xorps 0x33ca(%rip),%xmm9 # 8e90 <_sk_clut_4D_sse41+0x252d>
+ DB 68,15,89,5,210,51,0,0 ; mulps 0x33d2(%rip),%xmm8 # 8ea0 <_sk_clut_4D_sse41+0x253d>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -20321,7 +23414,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,153,24,0,0 ; mulps 0x1899(%rip),%xmm9 # 73b0 <_sk_callback_sse41+0x1435>
+ DB 68,15,89,13,153,51,0,0 ; mulps 0x3399(%rip),%xmm9 # 8eb0 <_sk_clut_4D_sse41+0x254d>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -20329,7 +23422,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,132,24,0,0 ; mulps 0x1884(%rip),%xmm10 # 73c0 <_sk_callback_sse41+0x1445>
+ DB 68,15,89,21,132,51,0,0 ; mulps 0x3384(%rip),%xmm10 # 8ec0 <_sk_clut_4D_sse41+0x255d>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -20338,8 +23431,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,108,24,0,0 ; xorps 0x186c(%rip),%xmm9 # 73d0 <_sk_callback_sse41+0x1455>
- DB 68,15,89,5,116,24,0,0 ; mulps 0x1874(%rip),%xmm8 # 73e0 <_sk_callback_sse41+0x1465>
+ DB 68,15,87,13,108,51,0,0 ; xorps 0x336c(%rip),%xmm9 # 8ed0 <_sk_clut_4D_sse41+0x256d>
+ DB 68,15,89,5,116,51,0,0 ; mulps 0x3374(%rip),%xmm8 # 8ee0 <_sk_clut_4D_sse41+0x257d>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -20355,7 +23448,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,76,24,0,0 ; mulps 0x184c(%rip),%xmm9 # 73f0 <_sk_callback_sse41+0x1475>
+ DB 68,15,89,13,76,51,0,0 ; mulps 0x334c(%rip),%xmm9 # 8ef0 <_sk_clut_4D_sse41+0x258d>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -20363,7 +23456,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,56,24,0,0 ; xorps 0x1838(%rip),%xmm0 # 7400 <_sk_callback_sse41+0x1485>
+ DB 15,87,5,56,51,0,0 ; xorps 0x3338(%rip),%xmm0 # 8f00 <_sk_clut_4D_sse41+0x259d>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20400,7 +23493,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,222,23,0,0 ; movaps 0x17de(%rip),%xmm8 # 7410 <_sk_callback_sse41+0x1495>
+ DB 68,15,40,5,222,50,0,0 ; movaps 0x32de(%rip),%xmm8 # 8f10 <_sk_clut_4D_sse41+0x25ad>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -20440,8 +23533,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,96,23,0,0 ; addps 0x1760(%rip),%xmm0 # 7420 <_sk_callback_sse41+0x14a5>
- DB 68,15,40,13,104,23,0,0 ; movaps 0x1768(%rip),%xmm9 # 7430 <_sk_callback_sse41+0x14b5>
+ DB 15,88,5,96,50,0,0 ; addps 0x3260(%rip),%xmm0 # 8f20 <_sk_clut_4D_sse41+0x25bd>
+ DB 68,15,40,13,104,50,0,0 ; movaps 0x3268(%rip),%xmm9 # 8f30 <_sk_clut_4D_sse41+0x25cd>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20452,7 +23545,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,87,23,0,0 ; addps 0x1757(%rip),%xmm0 # 7440 <_sk_callback_sse41+0x14c5>
+ DB 15,88,5,87,50,0,0 ; addps 0x3257(%rip),%xmm0 # 8f40 <_sk_clut_4D_sse41+0x25dd>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20462,8 +23555,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,73,23,0,0 ; addps 0x1749(%rip),%xmm1 # 7450 <_sk_callback_sse41+0x14d5>
- DB 68,15,40,13,81,23,0,0 ; movaps 0x1751(%rip),%xmm9 # 7460 <_sk_callback_sse41+0x14e5>
+ DB 15,88,13,73,50,0,0 ; addps 0x3249(%rip),%xmm1 # 8f50 <_sk_clut_4D_sse41+0x25ed>
+ DB 68,15,40,13,81,50,0,0 ; movaps 0x3251(%rip),%xmm9 # 8f60 <_sk_clut_4D_sse41+0x25fd>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20474,7 +23567,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,63,23,0,0 ; addps 0x173f(%rip),%xmm1 # 7470 <_sk_callback_sse41+0x14f5>
+ DB 15,88,13,63,50,0,0 ; addps 0x323f(%rip),%xmm1 # 8f70 <_sk_clut_4D_sse41+0x260d>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20484,13 +23577,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,50,23,0,0 ; addps 0x1732(%rip),%xmm0 # 7480 <_sk_callback_sse41+0x1505>
- DB 68,15,40,13,58,23,0,0 ; movaps 0x173a(%rip),%xmm9 # 7490 <_sk_callback_sse41+0x1515>
+ DB 15,88,5,50,50,0,0 ; addps 0x3232(%rip),%xmm0 # 8f80 <_sk_clut_4D_sse41+0x261d>
+ DB 68,15,40,13,58,50,0,0 ; movaps 0x323a(%rip),%xmm9 # 8f90 <_sk_clut_4D_sse41+0x262d>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,54,23,0,0 ; mulps 0x1736(%rip),%xmm9 # 74a0 <_sk_callback_sse41+0x1525>
- DB 68,15,88,13,62,23,0,0 ; addps 0x173e(%rip),%xmm9 # 74b0 <_sk_callback_sse41+0x1535>
+ DB 68,15,89,13,54,50,0,0 ; mulps 0x3236(%rip),%xmm9 # 8fa0 <_sk_clut_4D_sse41+0x263d>
+ DB 68,15,88,13,62,50,0,0 ; addps 0x323e(%rip),%xmm9 # 8fb0 <_sk_clut_4D_sse41+0x264d>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20501,16 +23594,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,45,23,0,0 ; addps 0x172d(%rip),%xmm0 # 74c0 <_sk_callback_sse41+0x1545>
- DB 68,15,40,13,53,23,0,0 ; movaps 0x1735(%rip),%xmm9 # 74d0 <_sk_callback_sse41+0x1555>
+ DB 15,88,5,45,50,0,0 ; addps 0x322d(%rip),%xmm0 # 8fc0 <_sk_clut_4D_sse41+0x265d>
+ DB 68,15,40,13,53,50,0,0 ; movaps 0x3235(%rip),%xmm9 # 8fd0 <_sk_clut_4D_sse41+0x266d>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,57,23,0,0 ; movaps 0x1739(%rip),%xmm8 # 74e0 <_sk_callback_sse41+0x1565>
+ DB 68,15,40,5,57,50,0,0 ; movaps 0x3239(%rip),%xmm8 # 8fe0 <_sk_clut_4D_sse41+0x267d>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,61,23,0,0 ; addps 0x173d(%rip),%xmm8 # 74f0 <_sk_callback_sse41+0x1575>
+ DB 68,15,88,5,61,50,0,0 ; addps 0x323d(%rip),%xmm8 # 8ff0 <_sk_clut_4D_sse41+0x268d>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,65,23,0,0 ; addps 0x1741(%rip),%xmm8 # 7500 <_sk_callback_sse41+0x1585>
+ DB 68,15,88,5,65,50,0,0 ; addps 0x3241(%rip),%xmm8 # 9000 <_sk_clut_4D_sse41+0x269d>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,69,23,0,0 ; addps 0x1745(%rip),%xmm8 # 7510 <_sk_callback_sse41+0x1595>
+ DB 68,15,88,5,69,50,0,0 ; addps 0x3245(%rip),%xmm8 # 9010 <_sk_clut_4D_sse41+0x26ad>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20518,17 +23611,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,63,23,0,0 ; movaps 0x173f(%rip),%xmm8 # 7520 <_sk_callback_sse41+0x15a5>
+ DB 68,15,40,5,63,50,0,0 ; movaps 0x323f(%rip),%xmm8 # 9020 <_sk_clut_4D_sse41+0x26bd>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,59,23,0,0 ; movaps 0x173b(%rip),%xmm10 # 7530 <_sk_callback_sse41+0x15b5>
+ DB 68,15,40,21,59,50,0,0 ; movaps 0x323b(%rip),%xmm10 # 9030 <_sk_clut_4D_sse41+0x26cd>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,63,23,0,0 ; addps 0x173f(%rip),%xmm10 # 7540 <_sk_callback_sse41+0x15c5>
+ DB 68,15,88,21,63,50,0,0 ; addps 0x323f(%rip),%xmm10 # 9040 <_sk_clut_4D_sse41+0x26dd>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,59,23,0,0 ; addps 0x173b(%rip),%xmm10 # 7550 <_sk_callback_sse41+0x15d5>
+ DB 68,15,88,21,59,50,0,0 ; addps 0x323b(%rip),%xmm10 # 9050 <_sk_clut_4D_sse41+0x26ed>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20538,11 +23631,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,46,23,0,0 ; addps 0x172e(%rip),%xmm0 # 7560 <_sk_callback_sse41+0x15e5>
+ DB 15,88,5,46,50,0,0 ; addps 0x322e(%rip),%xmm0 # 9060 <_sk_clut_4D_sse41+0x26fd>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,46,23,0,0 ; mulps 0x172e(%rip),%xmm8 # 7570 <_sk_callback_sse41+0x15f5>
- DB 68,15,88,5,54,23,0,0 ; addps 0x1736(%rip),%xmm8 # 7580 <_sk_callback_sse41+0x1605>
+ DB 68,15,89,5,46,50,0,0 ; mulps 0x322e(%rip),%xmm8 # 9070 <_sk_clut_4D_sse41+0x270d>
+ DB 68,15,88,5,54,50,0,0 ; addps 0x3236(%rip),%xmm8 # 9080 <_sk_clut_4D_sse41+0x271d>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20553,13 +23646,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,36,23,0,0 ; addps 0x1724(%rip),%xmm1 # 7590 <_sk_callback_sse41+0x1615>
- DB 68,15,40,13,44,23,0,0 ; movaps 0x172c(%rip),%xmm9 # 75a0 <_sk_callback_sse41+0x1625>
+ DB 15,88,13,36,50,0,0 ; addps 0x3224(%rip),%xmm1 # 9090 <_sk_clut_4D_sse41+0x272d>
+ DB 68,15,40,13,44,50,0,0 ; movaps 0x322c(%rip),%xmm9 # 90a0 <_sk_clut_4D_sse41+0x273d>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,40,23,0,0 ; mulps 0x1728(%rip),%xmm9 # 75b0 <_sk_callback_sse41+0x1635>
- DB 68,15,88,13,48,23,0,0 ; addps 0x1730(%rip),%xmm9 # 75c0 <_sk_callback_sse41+0x1645>
+ DB 68,15,89,13,40,50,0,0 ; mulps 0x3228(%rip),%xmm9 # 90b0 <_sk_clut_4D_sse41+0x274d>
+ DB 68,15,88,13,48,50,0,0 ; addps 0x3230(%rip),%xmm9 # 90c0 <_sk_clut_4D_sse41+0x275d>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20570,16 +23663,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,30,23,0,0 ; addps 0x171e(%rip),%xmm1 # 75d0 <_sk_callback_sse41+0x1655>
- DB 68,15,40,13,38,23,0,0 ; movaps 0x1726(%rip),%xmm9 # 75e0 <_sk_callback_sse41+0x1665>
+ DB 15,88,13,30,50,0,0 ; addps 0x321e(%rip),%xmm1 # 90d0 <_sk_clut_4D_sse41+0x276d>
+ DB 68,15,40,13,38,50,0,0 ; movaps 0x3226(%rip),%xmm9 # 90e0 <_sk_clut_4D_sse41+0x277d>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,42,23,0,0 ; movaps 0x172a(%rip),%xmm8 # 75f0 <_sk_callback_sse41+0x1675>
+ DB 68,15,40,5,42,50,0,0 ; movaps 0x322a(%rip),%xmm8 # 90f0 <_sk_clut_4D_sse41+0x278d>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,46,23,0,0 ; addps 0x172e(%rip),%xmm8 # 7600 <_sk_callback_sse41+0x1685>
+ DB 68,15,88,5,46,50,0,0 ; addps 0x322e(%rip),%xmm8 # 9100 <_sk_clut_4D_sse41+0x279d>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,50,23,0,0 ; addps 0x1732(%rip),%xmm8 # 7610 <_sk_callback_sse41+0x1695>
+ DB 68,15,88,5,50,50,0,0 ; addps 0x3232(%rip),%xmm8 # 9110 <_sk_clut_4D_sse41+0x27ad>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,54,23,0,0 ; addps 0x1736(%rip),%xmm8 # 7620 <_sk_callback_sse41+0x16a5>
+ DB 68,15,88,5,54,50,0,0 ; addps 0x3236(%rip),%xmm8 # 9120 <_sk_clut_4D_sse41+0x27bd>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20587,17 +23680,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,48,23,0,0 ; movaps 0x1730(%rip),%xmm8 # 7630 <_sk_callback_sse41+0x16b5>
+ DB 68,15,40,5,48,50,0,0 ; movaps 0x3230(%rip),%xmm8 # 9130 <_sk_clut_4D_sse41+0x27cd>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,43,23,0,0 ; movaps 0x172b(%rip),%xmm10 # 7640 <_sk_callback_sse41+0x16c5>
+ DB 68,15,40,21,43,50,0,0 ; movaps 0x322b(%rip),%xmm10 # 9140 <_sk_clut_4D_sse41+0x27dd>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,47,23,0,0 ; addps 0x172f(%rip),%xmm10 # 7650 <_sk_callback_sse41+0x16d5>
+ DB 68,15,88,21,47,50,0,0 ; addps 0x322f(%rip),%xmm10 # 9150 <_sk_clut_4D_sse41+0x27ed>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,43,23,0,0 ; addps 0x172b(%rip),%xmm10 # 7660 <_sk_callback_sse41+0x16e5>
+ DB 68,15,88,21,43,50,0,0 ; addps 0x322b(%rip),%xmm10 # 9160 <_sk_clut_4D_sse41+0x27fd>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20607,11 +23700,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,29,23,0,0 ; addps 0x171d(%rip),%xmm1 # 7670 <_sk_callback_sse41+0x16f5>
+ DB 15,88,13,29,50,0,0 ; addps 0x321d(%rip),%xmm1 # 9170 <_sk_clut_4D_sse41+0x280d>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,29,23,0,0 ; mulps 0x171d(%rip),%xmm8 # 7680 <_sk_callback_sse41+0x1705>
- DB 68,15,88,5,37,23,0,0 ; addps 0x1725(%rip),%xmm8 # 7690 <_sk_callback_sse41+0x1715>
+ DB 68,15,89,5,29,50,0,0 ; mulps 0x321d(%rip),%xmm8 # 9180 <_sk_clut_4D_sse41+0x281d>
+ DB 68,15,88,5,37,50,0,0 ; addps 0x3225(%rip),%xmm8 # 9190 <_sk_clut_4D_sse41+0x282d>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20685,6 +23778,1384 @@ _sk_callback_sse41 LABEL PROC
DB 93 ; pop %rbp
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_clut_3D_sse41
+_sk_clut_3D_sse41 LABEL PROC
+ DB 85 ; push %rbp
+ DB 65,87 ; push %r15
+ DB 65,86 ; push %r14
+ DB 65,85 ; push %r13
+ DB 65,84 ; push %r12
+ DB 83 ; push %rbx
+ DB 72,129,236,200,0,0,0 ; sub $0xc8,%rsp
+ DB 15,41,188,36,176,0,0,0 ; movaps %xmm7,0xb0(%rsp)
+ DB 15,41,180,36,160,0,0,0 ; movaps %xmm6,0xa0(%rsp)
+ DB 15,41,172,36,144,0,0,0 ; movaps %xmm5,0x90(%rsp)
+ DB 15,41,164,36,128,0,0,0 ; movaps %xmm4,0x80(%rsp)
+ DB 15,41,92,36,112 ; movaps %xmm3,0x70(%rsp)
+ DB 76,137,68,36,24 ; mov %r8,0x18(%rsp)
+ DB 72,137,76,36,16 ; mov %rcx,0x10(%rsp)
+ DB 73,137,208 ; mov %rdx,%r8
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,16 ; mov 0x10(%rax),%r9d
+ DB 65,141,89,255 ; lea -0x1(%r9),%ebx
+ DB 102,15,110,219 ; movd %ebx,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
+ DB 15,89,218 ; mulps %xmm2,%xmm3
+ DB 243,15,91,227 ; cvttps2dq %xmm3,%xmm4
+ DB 68,15,40,195 ; movaps %xmm3,%xmm8
+ DB 68,15,41,68,36,96 ; movaps %xmm8,0x60(%rsp)
+ DB 102,65,15,110,209 ; movd %r9d,%xmm2
+ DB 102,15,112,234,0 ; pshufd $0x0,%xmm2,%xmm5
+ DB 102,15,127,108,36,32 ; movdqa %xmm5,0x20(%rsp)
+ DB 68,139,72,12 ; mov 0xc(%rax),%r9d
+ DB 65,141,89,255 ; lea -0x1(%r9),%ebx
+ DB 102,15,110,219 ; movd %ebx,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 243,68,15,91,235 ; cvttps2dq %xmm3,%xmm13
+ DB 102,68,15,127,108,36,64 ; movdqa %xmm13,0x40(%rsp)
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,41,60,36 ; movaps %xmm7,(%rsp)
+ DB 102,68,15,56,64,237 ; pmulld %xmm5,%xmm13
+ DB 102,65,15,111,205 ; movdqa %xmm13,%xmm1
+ DB 102,15,254,204 ; paddd %xmm4,%xmm1
+ DB 102,68,15,111,212 ; movdqa %xmm4,%xmm10
+ DB 102,68,15,127,84,36,80 ; movdqa %xmm10,0x50(%rsp)
+ DB 102,65,15,110,217 ; movd %r9d,%xmm3
+ DB 102,15,56,64,218 ; pmulld %xmm2,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 139,88,8 ; mov 0x8(%rax),%ebx
+ DB 255,203 ; dec %ebx
+ DB 102,15,110,211 ; movd %ebx,%xmm2
+ DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
+ DB 68,15,91,242 ; cvtdq2ps %xmm2,%xmm14
+ DB 68,15,89,240 ; mulps %xmm0,%xmm14
+ DB 243,65,15,91,198 ; cvttps2dq %xmm14,%xmm0
+ DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
+ DB 102,68,15,56,64,227 ; pmulld %xmm3,%xmm12
+ DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
+ DB 102,15,254,209 ; paddd %xmm1,%xmm2
+ DB 102,15,111,37,101,48,0,0 ; movdqa 0x3065(%rip),%xmm4 # 91b0 <_sk_clut_4D_sse41+0x284d>
+ DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
+ DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
+ DB 102,68,15,111,61,98,48,0,0 ; movdqa 0x3062(%rip),%xmm15 # 91c0 <_sk_clut_4D_sse41+0x285d>
+ DB 102,15,111,226 ; movdqa %xmm2,%xmm4
+ DB 102,65,15,254,231 ; paddd %xmm15,%xmm4
+ DB 102,73,15,58,22,225,1 ; pextrq $0x1,%xmm4,%r9
+ DB 102,72,15,126,227 ; movq %xmm4,%rbx
+ DB 72,139,0 ; mov (%rax),%rax
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 69,137,203 ; mov %r9d,%r11d
+ DB 243,66,15,16,36,144 ; movss (%rax,%r10,4),%xmm4
+ DB 102,15,58,33,36,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm4
+ DB 243,66,15,16,44,152 ; movss (%rax,%r11,4),%xmm5
+ DB 102,15,58,33,229,32 ; insertps $0x20,%xmm5,%xmm4
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 243,66,15,16,44,136 ; movss (%rax,%r9,4),%xmm5
+ DB 102,15,58,33,229,48 ; insertps $0x30,%xmm5,%xmm4
+ DB 102,65,15,126,209 ; movd %xmm2,%r9d
+ DB 102,65,15,58,22,210,1 ; pextrd $0x1,%xmm2,%r10d
+ DB 102,65,15,58,22,211,2 ; pextrd $0x2,%xmm2,%r11d
+ DB 102,65,15,58,22,214,3 ; pextrd $0x3,%xmm2,%r14d
+ DB 102,68,15,111,13,4,48,0,0 ; movdqa 0x3004(%rip),%xmm9 # 91d0 <_sk_clut_4D_sse41+0x286d>
+ DB 102,65,15,254,209 ; paddd %xmm9,%xmm2
+ DB 102,73,15,58,22,215,1 ; pextrq $0x1,%xmm2,%r15
+ DB 102,72,15,126,211 ; movq %xmm2,%rbx
+ DB 65,137,220 ; mov %ebx,%r12d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 69,137,253 ; mov %r15d,%r13d
+ DB 243,66,15,16,52,160 ; movss (%rax,%r12,4),%xmm6
+ DB 102,15,58,33,52,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm6
+ DB 243,66,15,16,20,168 ; movss (%rax,%r13,4),%xmm2
+ DB 102,15,58,33,242,32 ; insertps $0x20,%xmm2,%xmm6
+ DB 73,193,239,32 ; shr $0x20,%r15
+ DB 243,66,15,16,20,184 ; movss (%rax,%r15,4),%xmm2
+ DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
+ DB 15,40,45,137,47,0,0 ; movaps 0x2f89(%rip),%xmm5 # 91a0 <_sk_clut_4D_sse41+0x283d>
+ DB 68,15,88,197 ; addps %xmm5,%xmm8
+ DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
+ DB 15,40,215 ; movaps %xmm7,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 65,15,88,238 ; addps %xmm14,%xmm5
+ DB 243,68,15,91,197 ; cvttps2dq %xmm5,%xmm8
+ DB 102,68,15,56,64,195 ; pmulld %xmm3,%xmm8
+ DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
+ DB 102,65,15,111,251 ; movdqa %xmm11,%xmm7
+ DB 102,15,56,64,207 ; pmulld %xmm7,%xmm1
+ DB 102,15,111,217 ; movdqa %xmm1,%xmm3
+ DB 102,65,15,254,223 ; paddd %xmm15,%xmm3
+ DB 102,73,15,58,22,223,1 ; pextrq $0x1,%xmm3,%r15
+ DB 102,72,15,126,219 ; movq %xmm3,%rbx
+ DB 65,137,220 ; mov %ebx,%r12d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 69,137,253 ; mov %r15d,%r13d
+ DB 243,66,15,16,44,160 ; movss (%rax,%r12,4),%xmm5
+ DB 102,15,58,33,44,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm5
+ DB 243,66,15,16,28,168 ; movss (%rax,%r13,4),%xmm3
+ DB 102,15,58,33,235,32 ; insertps $0x20,%xmm3,%xmm5
+ DB 73,193,239,32 ; shr $0x20,%r15
+ DB 243,66,15,16,28,184 ; movss (%rax,%r15,4),%xmm3
+ DB 102,15,58,33,235,48 ; insertps $0x30,%xmm3,%xmm5
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 102,65,15,58,22,207,1 ; pextrd $0x1,%xmm1,%r15d
+ DB 102,65,15,58,22,204,2 ; pextrd $0x2,%xmm1,%r12d
+ DB 102,65,15,58,22,205,3 ; pextrd $0x3,%xmm1,%r13d
+ DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
+ DB 102,72,15,58,22,205,1 ; pextrq $0x1,%xmm1,%rbp
+ DB 102,72,15,126,201 ; movq %xmm1,%rcx
+ DB 137,202 ; mov %ecx,%edx
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,28,144 ; movss (%rax,%rdx,4),%xmm3
+ DB 102,15,58,33,28,136,16 ; insertps $0x10,(%rax,%rcx,4),%xmm3
+ DB 137,233 ; mov %ebp,%ecx
+ DB 243,15,16,12,136 ; movss (%rax,%rcx,4),%xmm1
+ DB 102,15,58,33,217,32 ; insertps $0x20,%xmm1,%xmm3
+ DB 72,193,237,32 ; shr $0x20,%rbp
+ DB 243,15,16,12,168 ; movss (%rax,%rbp,4),%xmm1
+ DB 102,15,58,33,217,48 ; insertps $0x30,%xmm1,%xmm3
+ DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
+ DB 68,15,92,240 ; subps %xmm0,%xmm14
+ DB 243,66,15,16,4,136 ; movss (%rax,%r9,4),%xmm0
+ DB 102,66,15,58,33,4,144,16 ; insertps $0x10,(%rax,%r10,4),%xmm0
+ DB 102,66,15,58,33,4,152,32 ; insertps $0x20,(%rax,%r11,4),%xmm0
+ DB 102,66,15,58,33,4,176,48 ; insertps $0x30,(%rax,%r14,4),%xmm0
+ DB 243,15,16,12,152 ; movss (%rax,%rbx,4),%xmm1
+ DB 102,66,15,58,33,12,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm1
+ DB 102,66,15,58,33,12,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm1
+ DB 102,66,15,58,33,12,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm1
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 65,15,89,206 ; mulps %xmm14,%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 65,15,89,238 ; mulps %xmm14,%xmm5
+ DB 15,88,236 ; addps %xmm4,%xmm5
+ DB 15,92,222 ; subps %xmm6,%xmm3
+ DB 65,15,89,222 ; mulps %xmm14,%xmm3
+ DB 15,88,222 ; addps %xmm6,%xmm3
+ DB 243,68,15,91,218 ; cvttps2dq %xmm2,%xmm11
+ DB 102,68,15,56,64,92,36,32 ; pmulld 0x20(%rsp),%xmm11
+ DB 102,65,15,111,227 ; movdqa %xmm11,%xmm4
+ DB 102,65,15,254,226 ; paddd %xmm10,%xmm4
+ DB 102,15,111,196 ; movdqa %xmm4,%xmm0
+ DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
+ DB 102,15,56,64,199 ; pmulld %xmm7,%xmm0
+ DB 102,68,15,111,215 ; movdqa %xmm7,%xmm10
+ DB 102,15,126,193 ; movd %xmm0,%ecx
+ DB 102,15,58,22,194,1 ; pextrd $0x1,%xmm0,%edx
+ DB 102,15,58,22,197,2 ; pextrd $0x2,%xmm0,%ebp
+ DB 102,15,58,22,195,3 ; pextrd $0x3,%xmm0,%ebx
+ DB 243,15,16,52,136 ; movss (%rax,%rcx,4),%xmm6
+ DB 102,15,58,33,52,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm6
+ DB 102,15,58,33,52,168,32 ; insertps $0x20,(%rax,%rbp,4),%xmm6
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
+ DB 102,15,111,208 ; movdqa %xmm0,%xmm2
+ DB 102,65,15,254,215 ; paddd %xmm15,%xmm2
+ DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
+ DB 102,72,15,126,210 ; movq %xmm2,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,20,168 ; movss (%rax,%rbp,4),%xmm2
+ DB 102,15,58,33,20,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm2
+ DB 243,15,16,60,152 ; movss (%rax,%rbx,4),%xmm7
+ DB 102,15,58,33,215,32 ; insertps $0x20,%xmm7,%xmm2
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,60,136 ; movss (%rax,%rcx,4),%xmm7
+ DB 102,15,58,33,215,48 ; insertps $0x30,%xmm7,%xmm2
+ DB 102,65,15,254,193 ; paddd %xmm9,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,4,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm0
+ DB 243,15,16,60,152 ; movss (%rax,%rbx,4),%xmm7
+ DB 102,15,58,33,199,32 ; insertps $0x20,%xmm7,%xmm0
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,60,136 ; movss (%rax,%rcx,4),%xmm7
+ DB 102,15,58,33,199,48 ; insertps $0x30,%xmm7,%xmm0
+ DB 102,65,15,254,224 ; paddd %xmm8,%xmm4
+ DB 102,65,15,56,64,226 ; pmulld %xmm10,%xmm4
+ DB 102,15,111,252 ; movdqa %xmm4,%xmm7
+ DB 102,65,15,254,255 ; paddd %xmm15,%xmm7
+ DB 102,72,15,58,22,249,1 ; pextrq $0x1,%xmm7,%rcx
+ DB 102,72,15,126,250 ; movq %xmm7,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,68,15,16,20,168 ; movss (%rax,%rbp,4),%xmm10
+ DB 102,68,15,58,33,20,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm10
+ DB 243,15,16,60,152 ; movss (%rax,%rbx,4),%xmm7
+ DB 102,68,15,58,33,215,32 ; insertps $0x20,%xmm7,%xmm10
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,60,136 ; movss (%rax,%rcx,4),%xmm7
+ DB 102,68,15,58,33,215,48 ; insertps $0x30,%xmm7,%xmm10
+ DB 102,65,15,126,225 ; movd %xmm4,%r9d
+ DB 102,65,15,58,22,226,1 ; pextrd $0x1,%xmm4,%r10d
+ DB 102,65,15,58,22,230,2 ; pextrd $0x2,%xmm4,%r14d
+ DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d
+ DB 102,65,15,111,249 ; movdqa %xmm9,%xmm7
+ DB 102,15,254,231 ; paddd %xmm7,%xmm4
+ DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
+ DB 102,72,15,126,226 ; movq %xmm4,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,68,15,16,12,152 ; movss (%rax,%rbx,4),%xmm9
+ DB 102,68,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm9
+ DB 243,15,16,36,168 ; movss (%rax,%rbp,4),%xmm4
+ DB 102,68,15,58,33,204,32 ; insertps $0x20,%xmm4,%xmm9
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,36,136 ; movss (%rax,%rcx,4),%xmm4
+ DB 102,68,15,58,33,204,48 ; insertps $0x30,%xmm4,%xmm9
+ DB 243,66,15,16,36,136 ; movss (%rax,%r9,4),%xmm4
+ DB 102,66,15,58,33,36,144,16 ; insertps $0x10,(%rax,%r10,4),%xmm4
+ DB 102,66,15,58,33,36,176,32 ; insertps $0x20,(%rax,%r14,4),%xmm4
+ DB 102,66,15,58,33,36,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm4
+ DB 15,92,230 ; subps %xmm6,%xmm4
+ DB 65,15,89,230 ; mulps %xmm14,%xmm4
+ DB 15,88,230 ; addps %xmm6,%xmm4
+ DB 68,15,92,210 ; subps %xmm2,%xmm10
+ DB 69,15,89,214 ; mulps %xmm14,%xmm10
+ DB 68,15,88,210 ; addps %xmm2,%xmm10
+ DB 68,15,92,200 ; subps %xmm0,%xmm9
+ DB 69,15,89,206 ; mulps %xmm14,%xmm9
+ DB 68,15,88,200 ; addps %xmm0,%xmm9
+ DB 15,91,68,36,64 ; cvtdq2ps 0x40(%rsp),%xmm0
+ DB 15,40,20,36 ; movaps (%rsp),%xmm2
+ DB 15,92,208 ; subps %xmm0,%xmm2
+ DB 15,41,20,36 ; movaps %xmm2,(%rsp)
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 68,15,92,213 ; subps %xmm5,%xmm10
+ DB 68,15,89,210 ; mulps %xmm2,%xmm10
+ DB 68,15,88,213 ; addps %xmm5,%xmm10
+ DB 68,15,92,203 ; subps %xmm3,%xmm9
+ DB 68,15,89,202 ; mulps %xmm2,%xmm9
+ DB 68,15,88,203 ; addps %xmm3,%xmm9
+ DB 243,15,91,68,36,48 ; cvttps2dq 0x30(%rsp),%xmm0
+ DB 102,68,15,254,232 ; paddd %xmm0,%xmm13
+ DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
+ DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
+ DB 102,15,111,45,74,44,0,0 ; movdqa 0x2c4a(%rip),%xmm5 # 91b0 <_sk_clut_4D_sse41+0x284d>
+ DB 102,15,56,64,213 ; pmulld %xmm5,%xmm2
+ DB 102,15,111,202 ; movdqa %xmm2,%xmm1
+ DB 102,65,15,254,207 ; paddd %xmm15,%xmm1
+ DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
+ DB 102,72,15,126,202 ; movq %xmm1,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,12,168 ; movss (%rax,%rbp,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,28,152 ; movss (%rax,%rbx,4),%xmm3
+ DB 102,15,58,33,203,32 ; insertps $0x20,%xmm3,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,28,136 ; movss (%rax,%rcx,4),%xmm3
+ DB 102,15,58,33,203,48 ; insertps $0x30,%xmm3,%xmm1
+ DB 102,65,15,126,214 ; movd %xmm2,%r14d
+ DB 102,65,15,58,22,209,1 ; pextrd $0x1,%xmm2,%r9d
+ DB 102,65,15,58,22,210,2 ; pextrd $0x2,%xmm2,%r10d
+ DB 102,65,15,58,22,211,3 ; pextrd $0x3,%xmm2,%r11d
+ DB 102,15,254,215 ; paddd %xmm7,%xmm2
+ DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
+ DB 102,72,15,126,210 ; movq %xmm2,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,20,168 ; movss (%rax,%rbp,4),%xmm2
+ DB 102,15,58,33,20,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm2
+ DB 243,15,16,28,152 ; movss (%rax,%rbx,4),%xmm3
+ DB 102,15,58,33,211,32 ; insertps $0x20,%xmm3,%xmm2
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,28,136 ; movss (%rax,%rcx,4),%xmm3
+ DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
+ DB 102,65,15,111,240 ; movdqa %xmm8,%xmm6
+ DB 102,68,15,254,238 ; paddd %xmm6,%xmm13
+ DB 102,68,15,56,64,237 ; pmulld %xmm5,%xmm13
+ DB 102,65,15,111,221 ; movdqa %xmm13,%xmm3
+ DB 102,65,15,254,223 ; paddd %xmm15,%xmm3
+ DB 102,72,15,58,22,217,1 ; pextrq $0x1,%xmm3,%rcx
+ DB 102,72,15,126,218 ; movq %xmm3,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,68,15,16,4,152 ; movss (%rax,%rbx,4),%xmm8
+ DB 102,68,15,58,33,4,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm8
+ DB 243,15,16,28,168 ; movss (%rax,%rbp,4),%xmm3
+ DB 102,68,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm8
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,28,136 ; movss (%rax,%rcx,4),%xmm3
+ DB 102,68,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm8
+ DB 102,68,15,126,233 ; movd %xmm13,%ecx
+ DB 102,69,15,58,22,239,1 ; pextrd $0x1,%xmm13,%r15d
+ DB 102,69,15,58,22,236,2 ; pextrd $0x2,%xmm13,%r12d
+ DB 102,69,15,58,22,237,3 ; pextrd $0x3,%xmm13,%r13d
+ DB 102,68,15,254,239 ; paddd %xmm7,%xmm13
+ DB 102,76,15,58,22,234,1 ; pextrq $0x1,%xmm13,%rdx
+ DB 102,76,15,126,235 ; movq %xmm13,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,68,15,16,44,168 ; movss (%rax,%rbp,4),%xmm13
+ DB 102,68,15,58,33,44,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm13
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,28,152 ; movss (%rax,%rbx,4),%xmm3
+ DB 102,68,15,58,33,235,32 ; insertps $0x20,%xmm3,%xmm13
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,28,144 ; movss (%rax,%rdx,4),%xmm3
+ DB 102,68,15,58,33,235,48 ; insertps $0x30,%xmm3,%xmm13
+ DB 243,66,15,16,28,176 ; movss (%rax,%r14,4),%xmm3
+ DB 102,66,15,58,33,28,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm3
+ DB 102,66,15,58,33,28,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm3
+ DB 102,66,15,58,33,28,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm3
+ DB 243,15,16,60,136 ; movss (%rax,%rcx,4),%xmm7
+ DB 102,66,15,58,33,60,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm7
+ DB 102,66,15,58,33,60,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm7
+ DB 102,66,15,58,33,60,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm7
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 65,15,89,254 ; mulps %xmm14,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 68,15,92,193 ; subps %xmm1,%xmm8
+ DB 69,15,89,198 ; mulps %xmm14,%xmm8
+ DB 68,15,88,193 ; addps %xmm1,%xmm8
+ DB 68,15,92,234 ; subps %xmm2,%xmm13
+ DB 69,15,89,238 ; mulps %xmm14,%xmm13
+ DB 68,15,88,234 ; addps %xmm2,%xmm13
+ DB 102,68,15,254,216 ; paddd %xmm0,%xmm11
+ DB 102,69,15,254,227 ; paddd %xmm11,%xmm12
+ DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 102,68,15,56,64,225 ; pmulld %xmm1,%xmm12
+ DB 102,65,15,111,196 ; movdqa %xmm12,%xmm0
+ DB 102,65,15,254,199 ; paddd %xmm15,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,28,168 ; movss (%rax,%rbp,4),%xmm3
+ DB 102,15,58,33,28,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm3
+ DB 243,15,16,4,152 ; movss (%rax,%rbx,4),%xmm0
+ DB 102,15,58,33,216,32 ; insertps $0x20,%xmm0,%xmm3
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,15,58,33,216,48 ; insertps $0x30,%xmm0,%xmm3
+ DB 102,69,15,126,230 ; movd %xmm12,%r14d
+ DB 102,69,15,58,22,225,1 ; pextrd $0x1,%xmm12,%r9d
+ DB 102,69,15,58,22,226,2 ; pextrd $0x2,%xmm12,%r10d
+ DB 102,69,15,58,22,227,3 ; pextrd $0x3,%xmm12,%r11d
+ DB 102,15,111,21,62,42,0,0 ; movdqa 0x2a3e(%rip),%xmm2 # 91d0 <_sk_clut_4D_sse41+0x286d>
+ DB 102,68,15,254,226 ; paddd %xmm2,%xmm12
+ DB 102,76,15,58,22,225,1 ; pextrq $0x1,%xmm12,%rcx
+ DB 102,76,15,126,226 ; movq %xmm12,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,44,168 ; movss (%rax,%rbp,4),%xmm5
+ DB 102,15,58,33,44,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm5
+ DB 243,15,16,4,152 ; movss (%rax,%rbx,4),%xmm0
+ DB 102,15,58,33,232,32 ; insertps $0x20,%xmm0,%xmm5
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
+ DB 102,68,15,254,222 ; paddd %xmm6,%xmm11
+ DB 102,68,15,56,64,217 ; pmulld %xmm1,%xmm11
+ DB 102,69,15,254,251 ; paddd %xmm11,%xmm15
+ DB 102,76,15,58,22,249,1 ; pextrq $0x1,%xmm15,%rcx
+ DB 102,76,15,126,250 ; movq %xmm15,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,15,16,12,152 ; movss (%rax,%rbx,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,200,32 ; insertps $0x20,%xmm0,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,15,58,33,200,48 ; insertps $0x30,%xmm0,%xmm1
+ DB 102,68,15,126,217 ; movd %xmm11,%ecx
+ DB 102,69,15,58,22,223,1 ; pextrd $0x1,%xmm11,%r15d
+ DB 102,69,15,58,22,220,2 ; pextrd $0x2,%xmm11,%r12d
+ DB 102,69,15,58,22,221,3 ; pextrd $0x3,%xmm11,%r13d
+ DB 102,68,15,254,218 ; paddd %xmm2,%xmm11
+ DB 102,76,15,58,22,218,1 ; pextrq $0x1,%xmm11,%rdx
+ DB 102,76,15,126,219 ; movq %xmm11,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,15,16,20,168 ; movss (%rax,%rbp,4),%xmm2
+ DB 102,15,58,33,20,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm2
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,4,152 ; movss (%rax,%rbx,4),%xmm0
+ DB 102,15,58,33,208,32 ; insertps $0x20,%xmm0,%xmm2
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,4,144 ; movss (%rax,%rdx,4),%xmm0
+ DB 102,15,58,33,208,48 ; insertps $0x30,%xmm0,%xmm2
+ DB 243,66,15,16,52,176 ; movss (%rax,%r14,4),%xmm6
+ DB 102,66,15,58,33,52,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm6
+ DB 102,66,15,58,33,52,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm6
+ DB 102,66,15,58,33,52,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm6
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,66,15,58,33,4,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm0
+ DB 102,66,15,58,33,4,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm0
+ DB 102,66,15,58,33,4,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm0
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 65,15,89,198 ; mulps %xmm14,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 65,15,89,206 ; mulps %xmm14,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,92,213 ; subps %xmm5,%xmm2
+ DB 65,15,89,214 ; mulps %xmm14,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,40,28,36 ; movaps (%rsp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,199 ; addps %xmm7,%xmm0
+ DB 65,15,92,200 ; subps %xmm8,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 65,15,88,200 ; addps %xmm8,%xmm1
+ DB 65,15,92,213 ; subps %xmm13,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 65,15,88,213 ; addps %xmm13,%xmm2
+ DB 15,91,92,36,80 ; cvtdq2ps 0x50(%rsp),%xmm3
+ DB 15,40,108,36,96 ; movaps 0x60(%rsp),%xmm5
+ DB 15,92,235 ; subps %xmm3,%xmm5
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 65,15,92,202 ; subps %xmm10,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 65,15,88,202 ; addps %xmm10,%xmm1
+ DB 65,15,92,209 ; subps %xmm9,%xmm2
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 65,15,88,209 ; addps %xmm9,%xmm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,137,194 ; mov %r8,%rdx
+ DB 72,139,76,36,16 ; mov 0x10(%rsp),%rcx
+ DB 76,139,68,36,24 ; mov 0x18(%rsp),%r8
+ DB 15,40,92,36,112 ; movaps 0x70(%rsp),%xmm3
+ DB 15,40,164,36,128,0,0,0 ; movaps 0x80(%rsp),%xmm4
+ DB 15,40,172,36,144,0,0,0 ; movaps 0x90(%rsp),%xmm5
+ DB 15,40,180,36,160,0,0,0 ; movaps 0xa0(%rsp),%xmm6
+ DB 15,40,188,36,176,0,0,0 ; movaps 0xb0(%rsp),%xmm7
+ DB 72,129,196,200,0,0,0 ; add $0xc8,%rsp
+ DB 91 ; pop %rbx
+ DB 65,92 ; pop %r12
+ DB 65,93 ; pop %r13
+ DB 65,94 ; pop %r14
+ DB 65,95 ; pop %r15
+ DB 93 ; pop %rbp
+ DB 255,224 ; jmpq *%rax
+
+PUBLIC _sk_clut_4D_sse41
+_sk_clut_4D_sse41 LABEL PROC
+ DB 85 ; push %rbp
+ DB 65,87 ; push %r15
+ DB 65,86 ; push %r14
+ DB 65,85 ; push %r13
+ DB 65,84 ; push %r12
+ DB 83 ; push %rbx
+ DB 72,129,236,24,1,0,0 ; sub $0x118,%rsp
+ DB 15,41,188,36,0,1,0,0 ; movaps %xmm7,0x100(%rsp)
+ DB 15,41,180,36,240,0,0,0 ; movaps %xmm6,0xf0(%rsp)
+ DB 15,41,172,36,224,0,0,0 ; movaps %xmm5,0xe0(%rsp)
+ DB 15,41,164,36,208,0,0,0 ; movaps %xmm4,0xd0(%rsp)
+ DB 76,137,68,36,120 ; mov %r8,0x78(%rsp)
+ DB 72,137,76,36,112 ; mov %rcx,0x70(%rsp)
+ DB 73,137,208 ; mov %rdx,%r8
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,20 ; mov 0x14(%rax),%r9d
+ DB 65,141,89,255 ; lea -0x1(%r9),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
+ DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
+ DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 243,15,91,236 ; cvttps2dq %xmm4,%xmm5
+ DB 102,15,127,172,36,128,0,0,0 ; movdqa %xmm5,0x80(%rsp)
+ DB 68,15,40,212 ; movaps %xmm4,%xmm10
+ DB 68,15,41,148,36,192,0,0,0 ; movaps %xmm10,0xc0(%rsp)
+ DB 102,65,15,110,225 ; movd %r9d,%xmm4
+ DB 102,15,112,244,0 ; pshufd $0x0,%xmm4,%xmm6
+ DB 102,15,127,180,36,160,0,0,0 ; movdqa %xmm6,0xa0(%rsp)
+ DB 68,139,72,16 ; mov 0x10(%rax),%r9d
+ DB 65,141,89,255 ; lea -0x1(%r9),%ebx
+ DB 102,15,110,219 ; movd %ebx,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
+ DB 15,89,218 ; mulps %xmm2,%xmm3
+ DB 243,68,15,91,227 ; cvttps2dq %xmm3,%xmm12
+ DB 102,68,15,127,100,36,64 ; movdqa %xmm12,0x40(%rsp)
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,41,124,36,96 ; movaps %xmm7,0x60(%rsp)
+ DB 102,68,15,56,64,230 ; pmulld %xmm6,%xmm12
+ DB 102,65,15,111,220 ; movdqa %xmm12,%xmm3
+ DB 102,15,254,221 ; paddd %xmm5,%xmm3
+ DB 102,65,15,110,209 ; movd %r9d,%xmm2
+ DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
+ DB 102,15,112,234,0 ; pshufd $0x0,%xmm2,%xmm5
+ DB 102,15,127,108,36,16 ; movdqa %xmm5,0x10(%rsp)
+ DB 68,139,72,12 ; mov 0xc(%rax),%r9d
+ DB 65,141,89,255 ; lea -0x1(%r9),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
+ DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
+ DB 68,15,91,244 ; cvtdq2ps %xmm4,%xmm14
+ DB 68,15,89,241 ; mulps %xmm1,%xmm14
+ DB 102,65,15,110,225 ; movd %r9d,%xmm4
+ DB 102,15,56,64,226 ; pmulld %xmm2,%xmm4
+ DB 139,88,8 ; mov 0x8(%rax),%ebx
+ DB 255,203 ; dec %ebx
+ DB 102,15,110,203 ; movd %ebx,%xmm1
+ DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
+ DB 68,15,91,249 ; cvtdq2ps %xmm1,%xmm15
+ DB 68,15,89,248 ; mulps %xmm0,%xmm15
+ DB 243,65,15,91,198 ; cvttps2dq %xmm14,%xmm0
+ DB 102,15,127,4,36 ; movdqa %xmm0,(%rsp)
+ DB 102,15,56,64,197 ; pmulld %xmm5,%xmm0
+ DB 102,15,127,68,36,80 ; movdqa %xmm0,0x50(%rsp)
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,254,203 ; paddd %xmm3,%xmm1
+ DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
+ DB 243,69,15,91,207 ; cvttps2dq %xmm15,%xmm9
+ DB 102,69,15,111,233 ; movdqa %xmm9,%xmm13
+ DB 102,68,15,56,64,236 ; pmulld %xmm4,%xmm13
+ DB 102,65,15,111,197 ; movdqa %xmm13,%xmm0
+ DB 102,68,15,127,108,36,48 ; movdqa %xmm13,0x30(%rsp)
+ DB 102,15,254,193 ; paddd %xmm1,%xmm0
+ DB 102,15,56,64,5,54,39,0,0 ; pmulld 0x2736(%rip),%xmm0 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,68,15,111,29,61,39,0,0 ; movdqa 0x273d(%rip),%xmm11 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,15,111,208 ; movdqa %xmm0,%xmm2
+ DB 102,65,15,254,211 ; paddd %xmm11,%xmm2
+ DB 102,73,15,58,22,209,1 ; pextrq $0x1,%xmm2,%r9
+ DB 102,72,15,126,211 ; movq %xmm2,%rbx
+ DB 72,139,0 ; mov (%rax),%rax
+ DB 65,137,218 ; mov %ebx,%r10d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 69,137,203 ; mov %r9d,%r11d
+ DB 243,66,15,16,20,144 ; movss (%rax,%r10,4),%xmm2
+ DB 102,15,58,33,20,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm2
+ DB 243,66,15,16,44,152 ; movss (%rax,%r11,4),%xmm5
+ DB 102,15,58,33,213,32 ; insertps $0x20,%xmm5,%xmm2
+ DB 73,193,233,32 ; shr $0x20,%r9
+ DB 243,66,15,16,44,136 ; movss (%rax,%r9,4),%xmm5
+ DB 102,15,58,33,213,48 ; insertps $0x30,%xmm5,%xmm2
+ DB 102,65,15,126,193 ; movd %xmm0,%r9d
+ DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
+ DB 102,65,15,58,22,195,2 ; pextrd $0x2,%xmm0,%r11d
+ DB 102,65,15,58,22,198,3 ; pextrd $0x3,%xmm0,%r14d
+ DB 102,68,15,111,5,223,38,0,0 ; movdqa 0x26df(%rip),%xmm8 # 9210 <_sk_clut_4D_sse41+0x28ad>
+ DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
+ DB 102,73,15,58,22,199,1 ; pextrq $0x1,%xmm0,%r15
+ DB 102,72,15,126,195 ; movq %xmm0,%rbx
+ DB 65,137,220 ; mov %ebx,%r12d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 69,137,253 ; mov %r15d,%r13d
+ DB 243,66,15,16,44,160 ; movss (%rax,%r12,4),%xmm5
+ DB 102,15,58,33,44,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm5
+ DB 243,66,15,16,4,168 ; movss (%rax,%r13,4),%xmm0
+ DB 102,15,58,33,232,32 ; insertps $0x20,%xmm0,%xmm5
+ DB 73,193,239,32 ; shr $0x20,%r15
+ DB 243,66,15,16,4,184 ; movss (%rax,%r15,4),%xmm0
+ DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
+ DB 15,40,53,100,38,0,0 ; movaps 0x2664(%rip),%xmm6 # 91e0 <_sk_clut_4D_sse41+0x287d>
+ DB 68,15,88,214 ; addps %xmm6,%xmm10
+ DB 68,15,41,148,36,176,0,0,0 ; movaps %xmm10,0xb0(%rsp)
+ DB 15,88,254 ; addps %xmm6,%xmm7
+ DB 15,41,188,36,144,0,0,0 ; movaps %xmm7,0x90(%rsp)
+ DB 65,15,40,198 ; movaps %xmm14,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 65,15,88,247 ; addps %xmm15,%xmm6
+ DB 243,15,91,246 ; cvttps2dq %xmm6,%xmm6
+ DB 102,15,56,64,244 ; pmulld %xmm4,%xmm6
+ DB 102,15,254,206 ; paddd %xmm6,%xmm1
+ DB 102,68,15,111,214 ; movdqa %xmm6,%xmm10
+ DB 102,68,15,127,84,36,32 ; movdqa %xmm10,0x20(%rsp)
+ DB 102,15,56,64,13,47,38,0,0 ; pmulld 0x262f(%rip),%xmm1 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,15,111,225 ; movdqa %xmm1,%xmm4
+ DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
+ DB 102,73,15,58,22,231,1 ; pextrq $0x1,%xmm4,%r15
+ DB 102,72,15,126,227 ; movq %xmm4,%rbx
+ DB 65,137,220 ; mov %ebx,%r12d
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 69,137,253 ; mov %r15d,%r13d
+ DB 243,66,15,16,52,160 ; movss (%rax,%r12,4),%xmm6
+ DB 102,15,58,33,52,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm6
+ DB 243,66,15,16,36,168 ; movss (%rax,%r13,4),%xmm4
+ DB 102,15,58,33,244,32 ; insertps $0x20,%xmm4,%xmm6
+ DB 73,193,239,32 ; shr $0x20,%r15
+ DB 243,66,15,16,36,184 ; movss (%rax,%r15,4),%xmm4
+ DB 102,15,58,33,244,48 ; insertps $0x30,%xmm4,%xmm6
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 102,65,15,58,22,207,1 ; pextrd $0x1,%xmm1,%r15d
+ DB 102,65,15,58,22,204,2 ; pextrd $0x2,%xmm1,%r12d
+ DB 102,65,15,58,22,205,3 ; pextrd $0x3,%xmm1,%r13d
+ DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
+ DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
+ DB 102,72,15,58,22,205,1 ; pextrq $0x1,%xmm1,%rbp
+ DB 102,72,15,126,201 ; movq %xmm1,%rcx
+ DB 137,202 ; mov %ecx,%edx
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,36,144 ; movss (%rax,%rdx,4),%xmm4
+ DB 102,15,58,33,36,136,16 ; insertps $0x10,(%rax,%rcx,4),%xmm4
+ DB 137,233 ; mov %ebp,%ecx
+ DB 243,15,16,12,136 ; movss (%rax,%rcx,4),%xmm1
+ DB 102,15,58,33,225,32 ; insertps $0x20,%xmm1,%xmm4
+ DB 72,193,237,32 ; shr $0x20,%rbp
+ DB 243,15,16,12,168 ; movss (%rax,%rbp,4),%xmm1
+ DB 102,15,58,33,225,48 ; insertps $0x30,%xmm1,%xmm4
+ DB 65,15,91,201 ; cvtdq2ps %xmm9,%xmm1
+ DB 68,15,92,249 ; subps %xmm1,%xmm15
+ DB 243,66,15,16,12,136 ; movss (%rax,%r9,4),%xmm1
+ DB 102,66,15,58,33,12,144,16 ; insertps $0x10,(%rax,%r10,4),%xmm1
+ DB 102,66,15,58,33,12,152,32 ; insertps $0x20,(%rax,%r11,4),%xmm1
+ DB 102,66,15,58,33,12,176,48 ; insertps $0x30,(%rax,%r14,4),%xmm1
+ DB 243,15,16,60,152 ; movss (%rax,%rbx,4),%xmm7
+ DB 102,66,15,58,33,60,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm7
+ DB 102,66,15,58,33,60,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm7
+ DB 102,66,15,58,33,60,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm7
+ DB 15,92,249 ; subps %xmm1,%xmm7
+ DB 65,15,89,255 ; mulps %xmm15,%xmm7
+ DB 15,88,249 ; addps %xmm1,%xmm7
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 65,15,89,247 ; mulps %xmm15,%xmm6
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 65,15,89,231 ; mulps %xmm15,%xmm4
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 243,15,91,192 ; cvttps2dq %xmm0,%xmm0
+ DB 102,15,56,64,68,36,16 ; pmulld 0x10(%rsp),%xmm0
+ DB 102,15,127,68,36,16 ; movdqa %xmm0,0x10(%rsp)
+ DB 102,15,254,216 ; paddd %xmm0,%xmm3
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
+ DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
+ DB 102,15,111,5,3,37,0,0 ; movdqa 0x2503(%rip),%xmm0 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,15,56,64,200 ; pmulld %xmm0,%xmm1
+ DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
+ DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,68,15,111,5,252,36,0,0 ; movdqa 0x24fc(%rip),%xmm8 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,4,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm0
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
+ DB 102,65,15,126,206 ; movd %xmm1,%r14d
+ DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d
+ DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d
+ DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d
+ DB 102,65,15,254,203 ; paddd %xmm11,%xmm1
+ DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
+ DB 102,72,15,126,202 ; movq %xmm1,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,12,168 ; movss (%rax,%rbp,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,202,32 ; insertps $0x20,%xmm2,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
+ DB 102,65,15,254,218 ; paddd %xmm10,%xmm3
+ DB 102,65,15,56,64,217 ; pmulld %xmm9,%xmm3
+ DB 102,15,111,211 ; movdqa %xmm3,%xmm2
+ DB 102,65,15,254,208 ; paddd %xmm8,%xmm2
+ DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
+ DB 102,72,15,126,210 ; movq %xmm2,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,68,15,16,20,152 ; movss (%rax,%rbx,4),%xmm10
+ DB 102,68,15,58,33,20,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm10
+ DB 243,15,16,20,168 ; movss (%rax,%rbp,4),%xmm2
+ DB 102,68,15,58,33,210,32 ; insertps $0x20,%xmm2,%xmm10
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,68,15,58,33,210,48 ; insertps $0x30,%xmm2,%xmm10
+ DB 102,15,126,217 ; movd %xmm3,%ecx
+ DB 102,65,15,58,22,223,1 ; pextrd $0x1,%xmm3,%r15d
+ DB 102,65,15,58,22,220,2 ; pextrd $0x2,%xmm3,%r12d
+ DB 102,65,15,58,22,221,3 ; pextrd $0x3,%xmm3,%r13d
+ DB 102,65,15,254,219 ; paddd %xmm11,%xmm3
+ DB 102,72,15,58,22,218,1 ; pextrq $0x1,%xmm3,%rdx
+ DB 102,72,15,126,219 ; movq %xmm3,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,68,15,16,12,168 ; movss (%rax,%rbp,4),%xmm9
+ DB 102,68,15,58,33,12,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm9
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,68,15,58,33,202,32 ; insertps $0x20,%xmm2,%xmm9
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,20,144 ; movss (%rax,%rdx,4),%xmm2
+ DB 102,68,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm9
+ DB 243,66,15,16,20,176 ; movss (%rax,%r14,4),%xmm2
+ DB 102,66,15,58,33,20,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm2
+ DB 102,66,15,58,33,20,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm2
+ DB 102,66,15,58,33,20,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm2
+ DB 243,68,15,16,4,136 ; movss (%rax,%rcx,4),%xmm8
+ DB 102,70,15,58,33,4,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm8
+ DB 102,70,15,58,33,4,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm8
+ DB 102,70,15,58,33,4,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm8
+ DB 68,15,92,194 ; subps %xmm2,%xmm8
+ DB 69,15,89,199 ; mulps %xmm15,%xmm8
+ DB 68,15,88,194 ; addps %xmm2,%xmm8
+ DB 68,15,92,208 ; subps %xmm0,%xmm10
+ DB 69,15,89,215 ; mulps %xmm15,%xmm10
+ DB 68,15,88,208 ; addps %xmm0,%xmm10
+ DB 68,15,92,201 ; subps %xmm1,%xmm9
+ DB 69,15,89,207 ; mulps %xmm15,%xmm9
+ DB 68,15,88,201 ; addps %xmm1,%xmm9
+ DB 15,91,4,36 ; cvtdq2ps (%rsp),%xmm0
+ DB 68,15,92,240 ; subps %xmm0,%xmm14
+ DB 68,15,41,52,36 ; movaps %xmm14,(%rsp)
+ DB 68,15,92,199 ; subps %xmm7,%xmm8
+ DB 69,15,89,198 ; mulps %xmm14,%xmm8
+ DB 68,15,88,199 ; addps %xmm7,%xmm8
+ DB 68,15,92,214 ; subps %xmm6,%xmm10
+ DB 69,15,89,214 ; mulps %xmm14,%xmm10
+ DB 68,15,88,214 ; addps %xmm6,%xmm10
+ DB 68,15,92,204 ; subps %xmm4,%xmm9
+ DB 69,15,89,206 ; mulps %xmm14,%xmm9
+ DB 68,15,88,204 ; addps %xmm4,%xmm9
+ DB 243,68,15,91,180,36,144,0,0,0 ; cvttps2dq 0x90(%rsp),%xmm14
+ DB 102,68,15,56,64,180,36,160,0,0,0 ; pmulld 0xa0(%rsp),%xmm14
+ DB 102,65,15,111,230 ; movdqa %xmm14,%xmm4
+ DB 102,15,254,164,36,128,0,0,0 ; paddd 0x80(%rsp),%xmm4
+ DB 102,15,111,196 ; movdqa %xmm4,%xmm0
+ DB 102,15,254,68,36,80 ; paddd 0x50(%rsp),%xmm0
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,68,15,111,108,36,48 ; movdqa 0x30(%rsp),%xmm13
+ DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
+ DB 102,15,111,45,208,34,0,0 ; movdqa 0x22d0(%rip),%xmm5 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,15,56,64,205 ; pmulld %xmm5,%xmm1
+ DB 102,15,126,201 ; movd %xmm1,%ecx
+ DB 102,15,58,22,202,1 ; pextrd $0x1,%xmm1,%edx
+ DB 102,15,58,22,205,2 ; pextrd $0x2,%xmm1,%ebp
+ DB 102,15,58,22,203,3 ; pextrd $0x3,%xmm1,%ebx
+ DB 243,15,16,52,136 ; movss (%rax,%rcx,4),%xmm6
+ DB 102,15,58,33,52,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm6
+ DB 102,15,58,33,52,168,32 ; insertps $0x20,(%rax,%rbp,4),%xmm6
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
+ DB 102,15,111,209 ; movdqa %xmm1,%xmm2
+ DB 102,15,111,29,155,34,0,0 ; movdqa 0x229b(%rip),%xmm3 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
+ DB 102,72,15,126,210 ; movq %xmm2,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,60,168 ; movss (%rax,%rbp,4),%xmm7
+ DB 102,15,58,33,60,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm7
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,250,32 ; insertps $0x20,%xmm2,%xmm7
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,15,58,33,250,48 ; insertps $0x30,%xmm2,%xmm7
+ DB 102,65,15,254,203 ; paddd %xmm11,%xmm1
+ DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
+ DB 102,72,15,126,202 ; movq %xmm1,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,12,168 ; movss (%rax,%rbp,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,202,32 ; insertps $0x20,%xmm2,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
+ DB 102,68,15,111,92,36,32 ; movdqa 0x20(%rsp),%xmm11
+ DB 102,65,15,254,195 ; paddd %xmm11,%xmm0
+ DB 102,15,56,64,197 ; pmulld %xmm5,%xmm0
+ DB 102,15,111,208 ; movdqa %xmm0,%xmm2
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
+ DB 102,72,15,126,210 ; movq %xmm2,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,28,168 ; movss (%rax,%rbp,4),%xmm3
+ DB 102,15,58,33,28,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm3
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,218,32 ; insertps $0x20,%xmm2,%xmm3
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,15,58,33,218,48 ; insertps $0x30,%xmm2,%xmm3
+ DB 102,65,15,126,193 ; movd %xmm0,%r9d
+ DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
+ DB 102,65,15,58,22,198,2 ; pextrd $0x2,%xmm0,%r14d
+ DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
+ DB 102,15,254,5,185,33,0,0 ; paddd 0x21b9(%rip),%xmm0 # 9210 <_sk_clut_4D_sse41+0x28ad>
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,15,16,44,152 ; movss (%rax,%rbx,4),%xmm5
+ DB 102,15,58,33,44,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm5
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,232,32 ; insertps $0x20,%xmm0,%xmm5
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
+ DB 243,66,15,16,20,136 ; movss (%rax,%r9,4),%xmm2
+ DB 102,66,15,58,33,20,144,16 ; insertps $0x10,(%rax,%r10,4),%xmm2
+ DB 102,66,15,58,33,20,176,32 ; insertps $0x20,(%rax,%r14,4),%xmm2
+ DB 102,66,15,58,33,20,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm2
+ DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 65,15,89,215 ; mulps %xmm15,%xmm2
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,92,223 ; subps %xmm7,%xmm3
+ DB 65,15,89,223 ; mulps %xmm15,%xmm3
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 65,15,89,239 ; mulps %xmm15,%xmm5
+ DB 15,88,233 ; addps %xmm1,%xmm5
+ DB 102,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm4
+ DB 102,15,111,196 ; movdqa %xmm4,%xmm0
+ DB 102,65,15,254,197 ; paddd %xmm13,%xmm0
+ DB 102,68,15,111,45,11,33,0,0 ; movdqa 0x210b(%rip),%xmm13 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,65,15,56,64,197 ; pmulld %xmm13,%xmm0
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,111,53,9,33,0,0 ; movdqa 0x2109(%rip),%xmm6 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,15,254,206 ; paddd %xmm6,%xmm1
+ DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
+ DB 102,72,15,126,202 ; movq %xmm1,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,12,168 ; movss (%rax,%rbp,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,52,152 ; movss (%rax,%rbx,4),%xmm6
+ DB 102,15,58,33,206,32 ; insertps $0x20,%xmm6,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,52,136 ; movss (%rax,%rcx,4),%xmm6
+ DB 102,15,58,33,206,48 ; insertps $0x30,%xmm6,%xmm1
+ DB 102,65,15,126,198 ; movd %xmm0,%r14d
+ DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
+ DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
+ DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
+ DB 102,15,111,61,185,32,0,0 ; movdqa 0x20b9(%rip),%xmm7 # 9210 <_sk_clut_4D_sse41+0x28ad>
+ DB 102,15,254,199 ; paddd %xmm7,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,4,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm0
+ DB 243,15,16,52,152 ; movss (%rax,%rbx,4),%xmm6
+ DB 102,15,58,33,198,32 ; insertps $0x20,%xmm6,%xmm0
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,52,136 ; movss (%rax,%rcx,4),%xmm6
+ DB 102,15,58,33,198,48 ; insertps $0x30,%xmm6,%xmm0
+ DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
+ DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,68,15,111,45,83,32,0,0 ; movdqa 0x2053(%rip),%xmm13 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,65,15,254,245 ; paddd %xmm13,%xmm6
+ DB 102,72,15,58,22,241,1 ; pextrq $0x1,%xmm6,%rcx
+ DB 102,72,15,126,242 ; movq %xmm6,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,68,15,16,28,152 ; movss (%rax,%rbx,4),%xmm11
+ DB 102,68,15,58,33,28,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm11
+ DB 243,15,16,52,168 ; movss (%rax,%rbp,4),%xmm6
+ DB 102,68,15,58,33,222,32 ; insertps $0x20,%xmm6,%xmm11
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,52,136 ; movss (%rax,%rcx,4),%xmm6
+ DB 102,68,15,58,33,222,48 ; insertps $0x30,%xmm6,%xmm11
+ DB 102,15,126,225 ; movd %xmm4,%ecx
+ DB 102,65,15,58,22,231,1 ; pextrd $0x1,%xmm4,%r15d
+ DB 102,65,15,58,22,228,2 ; pextrd $0x2,%xmm4,%r12d
+ DB 102,65,15,58,22,229,3 ; pextrd $0x3,%xmm4,%r13d
+ DB 102,15,254,231 ; paddd %xmm7,%xmm4
+ DB 102,72,15,58,22,226,1 ; pextrq $0x1,%xmm4,%rdx
+ DB 102,72,15,126,227 ; movq %xmm4,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,15,16,60,168 ; movss (%rax,%rbp,4),%xmm7
+ DB 102,15,58,33,60,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm7
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,36,152 ; movss (%rax,%rbx,4),%xmm4
+ DB 102,15,58,33,252,32 ; insertps $0x20,%xmm4,%xmm7
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,36,144 ; movss (%rax,%rdx,4),%xmm4
+ DB 102,15,58,33,252,48 ; insertps $0x30,%xmm4,%xmm7
+ DB 243,66,15,16,36,176 ; movss (%rax,%r14,4),%xmm4
+ DB 102,66,15,58,33,36,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm4
+ DB 102,66,15,58,33,36,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm4
+ DB 102,66,15,58,33,36,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm4
+ DB 243,15,16,52,136 ; movss (%rax,%rcx,4),%xmm6
+ DB 102,66,15,58,33,52,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm6
+ DB 102,66,15,58,33,52,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm6
+ DB 102,66,15,58,33,52,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm6
+ DB 15,92,244 ; subps %xmm4,%xmm6
+ DB 65,15,89,247 ; mulps %xmm15,%xmm6
+ DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 68,15,92,217 ; subps %xmm1,%xmm11
+ DB 69,15,89,223 ; mulps %xmm15,%xmm11
+ DB 68,15,88,217 ; addps %xmm1,%xmm11
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 65,15,89,255 ; mulps %xmm15,%xmm7
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 15,40,4,36 ; movaps (%rsp),%xmm0
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 68,15,92,219 ; subps %xmm3,%xmm11
+ DB 68,15,89,216 ; mulps %xmm0,%xmm11
+ DB 68,15,88,219 ; addps %xmm3,%xmm11
+ DB 15,92,253 ; subps %xmm5,%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,88,253 ; addps %xmm5,%xmm7
+ DB 15,91,68,36,64 ; cvtdq2ps 0x40(%rsp),%xmm0
+ DB 15,40,76,36,96 ; movaps 0x60(%rsp),%xmm1
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,41,76,36,96 ; movaps %xmm1,0x60(%rsp)
+ DB 65,15,92,240 ; subps %xmm8,%xmm6
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 65,15,88,240 ; addps %xmm8,%xmm6
+ DB 69,15,92,218 ; subps %xmm10,%xmm11
+ DB 68,15,89,217 ; mulps %xmm1,%xmm11
+ DB 69,15,88,218 ; addps %xmm10,%xmm11
+ DB 65,15,92,249 ; subps %xmm9,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 65,15,88,249 ; addps %xmm9,%xmm7
+ DB 243,15,91,132,36,176,0,0,0 ; cvttps2dq 0xb0(%rsp),%xmm0
+ DB 102,15,127,68,36,64 ; movdqa %xmm0,0x40(%rsp)
+ DB 102,68,15,254,224 ; paddd %xmm0,%xmm12
+ DB 102,15,111,84,36,80 ; movdqa 0x50(%rsp),%xmm2
+ DB 102,65,15,254,212 ; paddd %xmm12,%xmm2
+ DB 102,68,15,111,76,36,48 ; movdqa 0x30(%rsp),%xmm9
+ DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
+ DB 102,15,254,194 ; paddd %xmm2,%xmm0
+ DB 102,15,111,29,193,30,0,0 ; movdqa 0x1ec1(%rip),%xmm3 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,15,56,64,195 ; pmulld %xmm3,%xmm0
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,69,15,111,213 ; movdqa %xmm13,%xmm10
+ DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
+ DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
+ DB 102,72,15,126,202 ; movq %xmm1,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,36,168 ; movss (%rax,%rbp,4),%xmm4
+ DB 102,15,58,33,36,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm4
+ DB 243,15,16,12,152 ; movss (%rax,%rbx,4),%xmm1
+ DB 102,15,58,33,225,32 ; insertps $0x20,%xmm1,%xmm4
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,12,136 ; movss (%rax,%rcx,4),%xmm1
+ DB 102,15,58,33,225,48 ; insertps $0x30,%xmm1,%xmm4
+ DB 102,65,15,126,198 ; movd %xmm0,%r14d
+ DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
+ DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
+ DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
+ DB 102,15,111,45,114,30,0,0 ; movdqa 0x1e72(%rip),%xmm5 # 9210 <_sk_clut_4D_sse41+0x28ad>
+ DB 102,15,254,197 ; paddd %xmm5,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,4,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm0
+ DB 243,15,16,12,152 ; movss (%rax,%rbx,4),%xmm1
+ DB 102,15,58,33,193,32 ; insertps $0x20,%xmm1,%xmm0
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,12,136 ; movss (%rax,%rcx,4),%xmm1
+ DB 102,15,58,33,193,48 ; insertps $0x30,%xmm1,%xmm0
+ DB 102,68,15,111,68,36,32 ; movdqa 0x20(%rsp),%xmm8
+ DB 102,65,15,254,208 ; paddd %xmm8,%xmm2
+ DB 102,15,56,64,211 ; pmulld %xmm3,%xmm2
+ DB 102,68,15,111,235 ; movdqa %xmm3,%xmm13
+ DB 102,15,111,202 ; movdqa %xmm2,%xmm1
+ DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
+ DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
+ DB 102,72,15,126,202 ; movq %xmm1,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,15,16,12,152 ; movss (%rax,%rbx,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,28,168 ; movss (%rax,%rbp,4),%xmm3
+ DB 102,15,58,33,203,32 ; insertps $0x20,%xmm3,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,28,136 ; movss (%rax,%rcx,4),%xmm3
+ DB 102,15,58,33,203,48 ; insertps $0x30,%xmm3,%xmm1
+ DB 102,15,126,209 ; movd %xmm2,%ecx
+ DB 102,65,15,58,22,215,1 ; pextrd $0x1,%xmm2,%r15d
+ DB 102,65,15,58,22,212,2 ; pextrd $0x2,%xmm2,%r12d
+ DB 102,65,15,58,22,213,3 ; pextrd $0x3,%xmm2,%r13d
+ DB 102,15,254,213 ; paddd %xmm5,%xmm2
+ DB 102,72,15,58,22,210,1 ; pextrq $0x1,%xmm2,%rdx
+ DB 102,72,15,126,211 ; movq %xmm2,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,15,16,20,168 ; movss (%rax,%rbp,4),%xmm2
+ DB 102,15,58,33,20,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm2
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,28,152 ; movss (%rax,%rbx,4),%xmm3
+ DB 102,15,58,33,211,32 ; insertps $0x20,%xmm3,%xmm2
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,28,144 ; movss (%rax,%rdx,4),%xmm3
+ DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
+ DB 243,66,15,16,44,176 ; movss (%rax,%r14,4),%xmm5
+ DB 102,66,15,58,33,44,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm5
+ DB 102,66,15,58,33,44,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm5
+ DB 102,66,15,58,33,44,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm5
+ DB 243,15,16,28,136 ; movss (%rax,%rcx,4),%xmm3
+ DB 102,66,15,58,33,28,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm3
+ DB 102,66,15,58,33,28,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm3
+ DB 102,66,15,58,33,28,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm3
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 65,15,89,223 ; mulps %xmm15,%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 15,92,204 ; subps %xmm4,%xmm1
+ DB 65,15,89,207 ; mulps %xmm15,%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,92,208 ; subps %xmm0,%xmm2
+ DB 65,15,89,215 ; mulps %xmm15,%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 102,68,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm12
+ DB 102,65,15,111,228 ; movdqa %xmm12,%xmm4
+ DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
+ DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4
+ DB 102,15,111,196 ; movdqa %xmm4,%xmm0
+ DB 102,65,15,254,194 ; paddd %xmm10,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,4,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm0
+ DB 243,15,16,44,152 ; movss (%rax,%rbx,4),%xmm5
+ DB 102,15,58,33,197,32 ; insertps $0x20,%xmm5,%xmm0
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,44,136 ; movss (%rax,%rcx,4),%xmm5
+ DB 102,15,58,33,197,48 ; insertps $0x30,%xmm5,%xmm0
+ DB 102,65,15,126,230 ; movd %xmm4,%r14d
+ DB 102,65,15,58,22,225,1 ; pextrd $0x1,%xmm4,%r9d
+ DB 102,65,15,58,22,226,2 ; pextrd $0x2,%xmm4,%r10d
+ DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d
+ DB 102,68,15,111,13,174,28,0,0 ; movdqa 0x1cae(%rip),%xmm9 # 9210 <_sk_clut_4D_sse41+0x28ad>
+ DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
+ DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
+ DB 102,72,15,126,226 ; movq %xmm4,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,44,168 ; movss (%rax,%rbp,4),%xmm5
+ DB 102,15,58,33,44,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm5
+ DB 243,15,16,36,152 ; movss (%rax,%rbx,4),%xmm4
+ DB 102,15,58,33,236,32 ; insertps $0x20,%xmm4,%xmm5
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,36,136 ; movss (%rax,%rcx,4),%xmm4
+ DB 102,15,58,33,236,48 ; insertps $0x30,%xmm4,%xmm5
+ DB 102,69,15,254,224 ; paddd %xmm8,%xmm12
+ DB 102,69,15,56,64,229 ; pmulld %xmm13,%xmm12
+ DB 102,65,15,111,228 ; movdqa %xmm12,%xmm4
+ DB 102,65,15,254,226 ; paddd %xmm10,%xmm4
+ DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
+ DB 102,72,15,126,226 ; movq %xmm4,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,68,15,16,20,152 ; movss (%rax,%rbx,4),%xmm10
+ DB 102,68,15,58,33,20,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm10
+ DB 243,15,16,36,168 ; movss (%rax,%rbp,4),%xmm4
+ DB 102,68,15,58,33,212,32 ; insertps $0x20,%xmm4,%xmm10
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,36,136 ; movss (%rax,%rcx,4),%xmm4
+ DB 102,68,15,58,33,212,48 ; insertps $0x30,%xmm4,%xmm10
+ DB 102,68,15,126,225 ; movd %xmm12,%ecx
+ DB 102,69,15,58,22,231,1 ; pextrd $0x1,%xmm12,%r15d
+ DB 102,69,15,58,22,228,2 ; pextrd $0x2,%xmm12,%r12d
+ DB 102,69,15,58,22,229,3 ; pextrd $0x3,%xmm12,%r13d
+ DB 102,69,15,254,225 ; paddd %xmm9,%xmm12
+ DB 102,76,15,58,22,226,1 ; pextrq $0x1,%xmm12,%rdx
+ DB 102,76,15,126,227 ; movq %xmm12,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,68,15,16,4,168 ; movss (%rax,%rbp,4),%xmm8
+ DB 102,68,15,58,33,4,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm8
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,36,152 ; movss (%rax,%rbx,4),%xmm4
+ DB 102,68,15,58,33,196,32 ; insertps $0x20,%xmm4,%xmm8
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,36,144 ; movss (%rax,%rdx,4),%xmm4
+ DB 102,68,15,58,33,196,48 ; insertps $0x30,%xmm4,%xmm8
+ DB 243,70,15,16,36,176 ; movss (%rax,%r14,4),%xmm12
+ DB 102,70,15,58,33,36,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm12
+ DB 102,70,15,58,33,36,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm12
+ DB 102,70,15,58,33,36,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm12
+ DB 243,15,16,36,136 ; movss (%rax,%rcx,4),%xmm4
+ DB 102,66,15,58,33,36,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm4
+ DB 102,66,15,58,33,36,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm4
+ DB 102,66,15,58,33,36,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm4
+ DB 65,15,92,228 ; subps %xmm12,%xmm4
+ DB 65,15,89,231 ; mulps %xmm15,%xmm4
+ DB 65,15,88,228 ; addps %xmm12,%xmm4
+ DB 68,15,92,208 ; subps %xmm0,%xmm10
+ DB 69,15,89,215 ; mulps %xmm15,%xmm10
+ DB 68,15,88,208 ; addps %xmm0,%xmm10
+ DB 68,15,92,197 ; subps %xmm5,%xmm8
+ DB 69,15,89,199 ; mulps %xmm15,%xmm8
+ DB 68,15,88,197 ; addps %xmm5,%xmm8
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,40,4,36 ; movaps (%rsp),%xmm0
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,88,227 ; addps %xmm3,%xmm4
+ DB 68,15,92,209 ; subps %xmm1,%xmm10
+ DB 68,15,89,208 ; mulps %xmm0,%xmm10
+ DB 68,15,88,209 ; addps %xmm1,%xmm10
+ DB 68,15,92,194 ; subps %xmm2,%xmm8
+ DB 68,15,89,192 ; mulps %xmm0,%xmm8
+ DB 68,15,88,194 ; addps %xmm2,%xmm8
+ DB 102,68,15,254,116,36,64 ; paddd 0x40(%rsp),%xmm14
+ DB 102,15,111,68,36,80 ; movdqa 0x50(%rsp),%xmm0
+ DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,111,232 ; movdqa %xmm0,%xmm5
+ DB 102,15,254,76,36,48 ; paddd 0x30(%rsp),%xmm1
+ DB 102,65,15,56,64,205 ; pmulld %xmm13,%xmm1
+ DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,68,15,111,37,248,26,0,0 ; movdqa 0x1af8(%rip),%xmm12 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,4,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm0
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
+ DB 102,65,15,126,206 ; movd %xmm1,%r14d
+ DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d
+ DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d
+ DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d
+ DB 102,15,111,29,167,26,0,0 ; movdqa 0x1aa7(%rip),%xmm3 # 9210 <_sk_clut_4D_sse41+0x28ad>
+ DB 102,15,254,203 ; paddd %xmm3,%xmm1
+ DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
+ DB 102,72,15,126,202 ; movq %xmm1,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,12,168 ; movss (%rax,%rbp,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,15,58,33,202,32 ; insertps $0x20,%xmm2,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
+ DB 102,15,254,108,36,32 ; paddd 0x20(%rsp),%xmm5
+ DB 102,65,15,56,64,237 ; pmulld %xmm13,%xmm5
+ DB 102,15,111,213 ; movdqa %xmm5,%xmm2
+ DB 102,65,15,254,212 ; paddd %xmm12,%xmm2
+ DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
+ DB 102,72,15,126,210 ; movq %xmm2,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,68,15,16,12,152 ; movss (%rax,%rbx,4),%xmm9
+ DB 102,68,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm9
+ DB 243,15,16,20,168 ; movss (%rax,%rbp,4),%xmm2
+ DB 102,68,15,58,33,202,32 ; insertps $0x20,%xmm2,%xmm9
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,20,136 ; movss (%rax,%rcx,4),%xmm2
+ DB 102,68,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm9
+ DB 102,15,111,213 ; movdqa %xmm5,%xmm2
+ DB 102,15,126,209 ; movd %xmm2,%ecx
+ DB 102,65,15,58,22,215,1 ; pextrd $0x1,%xmm2,%r15d
+ DB 102,65,15,58,22,212,2 ; pextrd $0x2,%xmm2,%r12d
+ DB 102,65,15,58,22,213,3 ; pextrd $0x3,%xmm2,%r13d
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,15,111,235 ; movdqa %xmm3,%xmm5
+ DB 102,72,15,58,22,210,1 ; pextrq $0x1,%xmm2,%rdx
+ DB 102,72,15,126,211 ; movq %xmm2,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,68,15,16,36,168 ; movss (%rax,%rbp,4),%xmm12
+ DB 102,68,15,58,33,36,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm12
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
+ DB 102,68,15,58,33,226,32 ; insertps $0x20,%xmm2,%xmm12
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,20,144 ; movss (%rax,%rdx,4),%xmm2
+ DB 102,68,15,58,33,226,48 ; insertps $0x30,%xmm2,%xmm12
+ DB 243,66,15,16,20,176 ; movss (%rax,%r14,4),%xmm2
+ DB 102,66,15,58,33,20,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm2
+ DB 102,66,15,58,33,20,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm2
+ DB 102,66,15,58,33,20,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm2
+ DB 243,68,15,16,44,136 ; movss (%rax,%rcx,4),%xmm13
+ DB 102,70,15,58,33,44,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm13
+ DB 102,70,15,58,33,44,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm13
+ DB 102,70,15,58,33,44,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm13
+ DB 68,15,92,234 ; subps %xmm2,%xmm13
+ DB 69,15,89,239 ; mulps %xmm15,%xmm13
+ DB 68,15,88,234 ; addps %xmm2,%xmm13
+ DB 68,15,92,200 ; subps %xmm0,%xmm9
+ DB 69,15,89,207 ; mulps %xmm15,%xmm9
+ DB 68,15,88,200 ; addps %xmm0,%xmm9
+ DB 68,15,92,225 ; subps %xmm1,%xmm12
+ DB 69,15,89,231 ; mulps %xmm15,%xmm12
+ DB 68,15,88,225 ; addps %xmm1,%xmm12
+ DB 102,68,15,254,116,36,16 ; paddd 0x10(%rsp),%xmm14
+ DB 102,15,111,68,36,48 ; movdqa 0x30(%rsp),%xmm0
+ DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
+ DB 102,15,56,64,5,24,25,0,0 ; pmulld 0x1918(%rip),%xmm0 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,254,5,28,25,0,0 ; paddd 0x191c(%rip),%xmm0 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,28,168 ; movss (%rax,%rbp,4),%xmm3
+ DB 102,15,58,33,28,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm3
+ DB 243,15,16,4,152 ; movss (%rax,%rbx,4),%xmm0
+ DB 102,15,58,33,216,32 ; insertps $0x20,%xmm0,%xmm3
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,15,58,33,216,48 ; insertps $0x30,%xmm0,%xmm3
+ DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,65,15,126,198 ; movd %xmm0,%r14d
+ DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
+ DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
+ DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
+ DB 102,15,111,213 ; movdqa %xmm5,%xmm2
+ DB 102,15,254,194 ; paddd %xmm2,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,213 ; mov %edx,%ebp
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,203 ; mov %ecx,%ebx
+ DB 243,15,16,44,168 ; movss (%rax,%rbp,4),%xmm5
+ DB 102,15,58,33,44,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm5
+ DB 243,15,16,4,152 ; movss (%rax,%rbx,4),%xmm0
+ DB 102,15,58,33,232,32 ; insertps $0x20,%xmm0,%xmm5
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
+ DB 102,68,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm14
+ DB 102,68,15,56,64,53,97,24,0,0 ; pmulld 0x1861(%rip),%xmm14 # 91f0 <_sk_clut_4D_sse41+0x288d>
+ DB 102,15,111,5,105,24,0,0 ; movdqa 0x1869(%rip),%xmm0 # 9200 <_sk_clut_4D_sse41+0x289d>
+ DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
+ DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
+ DB 102,72,15,126,194 ; movq %xmm0,%rdx
+ DB 137,211 ; mov %edx,%ebx
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 137,205 ; mov %ecx,%ebp
+ DB 243,15,16,12,152 ; movss (%rax,%rbx,4),%xmm1
+ DB 102,15,58,33,12,144,16 ; insertps $0x10,(%rax,%rdx,4),%xmm1
+ DB 243,15,16,4,168 ; movss (%rax,%rbp,4),%xmm0
+ DB 102,15,58,33,200,32 ; insertps $0x20,%xmm0,%xmm1
+ DB 72,193,233,32 ; shr $0x20,%rcx
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,15,58,33,200,48 ; insertps $0x30,%xmm0,%xmm1
+ DB 102,68,15,126,241 ; movd %xmm14,%ecx
+ DB 102,69,15,58,22,247,1 ; pextrd $0x1,%xmm14,%r15d
+ DB 102,69,15,58,22,244,2 ; pextrd $0x2,%xmm14,%r12d
+ DB 102,69,15,58,22,245,3 ; pextrd $0x3,%xmm14,%r13d
+ DB 102,68,15,254,242 ; paddd %xmm2,%xmm14
+ DB 102,76,15,58,22,242,1 ; pextrq $0x1,%xmm14,%rdx
+ DB 102,76,15,126,243 ; movq %xmm14,%rbx
+ DB 137,221 ; mov %ebx,%ebp
+ DB 72,193,235,32 ; shr $0x20,%rbx
+ DB 243,15,16,20,168 ; movss (%rax,%rbp,4),%xmm2
+ DB 102,15,58,33,20,152,16 ; insertps $0x10,(%rax,%rbx,4),%xmm2
+ DB 137,211 ; mov %edx,%ebx
+ DB 243,15,16,4,152 ; movss (%rax,%rbx,4),%xmm0
+ DB 102,15,58,33,208,32 ; insertps $0x20,%xmm0,%xmm2
+ DB 72,193,234,32 ; shr $0x20,%rdx
+ DB 243,15,16,4,144 ; movss (%rax,%rdx,4),%xmm0
+ DB 102,15,58,33,208,48 ; insertps $0x30,%xmm0,%xmm2
+ DB 243,70,15,16,52,176 ; movss (%rax,%r14,4),%xmm14
+ DB 102,70,15,58,33,52,136,16 ; insertps $0x10,(%rax,%r9,4),%xmm14
+ DB 102,70,15,58,33,52,144,32 ; insertps $0x20,(%rax,%r10,4),%xmm14
+ DB 102,70,15,58,33,52,152,48 ; insertps $0x30,(%rax,%r11,4),%xmm14
+ DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
+ DB 102,66,15,58,33,4,184,16 ; insertps $0x10,(%rax,%r15,4),%xmm0
+ DB 102,66,15,58,33,4,160,32 ; insertps $0x20,(%rax,%r12,4),%xmm0
+ DB 102,66,15,58,33,4,168,48 ; insertps $0x30,(%rax,%r13,4),%xmm0
+ DB 65,15,92,198 ; subps %xmm14,%xmm0
+ DB 65,15,89,199 ; mulps %xmm15,%xmm0
+ DB 65,15,88,198 ; addps %xmm14,%xmm0
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 65,15,89,207 ; mulps %xmm15,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,92,213 ; subps %xmm5,%xmm2
+ DB 65,15,89,215 ; mulps %xmm15,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 65,15,92,197 ; subps %xmm13,%xmm0
+ DB 15,40,28,36 ; movaps (%rsp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 65,15,88,197 ; addps %xmm13,%xmm0
+ DB 65,15,92,201 ; subps %xmm9,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 65,15,88,201 ; addps %xmm9,%xmm1
+ DB 65,15,92,212 ; subps %xmm12,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 65,15,88,212 ; addps %xmm12,%xmm2
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,40,92,36,96 ; movaps 0x60(%rsp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 65,15,92,202 ; subps %xmm10,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 65,15,88,202 ; addps %xmm10,%xmm1
+ DB 65,15,92,208 ; subps %xmm8,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 65,15,88,208 ; addps %xmm8,%xmm2
+ DB 15,91,156,36,128,0,0,0 ; cvtdq2ps 0x80(%rsp),%xmm3
+ DB 15,40,164,36,192,0,0,0 ; movaps 0xc0(%rsp),%xmm4
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,215 ; addps %xmm7,%xmm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,40,29,20,23,0,0 ; movaps 0x1714(%rip),%xmm3 # 9220 <_sk_clut_4D_sse41+0x28bd>
+ DB 76,137,194 ; mov %r8,%rdx
+ DB 72,139,76,36,112 ; mov 0x70(%rsp),%rcx
+ DB 76,139,68,36,120 ; mov 0x78(%rsp),%r8
+ DB 15,40,164,36,208,0,0,0 ; movaps 0xd0(%rsp),%xmm4
+ DB 15,40,172,36,224,0,0,0 ; movaps 0xe0(%rsp),%xmm5
+ DB 15,40,180,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm6
+ DB 15,40,188,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm7
+ DB 72,129,196,24,1,0,0 ; add $0x118,%rsp
+ DB 91 ; pop %rbx
+ DB 65,92 ; pop %r12
+ DB 65,93 ; pop %r13
+ DB 65,94 ; pop %r14
+ DB 65,95 ; pop %r15
+ DB 93 ; pop %rbp
+ DB 255,224 ; jmpq *%rax
+
ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
@@ -20841,9 +25312,9 @@ ALIGN 16
DB 128,191,0,0,224,64,0 ; cmpb $0x0,0x40e00000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 624c <.literal16+0x1fc>
+ DB 224,64 ; loopne 7d4c <.literal16+0x1fc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 6250 <.literal16+0x200>
+ DB 224,64 ; loopne 7d50 <.literal16+0x200>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -20863,13 +25334,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6271 <.literal16+0x221>
+ DB 71,225,61 ; rex.RXB loope 7d71 <.literal16+0x221>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6275 <.literal16+0x225>
+ DB 71,225,61 ; rex.RXB loope 7d75 <.literal16+0x225>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6279 <.literal16+0x229>
+ DB 71,225,61 ; rex.RXB loope 7d79 <.literal16+0x229>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 627d <.literal16+0x22d>
+ DB 71,225,61 ; rex.RXB loope 7d7d <.literal16+0x22d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20894,13 +25365,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62b1 <.literal16+0x261>
+ DB 71,225,61 ; rex.RXB loope 7db1 <.literal16+0x261>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62b5 <.literal16+0x265>
+ DB 71,225,61 ; rex.RXB loope 7db5 <.literal16+0x265>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62b9 <.literal16+0x269>
+ DB 71,225,61 ; rex.RXB loope 7db9 <.literal16+0x269>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62bd <.literal16+0x26d>
+ DB 71,225,61 ; rex.RXB loope 7dbd <.literal16+0x26d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20925,13 +25396,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62f1 <.literal16+0x2a1>
+ DB 71,225,61 ; rex.RXB loope 7df1 <.literal16+0x2a1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62f5 <.literal16+0x2a5>
+ DB 71,225,61 ; rex.RXB loope 7df5 <.literal16+0x2a5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62f9 <.literal16+0x2a9>
+ DB 71,225,61 ; rex.RXB loope 7df9 <.literal16+0x2a9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 62fd <.literal16+0x2ad>
+ DB 71,225,61 ; rex.RXB loope 7dfd <.literal16+0x2ad>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20956,13 +25427,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6331 <.literal16+0x2e1>
+ DB 71,225,61 ; rex.RXB loope 7e31 <.literal16+0x2e1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6335 <.literal16+0x2e5>
+ DB 71,225,61 ; rex.RXB loope 7e35 <.literal16+0x2e5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6339 <.literal16+0x2e9>
+ DB 71,225,61 ; rex.RXB loope 7e39 <.literal16+0x2e9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 633d <.literal16+0x2ed>
+ DB 71,225,61 ; rex.RXB loope 7e3d <.literal16+0x2ed>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20979,10 +25450,10 @@ ALIGN 16
DB 0,1 ; add %al,(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006328 <_sk_callback_sse41+0xa0003ad>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a007e28 <_sk_clut_4D_sse41+0xa0014c5>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006330 <_sk_callback_sse41+0x30003b5>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3007e30 <_sk_clut_4D_sse41+0x30014cd>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -21001,11 +25472,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
DB 67,0,0 ; rex.XB add %al,(%r8)
- DB 127,67 ; jg 639b <.literal16+0x34b>
+ DB 127,67 ; jg 7e9b <.literal16+0x34b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 639f <.literal16+0x34f>
+ DB 127,67 ; jg 7e9f <.literal16+0x34f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 63a3 <.literal16+0x353>
+ DB 127,67 ; jg 7ea3 <.literal16+0x353>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -21292,13 +25763,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 65e9 <.literal16+0x599>
+ DB 224,7 ; loopne 80e9 <.literal16+0x599>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 65ed <.literal16+0x59d>
+ DB 224,7 ; loopne 80ed <.literal16+0x59d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 65f1 <.literal16+0x5a1>
+ DB 224,7 ; loopne 80f1 <.literal16+0x5a1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 65f5 <.literal16+0x5a5>
+ DB 224,7 ; loopne 80f5 <.literal16+0x5a5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -21332,10 +25803,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006638 <_sk_callback_sse41+0xa0006bd>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a008138 <_sk_clut_4D_sse41+0xa0017d5>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006640 <_sk_callback_sse41+0x30006c5>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3008140 <_sk_clut_4D_sse41+0x30017dd>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -21390,11 +25861,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 670b <.literal16+0x6bb>
+ DB 127,67 ; jg 820b <.literal16+0x6bb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 670f <.literal16+0x6bf>
+ DB 127,67 ; jg 820f <.literal16+0x6bf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6713 <.literal16+0x6c3>
+ DB 127,67 ; jg 8213 <.literal16+0x6c3>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -21409,16 +25880,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6704 <.literal16+0x6b4>
+ DB 127,0 ; jg 8204 <.literal16+0x6b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6708 <.literal16+0x6b8>
+ DB 127,0 ; jg 8208 <.literal16+0x6b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 670c <.literal16+0x6bc>
+ DB 127,0 ; jg 820c <.literal16+0x6bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6710 <.literal16+0x6c0>
+ DB 127,0 ; jg 8210 <.literal16+0x6c0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21427,7 +25898,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6795 <.literal16+0x745>
+ DB 119,115 ; ja 8295 <.literal16+0x745>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21438,7 +25909,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 66f9 <.literal16+0x6a9>
+ DB 117,191 ; jne 81f9 <.literal16+0x6a9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21450,7 +25921,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a73a <_sk_callback_sse41+0xffffffffe9a347bf>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3c23a <_sk_clut_4D_sse41+0xffffffffe9a358d7>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21505,16 +25976,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 67d4 <.literal16+0x784>
+ DB 127,0 ; jg 82d4 <.literal16+0x784>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 67d8 <.literal16+0x788>
+ DB 127,0 ; jg 82d8 <.literal16+0x788>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 67dc <.literal16+0x78c>
+ DB 127,0 ; jg 82dc <.literal16+0x78c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 67e0 <.literal16+0x790>
+ DB 127,0 ; jg 82e0 <.literal16+0x790>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21523,7 +25994,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6865 <.literal16+0x815>
+ DB 119,115 ; ja 8365 <.literal16+0x815>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21534,7 +26005,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 67c9 <.literal16+0x779>
+ DB 117,191 ; jne 82c9 <.literal16+0x779>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21546,7 +26017,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a80a <_sk_callback_sse41+0xffffffffe9a3488f>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3c30a <_sk_clut_4D_sse41+0xffffffffe9a359a7>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21601,16 +26072,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 68a4 <.literal16+0x854>
+ DB 127,0 ; jg 83a4 <.literal16+0x854>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 68a8 <.literal16+0x858>
+ DB 127,0 ; jg 83a8 <.literal16+0x858>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 68ac <.literal16+0x85c>
+ DB 127,0 ; jg 83ac <.literal16+0x85c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 68b0 <.literal16+0x860>
+ DB 127,0 ; jg 83b0 <.literal16+0x860>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21619,7 +26090,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6935 <.literal16+0x8e5>
+ DB 119,115 ; ja 8435 <.literal16+0x8e5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21630,7 +26101,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6899 <.literal16+0x849>
+ DB 117,191 ; jne 8399 <.literal16+0x849>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21642,7 +26113,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a8da <_sk_callback_sse41+0xffffffffe9a3495f>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3c3da <_sk_clut_4D_sse41+0xffffffffe9a35a77>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21697,16 +26168,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6974 <.literal16+0x924>
+ DB 127,0 ; jg 8474 <.literal16+0x924>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6978 <.literal16+0x928>
+ DB 127,0 ; jg 8478 <.literal16+0x928>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 697c <.literal16+0x92c>
+ DB 127,0 ; jg 847c <.literal16+0x92c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6980 <.literal16+0x930>
+ DB 127,0 ; jg 8480 <.literal16+0x930>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21715,7 +26186,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6a05 <.literal16+0x9b5>
+ DB 119,115 ; ja 8505 <.literal16+0x9b5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21726,7 +26197,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6969 <.literal16+0x919>
+ DB 117,191 ; jne 8469 <.literal16+0x919>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21738,7 +26209,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a9aa <_sk_callback_sse41+0xffffffffe9a34a2f>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3c4aa <_sk_clut_4D_sse41+0xffffffffe9a35b47>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21793,16 +26264,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6a44 <.literal16+0x9f4>
+ DB 127,0 ; jg 8544 <.literal16+0x9f4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6a48 <.literal16+0x9f8>
+ DB 127,0 ; jg 8548 <.literal16+0x9f8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6a4c <.literal16+0x9fc>
+ DB 127,0 ; jg 854c <.literal16+0x9fc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6a50 <.literal16+0xa00>
+ DB 127,0 ; jg 8550 <.literal16+0xa00>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21811,7 +26282,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6ad5 <.literal16+0xa85>
+ DB 119,115 ; ja 85d5 <.literal16+0xa85>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21822,7 +26293,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6a39 <.literal16+0x9e9>
+ DB 117,191 ; jne 8539 <.literal16+0x9e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21834,7 +26305,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3aa7a <_sk_callback_sse41+0xffffffffe9a34aff>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3c57a <_sk_clut_4D_sse41+0xffffffffe9a35c17>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21879,13 +26350,13 @@ ALIGN 16
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 6b47 <.literal16+0xaf7>
+ DB 127,67 ; jg 8647 <.literal16+0xaf7>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6b4b <.literal16+0xafb>
+ DB 127,67 ; jg 864b <.literal16+0xafb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6b4f <.literal16+0xaff>
+ DB 127,67 ; jg 864f <.literal16+0xaff>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6b53 <.literal16+0xb03>
+ DB 127,67 ; jg 8653 <.literal16+0xb03>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -21932,16 +26403,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6bd3 <.literal16+0xb83>
+ DB 118,63 ; jbe 86d3 <.literal16+0xb83>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6bd7 <.literal16+0xb87>
+ DB 118,63 ; jbe 86d7 <.literal16+0xb87>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6bdb <.literal16+0xb8b>
+ DB 118,63 ; jbe 86db <.literal16+0xb8b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6bdf <.literal16+0xb8f>
+ DB 118,63 ; jbe 86df <.literal16+0xb8f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -21970,11 +26441,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6c4b <.literal16+0xbfb>
+ DB 127,67 ; jg 874b <.literal16+0xbfb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6c4f <.literal16+0xbff>
+ DB 127,67 ; jg 874f <.literal16+0xbff>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6c53 <.literal16+0xc03>
+ DB 127,67 ; jg 8753 <.literal16+0xc03>
DB 0,4,0 ; add %al,(%rax,%rax,1)
DB 0,0 ; add %al,(%rax)
DB 0,0 ; add %al,(%rax)
@@ -22034,13 +26505,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6cc9 <.literal16+0xc79>
+ DB 224,7 ; loopne 87c9 <.literal16+0xc79>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ccd <.literal16+0xc7d>
+ DB 224,7 ; loopne 87cd <.literal16+0xc7d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6cd1 <.literal16+0xc81>
+ DB 224,7 ; loopne 87d1 <.literal16+0xc81>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6cd5 <.literal16+0xc85>
+ DB 224,7 ; loopne 87d5 <.literal16+0xc85>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -22086,13 +26557,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6d39 <.literal16+0xce9>
+ DB 224,7 ; loopne 8839 <.literal16+0xce9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6d3d <.literal16+0xced>
+ DB 224,7 ; loopne 883d <.literal16+0xced>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6d41 <.literal16+0xcf1>
+ DB 224,7 ; loopne 8841 <.literal16+0xcf1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6d45 <.literal16+0xcf5>
+ DB 224,7 ; loopne 8845 <.literal16+0xcf5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -22138,13 +26609,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6da9 <.literal16+0xd59>
+ DB 224,7 ; loopne 88a9 <.literal16+0xd59>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6dad <.literal16+0xd5d>
+ DB 224,7 ; loopne 88ad <.literal16+0xd5d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6db1 <.literal16+0xd61>
+ DB 224,7 ; loopne 88b1 <.literal16+0xd61>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6db5 <.literal16+0xd65>
+ DB 224,7 ; loopne 88b5 <.literal16+0xd65>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -22182,13 +26653,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 6e46 <.literal16+0xdf6>
+ DB 124,66 ; jl 8946 <.literal16+0xdf6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 6e4a <.literal16+0xdfa>
+ DB 124,66 ; jl 894a <.literal16+0xdfa>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 6e4e <.literal16+0xdfe>
+ DB 124,66 ; jl 894e <.literal16+0xdfe>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 6e52 <.literal16+0xe02>
+ DB 124,66 ; jl 8952 <.literal16+0xe02>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -22322,13 +26793,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6fd5 <.literal16+0xf85>
+ DB 112,65 ; jo 8ad5 <.literal16+0xf85>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6fd9 <.literal16+0xf89>
+ DB 112,65 ; jo 8ad9 <.literal16+0xf89>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6fdd <.literal16+0xf8d>
+ DB 112,65 ; jo 8add <.literal16+0xf8d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6fe1 <.literal16+0xf91>
+ DB 112,65 ; jo 8ae1 <.literal16+0xf91>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -22343,7 +26814,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006fd0 <_sk_callback_sse41+0x3001055>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3008ad0 <_sk_clut_4D_sse41+0x300216d>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22370,7 +26841,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3007010 <_sk_callback_sse41+0x3001095>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3008b10 <_sk_clut_4D_sse41+0x30021ad>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22397,7 +26868,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3007050 <_sk_callback_sse41+0x30010d5>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3008b50 <_sk_clut_4D_sse41+0x30021ed>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22412,11 +26883,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 70ab <.literal16+0x105b>
+ DB 127,67 ; jg 8bab <.literal16+0x105b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 70af <.literal16+0x105f>
+ DB 127,67 ; jg 8baf <.literal16+0x105f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 70b3 <.literal16+0x1063>
+ DB 127,67 ; jg 8bb3 <.literal16+0x1063>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -22431,7 +26902,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30070a0 <_sk_callback_sse41+0x3001125>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3008ba0 <_sk_clut_4D_sse41+0x300223d>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22458,7 +26929,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30070e0 <_sk_callback_sse41+0x3001165>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3008be0 <_sk_clut_4D_sse41+0x300227d>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22485,7 +26956,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3007120 <_sk_callback_sse41+0x30011a5>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3008c20 <_sk_clut_4D_sse41+0x30022bd>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22500,11 +26971,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 717b <.literal16+0x112b>
+ DB 127,67 ; jg 8c7b <.literal16+0x112b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 717f <.literal16+0x112f>
+ DB 127,67 ; jg 8c7f <.literal16+0x112f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 7183 <.literal16+0x1133>
+ DB 127,67 ; jg 8c83 <.literal16+0x1133>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -22599,13 +27070,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 727b <.literal16+0x122b>
+ DB 127,71 ; jg 8d7b <.literal16+0x122b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 727f <.literal16+0x122f>
+ DB 127,71 ; jg 8d7f <.literal16+0x122f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7283 <.literal16+0x1233>
+ DB 127,71 ; jg 8d83 <.literal16+0x1233>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7287 <.literal16+0x1237>
+ DB 127,71 ; jg 8d87 <.literal16+0x1237>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -22651,10 +27122,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc083ba <_sk_callback_sse41+0x2dc0243f>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc09eba <_sk_clut_4D_sse41+0x2dc03557>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 72ec <.literal16+0x129c>
+ DB 120,57 ; js 8dec <.literal16+0x129c>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -22835,11 +27306,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 74c2 <.literal16+0x1472>
+ DB 62,114,28 ; jb,pt 8fc2 <.literal16+0x1472>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 74c6 <.literal16+0x1476>
+ DB 62,114,28 ; jb,pt 8fc6 <.literal16+0x1476>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 74ca <.literal16+0x147a>
+ DB 62,114,28 ; jb,pt 8fca <.literal16+0x147a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -22883,7 +27354,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640355 <_sk_callback_sse41+0x3d63a3da>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d641e55 <_sk_clut_4D_sse41+0x3d63b4f2>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -22909,7 +27380,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640395 <_sk_callback_sse41+0x3d63a41a>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d641e95 <_sk_clut_4D_sse41+0x3d63b532>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -22918,13 +27389,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 758e <.literal16+0x153e>
+ DB 114,28 ; jb 908e <.literal16+0x153e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7592 <.literal16+0x1542>
+ DB 62,114,28 ; jb,pt 9092 <.literal16+0x1542>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7596 <.literal16+0x1546>
+ DB 62,114,28 ; jb,pt 9096 <.literal16+0x1546>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 759a <.literal16+0x154a>
+ DB 62,114,28 ; jb,pt 909a <.literal16+0x154a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -22945,11 +27416,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 75d2 <.literal16+0x1582>
+ DB 62,114,28 ; jb,pt 90d2 <.literal16+0x1582>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 75d6 <.literal16+0x1586>
+ DB 62,114,28 ; jb,pt 90d6 <.literal16+0x1586>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 75da <.literal16+0x158a>
+ DB 62,114,28 ; jb,pt 90da <.literal16+0x158a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -22993,7 +27464,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640465 <_sk_callback_sse41+0x3d63a4ea>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d641f65 <_sk_clut_4D_sse41+0x3d63b602>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -23019,7 +27490,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6404a5 <_sk_callback_sse41+0x3d63a52a>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d641fa5 <_sk_clut_4D_sse41+0x3d63b642>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -23028,13 +27499,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 769e <.literal16+0x164e>
+ DB 114,28 ; jb 919e <.literal16+0x164e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 76a2 <_sk_callback_sse41+0x1727>
+ DB 62,114,28 ; jb,pt 91a2 <.literal16+0x1652>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 76a6 <_sk_callback_sse41+0x172b>
+ DB 62,114,28 ; jb,pt 91a6 <.literal16+0x1656>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 76aa <_sk_callback_sse41+0x172f>
+ DB 62,114,28 ; jb,pt 91aa <.literal16+0x165a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -23044,6 +27515,77 @@ ALIGN 16
DB 170 ; stos %al,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
DB 190,171,170,170,190 ; mov $0xbeaaaaab,%esi
+ DB 114,249 ; jb 919b <.literal16+0x164b>
+ DB 127,63 ; jg 91e3 <.literal16+0x1693>
+ DB 114,249 ; jb 919f <.literal16+0x164f>
+ DB 127,63 ; jg 91e7 <.literal16+0x1697>
+ DB 114,249 ; jb 91a3 <.literal16+0x1653>
+ DB 127,63 ; jg 91eb <.literal16+0x169b>
+ DB 114,249 ; jb 91a7 <.literal16+0x1657>
+ DB 127,63 ; jg 91ef <.literal16+0x169f>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 114,249 ; jb 91db <.literal16+0x168b>
+ DB 127,63 ; jg 9223 <.literal16+0x16d3>
+ DB 114,249 ; jb 91df <.literal16+0x168f>
+ DB 127,63 ; jg 9227 <.literal16+0x16d7>
+ DB 114,249 ; jb 91e3 <.literal16+0x1693>
+ DB 127,63 ; jg 922b <.literal16+0x16db>
+ DB 114,249 ; jb 91e7 <.literal16+0x1697>
+ DB 127,63 ; jg 922f <.literal16+0x16df>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,0 ; cmpb $0x0,(%rdi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
+ DB 63 ; (bad)
+ DB 0,0 ; add %al,(%rax)
+ DB 128 ; .byte 0x80
+ DB 63 ; (bad)
ALIGN 4
DB 0,0 ; add %al,(%rax)
@@ -23142,7 +27684,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,251,99,0,0 ; movaps 0x63fb(%rip),%xmm2 # 6550 <_sk_callback_sse2+0xce>
+ DB 15,40,21,43,133,0,0 ; movaps 0x852b(%rip),%xmm2 # 8680 <_sk_clut_4D_sse2+0x1623>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -23151,7 +27693,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,234,99,0,0 ; movaps 0x63ea(%rip),%xmm2 # 6560 <_sk_callback_sse2+0xde>
+ DB 15,40,21,26,133,0,0 ; movaps 0x851a(%rip),%xmm2 # 8690 <_sk_clut_4D_sse2+0x1633>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -23169,14 +27711,14 @@ _sk_dither_sse2 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,184,99,0,0 ; movdqa 0x63b8(%rip),%xmm10 # 6570 <_sk_callback_sse2+0xee>
+ DB 102,68,15,111,21,232,132,0,0 ; movdqa 0x84e8(%rip),%xmm10 # 86a0 <_sk_clut_4D_sse2+0x1643>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,164,99,0,0 ; movdqa 0x63a4(%rip),%xmm12 # 6580 <_sk_callback_sse2+0xfe>
- DB 102,68,15,111,45,171,99,0,0 ; movdqa 0x63ab(%rip),%xmm13 # 6590 <_sk_callback_sse2+0x10e>
+ DB 102,68,15,111,37,212,132,0,0 ; movdqa 0x84d4(%rip),%xmm12 # 86b0 <_sk_clut_4D_sse2+0x1653>
+ DB 102,68,15,111,45,219,132,0,0 ; movdqa 0x84db(%rip),%xmm13 # 86c0 <_sk_clut_4D_sse2+0x1663>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -23192,8 +27734,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,102,99,0,0 ; mulps 0x6366(%rip),%xmm8 # 65a0 <_sk_callback_sse2+0x11e>
- DB 68,15,88,5,110,99,0,0 ; addps 0x636e(%rip),%xmm8 # 65b0 <_sk_callback_sse2+0x12e>
+ DB 68,15,89,5,150,132,0,0 ; mulps 0x8496(%rip),%xmm8 # 86d0 <_sk_clut_4D_sse2+0x1673>
+ DB 68,15,88,5,158,132,0,0 ; addps 0x849e(%rip),%xmm8 # 86e0 <_sk_clut_4D_sse2+0x1683>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -23231,7 +27773,7 @@ _sk_uniform_color_sse2 LABEL PROC
PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,4,99,0,0 ; movaps 0x6304(%rip),%xmm3 # 65c0 <_sk_callback_sse2+0x13e>
+ DB 15,40,29,52,132,0,0 ; movaps 0x8434(%rip),%xmm3 # 86f0 <_sk_clut_4D_sse2+0x1693>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -23240,7 +27782,7 @@ _sk_black_color_sse2 LABEL PROC
PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,0,99,0,0 ; movaps 0x6300(%rip),%xmm0 # 65d0 <_sk_callback_sse2+0x14e>
+ DB 15,40,5,48,132,0,0 ; movaps 0x8430(%rip),%xmm0 # 8700 <_sk_clut_4D_sse2+0x16a3>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -23278,7 +27820,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,192,98,0,0 ; movaps 0x62c0(%rip),%xmm8 # 65e0 <_sk_callback_sse2+0x15e>
+ DB 68,15,40,5,240,131,0,0 ; movaps 0x83f0(%rip),%xmm8 # 8710 <_sk_clut_4D_sse2+0x16b3>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -23301,7 +27843,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,131,98,0,0 ; movaps 0x6283(%rip),%xmm9 # 65f0 <_sk_callback_sse2+0x16e>
+ DB 68,15,40,13,179,131,0,0 ; movaps 0x83b3(%rip),%xmm9 # 8720 <_sk_clut_4D_sse2+0x16c3>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -23342,7 +27884,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,39,98,0,0 ; movaps 0x6227(%rip),%xmm8 # 6600 <_sk_callback_sse2+0x17e>
+ DB 68,15,40,5,87,131,0,0 ; movaps 0x8357(%rip),%xmm8 # 8730 <_sk_clut_4D_sse2+0x16d3>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -23353,7 +27895,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,23,98,0,0 ; movaps 0x6217(%rip),%xmm8 # 6610 <_sk_callback_sse2+0x18e>
+ DB 68,15,40,5,71,131,0,0 ; movaps 0x8347(%rip),%xmm8 # 8740 <_sk_clut_4D_sse2+0x16e3>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -23368,7 +27910,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,250,97,0,0 ; movaps 0x61fa(%rip),%xmm8 # 6620 <_sk_callback_sse2+0x19e>
+ DB 68,15,40,5,42,131,0,0 ; movaps 0x832a(%rip),%xmm8 # 8750 <_sk_clut_4D_sse2+0x16f3>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -23386,7 +27928,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,206,97,0,0 ; movaps 0x61ce(%rip),%xmm8 # 6630 <_sk_callback_sse2+0x1ae>
+ DB 68,15,40,5,254,130,0,0 ; movaps 0x82fe(%rip),%xmm8 # 8760 <_sk_clut_4D_sse2+0x1703>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -23410,7 +27952,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,162,97,0,0 ; movaps 0x61a2(%rip),%xmm8 # 6640 <_sk_callback_sse2+0x1be>
+ DB 68,15,40,5,210,130,0,0 ; movaps 0x82d2(%rip),%xmm8 # 8770 <_sk_clut_4D_sse2+0x1713>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -23479,7 +28021,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,215,96,0,0 ; movaps 0x60d7(%rip),%xmm3 # 6650 <_sk_callback_sse2+0x1ce>
+ DB 15,40,29,7,130,0,0 ; movaps 0x8207(%rip),%xmm3 # 8780 <_sk_clut_4D_sse2+0x1723>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -23525,7 +28067,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,66,96,0,0 ; movaps 0x6042(%rip),%xmm2 # 6660 <_sk_callback_sse2+0x1de>
+ DB 15,40,21,114,129,0,0 ; movaps 0x8172(%rip),%xmm2 # 8790 <_sk_clut_4D_sse2+0x1733>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23557,7 +28099,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,231,95,0,0 ; movaps 0x5fe7(%rip),%xmm2 # 6670 <_sk_callback_sse2+0x1ee>
+ DB 15,40,21,23,129,0,0 ; movaps 0x8117(%rip),%xmm2 # 87a0 <_sk_clut_4D_sse2+0x1743>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23592,7 +28134,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,129,95,0,0 ; movaps 0x5f81(%rip),%xmm2 # 6680 <_sk_callback_sse2+0x1fe>
+ DB 15,40,21,177,128,0,0 ; movaps 0x80b1(%rip),%xmm2 # 87b0 <_sk_clut_4D_sse2+0x1753>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23618,7 +28160,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,65,95,0,0 ; movaps 0x5f41(%rip),%xmm2 # 6690 <_sk_callback_sse2+0x20e>
+ DB 15,40,21,113,128,0,0 ; movaps 0x8071(%rip),%xmm2 # 87c0 <_sk_clut_4D_sse2+0x1763>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23629,7 +28171,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,52,95,0,0 ; movaps 0x5f34(%rip),%xmm10 # 66a0 <_sk_callback_sse2+0x21e>
+ DB 68,15,40,21,100,128,0,0 ; movaps 0x8064(%rip),%xmm10 # 87d0 <_sk_clut_4D_sse2+0x1773>
DB 69,15,40,202 ; movaps %xmm10,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,217 ; movaps %xmm9,%xmm11
@@ -23721,7 +28263,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,234,93,0,0 ; movaps 0x5dea(%rip),%xmm10 # 66b0 <_sk_callback_sse2+0x22e>
+ DB 68,15,40,21,26,127,0,0 ; movaps 0x7f1a(%rip),%xmm10 # 87e0 <_sk_clut_4D_sse2+0x1783>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -23814,7 +28356,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,156,92,0,0 ; movaps 0x5c9c(%rip),%xmm11 # 66c0 <_sk_callback_sse2+0x23e>
+ DB 68,15,40,29,204,125,0,0 ; movaps 0x7dcc(%rip),%xmm11 # 87f0 <_sk_clut_4D_sse2+0x1793>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -23901,7 +28443,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,103,91,0,0 ; movaps 0x5b67(%rip),%xmm9 # 66d0 <_sk_callback_sse2+0x24e>
+ DB 68,15,40,13,151,124,0,0 ; movaps 0x7c97(%rip),%xmm9 # 8800 <_sk_clut_4D_sse2+0x17a3>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -23991,7 +28533,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,33,90,0,0 ; movaps 0x5a21(%rip),%xmm9 # 66e0 <_sk_callback_sse2+0x25e>
+ DB 68,15,40,13,81,123,0,0 ; movaps 0x7b51(%rip),%xmm9 # 8810 <_sk_clut_4D_sse2+0x17b3>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24004,10 +28546,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,251,89,0,0 ; movaps 0x59fb(%rip),%xmm14 # 66f0 <_sk_callback_sse2+0x26e>
+ DB 68,15,40,53,43,123,0,0 ; movaps 0x7b2b(%rip),%xmm14 # 8820 <_sk_clut_4D_sse2+0x17c3>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,251,89,0,0 ; movaps 0x59fb(%rip),%xmm10 # 6700 <_sk_callback_sse2+0x27e>
+ DB 68,15,40,21,43,123,0,0 ; movaps 0x7b2b(%rip),%xmm10 # 8830 <_sk_clut_4D_sse2+0x17d3>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -24152,7 +28694,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,55,88,0,0 ; movaps 0x5837(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x2be>
+ DB 68,15,40,5,103,121,0,0 ; movaps 0x7967(%rip),%xmm8 # 8870 <_sk_clut_4D_sse2+0x1813>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -24200,12 +28742,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,68,87,0,0 ; movaps 0x5744(%rip),%xmm15 # 6710 <_sk_callback_sse2+0x28e>
+ DB 68,15,40,61,116,120,0,0 ; movaps 0x7874(%rip),%xmm15 # 8840 <_sk_clut_4D_sse2+0x17e3>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,73,87,0,0 ; movaps 0x5749(%rip),%xmm0 # 6720 <_sk_callback_sse2+0x29e>
+ DB 15,40,5,121,120,0,0 ; movaps 0x7879(%rip),%xmm0 # 8850 <_sk_clut_4D_sse2+0x17f3>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,75,87,0,0 ; movaps 0x574b(%rip),%xmm14 # 6730 <_sk_callback_sse2+0x2ae>
+ DB 68,15,40,53,123,120,0,0 ; movaps 0x787b(%rip),%xmm14 # 8860 <_sk_clut_4D_sse2+0x1803>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -24383,14 +28925,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,216,84,0,0 ; movaps 0x54d8(%rip),%xmm8 # 6750 <_sk_callback_sse2+0x2ce>
+ DB 68,15,40,5,8,118,0,0 ; movaps 0x7608(%rip),%xmm8 # 8880 <_sk_clut_4D_sse2+0x1823>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,218,84,0,0 ; movaps 0x54da(%rip),%xmm1 # 6760 <_sk_callback_sse2+0x2de>
+ DB 15,40,13,10,118,0,0 ; movaps 0x760a(%rip),%xmm1 # 8890 <_sk_clut_4D_sse2+0x1833>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,217,84,0,0 ; movaps 0x54d9(%rip),%xmm12 # 6770 <_sk_callback_sse2+0x2ee>
+ DB 68,15,40,37,9,118,0,0 ; movaps 0x7609(%rip),%xmm12 # 88a0 <_sk_clut_4D_sse2+0x1843>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -24435,7 +28977,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,62,84,0,0 ; movaps 0x543e(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x2fe>
+ DB 68,15,40,5,110,117,0,0 ; movaps 0x756e(%rip),%xmm8 # 88b0 <_sk_clut_4D_sse2+0x1853>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -24536,14 +29078,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,214,82,0,0 ; movaps 0x52d6(%rip),%xmm13 # 6790 <_sk_callback_sse2+0x30e>
+ DB 68,15,40,45,6,116,0,0 ; movaps 0x7406(%rip),%xmm13 # 88c0 <_sk_clut_4D_sse2+0x1863>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,214,82,0,0 ; movaps 0x52d6(%rip),%xmm14 # 67a0 <_sk_callback_sse2+0x31e>
+ DB 68,15,40,53,6,116,0,0 ; movaps 0x7406(%rip),%xmm14 # 88d0 <_sk_clut_4D_sse2+0x1873>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,210,82,0,0 ; movaps 0x52d2(%rip),%xmm11 # 67b0 <_sk_callback_sse2+0x32e>
+ DB 68,15,40,29,2,116,0,0 ; movaps 0x7402(%rip),%xmm11 # 88e0 <_sk_clut_4D_sse2+0x1883>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -24551,7 +29093,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,190,82,0,0 ; movaps 0x52be(%rip),%xmm8 # 67c0 <_sk_callback_sse2+0x33e>
+ DB 68,15,40,5,238,115,0,0 ; movaps 0x73ee(%rip),%xmm8 # 88f0 <_sk_clut_4D_sse2+0x1893>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -24687,15 +29229,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,208,80,0,0 ; movaps 0x50d0(%rip),%xmm12 # 67d0 <_sk_callback_sse2+0x34e>
+ DB 68,15,40,37,0,114,0,0 ; movaps 0x7200(%rip),%xmm12 # 8900 <_sk_clut_4D_sse2+0x18a3>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,208,80,0,0 ; movaps 0x50d0(%rip),%xmm13 # 67e0 <_sk_callback_sse2+0x35e>
+ DB 68,15,40,45,0,114,0,0 ; movaps 0x7200(%rip),%xmm13 # 8910 <_sk_clut_4D_sse2+0x18b3>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,204,80,0,0 ; movaps 0x50cc(%rip),%xmm11 # 67f0 <_sk_callback_sse2+0x36e>
- DB 68,15,40,5,212,80,0,0 ; movaps 0x50d4(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x37e>
+ DB 68,15,40,29,252,113,0,0 ; movaps 0x71fc(%rip),%xmm11 # 8920 <_sk_clut_4D_sse2+0x18c3>
+ DB 68,15,40,5,4,114,0,0 ; movaps 0x7204(%rip),%xmm8 # 8930 <_sk_clut_4D_sse2+0x18d3>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -24838,7 +29380,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,133,228,0,0,0 ; jne 1a19 <_sk_srcover_rgba_8888_sse2+0x104>
DB 243,69,15,111,4,129 ; movdqu (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,53,202,78,0,0 ; movdqa 0x4eca(%rip),%xmm6 # 6810 <_sk_callback_sse2+0x38e>
+ DB 102,15,111,53,250,111,0,0 ; movdqa 0x6ffa(%rip),%xmm6 # 8940 <_sk_clut_4D_sse2+0x18e3>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -24852,9 +29394,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,154,78,0,0 ; movaps 0x4e9a(%rip),%xmm8 # 6820 <_sk_callback_sse2+0x39e>
+ DB 68,15,40,5,202,111,0,0 ; movaps 0x6fca(%rip),%xmm8 # 8950 <_sk_clut_4D_sse2+0x18f3>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,158,78,0,0 ; movaps 0x4e9e(%rip),%xmm12 # 6830 <_sk_callback_sse2+0x3ae>
+ DB 68,15,40,37,206,111,0,0 ; movaps 0x6fce(%rip),%xmm12 # 8960 <_sk_clut_4D_sse2+0x1903>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24930,7 +29472,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,138,77,0,0 ; movaps 0x4d8a(%rip),%xmm8 # 6840 <_sk_callback_sse2+0x3be>
+ DB 68,15,40,5,186,110,0,0 ; movaps 0x6eba(%rip),%xmm8 # 8970 <_sk_clut_4D_sse2+0x1913>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -24940,7 +29482,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,127,77,0,0 ; minps 0x4d7f(%rip),%xmm3 # 6850 <_sk_callback_sse2+0x3ce>
+ DB 15,93,29,175,110,0,0 ; minps 0x6eaf(%rip),%xmm3 # 8980 <_sk_clut_4D_sse2+0x1923>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -24949,7 +29491,7 @@ _sk_clamp_a_sse2 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
- DB 15,93,61,123,77,0,0 ; minps 0x4d7b(%rip),%xmm7 # 6860 <_sk_callback_sse2+0x3de>
+ DB 15,93,61,171,110,0,0 ; minps 0x6eab(%rip),%xmm7 # 8990 <_sk_clut_4D_sse2+0x1933>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -24978,7 +29520,7 @@ _sk_swap_rb_sse2 LABEL PROC
PUBLIC _sk_invert_sse2
_sk_invert_sse2 LABEL PROC
- DB 68,15,40,5,71,77,0,0 ; movaps 0x4d47(%rip),%xmm8 # 6870 <_sk_callback_sse2+0x3ee>
+ DB 68,15,40,5,119,110,0,0 ; movaps 0x6e77(%rip),%xmm8 # 89a0 <_sk_clut_4D_sse2+0x1943>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -25030,7 +29572,7 @@ _sk_premul_dst_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,225,76,0,0 ; movaps 0x4ce1(%rip),%xmm9 # 6880 <_sk_callback_sse2+0x3fe>
+ DB 68,15,40,13,17,110,0,0 ; movaps 0x6e11(%rip),%xmm9 # 89b0 <_sk_clut_4D_sse2+0x1953>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -25042,20 +29584,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,204,76,0,0 ; movaps 0x4ccc(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x40e>
+ DB 68,15,40,5,252,109,0,0 ; movaps 0x6dfc(%rip),%xmm8 # 89c0 <_sk_clut_4D_sse2+0x1963>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,196,76,0,0 ; movaps 0x4cc4(%rip),%xmm9 # 68a0 <_sk_callback_sse2+0x41e>
+ DB 68,15,40,13,244,109,0,0 ; movaps 0x6df4(%rip),%xmm9 # 89d0 <_sk_clut_4D_sse2+0x1973>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,196,76,0,0 ; movaps 0x4cc4(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x42e>
+ DB 68,15,40,21,244,109,0,0 ; movaps 0x6df4(%rip),%xmm10 # 89e0 <_sk_clut_4D_sse2+0x1983>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,196,76,0,0 ; movaps 0x4cc4(%rip),%xmm11 # 68c0 <_sk_callback_sse2+0x43e>
+ DB 68,15,40,29,244,109,0,0 ; movaps 0x6df4(%rip),%xmm11 # 89f0 <_sk_clut_4D_sse2+0x1993>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,200,76,0,0 ; movaps 0x4cc8(%rip),%xmm12 # 68d0 <_sk_callback_sse2+0x44e>
+ DB 68,15,40,37,248,109,0,0 ; movaps 0x6df8(%rip),%xmm12 # 8a00 <_sk_clut_4D_sse2+0x19a3>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -25089,20 +29631,20 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
- DB 68,15,40,5,89,76,0,0 ; movaps 0x4c59(%rip),%xmm8 # 68e0 <_sk_callback_sse2+0x45e>
+ DB 68,15,40,5,137,109,0,0 ; movaps 0x6d89(%rip),%xmm8 # 8a10 <_sk_clut_4D_sse2+0x19b3>
DB 68,15,40,236 ; movaps %xmm4,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,220 ; movaps %xmm4,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,81,76,0,0 ; movaps 0x4c51(%rip),%xmm9 # 68f0 <_sk_callback_sse2+0x46e>
+ DB 68,15,40,13,129,109,0,0 ; movaps 0x6d81(%rip),%xmm9 # 8a20 <_sk_clut_4D_sse2+0x19c3>
DB 68,15,40,244 ; movaps %xmm4,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,81,76,0,0 ; movaps 0x4c51(%rip),%xmm10 # 6900 <_sk_callback_sse2+0x47e>
+ DB 68,15,40,21,129,109,0,0 ; movaps 0x6d81(%rip),%xmm10 # 8a30 <_sk_clut_4D_sse2+0x19d3>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,81,76,0,0 ; movaps 0x4c51(%rip),%xmm11 # 6910 <_sk_callback_sse2+0x48e>
+ DB 68,15,40,29,129,109,0,0 ; movaps 0x6d81(%rip),%xmm11 # 8a40 <_sk_clut_4D_sse2+0x19e3>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,85,76,0,0 ; movaps 0x4c55(%rip),%xmm12 # 6920 <_sk_callback_sse2+0x49e>
+ DB 68,15,40,37,133,109,0,0 ; movaps 0x6d85(%rip),%xmm12 # 8a50 <_sk_clut_4D_sse2+0x19f3>
DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4
DB 68,15,84,236 ; andps %xmm4,%xmm13
DB 65,15,85,230 ; andnps %xmm14,%xmm4
@@ -25137,22 +29679,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,226,75,0,0 ; movaps 0x4be2(%rip),%xmm8 # 6930 <_sk_callback_sse2+0x4ae>
+ DB 68,15,40,5,18,109,0,0 ; movaps 0x6d12(%rip),%xmm8 # 8a60 <_sk_clut_4D_sse2+0x1a03>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,226,75,0,0 ; movaps 0x4be2(%rip),%xmm9 # 6940 <_sk_callback_sse2+0x4be>
+ DB 68,15,40,13,18,109,0,0 ; movaps 0x6d12(%rip),%xmm9 # 8a70 <_sk_clut_4D_sse2+0x1a13>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,226,75,0,0 ; movaps 0x4be2(%rip),%xmm10 # 6950 <_sk_callback_sse2+0x4ce>
+ DB 68,15,40,21,18,109,0,0 ; movaps 0x6d12(%rip),%xmm10 # 8a80 <_sk_clut_4D_sse2+0x1a23>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,226,75,0,0 ; movaps 0x4be2(%rip),%xmm11 # 6960 <_sk_callback_sse2+0x4de>
+ DB 68,15,40,29,18,109,0,0 ; movaps 0x6d12(%rip),%xmm11 # 8a90 <_sk_clut_4D_sse2+0x1a33>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,230,75,0,0 ; movaps 0x4be6(%rip),%xmm12 # 6970 <_sk_callback_sse2+0x4ee>
+ DB 68,15,40,37,22,109,0,0 ; movaps 0x6d16(%rip),%xmm12 # 8aa0 <_sk_clut_4D_sse2+0x1a43>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,226,75,0,0 ; movaps 0x4be2(%rip),%xmm15 # 6980 <_sk_callback_sse2+0x4fe>
+ DB 68,15,40,61,18,109,0,0 ; movaps 0x6d12(%rip),%xmm15 # 8ab0 <_sk_clut_4D_sse2+0x1a53>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -25200,7 +29742,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,93,218 ; minps %xmm2,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,59,75,0,0 ; movaps 0x4b3b(%rip),%xmm13 # 6990 <_sk_callback_sse2+0x50e>
+ DB 68,15,40,45,107,108,0,0 ; movaps 0x6c6b(%rip),%xmm13 # 8ac0 <_sk_clut_4D_sse2+0x1a63>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -25209,30 +29751,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,33,75,0,0 ; andps 0x4b21(%rip),%xmm14 # 69a0 <_sk_callback_sse2+0x51e>
+ DB 68,15,84,53,81,108,0,0 ; andps 0x6c51(%rip),%xmm14 # 8ad0 <_sk_clut_4D_sse2+0x1a73>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,20,75,0,0 ; movaps 0x4b14(%rip),%xmm12 # 69b0 <_sk_callback_sse2+0x52e>
+ DB 68,15,40,37,68,108,0,0 ; movaps 0x6c44(%rip),%xmm12 # 8ae0 <_sk_clut_4D_sse2+0x1a83>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,16,75,0,0 ; addps 0x4b10(%rip),%xmm8 # 69c0 <_sk_callback_sse2+0x53e>
+ DB 68,15,88,5,64,108,0,0 ; addps 0x6c40(%rip),%xmm8 # 8af0 <_sk_clut_4D_sse2+0x1a93>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,1,75,0,0 ; mulps 0x4b01(%rip),%xmm0 # 69d0 <_sk_callback_sse2+0x54e>
+ DB 15,89,5,49,108,0,0 ; mulps 0x6c31(%rip),%xmm0 # 8b00 <_sk_clut_4D_sse2+0x1aa3>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,244,74,0,0 ; movaps 0x4af4(%rip),%xmm9 # 69e0 <_sk_callback_sse2+0x55e>
+ DB 68,15,40,13,36,108,0,0 ; movaps 0x6c24(%rip),%xmm9 # 8b10 <_sk_clut_4D_sse2+0x1ab3>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -25255,7 +29797,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,175,74,0,0 ; movaps 0x4aaf(%rip),%xmm9 # 69f0 <_sk_callback_sse2+0x56e>
+ DB 68,15,40,13,223,107,0,0 ; movaps 0x6bdf(%rip),%xmm9 # 8b20 <_sk_clut_4D_sse2+0x1ac3>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -25272,28 +29814,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,121,74,0,0 ; movaps 0x4a79(%rip),%xmm0 # 6a00 <_sk_callback_sse2+0x57e>
+ DB 15,40,5,169,107,0,0 ; movaps 0x6ba9(%rip),%xmm0 # 8b30 <_sk_clut_4D_sse2+0x1ad3>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,113,74,0,0 ; andps 0x4a71(%rip),%xmm3 # 6a10 <_sk_callback_sse2+0x58e>
+ DB 15,84,29,161,107,0,0 ; andps 0x6ba1(%rip),%xmm3 # 8b40 <_sk_clut_4D_sse2+0x1ae3>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,115,74,0,0 ; movaps 0x4a73(%rip),%xmm13 # 6a20 <_sk_callback_sse2+0x59e>
+ DB 68,15,40,45,163,107,0,0 ; movaps 0x6ba3(%rip),%xmm13 # 8b50 <_sk_clut_4D_sse2+0x1af3>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,131,74,0,0 ; movaps 0x4a83(%rip),%xmm2 # 6a50 <_sk_callback_sse2+0x5ce>
+ DB 15,40,21,179,107,0,0 ; movaps 0x6bb3(%rip),%xmm2 # 8b80 <_sk_clut_4D_sse2+0x1b23>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,83,74,0,0 ; movaps 0x4a53(%rip),%xmm1 # 6a30 <_sk_callback_sse2+0x5ae>
+ DB 15,40,13,131,107,0,0 ; movaps 0x6b83(%rip),%xmm1 # 8b60 <_sk_clut_4D_sse2+0x1b03>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,89,74,0,0 ; movaps 0x4a59(%rip),%xmm5 # 6a40 <_sk_callback_sse2+0x5be>
+ DB 15,40,45,137,107,0,0 ; movaps 0x6b89(%rip),%xmm5 # 8b70 <_sk_clut_4D_sse2+0x1b13>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -25316,7 +29858,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,206,73,0,0 ; andps 0x49ce(%rip),%xmm3 # 6a10 <_sk_callback_sse2+0x58e>
+ DB 15,84,29,254,106,0,0 ; andps 0x6afe(%rip),%xmm3 # 8b40 <_sk_clut_4D_sse2+0x1ae3>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -25346,12 +29888,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,167,73,0,0 ; addps 0x49a7(%rip),%xmm6 # 6a60 <_sk_callback_sse2+0x5de>
+ DB 15,88,53,215,106,0,0 ; addps 0x6ad7(%rip),%xmm6 # 8b90 <_sk_clut_4D_sse2+0x1b33>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,66,73,0,0 ; andps 0x4942(%rip),%xmm3 # 6a10 <_sk_callback_sse2+0x58e>
+ DB 15,84,29,114,106,0,0 ; andps 0x6a72(%rip),%xmm3 # 8b40 <_sk_clut_4D_sse2+0x1ae3>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -25416,9 +29958,9 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,193,72,0,0 ; pand 0x48c1(%rip),%xmm8 # 6a70 <_sk_callback_sse2+0x5ee>
+ DB 102,68,15,219,5,241,105,0,0 ; pand 0x69f1(%rip),%xmm8 # 8ba0 <_sk_clut_4D_sse2+0x1b43>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,197,72,0,0 ; mulps 0x48c5(%rip),%xmm8 # 6a80 <_sk_callback_sse2+0x5fe>
+ DB 68,15,89,5,245,105,0,0 ; mulps 0x69f5(%rip),%xmm8 # 8bb0 <_sk_clut_4D_sse2+0x1b53>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -25481,9 +30023,9 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,251,71,0,0 ; pand 0x47fb(%rip),%xmm8 # 6a90 <_sk_callback_sse2+0x60e>
+ DB 102,68,15,219,5,43,105,0,0 ; pand 0x692b(%rip),%xmm8 # 8bc0 <_sk_clut_4D_sse2+0x1b63>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,255,71,0,0 ; mulps 0x47ff(%rip),%xmm8 # 6aa0 <_sk_callback_sse2+0x61e>
+ DB 68,15,89,5,47,105,0,0 ; mulps 0x692f(%rip),%xmm8 # 8bd0 <_sk_clut_4D_sse2+0x1b73>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -25533,17 +30075,17 @@ _sk_lerp_565_sse2 LABEL PROC
DB 15,133,156,0,0,0 ; jne 23e4 <_sk_lerp_565_sse2+0xbb>
DB 243,71,15,126,12,89 ; movq (%r9,%r11,2),%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
- DB 102,68,15,111,5,84,71,0,0 ; movdqa 0x4754(%rip),%xmm8 # 6ab0 <_sk_callback_sse2+0x62e>
+ DB 102,68,15,111,5,132,104,0,0 ; movdqa 0x6884(%rip),%xmm8 # 8be0 <_sk_clut_4D_sse2+0x1b83>
DB 102,69,15,219,193 ; pand %xmm9,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,83,71,0,0 ; mulps 0x4753(%rip),%xmm8 # 6ac0 <_sk_callback_sse2+0x63e>
- DB 102,68,15,111,21,90,71,0,0 ; movdqa 0x475a(%rip),%xmm10 # 6ad0 <_sk_callback_sse2+0x64e>
+ DB 68,15,89,5,131,104,0,0 ; mulps 0x6883(%rip),%xmm8 # 8bf0 <_sk_clut_4D_sse2+0x1b93>
+ DB 102,68,15,111,21,138,104,0,0 ; movdqa 0x688a(%rip),%xmm10 # 8c00 <_sk_clut_4D_sse2+0x1ba3>
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,89,71,0,0 ; mulps 0x4759(%rip),%xmm10 # 6ae0 <_sk_callback_sse2+0x65e>
- DB 102,68,15,219,13,96,71,0,0 ; pand 0x4760(%rip),%xmm9 # 6af0 <_sk_callback_sse2+0x66e>
+ DB 68,15,89,21,137,104,0,0 ; mulps 0x6889(%rip),%xmm10 # 8c10 <_sk_clut_4D_sse2+0x1bb3>
+ DB 102,68,15,219,13,144,104,0,0 ; pand 0x6890(%rip),%xmm9 # 8c20 <_sk_clut_4D_sse2+0x1bc3>
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,100,71,0,0 ; mulps 0x4764(%rip),%xmm9 # 6b00 <_sk_callback_sse2+0x67e>
+ DB 68,15,89,13,148,104,0,0 ; mulps 0x6894(%rip),%xmm9 # 8c30 <_sk_clut_4D_sse2+0x1bd3>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -25595,7 +30137,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,179,70,0,0 ; movdqa 0x46b3(%rip),%xmm8 # 6b10 <_sk_callback_sse2+0x68e>
+ DB 102,68,15,111,5,227,103,0,0 ; movdqa 0x67e3(%rip),%xmm8 # 8c40 <_sk_clut_4D_sse2+0x1be3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -25651,7 +30193,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,188,69,0,0 ; mulps 0x45bc(%rip),%xmm3 # 6b20 <_sk_callback_sse2+0x69e>
+ DB 15,89,29,236,102,0,0 ; mulps 0x66ec(%rip),%xmm3 # 8c50 <_sk_clut_4D_sse2+0x1bf3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -25691,7 +30233,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,49,69,0,0 ; movdqa 0x4531(%rip),%xmm10 # 6b30 <_sk_callback_sse2+0x6ae>
+ DB 102,68,15,111,21,97,102,0,0 ; movdqa 0x6661(%rip),%xmm10 # 8c60 <_sk_clut_4D_sse2+0x1c03>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -25753,7 +30295,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,28,68,0,0 ; mulps 0x441c(%rip),%xmm3 # 6b40 <_sk_callback_sse2+0x6be>
+ DB 15,89,29,76,101,0,0 ; mulps 0x654c(%rip),%xmm3 # 8c70 <_sk_clut_4D_sse2+0x1c13>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -25794,7 +30336,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,139,67,0,0 ; movdqa 0x438b(%rip),%xmm8 # 6b50 <_sk_callback_sse2+0x6ce>
+ DB 102,68,15,111,5,187,100,0,0 ; movdqa 0x64bb(%rip),%xmm8 # 8c80 <_sk_clut_4D_sse2+0x1c23>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -25850,7 +30392,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,150,66,0,0 ; movaps 0x4296(%rip),%xmm3 # 6b60 <_sk_callback_sse2+0x6de>
+ DB 15,40,29,198,99,0,0 ; movaps 0x63c6(%rip),%xmm3 # 8c90 <_sk_clut_4D_sse2+0x1c33>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -25882,7 +30424,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,47,66,0,0 ; movaps 0x422f(%rip),%xmm8 # 6b70 <_sk_callback_sse2+0x6ee>
+ DB 68,15,40,5,95,99,0,0 ; movaps 0x635f(%rip),%xmm8 # 8ca0 <_sk_clut_4D_sse2+0x1c43>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -25910,7 +30452,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,201,65,0,0 ; movaps 0x41c9(%rip),%xmm10 # 6b80 <_sk_callback_sse2+0x6fe>
+ DB 68,15,40,21,249,98,0,0 ; movaps 0x62f9(%rip),%xmm10 # 8cb0 <_sk_clut_4D_sse2+0x1c53>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -26029,7 +30571,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,17,64,0,0 ; movaps 0x4011(%rip),%xmm10 # 6b90 <_sk_callback_sse2+0x70e>
+ DB 68,15,40,21,65,97,0,0 ; movaps 0x6141(%rip),%xmm10 # 8cc0 <_sk_clut_4D_sse2+0x1c63>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -26226,15 +30768,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,69,61,0,0 ; mulps 0x3d45(%rip),%xmm9 # 6ba0 <_sk_callback_sse2+0x71e>
- DB 68,15,84,21,77,61,0,0 ; andps 0x3d4d(%rip),%xmm10 # 6bb0 <_sk_callback_sse2+0x72e>
- DB 68,15,86,21,85,61,0,0 ; orps 0x3d55(%rip),%xmm10 # 6bc0 <_sk_callback_sse2+0x73e>
- DB 68,15,88,13,93,61,0,0 ; addps 0x3d5d(%rip),%xmm9 # 6bd0 <_sk_callback_sse2+0x74e>
- DB 68,15,40,37,101,61,0,0 ; movaps 0x3d65(%rip),%xmm12 # 6be0 <_sk_callback_sse2+0x75e>
+ DB 68,15,89,13,117,94,0,0 ; mulps 0x5e75(%rip),%xmm9 # 8cd0 <_sk_clut_4D_sse2+0x1c73>
+ DB 68,15,84,21,125,94,0,0 ; andps 0x5e7d(%rip),%xmm10 # 8ce0 <_sk_clut_4D_sse2+0x1c83>
+ DB 68,15,86,21,133,94,0,0 ; orps 0x5e85(%rip),%xmm10 # 8cf0 <_sk_clut_4D_sse2+0x1c93>
+ DB 68,15,88,13,141,94,0,0 ; addps 0x5e8d(%rip),%xmm9 # 8d00 <_sk_clut_4D_sse2+0x1ca3>
+ DB 68,15,40,37,149,94,0,0 ; movaps 0x5e95(%rip),%xmm12 # 8d10 <_sk_clut_4D_sse2+0x1cb3>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,101,61,0,0 ; addps 0x3d65(%rip),%xmm10 # 6bf0 <_sk_callback_sse2+0x76e>
- DB 68,15,40,37,109,61,0,0 ; movaps 0x3d6d(%rip),%xmm12 # 6c00 <_sk_callback_sse2+0x77e>
+ DB 68,15,88,21,149,94,0,0 ; addps 0x5e95(%rip),%xmm10 # 8d20 <_sk_clut_4D_sse2+0x1cc3>
+ DB 68,15,40,37,157,94,0,0 ; movaps 0x5e9d(%rip),%xmm12 # 8d30 <_sk_clut_4D_sse2+0x1cd3>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -26242,22 +30784,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,87,61,0,0 ; movaps 0x3d57(%rip),%xmm10 # 6c10 <_sk_callback_sse2+0x78e>
+ DB 68,15,40,21,135,94,0,0 ; movaps 0x5e87(%rip),%xmm10 # 8d40 <_sk_clut_4D_sse2+0x1ce3>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,75,61,0,0 ; addps 0x3d4b(%rip),%xmm9 # 6c20 <_sk_callback_sse2+0x79e>
- DB 68,15,40,37,83,61,0,0 ; movaps 0x3d53(%rip),%xmm12 # 6c30 <_sk_callback_sse2+0x7ae>
+ DB 68,15,88,13,123,94,0,0 ; addps 0x5e7b(%rip),%xmm9 # 8d50 <_sk_clut_4D_sse2+0x1cf3>
+ DB 68,15,40,37,131,94,0,0 ; movaps 0x5e83(%rip),%xmm12 # 8d60 <_sk_clut_4D_sse2+0x1d03>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,83,61,0,0 ; movaps 0x3d53(%rip),%xmm12 # 6c40 <_sk_callback_sse2+0x7be>
+ DB 68,15,40,37,131,94,0,0 ; movaps 0x5e83(%rip),%xmm12 # 8d70 <_sk_clut_4D_sse2+0x1d13>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,87,61,0,0 ; movaps 0x3d57(%rip),%xmm13 # 6c50 <_sk_callback_sse2+0x7ce>
+ DB 68,15,40,45,135,94,0,0 ; movaps 0x5e87(%rip),%xmm13 # 8d80 <_sk_clut_4D_sse2+0x1d23>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,87,61,0,0 ; mulps 0x3d57(%rip),%xmm13 # 6c60 <_sk_callback_sse2+0x7de>
+ DB 68,15,89,45,135,94,0,0 ; mulps 0x5e87(%rip),%xmm13 # 8d90 <_sk_clut_4D_sse2+0x1d33>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -26291,15 +30833,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,215,60,0,0 ; mulps 0x3cd7(%rip),%xmm9 # 6c70 <_sk_callback_sse2+0x7ee>
- DB 68,15,84,21,223,60,0,0 ; andps 0x3cdf(%rip),%xmm10 # 6c80 <_sk_callback_sse2+0x7fe>
- DB 68,15,86,21,231,60,0,0 ; orps 0x3ce7(%rip),%xmm10 # 6c90 <_sk_callback_sse2+0x80e>
- DB 68,15,88,13,239,60,0,0 ; addps 0x3cef(%rip),%xmm9 # 6ca0 <_sk_callback_sse2+0x81e>
- DB 68,15,40,37,247,60,0,0 ; movaps 0x3cf7(%rip),%xmm12 # 6cb0 <_sk_callback_sse2+0x82e>
+ DB 68,15,89,13,7,94,0,0 ; mulps 0x5e07(%rip),%xmm9 # 8da0 <_sk_clut_4D_sse2+0x1d43>
+ DB 68,15,84,21,15,94,0,0 ; andps 0x5e0f(%rip),%xmm10 # 8db0 <_sk_clut_4D_sse2+0x1d53>
+ DB 68,15,86,21,23,94,0,0 ; orps 0x5e17(%rip),%xmm10 # 8dc0 <_sk_clut_4D_sse2+0x1d63>
+ DB 68,15,88,13,31,94,0,0 ; addps 0x5e1f(%rip),%xmm9 # 8dd0 <_sk_clut_4D_sse2+0x1d73>
+ DB 68,15,40,37,39,94,0,0 ; movaps 0x5e27(%rip),%xmm12 # 8de0 <_sk_clut_4D_sse2+0x1d83>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,247,60,0,0 ; addps 0x3cf7(%rip),%xmm10 # 6cc0 <_sk_callback_sse2+0x83e>
- DB 68,15,40,37,255,60,0,0 ; movaps 0x3cff(%rip),%xmm12 # 6cd0 <_sk_callback_sse2+0x84e>
+ DB 68,15,88,21,39,94,0,0 ; addps 0x5e27(%rip),%xmm10 # 8df0 <_sk_clut_4D_sse2+0x1d93>
+ DB 68,15,40,37,47,94,0,0 ; movaps 0x5e2f(%rip),%xmm12 # 8e00 <_sk_clut_4D_sse2+0x1da3>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -26307,22 +30849,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,233,60,0,0 ; movaps 0x3ce9(%rip),%xmm10 # 6ce0 <_sk_callback_sse2+0x85e>
+ DB 68,15,40,21,25,94,0,0 ; movaps 0x5e19(%rip),%xmm10 # 8e10 <_sk_clut_4D_sse2+0x1db3>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,221,60,0,0 ; addps 0x3cdd(%rip),%xmm9 # 6cf0 <_sk_callback_sse2+0x86e>
- DB 68,15,40,37,229,60,0,0 ; movaps 0x3ce5(%rip),%xmm12 # 6d00 <_sk_callback_sse2+0x87e>
+ DB 68,15,88,13,13,94,0,0 ; addps 0x5e0d(%rip),%xmm9 # 8e20 <_sk_clut_4D_sse2+0x1dc3>
+ DB 68,15,40,37,21,94,0,0 ; movaps 0x5e15(%rip),%xmm12 # 8e30 <_sk_clut_4D_sse2+0x1dd3>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,229,60,0,0 ; movaps 0x3ce5(%rip),%xmm12 # 6d10 <_sk_callback_sse2+0x88e>
+ DB 68,15,40,37,21,94,0,0 ; movaps 0x5e15(%rip),%xmm12 # 8e40 <_sk_clut_4D_sse2+0x1de3>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,233,60,0,0 ; movaps 0x3ce9(%rip),%xmm13 # 6d20 <_sk_callback_sse2+0x89e>
+ DB 68,15,40,45,25,94,0,0 ; movaps 0x5e19(%rip),%xmm13 # 8e50 <_sk_clut_4D_sse2+0x1df3>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,233,60,0,0 ; mulps 0x3ce9(%rip),%xmm13 # 6d30 <_sk_callback_sse2+0x8ae>
+ DB 68,15,89,45,25,94,0,0 ; mulps 0x5e19(%rip),%xmm13 # 8e60 <_sk_clut_4D_sse2+0x1e03>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -26356,15 +30898,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,105,60,0,0 ; mulps 0x3c69(%rip),%xmm9 # 6d40 <_sk_callback_sse2+0x8be>
- DB 68,15,84,21,113,60,0,0 ; andps 0x3c71(%rip),%xmm10 # 6d50 <_sk_callback_sse2+0x8ce>
- DB 68,15,86,21,121,60,0,0 ; orps 0x3c79(%rip),%xmm10 # 6d60 <_sk_callback_sse2+0x8de>
- DB 68,15,88,13,129,60,0,0 ; addps 0x3c81(%rip),%xmm9 # 6d70 <_sk_callback_sse2+0x8ee>
- DB 68,15,40,37,137,60,0,0 ; movaps 0x3c89(%rip),%xmm12 # 6d80 <_sk_callback_sse2+0x8fe>
+ DB 68,15,89,13,153,93,0,0 ; mulps 0x5d99(%rip),%xmm9 # 8e70 <_sk_clut_4D_sse2+0x1e13>
+ DB 68,15,84,21,161,93,0,0 ; andps 0x5da1(%rip),%xmm10 # 8e80 <_sk_clut_4D_sse2+0x1e23>
+ DB 68,15,86,21,169,93,0,0 ; orps 0x5da9(%rip),%xmm10 # 8e90 <_sk_clut_4D_sse2+0x1e33>
+ DB 68,15,88,13,177,93,0,0 ; addps 0x5db1(%rip),%xmm9 # 8ea0 <_sk_clut_4D_sse2+0x1e43>
+ DB 68,15,40,37,185,93,0,0 ; movaps 0x5db9(%rip),%xmm12 # 8eb0 <_sk_clut_4D_sse2+0x1e53>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,137,60,0,0 ; addps 0x3c89(%rip),%xmm10 # 6d90 <_sk_callback_sse2+0x90e>
- DB 68,15,40,37,145,60,0,0 ; movaps 0x3c91(%rip),%xmm12 # 6da0 <_sk_callback_sse2+0x91e>
+ DB 68,15,88,21,185,93,0,0 ; addps 0x5db9(%rip),%xmm10 # 8ec0 <_sk_clut_4D_sse2+0x1e63>
+ DB 68,15,40,37,193,93,0,0 ; movaps 0x5dc1(%rip),%xmm12 # 8ed0 <_sk_clut_4D_sse2+0x1e73>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -26372,22 +30914,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,123,60,0,0 ; movaps 0x3c7b(%rip),%xmm10 # 6db0 <_sk_callback_sse2+0x92e>
+ DB 68,15,40,21,171,93,0,0 ; movaps 0x5dab(%rip),%xmm10 # 8ee0 <_sk_clut_4D_sse2+0x1e83>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,111,60,0,0 ; addps 0x3c6f(%rip),%xmm9 # 6dc0 <_sk_callback_sse2+0x93e>
- DB 68,15,40,37,119,60,0,0 ; movaps 0x3c77(%rip),%xmm12 # 6dd0 <_sk_callback_sse2+0x94e>
+ DB 68,15,88,13,159,93,0,0 ; addps 0x5d9f(%rip),%xmm9 # 8ef0 <_sk_clut_4D_sse2+0x1e93>
+ DB 68,15,40,37,167,93,0,0 ; movaps 0x5da7(%rip),%xmm12 # 8f00 <_sk_clut_4D_sse2+0x1ea3>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,119,60,0,0 ; movaps 0x3c77(%rip),%xmm12 # 6de0 <_sk_callback_sse2+0x95e>
+ DB 68,15,40,37,167,93,0,0 ; movaps 0x5da7(%rip),%xmm12 # 8f10 <_sk_clut_4D_sse2+0x1eb3>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,123,60,0,0 ; movaps 0x3c7b(%rip),%xmm13 # 6df0 <_sk_callback_sse2+0x96e>
+ DB 68,15,40,45,171,93,0,0 ; movaps 0x5dab(%rip),%xmm13 # 8f20 <_sk_clut_4D_sse2+0x1ec3>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,123,60,0,0 ; mulps 0x3c7b(%rip),%xmm13 # 6e00 <_sk_callback_sse2+0x97e>
+ DB 68,15,89,45,171,93,0,0 ; mulps 0x5dab(%rip),%xmm13 # 8f30 <_sk_clut_4D_sse2+0x1ed3>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -26421,15 +30963,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,251,59,0,0 ; mulps 0x3bfb(%rip),%xmm9 # 6e10 <_sk_callback_sse2+0x98e>
- DB 68,15,84,21,3,60,0,0 ; andps 0x3c03(%rip),%xmm10 # 6e20 <_sk_callback_sse2+0x99e>
- DB 68,15,86,21,11,60,0,0 ; orps 0x3c0b(%rip),%xmm10 # 6e30 <_sk_callback_sse2+0x9ae>
- DB 68,15,88,13,19,60,0,0 ; addps 0x3c13(%rip),%xmm9 # 6e40 <_sk_callback_sse2+0x9be>
- DB 68,15,40,37,27,60,0,0 ; movaps 0x3c1b(%rip),%xmm12 # 6e50 <_sk_callback_sse2+0x9ce>
+ DB 68,15,89,13,43,93,0,0 ; mulps 0x5d2b(%rip),%xmm9 # 8f40 <_sk_clut_4D_sse2+0x1ee3>
+ DB 68,15,84,21,51,93,0,0 ; andps 0x5d33(%rip),%xmm10 # 8f50 <_sk_clut_4D_sse2+0x1ef3>
+ DB 68,15,86,21,59,93,0,0 ; orps 0x5d3b(%rip),%xmm10 # 8f60 <_sk_clut_4D_sse2+0x1f03>
+ DB 68,15,88,13,67,93,0,0 ; addps 0x5d43(%rip),%xmm9 # 8f70 <_sk_clut_4D_sse2+0x1f13>
+ DB 68,15,40,37,75,93,0,0 ; movaps 0x5d4b(%rip),%xmm12 # 8f80 <_sk_clut_4D_sse2+0x1f23>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,27,60,0,0 ; addps 0x3c1b(%rip),%xmm10 # 6e60 <_sk_callback_sse2+0x9de>
- DB 68,15,40,37,35,60,0,0 ; movaps 0x3c23(%rip),%xmm12 # 6e70 <_sk_callback_sse2+0x9ee>
+ DB 68,15,88,21,75,93,0,0 ; addps 0x5d4b(%rip),%xmm10 # 8f90 <_sk_clut_4D_sse2+0x1f33>
+ DB 68,15,40,37,83,93,0,0 ; movaps 0x5d53(%rip),%xmm12 # 8fa0 <_sk_clut_4D_sse2+0x1f43>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -26437,22 +30979,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,13,60,0,0 ; movaps 0x3c0d(%rip),%xmm10 # 6e80 <_sk_callback_sse2+0x9fe>
+ DB 68,15,40,21,61,93,0,0 ; movaps 0x5d3d(%rip),%xmm10 # 8fb0 <_sk_clut_4D_sse2+0x1f53>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,1,60,0,0 ; addps 0x3c01(%rip),%xmm9 # 6e90 <_sk_callback_sse2+0xa0e>
- DB 68,15,40,37,9,60,0,0 ; movaps 0x3c09(%rip),%xmm12 # 6ea0 <_sk_callback_sse2+0xa1e>
+ DB 68,15,88,13,49,93,0,0 ; addps 0x5d31(%rip),%xmm9 # 8fc0 <_sk_clut_4D_sse2+0x1f63>
+ DB 68,15,40,37,57,93,0,0 ; movaps 0x5d39(%rip),%xmm12 # 8fd0 <_sk_clut_4D_sse2+0x1f73>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,9,60,0,0 ; movaps 0x3c09(%rip),%xmm12 # 6eb0 <_sk_callback_sse2+0xa2e>
+ DB 68,15,40,37,57,93,0,0 ; movaps 0x5d39(%rip),%xmm12 # 8fe0 <_sk_clut_4D_sse2+0x1f83>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,13,60,0,0 ; movaps 0x3c0d(%rip),%xmm13 # 6ec0 <_sk_callback_sse2+0xa3e>
+ DB 68,15,40,45,61,93,0,0 ; movaps 0x5d3d(%rip),%xmm13 # 8ff0 <_sk_clut_4D_sse2+0x1f93>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,13,60,0,0 ; mulps 0x3c0d(%rip),%xmm13 # 6ed0 <_sk_callback_sse2+0xa4e>
+ DB 68,15,89,45,61,93,0,0 ; mulps 0x5d3d(%rip),%xmm13 # 9000 <_sk_clut_4D_sse2+0x1fa3>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -26476,19 +31018,19 @@ _sk_gamma_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,197,59,0,0 ; mulps 0x3bc5(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xa5e>
- DB 15,84,21,206,59,0,0 ; andps 0x3bce(%rip),%xmm2 # 6ef0 <_sk_callback_sse2+0xa6e>
- DB 68,15,40,53,214,59,0,0 ; movaps 0x3bd6(%rip),%xmm14 # 6f00 <_sk_callback_sse2+0xa7e>
+ DB 15,89,5,245,92,0,0 ; mulps 0x5cf5(%rip),%xmm0 # 9010 <_sk_clut_4D_sse2+0x1fb3>
+ DB 15,84,21,254,92,0,0 ; andps 0x5cfe(%rip),%xmm2 # 9020 <_sk_clut_4D_sse2+0x1fc3>
+ DB 68,15,40,53,6,93,0,0 ; movaps 0x5d06(%rip),%xmm14 # 9030 <_sk_clut_4D_sse2+0x1fd3>
DB 65,15,86,214 ; orps %xmm14,%xmm2
- DB 68,15,40,37,218,59,0,0 ; movaps 0x3bda(%rip),%xmm12 # 6f10 <_sk_callback_sse2+0xa8e>
+ DB 68,15,40,37,10,93,0,0 ; movaps 0x5d0a(%rip),%xmm12 # 9040 <_sk_clut_4D_sse2+0x1fe3>
DB 65,15,88,196 ; addps %xmm12,%xmm0
- DB 68,15,40,29,222,59,0,0 ; movaps 0x3bde(%rip),%xmm11 # 6f20 <_sk_callback_sse2+0xa9e>
+ DB 68,15,40,29,14,93,0,0 ; movaps 0x5d0e(%rip),%xmm11 # 9050 <_sk_clut_4D_sse2+0x1ff3>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,21,220,59,0,0 ; movaps 0x3bdc(%rip),%xmm10 # 6f30 <_sk_callback_sse2+0xaae>
+ DB 68,15,40,21,12,93,0,0 ; movaps 0x5d0c(%rip),%xmm10 # 9060 <_sk_clut_4D_sse2+0x2003>
DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 68,15,40,45,224,59,0,0 ; movaps 0x3be0(%rip),%xmm13 # 6f40 <_sk_callback_sse2+0xabe>
+ DB 68,15,40,45,16,93,0,0 ; movaps 0x5d10(%rip),%xmm13 # 9070 <_sk_clut_4D_sse2+0x2013>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -26500,27 +31042,27 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
- DB 68,15,40,13,192,59,0,0 ; movaps 0x3bc0(%rip),%xmm9 # 6f50 <_sk_callback_sse2+0xace>
+ DB 68,15,40,13,240,92,0,0 ; movaps 0x5cf0(%rip),%xmm9 # 9080 <_sk_clut_4D_sse2+0x2023>
DB 65,15,84,225 ; andps %xmm9,%xmm4
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,188,59,0,0 ; movaps 0x3bbc(%rip),%xmm6 # 6f60 <_sk_callback_sse2+0xade>
+ DB 15,40,53,236,92,0,0 ; movaps 0x5cec(%rip),%xmm6 # 9090 <_sk_clut_4D_sse2+0x2033>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,210,59,0,0 ; movaps 0x3bd2(%rip),%xmm7 # 6f80 <_sk_callback_sse2+0xafe>
+ DB 15,40,61,2,93,0,0 ; movaps 0x5d02(%rip),%xmm7 # 90b0 <_sk_clut_4D_sse2+0x2053>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,178,59,0,0 ; movaps 0x3bb2(%rip),%xmm4 # 6f70 <_sk_callback_sse2+0xaee>
+ DB 15,40,37,226,92,0,0 ; movaps 0x5ce2(%rip),%xmm4 # 90a0 <_sk_clut_4D_sse2+0x2043>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,196,59,0,0 ; movaps 0x3bc4(%rip),%xmm15 # 6f90 <_sk_callback_sse2+0xb0e>
+ DB 68,15,40,61,244,92,0,0 ; movaps 0x5cf4(%rip),%xmm15 # 90c0 <_sk_clut_4D_sse2+0x2063>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,0,59,0,0 ; mulps 0x3b00(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xa5e>
- DB 15,84,13,9,59,0,0 ; andps 0x3b09(%rip),%xmm1 # 6ef0 <_sk_callback_sse2+0xa6e>
+ DB 15,89,5,48,92,0,0 ; mulps 0x5c30(%rip),%xmm0 # 9010 <_sk_clut_4D_sse2+0x1fb3>
+ DB 15,84,13,57,92,0,0 ; andps 0x5c39(%rip),%xmm1 # 9020 <_sk_clut_4D_sse2+0x1fc3>
DB 65,15,86,206 ; orps %xmm14,%xmm1
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
@@ -26550,9 +31092,9 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,143,58,0,0 ; mulps 0x3a8f(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xa5e>
- DB 15,84,29,152,58,0,0 ; andps 0x3a98(%rip),%xmm3 # 6ef0 <_sk_callback_sse2+0xa6e>
- DB 15,86,29,161,58,0,0 ; orps 0x3aa1(%rip),%xmm3 # 6f00 <_sk_callback_sse2+0xa7e>
+ DB 15,89,5,191,91,0,0 ; mulps 0x5bbf(%rip),%xmm0 # 9010 <_sk_clut_4D_sse2+0x1fb3>
+ DB 15,84,29,200,91,0,0 ; andps 0x5bc8(%rip),%xmm3 # 9020 <_sk_clut_4D_sse2+0x1fc3>
+ DB 15,86,29,209,91,0,0 ; orps 0x5bd1(%rip),%xmm3 # 9030 <_sk_clut_4D_sse2+0x1fd3>
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
DB 65,15,92,195 ; subps %xmm11,%xmm0
@@ -26574,7 +31116,7 @@ _sk_gamma_sse2 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,238,58,0,0 ; movaps 0x3aee(%rip),%xmm0 # 6fa0 <_sk_callback_sse2+0xb1e>
+ DB 15,40,5,30,92,0,0 ; movaps 0x5c1e(%rip),%xmm0 # 90d0 <_sk_clut_4D_sse2+0x2073>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -26592,29 +31134,29 @@ _sk_gamma_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,192,58,0,0 ; mulps 0x3ac0(%rip),%xmm0 # 6fb0 <_sk_callback_sse2+0xb2e>
- DB 68,15,40,5,200,58,0,0 ; movaps 0x3ac8(%rip),%xmm8 # 6fc0 <_sk_callback_sse2+0xb3e>
+ DB 15,89,5,240,91,0,0 ; mulps 0x5bf0(%rip),%xmm0 # 90e0 <_sk_clut_4D_sse2+0x2083>
+ DB 68,15,40,5,248,91,0,0 ; movaps 0x5bf8(%rip),%xmm8 # 90f0 <_sk_clut_4D_sse2+0x2093>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,204,58,0,0 ; movaps 0x3acc(%rip),%xmm9 # 6fd0 <_sk_callback_sse2+0xb4e>
+ DB 68,15,40,13,252,91,0,0 ; movaps 0x5bfc(%rip),%xmm9 # 9100 <_sk_clut_4D_sse2+0x20a3>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,201,58,0,0 ; addps 0x3ac9(%rip),%xmm0 # 6fe0 <_sk_callback_sse2+0xb5e>
- DB 15,89,5,210,58,0,0 ; mulps 0x3ad2(%rip),%xmm0 # 6ff0 <_sk_callback_sse2+0xb6e>
- DB 15,89,13,219,58,0,0 ; mulps 0x3adb(%rip),%xmm1 # 7000 <_sk_callback_sse2+0xb7e>
+ DB 15,88,5,249,91,0,0 ; addps 0x5bf9(%rip),%xmm0 # 9110 <_sk_clut_4D_sse2+0x20b3>
+ DB 15,89,5,2,92,0,0 ; mulps 0x5c02(%rip),%xmm0 # 9120 <_sk_clut_4D_sse2+0x20c3>
+ DB 15,89,13,11,92,0,0 ; mulps 0x5c0b(%rip),%xmm1 # 9130 <_sk_clut_4D_sse2+0x20d3>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,225,58,0,0 ; mulps 0x3ae1(%rip),%xmm2 # 7010 <_sk_callback_sse2+0xb8e>
+ DB 15,89,21,17,92,0,0 ; mulps 0x5c11(%rip),%xmm2 # 9140 <_sk_clut_4D_sse2+0x20e3>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,214,58,0,0 ; movaps 0x3ad6(%rip),%xmm2 # 7020 <_sk_callback_sse2+0xb9e>
+ DB 15,40,21,6,92,0,0 ; movaps 0x5c06(%rip),%xmm2 # 9150 <_sk_clut_4D_sse2+0x20f3>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,213,58,0,0 ; movaps 0x3ad5(%rip),%xmm10 # 7030 <_sk_callback_sse2+0xbae>
+ DB 68,15,40,21,5,92,0,0 ; movaps 0x5c05(%rip),%xmm10 # 9160 <_sk_clut_4D_sse2+0x2103>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,217,58,0,0 ; movaps 0x3ad9(%rip),%xmm11 # 7040 <_sk_callback_sse2+0xbbe>
+ DB 68,15,40,29,9,92,0,0 ; movaps 0x5c09(%rip),%xmm11 # 9170 <_sk_clut_4D_sse2+0x2113>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -26638,8 +31180,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,137,58,0,0 ; mulps 0x3a89(%rip),%xmm8 # 7050 <_sk_callback_sse2+0xbce>
- DB 15,89,21,146,58,0,0 ; mulps 0x3a92(%rip),%xmm2 # 7060 <_sk_callback_sse2+0xbde>
+ DB 68,15,89,5,185,91,0,0 ; mulps 0x5bb9(%rip),%xmm8 # 9180 <_sk_clut_4D_sse2+0x2123>
+ DB 15,89,21,194,91,0,0 ; mulps 0x5bc2(%rip),%xmm2 # 9190 <_sk_clut_4D_sse2+0x2133>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -26657,9 +31199,9 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,108,58,0,0 ; pand 0x3a6c(%rip),%xmm0 # 7070 <_sk_callback_sse2+0xbee>
+ DB 102,15,219,5,156,91,0,0 ; pand 0x5b9c(%rip),%xmm0 # 91a0 <_sk_clut_4D_sse2+0x2143>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,114,58,0,0 ; mulps 0x3a72(%rip),%xmm3 # 7080 <_sk_callback_sse2+0xbfe>
+ DB 15,89,29,162,91,0,0 ; mulps 0x5ba2(%rip),%xmm3 # 91b0 <_sk_clut_4D_sse2+0x2153>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
@@ -26700,9 +31242,9 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,248,57,0,0 ; pand 0x39f8(%rip),%xmm4 # 7090 <_sk_callback_sse2+0xc0e>
+ DB 102,15,219,37,40,91,0,0 ; pand 0x5b28(%rip),%xmm4 # 91c0 <_sk_clut_4D_sse2+0x2163>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,254,57,0,0 ; mulps 0x39fe(%rip),%xmm7 # 70a0 <_sk_callback_sse2+0xc1e>
+ DB 15,89,61,46,91,0,0 ; mulps 0x5b2e(%rip),%xmm7 # 91d0 <_sk_clut_4D_sse2+0x2173>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
@@ -26768,7 +31310,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,31,57,0,0 ; mulps 0x391f(%rip),%xmm3 # 70b0 <_sk_callback_sse2+0xc2e>
+ DB 15,89,29,79,90,0,0 ; mulps 0x5a4f(%rip),%xmm3 # 91e0 <_sk_clut_4D_sse2+0x2183>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -26786,7 +31328,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,255,56,0,0 ; movaps 0x38ff(%rip),%xmm8 # 70c0 <_sk_callback_sse2+0xc3e>
+ DB 68,15,40,5,47,90,0,0 ; movaps 0x5a2f(%rip),%xmm8 # 91f0 <_sk_clut_4D_sse2+0x2193>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -26813,7 +31355,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 67,136,68,25,2 ; mov %al,0x2(%r9,%r11,1)
- DB 102,68,15,219,5,158,56,0,0 ; pand 0x389e(%rip),%xmm8 # 70d0 <_sk_callback_sse2+0xc4e>
+ DB 102,68,15,219,5,206,89,0,0 ; pand 0x59ce(%rip),%xmm8 # 9200 <_sk_clut_4D_sse2+0x21a3>
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,68,15,126,192 ; movd %xmm8,%eax
@@ -26837,11 +31379,11 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,91,56,0,0 ; pand 0x385b(%rip),%xmm0 # 70e0 <_sk_callback_sse2+0xc5e>
+ DB 102,15,219,5,139,89,0,0 ; pand 0x598b(%rip),%xmm0 # 9210 <_sk_clut_4D_sse2+0x21b3>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,97,56,0,0 ; mulps 0x3861(%rip),%xmm0 # 70f0 <_sk_callback_sse2+0xc6e>
+ DB 15,89,5,145,89,0,0 ; mulps 0x5991(%rip),%xmm0 # 9220 <_sk_clut_4D_sse2+0x21c3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,104,56,0,0 ; movaps 0x3868(%rip),%xmm3 # 7100 <_sk_callback_sse2+0xc7e>
+ DB 15,40,29,152,89,0,0 ; movaps 0x5998(%rip),%xmm3 # 9230 <_sk_clut_4D_sse2+0x21d3>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -26880,11 +31422,11 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,244,55,0,0 ; pand 0x37f4(%rip),%xmm4 # 7110 <_sk_callback_sse2+0xc8e>
+ DB 102,15,219,37,36,89,0,0 ; pand 0x5924(%rip),%xmm4 # 9240 <_sk_clut_4D_sse2+0x21e3>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,250,55,0,0 ; mulps 0x37fa(%rip),%xmm4 # 7120 <_sk_callback_sse2+0xc9e>
+ DB 15,89,37,42,89,0,0 ; mulps 0x592a(%rip),%xmm4 # 9250 <_sk_clut_4D_sse2+0x21f3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,1,56,0,0 ; movaps 0x3801(%rip),%xmm7 # 7130 <_sk_callback_sse2+0xcae>
+ DB 15,40,61,49,89,0,0 ; movaps 0x5931(%rip),%xmm7 # 9260 <_sk_clut_4D_sse2+0x2203>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
@@ -26948,9 +31490,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,40,55,0,0 ; mulps 0x3728(%rip),%xmm0 # 7140 <_sk_callback_sse2+0xcbe>
+ DB 15,89,5,88,88,0,0 ; mulps 0x5858(%rip),%xmm0 # 9270 <_sk_clut_4D_sse2+0x2213>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,47,55,0,0 ; movaps 0x372f(%rip),%xmm3 # 7150 <_sk_callback_sse2+0xcce>
+ DB 15,40,29,95,88,0,0 ; movaps 0x585f(%rip),%xmm3 # 9280 <_sk_clut_4D_sse2+0x2223>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -26970,19 +31512,19 @@ _sk_load_565_sse2 LABEL PROC
DB 117,83 ; jne 3a99 <_sk_load_565_sse2+0x6e>
DB 243,67,15,126,20,89 ; movq (%r9,%r11,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,8,55,0,0 ; movdqa 0x3708(%rip),%xmm0 # 7160 <_sk_callback_sse2+0xcde>
+ DB 102,15,111,5,56,88,0,0 ; movdqa 0x5838(%rip),%xmm0 # 9290 <_sk_clut_4D_sse2+0x2233>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,10,55,0,0 ; mulps 0x370a(%rip),%xmm0 # 7170 <_sk_callback_sse2+0xcee>
- DB 102,15,111,13,18,55,0,0 ; movdqa 0x3712(%rip),%xmm1 # 7180 <_sk_callback_sse2+0xcfe>
+ DB 15,89,5,58,88,0,0 ; mulps 0x583a(%rip),%xmm0 # 92a0 <_sk_clut_4D_sse2+0x2243>
+ DB 102,15,111,13,66,88,0,0 ; movdqa 0x5842(%rip),%xmm1 # 92b0 <_sk_clut_4D_sse2+0x2253>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,20,55,0,0 ; mulps 0x3714(%rip),%xmm1 # 7190 <_sk_callback_sse2+0xd0e>
- DB 102,15,219,21,28,55,0,0 ; pand 0x371c(%rip),%xmm2 # 71a0 <_sk_callback_sse2+0xd1e>
+ DB 15,89,13,68,88,0,0 ; mulps 0x5844(%rip),%xmm1 # 92c0 <_sk_clut_4D_sse2+0x2263>
+ DB 102,15,219,21,76,88,0,0 ; pand 0x584c(%rip),%xmm2 # 92d0 <_sk_clut_4D_sse2+0x2273>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,34,55,0,0 ; mulps 0x3722(%rip),%xmm2 # 71b0 <_sk_callback_sse2+0xd2e>
+ DB 15,89,21,82,88,0,0 ; mulps 0x5852(%rip),%xmm2 # 92e0 <_sk_clut_4D_sse2+0x2283>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,41,55,0,0 ; movaps 0x3729(%rip),%xmm3 # 71c0 <_sk_callback_sse2+0xd3e>
+ DB 15,40,29,89,88,0,0 ; movaps 0x5859(%rip),%xmm3 # 92f0 <_sk_clut_4D_sse2+0x2293>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
@@ -27017,19 +31559,19 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 117,83 ; jne 3b54 <_sk_load_565_dst_sse2+0x6e>
DB 243,67,15,126,52,89 ; movq (%r9,%r11,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,37,189,54,0,0 ; movdqa 0x36bd(%rip),%xmm4 # 71d0 <_sk_callback_sse2+0xd4e>
+ DB 102,15,111,37,237,87,0,0 ; movdqa 0x57ed(%rip),%xmm4 # 9300 <_sk_clut_4D_sse2+0x22a3>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,191,54,0,0 ; mulps 0x36bf(%rip),%xmm4 # 71e0 <_sk_callback_sse2+0xd5e>
- DB 102,15,111,45,199,54,0,0 ; movdqa 0x36c7(%rip),%xmm5 # 71f0 <_sk_callback_sse2+0xd6e>
+ DB 15,89,37,239,87,0,0 ; mulps 0x57ef(%rip),%xmm4 # 9310 <_sk_clut_4D_sse2+0x22b3>
+ DB 102,15,111,45,247,87,0,0 ; movdqa 0x57f7(%rip),%xmm5 # 9320 <_sk_clut_4D_sse2+0x22c3>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,201,54,0,0 ; mulps 0x36c9(%rip),%xmm5 # 7200 <_sk_callback_sse2+0xd7e>
- DB 102,15,219,53,209,54,0,0 ; pand 0x36d1(%rip),%xmm6 # 7210 <_sk_callback_sse2+0xd8e>
+ DB 15,89,45,249,87,0,0 ; mulps 0x57f9(%rip),%xmm5 # 9330 <_sk_clut_4D_sse2+0x22d3>
+ DB 102,15,219,53,1,88,0,0 ; pand 0x5801(%rip),%xmm6 # 9340 <_sk_clut_4D_sse2+0x22e3>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,215,54,0,0 ; mulps 0x36d7(%rip),%xmm6 # 7220 <_sk_callback_sse2+0xd9e>
+ DB 15,89,53,7,88,0,0 ; mulps 0x5807(%rip),%xmm6 # 9350 <_sk_clut_4D_sse2+0x22f3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,222,54,0,0 ; movaps 0x36de(%rip),%xmm7 # 7230 <_sk_callback_sse2+0xdae>
+ DB 15,40,61,14,88,0,0 ; movaps 0x580e(%rip),%xmm7 # 9360 <_sk_clut_4D_sse2+0x2303>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
@@ -27082,19 +31624,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,25,54,0,0 ; movdqa 0x3619(%rip),%xmm0 # 7240 <_sk_callback_sse2+0xdbe>
+ DB 102,15,111,5,73,87,0,0 ; movdqa 0x5749(%rip),%xmm0 # 9370 <_sk_clut_4D_sse2+0x2313>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,27,54,0,0 ; mulps 0x361b(%rip),%xmm0 # 7250 <_sk_callback_sse2+0xdce>
- DB 102,15,111,13,35,54,0,0 ; movdqa 0x3623(%rip),%xmm1 # 7260 <_sk_callback_sse2+0xdde>
+ DB 15,89,5,75,87,0,0 ; mulps 0x574b(%rip),%xmm0 # 9380 <_sk_clut_4D_sse2+0x2323>
+ DB 102,15,111,13,83,87,0,0 ; movdqa 0x5753(%rip),%xmm1 # 9390 <_sk_clut_4D_sse2+0x2333>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,37,54,0,0 ; mulps 0x3625(%rip),%xmm1 # 7270 <_sk_callback_sse2+0xdee>
- DB 102,15,219,21,45,54,0,0 ; pand 0x362d(%rip),%xmm2 # 7280 <_sk_callback_sse2+0xdfe>
+ DB 15,89,13,85,87,0,0 ; mulps 0x5755(%rip),%xmm1 # 93a0 <_sk_clut_4D_sse2+0x2343>
+ DB 102,15,219,21,93,87,0,0 ; pand 0x575d(%rip),%xmm2 # 93b0 <_sk_clut_4D_sse2+0x2353>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,51,54,0,0 ; mulps 0x3633(%rip),%xmm2 # 7290 <_sk_callback_sse2+0xe0e>
+ DB 15,89,21,99,87,0,0 ; mulps 0x5763(%rip),%xmm2 # 93c0 <_sk_clut_4D_sse2+0x2363>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,58,54,0,0 ; movaps 0x363a(%rip),%xmm3 # 72a0 <_sk_callback_sse2+0xe1e>
+ DB 15,40,29,106,87,0,0 ; movaps 0x576a(%rip),%xmm3 # 93d0 <_sk_clut_4D_sse2+0x2373>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -27107,12 +31649,12 @@ _sk_store_565_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,41,54,0,0 ; movaps 0x3629(%rip),%xmm8 # 72b0 <_sk_callback_sse2+0xe2e>
+ DB 68,15,40,5,89,87,0,0 ; movaps 0x5759(%rip),%xmm8 # 93e0 <_sk_clut_4D_sse2+0x2383>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,30,54,0,0 ; movaps 0x361e(%rip),%xmm10 # 72c0 <_sk_callback_sse2+0xe3e>
+ DB 68,15,40,21,78,87,0,0 ; movaps 0x574e(%rip),%xmm10 # 93f0 <_sk_clut_4D_sse2+0x2393>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -27159,21 +31701,21 @@ _sk_load_4444_sse2 LABEL PROC
DB 117,98 ; jne 3da5 <_sk_load_4444_sse2+0x7d>
DB 243,67,15,126,28,89 ; movq (%r9,%r11,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,123,53,0,0 ; movdqa 0x357b(%rip),%xmm0 # 72d0 <_sk_callback_sse2+0xe4e>
+ DB 102,15,111,5,171,86,0,0 ; movdqa 0x56ab(%rip),%xmm0 # 9400 <_sk_clut_4D_sse2+0x23a3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,125,53,0,0 ; mulps 0x357d(%rip),%xmm0 # 72e0 <_sk_callback_sse2+0xe5e>
- DB 102,15,111,13,133,53,0,0 ; movdqa 0x3585(%rip),%xmm1 # 72f0 <_sk_callback_sse2+0xe6e>
+ DB 15,89,5,173,86,0,0 ; mulps 0x56ad(%rip),%xmm0 # 9410 <_sk_clut_4D_sse2+0x23b3>
+ DB 102,15,111,13,181,86,0,0 ; movdqa 0x56b5(%rip),%xmm1 # 9420 <_sk_clut_4D_sse2+0x23c3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,135,53,0,0 ; mulps 0x3587(%rip),%xmm1 # 7300 <_sk_callback_sse2+0xe7e>
- DB 102,15,111,21,143,53,0,0 ; movdqa 0x358f(%rip),%xmm2 # 7310 <_sk_callback_sse2+0xe8e>
+ DB 15,89,13,183,86,0,0 ; mulps 0x56b7(%rip),%xmm1 # 9430 <_sk_clut_4D_sse2+0x23d3>
+ DB 102,15,111,21,191,86,0,0 ; movdqa 0x56bf(%rip),%xmm2 # 9440 <_sk_clut_4D_sse2+0x23e3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,145,53,0,0 ; mulps 0x3591(%rip),%xmm2 # 7320 <_sk_callback_sse2+0xe9e>
- DB 102,15,219,29,153,53,0,0 ; pand 0x3599(%rip),%xmm3 # 7330 <_sk_callback_sse2+0xeae>
+ DB 15,89,21,193,86,0,0 ; mulps 0x56c1(%rip),%xmm2 # 9450 <_sk_clut_4D_sse2+0x23f3>
+ DB 102,15,219,29,201,86,0,0 ; pand 0x56c9(%rip),%xmm3 # 9460 <_sk_clut_4D_sse2+0x2403>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,159,53,0,0 ; mulps 0x359f(%rip),%xmm3 # 7340 <_sk_callback_sse2+0xebe>
+ DB 15,89,29,207,86,0,0 ; mulps 0x56cf(%rip),%xmm3 # 9470 <_sk_clut_4D_sse2+0x2413>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -27209,21 +31751,21 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 117,98 ; jne 3e6f <_sk_load_4444_dst_sse2+0x7d>
DB 243,67,15,126,60,89 ; movq (%r9,%r11,2),%xmm7
DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
- DB 102,15,111,37,49,53,0,0 ; movdqa 0x3531(%rip),%xmm4 # 7350 <_sk_callback_sse2+0xece>
+ DB 102,15,111,37,97,86,0,0 ; movdqa 0x5661(%rip),%xmm4 # 9480 <_sk_clut_4D_sse2+0x2423>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,51,53,0,0 ; mulps 0x3533(%rip),%xmm4 # 7360 <_sk_callback_sse2+0xede>
- DB 102,15,111,45,59,53,0,0 ; movdqa 0x353b(%rip),%xmm5 # 7370 <_sk_callback_sse2+0xeee>
+ DB 15,89,37,99,86,0,0 ; mulps 0x5663(%rip),%xmm4 # 9490 <_sk_clut_4D_sse2+0x2433>
+ DB 102,15,111,45,107,86,0,0 ; movdqa 0x566b(%rip),%xmm5 # 94a0 <_sk_clut_4D_sse2+0x2443>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,61,53,0,0 ; mulps 0x353d(%rip),%xmm5 # 7380 <_sk_callback_sse2+0xefe>
- DB 102,15,111,53,69,53,0,0 ; movdqa 0x3545(%rip),%xmm6 # 7390 <_sk_callback_sse2+0xf0e>
+ DB 15,89,45,109,86,0,0 ; mulps 0x566d(%rip),%xmm5 # 94b0 <_sk_clut_4D_sse2+0x2453>
+ DB 102,15,111,53,117,86,0,0 ; movdqa 0x5675(%rip),%xmm6 # 94c0 <_sk_clut_4D_sse2+0x2463>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,71,53,0,0 ; mulps 0x3547(%rip),%xmm6 # 73a0 <_sk_callback_sse2+0xf1e>
- DB 102,15,219,61,79,53,0,0 ; pand 0x354f(%rip),%xmm7 # 73b0 <_sk_callback_sse2+0xf2e>
+ DB 15,89,53,119,86,0,0 ; mulps 0x5677(%rip),%xmm6 # 94d0 <_sk_clut_4D_sse2+0x2473>
+ DB 102,15,219,61,127,86,0,0 ; pand 0x567f(%rip),%xmm7 # 94e0 <_sk_clut_4D_sse2+0x2483>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,85,53,0,0 ; mulps 0x3555(%rip),%xmm7 # 73c0 <_sk_callback_sse2+0xf3e>
+ DB 15,89,61,133,86,0,0 ; mulps 0x5685(%rip),%xmm7 # 94f0 <_sk_clut_4D_sse2+0x2493>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -27277,21 +31819,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,142,52,0,0 ; movdqa 0x348e(%rip),%xmm0 # 73d0 <_sk_callback_sse2+0xf4e>
+ DB 102,15,111,5,190,85,0,0 ; movdqa 0x55be(%rip),%xmm0 # 9500 <_sk_clut_4D_sse2+0x24a3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,144,52,0,0 ; mulps 0x3490(%rip),%xmm0 # 73e0 <_sk_callback_sse2+0xf5e>
- DB 102,15,111,13,152,52,0,0 ; movdqa 0x3498(%rip),%xmm1 # 73f0 <_sk_callback_sse2+0xf6e>
+ DB 15,89,5,192,85,0,0 ; mulps 0x55c0(%rip),%xmm0 # 9510 <_sk_clut_4D_sse2+0x24b3>
+ DB 102,15,111,13,200,85,0,0 ; movdqa 0x55c8(%rip),%xmm1 # 9520 <_sk_clut_4D_sse2+0x24c3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,154,52,0,0 ; mulps 0x349a(%rip),%xmm1 # 7400 <_sk_callback_sse2+0xf7e>
- DB 102,15,111,21,162,52,0,0 ; movdqa 0x34a2(%rip),%xmm2 # 7410 <_sk_callback_sse2+0xf8e>
+ DB 15,89,13,202,85,0,0 ; mulps 0x55ca(%rip),%xmm1 # 9530 <_sk_clut_4D_sse2+0x24d3>
+ DB 102,15,111,21,210,85,0,0 ; movdqa 0x55d2(%rip),%xmm2 # 9540 <_sk_clut_4D_sse2+0x24e3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,164,52,0,0 ; mulps 0x34a4(%rip),%xmm2 # 7420 <_sk_callback_sse2+0xf9e>
- DB 102,15,219,29,172,52,0,0 ; pand 0x34ac(%rip),%xmm3 # 7430 <_sk_callback_sse2+0xfae>
+ DB 15,89,21,212,85,0,0 ; mulps 0x55d4(%rip),%xmm2 # 9550 <_sk_clut_4D_sse2+0x24f3>
+ DB 102,15,219,29,220,85,0,0 ; pand 0x55dc(%rip),%xmm3 # 9560 <_sk_clut_4D_sse2+0x2503>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,178,52,0,0 ; mulps 0x34b2(%rip),%xmm3 # 7440 <_sk_callback_sse2+0xfbe>
+ DB 15,89,29,226,85,0,0 ; mulps 0x55e2(%rip),%xmm3 # 9570 <_sk_clut_4D_sse2+0x2513>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -27305,7 +31847,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,159,52,0,0 ; movaps 0x349f(%rip),%xmm8 # 7450 <_sk_callback_sse2+0xfce>
+ DB 68,15,40,5,207,85,0,0 ; movaps 0x55cf(%rip),%xmm8 # 9580 <_sk_clut_4D_sse2+0x2523>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -27361,11 +31903,11 @@ _sk_load_8888_sse2 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,98 ; jne 40e4 <_sk_load_8888_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,21,208,51,0,0 ; movdqa 0x33d0(%rip),%xmm2 # 7460 <_sk_callback_sse2+0xfde>
+ DB 102,15,111,21,0,85,0,0 ; movdqa 0x5500(%rip),%xmm2 # 9590 <_sk_clut_4D_sse2+0x2533>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,204,51,0,0 ; movaps 0x33cc(%rip),%xmm8 # 7470 <_sk_callback_sse2+0xfee>
+ DB 68,15,40,5,252,84,0,0 ; movaps 0x54fc(%rip),%xmm8 # 95a0 <_sk_clut_4D_sse2+0x2543>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -27410,11 +31952,11 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,98 ; jne 41a3 <_sk_load_8888_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,53,49,51,0,0 ; movdqa 0x3331(%rip),%xmm6 # 7480 <_sk_callback_sse2+0xffe>
+ DB 102,15,111,53,97,84,0,0 ; movdqa 0x5461(%rip),%xmm6 # 95b0 <_sk_clut_4D_sse2+0x2553>
DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,45,51,0,0 ; movaps 0x332d(%rip),%xmm8 # 7490 <_sk_callback_sse2+0x100e>
+ DB 68,15,40,5,93,84,0,0 ; movaps 0x545d(%rip),%xmm8 # 95c0 <_sk_clut_4D_sse2+0x2563>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -27477,11 +32019,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,58,50,0,0 ; movdqa 0x323a(%rip),%xmm2 # 74a0 <_sk_callback_sse2+0x101e>
+ DB 102,15,111,21,106,83,0,0 ; movdqa 0x536a(%rip),%xmm2 # 95d0 <_sk_clut_4D_sse2+0x2573>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,54,50,0,0 ; movaps 0x3236(%rip),%xmm8 # 74b0 <_sk_callback_sse2+0x102e>
+ DB 68,15,40,5,102,83,0,0 ; movaps 0x5366(%rip),%xmm8 # 95e0 <_sk_clut_4D_sse2+0x2583>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -27509,7 +32051,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,230,49,0,0 ; movaps 0x31e6(%rip),%xmm8 # 74c0 <_sk_callback_sse2+0x103e>
+ DB 68,15,40,5,22,83,0,0 ; movaps 0x5316(%rip),%xmm8 # 95f0 <_sk_clut_4D_sse2+0x2593>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -27559,11 +32101,11 @@ _sk_load_bgra_sse2 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,98 ; jne 43ee <_sk_load_bgra_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,5,54,49,0,0 ; movdqa 0x3136(%rip),%xmm0 # 74d0 <_sk_callback_sse2+0x104e>
+ DB 102,15,111,5,102,82,0,0 ; movdqa 0x5266(%rip),%xmm0 # 9600 <_sk_clut_4D_sse2+0x25a3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,50,49,0,0 ; movaps 0x3132(%rip),%xmm8 # 74e0 <_sk_callback_sse2+0x105e>
+ DB 68,15,40,5,98,82,0,0 ; movaps 0x5262(%rip),%xmm8 # 9610 <_sk_clut_4D_sse2+0x25b3>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -27608,11 +32150,11 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,98 ; jne 44ad <_sk_load_bgra_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,37,151,48,0,0 ; movdqa 0x3097(%rip),%xmm4 # 74f0 <_sk_callback_sse2+0x106e>
+ DB 102,15,111,37,199,81,0,0 ; movdqa 0x51c7(%rip),%xmm4 # 9620 <_sk_clut_4D_sse2+0x25c3>
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 68,15,40,5,147,48,0,0 ; movaps 0x3093(%rip),%xmm8 # 7500 <_sk_callback_sse2+0x107e>
+ DB 68,15,40,5,195,81,0,0 ; movaps 0x51c3(%rip),%xmm8 # 9630 <_sk_clut_4D_sse2+0x25d3>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -27675,11 +32217,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,5,160,47,0,0 ; movdqa 0x2fa0(%rip),%xmm0 # 7510 <_sk_callback_sse2+0x108e>
+ DB 102,15,111,5,208,80,0,0 ; movdqa 0x50d0(%rip),%xmm0 # 9640 <_sk_clut_4D_sse2+0x25e3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,156,47,0,0 ; movaps 0x2f9c(%rip),%xmm8 # 7520 <_sk_callback_sse2+0x109e>
+ DB 68,15,40,5,204,80,0,0 ; movaps 0x50cc(%rip),%xmm8 # 9650 <_sk_clut_4D_sse2+0x25f3>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -27707,7 +32249,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,76,47,0,0 ; movaps 0x2f4c(%rip),%xmm8 # 7530 <_sk_callback_sse2+0x10ae>
+ DB 68,15,40,5,124,80,0,0 ; movaps 0x507c(%rip),%xmm8 # 9660 <_sk_clut_4D_sse2+0x2603>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -27767,7 +32309,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,100,46,0,0 ; movdqa 0x2e64(%rip),%xmm9 # 7540 <_sk_callback_sse2+0x10be>
+ DB 102,68,15,111,13,148,79,0,0 ; movdqa 0x4f94(%rip),%xmm9 # 9670 <_sk_clut_4D_sse2+0x2613>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -27775,11 +32317,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,73,46,0,0 ; movdqa 0x2e49(%rip),%xmm11 # 7550 <_sk_callback_sse2+0x10ce>
+ DB 102,68,15,111,29,121,79,0,0 ; movdqa 0x4f79(%rip),%xmm11 # 9680 <_sk_clut_4D_sse2+0x2623>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,75,46,0,0 ; movdqa 0x2e4b(%rip),%xmm12 # 7560 <_sk_callback_sse2+0x10de>
+ DB 102,68,15,111,37,123,79,0,0 ; movdqa 0x4f7b(%rip),%xmm12 # 9690 <_sk_clut_4D_sse2+0x2633>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,78,46,0,0 ; movdqa 0x2e4e(%rip),%xmm3 # 7570 <_sk_callback_sse2+0x10ee>
+ DB 102,15,111,29,126,79,0,0 ; movdqa 0x4f7e(%rip),%xmm3 # 96a0 <_sk_clut_4D_sse2+0x2643>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -27861,7 +32403,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5
DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5
- DB 102,68,15,111,13,228,44,0,0 ; movdqa 0x2ce4(%rip),%xmm9 # 7580 <_sk_callback_sse2+0x10fe>
+ DB 102,68,15,111,13,20,78,0,0 ; movdqa 0x4e14(%rip),%xmm9 # 96b0 <_sk_clut_4D_sse2+0x2653>
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,219,225 ; pand %xmm9,%xmm4
DB 102,15,239,236 ; pxor %xmm4,%xmm5
@@ -27869,11 +32411,11 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,236 ; por %xmm4,%xmm13
- DB 102,68,15,111,29,201,44,0,0 ; movdqa 0x2cc9(%rip),%xmm11 # 7590 <_sk_callback_sse2+0x110e>
+ DB 102,68,15,111,29,249,77,0,0 ; movdqa 0x4df9(%rip),%xmm11 # 96c0 <_sk_clut_4D_sse2+0x2663>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,203,44,0,0 ; movdqa 0x2ccb(%rip),%xmm12 # 75a0 <_sk_callback_sse2+0x111e>
+ DB 102,68,15,111,37,251,77,0,0 ; movdqa 0x4dfb(%rip),%xmm12 # 96d0 <_sk_clut_4D_sse2+0x2673>
DB 102,65,15,239,236 ; pxor %xmm12,%xmm5
- DB 102,15,111,61,206,44,0,0 ; movdqa 0x2cce(%rip),%xmm7 # 75b0 <_sk_callback_sse2+0x112e>
+ DB 102,15,111,61,254,77,0,0 ; movdqa 0x4dfe(%rip),%xmm7 # 96e0 <_sk_clut_4D_sse2+0x2683>
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4
DB 102,65,15,223,229 ; pandn %xmm13,%xmm4
@@ -27971,7 +32513,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,29,43,0,0 ; movdqa 0x2b1d(%rip),%xmm9 # 75c0 <_sk_callback_sse2+0x113e>
+ DB 102,68,15,111,13,77,76,0,0 ; movdqa 0x4c4d(%rip),%xmm9 # 96f0 <_sk_clut_4D_sse2+0x2693>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -27979,11 +32521,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,2,43,0,0 ; movdqa 0x2b02(%rip),%xmm11 # 75d0 <_sk_callback_sse2+0x114e>
+ DB 102,68,15,111,29,50,76,0,0 ; movdqa 0x4c32(%rip),%xmm11 # 9700 <_sk_clut_4D_sse2+0x26a3>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,4,43,0,0 ; movdqa 0x2b04(%rip),%xmm12 # 75e0 <_sk_callback_sse2+0x115e>
+ DB 102,68,15,111,37,52,76,0,0 ; movdqa 0x4c34(%rip),%xmm12 # 9710 <_sk_clut_4D_sse2+0x26b3>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,7,43,0,0 ; movdqa 0x2b07(%rip),%xmm3 # 75f0 <_sk_callback_sse2+0x116e>
+ DB 102,15,111,29,55,76,0,0 ; movdqa 0x4c37(%rip),%xmm3 # 9720 <_sk_clut_4D_sse2+0x26c3>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -28040,17 +32582,17 @@ _sk_store_f16_sse2 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,28,42,0,0 ; movdqa 0x2a1c(%rip),%xmm10 # 7600 <_sk_callback_sse2+0x117e>
+ DB 102,68,15,111,21,76,75,0,0 ; movdqa 0x4b4c(%rip),%xmm10 # 9730 <_sk_clut_4D_sse2+0x26d3>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,15,42,0,0 ; movdqa 0x2a0f(%rip),%xmm9 # 7610 <_sk_callback_sse2+0x118e>
+ DB 102,68,15,111,13,63,75,0,0 ; movdqa 0x4b3f(%rip),%xmm9 # 9740 <_sk_clut_4D_sse2+0x26e3>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,0,42,0,0 ; movdqa 0x2a00(%rip),%xmm11 # 7620 <_sk_callback_sse2+0x119e>
+ DB 102,68,15,111,29,48,75,0,0 ; movdqa 0x4b30(%rip),%xmm11 # 9750 <_sk_clut_4D_sse2+0x26f3>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -28146,7 +32688,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,79,40,0,0 ; movaps 0x284f(%rip),%xmm8 # 7630 <_sk_callback_sse2+0x11ae>
+ DB 68,15,40,5,127,73,0,0 ; movaps 0x497f(%rip),%xmm8 # 9760 <_sk_clut_4D_sse2+0x2703>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -28220,7 +32762,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,37,39,0,0 ; movaps 0x2725(%rip),%xmm9 # 7640 <_sk_callback_sse2+0x11be>
+ DB 68,15,40,13,85,72,0,0 ; movaps 0x4855(%rip),%xmm9 # 9770 <_sk_clut_4D_sse2+0x2713>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -28237,7 +32779,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,236,38,0,0 ; movaps 0x26ec(%rip),%xmm3 # 7650 <_sk_callback_sse2+0x11ce>
+ DB 15,40,29,28,72,0,0 ; movaps 0x481c(%rip),%xmm3 # 9780 <_sk_clut_4D_sse2+0x2723>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
@@ -28269,7 +32811,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,117,38,0,0 ; movaps 0x2675(%rip),%xmm10 # 7660 <_sk_callback_sse2+0x11de>
+ DB 68,15,40,21,165,71,0,0 ; movaps 0x47a5(%rip),%xmm10 # 9790 <_sk_clut_4D_sse2+0x2733>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -28496,7 +33038,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,34,35,0,0 ; andps 0x2322(%rip),%xmm10 # 7670 <_sk_callback_sse2+0x11ee>
+ DB 68,15,84,21,82,68,0,0 ; andps 0x4452(%rip),%xmm10 # 97a0 <_sk_clut_4D_sse2+0x2743>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -28520,7 +33062,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,216,34,0,0 ; andps 0x22d8(%rip),%xmm10 # 7680 <_sk_callback_sse2+0x11fe>
+ DB 68,15,84,21,8,68,0,0 ; andps 0x4408(%rip),%xmm10 # 97b0 <_sk_clut_4D_sse2+0x2753>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -28544,13 +33086,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,193 ; subps %xmm9,%xmm0
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,61,39,0,0 ; mulss 0x273d(%rip),%xmm11 # 7b40 <_sk_callback_sse2+0x16be>
+ DB 243,68,15,89,29,253,72,0,0 ; mulss 0x48fd(%rip),%xmm11 # 9d00 <_sk_clut_4D_sse2+0x2ca3>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,110,34,0,0 ; andps 0x226e(%rip),%xmm11 # 7690 <_sk_callback_sse2+0x120e>
+ DB 68,15,84,29,158,67,0,0 ; andps 0x439e(%rip),%xmm11 # 97c0 <_sk_clut_4D_sse2+0x2763>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -28577,13 +33119,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,201 ; subps %xmm9,%xmm1
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,188,38,0,0 ; mulss 0x26bc(%rip),%xmm11 # 7b44 <_sk_callback_sse2+0x16c2>
+ DB 243,68,15,89,29,124,72,0,0 ; mulss 0x487c(%rip),%xmm11 # 9d04 <_sk_clut_4D_sse2+0x2ca7>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,249,33,0,0 ; andps 0x21f9(%rip),%xmm11 # 76a0 <_sk_callback_sse2+0x121e>
+ DB 68,15,84,29,41,67,0,0 ; andps 0x4329(%rip),%xmm11 # 97d0 <_sk_clut_4D_sse2+0x2773>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -28604,7 +33146,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,192,33,0,0 ; minps 0x21c0(%rip),%xmm8 # 76b0 <_sk_callback_sse2+0x122e>
+ DB 68,15,93,5,240,66,0,0 ; minps 0x42f0(%rip),%xmm8 # 97e0 <_sk_clut_4D_sse2+0x2783>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -28615,7 +33157,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,174,33,0,0 ; andps 0x21ae(%rip),%xmm9 # 76c0 <_sk_callback_sse2+0x123e>
+ DB 68,15,84,13,222,66,0,0 ; andps 0x42de(%rip),%xmm9 # 97f0 <_sk_clut_4D_sse2+0x2793>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28623,14 +33165,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,170,33,0,0 ; movaps 0x21aa(%rip),%xmm8 # 76d0 <_sk_callback_sse2+0x124e>
+ DB 68,15,40,5,218,66,0,0 ; movaps 0x42da(%rip),%xmm8 # 9800 <_sk_clut_4D_sse2+0x27a3>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,174,33,0,0 ; movaps 0x21ae(%rip),%xmm9 # 76e0 <_sk_callback_sse2+0x125e>
+ DB 68,15,40,13,222,66,0,0 ; movaps 0x42de(%rip),%xmm9 # 9810 <_sk_clut_4D_sse2+0x27b3>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,164,33,0,0 ; andps 0x21a4(%rip),%xmm9 # 76f0 <_sk_callback_sse2+0x126e>
+ DB 68,15,84,13,212,66,0,0 ; andps 0x42d4(%rip),%xmm9 # 9820 <_sk_clut_4D_sse2+0x27c3>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -28644,10 +33186,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,138,33,0,0 ; mulps 0x218a(%rip),%xmm0 # 7700 <_sk_callback_sse2+0x127e>
- DB 15,89,13,147,33,0,0 ; mulps 0x2193(%rip),%xmm1 # 7710 <_sk_callback_sse2+0x128e>
+ DB 15,89,5,186,66,0,0 ; mulps 0x42ba(%rip),%xmm0 # 9830 <_sk_clut_4D_sse2+0x27d3>
+ DB 15,89,13,195,66,0,0 ; mulps 0x42c3(%rip),%xmm1 # 9840 <_sk_clut_4D_sse2+0x27e3>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,153,33,0,0 ; mulps 0x2199(%rip),%xmm3 # 7720 <_sk_callback_sse2+0x129e>
+ DB 15,89,29,201,66,0,0 ; mulps 0x42c9(%rip),%xmm3 # 9850 <_sk_clut_4D_sse2+0x27f3>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -29041,15 +33583,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,104,27,0,0 ; movaps 0x1b68(%rip),%xmm0 # 7730 <_sk_callback_sse2+0x12ae>
+ DB 15,40,5,152,60,0,0 ; movaps 0x3c98(%rip),%xmm0 # 9860 <_sk_clut_4D_sse2+0x2803>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,110,27,0,0 ; addps 0x1b6e(%rip),%xmm0 # 7740 <_sk_callback_sse2+0x12be>
+ DB 15,88,5,158,60,0,0 ; addps 0x3c9e(%rip),%xmm0 # 9870 <_sk_clut_4D_sse2+0x2813>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,116,27,0,0 ; addps 0x1b74(%rip),%xmm0 # 7750 <_sk_callback_sse2+0x12ce>
+ DB 15,88,5,164,60,0,0 ; addps 0x3ca4(%rip),%xmm0 # 9880 <_sk_clut_4D_sse2+0x2823>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,122,27,0,0 ; addps 0x1b7a(%rip),%xmm0 # 7760 <_sk_callback_sse2+0x12de>
+ DB 15,88,5,170,60,0,0 ; addps 0x3caa(%rip),%xmm0 # 9890 <_sk_clut_4D_sse2+0x2833>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,128,27,0,0 ; addps 0x1b80(%rip),%xmm0 # 7770 <_sk_callback_sse2+0x12ee>
+ DB 15,88,5,176,60,0,0 ; addps 0x3cb0(%rip),%xmm0 # 98a0 <_sk_clut_4D_sse2+0x2843>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -29070,7 +33612,7 @@ _sk_gradient_sse2 LABEL PROC
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,89,27,0,0 ; movaps 0x1b59(%rip),%xmm2 # 7780 <_sk_callback_sse2+0x12fe>
+ DB 15,40,21,137,60,0,0 ; movaps 0x3c89(%rip),%xmm2 # 98b0 <_sk_clut_4D_sse2+0x2853>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -29213,29 +33755,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,26,25,0,0 ; movaps 0x191a(%rip),%xmm13 # 7790 <_sk_callback_sse2+0x130e>
+ DB 68,15,40,45,74,58,0,0 ; movaps 0x3a4a(%rip),%xmm13 # 98c0 <_sk_clut_4D_sse2+0x2863>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,30,25,0,0 ; addps 0x191e(%rip),%xmm13 # 77a0 <_sk_callback_sse2+0x131e>
+ DB 68,15,88,45,78,58,0,0 ; addps 0x3a4e(%rip),%xmm13 # 98d0 <_sk_clut_4D_sse2+0x2873>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,34,25,0,0 ; addps 0x1922(%rip),%xmm13 # 77b0 <_sk_callback_sse2+0x132e>
+ DB 68,15,88,45,82,58,0,0 ; addps 0x3a52(%rip),%xmm13 # 98e0 <_sk_clut_4D_sse2+0x2883>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,38,25,0,0 ; addps 0x1926(%rip),%xmm13 # 77c0 <_sk_callback_sse2+0x133e>
+ DB 68,15,88,45,86,58,0,0 ; addps 0x3a56(%rip),%xmm13 # 98f0 <_sk_clut_4D_sse2+0x2893>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,37,25,0,0 ; movaps 0x1925(%rip),%xmm10 # 77d0 <_sk_callback_sse2+0x134e>
+ DB 68,15,40,21,85,58,0,0 ; movaps 0x3a55(%rip),%xmm10 # 9900 <_sk_clut_4D_sse2+0x28a3>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,24,25,0,0 ; movaps 0x1918(%rip),%xmm10 # 77e0 <_sk_callback_sse2+0x135e>
+ DB 68,15,40,21,72,58,0,0 ; movaps 0x3a48(%rip),%xmm10 # 9910 <_sk_clut_4D_sse2+0x28b3>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,7,25,0,0 ; movaps 0x1907(%rip),%xmm10 # 77f0 <_sk_callback_sse2+0x136e>
+ DB 68,15,40,21,55,58,0,0 ; movaps 0x3a37(%rip),%xmm10 # 9920 <_sk_clut_4D_sse2+0x28c3>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -29266,7 +33808,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,174,24,0,0 ; mulps 0x18ae(%rip),%xmm9 # 7800 <_sk_callback_sse2+0x137e>
+ DB 68,15,89,13,222,57,0,0 ; mulps 0x39de(%rip),%xmm9 # 9930 <_sk_clut_4D_sse2+0x28d3>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -29274,7 +33816,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,153,24,0,0 ; mulps 0x1899(%rip),%xmm10 # 7810 <_sk_callback_sse2+0x138e>
+ DB 68,15,89,21,201,57,0,0 ; mulps 0x39c9(%rip),%xmm10 # 9940 <_sk_clut_4D_sse2+0x28e3>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -29283,8 +33825,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,129,24,0,0 ; xorps 0x1881(%rip),%xmm9 # 7820 <_sk_callback_sse2+0x139e>
- DB 68,15,89,5,137,24,0,0 ; mulps 0x1889(%rip),%xmm8 # 7830 <_sk_callback_sse2+0x13ae>
+ DB 68,15,87,13,177,57,0,0 ; xorps 0x39b1(%rip),%xmm9 # 9950 <_sk_clut_4D_sse2+0x28f3>
+ DB 68,15,89,5,185,57,0,0 ; mulps 0x39b9(%rip),%xmm8 # 9960 <_sk_clut_4D_sse2+0x2903>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -29303,7 +33845,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,80,24,0,0 ; mulps 0x1850(%rip),%xmm9 # 7840 <_sk_callback_sse2+0x13be>
+ DB 68,15,89,13,128,57,0,0 ; mulps 0x3980(%rip),%xmm9 # 9970 <_sk_clut_4D_sse2+0x2913>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -29311,7 +33853,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,59,24,0,0 ; mulps 0x183b(%rip),%xmm10 # 7850 <_sk_callback_sse2+0x13ce>
+ DB 68,15,89,21,107,57,0,0 ; mulps 0x396b(%rip),%xmm10 # 9980 <_sk_clut_4D_sse2+0x2923>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -29320,8 +33862,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,35,24,0,0 ; xorps 0x1823(%rip),%xmm9 # 7860 <_sk_callback_sse2+0x13de>
- DB 68,15,89,5,43,24,0,0 ; mulps 0x182b(%rip),%xmm8 # 7870 <_sk_callback_sse2+0x13ee>
+ DB 68,15,87,13,83,57,0,0 ; xorps 0x3953(%rip),%xmm9 # 9990 <_sk_clut_4D_sse2+0x2933>
+ DB 68,15,89,5,91,57,0,0 ; mulps 0x395b(%rip),%xmm8 # 99a0 <_sk_clut_4D_sse2+0x2943>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -29337,7 +33879,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,3,24,0,0 ; mulps 0x1803(%rip),%xmm9 # 7880 <_sk_callback_sse2+0x13fe>
+ DB 68,15,89,13,51,57,0,0 ; mulps 0x3933(%rip),%xmm9 # 99b0 <_sk_clut_4D_sse2+0x2953>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -29345,7 +33887,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,239,23,0,0 ; xorps 0x17ef(%rip),%xmm0 # 7890 <_sk_callback_sse2+0x140e>
+ DB 15,87,5,31,57,0,0 ; xorps 0x391f(%rip),%xmm0 # 99c0 <_sk_clut_4D_sse2+0x2963>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29382,7 +33924,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,149,23,0,0 ; movaps 0x1795(%rip),%xmm8 # 78a0 <_sk_callback_sse2+0x141e>
+ DB 68,15,40,5,197,56,0,0 ; movaps 0x38c5(%rip),%xmm8 # 99d0 <_sk_clut_4D_sse2+0x2973>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -29390,7 +33932,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,128,23,0,0 ; movaps 0x1780(%rip),%xmm12 # 78b0 <_sk_callback_sse2+0x142e>
+ DB 68,15,40,37,176,56,0,0 ; movaps 0x38b0(%rip),%xmm12 # 99e0 <_sk_clut_4D_sse2+0x2983>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -29433,8 +33975,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,249,22,0,0 ; addps 0x16f9(%rip),%xmm0 # 78c0 <_sk_callback_sse2+0x143e>
- DB 68,15,40,13,1,23,0,0 ; movaps 0x1701(%rip),%xmm9 # 78d0 <_sk_callback_sse2+0x144e>
+ DB 15,88,5,41,56,0,0 ; addps 0x3829(%rip),%xmm0 # 99f0 <_sk_clut_4D_sse2+0x2993>
+ DB 68,15,40,13,49,56,0,0 ; movaps 0x3831(%rip),%xmm9 # 9a00 <_sk_clut_4D_sse2+0x29a3>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29445,7 +33987,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,240,22,0,0 ; addps 0x16f0(%rip),%xmm0 # 78e0 <_sk_callback_sse2+0x145e>
+ DB 15,88,5,32,56,0,0 ; addps 0x3820(%rip),%xmm0 # 9a10 <_sk_clut_4D_sse2+0x29b3>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29455,8 +33997,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,226,22,0,0 ; addps 0x16e2(%rip),%xmm1 # 78f0 <_sk_callback_sse2+0x146e>
- DB 68,15,40,13,234,22,0,0 ; movaps 0x16ea(%rip),%xmm9 # 7900 <_sk_callback_sse2+0x147e>
+ DB 15,88,13,18,56,0,0 ; addps 0x3812(%rip),%xmm1 # 9a20 <_sk_clut_4D_sse2+0x29c3>
+ DB 68,15,40,13,26,56,0,0 ; movaps 0x381a(%rip),%xmm9 # 9a30 <_sk_clut_4D_sse2+0x29d3>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29467,7 +34009,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,216,22,0,0 ; addps 0x16d8(%rip),%xmm1 # 7910 <_sk_callback_sse2+0x148e>
+ DB 15,88,13,8,56,0,0 ; addps 0x3808(%rip),%xmm1 # 9a40 <_sk_clut_4D_sse2+0x29e3>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29477,13 +34019,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,203,22,0,0 ; addps 0x16cb(%rip),%xmm0 # 7920 <_sk_callback_sse2+0x149e>
- DB 68,15,40,13,211,22,0,0 ; movaps 0x16d3(%rip),%xmm9 # 7930 <_sk_callback_sse2+0x14ae>
+ DB 15,88,5,251,55,0,0 ; addps 0x37fb(%rip),%xmm0 # 9a50 <_sk_clut_4D_sse2+0x29f3>
+ DB 68,15,40,13,3,56,0,0 ; movaps 0x3803(%rip),%xmm9 # 9a60 <_sk_clut_4D_sse2+0x2a03>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,207,22,0,0 ; mulps 0x16cf(%rip),%xmm9 # 7940 <_sk_callback_sse2+0x14be>
- DB 68,15,88,13,215,22,0,0 ; addps 0x16d7(%rip),%xmm9 # 7950 <_sk_callback_sse2+0x14ce>
+ DB 68,15,89,13,255,55,0,0 ; mulps 0x37ff(%rip),%xmm9 # 9a70 <_sk_clut_4D_sse2+0x2a13>
+ DB 68,15,88,13,7,56,0,0 ; addps 0x3807(%rip),%xmm9 # 9a80 <_sk_clut_4D_sse2+0x2a23>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29494,16 +34036,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,198,22,0,0 ; addps 0x16c6(%rip),%xmm0 # 7960 <_sk_callback_sse2+0x14de>
- DB 68,15,40,13,206,22,0,0 ; movaps 0x16ce(%rip),%xmm9 # 7970 <_sk_callback_sse2+0x14ee>
+ DB 15,88,5,246,55,0,0 ; addps 0x37f6(%rip),%xmm0 # 9a90 <_sk_clut_4D_sse2+0x2a33>
+ DB 68,15,40,13,254,55,0,0 ; movaps 0x37fe(%rip),%xmm9 # 9aa0 <_sk_clut_4D_sse2+0x2a43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,210,22,0,0 ; movaps 0x16d2(%rip),%xmm8 # 7980 <_sk_callback_sse2+0x14fe>
+ DB 68,15,40,5,2,56,0,0 ; movaps 0x3802(%rip),%xmm8 # 9ab0 <_sk_clut_4D_sse2+0x2a53>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,214,22,0,0 ; addps 0x16d6(%rip),%xmm8 # 7990 <_sk_callback_sse2+0x150e>
+ DB 68,15,88,5,6,56,0,0 ; addps 0x3806(%rip),%xmm8 # 9ac0 <_sk_clut_4D_sse2+0x2a63>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,218,22,0,0 ; addps 0x16da(%rip),%xmm8 # 79a0 <_sk_callback_sse2+0x151e>
+ DB 68,15,88,5,10,56,0,0 ; addps 0x380a(%rip),%xmm8 # 9ad0 <_sk_clut_4D_sse2+0x2a73>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,222,22,0,0 ; addps 0x16de(%rip),%xmm8 # 79b0 <_sk_callback_sse2+0x152e>
+ DB 68,15,88,5,14,56,0,0 ; addps 0x380e(%rip),%xmm8 # 9ae0 <_sk_clut_4D_sse2+0x2a83>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29511,17 +34053,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,216,22,0,0 ; movaps 0x16d8(%rip),%xmm8 # 79c0 <_sk_callback_sse2+0x153e>
+ DB 68,15,40,5,8,56,0,0 ; movaps 0x3808(%rip),%xmm8 # 9af0 <_sk_clut_4D_sse2+0x2a93>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,212,22,0,0 ; movaps 0x16d4(%rip),%xmm10 # 79d0 <_sk_callback_sse2+0x154e>
+ DB 68,15,40,21,4,56,0,0 ; movaps 0x3804(%rip),%xmm10 # 9b00 <_sk_clut_4D_sse2+0x2aa3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,216,22,0,0 ; addps 0x16d8(%rip),%xmm10 # 79e0 <_sk_callback_sse2+0x155e>
+ DB 68,15,88,21,8,56,0,0 ; addps 0x3808(%rip),%xmm10 # 9b10 <_sk_clut_4D_sse2+0x2ab3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,212,22,0,0 ; addps 0x16d4(%rip),%xmm10 # 79f0 <_sk_callback_sse2+0x156e>
+ DB 68,15,88,21,4,56,0,0 ; addps 0x3804(%rip),%xmm10 # 9b20 <_sk_clut_4D_sse2+0x2ac3>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29531,11 +34073,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,199,22,0,0 ; addps 0x16c7(%rip),%xmm0 # 7a00 <_sk_callback_sse2+0x157e>
+ DB 15,88,5,247,55,0,0 ; addps 0x37f7(%rip),%xmm0 # 9b30 <_sk_clut_4D_sse2+0x2ad3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,199,22,0,0 ; mulps 0x16c7(%rip),%xmm8 # 7a10 <_sk_callback_sse2+0x158e>
- DB 68,15,88,5,207,22,0,0 ; addps 0x16cf(%rip),%xmm8 # 7a20 <_sk_callback_sse2+0x159e>
+ DB 68,15,89,5,247,55,0,0 ; mulps 0x37f7(%rip),%xmm8 # 9b40 <_sk_clut_4D_sse2+0x2ae3>
+ DB 68,15,88,5,255,55,0,0 ; addps 0x37ff(%rip),%xmm8 # 9b50 <_sk_clut_4D_sse2+0x2af3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29546,13 +34088,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,189,22,0,0 ; addps 0x16bd(%rip),%xmm1 # 7a30 <_sk_callback_sse2+0x15ae>
- DB 68,15,40,13,197,22,0,0 ; movaps 0x16c5(%rip),%xmm9 # 7a40 <_sk_callback_sse2+0x15be>
+ DB 15,88,13,237,55,0,0 ; addps 0x37ed(%rip),%xmm1 # 9b60 <_sk_clut_4D_sse2+0x2b03>
+ DB 68,15,40,13,245,55,0,0 ; movaps 0x37f5(%rip),%xmm9 # 9b70 <_sk_clut_4D_sse2+0x2b13>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,193,22,0,0 ; mulps 0x16c1(%rip),%xmm9 # 7a50 <_sk_callback_sse2+0x15ce>
- DB 68,15,88,13,201,22,0,0 ; addps 0x16c9(%rip),%xmm9 # 7a60 <_sk_callback_sse2+0x15de>
+ DB 68,15,89,13,241,55,0,0 ; mulps 0x37f1(%rip),%xmm9 # 9b80 <_sk_clut_4D_sse2+0x2b23>
+ DB 68,15,88,13,249,55,0,0 ; addps 0x37f9(%rip),%xmm9 # 9b90 <_sk_clut_4D_sse2+0x2b33>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29563,16 +34105,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,183,22,0,0 ; addps 0x16b7(%rip),%xmm1 # 7a70 <_sk_callback_sse2+0x15ee>
- DB 68,15,40,13,191,22,0,0 ; movaps 0x16bf(%rip),%xmm9 # 7a80 <_sk_callback_sse2+0x15fe>
+ DB 15,88,13,231,55,0,0 ; addps 0x37e7(%rip),%xmm1 # 9ba0 <_sk_clut_4D_sse2+0x2b43>
+ DB 68,15,40,13,239,55,0,0 ; movaps 0x37ef(%rip),%xmm9 # 9bb0 <_sk_clut_4D_sse2+0x2b53>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,195,22,0,0 ; movaps 0x16c3(%rip),%xmm8 # 7a90 <_sk_callback_sse2+0x160e>
+ DB 68,15,40,5,243,55,0,0 ; movaps 0x37f3(%rip),%xmm8 # 9bc0 <_sk_clut_4D_sse2+0x2b63>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,199,22,0,0 ; addps 0x16c7(%rip),%xmm8 # 7aa0 <_sk_callback_sse2+0x161e>
+ DB 68,15,88,5,247,55,0,0 ; addps 0x37f7(%rip),%xmm8 # 9bd0 <_sk_clut_4D_sse2+0x2b73>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,203,22,0,0 ; addps 0x16cb(%rip),%xmm8 # 7ab0 <_sk_callback_sse2+0x162e>
+ DB 68,15,88,5,251,55,0,0 ; addps 0x37fb(%rip),%xmm8 # 9be0 <_sk_clut_4D_sse2+0x2b83>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,207,22,0,0 ; addps 0x16cf(%rip),%xmm8 # 7ac0 <_sk_callback_sse2+0x163e>
+ DB 68,15,88,5,255,55,0,0 ; addps 0x37ff(%rip),%xmm8 # 9bf0 <_sk_clut_4D_sse2+0x2b93>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29580,17 +34122,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,201,22,0,0 ; movaps 0x16c9(%rip),%xmm8 # 7ad0 <_sk_callback_sse2+0x164e>
+ DB 68,15,40,5,249,55,0,0 ; movaps 0x37f9(%rip),%xmm8 # 9c00 <_sk_clut_4D_sse2+0x2ba3>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,196,22,0,0 ; movaps 0x16c4(%rip),%xmm10 # 7ae0 <_sk_callback_sse2+0x165e>
+ DB 68,15,40,21,244,55,0,0 ; movaps 0x37f4(%rip),%xmm10 # 9c10 <_sk_clut_4D_sse2+0x2bb3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,200,22,0,0 ; addps 0x16c8(%rip),%xmm10 # 7af0 <_sk_callback_sse2+0x166e>
+ DB 68,15,88,21,248,55,0,0 ; addps 0x37f8(%rip),%xmm10 # 9c20 <_sk_clut_4D_sse2+0x2bc3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,196,22,0,0 ; addps 0x16c4(%rip),%xmm10 # 7b00 <_sk_callback_sse2+0x167e>
+ DB 68,15,88,21,244,55,0,0 ; addps 0x37f4(%rip),%xmm10 # 9c30 <_sk_clut_4D_sse2+0x2bd3>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29600,11 +34142,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,182,22,0,0 ; addps 0x16b6(%rip),%xmm1 # 7b10 <_sk_callback_sse2+0x168e>
+ DB 15,88,13,230,55,0,0 ; addps 0x37e6(%rip),%xmm1 # 9c40 <_sk_clut_4D_sse2+0x2be3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,182,22,0,0 ; mulps 0x16b6(%rip),%xmm8 # 7b20 <_sk_callback_sse2+0x169e>
- DB 68,15,88,5,190,22,0,0 ; addps 0x16be(%rip),%xmm8 # 7b30 <_sk_callback_sse2+0x16ae>
+ DB 68,15,89,5,230,55,0,0 ; mulps 0x37e6(%rip),%xmm8 # 9c50 <_sk_clut_4D_sse2+0x2bf3>
+ DB 68,15,88,5,238,55,0,0 ; addps 0x37ee(%rip),%xmm8 # 9c60 <_sk_clut_4D_sse2+0x2c03>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29678,6 +34220,1900 @@ _sk_callback_sse2 LABEL PROC
DB 93 ; pop %rbp
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_clut_3D_sse2
+_sk_clut_3D_sse2 LABEL PROC
+ DB 83 ; push %rbx
+ DB 72,129,236,176,0,0,0 ; sub $0xb0,%rsp
+ DB 15,41,188,36,160,0,0,0 ; movaps %xmm7,0xa0(%rsp)
+ DB 15,41,180,36,144,0,0,0 ; movaps %xmm6,0x90(%rsp)
+ DB 15,41,172,36,128,0,0,0 ; movaps %xmm5,0x80(%rsp)
+ DB 15,41,100,36,112 ; movaps %xmm4,0x70(%rsp)
+ DB 15,41,92,36,96 ; movaps %xmm3,0x60(%rsp)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,16 ; mov 0x10(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 102,65,15,110,218 ; movd %r10d,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
+ DB 15,89,218 ; mulps %xmm2,%xmm3
+ DB 15,40,235 ; movaps %xmm3,%xmm5
+ DB 102,65,15,110,209 ; movd %r9d,%xmm2
+ DB 102,68,15,112,250,0 ; pshufd $0x0,%xmm2,%xmm15
+ DB 68,139,72,12 ; mov 0xc(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 102,65,15,110,218 ; movd %r10d,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 68,15,91,211 ; cvtdq2ps %xmm3,%xmm10
+ DB 68,15,89,209 ; mulps %xmm1,%xmm10
+ DB 243,65,15,91,226 ; cvttps2dq %xmm10,%xmm4
+ DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
+ DB 68,15,41,84,36,16 ; movaps %xmm10,0x10(%rsp)
+ DB 102,15,112,204,245 ; pshufd $0xf5,%xmm4,%xmm1
+ DB 102,15,111,220 ; movdqa %xmm4,%xmm3
+ DB 102,65,15,244,223 ; pmuludq %xmm15,%xmm3
+ DB 102,68,15,112,203,232 ; pshufd $0xe8,%xmm3,%xmm9
+ DB 102,65,15,244,207 ; pmuludq %xmm15,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
+ DB 102,65,15,110,201 ; movd %r9d,%xmm1
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,15,112,209,0 ; pshufd $0x0,%xmm1,%xmm2
+ DB 68,139,72,8 ; mov 0x8(%rax),%r9d
+ DB 65,255,201 ; dec %r9d
+ DB 102,65,15,110,201 ; movd %r9d,%xmm1
+ DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
+ DB 68,15,91,233 ; cvtdq2ps %xmm1,%xmm13
+ DB 68,15,89,232 ; mulps %xmm0,%xmm13
+ DB 243,69,15,91,229 ; cvttps2dq %xmm13,%xmm12
+ DB 102,65,15,112,196,245 ; pshufd $0xf5,%xmm12,%xmm0
+ DB 102,65,15,111,204 ; movdqa %xmm12,%xmm1
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,68,15,112,241,232 ; pshufd $0xe8,%xmm1,%xmm14
+ DB 102,68,15,112,194,245 ; pshufd $0xf5,%xmm2,%xmm8
+ DB 102,65,15,244,192 ; pmuludq %xmm8,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,68,15,98,240 ; punpckldq %xmm0,%xmm14
+ DB 243,15,91,197 ; cvttps2dq %xmm5,%xmm0
+ DB 102,15,127,68,36,48 ; movdqa %xmm0,0x30(%rsp)
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,41,100,36,80 ; movaps %xmm4,0x50(%rsp)
+ DB 102,65,15,111,217 ; movdqa %xmm9,%xmm3
+ DB 102,15,254,216 ; paddd %xmm0,%xmm3
+ DB 102,65,15,111,198 ; movdqa %xmm14,%xmm0
+ DB 102,15,254,195 ; paddd %xmm3,%xmm0
+ DB 102,15,111,45,18,54,0,0 ; movdqa 0x3612(%rip),%xmm5 # 9c80 <_sk_clut_4D_sse2+0x2c23>
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,244,205 ; pmuludq %xmm5,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,65,15,126,201 ; movd %xmm1,%r9d
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,65,15,126,202 ; movd %xmm1,%r10d
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,65,15,126,203 ; movd %xmm1,%r11d
+ DB 72,139,24 ; mov (%rax),%rbx
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,233 ; unpcklps %xmm1,%xmm5
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,12,147 ; movss (%rbx,%r10,4),%xmm1
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,254,13,182,53,0,0 ; paddd 0x35b6(%rip),%xmm1 # 9c90 <_sk_clut_4D_sse2+0x2c33>
+ DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,44,155 ; movss (%rbx,%r11,4),%xmm5
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,253 ; unpcklps %xmm5,%xmm7
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 102,15,254,5,124,53,0,0 ; paddd 0x357c(%rip),%xmm0 # 9ca0 <_sk_clut_4D_sse2+0x2c43>
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,73,15,126,201 ; movq %xmm1,%r9
+ DB 102,73,15,126,194 ; movq %xmm0,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 15,40,45,3,53,0,0 ; movaps 0x3503(%rip),%xmm5 # 9c70 <_sk_clut_4D_sse2+0x2c13>
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 15,41,100,36,64 ; movaps %xmm4,0x40(%rsp)
+ DB 68,15,88,213 ; addps %xmm5,%xmm10
+ DB 65,15,88,237 ; addps %xmm13,%xmm5
+ DB 243,15,91,237 ; cvttps2dq %xmm5,%xmm5
+ DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
+ DB 102,15,112,237,245 ; pshufd $0xf5,%xmm5,%xmm5
+ DB 102,65,15,244,232 ; pmuludq %xmm8,%xmm5
+ DB 102,15,112,194,232 ; pshufd $0xe8,%xmm2,%xmm0
+ DB 102,15,112,213,232 ; pshufd $0xe8,%xmm5,%xmm2
+ DB 102,15,98,194 ; punpckldq %xmm2,%xmm0
+ DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%rsp)
+ DB 102,15,254,216 ; paddd %xmm0,%xmm3
+ DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
+ DB 102,15,111,5,204,52,0,0 ; movdqa 0x34cc(%rip),%xmm0 # 9c80 <_sk_clut_4D_sse2+0x2c23>
+ DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
+ DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
+ DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
+ DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8
+ DB 102,15,112,220,232 ; pshufd $0xe8,%xmm4,%xmm3
+ DB 102,15,98,211 ; punpckldq %xmm3,%xmm2
+ DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
+ DB 102,65,15,126,218 ; movd %xmm3,%r10d
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,65,15,126,217 ; movd %xmm3,%r9d
+ DB 102,15,112,218,231 ; pshufd $0xe7,%xmm2,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,44,147 ; movss (%rbx,%r10,4),%xmm5
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 15,20,229 ; unpcklps %xmm5,%xmm4
+ DB 102,15,111,218 ; movdqa %xmm2,%xmm3
+ DB 102,15,254,29,117,52,0,0 ; paddd 0x3475(%rip),%xmm3 # 9c90 <_sk_clut_4D_sse2+0x2c33>
+ DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 15,20,221 ; unpcklps %xmm5,%xmm3
+ DB 102,15,254,21,59,52,0,0 ; paddd 0x343b(%rip),%xmm2 # 9ca0 <_sk_clut_4D_sse2+0x2c43>
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,73,15,126,193 ; movq %xmm0,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,194 ; unpcklps %xmm2,%xmm0
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
+ DB 15,20,208 ; unpcklps %xmm0,%xmm2
+ DB 65,15,91,196 ; cvtdq2ps %xmm12,%xmm0
+ DB 68,15,92,232 ; subps %xmm0,%xmm13
+ DB 15,92,230 ; subps %xmm6,%xmm4
+ DB 65,15,89,229 ; mulps %xmm13,%xmm4
+ DB 15,88,230 ; addps %xmm6,%xmm4
+ DB 15,92,223 ; subps %xmm7,%xmm3
+ DB 65,15,89,221 ; mulps %xmm13,%xmm3
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 15,92,209 ; subps %xmm1,%xmm2
+ DB 65,15,89,213 ; mulps %xmm13,%xmm2
+ DB 15,88,209 ; addps %xmm1,%xmm2
+ DB 243,65,15,91,194 ; cvttps2dq %xmm10,%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,65,15,244,199 ; pmuludq %xmm15,%xmm0
+ DB 102,65,15,244,207 ; pmuludq %xmm15,%xmm1
+ DB 102,68,15,112,224,232 ; pshufd $0xe8,%xmm0,%xmm12
+ DB 102,15,112,193,232 ; pshufd $0xe8,%xmm1,%xmm0
+ DB 102,68,15,98,224 ; punpckldq %xmm0,%xmm12
+ DB 102,65,15,111,244 ; movdqa %xmm12,%xmm6
+ DB 102,15,254,116,36,48 ; paddd 0x30(%rsp),%xmm6
+ DB 102,15,111,198 ; movdqa %xmm6,%xmm0
+ DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,65,15,111,232 ; movdqa %xmm8,%xmm5
+ DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,244,205 ; pmuludq %xmm5,%xmm1
+ DB 102,68,15,111,221 ; movdqa %xmm5,%xmm11
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,65,15,126,202 ; movd %xmm1,%r10d
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,65,15,126,201 ; movd %xmm1,%r9d
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,60,147 ; movss (%rbx,%r10,4),%xmm7
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,68,15,16,4,131 ; movss (%rbx,%rax,4),%xmm8
+ DB 243,66,15,16,12,139 ; movss (%rbx,%r9,4),%xmm1
+ DB 68,15,20,193 ; unpcklps %xmm1,%xmm8
+ DB 68,15,20,199 ; unpcklps %xmm7,%xmm8
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,68,15,111,21,22,51,0,0 ; movdqa 0x3316(%rip),%xmm10 # 9c90 <_sk_clut_4D_sse2+0x2c33>
+ DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
+ DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7
+ DB 102,73,15,126,249 ; movq %xmm7,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 102,15,111,45,215,50,0,0 ; movdqa 0x32d7(%rip),%xmm5 # 9ca0 <_sk_clut_4D_sse2+0x2c43>
+ DB 102,15,254,197 ; paddd %xmm5,%xmm0
+ DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,194 ; movq %xmm0,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,4,155 ; movss (%rbx,%r11,4),%xmm0
+ DB 15,20,232 ; unpcklps %xmm0,%xmm5
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,20,197 ; unpcklps %xmm5,%xmm0
+ DB 102,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm6
+ DB 102,15,112,238,245 ; pshufd $0xf5,%xmm6,%xmm5
+ DB 102,65,15,111,251 ; movdqa %xmm11,%xmm7
+ DB 102,15,244,247 ; pmuludq %xmm7,%xmm6
+ DB 102,15,112,246,232 ; pshufd $0xe8,%xmm6,%xmm6
+ DB 102,15,244,239 ; pmuludq %xmm7,%xmm5
+ DB 102,15,112,237,232 ; pshufd $0xe8,%xmm5,%xmm5
+ DB 102,15,98,245 ; punpckldq %xmm5,%xmm6
+ DB 102,15,112,238,229 ; pshufd $0xe5,%xmm6,%xmm5
+ DB 102,65,15,126,234 ; movd %xmm5,%r10d
+ DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5
+ DB 102,65,15,126,233 ; movd %xmm5,%r9d
+ DB 102,15,112,238,231 ; pshufd $0xe7,%xmm6,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,60,147 ; movss (%rbx,%r10,4),%xmm7
+ DB 15,20,253 ; unpcklps %xmm5,%xmm7
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 243,68,15,16,60,131 ; movss (%rbx,%rax,4),%xmm15
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 68,15,20,253 ; unpcklps %xmm5,%xmm15
+ DB 68,15,20,255 ; unpcklps %xmm7,%xmm15
+ DB 102,15,111,238 ; movdqa %xmm6,%xmm5
+ DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
+ DB 102,15,112,253,78 ; pshufd $0x4e,%xmm5,%xmm7
+ DB 102,73,15,126,249 ; movq %xmm7,%r9
+ DB 102,73,15,126,234 ; movq %xmm5,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,60,155 ; movss (%rbx,%r11,4),%xmm7
+ DB 15,20,239 ; unpcklps %xmm7,%xmm5
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,28,131 ; movss (%rbx,%rax,4),%xmm11
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 68,15,20,223 ; unpcklps %xmm7,%xmm11
+ DB 68,15,20,221 ; unpcklps %xmm5,%xmm11
+ DB 102,15,111,45,210,49,0,0 ; movdqa 0x31d2(%rip),%xmm5 # 9ca0 <_sk_clut_4D_sse2+0x2c43>
+ DB 102,15,254,245 ; paddd %xmm5,%xmm6
+ DB 102,15,111,253 ; movdqa %xmm5,%xmm7
+ DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,242 ; movq %xmm6,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,52,155 ; movss (%rbx,%r11,4),%xmm6
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,20,131 ; movss (%rbx,%rax,4),%xmm10
+ DB 243,66,15,16,52,139 ; movss (%rbx,%r9,4),%xmm6
+ DB 68,15,20,214 ; unpcklps %xmm6,%xmm10
+ DB 68,15,20,213 ; unpcklps %xmm5,%xmm10
+ DB 69,15,92,248 ; subps %xmm8,%xmm15
+ DB 69,15,89,253 ; mulps %xmm13,%xmm15
+ DB 69,15,88,248 ; addps %xmm8,%xmm15
+ DB 68,15,92,217 ; subps %xmm1,%xmm11
+ DB 69,15,89,221 ; mulps %xmm13,%xmm11
+ DB 68,15,88,217 ; addps %xmm1,%xmm11
+ DB 68,15,92,208 ; subps %xmm0,%xmm10
+ DB 69,15,89,213 ; mulps %xmm13,%xmm10
+ DB 68,15,88,208 ; addps %xmm0,%xmm10
+ DB 15,91,4,36 ; cvtdq2ps (%rsp),%xmm0
+ DB 15,40,76,36,16 ; movaps 0x10(%rsp),%xmm1
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,41,76,36,16 ; movaps %xmm1,0x10(%rsp)
+ DB 68,15,92,252 ; subps %xmm4,%xmm15
+ DB 68,15,89,249 ; mulps %xmm1,%xmm15
+ DB 68,15,88,252 ; addps %xmm4,%xmm15
+ DB 68,15,92,219 ; subps %xmm3,%xmm11
+ DB 68,15,89,217 ; mulps %xmm1,%xmm11
+ DB 68,15,88,219 ; addps %xmm3,%xmm11
+ DB 68,15,92,210 ; subps %xmm2,%xmm10
+ DB 68,15,89,209 ; mulps %xmm1,%xmm10
+ DB 68,15,88,210 ; addps %xmm2,%xmm10
+ DB 243,15,91,68,36,64 ; cvttps2dq 0x40(%rsp),%xmm0
+ DB 102,15,127,4,36 ; movdqa %xmm0,(%rsp)
+ DB 102,68,15,254,200 ; paddd %xmm0,%xmm9
+ DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
+ DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
+ DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
+ DB 102,15,111,5,229,48,0,0 ; movdqa 0x30e5(%rip),%xmm0 # 9c80 <_sk_clut_4D_sse2+0x2c23>
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
+ DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
+ DB 102,15,111,240 ; movdqa %xmm0,%xmm6
+ DB 102,15,112,202,232 ; pshufd $0xe8,%xmm2,%xmm1
+ DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
+ DB 102,15,112,203,229 ; pshufd $0xe5,%xmm3,%xmm1
+ DB 102,65,15,126,202 ; movd %xmm1,%r10d
+ DB 102,15,112,203,78 ; pshufd $0x4e,%xmm3,%xmm1
+ DB 102,65,15,126,201 ; movd %xmm1,%r9d
+ DB 102,15,112,203,231 ; pshufd $0xe7,%xmm3,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,20,147 ; movss (%rbx,%r10,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 15,20,202 ; unpcklps %xmm2,%xmm1
+ DB 102,15,111,211 ; movdqa %xmm3,%xmm2
+ DB 102,15,111,5,143,48,0,0 ; movdqa 0x308f(%rip),%xmm0 # 9c90 <_sk_clut_4D_sse2+0x2c33>
+ DB 102,15,254,208 ; paddd %xmm0,%xmm2
+ DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,226 ; unpcklps %xmm2,%xmm4
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
+ DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 102,15,254,223 ; paddd %xmm7,%xmm3
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,36,155 ; movss (%rbx,%r11,4),%xmm4
+ DB 15,20,220 ; unpcklps %xmm4,%xmm3
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,229 ; unpcklps %xmm5,%xmm4
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 102,15,111,124,36,32 ; movdqa 0x20(%rsp),%xmm7
+ DB 102,68,15,254,207 ; paddd %xmm7,%xmm9
+ DB 102,65,15,112,233,245 ; pshufd $0xf5,%xmm9,%xmm5
+ DB 102,68,15,244,206 ; pmuludq %xmm6,%xmm9
+ DB 102,65,15,112,217,232 ; pshufd $0xe8,%xmm9,%xmm3
+ DB 102,15,244,238 ; pmuludq %xmm6,%xmm5
+ DB 102,68,15,111,206 ; movdqa %xmm6,%xmm9
+ DB 102,15,112,237,232 ; pshufd $0xe8,%xmm5,%xmm5
+ DB 102,15,98,221 ; punpckldq %xmm5,%xmm3
+ DB 102,15,112,235,229 ; pshufd $0xe5,%xmm3,%xmm5
+ DB 102,65,15,126,234 ; movd %xmm5,%r10d
+ DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5
+ DB 102,65,15,126,233 ; movd %xmm5,%r9d
+ DB 102,15,112,235,231 ; pshufd $0xe7,%xmm3,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,52,147 ; movss (%rbx,%r10,4),%xmm6
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,68,15,16,4,131 ; movss (%rbx,%rax,4),%xmm8
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 68,15,20,197 ; unpcklps %xmm5,%xmm8
+ DB 68,15,20,198 ; unpcklps %xmm6,%xmm8
+ DB 102,15,111,235 ; movdqa %xmm3,%xmm5
+ DB 102,15,254,232 ; paddd %xmm0,%xmm5
+ DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
+ DB 102,73,15,126,241 ; movq %xmm6,%r9
+ DB 102,73,15,126,234 ; movq %xmm5,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,52,155 ; movss (%rbx,%r11,4),%xmm6
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 102,15,254,29,80,47,0,0 ; paddd 0x2f50(%rip),%xmm3 # 9ca0 <_sk_clut_4D_sse2+0x2c43>
+ DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
+ DB 102,73,15,126,193 ; movq %xmm0,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 15,20,232 ; unpcklps %xmm0,%xmm5
+ DB 68,15,92,193 ; subps %xmm1,%xmm8
+ DB 69,15,89,197 ; mulps %xmm13,%xmm8
+ DB 68,15,88,193 ; addps %xmm1,%xmm8
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 65,15,89,245 ; mulps %xmm13,%xmm6
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 65,15,89,237 ; mulps %xmm13,%xmm5
+ DB 15,88,236 ; addps %xmm4,%xmm5
+ DB 102,68,15,254,36,36 ; paddd (%rsp),%xmm12
+ DB 102,69,15,254,244 ; paddd %xmm12,%xmm14
+ DB 102,65,15,112,206,245 ; pshufd $0xf5,%xmm14,%xmm1
+ DB 102,65,15,111,209 ; movdqa %xmm9,%xmm2
+ DB 102,68,15,244,242 ; pmuludq %xmm2,%xmm14
+ DB 102,65,15,112,198,232 ; pshufd $0xe8,%xmm14,%xmm0
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,15,111,226 ; movdqa %xmm2,%xmm4
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,65,15,126,202 ; movd %xmm1,%r10d
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,65,15,126,201 ; movd %xmm1,%r9d
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,20,147 ; movss (%rbx,%r10,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,68,15,16,12,131 ; movss (%rbx,%rax,4),%xmm9
+ DB 243,66,15,16,12,139 ; movss (%rbx,%r9,4),%xmm1
+ DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
+ DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,254,13,93,46,0,0 ; paddd 0x2e5d(%rip),%xmm1 # 9c90 <_sk_clut_4D_sse2+0x2c33>
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,73,15,126,209 ; movq %xmm2,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,202 ; unpcklps %xmm2,%xmm1
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,52,131 ; movss (%rbx,%rax,4),%xmm14
+ DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
+ DB 68,15,20,242 ; unpcklps %xmm2,%xmm14
+ DB 68,15,20,241 ; unpcklps %xmm1,%xmm14
+ DB 102,15,254,5,32,46,0,0 ; paddd 0x2e20(%rip),%xmm0 # 9ca0 <_sk_clut_4D_sse2+0x2c43>
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,73,15,126,201 ; movq %xmm1,%r9
+ DB 102,73,15,126,194 ; movq %xmm0,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,12,139 ; movss (%rbx,%r9,4),%xmm1
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 102,68,15,254,231 ; paddd %xmm7,%xmm12
+ DB 102,65,15,112,196,245 ; pshufd $0xf5,%xmm12,%xmm0
+ DB 102,68,15,244,228 ; pmuludq %xmm4,%xmm12
+ DB 102,15,244,196 ; pmuludq %xmm4,%xmm0
+ DB 102,65,15,112,212,232 ; pshufd $0xe8,%xmm12,%xmm2
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,65,15,126,194 ; movd %xmm0,%r10d
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,65,15,126,193 ; movd %xmm0,%r9d
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,12,147 ; movss (%rbx,%r10,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 102,15,111,37,99,45,0,0 ; movdqa 0x2d63(%rip),%xmm4 # 9c90 <_sk_clut_4D_sse2+0x2c33>
+ DB 102,15,254,226 ; paddd %xmm2,%xmm4
+ DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1
+ DB 102,73,15,126,201 ; movq %xmm1,%r9
+ DB 102,73,15,126,226 ; movq %xmm4,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 102,15,254,21,37,45,0,0 ; paddd 0x2d25(%rip),%xmm2 # 9ca0 <_sk_clut_4D_sse2+0x2c43>
+ DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,226 ; unpcklps %xmm2,%xmm4
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 65,15,92,193 ; subps %xmm9,%xmm0
+ DB 65,15,89,197 ; mulps %xmm13,%xmm0
+ DB 65,15,88,193 ; addps %xmm9,%xmm0
+ DB 65,15,92,206 ; subps %xmm14,%xmm1
+ DB 65,15,89,205 ; mulps %xmm13,%xmm1
+ DB 65,15,88,206 ; addps %xmm14,%xmm1
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 65,15,89,213 ; mulps %xmm13,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 65,15,92,192 ; subps %xmm8,%xmm0
+ DB 15,40,92,36,16 ; movaps 0x10(%rsp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 65,15,88,192 ; addps %xmm8,%xmm0
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,92,213 ; subps %xmm5,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,91,92,36,48 ; cvtdq2ps 0x30(%rsp),%xmm3
+ DB 15,40,100,36,80 ; movaps 0x50(%rsp),%xmm4
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 65,15,92,199 ; subps %xmm15,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 65,15,88,199 ; addps %xmm15,%xmm0
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 65,15,92,210 ; subps %xmm10,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 65,15,88,210 ; addps %xmm10,%xmm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,40,92,36,96 ; movaps 0x60(%rsp),%xmm3
+ DB 15,40,100,36,112 ; movaps 0x70(%rsp),%xmm4
+ DB 15,40,172,36,128,0,0,0 ; movaps 0x80(%rsp),%xmm5
+ DB 15,40,180,36,144,0,0,0 ; movaps 0x90(%rsp),%xmm6
+ DB 15,40,188,36,160,0,0,0 ; movaps 0xa0(%rsp),%xmm7
+ DB 72,129,196,176,0,0,0 ; add $0xb0,%rsp
+ DB 91 ; pop %rbx
+ DB 255,224 ; jmpq *%rax
+
+PUBLIC _sk_clut_4D_sse2
+_sk_clut_4D_sse2 LABEL PROC
+ DB 83 ; push %rbx
+ DB 72,129,236,48,1,0,0 ; sub $0x130,%rsp
+ DB 15,41,188,36,32,1,0,0 ; movaps %xmm7,0x120(%rsp)
+ DB 15,41,180,36,16,1,0,0 ; movaps %xmm6,0x110(%rsp)
+ DB 15,41,172,36,0,1,0,0 ; movaps %xmm5,0x100(%rsp)
+ DB 15,41,164,36,240,0,0,0 ; movaps %xmm4,0xf0(%rsp)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 68,139,72,20 ; mov 0x14(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 102,65,15,110,226 ; movd %r10d,%xmm4
+ DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
+ DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 102,65,15,110,217 ; movd %r9d,%xmm3
+ DB 102,15,112,251,0 ; pshufd $0x0,%xmm3,%xmm7
+ DB 68,139,72,16 ; mov 0x10(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 102,65,15,110,226 ; movd %r10d,%xmm4
+ DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
+ DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 243,15,91,244 ; cvttps2dq %xmm4,%xmm6
+ DB 102,15,127,116,36,96 ; movdqa %xmm6,0x60(%rsp)
+ DB 68,15,40,204 ; movaps %xmm4,%xmm9
+ DB 68,15,41,140,36,160,0,0,0 ; movaps %xmm9,0xa0(%rsp)
+ DB 102,15,112,214,245 ; pshufd $0xf5,%xmm6,%xmm2
+ DB 102,15,111,230 ; movdqa %xmm6,%xmm4
+ DB 102,15,127,124,36,80 ; movdqa %xmm7,0x50(%rsp)
+ DB 102,15,244,231 ; pmuludq %xmm7,%xmm4
+ DB 102,15,112,228,232 ; pshufd $0xe8,%xmm4,%xmm4
+ DB 102,15,244,215 ; pmuludq %xmm7,%xmm2
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,98,226 ; punpckldq %xmm2,%xmm4
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,127,180,36,208,0,0,0 ; movdqa %xmm6,0xd0(%rsp)
+ DB 102,65,15,110,209 ; movd %r9d,%xmm2
+ DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,98,211 ; punpckldq %xmm3,%xmm2
+ DB 102,68,15,112,250,0 ; pshufd $0x0,%xmm2,%xmm15
+ DB 68,139,72,12 ; mov 0xc(%rax),%r9d
+ DB 69,141,81,255 ; lea -0x1(%r9),%r10d
+ DB 102,65,15,110,218 ; movd %r10d,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 15,91,227 ; cvtdq2ps %xmm3,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 243,15,91,220 ; cvttps2dq %xmm4,%xmm3
+ DB 68,15,40,220 ; movaps %xmm4,%xmm11
+ DB 68,15,41,92,36,16 ; movaps %xmm11,0x10(%rsp)
+ DB 102,15,127,92,36,64 ; movdqa %xmm3,0x40(%rsp)
+ DB 102,15,112,203,245 ; pshufd $0xf5,%xmm3,%xmm1
+ DB 102,65,15,244,223 ; pmuludq %xmm15,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,65,15,112,231,245 ; pshufd $0xf5,%xmm15,%xmm4
+ DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
+ DB 102,15,244,204 ; pmuludq %xmm4,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
+ DB 102,15,127,156,36,144,0,0,0 ; movdqa %xmm3,0x90(%rsp)
+ DB 102,65,15,110,201 ; movd %r9d,%xmm1
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 68,139,72,8 ; mov 0x8(%rax),%r9d
+ DB 65,255,201 ; dec %r9d
+ DB 102,65,15,110,209 ; movd %r9d,%xmm2
+ DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
+ DB 68,15,91,242 ; cvtdq2ps %xmm2,%xmm14
+ DB 68,15,89,240 ; mulps %xmm0,%xmm14
+ DB 102,15,112,193,0 ; pshufd $0x0,%xmm1,%xmm0
+ DB 243,69,15,91,230 ; cvttps2dq %xmm14,%xmm12
+ DB 102,65,15,111,204 ; movdqa %xmm12,%xmm1
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,225,232 ; pshufd $0xe8,%xmm1,%xmm4
+ DB 102,65,15,112,204,245 ; pshufd $0xf5,%xmm12,%xmm1
+ DB 102,68,15,112,232,245 ; pshufd $0xf5,%xmm0,%xmm13
+ DB 102,65,15,244,205 ; pmuludq %xmm13,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,225 ; punpckldq %xmm1,%xmm4
+ DB 102,15,127,100,36,32 ; movdqa %xmm4,0x20(%rsp)
+ DB 243,15,91,213 ; cvttps2dq %xmm5,%xmm2
+ DB 102,15,127,148,36,176,0,0,0 ; movdqa %xmm2,0xb0(%rsp)
+ DB 68,15,40,197 ; movaps %xmm5,%xmm8
+ DB 68,15,41,132,36,224,0,0,0 ; movaps %xmm8,0xe0(%rsp)
+ DB 102,15,111,206 ; movdqa %xmm6,%xmm1
+ DB 102,15,254,202 ; paddd %xmm2,%xmm1
+ DB 102,15,111,211 ; movdqa %xmm3,%xmm2
+ DB 102,15,254,209 ; paddd %xmm1,%xmm2
+ DB 102,15,111,220 ; movdqa %xmm4,%xmm3
+ DB 102,15,254,218 ; paddd %xmm2,%xmm3
+ DB 102,68,15,111,21,161,42,0,0 ; movdqa 0x2aa1(%rip),%xmm10 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,15,112,235,245 ; pshufd $0xf5,%xmm3,%xmm5
+ DB 102,65,15,244,218 ; pmuludq %xmm10,%xmm3
+ DB 102,15,112,227,232 ; pshufd $0xe8,%xmm3,%xmm4
+ DB 102,65,15,244,234 ; pmuludq %xmm10,%xmm5
+ DB 102,15,112,221,232 ; pshufd $0xe8,%xmm5,%xmm3
+ DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
+ DB 102,15,112,220,229 ; pshufd $0xe5,%xmm4,%xmm3
+ DB 102,65,15,126,217 ; movd %xmm3,%r9d
+ DB 102,15,112,220,78 ; pshufd $0x4e,%xmm4,%xmm3
+ DB 102,65,15,126,218 ; movd %xmm3,%r10d
+ DB 102,15,112,220,231 ; pshufd $0xe7,%xmm4,%xmm3
+ DB 102,65,15,126,219 ; movd %xmm3,%r11d
+ DB 72,139,24 ; mov (%rax),%rbx
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,52,147 ; movss (%rbx,%r10,4),%xmm6
+ DB 15,20,222 ; unpcklps %xmm6,%xmm3
+ DB 15,20,221 ; unpcklps %xmm5,%xmm3
+ DB 102,15,111,236 ; movdqa %xmm4,%xmm5
+ DB 102,15,254,45,67,42,0,0 ; paddd 0x2a43(%rip),%xmm5 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
+ DB 102,73,15,126,241 ; movq %xmm6,%r9
+ DB 102,73,15,126,234 ; movq %xmm5,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,52,155 ; movss (%rbx,%r11,4),%xmm6
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,247 ; unpcklps %xmm7,%xmm6
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 102,15,254,37,9,42,0,0 ; paddd 0x2a09(%rip),%xmm4 # 9ce0 <_sk_clut_4D_sse2+0x2c83>
+ DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,226 ; movq %xmm4,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,44,155 ; movss (%rbx,%r11,4),%xmm5
+ DB 15,20,229 ; unpcklps %xmm5,%xmm4
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,239 ; unpcklps %xmm7,%xmm5
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 15,40,61,144,41,0,0 ; movaps 0x2990(%rip),%xmm7 # 9cb0 <_sk_clut_4D_sse2+0x2c53>
+ DB 68,15,88,199 ; addps %xmm7,%xmm8
+ DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
+ DB 68,15,88,207 ; addps %xmm7,%xmm9
+ DB 68,15,41,140,36,192,0,0,0 ; movaps %xmm9,0xc0(%rsp)
+ DB 69,15,40,195 ; movaps %xmm11,%xmm8
+ DB 68,15,88,199 ; addps %xmm7,%xmm8
+ DB 65,15,88,254 ; addps %xmm14,%xmm7
+ DB 243,15,91,255 ; cvttps2dq %xmm7,%xmm7
+ DB 102,15,244,199 ; pmuludq %xmm7,%xmm0
+ DB 102,15,112,255,245 ; pshufd $0xf5,%xmm7,%xmm7
+ DB 102,65,15,244,253 ; pmuludq %xmm13,%xmm7
+ DB 102,68,15,112,216,232 ; pshufd $0xe8,%xmm0,%xmm11
+ DB 102,15,112,199,232 ; pshufd $0xe8,%xmm7,%xmm0
+ DB 102,68,15,98,216 ; punpckldq %xmm0,%xmm11
+ DB 102,65,15,254,211 ; paddd %xmm11,%xmm2
+ DB 102,68,15,127,156,36,128,0,0,0 ; movdqa %xmm11,0x80(%rsp)
+ DB 102,15,112,250,245 ; pshufd $0xf5,%xmm2,%xmm7
+ DB 102,65,15,244,210 ; pmuludq %xmm10,%xmm2
+ DB 102,15,112,194,232 ; pshufd $0xe8,%xmm2,%xmm0
+ DB 102,65,15,244,250 ; pmuludq %xmm10,%xmm7
+ DB 102,15,112,215,232 ; pshufd $0xe8,%xmm7,%xmm2
+ DB 102,15,98,194 ; punpckldq %xmm2,%xmm0
+ DB 102,15,112,208,229 ; pshufd $0xe5,%xmm0,%xmm2
+ DB 102,65,15,126,210 ; movd %xmm2,%r10d
+ DB 102,15,112,208,78 ; pshufd $0x4e,%xmm0,%xmm2
+ DB 102,65,15,126,209 ; movd %xmm2,%r9d
+ DB 102,15,112,208,231 ; pshufd $0xe7,%xmm0,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,60,147 ; movss (%rbx,%r10,4),%xmm7
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,68,15,16,44,131 ; movss (%rbx,%rax,4),%xmm13
+ DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
+ DB 68,15,20,234 ; unpcklps %xmm2,%xmm13
+ DB 68,15,20,239 ; unpcklps %xmm7,%xmm13
+ DB 102,15,111,208 ; movdqa %xmm0,%xmm2
+ DB 102,15,254,21,240,40,0,0 ; paddd 0x28f0(%rip),%xmm2 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
+ DB 102,73,15,126,249 ; movq %xmm7,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,70,15,16,12,139 ; movss (%rbx,%r9,4),%xmm9
+ DB 65,15,20,209 ; unpcklps %xmm9,%xmm2
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 102,15,254,5,181,40,0,0 ; paddd 0x28b5(%rip),%xmm0 # 9ce0 <_sk_clut_4D_sse2+0x2c83>
+ DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7
+ DB 102,73,15,126,249 ; movq %xmm7,%r9
+ DB 102,73,15,126,194 ; movq %xmm0,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,4,155 ; movss (%rbx,%r11,4),%xmm0
+ DB 15,20,248 ; unpcklps %xmm0,%xmm7
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,196 ; unpcklps %xmm4,%xmm0
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 65,15,91,228 ; cvtdq2ps %xmm12,%xmm4
+ DB 68,15,92,244 ; subps %xmm4,%xmm14
+ DB 68,15,92,235 ; subps %xmm3,%xmm13
+ DB 69,15,89,238 ; mulps %xmm14,%xmm13
+ DB 68,15,88,235 ; addps %xmm3,%xmm13
+ DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 65,15,89,214 ; mulps %xmm14,%xmm2
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 65,15,89,198 ; mulps %xmm14,%xmm0
+ DB 69,15,40,206 ; movaps %xmm14,%xmm9
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 243,65,15,91,216 ; cvttps2dq %xmm8,%xmm3
+ DB 102,68,15,244,251 ; pmuludq %xmm3,%xmm15
+ DB 102,15,112,219,245 ; pshufd $0xf5,%xmm3,%xmm3
+ DB 102,15,244,28,36 ; pmuludq (%rsp),%xmm3
+ DB 102,65,15,112,231,232 ; pshufd $0xe8,%xmm15,%xmm4
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
+ DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
+ DB 102,15,254,204 ; paddd %xmm4,%xmm1
+ DB 102,15,111,217 ; movdqa %xmm1,%xmm3
+ DB 102,15,254,92,36,32 ; paddd 0x20(%rsp),%xmm3
+ DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
+ DB 102,68,15,111,53,227,39,0,0 ; movdqa 0x27e3(%rip),%xmm14 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4
+ DB 102,15,112,228,232 ; pshufd $0xe8,%xmm4,%xmm4
+ DB 102,15,98,220 ; punpckldq %xmm4,%xmm3
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
+ DB 102,65,15,126,226 ; movd %xmm4,%r10d
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,65,15,126,225 ; movd %xmm4,%r9d
+ DB 102,15,112,227,231 ; pshufd $0xe7,%xmm3,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,44,147 ; movss (%rbx,%r10,4),%xmm5
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,68,15,16,36,131 ; movss (%rbx,%rax,4),%xmm12
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 68,15,20,228 ; unpcklps %xmm4,%xmm12
+ DB 68,15,20,229 ; unpcklps %xmm5,%xmm12
+ DB 102,15,111,227 ; movdqa %xmm3,%xmm4
+ DB 102,15,111,61,140,39,0,0 ; movdqa 0x278c(%rip),%xmm7 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,254,231 ; paddd %xmm7,%xmm4
+ DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,226 ; movq %xmm4,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,44,155 ; movss (%rbx,%r11,4),%xmm5
+ DB 15,20,229 ; unpcklps %xmm5,%xmm4
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 102,68,15,111,5,77,39,0,0 ; movdqa 0x274d(%rip),%xmm8 # 9ce0 <_sk_clut_4D_sse2+0x2c83>
+ DB 102,65,15,254,216 ; paddd %xmm8,%xmm3
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,36,155 ; movss (%rbx,%r11,4),%xmm4
+ DB 15,20,220 ; unpcklps %xmm4,%xmm3
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 102,65,15,254,203 ; paddd %xmm11,%xmm1
+ DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
+ DB 102,65,15,244,206 ; pmuludq %xmm14,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,98,203 ; punpckldq %xmm3,%xmm1
+ DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3
+ DB 102,65,15,126,218 ; movd %xmm3,%r10d
+ DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
+ DB 102,65,15,126,217 ; movd %xmm3,%r9d
+ DB 102,15,112,217,231 ; pshufd $0xe7,%xmm1,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,36,147 ; movss (%rbx,%r10,4),%xmm4
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,68,15,16,60,131 ; movss (%rbx,%rax,4),%xmm15
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 68,15,20,251 ; unpcklps %xmm3,%xmm15
+ DB 68,15,20,252 ; unpcklps %xmm4,%xmm15
+ DB 102,15,111,217 ; movdqa %xmm1,%xmm3
+ DB 102,15,254,223 ; paddd %xmm7,%xmm3
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,52,131 ; movss (%rbx,%rax,4),%xmm14
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 68,15,20,247 ; unpcklps %xmm7,%xmm14
+ DB 68,15,20,244 ; unpcklps %xmm4,%xmm14
+ DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
+ DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,36,155 ; movss (%rbx,%r11,4),%xmm4
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,20,131 ; movss (%rbx,%rax,4),%xmm10
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 68,15,20,215 ; unpcklps %xmm7,%xmm10
+ DB 68,15,20,209 ; unpcklps %xmm1,%xmm10
+ DB 69,15,92,252 ; subps %xmm12,%xmm15
+ DB 68,15,41,76,36,112 ; movaps %xmm9,0x70(%rsp)
+ DB 69,15,89,249 ; mulps %xmm9,%xmm15
+ DB 69,15,88,252 ; addps %xmm12,%xmm15
+ DB 68,15,92,246 ; subps %xmm6,%xmm14
+ DB 69,15,89,241 ; mulps %xmm9,%xmm14
+ DB 68,15,88,246 ; addps %xmm6,%xmm14
+ DB 68,15,92,213 ; subps %xmm5,%xmm10
+ DB 69,15,89,209 ; mulps %xmm9,%xmm10
+ DB 68,15,88,213 ; addps %xmm5,%xmm10
+ DB 15,91,76,36,64 ; cvtdq2ps 0x40(%rsp),%xmm1
+ DB 15,40,92,36,16 ; movaps 0x10(%rsp),%xmm3
+ DB 15,92,217 ; subps %xmm1,%xmm3
+ DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
+ DB 69,15,92,253 ; subps %xmm13,%xmm15
+ DB 68,15,89,251 ; mulps %xmm3,%xmm15
+ DB 69,15,88,253 ; addps %xmm13,%xmm15
+ DB 68,15,92,242 ; subps %xmm2,%xmm14
+ DB 68,15,89,243 ; mulps %xmm3,%xmm14
+ DB 68,15,88,242 ; addps %xmm2,%xmm14
+ DB 68,15,92,208 ; subps %xmm0,%xmm10
+ DB 68,15,89,211 ; mulps %xmm3,%xmm10
+ DB 68,15,88,208 ; addps %xmm0,%xmm10
+ DB 243,15,91,132,36,192,0,0,0 ; cvttps2dq 0xc0(%rsp),%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,84,36,80 ; movdqa 0x50(%rsp),%xmm2
+ DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
+ DB 102,15,112,193,232 ; pshufd $0xe8,%xmm1,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,127,84,36,64 ; movdqa %xmm2,0x40(%rsp)
+ DB 102,68,15,111,218 ; movdqa %xmm2,%xmm11
+ DB 102,68,15,254,156,36,176,0,0,0 ; paddd 0xb0(%rsp),%xmm11
+ DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
+ DB 102,15,254,132,36,144,0,0,0 ; paddd 0x90(%rsp),%xmm0
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,68,15,111,108,36,32 ; movdqa 0x20(%rsp),%xmm13
+ DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
+ DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
+ DB 102,15,111,29,32,37,0,0 ; movdqa 0x2520(%rip),%xmm3 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
+ DB 102,15,111,251 ; movdqa %xmm3,%xmm7
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
+ DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
+ DB 102,65,15,126,210 ; movd %xmm2,%r10d
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,65,15,126,209 ; movd %xmm2,%r9d
+ DB 102,15,112,209,231 ; pshufd $0xe7,%xmm1,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,44,147 ; movss (%rbx,%r10,4),%xmm5
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,68,15,16,12,131 ; movss (%rbx,%rax,4),%xmm9
+ DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
+ DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
+ DB 68,15,20,205 ; unpcklps %xmm5,%xmm9
+ DB 102,15,111,209 ; movdqa %xmm1,%xmm2
+ DB 102,15,111,29,199,36,0,0 ; movdqa 0x24c7(%rip),%xmm3 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,52,139 ; movss (%rbx,%r9,4),%xmm6
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
+ DB 102,69,15,111,224 ; movdqa %xmm8,%xmm12
+ DB 102,65,15,254,204 ; paddd %xmm12,%xmm1
+ DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,44,155 ; movss (%rbx,%r11,4),%xmm5
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 102,15,111,164,36,128,0,0,0 ; movdqa 0x80(%rsp),%xmm4
+ DB 102,15,254,196 ; paddd %xmm4,%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,244,199 ; pmuludq %xmm7,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,244,207 ; pmuludq %xmm7,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,65,15,126,202 ; movd %xmm1,%r10d
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,65,15,126,201 ; movd %xmm1,%r9d
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,44,147 ; movss (%rbx,%r10,4),%xmm5
+ DB 15,20,233 ; unpcklps %xmm1,%xmm5
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,68,15,16,4,131 ; movss (%rbx,%rax,4),%xmm8
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 68,15,20,199 ; unpcklps %xmm7,%xmm8
+ DB 68,15,20,197 ; unpcklps %xmm5,%xmm8
+ DB 102,15,111,232 ; movdqa %xmm0,%xmm5
+ DB 102,15,254,235 ; paddd %xmm3,%xmm5
+ DB 102,15,112,253,78 ; pshufd $0x4e,%xmm5,%xmm7
+ DB 102,73,15,126,249 ; movq %xmm7,%r9
+ DB 102,73,15,126,234 ; movq %xmm5,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,44,155 ; movss (%rbx,%r11,4),%xmm5
+ DB 15,20,253 ; unpcklps %xmm5,%xmm7
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 15,20,239 ; unpcklps %xmm7,%xmm5
+ DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
+ DB 102,15,112,216,78 ; pshufd $0x4e,%xmm0,%xmm3
+ DB 102,73,15,126,217 ; movq %xmm3,%r9
+ DB 102,73,15,126,194 ; movq %xmm0,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,4,155 ; movss (%rbx,%r11,4),%xmm0
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 15,20,203 ; unpcklps %xmm3,%xmm1
+ DB 69,15,92,193 ; subps %xmm9,%xmm8
+ DB 15,40,68,36,112 ; movaps 0x70(%rsp),%xmm0
+ DB 68,15,89,192 ; mulps %xmm0,%xmm8
+ DB 69,15,88,193 ; addps %xmm9,%xmm8
+ DB 15,92,234 ; subps %xmm2,%xmm5
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 68,15,40,224 ; movaps %xmm0,%xmm12
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 102,68,15,254,28,36 ; paddd (%rsp),%xmm11
+ DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2
+ DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
+ DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
+ DB 102,15,111,5,229,34,0,0 ; movdqa 0x22e5(%rip),%xmm0 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
+ DB 102,15,112,250,232 ; pshufd $0xe8,%xmm2,%xmm7
+ DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
+ DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
+ DB 102,15,98,250 ; punpckldq %xmm2,%xmm7
+ DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2
+ DB 102,65,15,126,210 ; movd %xmm2,%r10d
+ DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
+ DB 102,65,15,126,209 ; movd %xmm2,%r9d
+ DB 102,15,112,215,231 ; pshufd $0xe7,%xmm7,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,28,147 ; movss (%rbx,%r10,4),%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 243,68,15,16,12,131 ; movss (%rbx,%rax,4),%xmm9
+ DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
+ DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
+ DB 68,15,20,203 ; unpcklps %xmm3,%xmm9
+ DB 102,15,111,215 ; movdqa %xmm7,%xmm2
+ DB 102,15,111,5,144,34,0,0 ; movdqa 0x2290(%rip),%xmm0 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,254,208 ; paddd %xmm0,%xmm2
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,73,15,126,217 ; movq %xmm3,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,211 ; unpcklps %xmm3,%xmm2
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 15,20,243 ; unpcklps %xmm3,%xmm6
+ DB 15,20,242 ; unpcklps %xmm2,%xmm6
+ DB 102,68,15,111,45,81,34,0,0 ; movdqa 0x2251(%rip),%xmm13 # 9ce0 <_sk_clut_4D_sse2+0x2c83>
+ DB 102,65,15,254,253 ; paddd %xmm13,%xmm7
+ DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
+ DB 102,73,15,126,209 ; movq %xmm2,%r9
+ DB 102,73,15,126,250 ; movq %xmm7,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,211 ; unpcklps %xmm3,%xmm2
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 15,20,251 ; unpcklps %xmm3,%xmm7
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 102,68,15,254,220 ; paddd %xmm4,%xmm11
+ DB 102,65,15,112,219,245 ; pshufd $0xf5,%xmm11,%xmm3
+ DB 102,15,111,37,215,33,0,0 ; movdqa 0x21d7(%rip),%xmm4 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,68,15,244,220 ; pmuludq %xmm4,%xmm11
+ DB 102,65,15,112,211,232 ; pshufd $0xe8,%xmm11,%xmm2
+ DB 102,15,244,220 ; pmuludq %xmm4,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,98,211 ; punpckldq %xmm3,%xmm2
+ DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
+ DB 102,65,15,126,218 ; movd %xmm3,%r10d
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,65,15,126,217 ; movd %xmm3,%r9d
+ DB 102,15,112,218,231 ; pshufd $0xe7,%xmm2,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,68,15,16,28,131 ; movss (%rbx,%rax,4),%xmm11
+ DB 243,66,15,16,28,147 ; movss (%rbx,%r10,4),%xmm3
+ DB 65,15,20,219 ; unpcklps %xmm11,%xmm3
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,68,15,16,28,131 ; movss (%rbx,%rax,4),%xmm11
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 68,15,20,220 ; unpcklps %xmm4,%xmm11
+ DB 68,15,20,219 ; unpcklps %xmm3,%xmm11
+ DB 102,15,111,218 ; movdqa %xmm2,%xmm3
+ DB 102,15,254,216 ; paddd %xmm0,%xmm3
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,36,155 ; movss (%rbx,%r11,4),%xmm4
+ DB 15,20,220 ; unpcklps %xmm4,%xmm3
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,196 ; unpcklps %xmm4,%xmm0
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,73,15,126,217 ; movq %xmm3,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,211 ; unpcklps %xmm3,%xmm2
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,44,131 ; movss (%rbx,%rax,4),%xmm13
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 68,15,20,235 ; unpcklps %xmm3,%xmm13
+ DB 68,15,20,234 ; unpcklps %xmm2,%xmm13
+ DB 69,15,92,217 ; subps %xmm9,%xmm11
+ DB 69,15,89,220 ; mulps %xmm12,%xmm11
+ DB 69,15,88,217 ; addps %xmm9,%xmm11
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 65,15,89,196 ; mulps %xmm12,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 68,15,92,239 ; subps %xmm7,%xmm13
+ DB 69,15,89,236 ; mulps %xmm12,%xmm13
+ DB 68,15,88,239 ; addps %xmm7,%xmm13
+ DB 69,15,92,216 ; subps %xmm8,%xmm11
+ DB 15,40,92,36,16 ; movaps 0x10(%rsp),%xmm3
+ DB 68,15,89,219 ; mulps %xmm3,%xmm11
+ DB 69,15,88,216 ; addps %xmm8,%xmm11
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 68,15,92,233 ; subps %xmm1,%xmm13
+ DB 68,15,89,235 ; mulps %xmm3,%xmm13
+ DB 68,15,88,233 ; addps %xmm1,%xmm13
+ DB 15,91,68,36,96 ; cvtdq2ps 0x60(%rsp),%xmm0
+ DB 15,40,140,36,160,0,0,0 ; movaps 0xa0(%rsp),%xmm1
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,41,140,36,160,0,0,0 ; movaps %xmm1,0xa0(%rsp)
+ DB 69,15,92,223 ; subps %xmm15,%xmm11
+ DB 68,15,89,217 ; mulps %xmm1,%xmm11
+ DB 69,15,88,223 ; addps %xmm15,%xmm11
+ DB 68,15,41,92,36,96 ; movaps %xmm11,0x60(%rsp)
+ DB 65,15,92,214 ; subps %xmm14,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 65,15,88,214 ; addps %xmm14,%xmm2
+ DB 15,41,84,36,80 ; movaps %xmm2,0x50(%rsp)
+ DB 69,15,92,234 ; subps %xmm10,%xmm13
+ DB 68,15,89,233 ; mulps %xmm1,%xmm13
+ DB 69,15,88,234 ; addps %xmm10,%xmm13
+ DB 243,15,91,68,36,48 ; cvttps2dq 0x30(%rsp),%xmm0
+ DB 102,15,127,68,36,48 ; movdqa %xmm0,0x30(%rsp)
+ DB 102,15,111,140,36,208,0,0,0 ; movdqa 0xd0(%rsp),%xmm1
+ DB 102,15,254,200 ; paddd %xmm0,%xmm1
+ DB 102,15,111,132,36,144,0,0,0 ; movdqa 0x90(%rsp),%xmm0
+ DB 102,15,254,193 ; paddd %xmm1,%xmm0
+ DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
+ DB 102,68,15,111,84,36,32 ; movdqa 0x20(%rsp),%xmm10
+ DB 102,65,15,111,202 ; movdqa %xmm10,%xmm1
+ DB 102,15,254,200 ; paddd %xmm0,%xmm1
+ DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
+ DB 102,15,111,29,13,32,0,0 ; movdqa 0x200d(%rip),%xmm3 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
+ DB 102,68,15,111,243 ; movdqa %xmm3,%xmm14
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
+ DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
+ DB 102,65,15,126,210 ; movd %xmm2,%r10d
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,65,15,126,209 ; movd %xmm2,%r9d
+ DB 102,15,112,209,231 ; pshufd $0xe7,%xmm1,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,28,147 ; movss (%rbx,%r10,4),%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 15,20,211 ; unpcklps %xmm3,%xmm2
+ DB 102,15,111,217 ; movdqa %xmm1,%xmm3
+ DB 102,15,111,61,182,31,0,0 ; movdqa 0x1fb6(%rip),%xmm7 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,254,223 ; paddd %xmm7,%xmm3
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,221 ; unpcklps %xmm5,%xmm3
+ DB 15,20,220 ; unpcklps %xmm4,%xmm3
+ DB 102,68,15,111,13,119,31,0,0 ; movdqa 0x1f77(%rip),%xmm9 # 9ce0 <_sk_clut_4D_sse2+0x2c83>
+ DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
+ DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,36,155 ; movss (%rbx,%r11,4),%xmm4
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 15,20,229 ; unpcklps %xmm5,%xmm4
+ DB 15,20,225 ; unpcklps %xmm1,%xmm4
+ DB 102,68,15,111,188,36,128,0,0,0 ; movdqa 0x80(%rsp),%xmm15
+ DB 102,65,15,254,199 ; paddd %xmm15,%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,65,15,244,198 ; pmuludq %xmm14,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,65,15,244,206 ; pmuludq %xmm14,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,65,15,126,202 ; movd %xmm1,%r10d
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,65,15,126,201 ; movd %xmm1,%r9d
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,44,147 ; movss (%rbx,%r10,4),%xmm5
+ DB 15,20,233 ; unpcklps %xmm1,%xmm5
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,52,139 ; movss (%rbx,%r9,4),%xmm6
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 102,15,111,232 ; movdqa %xmm0,%xmm5
+ DB 102,15,254,239 ; paddd %xmm7,%xmm5
+ DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
+ DB 102,73,15,126,241 ; movq %xmm6,%r9
+ DB 102,73,15,126,234 ; movq %xmm5,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,44,155 ; movss (%rbx,%r11,4),%xmm5
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,239 ; unpcklps %xmm7,%xmm5
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 102,65,15,254,193 ; paddd %xmm9,%xmm0
+ DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
+ DB 102,73,15,126,241 ; movq %xmm6,%r9
+ DB 102,73,15,126,194 ; movq %xmm0,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,4,155 ; movss (%rbx,%r11,4),%xmm0
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,20,198 ; unpcklps %xmm6,%xmm0
+ DB 15,92,202 ; subps %xmm2,%xmm1
+ DB 69,15,40,196 ; movaps %xmm12,%xmm8
+ DB 65,15,89,200 ; mulps %xmm8,%xmm1
+ DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,92,235 ; subps %xmm3,%xmm5
+ DB 65,15,89,232 ; mulps %xmm8,%xmm5
+ DB 15,88,235 ; addps %xmm3,%xmm5
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 102,65,15,111,219 ; movdqa %xmm11,%xmm3
+ DB 102,15,254,28,36 ; paddd (%rsp),%xmm3
+ DB 102,15,111,211 ; movdqa %xmm3,%xmm2
+ DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
+ DB 102,65,15,254,210 ; paddd %xmm10,%xmm2
+ DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
+ DB 102,65,15,244,214 ; pmuludq %xmm14,%xmm2
+ DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4
+ DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
+ DB 102,69,15,111,230 ; movdqa %xmm14,%xmm12
+ DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
+ DB 102,15,98,226 ; punpckldq %xmm2,%xmm4
+ DB 102,15,112,212,229 ; pshufd $0xe5,%xmm4,%xmm2
+ DB 102,65,15,126,210 ; movd %xmm2,%r10d
+ DB 102,15,112,212,78 ; pshufd $0x4e,%xmm4,%xmm2
+ DB 102,65,15,126,209 ; movd %xmm2,%r9d
+ DB 102,15,112,212,231 ; pshufd $0xe7,%xmm4,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,28,147 ; movss (%rbx,%r10,4),%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 243,68,15,16,52,131 ; movss (%rbx,%rax,4),%xmm14
+ DB 243,66,15,16,52,139 ; movss (%rbx,%r9,4),%xmm6
+ DB 68,15,20,246 ; unpcklps %xmm6,%xmm14
+ DB 68,15,20,243 ; unpcklps %xmm3,%xmm14
+ DB 102,15,111,220 ; movdqa %xmm4,%xmm3
+ DB 102,68,15,111,21,119,29,0,0 ; movdqa 0x1d77(%rip),%xmm10 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,65,15,254,218 ; paddd %xmm10,%xmm3
+ DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
+ DB 102,73,15,126,241 ; movq %xmm6,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,28,155 ; movss (%rbx,%r11,4),%xmm3
+ DB 15,20,243 ; unpcklps %xmm3,%xmm6
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,223 ; unpcklps %xmm7,%xmm3
+ DB 15,20,222 ; unpcklps %xmm6,%xmm3
+ DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
+ DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
+ DB 102,73,15,126,241 ; movq %xmm6,%r9
+ DB 102,73,15,126,226 ; movq %xmm4,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,52,131 ; movss (%rbx,%rax,4),%xmm6
+ DB 243,66,15,16,36,155 ; movss (%rbx,%r11,4),%xmm4
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,231 ; unpcklps %xmm7,%xmm4
+ DB 15,20,230 ; unpcklps %xmm6,%xmm4
+ DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2
+ DB 102,65,15,254,215 ; paddd %xmm15,%xmm2
+ DB 102,15,112,250,245 ; pshufd $0xf5,%xmm2,%xmm7
+ DB 102,65,15,244,212 ; pmuludq %xmm12,%xmm2
+ DB 102,15,112,242,232 ; pshufd $0xe8,%xmm2,%xmm6
+ DB 102,65,15,244,252 ; pmuludq %xmm12,%xmm7
+ DB 102,15,112,255,232 ; pshufd $0xe8,%xmm7,%xmm7
+ DB 102,15,98,247 ; punpckldq %xmm7,%xmm6
+ DB 102,15,112,254,229 ; pshufd $0xe5,%xmm6,%xmm7
+ DB 102,65,15,126,250 ; movd %xmm7,%r10d
+ DB 102,15,112,254,78 ; pshufd $0x4e,%xmm6,%xmm7
+ DB 102,65,15,126,249 ; movd %xmm7,%r9d
+ DB 102,15,112,254,231 ; pshufd $0xe7,%xmm6,%xmm7
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,20,147 ; movss (%rbx,%r10,4),%xmm2
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 243,68,15,16,36,131 ; movss (%rbx,%rax,4),%xmm12
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 68,15,20,231 ; unpcklps %xmm7,%xmm12
+ DB 68,15,20,226 ; unpcklps %xmm2,%xmm12
+ DB 102,15,111,214 ; movdqa %xmm6,%xmm2
+ DB 102,65,15,254,210 ; paddd %xmm10,%xmm2
+ DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
+ DB 102,73,15,126,249 ; movq %xmm7,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,60,155 ; movss (%rbx,%r11,4),%xmm7
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,28,131 ; movss (%rbx,%rax,4),%xmm11
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 68,15,20,223 ; unpcklps %xmm7,%xmm11
+ DB 68,15,20,218 ; unpcklps %xmm2,%xmm11
+ DB 102,65,15,254,241 ; paddd %xmm9,%xmm6
+ DB 102,15,112,214,78 ; pshufd $0x4e,%xmm6,%xmm2
+ DB 102,73,15,126,209 ; movq %xmm2,%r9
+ DB 102,73,15,126,242 ; movq %xmm6,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,52,155 ; movss (%rbx,%r11,4),%xmm6
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,20,131 ; movss (%rbx,%rax,4),%xmm10
+ DB 243,66,15,16,52,139 ; movss (%rbx,%r9,4),%xmm6
+ DB 68,15,20,214 ; unpcklps %xmm6,%xmm10
+ DB 68,15,20,210 ; unpcklps %xmm2,%xmm10
+ DB 69,15,92,230 ; subps %xmm14,%xmm12
+ DB 69,15,89,224 ; mulps %xmm8,%xmm12
+ DB 69,15,88,230 ; addps %xmm14,%xmm12
+ DB 68,15,92,219 ; subps %xmm3,%xmm11
+ DB 69,15,89,216 ; mulps %xmm8,%xmm11
+ DB 68,15,88,219 ; addps %xmm3,%xmm11
+ DB 68,15,92,212 ; subps %xmm4,%xmm10
+ DB 69,15,89,208 ; mulps %xmm8,%xmm10
+ DB 68,15,88,212 ; addps %xmm4,%xmm10
+ DB 68,15,92,225 ; subps %xmm1,%xmm12
+ DB 15,40,84,36,16 ; movaps 0x10(%rsp),%xmm2
+ DB 68,15,89,226 ; mulps %xmm2,%xmm12
+ DB 68,15,88,225 ; addps %xmm1,%xmm12
+ DB 68,15,92,221 ; subps %xmm5,%xmm11
+ DB 68,15,89,218 ; mulps %xmm2,%xmm11
+ DB 68,15,88,221 ; addps %xmm5,%xmm11
+ DB 68,15,92,208 ; subps %xmm0,%xmm10
+ DB 68,15,89,210 ; mulps %xmm2,%xmm10
+ DB 68,15,88,208 ; addps %xmm0,%xmm10
+ DB 102,15,111,68,36,64 ; movdqa 0x40(%rsp),%xmm0
+ DB 102,15,254,68,36,48 ; paddd 0x30(%rsp),%xmm0
+ DB 102,15,111,140,36,144,0,0,0 ; movdqa 0x90(%rsp),%xmm1
+ DB 102,15,254,200 ; paddd %xmm0,%xmm1
+ DB 102,15,111,248 ; movdqa %xmm0,%xmm7
+ DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,15,111,233 ; movdqa %xmm1,%xmm5
+ DB 102,15,111,116,36,32 ; movdqa 0x20(%rsp),%xmm6
+ DB 102,15,254,198 ; paddd %xmm6,%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,29,78,27,0,0 ; movdqa 0x1b4e(%rip),%xmm3 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
+ DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
+ DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
+ DB 102,68,15,111,243 ; movdqa %xmm3,%xmm14
+ DB 102,15,112,193,232 ; pshufd $0xe8,%xmm1,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,65,15,126,194 ; movd %xmm0,%r10d
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,65,15,126,193 ; movd %xmm0,%r9d
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,12,147 ; movss (%rbx,%r10,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 102,15,111,202 ; movdqa %xmm2,%xmm1
+ DB 102,68,15,111,5,246,26,0,0 ; movdqa 0x1af6(%rip),%xmm8 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
+ DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
+ DB 102,73,15,126,217 ; movq %xmm3,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 15,20,203 ; unpcklps %xmm3,%xmm1
+ DB 102,65,15,254,209 ; paddd %xmm9,%xmm2
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,73,15,126,217 ; movq %xmm3,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 15,20,211 ; unpcklps %xmm3,%xmm2
+ DB 102,15,111,221 ; movdqa %xmm5,%xmm3
+ DB 102,65,15,254,223 ; paddd %xmm15,%xmm3
+ DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
+ DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4
+ DB 102,15,112,228,232 ; pshufd $0xe8,%xmm4,%xmm4
+ DB 102,15,98,220 ; punpckldq %xmm4,%xmm3
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
+ DB 102,65,15,126,226 ; movd %xmm4,%r10d
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,65,15,126,225 ; movd %xmm4,%r9d
+ DB 102,15,112,227,231 ; pshufd $0xe7,%xmm3,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,44,147 ; movss (%rbx,%r10,4),%xmm5
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,68,15,16,52,131 ; movss (%rbx,%rax,4),%xmm14
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 68,15,20,244 ; unpcklps %xmm4,%xmm14
+ DB 68,15,20,245 ; unpcklps %xmm5,%xmm14
+ DB 102,15,111,227 ; movdqa %xmm3,%xmm4
+ DB 102,65,15,254,224 ; paddd %xmm8,%xmm4
+ DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
+ DB 102,73,15,126,233 ; movq %xmm5,%r9
+ DB 102,73,15,126,226 ; movq %xmm4,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,44,155 ; movss (%rbx,%r11,4),%xmm5
+ DB 15,20,229 ; unpcklps %xmm5,%xmm4
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,68,15,16,4,131 ; movss (%rbx,%rax,4),%xmm8
+ DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
+ DB 68,15,20,197 ; unpcklps %xmm5,%xmm8
+ DB 68,15,20,196 ; unpcklps %xmm4,%xmm8
+ DB 102,65,15,254,217 ; paddd %xmm9,%xmm3
+ DB 102,69,15,111,249 ; movdqa %xmm9,%xmm15
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,73,15,126,225 ; movq %xmm4,%r9
+ DB 102,73,15,126,218 ; movq %xmm3,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,36,155 ; movss (%rbx,%r11,4),%xmm4
+ DB 15,20,220 ; unpcklps %xmm4,%xmm3
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,44,131 ; movss (%rbx,%rax,4),%xmm5
+ DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 68,15,92,240 ; subps %xmm0,%xmm14
+ DB 15,40,92,36,112 ; movaps 0x70(%rsp),%xmm3
+ DB 68,15,89,243 ; mulps %xmm3,%xmm14
+ DB 68,15,88,240 ; addps %xmm0,%xmm14
+ DB 68,15,92,193 ; subps %xmm1,%xmm8
+ DB 68,15,89,195 ; mulps %xmm3,%xmm8
+ DB 68,15,88,193 ; addps %xmm1,%xmm8
+ DB 15,92,234 ; subps %xmm2,%xmm5
+ DB 15,89,235 ; mulps %xmm3,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 102,15,254,60,36 ; paddd (%rsp),%xmm7
+ DB 102,15,254,247 ; paddd %xmm7,%xmm6
+ DB 102,15,112,206,245 ; pshufd $0xf5,%xmm6,%xmm1
+ DB 102,15,111,21,25,25,0,0 ; movdqa 0x1919(%rip),%xmm2 # 9cc0 <_sk_clut_4D_sse2+0x2c63>
+ DB 102,15,244,242 ; pmuludq %xmm2,%xmm6
+ DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,15,111,242 ; movdqa %xmm2,%xmm6
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,65,15,126,202 ; movd %xmm1,%r10d
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,65,15,126,201 ; movd %xmm1,%r9d
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,20,147 ; movss (%rbx,%r10,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,68,15,16,12,131 ; movss (%rbx,%rax,4),%xmm9
+ DB 243,66,15,16,12,139 ; movss (%rbx,%r9,4),%xmm1
+ DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
+ DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,254,13,192,24,0,0 ; paddd 0x18c0(%rip),%xmm1 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,73,15,126,209 ; movq %xmm2,%r9
+ DB 102,73,15,126,202 ; movq %xmm1,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,202 ; unpcklps %xmm2,%xmm1
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,36,131 ; movss (%rbx,%rax,4),%xmm4
+ DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
+ DB 15,20,226 ; unpcklps %xmm2,%xmm4
+ DB 15,20,225 ; unpcklps %xmm1,%xmm4
+ DB 102,65,15,254,199 ; paddd %xmm15,%xmm0
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,73,15,126,201 ; movq %xmm1,%r9
+ DB 102,73,15,126,194 ; movq %xmm0,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,28,131 ; movss (%rbx,%rax,4),%xmm3
+ DB 243,66,15,16,12,139 ; movss (%rbx,%r9,4),%xmm1
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 102,68,15,111,255 ; movdqa %xmm7,%xmm15
+ DB 102,68,15,254,188,36,128,0,0,0 ; paddd 0x80(%rsp),%xmm15
+ DB 102,65,15,112,199,245 ; pshufd $0xf5,%xmm15,%xmm0
+ DB 102,68,15,244,254 ; pmuludq %xmm6,%xmm15
+ DB 102,15,244,198 ; pmuludq %xmm6,%xmm0
+ DB 102,65,15,112,215,232 ; pshufd $0xe8,%xmm15,%xmm2
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,65,15,126,194 ; movd %xmm0,%r10d
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,65,15,126,193 ; movd %xmm0,%r9d
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,12,147 ; movss (%rbx,%r10,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,4,131 ; movss (%rbx,%rax,4),%xmm0
+ DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 102,15,111,53,194,23,0,0 ; movdqa 0x17c2(%rip),%xmm6 # 9cd0 <_sk_clut_4D_sse2+0x2c73>
+ DB 102,15,254,242 ; paddd %xmm2,%xmm6
+ DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1
+ DB 102,73,15,126,201 ; movq %xmm1,%r9
+ DB 102,73,15,126,242 ; movq %xmm6,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,12,155 ; movss (%rbx,%r11,4),%xmm1
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,12,131 ; movss (%rbx,%rax,4),%xmm1
+ DB 243,70,15,16,60,139 ; movss (%rbx,%r9,4),%xmm15
+ DB 65,15,20,207 ; unpcklps %xmm15,%xmm1
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 102,15,254,21,131,23,0,0 ; paddd 0x1783(%rip),%xmm2 # 9ce0 <_sk_clut_4D_sse2+0x2c83>
+ DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
+ DB 102,73,15,126,249 ; movq %xmm7,%r9
+ DB 102,73,15,126,210 ; movq %xmm2,%r10
+ DB 77,137,203 ; mov %r9,%r11
+ DB 73,193,235,32 ; shr $0x20,%r11
+ DB 76,137,208 ; mov %r10,%rax
+ DB 72,193,232,32 ; shr $0x20,%rax
+ DB 243,15,16,60,131 ; movss (%rbx,%rax,4),%xmm7
+ DB 243,66,15,16,20,155 ; movss (%rbx,%r11,4),%xmm2
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 68,137,208 ; mov %r10d,%eax
+ DB 69,137,201 ; mov %r9d,%r9d
+ DB 243,15,16,20,131 ; movss (%rbx,%rax,4),%xmm2
+ DB 243,66,15,16,52,139 ; movss (%rbx,%r9,4),%xmm6
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 65,15,92,193 ; subps %xmm9,%xmm0
+ DB 15,40,116,36,112 ; movaps 0x70(%rsp),%xmm6
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 65,15,88,193 ; addps %xmm9,%xmm0
+ DB 15,92,204 ; subps %xmm4,%xmm1
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 65,15,92,198 ; subps %xmm14,%xmm0
+ DB 15,40,92,36,16 ; movaps 0x10(%rsp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 65,15,88,198 ; addps %xmm14,%xmm0
+ DB 65,15,92,200 ; subps %xmm8,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 65,15,88,200 ; addps %xmm8,%xmm1
+ DB 15,92,213 ; subps %xmm5,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 65,15,92,196 ; subps %xmm12,%xmm0
+ DB 15,40,156,36,160,0,0,0 ; movaps 0xa0(%rsp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 65,15,88,196 ; addps %xmm12,%xmm0
+ DB 65,15,92,203 ; subps %xmm11,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 65,15,88,203 ; addps %xmm11,%xmm1
+ DB 65,15,92,210 ; subps %xmm10,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 65,15,88,210 ; addps %xmm10,%xmm2
+ DB 15,91,156,36,176,0,0,0 ; cvtdq2ps 0xb0(%rsp),%xmm3
+ DB 15,40,164,36,224,0,0,0 ; movaps 0xe0(%rsp),%xmm4
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,40,92,36,96 ; movaps 0x60(%rsp),%xmm3
+ DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,195 ; addps %xmm3,%xmm0
+ DB 15,40,92,36,80 ; movaps 0x50(%rsp),%xmm3
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 65,15,92,213 ; subps %xmm13,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 65,15,88,213 ; addps %xmm13,%xmm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,40,29,159,22,0,0 ; movaps 0x169f(%rip),%xmm3 # 9cf0 <_sk_clut_4D_sse2+0x2c93>
+ DB 15,40,164,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm4
+ DB 15,40,172,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm5
+ DB 15,40,180,36,16,1,0,0 ; movaps 0x110(%rsp),%xmm6
+ DB 15,40,188,36,32,1,0,0 ; movaps 0x120(%rsp),%xmm7
+ DB 72,129,196,48,1,0,0 ; add $0x130,%rsp
+ DB 91 ; pop %rbx
+ DB 255,224 ; jmpq *%rax
+
ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
@@ -29834,9 +36270,9 @@ ALIGN 16
DB 128,191,0,0,224,64,0 ; cmpb $0x0,0x40e00000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 674c <.literal16+0x1fc>
+ DB 224,64 ; loopne 887c <.literal16+0x1fc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 6750 <.literal16+0x200>
+ DB 224,64 ; loopne 8880 <.literal16+0x200>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -29856,13 +36292,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6771 <.literal16+0x221>
+ DB 71,225,61 ; rex.RXB loope 88a1 <.literal16+0x221>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6775 <.literal16+0x225>
+ DB 71,225,61 ; rex.RXB loope 88a5 <.literal16+0x225>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6779 <.literal16+0x229>
+ DB 71,225,61 ; rex.RXB loope 88a9 <.literal16+0x229>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 677d <.literal16+0x22d>
+ DB 71,225,61 ; rex.RXB loope 88ad <.literal16+0x22d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29887,13 +36323,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67b1 <.literal16+0x261>
+ DB 71,225,61 ; rex.RXB loope 88e1 <.literal16+0x261>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67b5 <.literal16+0x265>
+ DB 71,225,61 ; rex.RXB loope 88e5 <.literal16+0x265>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67b9 <.literal16+0x269>
+ DB 71,225,61 ; rex.RXB loope 88e9 <.literal16+0x269>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67bd <.literal16+0x26d>
+ DB 71,225,61 ; rex.RXB loope 88ed <.literal16+0x26d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29918,13 +36354,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67f1 <.literal16+0x2a1>
+ DB 71,225,61 ; rex.RXB loope 8921 <.literal16+0x2a1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67f5 <.literal16+0x2a5>
+ DB 71,225,61 ; rex.RXB loope 8925 <.literal16+0x2a5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67f9 <.literal16+0x2a9>
+ DB 71,225,61 ; rex.RXB loope 8929 <.literal16+0x2a9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 67fd <.literal16+0x2ad>
+ DB 71,225,61 ; rex.RXB loope 892d <.literal16+0x2ad>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29949,13 +36385,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6831 <.literal16+0x2e1>
+ DB 71,225,61 ; rex.RXB loope 8961 <.literal16+0x2e1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6835 <.literal16+0x2e5>
+ DB 71,225,61 ; rex.RXB loope 8965 <.literal16+0x2e5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6839 <.literal16+0x2e9>
+ DB 71,225,61 ; rex.RXB loope 8969 <.literal16+0x2e9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 683d <.literal16+0x2ed>
+ DB 71,225,61 ; rex.RXB loope 896d <.literal16+0x2ed>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29976,11 +36412,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
DB 67,0,0 ; rex.XB add %al,(%r8)
- DB 127,67 ; jg 687b <.literal16+0x32b>
+ DB 127,67 ; jg 89ab <.literal16+0x32b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 687f <.literal16+0x32f>
+ DB 127,67 ; jg 89af <.literal16+0x32f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6883 <.literal16+0x333>
+ DB 127,67 ; jg 89b3 <.literal16+0x333>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -30272,13 +36708,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6ad9 <.literal16+0x589>
+ DB 224,7 ; loopne 8c09 <.literal16+0x589>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6add <.literal16+0x58d>
+ DB 224,7 ; loopne 8c0d <.literal16+0x58d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ae1 <.literal16+0x591>
+ DB 224,7 ; loopne 8c11 <.literal16+0x591>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ae5 <.literal16+0x595>
+ DB 224,7 ; loopne 8c15 <.literal16+0x595>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -30343,11 +36779,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6bbb <.literal16+0x66b>
+ DB 127,67 ; jg 8ceb <.literal16+0x66b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6bbf <.literal16+0x66f>
+ DB 127,67 ; jg 8cef <.literal16+0x66f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6bc3 <.literal16+0x673>
+ DB 127,67 ; jg 8cf3 <.literal16+0x673>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -30362,16 +36798,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6bb4 <.literal16+0x664>
+ DB 127,0 ; jg 8ce4 <.literal16+0x664>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6bb8 <.literal16+0x668>
+ DB 127,0 ; jg 8ce8 <.literal16+0x668>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6bbc <.literal16+0x66c>
+ DB 127,0 ; jg 8cec <.literal16+0x66c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6bc0 <.literal16+0x670>
+ DB 127,0 ; jg 8cf0 <.literal16+0x670>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -30380,7 +36816,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6c45 <.literal16+0x6f5>
+ DB 119,115 ; ja 8d75 <.literal16+0x6f5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -30391,7 +36827,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6ba9 <.literal16+0x659>
+ DB 117,191 ; jne 8cd9 <.literal16+0x659>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -30403,7 +36839,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3abea <_sk_callback_sse2+0xffffffffe9a34768>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3cd1a <_sk_clut_4D_sse2+0xffffffffe9a35cbd>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30457,16 +36893,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6c84 <.literal16+0x734>
+ DB 127,0 ; jg 8db4 <.literal16+0x734>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6c88 <.literal16+0x738>
+ DB 127,0 ; jg 8db8 <.literal16+0x738>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6c8c <.literal16+0x73c>
+ DB 127,0 ; jg 8dbc <.literal16+0x73c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6c90 <.literal16+0x740>
+ DB 127,0 ; jg 8dc0 <.literal16+0x740>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -30475,7 +36911,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6d15 <.literal16+0x7c5>
+ DB 119,115 ; ja 8e45 <.literal16+0x7c5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -30486,7 +36922,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6c79 <.literal16+0x729>
+ DB 117,191 ; jne 8da9 <.literal16+0x729>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -30498,7 +36934,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3acba <_sk_callback_sse2+0xffffffffe9a34838>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3cdea <_sk_clut_4D_sse2+0xffffffffe9a35d8d>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30552,16 +36988,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6d54 <.literal16+0x804>
+ DB 127,0 ; jg 8e84 <.literal16+0x804>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6d58 <.literal16+0x808>
+ DB 127,0 ; jg 8e88 <.literal16+0x808>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6d5c <.literal16+0x80c>
+ DB 127,0 ; jg 8e8c <.literal16+0x80c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6d60 <.literal16+0x810>
+ DB 127,0 ; jg 8e90 <.literal16+0x810>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -30570,7 +37006,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6de5 <.literal16+0x895>
+ DB 119,115 ; ja 8f15 <.literal16+0x895>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -30581,7 +37017,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6d49 <.literal16+0x7f9>
+ DB 117,191 ; jne 8e79 <.literal16+0x7f9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -30593,7 +37029,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3ad8a <_sk_callback_sse2+0xffffffffe9a34908>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3ceba <_sk_clut_4D_sse2+0xffffffffe9a35e5d>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30647,16 +37083,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6e24 <.literal16+0x8d4>
+ DB 127,0 ; jg 8f54 <.literal16+0x8d4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6e28 <.literal16+0x8d8>
+ DB 127,0 ; jg 8f58 <.literal16+0x8d8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6e2c <.literal16+0x8dc>
+ DB 127,0 ; jg 8f5c <.literal16+0x8dc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6e30 <.literal16+0x8e0>
+ DB 127,0 ; jg 8f60 <.literal16+0x8e0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -30665,7 +37101,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6eb5 <.literal16+0x965>
+ DB 119,115 ; ja 8fe5 <.literal16+0x965>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -30676,7 +37112,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6e19 <.literal16+0x8c9>
+ DB 117,191 ; jne 8f49 <.literal16+0x8c9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -30688,7 +37124,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3ae5a <_sk_callback_sse2+0xffffffffe9a349d8>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3cf8a <_sk_clut_4D_sse2+0xffffffffe9a35f2d>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30742,16 +37178,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6ef4 <.literal16+0x9a4>
+ DB 127,0 ; jg 9024 <.literal16+0x9a4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6ef8 <.literal16+0x9a8>
+ DB 127,0 ; jg 9028 <.literal16+0x9a8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6efc <.literal16+0x9ac>
+ DB 127,0 ; jg 902c <.literal16+0x9ac>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6f00 <.literal16+0x9b0>
+ DB 127,0 ; jg 9030 <.literal16+0x9b0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -30760,7 +37196,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6f85 <.literal16+0xa35>
+ DB 119,115 ; ja 90b5 <.literal16+0xa35>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -30771,7 +37207,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6ee9 <.literal16+0x999>
+ DB 117,191 ; jne 9019 <.literal16+0x999>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -30783,7 +37219,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3af2a <_sk_callback_sse2+0xffffffffe9a34aa8>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3d05a <_sk_clut_4D_sse2+0xffffffffe9a35ffd>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30833,13 +37269,13 @@ ALIGN 16
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 7007 <.literal16+0xab7>
+ DB 127,67 ; jg 9137 <.literal16+0xab7>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 700b <.literal16+0xabb>
+ DB 127,67 ; jg 913b <.literal16+0xabb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 700f <.literal16+0xabf>
+ DB 127,67 ; jg 913f <.literal16+0xabf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 7013 <.literal16+0xac3>
+ DB 127,67 ; jg 9143 <.literal16+0xac3>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -30886,16 +37322,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 7093 <.literal16+0xb43>
+ DB 118,63 ; jbe 91c3 <.literal16+0xb43>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 7097 <.literal16+0xb47>
+ DB 118,63 ; jbe 91c7 <.literal16+0xb47>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 709b <.literal16+0xb4b>
+ DB 118,63 ; jbe 91cb <.literal16+0xb4b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 709f <.literal16+0xb4f>
+ DB 118,63 ; jbe 91cf <.literal16+0xb4f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -30924,11 +37360,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 710b <.literal16+0xbbb>
+ DB 127,67 ; jg 923b <.literal16+0xbbb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 710f <.literal16+0xbbf>
+ DB 127,67 ; jg 923f <.literal16+0xbbf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 7113 <.literal16+0xbc3>
+ DB 127,67 ; jg 9243 <.literal16+0xbc3>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -30990,13 +37426,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7189 <.literal16+0xc39>
+ DB 224,7 ; loopne 92b9 <.literal16+0xc39>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 718d <.literal16+0xc3d>
+ DB 224,7 ; loopne 92bd <.literal16+0xc3d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 7191 <.literal16+0xc41>
+ DB 224,7 ; loopne 92c1 <.literal16+0xc41>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 7195 <.literal16+0xc45>
+ DB 224,7 ; loopne 92c5 <.literal16+0xc45>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -31042,13 +37478,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 71f9 <.literal16+0xca9>
+ DB 224,7 ; loopne 9329 <.literal16+0xca9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 71fd <.literal16+0xcad>
+ DB 224,7 ; loopne 932d <.literal16+0xcad>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 7201 <.literal16+0xcb1>
+ DB 224,7 ; loopne 9331 <.literal16+0xcb1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 7205 <.literal16+0xcb5>
+ DB 224,7 ; loopne 9335 <.literal16+0xcb5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -31094,13 +37530,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7269 <.literal16+0xd19>
+ DB 224,7 ; loopne 9399 <.literal16+0xd19>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 726d <.literal16+0xd1d>
+ DB 224,7 ; loopne 939d <.literal16+0xd1d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 7271 <.literal16+0xd21>
+ DB 224,7 ; loopne 93a1 <.literal16+0xd21>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 7275 <.literal16+0xd25>
+ DB 224,7 ; loopne 93a5 <.literal16+0xd25>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -31138,13 +37574,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 7306 <.literal16+0xdb6>
+ DB 124,66 ; jl 9436 <.literal16+0xdb6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 730a <.literal16+0xdba>
+ DB 124,66 ; jl 943a <.literal16+0xdba>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 730e <.literal16+0xdbe>
+ DB 124,66 ; jl 943e <.literal16+0xdbe>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 7312 <.literal16+0xdc2>
+ DB 124,66 ; jl 9442 <.literal16+0xdc2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -31278,13 +37714,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 7495 <.literal16+0xf45>
+ DB 112,65 ; jo 95c5 <.literal16+0xf45>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 7499 <.literal16+0xf49>
+ DB 112,65 ; jo 95c9 <.literal16+0xf49>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 749d <.literal16+0xf4d>
+ DB 112,65 ; jo 95cd <.literal16+0xf4d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 74a1 <.literal16+0xf51>
+ DB 112,65 ; jo 95d1 <.literal16+0xf51>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -31315,11 +37751,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 750b <.literal16+0xfbb>
+ DB 127,67 ; jg 963b <.literal16+0xfbb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 750f <.literal16+0xfbf>
+ DB 127,67 ; jg 963f <.literal16+0xfbf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 7513 <.literal16+0xfc3>
+ DB 127,67 ; jg 9643 <.literal16+0xfc3>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -31350,11 +37786,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 757b <.literal16+0x102b>
+ DB 127,67 ; jg 96ab <.literal16+0x102b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 757f <.literal16+0x102f>
+ DB 127,67 ; jg 96af <.literal16+0x102f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 7583 <.literal16+0x1033>
+ DB 127,67 ; jg 96b3 <.literal16+0x1033>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -31450,13 +37886,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 76ab <.literal16+0x115b>
+ DB 127,71 ; jg 97db <.literal16+0x115b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 76af <.literal16+0x115f>
+ DB 127,71 ; jg 97df <.literal16+0x115f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 76b3 <.literal16+0x1163>
+ DB 127,71 ; jg 97e3 <.literal16+0x1163>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 76b7 <.literal16+0x1167>
+ DB 127,71 ; jg 97e7 <.literal16+0x1167>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -31533,10 +37969,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0884a <_sk_callback_sse2+0x2dc023c8>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0a97a <_sk_clut_4D_sse2+0x2dc0391d>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 777c <.literal16+0x122c>
+ DB 120,57 ; js 98ac <.literal16+0x122c>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -31723,11 +38159,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 7962 <.literal16+0x1412>
+ DB 62,114,28 ; jb,pt 9a92 <.literal16+0x1412>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7966 <.literal16+0x1416>
+ DB 62,114,28 ; jb,pt 9a96 <.literal16+0x1416>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 796a <.literal16+0x141a>
+ DB 62,114,28 ; jb,pt 9a9a <.literal16+0x141a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -31771,7 +38207,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6407f5 <_sk_callback_sse2+0x3d63a373>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d642925 <_sk_clut_4D_sse2+0x3d63b8c8>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -31797,7 +38233,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640835 <_sk_callback_sse2+0x3d63a3b3>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d642965 <_sk_clut_4D_sse2+0x3d63b908>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -31806,13 +38242,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 7a2e <.literal16+0x14de>
+ DB 114,28 ; jb 9b5e <.literal16+0x14de>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7a32 <.literal16+0x14e2>
+ DB 62,114,28 ; jb,pt 9b62 <.literal16+0x14e2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7a36 <.literal16+0x14e6>
+ DB 62,114,28 ; jb,pt 9b66 <.literal16+0x14e6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7a3a <.literal16+0x14ea>
+ DB 62,114,28 ; jb,pt 9b6a <.literal16+0x14ea>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -31833,11 +38269,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 7a72 <.literal16+0x1522>
+ DB 62,114,28 ; jb,pt 9ba2 <.literal16+0x1522>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7a76 <.literal16+0x1526>
+ DB 62,114,28 ; jb,pt 9ba6 <.literal16+0x1526>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7a7a <.literal16+0x152a>
+ DB 62,114,28 ; jb,pt 9baa <.literal16+0x152a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -31881,7 +38317,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640905 <_sk_callback_sse2+0x3d63a483>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d642a35 <_sk_clut_4D_sse2+0x3d63b9d8>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -31907,7 +38343,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640945 <_sk_callback_sse2+0x3d63a4c3>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d642a75 <_sk_clut_4D_sse2+0x3d63ba18>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -31916,13 +38352,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 7b3e <.literal16+0x15ee>
+ DB 114,28 ; jb 9c6e <.literal16+0x15ee>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7b42 <_sk_callback_sse2+0x16c0>
+ DB 62,114,28 ; jb,pt 9c72 <.literal16+0x15f2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7b46 <_sk_callback_sse2+0x16c4>
+ DB 62,114,28 ; jb,pt 9c76 <.literal16+0x15f6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7b4a <_sk_callback_sse2+0x16c8>
+ DB 62,114,28 ; jb,pt 9c7a <.literal16+0x15fa>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -31932,6 +38368,77 @@ ALIGN 16
DB 170 ; stos %al,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
DB 190,171,170,170,190 ; mov $0xbeaaaaab,%esi
+ DB 114,249 ; jb 9c6b <.literal16+0x15eb>
+ DB 127,63 ; jg 9cb3 <.literal16+0x1633>
+ DB 114,249 ; jb 9c6f <.literal16+0x15ef>
+ DB 127,63 ; jg 9cb7 <.literal16+0x1637>
+ DB 114,249 ; jb 9c73 <.literal16+0x15f3>
+ DB 127,63 ; jg 9cbb <.literal16+0x163b>
+ DB 114,249 ; jb 9c77 <.literal16+0x15f7>
+ DB 127,63 ; jg 9cbf <.literal16+0x163f>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 114,249 ; jb 9cab <.literal16+0x162b>
+ DB 127,63 ; jg 9cf3 <.literal16+0x1673>
+ DB 114,249 ; jb 9caf <.literal16+0x162f>
+ DB 127,63 ; jg 9cf7 <.literal16+0x1677>
+ DB 114,249 ; jb 9cb3 <.literal16+0x1633>
+ DB 127,63 ; jg 9cfb <.literal16+0x167b>
+ DB 114,249 ; jb 9cb7 <.literal16+0x1637>
+ DB 127,63 ; jg 9cff <.literal16+0x167f>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 1,0 ; add %eax,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,0 ; cmpb $0x0,(%rdi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
+ DB 63 ; (bad)
+ DB 0,0 ; add %al,(%rax)
+ DB 128 ; .byte 0x80
+ DB 63 ; (bad)
ALIGN 4
DB 0,0 ; add %al,(%rax)
@@ -36692,7 +43199,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,2 ; movd (%edx),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,144,34,112,0,0 ; movaps 0x7022(%eax),%xmm2
+ DB 15,40,144,2,145,0,0 ; movaps 0x9102(%eax),%xmm2
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -36707,7 +43214,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,41,82,32 ; movaps %xmm2,0x20(%edx)
DB 15,41,82,16 ; movaps %xmm2,0x10(%edx)
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,144,50,112,0,0 ; movaps 0x7032(%eax),%xmm2
+ DB 15,40,144,18,145,0,0 ; movaps 0x9112(%eax),%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 86 ; push %esi
DB 82 ; push %edx
@@ -36738,16 +43245,16 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4
DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7
DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,111,177,197,111,0,0 ; movdqa 0x6fc5(%ecx),%xmm6
+ DB 102,15,111,177,165,144,0,0 ; movdqa 0x90a5(%ecx),%xmm6
DB 102,15,111,207 ; movdqa %xmm7,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
- DB 102,15,111,129,229,111,0,0 ; movdqa 0x6fe5(%ecx),%xmm0
+ DB 102,15,111,129,197,144,0,0 ; movdqa 0x90c5(%ecx),%xmm0
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,219,197 ; pand %xmm5,%xmm0
- DB 102,15,219,185,213,111,0,0 ; pand 0x6fd5(%ecx),%xmm7
- DB 102,15,219,169,213,111,0,0 ; pand 0x6fd5(%ecx),%xmm5
+ DB 102,15,219,185,181,144,0,0 ; pand 0x90b5(%ecx),%xmm7
+ DB 102,15,219,169,181,144,0,0 ; pand 0x90b5(%ecx),%xmm5
DB 102,15,114,246,4 ; pslld $0x4,%xmm6
DB 102,15,254,192 ; paddd %xmm0,%xmm0
DB 102,15,235,198 ; por %xmm6,%xmm0
@@ -36762,8 +43269,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0
- DB 15,89,129,245,111,0,0 ; mulps 0x6ff5(%ecx),%xmm0
- DB 15,88,129,5,112,0,0 ; addps 0x7005(%ecx),%xmm0
+ DB 15,89,129,213,144,0,0 ; mulps 0x90d5(%ecx),%xmm0
+ DB 15,88,129,229,144,0,0 ; addps 0x90e5(%ecx),%xmm0
DB 243,15,16,14 ; movss (%esi),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -36827,7 +43334,7 @@ _sk_black_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,152,213,110,0,0 ; movaps 0x6ed5(%eax),%xmm3
+ DB 15,40,152,181,143,0,0 ; movaps 0x8fb5(%eax),%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -36848,7 +43355,7 @@ _sk_white_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,128,181,110,0,0 ; movaps 0x6eb5(%eax),%xmm0
+ DB 15,40,128,149,143,0,0 ; movaps 0x8f95(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -36930,7 +43437,7 @@ _sk_srcatop_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,170,22,110,0,0 ; movaps 0x6e16(%edx),%xmm5
+ DB 15,40,170,246,142,0,0 ; movaps 0x8ef6(%edx),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
@@ -36967,7 +43474,7 @@ _sk_dstatop_sse2 LABEL PROC
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,40,162,199,109,0,0 ; movaps 0x6dc7(%edx),%xmm4
+ DB 15,40,162,167,142,0,0 ; movaps 0x8ea7(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
@@ -37045,7 +43552,7 @@ _sk_srcout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,22,109,0,0 ; movaps 0x6d16(%eax),%xmm4
+ DB 15,40,160,246,141,0,0 ; movaps 0x8df6(%eax),%xmm4
DB 15,92,98,64 ; subps 0x40(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
@@ -37069,7 +43576,7 @@ _sk_dstout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,238,108,0,0 ; movaps 0x6cee(%eax),%xmm4
+ DB 15,40,160,206,141,0,0 ; movaps 0x8dce(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -37097,7 +43604,7 @@ _sk_srcover_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,183,108,0,0 ; movaps 0x6cb7(%eax),%xmm4
+ DB 15,40,160,151,141,0,0 ; movaps 0x8d97(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -37129,7 +43636,7 @@ _sk_dstover_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5
- DB 15,40,160,119,108,0,0 ; movaps 0x6c77(%eax),%xmm4
+ DB 15,40,160,87,141,0,0 ; movaps 0x8d57(%eax),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
@@ -37181,7 +43688,7 @@ _sk_multiply_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,40,129,8,108,0,0 ; movaps 0x6c08(%ecx),%xmm0
+ DB 15,40,129,232,140,0,0 ; movaps 0x8ce8(%ecx),%xmm0
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -37300,7 +43807,7 @@ _sk_xor__sse2 LABEL PROC
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
- DB 15,40,154,221,106,0,0 ; movaps 0x6add(%edx),%xmm3
+ DB 15,40,154,189,139,0,0 ; movaps 0x8bbd(%edx),%xmm3
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,89,198 ; mulps %xmm6,%xmm0
@@ -37360,7 +43867,7 @@ _sk_darken_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,95,209 ; maxps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,133,106,0,0 ; movaps 0x6a85(%edx),%xmm1
+ DB 15,40,138,101,139,0,0 ; movaps 0x8b65(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -37407,7 +43914,7 @@ _sk_lighten_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,93,209 ; minps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,21,106,0,0 ; movaps 0x6a15(%edx),%xmm1
+ DB 15,40,138,245,138,0,0 ; movaps 0x8af5(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -37458,7 +43965,7 @@ _sk_difference_sse2 LABEL PROC
DB 15,93,214 ; minps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,146,162,105,0,0 ; movaps 0x69a2(%edx),%xmm2
+ DB 15,40,146,130,138,0,0 ; movaps 0x8a82(%edx),%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -37500,7 +44007,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,202 ; mulps %xmm2,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
DB 15,92,233 ; subps %xmm1,%xmm5
- DB 15,40,138,44,105,0,0 ; movaps 0x692c(%edx),%xmm1
+ DB 15,40,138,12,138,0,0 ; movaps 0x8a0c(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -37539,7 +44046,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,92,238 ; subps %xmm6,%xmm5
- DB 15,40,177,185,104,0,0 ; movaps 0x68b9(%ecx),%xmm6
+ DB 15,40,177,153,137,0,0 ; movaps 0x8999(%ecx),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
@@ -37659,7 +44166,7 @@ _sk_colordodge_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
- DB 15,40,177,51,103,0,0 ; movaps 0x6733(%ecx),%xmm6
+ DB 15,40,177,19,136,0,0 ; movaps 0x8813(%ecx),%xmm6
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
@@ -37776,7 +44283,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
- DB 15,40,145,215,101,0,0 ; movaps 0x65d7(%ecx),%xmm2
+ DB 15,40,145,183,134,0,0 ; movaps 0x86b7(%ecx),%xmm2
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,40,225 ; movaps %xmm1,%xmm4
@@ -37884,7 +44391,7 @@ _sk_overlay_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
- DB 15,40,161,156,100,0,0 ; movaps 0x649c(%ecx),%xmm4
+ DB 15,40,161,124,133,0,0 ; movaps 0x857c(%ecx),%xmm4
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
@@ -38010,17 +44517,17 @@ _sk_softlight_sse2 LABEL PROC
DB 232,0,0,0,0 ; call f44 <_sk_softlight_sse2+0x52>
DB 89 ; pop %ecx
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,137,44,99,0,0 ; movaps 0x632c(%ecx),%xmm1
+ DB 15,40,137,12,132,0,0 ; movaps 0x840c(%ecx),%xmm1
DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
DB 15,88,193 ; addps %xmm1,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,185,28,99,0,0 ; movaps 0x631c(%ecx),%xmm7
+ DB 15,40,185,252,131,0,0 ; movaps 0x83fc(%ecx),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,82,242 ; rsqrtps %xmm2,%xmm6
DB 15,83,206 ; rcpps %xmm6,%xmm1
DB 15,92,202 ; subps %xmm2,%xmm1
- DB 15,40,161,60,99,0,0 ; movaps 0x633c(%ecx),%xmm4
+ DB 15,40,161,28,132,0,0 ; movaps 0x841c(%ecx),%xmm4
DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
@@ -38224,7 +44731,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 15,40,169,187,96,0,0 ; movaps 0x60bb(%ecx),%xmm5
+ DB 15,40,169,155,129,0,0 ; movaps 0x819b(%ecx),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
@@ -38257,17 +44764,17 @@ _sk_hue_sse2 LABEL PROC
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,153,139,96,0,0 ; movaps 0x608b(%ecx),%xmm3
+ DB 15,40,153,107,129,0,0 ; movaps 0x816b(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,153,155,96,0,0 ; movaps 0x609b(%ecx),%xmm3
+ DB 15,40,153,123,129,0,0 ; movaps 0x817b(%ecx),%xmm3
DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,137,187,96,0,0 ; movaps 0x60bb(%ecx),%xmm1
+ DB 15,40,137,155,129,0,0 ; movaps 0x819b(%ecx),%xmm1
DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
@@ -38277,7 +44784,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
- DB 15,40,169,171,96,0,0 ; movaps 0x60ab(%ecx),%xmm5
+ DB 15,40,169,139,129,0,0 ; movaps 0x818b(%ecx),%xmm5
DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,207 ; addps %xmm7,%xmm1
DB 15,94,212 ; divps %xmm4,%xmm2
@@ -38468,17 +44975,17 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,253 ; mulps %xmm5,%xmm7
DB 232,0,0,0,0 ; call 1559 <_sk_saturation_sse2+0xb0>
DB 89 ; pop %ecx
- DB 15,40,153,119,93,0,0 ; movaps 0x5d77(%ecx),%xmm3
+ DB 15,40,153,87,126,0,0 ; movaps 0x7e57(%ecx),%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,153,135,93,0,0 ; movaps 0x5d87(%ecx),%xmm3
+ DB 15,40,153,103,126,0,0 ; movaps 0x7e67(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,129,167,93,0,0 ; movaps 0x5da7(%ecx),%xmm0
+ DB 15,40,129,135,126,0,0 ; movaps 0x7e87(%ecx),%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -38490,7 +44997,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,129,151,93,0,0 ; movaps 0x5d97(%ecx),%xmm0
+ DB 15,40,129,119,126,0,0 ; movaps 0x7e77(%ecx),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
@@ -38647,16 +45154,16 @@ _sk_color_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1
- DB 15,40,177,92,91,0,0 ; movaps 0x5b5c(%ecx),%xmm6
+ DB 15,40,177,60,124,0,0 ; movaps 0x7c3c(%ecx),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,153,108,91,0,0 ; movaps 0x5b6c(%ecx),%xmm3
+ DB 15,40,153,76,124,0,0 ; movaps 0x7c4c(%ecx),%xmm3
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 15,40,129,140,91,0,0 ; movaps 0x5b8c(%ecx),%xmm0
+ DB 15,40,129,108,124,0,0 ; movaps 0x7c6c(%ecx),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0
DB 15,89,208 ; mulps %xmm0,%xmm2
@@ -38666,7 +45173,7 @@ _sk_color_sse2 LABEL PROC
DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
DB 15,89,194 ; mulps %xmm2,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
- DB 15,40,137,124,91,0,0 ; movaps 0x5b7c(%ecx),%xmm1
+ DB 15,40,137,92,124,0,0 ; movaps 0x7c5c(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
@@ -38823,18 +45330,18 @@ _sk_luminosity_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1a17 <_sk_luminosity_sse2+0x11>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 15,40,161,57,89,0,0 ; movaps 0x5939(%ecx),%xmm4
+ DB 15,40,161,25,122,0,0 ; movaps 0x7a19(%ecx),%xmm4
DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,161,73,89,0,0 ; movaps 0x5949(%ecx),%xmm4
+ DB 15,40,161,41,122,0,0 ; movaps 0x7a29(%ecx),%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,161,105,89,0,0 ; movaps 0x5969(%ecx),%xmm4
+ DB 15,40,161,73,122,0,0 ; movaps 0x7a49(%ecx),%xmm4
DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -38844,7 +45351,7 @@ _sk_luminosity_sse2 LABEL PROC
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp)
DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,40,137,89,89,0,0 ; movaps 0x5959(%ecx),%xmm1
+ DB 15,40,137,57,122,0,0 ; movaps 0x7a39(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,213 ; addps %xmm5,%xmm2
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
@@ -39018,7 +45525,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 139,49 ; mov (%ecx),%esi
DB 15,133,224,0,0,0 ; jne 1d84 <_sk_srcover_rgba_8888_sse2+0x119>
DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2
- DB 102,15,111,167,14,87,0,0 ; movdqa 0x570e(%edi),%xmm4
+ DB 102,15,111,167,238,119,0,0 ; movdqa 0x77ee(%edi),%xmm4
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
@@ -39029,9 +45536,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,219,252 ; pand %xmm4,%xmm7
DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,175,30,87,0,0 ; movaps 0x571e(%edi),%xmm5
+ DB 15,40,175,254,119,0,0 ; movaps 0x77fe(%edi),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,40,143,46,87,0,0 ; movaps 0x572e(%edi),%xmm1
+ DB 15,40,143,14,120,0,0 ; movaps 0x780e(%edi),%xmm1
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
@@ -39141,7 +45648,7 @@ _sk_clamp_1_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1e2e <_sk_clamp_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,146,85,0,0 ; movaps 0x5592(%eax),%xmm4
+ DB 15,40,160,114,118,0,0 ; movaps 0x7672(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,93,204 ; minps %xmm4,%xmm1
DB 15,93,212 ; minps %xmm4,%xmm2
@@ -39163,7 +45670,7 @@ _sk_clamp_a_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1e61 <_sk_clamp_a_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,93,152,111,85,0,0 ; minps 0x556f(%eax),%xmm3
+ DB 15,93,152,79,118,0,0 ; minps 0x764f(%eax),%xmm3
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -39186,7 +45693,7 @@ _sk_clamp_a_dst_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4
- DB 15,93,160,79,85,0,0 ; minps 0x554f(%eax),%xmm4
+ DB 15,93,160,47,118,0,0 ; minps 0x762f(%eax),%xmm4
DB 15,41,98,64 ; movaps %xmm4,0x40(%edx)
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,93,236 ; minps %xmm4,%xmm5
@@ -39254,7 +45761,7 @@ _sk_invert_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1f3c <_sk_invert_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,180,84,0,0 ; movaps 0x54b4(%eax),%xmm4
+ DB 15,40,160,148,117,0,0 ; movaps 0x7594(%eax),%xmm4
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
@@ -39367,7 +45874,7 @@ _sk_unpremul_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,40,168,198,83,0,0 ; movaps 0x53c6(%eax),%xmm5
+ DB 15,40,168,166,116,0,0 ; movaps 0x74a6(%eax),%xmm5
DB 15,94,235 ; divps %xmm3,%xmm5
DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
DB 15,84,229 ; andps %xmm5,%xmm4
@@ -39396,19 +45903,19 @@ _sk_from_srgb_sse2 LABEL PROC
DB 88 ; pop %eax
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,201 ; mulps %xmm1,%xmm1
- DB 15,40,160,156,83,0,0 ; movaps 0x539c(%eax),%xmm4
+ DB 15,40,160,124,116,0,0 ; movaps 0x747c(%eax),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,176,172,83,0,0 ; movaps 0x53ac(%eax),%xmm6
+ DB 15,40,176,140,116,0,0 ; movaps 0x748c(%eax),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,176,140,83,0,0 ; movaps 0x538c(%eax),%xmm6
+ DB 15,40,176,108,116,0,0 ; movaps 0x746c(%eax),%xmm6
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,184,188,83,0,0 ; movaps 0x53bc(%eax),%xmm7
+ DB 15,40,184,156,116,0,0 ; movaps 0x749c(%eax),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,184,204,83,0,0 ; movaps 0x53cc(%eax),%xmm7
+ DB 15,40,184,172,116,0,0 ; movaps 0x74ac(%eax),%xmm7
DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -39466,18 +45973,18 @@ _sk_from_srgb_dst_sse2 LABEL PROC
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,40,161,17,83,0,0 ; movaps 0x5311(%ecx),%xmm4
+ DB 15,40,161,241,115,0,0 ; movaps 0x73f1(%ecx),%xmm4
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,177,33,83,0,0 ; movaps 0x5321(%ecx),%xmm6
+ DB 15,40,177,1,116,0,0 ; movaps 0x7401(%ecx),%xmm6
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,169,1,83,0,0 ; movaps 0x5301(%ecx),%xmm5
+ DB 15,40,169,225,115,0,0 ; movaps 0x73e1(%ecx),%xmm5
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,185,49,83,0,0 ; movaps 0x5331(%ecx),%xmm7
+ DB 15,40,185,17,116,0,0 ; movaps 0x7411(%ecx),%xmm7
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,153,65,83,0,0 ; movaps 0x5341(%ecx),%xmm3
+ DB 15,40,153,33,116,0,0 ; movaps 0x7421(%ecx),%xmm3
DB 15,194,203,1 ; cmpltps %xmm3,%xmm1
DB 15,84,209 ; andps %xmm1,%xmm2
DB 15,85,200 ; andnps %xmm0,%xmm1
@@ -39537,25 +46044,25 @@ _sk_to_srgb_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 224a <_sk_to_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,82,218 ; rsqrtps %xmm2,%xmm3
- DB 15,40,160,118,82,0,0 ; movaps 0x5276(%eax),%xmm4
+ DB 15,40,160,86,115,0,0 ; movaps 0x7356(%eax),%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,128,134,82,0,0 ; movaps 0x5286(%eax),%xmm0
+ DB 15,40,128,102,115,0,0 ; movaps 0x7366(%eax),%xmm0
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,40,128,150,82,0,0 ; movaps 0x5296(%eax),%xmm0
+ DB 15,40,128,118,115,0,0 ; movaps 0x7376(%eax),%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,128,166,82,0,0 ; movaps 0x52a6(%eax),%xmm0
+ DB 15,40,128,134,115,0,0 ; movaps 0x7386(%eax),%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,83,195 ; rcpps %xmm3,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,168,102,82,0,0 ; movaps 0x5266(%eax),%xmm5
+ DB 15,40,168,70,115,0,0 ; movaps 0x7346(%eax),%xmm5
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,152,182,82,0,0 ; movaps 0x52b6(%eax),%xmm3
+ DB 15,40,152,150,115,0,0 ; movaps 0x7396(%eax),%xmm3
DB 15,194,211,1 ; cmpltps %xmm3,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -39622,14 +46129,14 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
- DB 15,40,152,207,81,0,0 ; movaps 0x51cf(%eax),%xmm3
+ DB 15,40,152,175,114,0,0 ; movaps 0x72af(%eax),%xmm3
DB 15,94,216 ; divps %xmm0,%xmm3
DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,92,194 ; subps %xmm2,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,168,223,81,0,0 ; andps 0x51df(%eax),%xmm5
+ DB 15,84,168,191,114,0,0 ; andps 0x72bf(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0
@@ -39639,9 +46146,9 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,92,231 ; subps %xmm7,%xmm4
DB 15,89,211 ; mulps %xmm3,%xmm2
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,40,152,239,81,0,0 ; movaps 0x51ef(%eax),%xmm3
+ DB 15,40,152,207,114,0,0 ; movaps 0x72cf(%eax),%xmm3
DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,88,160,255,81,0,0 ; addps 0x51ff(%eax),%xmm4
+ DB 15,88,160,223,114,0,0 ; addps 0x72df(%eax),%xmm4
DB 15,84,214 ; andps %xmm6,%xmm2
DB 15,85,244 ; andnps %xmm4,%xmm6
DB 15,86,242 ; orps %xmm2,%xmm6
@@ -39653,7 +46160,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4
DB 15,92,217 ; subps %xmm1,%xmm3
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,40,168,31,82,0,0 ; movaps 0x521f(%eax),%xmm5
+ DB 15,40,168,255,114,0,0 ; movaps 0x72ff(%eax),%xmm5
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
@@ -39663,7 +46170,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,86,235 ; orps %xmm3,%xmm5
DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,94,205 ; divps %xmm5,%xmm1
- DB 15,89,128,15,82,0,0 ; mulps 0x520f(%eax),%xmm0
+ DB 15,89,128,239,114,0,0 ; mulps 0x72ef(%eax),%xmm0
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -39686,7 +46193,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
DB 232,0,0,0,0 ; call 2436 <_sk_hsl_to_rgb_sse2+0x19>
DB 88 ; pop %eax
- DB 15,40,160,58,81,0,0 ; movaps 0x513a(%eax),%xmm4
+ DB 15,40,160,26,114,0,0 ; movaps 0x721a(%eax),%xmm4
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
@@ -39699,13 +46206,13 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,84,243 ; andps %xmm3,%xmm6
DB 15,85,217 ; andnps %xmm1,%xmm3
DB 15,86,222 ; orps %xmm6,%xmm3
- DB 15,40,168,74,81,0,0 ; movaps 0x514a(%eax),%xmm5
+ DB 15,40,168,42,114,0,0 ; movaps 0x722a(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,193,1 ; cmpltps %xmm1,%xmm0
- DB 15,40,176,90,81,0,0 ; movaps 0x515a(%eax),%xmm6
+ DB 15,40,176,58,114,0,0 ; movaps 0x723a(%eax),%xmm6
DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,200 ; subps %xmm0,%xmm1
@@ -39715,19 +46222,19 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,184,106,81,0,0 ; movaps 0x516a(%eax),%xmm7
+ DB 15,40,184,74,114,0,0 ; movaps 0x724a(%eax),%xmm7
DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp)
DB 15,194,253,2 ; cmpleps %xmm5,%xmm7
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,204 ; movaps %xmm4,%xmm1
DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
- DB 15,40,160,154,81,0,0 ; movaps 0x519a(%eax),%xmm4
+ DB 15,40,160,122,114,0,0 ; movaps 0x727a(%eax),%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
- DB 15,40,176,122,81,0,0 ; movaps 0x517a(%eax),%xmm6
+ DB 15,40,176,90,114,0,0 ; movaps 0x725a(%eax),%xmm6
DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,128,138,81,0,0 ; movaps 0x518a(%eax),%xmm0
+ DB 15,40,128,106,114,0,0 ; movaps 0x726a(%eax),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
@@ -39753,18 +46260,18 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,136,90,81,0,0 ; andps 0x515a(%eax),%xmm1
+ DB 15,84,136,58,114,0,0 ; andps 0x723a(%eax),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,128,106,81,0,0 ; movaps 0x516a(%eax),%xmm0
+ DB 15,40,128,74,114,0,0 ; movaps 0x724a(%eax),%xmm0
DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,152,58,81,0,0 ; movaps 0x513a(%eax),%xmm3
+ DB 15,40,152,26,114,0,0 ; movaps 0x721a(%eax),%xmm3
DB 15,194,217,2 ; cmpleps %xmm1,%xmm3
- DB 15,40,160,154,81,0,0 ; movaps 0x519a(%eax),%xmm4
+ DB 15,40,160,122,114,0,0 ; movaps 0x727a(%eax),%xmm4
DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,168,138,81,0,0 ; movaps 0x518a(%eax),%xmm5
+ DB 15,40,168,106,114,0,0 ; movaps 0x726a(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
@@ -39784,7 +46291,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
DB 15,85,252 ; andnps %xmm4,%xmm7
DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,88,152,170,81,0,0 ; addps 0x51aa(%eax),%xmm3
+ DB 15,88,152,138,114,0,0 ; addps 0x728a(%eax),%xmm3
DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
@@ -39882,9 +46389,9 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,64,79,0,0 ; pand 0x4f40(%edx),%xmm4
+ DB 102,15,219,162,32,112,0,0 ; pand 0x7020(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,80,79,0,0 ; mulps 0x4f50(%edx),%xmm4
+ DB 15,89,162,48,112,0,0 ; mulps 0x7030(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
@@ -39980,9 +46487,9 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,88,78,0,0 ; pand 0x4e58(%edx),%xmm4
+ DB 102,15,219,162,56,111,0,0 ; pand 0x6f38(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,104,78,0,0 ; mulps 0x4e68(%edx),%xmm4
+ DB 15,89,162,72,111,0,0 ; mulps 0x6f48(%edx),%xmm4
DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
DB 15,92,197 ; subps %xmm5,%xmm0
@@ -40054,17 +46561,17 @@ _sk_lerp_565_sse2 LABEL PROC
DB 15,133,163,0,0,0 ; jne 2955 <_sk_lerp_565_sse2+0xd2>
DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,162,159,77,0,0 ; movdqa 0x4d9f(%edx),%xmm4
+ DB 102,15,111,162,127,110,0,0 ; movdqa 0x6e7f(%edx),%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,175,77,0,0 ; mulps 0x4daf(%edx),%xmm4
- DB 102,15,111,170,191,77,0,0 ; movdqa 0x4dbf(%edx),%xmm5
+ DB 15,89,162,143,110,0,0 ; mulps 0x6e8f(%edx),%xmm4
+ DB 102,15,111,170,159,110,0,0 ; movdqa 0x6e9f(%edx),%xmm5
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,207,77,0,0 ; mulps 0x4dcf(%edx),%xmm5
- DB 102,15,219,178,223,77,0,0 ; pand 0x4ddf(%edx),%xmm6
+ DB 15,89,170,175,110,0,0 ; mulps 0x6eaf(%edx),%xmm5
+ DB 102,15,219,178,191,110,0,0 ; pand 0x6ebf(%edx),%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,239,77,0,0 ; mulps 0x4def(%edx),%xmm6
+ DB 15,89,178,207,110,0,0 ; mulps 0x6ecf(%edx),%xmm6
DB 15,40,121,16 ; movaps 0x10(%ecx),%xmm7
DB 15,92,199 ; subps %xmm7,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -40137,7 +46644,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 139,30 ; mov (%esi),%ebx
DB 15,133,19,1,0,0 ; jne 2ad5 <_sk_load_tables_sse2+0x139>
DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3
- DB 102,15,111,146,230,76,0,0 ; movdqa 0x4ce6(%edx),%xmm2
+ DB 102,15,111,146,198,109,0,0 ; movdqa 0x6dc6(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
@@ -40193,7 +46700,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,246,76,0,0 ; mulps 0x4cf6(%edx),%xmm3
+ DB 15,89,154,214,109,0,0 ; mulps 0x6dd6(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,194 ; mov %eax,%edx
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -40338,7 +46845,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3
DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,152,75,0,0 ; mulps 0x4b98(%edx),%xmm3
+ DB 15,89,154,120,108,0,0 ; mulps 0x6c78(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
@@ -40475,7 +46982,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 141,65,8 ; lea 0x8(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 139,85,240 ; mov -0x10(%ebp),%edx
- DB 15,40,162,168,73,0,0 ; movaps 0x49a8(%edx),%xmm4
+ DB 15,40,162,136,106,0,0 ; movaps 0x6a88(%edx),%xmm4
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 80 ; push %eax
@@ -40518,7 +47025,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
- DB 15,40,162,169,71,0,0 ; movaps 0x47a9(%edx),%xmm4
+ DB 15,40,162,137,104,0,0 ; movaps 0x6889(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
@@ -40540,7 +47047,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
DB 139,65,4 ; mov 0x4(%ecx),%eax
DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0
- DB 15,40,170,185,71,0,0 ; movaps 0x47b9(%edx),%xmm5
+ DB 15,40,170,153,104,0,0 ; movaps 0x6899(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -40668,7 +47175,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0
DB 139,121,4 ; mov 0x4(%ecx),%edi
DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0
- DB 15,40,170,201,69,0,0 ; movaps 0x45c9(%edx),%xmm5
+ DB 15,40,170,169,102,0,0 ; movaps 0x66a9(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -40914,15 +47421,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,10,67,0,0 ; mulps 0x430a(%edx),%xmm5
- DB 15,84,178,26,67,0,0 ; andps 0x431a(%edx),%xmm6
- DB 15,86,178,42,67,0,0 ; orps 0x432a(%edx),%xmm6
- DB 15,88,170,58,67,0,0 ; addps 0x433a(%edx),%xmm5
- DB 15,40,186,74,67,0,0 ; movaps 0x434a(%edx),%xmm7
+ DB 15,89,170,234,99,0,0 ; mulps 0x63ea(%edx),%xmm5
+ DB 15,84,178,250,99,0,0 ; andps 0x63fa(%edx),%xmm6
+ DB 15,86,178,10,100,0,0 ; orps 0x640a(%edx),%xmm6
+ DB 15,88,170,26,100,0,0 ; addps 0x641a(%edx),%xmm5
+ DB 15,40,186,42,100,0,0 ; movaps 0x642a(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,90,67,0,0 ; addps 0x435a(%edx),%xmm6
- DB 15,40,186,106,67,0,0 ; movaps 0x436a(%edx),%xmm7
+ DB 15,88,178,58,100,0,0 ; addps 0x643a(%edx),%xmm6
+ DB 15,40,186,74,100,0,0 ; movaps 0x644a(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -40932,21 +47439,21 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,122,67,0,0 ; movaps 0x437a(%edx),%xmm6
+ DB 15,40,178,90,100,0,0 ; movaps 0x645a(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,138,67,0,0 ; addps 0x438a(%edx),%xmm5
- DB 15,40,186,154,67,0,0 ; movaps 0x439a(%edx),%xmm7
+ DB 15,88,170,106,100,0,0 ; addps 0x646a(%edx),%xmm5
+ DB 15,40,186,122,100,0,0 ; movaps 0x647a(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,170,67,0,0 ; movaps 0x43aa(%edx),%xmm7
+ DB 15,40,186,138,100,0,0 ; movaps 0x648a(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,186,67,0,0 ; movaps 0x43ba(%edx),%xmm0
+ DB 15,40,130,154,100,0,0 ; movaps 0x649a(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,202,67,0,0 ; mulps 0x43ca(%edx),%xmm0
+ DB 15,89,130,170,100,0,0 ; mulps 0x64aa(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -40998,15 +47505,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,163,66,0,0 ; mulps 0x42a3(%edx),%xmm5
- DB 15,84,178,179,66,0,0 ; andps 0x42b3(%edx),%xmm6
- DB 15,86,178,195,66,0,0 ; orps 0x42c3(%edx),%xmm6
- DB 15,88,170,211,66,0,0 ; addps 0x42d3(%edx),%xmm5
- DB 15,40,186,227,66,0,0 ; movaps 0x42e3(%edx),%xmm7
+ DB 15,89,170,131,99,0,0 ; mulps 0x6383(%edx),%xmm5
+ DB 15,84,178,147,99,0,0 ; andps 0x6393(%edx),%xmm6
+ DB 15,86,178,163,99,0,0 ; orps 0x63a3(%edx),%xmm6
+ DB 15,88,170,179,99,0,0 ; addps 0x63b3(%edx),%xmm5
+ DB 15,40,186,195,99,0,0 ; movaps 0x63c3(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,243,66,0,0 ; addps 0x42f3(%edx),%xmm6
- DB 15,40,186,3,67,0,0 ; movaps 0x4303(%edx),%xmm7
+ DB 15,88,178,211,99,0,0 ; addps 0x63d3(%edx),%xmm6
+ DB 15,40,186,227,99,0,0 ; movaps 0x63e3(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -41016,21 +47523,21 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,19,67,0,0 ; movaps 0x4313(%edx),%xmm6
+ DB 15,40,178,243,99,0,0 ; movaps 0x63f3(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,35,67,0,0 ; addps 0x4323(%edx),%xmm5
- DB 15,40,186,51,67,0,0 ; movaps 0x4333(%edx),%xmm7
+ DB 15,88,170,3,100,0,0 ; addps 0x6403(%edx),%xmm5
+ DB 15,40,186,19,100,0,0 ; movaps 0x6413(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,67,67,0,0 ; movaps 0x4343(%edx),%xmm7
+ DB 15,40,186,35,100,0,0 ; movaps 0x6423(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,83,67,0,0 ; movaps 0x4353(%edx),%xmm0
+ DB 15,40,130,51,100,0,0 ; movaps 0x6433(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,99,67,0,0 ; mulps 0x4363(%edx),%xmm0
+ DB 15,89,130,67,100,0,0 ; mulps 0x6443(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -41081,15 +47588,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,63,66,0,0 ; mulps 0x423f(%edx),%xmm5
- DB 15,84,178,79,66,0,0 ; andps 0x424f(%edx),%xmm6
- DB 15,86,178,95,66,0,0 ; orps 0x425f(%edx),%xmm6
- DB 15,88,170,111,66,0,0 ; addps 0x426f(%edx),%xmm5
- DB 15,40,186,127,66,0,0 ; movaps 0x427f(%edx),%xmm7
+ DB 15,89,170,31,99,0,0 ; mulps 0x631f(%edx),%xmm5
+ DB 15,84,178,47,99,0,0 ; andps 0x632f(%edx),%xmm6
+ DB 15,86,178,63,99,0,0 ; orps 0x633f(%edx),%xmm6
+ DB 15,88,170,79,99,0,0 ; addps 0x634f(%edx),%xmm5
+ DB 15,40,186,95,99,0,0 ; movaps 0x635f(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,143,66,0,0 ; addps 0x428f(%edx),%xmm6
- DB 15,40,186,159,66,0,0 ; movaps 0x429f(%edx),%xmm7
+ DB 15,88,178,111,99,0,0 ; addps 0x636f(%edx),%xmm6
+ DB 15,40,186,127,99,0,0 ; movaps 0x637f(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -41099,21 +47606,21 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,175,66,0,0 ; movaps 0x42af(%edx),%xmm6
+ DB 15,40,178,143,99,0,0 ; movaps 0x638f(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,191,66,0,0 ; addps 0x42bf(%edx),%xmm5
- DB 15,40,186,207,66,0,0 ; movaps 0x42cf(%edx),%xmm7
+ DB 15,88,170,159,99,0,0 ; addps 0x639f(%edx),%xmm5
+ DB 15,40,186,175,99,0,0 ; movaps 0x63af(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,223,66,0,0 ; movaps 0x42df(%edx),%xmm7
+ DB 15,40,186,191,99,0,0 ; movaps 0x63bf(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,239,66,0,0 ; movaps 0x42ef(%edx),%xmm0
+ DB 15,40,130,207,99,0,0 ; movaps 0x63cf(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,255,66,0,0 ; mulps 0x42ff(%edx),%xmm0
+ DB 15,89,130,223,99,0,0 ; mulps 0x63df(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -41164,15 +47671,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,219,65,0,0 ; mulps 0x41db(%edx),%xmm5
- DB 15,84,178,235,65,0,0 ; andps 0x41eb(%edx),%xmm6
- DB 15,86,178,251,65,0,0 ; orps 0x41fb(%edx),%xmm6
- DB 15,88,170,11,66,0,0 ; addps 0x420b(%edx),%xmm5
- DB 15,40,186,27,66,0,0 ; movaps 0x421b(%edx),%xmm7
+ DB 15,89,170,187,98,0,0 ; mulps 0x62bb(%edx),%xmm5
+ DB 15,84,178,203,98,0,0 ; andps 0x62cb(%edx),%xmm6
+ DB 15,86,178,219,98,0,0 ; orps 0x62db(%edx),%xmm6
+ DB 15,88,170,235,98,0,0 ; addps 0x62eb(%edx),%xmm5
+ DB 15,40,186,251,98,0,0 ; movaps 0x62fb(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,43,66,0,0 ; addps 0x422b(%edx),%xmm6
- DB 15,40,186,59,66,0,0 ; movaps 0x423b(%edx),%xmm7
+ DB 15,88,178,11,99,0,0 ; addps 0x630b(%edx),%xmm6
+ DB 15,40,186,27,99,0,0 ; movaps 0x631b(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -41182,21 +47689,21 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,75,66,0,0 ; movaps 0x424b(%edx),%xmm6
+ DB 15,40,178,43,99,0,0 ; movaps 0x632b(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,91,66,0,0 ; addps 0x425b(%edx),%xmm5
- DB 15,40,186,107,66,0,0 ; movaps 0x426b(%edx),%xmm7
+ DB 15,88,170,59,99,0,0 ; addps 0x633b(%edx),%xmm5
+ DB 15,40,186,75,99,0,0 ; movaps 0x634b(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,123,66,0,0 ; movaps 0x427b(%edx),%xmm7
+ DB 15,40,186,91,99,0,0 ; movaps 0x635b(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,139,66,0,0 ; movaps 0x428b(%edx),%xmm0
+ DB 15,40,130,107,99,0,0 ; movaps 0x636b(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,155,66,0,0 ; mulps 0x429b(%edx),%xmm0
+ DB 15,89,130,123,99,0,0 ; mulps 0x637b(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -41229,15 +47736,15 @@ _sk_gamma_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 38c6 <_sk_gamma_sse2+0x12>
DB 88 ; pop %eax
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,128,122,65,0,0 ; mulps 0x417a(%eax),%xmm0
- DB 15,84,152,138,65,0,0 ; andps 0x418a(%eax),%xmm3
- DB 15,86,152,154,65,0,0 ; orps 0x419a(%eax),%xmm3
- DB 15,88,128,170,65,0,0 ; addps 0x41aa(%eax),%xmm0
+ DB 15,89,128,90,98,0,0 ; mulps 0x625a(%eax),%xmm0
+ DB 15,84,152,106,98,0,0 ; andps 0x626a(%eax),%xmm3
+ DB 15,86,152,122,98,0,0 ; orps 0x627a(%eax),%xmm3
+ DB 15,88,128,138,98,0,0 ; addps 0x628a(%eax),%xmm0
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,89,160,186,65,0,0 ; mulps 0x41ba(%eax),%xmm4
+ DB 15,89,160,154,98,0,0 ; mulps 0x629a(%eax),%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,88,152,202,65,0,0 ; addps 0x41ca(%eax),%xmm3
- DB 15,40,160,218,65,0,0 ; movaps 0x41da(%eax),%xmm4
+ DB 15,88,152,170,98,0,0 ; addps 0x62aa(%eax),%xmm3
+ DB 15,40,160,186,98,0,0 ; movaps 0x62ba(%eax),%xmm4
DB 15,94,227 ; divps %xmm3,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 139,77,12 ; mov 0xc(%ebp),%ecx
@@ -41250,30 +47757,30 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,227,1 ; cmpltps %xmm3,%xmm4
- DB 15,84,160,234,65,0,0 ; andps 0x41ea(%eax),%xmm4
+ DB 15,84,160,202,98,0,0 ; andps 0x62ca(%eax),%xmm4
DB 15,92,220 ; subps %xmm4,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,88,128,250,65,0,0 ; addps 0x41fa(%eax),%xmm0
- DB 15,40,176,26,66,0,0 ; movaps 0x421a(%eax),%xmm6
+ DB 15,88,128,218,98,0,0 ; addps 0x62da(%eax),%xmm0
+ DB 15,40,176,250,98,0,0 ; movaps 0x62fa(%eax),%xmm6
DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,40,168,10,66,0,0 ; movaps 0x420a(%eax),%xmm5
+ DB 15,40,168,234,98,0,0 ; movaps 0x62ea(%eax),%xmm5
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,40,152,42,66,0,0 ; movaps 0x422a(%eax),%xmm3
+ DB 15,40,152,10,99,0,0 ; movaps 0x630a(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,94,230 ; divps %xmm6,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,128,122,65,0,0 ; mulps 0x417a(%eax),%xmm0
- DB 15,84,136,138,65,0,0 ; andps 0x418a(%eax),%xmm1
- DB 15,86,136,154,65,0,0 ; orps 0x419a(%eax),%xmm1
- DB 15,88,128,170,65,0,0 ; addps 0x41aa(%eax),%xmm0
+ DB 15,89,128,90,98,0,0 ; mulps 0x625a(%eax),%xmm0
+ DB 15,84,136,106,98,0,0 ; andps 0x626a(%eax),%xmm1
+ DB 15,86,136,122,98,0,0 ; orps 0x627a(%eax),%xmm1
+ DB 15,88,128,138,98,0,0 ; addps 0x628a(%eax),%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,89,176,186,65,0,0 ; mulps 0x41ba(%eax),%xmm6
+ DB 15,89,176,154,98,0,0 ; mulps 0x629a(%eax),%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,136,202,65,0,0 ; addps 0x41ca(%eax),%xmm1
- DB 15,40,176,218,65,0,0 ; movaps 0x41da(%eax),%xmm6
+ DB 15,88,136,170,98,0,0 ; addps 0x62aa(%eax),%xmm1
+ DB 15,40,176,186,98,0,0 ; movaps 0x62ba(%eax),%xmm6
DB 15,94,241 ; divps %xmm1,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -41281,12 +47788,12 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,241,1 ; cmpltps %xmm1,%xmm6
- DB 15,84,176,234,65,0,0 ; andps 0x41ea(%eax),%xmm6
+ DB 15,84,176,202,98,0,0 ; andps 0x62ca(%eax),%xmm6
DB 15,92,206 ; subps %xmm6,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,88,128,250,65,0,0 ; addps 0x41fa(%eax),%xmm0
- DB 15,40,184,26,66,0,0 ; movaps 0x421a(%eax),%xmm7
+ DB 15,88,128,218,98,0,0 ; addps 0x62da(%eax),%xmm0
+ DB 15,40,184,250,98,0,0 ; movaps 0x62fa(%eax),%xmm7
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
@@ -41294,15 +47801,15 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,207 ; divps %xmm7,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,128,122,65,0,0 ; mulps 0x417a(%eax),%xmm0
- DB 15,84,144,138,65,0,0 ; andps 0x418a(%eax),%xmm2
- DB 15,86,144,154,65,0,0 ; orps 0x419a(%eax),%xmm2
- DB 15,88,128,170,65,0,0 ; addps 0x41aa(%eax),%xmm0
- DB 15,40,176,186,65,0,0 ; movaps 0x41ba(%eax),%xmm6
+ DB 15,89,128,90,98,0,0 ; mulps 0x625a(%eax),%xmm0
+ DB 15,84,144,106,98,0,0 ; andps 0x626a(%eax),%xmm2
+ DB 15,86,144,122,98,0,0 ; orps 0x627a(%eax),%xmm2
+ DB 15,88,128,138,98,0,0 ; addps 0x628a(%eax),%xmm0
+ DB 15,40,176,154,98,0,0 ; movaps 0x629a(%eax),%xmm6
DB 15,89,242 ; mulps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,144,202,65,0,0 ; addps 0x41ca(%eax),%xmm2
- DB 15,40,176,218,65,0,0 ; movaps 0x41da(%eax),%xmm6
+ DB 15,88,144,170,98,0,0 ; addps 0x62aa(%eax),%xmm2
+ DB 15,40,176,186,98,0,0 ; movaps 0x62ba(%eax),%xmm6
DB 15,94,242 ; divps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
@@ -41310,18 +47817,18 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,242,1 ; cmpltps %xmm2,%xmm6
- DB 15,84,176,234,65,0,0 ; andps 0x41ea(%eax),%xmm6
+ DB 15,84,176,202,98,0,0 ; andps 0x62ca(%eax),%xmm6
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,88,128,250,65,0,0 ; addps 0x41fa(%eax),%xmm0
+ DB 15,88,128,218,98,0,0 ; addps 0x62da(%eax),%xmm0
DB 15,89,238 ; mulps %xmm6,%xmm5
DB 15,92,197 ; subps %xmm5,%xmm0
- DB 15,40,144,26,66,0,0 ; movaps 0x421a(%eax),%xmm2
+ DB 15,40,144,250,98,0,0 ; movaps 0x62fa(%eax),%xmm2
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,94,218 ; divps %xmm2,%xmm3
DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,40,128,58,66,0,0 ; movaps 0x423a(%eax),%xmm0
+ DB 15,40,128,26,99,0,0 ; movaps 0x631a(%eax),%xmm0
DB 15,89,224 ; mulps %xmm0,%xmm4
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,89,216 ; mulps %xmm0,%xmm3
@@ -41348,29 +47855,29 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 232,0,0,0,0 ; call 3aae <_sk_lab_to_xyz_sse2+0x15>
DB 88 ; pop %eax
- DB 15,89,144,98,64,0,0 ; mulps 0x4062(%eax),%xmm2
- DB 15,40,160,114,64,0,0 ; movaps 0x4072(%eax),%xmm4
+ DB 15,89,144,66,97,0,0 ; mulps 0x6142(%eax),%xmm2
+ DB 15,40,160,82,97,0,0 ; movaps 0x6152(%eax),%xmm4
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,168,130,64,0,0 ; movaps 0x4082(%eax),%xmm5
+ DB 15,40,168,98,97,0,0 ; movaps 0x6162(%eax),%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,144,146,64,0,0 ; addps 0x4092(%eax),%xmm2
- DB 15,89,144,162,64,0,0 ; mulps 0x40a2(%eax),%xmm2
- DB 15,89,136,178,64,0,0 ; mulps 0x40b2(%eax),%xmm1
+ DB 15,88,144,114,97,0,0 ; addps 0x6172(%eax),%xmm2
+ DB 15,89,144,130,97,0,0 ; mulps 0x6182(%eax),%xmm2
+ DB 15,89,136,146,97,0,0 ; mulps 0x6192(%eax),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,89,152,194,64,0,0 ; mulps 0x40c2(%eax),%xmm3
+ DB 15,89,152,162,97,0,0 ; mulps 0x61a2(%eax),%xmm3
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,152,210,64,0,0 ; movaps 0x40d2(%eax),%xmm3
+ DB 15,40,152,178,97,0,0 ; movaps 0x61b2(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,194,224,1 ; cmpltps %xmm0,%xmm4
- DB 15,40,176,226,64,0,0 ; movaps 0x40e2(%eax),%xmm6
+ DB 15,40,176,194,97,0,0 ; movaps 0x61c2(%eax),%xmm6
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,184,242,64,0,0 ; movaps 0x40f2(%eax),%xmm7
+ DB 15,40,184,210,97,0,0 ; movaps 0x61d2(%eax),%xmm7
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,85,225 ; andnps %xmm1,%xmm4
@@ -41395,8 +47902,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,85,221 ; andnps %xmm5,%xmm3
DB 15,86,216 ; orps %xmm0,%xmm3
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,160,2,65,0,0 ; mulps 0x4102(%eax),%xmm4
- DB 15,89,152,18,65,0,0 ; mulps 0x4112(%eax),%xmm3
+ DB 15,89,160,226,97,0,0 ; mulps 0x61e2(%eax),%xmm4
+ DB 15,89,152,242,97,0,0 ; mulps 0x61f2(%eax),%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -41432,9 +47939,9 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,50,64,0,0 ; pand 0x4032(%edx),%xmm0
+ DB 102,15,219,130,18,97,0,0 ; pand 0x6112(%edx),%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,154,66,64,0,0 ; mulps 0x4042(%edx),%xmm3
+ DB 15,89,154,34,97,0,0 ; mulps 0x6122(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -41497,9 +48004,9 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,126,63,0,0 ; pand 0x3f7e(%edx),%xmm4
+ DB 102,15,219,162,94,96,0,0 ; pand 0x605e(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,142,63,0,0 ; mulps 0x3f8e(%edx),%xmm4
+ DB 15,89,162,110,96,0,0 ; mulps 0x606e(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -41575,7 +48082,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,153,160,62,0,0 ; mulps 0x3ea0(%ecx),%xmm3
+ DB 15,89,153,128,95,0,0 ; mulps 0x5f80(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -41607,7 +48114,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 15,175,81,4 ; imul 0x4(%ecx),%edx
DB 3,23 ; add (%edi),%edx
DB 139,89,8 ; mov 0x8(%ecx),%ebx
- DB 15,40,166,108,62,0,0 ; movaps 0x3e6c(%esi),%xmm4
+ DB 15,40,166,76,95,0,0 ; movaps 0x5f4c(%esi),%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
@@ -41643,7 +48150,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 138,93,208 ; mov -0x30(%ebp),%bl
DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
- DB 102,15,219,166,124,62,0,0 ; pand 0x3e7c(%esi),%xmm4
+ DB 102,15,219,166,92,95,0,0 ; pand 0x5f5c(%esi),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
@@ -41678,12 +48185,12 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,211,61,0,0 ; pand 0x3dd3(%edx),%xmm0
+ DB 102,15,219,130,179,94,0,0 ; pand 0x5eb3(%edx),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,227,61,0,0 ; mulps 0x3de3(%edx),%xmm0
+ DB 15,89,130,195,94,0,0 ; mulps 0x5ec3(%edx),%xmm0
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,243,61,0,0 ; movaps 0x3df3(%edx),%xmm3
+ DB 15,40,154,211,94,0,0 ; movaps 0x5ed3(%edx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 86 ; push %esi
@@ -41739,13 +48246,13 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,87,61,0,0 ; pand 0x3d57(%edx),%xmm4
+ DB 102,15,219,162,55,94,0,0 ; pand 0x5e37(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,103,61,0,0 ; mulps 0x3d67(%edx),%xmm4
+ DB 15,89,162,71,94,0,0 ; mulps 0x5e47(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx)
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,162,119,61,0,0 ; movaps 0x3d77(%edx),%xmm4
+ DB 15,40,162,87,94,0,0 ; movaps 0x5e57(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -41822,10 +48329,10 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,95,60,0,0 ; mulps 0x3c5f(%ecx),%xmm0
+ DB 15,89,129,63,93,0,0 ; mulps 0x5d3f(%ecx),%xmm0
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,111,60,0,0 ; movaps 0x3c6f(%ecx),%xmm3
+ DB 15,40,153,79,93,0,0 ; movaps 0x5d4f(%ecx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 82 ; push %edx
@@ -41860,20 +48367,20 @@ _sk_load_565_sse2 LABEL PROC
DB 117,97 ; jne 410a <_sk_load_565_sse2+0x8c>
DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,52,60,0,0 ; movdqa 0x3c34(%edx),%xmm0
+ DB 102,15,111,130,20,93,0,0 ; movdqa 0x5d14(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,68,60,0,0 ; mulps 0x3c44(%edx),%xmm0
- DB 102,15,111,138,84,60,0,0 ; movdqa 0x3c54(%edx),%xmm1
+ DB 15,89,130,36,93,0,0 ; mulps 0x5d24(%edx),%xmm0
+ DB 102,15,111,138,52,93,0,0 ; movdqa 0x5d34(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,100,60,0,0 ; mulps 0x3c64(%edx),%xmm1
- DB 102,15,219,146,116,60,0,0 ; pand 0x3c74(%edx),%xmm2
+ DB 15,89,138,68,93,0,0 ; mulps 0x5d44(%edx),%xmm1
+ DB 102,15,219,146,84,93,0,0 ; pand 0x5d54(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,132,60,0,0 ; mulps 0x3c84(%edx),%xmm2
+ DB 15,89,146,100,93,0,0 ; mulps 0x5d64(%edx),%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,148,60,0,0 ; movaps 0x3c94(%edx),%xmm3
+ DB 15,40,154,116,93,0,0 ; movaps 0x5d74(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -41925,21 +48432,21 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 117,113 ; jne 41e9 <_sk_load_565_dst_sse2+0x9c>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,213,59,0,0 ; movdqa 0x3bd5(%edx),%xmm5
+ DB 102,15,111,170,181,92,0,0 ; movdqa 0x5cb5(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,229,59,0,0 ; mulps 0x3be5(%edx),%xmm5
+ DB 15,89,170,197,92,0,0 ; mulps 0x5cc5(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,245,59,0,0 ; movdqa 0x3bf5(%edx),%xmm5
+ DB 102,15,111,170,213,92,0,0 ; movdqa 0x5cd5(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,5,60,0,0 ; mulps 0x3c05(%edx),%xmm5
+ DB 15,89,170,229,92,0,0 ; mulps 0x5ce5(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,219,162,21,60,0,0 ; pand 0x3c15(%edx),%xmm4
+ DB 102,15,219,162,245,92,0,0 ; pand 0x5cf5(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,37,60,0,0 ; mulps 0x3c25(%edx),%xmm4
+ DB 15,89,162,5,93,0,0 ; mulps 0x5d05(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
- DB 15,40,162,53,60,0,0 ; movaps 0x3c35(%edx),%xmm4
+ DB 15,40,162,21,93,0,0 ; movaps 0x5d15(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -42007,20 +48514,20 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,249,58,0,0 ; movdqa 0x3af9(%edx),%xmm0
+ DB 102,15,111,130,217,91,0,0 ; movdqa 0x5bd9(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,9,59,0,0 ; mulps 0x3b09(%edx),%xmm0
- DB 102,15,111,138,25,59,0,0 ; movdqa 0x3b19(%edx),%xmm1
+ DB 15,89,130,233,91,0,0 ; mulps 0x5be9(%edx),%xmm0
+ DB 102,15,111,138,249,91,0,0 ; movdqa 0x5bf9(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,41,59,0,0 ; mulps 0x3b29(%edx),%xmm1
- DB 102,15,219,146,57,59,0,0 ; pand 0x3b39(%edx),%xmm2
+ DB 15,89,138,9,92,0,0 ; mulps 0x5c09(%edx),%xmm1
+ DB 102,15,219,146,25,92,0,0 ; pand 0x5c19(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,73,59,0,0 ; mulps 0x3b49(%edx),%xmm2
+ DB 15,89,146,41,92,0,0 ; mulps 0x5c29(%edx),%xmm2
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,89,59,0,0 ; movaps 0x3b59(%edx),%xmm3
+ DB 15,40,154,57,92,0,0 ; movaps 0x5c39(%edx),%xmm3
DB 81 ; push %ecx
DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
@@ -42046,8 +48553,8 @@ _sk_store_565_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,246,58,0,0 ; movaps 0x3af6(%edi),%xmm4
- DB 15,40,175,6,59,0,0 ; movaps 0x3b06(%edi),%xmm5
+ DB 15,40,167,214,91,0,0 ; movaps 0x5bd6(%edi),%xmm4
+ DB 15,40,175,230,91,0,0 ; movaps 0x5be6(%edi),%xmm5
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,89,244 ; mulps %xmm4,%xmm6
@@ -42125,21 +48632,21 @@ _sk_load_4444_sse2 LABEL PROC
DB 117,112 ; jne 4489 <_sk_load_4444_sse2+0x9b>
DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,52,58,0,0 ; movdqa 0x3a34(%edx),%xmm0
+ DB 102,15,111,130,20,91,0,0 ; movdqa 0x5b14(%edx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,68,58,0,0 ; mulps 0x3a44(%edx),%xmm0
- DB 102,15,111,138,84,58,0,0 ; movdqa 0x3a54(%edx),%xmm1
+ DB 15,89,130,36,91,0,0 ; mulps 0x5b24(%edx),%xmm0
+ DB 102,15,111,138,52,91,0,0 ; movdqa 0x5b34(%edx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,100,58,0,0 ; mulps 0x3a64(%edx),%xmm1
- DB 102,15,111,146,116,58,0,0 ; movdqa 0x3a74(%edx),%xmm2
+ DB 15,89,138,68,91,0,0 ; mulps 0x5b44(%edx),%xmm1
+ DB 102,15,111,146,84,91,0,0 ; movdqa 0x5b54(%edx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,132,58,0,0 ; mulps 0x3a84(%edx),%xmm2
- DB 102,15,219,154,148,58,0,0 ; pand 0x3a94(%edx),%xmm3
+ DB 15,89,146,100,91,0,0 ; mulps 0x5b64(%edx),%xmm2
+ DB 102,15,219,154,116,91,0,0 ; pand 0x5b74(%edx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,164,58,0,0 ; mulps 0x3aa4(%edx),%xmm3
+ DB 15,89,154,132,91,0,0 ; mulps 0x5b84(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 82 ; push %edx
@@ -42193,24 +48700,24 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 15,133,128,0,0,0 ; jne 457b <_sk_load_4444_dst_sse2+0xaf>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,214,57,0,0 ; movdqa 0x39d6(%edx),%xmm5
+ DB 102,15,111,170,182,90,0,0 ; movdqa 0x5ab6(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,230,57,0,0 ; mulps 0x39e6(%edx),%xmm5
+ DB 15,89,170,198,90,0,0 ; mulps 0x5ac6(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,246,57,0,0 ; movdqa 0x39f6(%edx),%xmm5
+ DB 102,15,111,170,214,90,0,0 ; movdqa 0x5ad6(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,6,58,0,0 ; mulps 0x3a06(%edx),%xmm5
+ DB 15,89,170,230,90,0,0 ; mulps 0x5ae6(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,111,170,22,58,0,0 ; movdqa 0x3a16(%edx),%xmm5
+ DB 102,15,111,170,246,90,0,0 ; movdqa 0x5af6(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,38,58,0,0 ; mulps 0x3a26(%edx),%xmm5
+ DB 15,89,170,6,91,0,0 ; mulps 0x5b06(%edx),%xmm5
DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
- DB 102,15,219,162,54,58,0,0 ; pand 0x3a36(%edx),%xmm4
+ DB 102,15,219,162,22,91,0,0 ; pand 0x5b16(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,70,58,0,0 ; mulps 0x3a46(%edx),%xmm4
+ DB 15,89,162,38,91,0,0 ; mulps 0x5b26(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -42278,21 +48785,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,129,238,56,0,0 ; movdqa 0x38ee(%ecx),%xmm0
+ DB 102,15,111,129,206,89,0,0 ; movdqa 0x59ce(%ecx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,254,56,0,0 ; mulps 0x38fe(%ecx),%xmm0
- DB 102,15,111,137,14,57,0,0 ; movdqa 0x390e(%ecx),%xmm1
+ DB 15,89,129,222,89,0,0 ; mulps 0x59de(%ecx),%xmm0
+ DB 102,15,111,137,238,89,0,0 ; movdqa 0x59ee(%ecx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,137,30,57,0,0 ; mulps 0x391e(%ecx),%xmm1
- DB 102,15,111,145,46,57,0,0 ; movdqa 0x392e(%ecx),%xmm2
+ DB 15,89,137,254,89,0,0 ; mulps 0x59fe(%ecx),%xmm1
+ DB 102,15,111,145,14,90,0,0 ; movdqa 0x5a0e(%ecx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,145,62,57,0,0 ; mulps 0x393e(%ecx),%xmm2
- DB 102,15,219,153,78,57,0,0 ; pand 0x394e(%ecx),%xmm3
+ DB 15,89,145,30,90,0,0 ; mulps 0x5a1e(%ecx),%xmm2
+ DB 102,15,219,153,46,90,0,0 ; pand 0x5a2e(%ecx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,153,94,57,0,0 ; mulps 0x395e(%ecx),%xmm3
+ DB 15,89,153,62,90,0,0 ; mulps 0x5a3e(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 81 ; push %ecx
@@ -42320,7 +48827,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,241,56,0,0 ; movaps 0x38f1(%edi),%xmm4
+ DB 15,40,167,209,89,0,0 ; movaps 0x59d1(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -42403,11 +48910,11 @@ _sk_load_8888_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,102 ; jne 4834 <_sk_load_8888_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,146,16,56,0,0 ; movdqa 0x3810(%edx),%xmm2
+ DB 102,15,111,146,240,88,0,0 ; movdqa 0x58f0(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,32,56,0,0 ; movaps 0x3820(%edx),%xmm4
+ DB 15,40,162,0,89,0,0 ; movaps 0x5900(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -42470,11 +48977,11 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,118 ; jne 490b <_sk_load_8888_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,105,55,0,0 ; movdqa 0x3769(%edx),%xmm5
+ DB 102,15,111,170,73,88,0,0 ; movdqa 0x5849(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,121,55,0,0 ; movaps 0x3779(%edx),%xmm7
+ DB 15,40,186,89,88,0,0 ; movaps 0x5859(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -42554,11 +49061,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,145,70,54,0,0 ; movdqa 0x3646(%ecx),%xmm2
+ DB 102,15,111,145,38,87,0,0 ; movdqa 0x5726(%ecx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,161,86,54,0,0 ; movaps 0x3656(%ecx),%xmm4
+ DB 15,40,161,54,87,0,0 ; movaps 0x5736(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -42600,7 +49107,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,235,53,0,0 ; movaps 0x35eb(%edi),%xmm4
+ DB 15,40,167,203,86,0,0 ; movaps 0x56cb(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -42669,11 +49176,11 @@ _sk_load_bgra_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,102 ; jne 4b6f <_sk_load_bgra_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,130,69,53,0,0 ; movdqa 0x3545(%edx),%xmm0
+ DB 102,15,111,130,37,86,0,0 ; movdqa 0x5625(%edx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,162,85,53,0,0 ; movaps 0x3555(%edx),%xmm4
+ DB 15,40,162,53,86,0,0 ; movaps 0x5635(%edx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -42736,11 +49243,11 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,118 ; jne 4c46 <_sk_load_bgra_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,158,52,0,0 ; movdqa 0x349e(%edx),%xmm5
+ DB 102,15,111,170,126,85,0,0 ; movdqa 0x557e(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,174,52,0,0 ; movaps 0x34ae(%edx),%xmm7
+ DB 15,40,186,142,85,0,0 ; movaps 0x558e(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -42820,11 +49327,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,129,123,51,0,0 ; movdqa 0x337b(%ecx),%xmm0
+ DB 102,15,111,129,91,84,0,0 ; movdqa 0x545b(%ecx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,161,139,51,0,0 ; movaps 0x338b(%ecx),%xmm4
+ DB 15,40,161,107,84,0,0 ; movaps 0x546b(%ecx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -42866,7 +49373,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,32,51,0,0 ; movaps 0x3320(%edi),%xmm4
+ DB 15,40,167,0,84,0,0 ; movaps 0x5400(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -42961,7 +49468,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,154,122,50,0,0 ; movdqa 0x327a(%edx),%xmm3
+ DB 102,15,111,154,90,83,0,0 ; movdqa 0x535a(%edx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -42994,15 +49501,15 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,154,138,50,0,0 ; movdqa 0x328a(%edx),%xmm3
+ DB 102,15,111,154,106,83,0,0 ; movdqa 0x536a(%edx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,154,154,50,0,0 ; movdqa 0x329a(%edx),%xmm3
+ DB 102,15,111,154,122,83,0,0 ; movdqa 0x537a(%edx),%xmm3
DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,154,170,50,0,0 ; movdqa 0x32aa(%edx),%xmm3
+ DB 102,15,111,154,138,83,0,0 ; movdqa 0x538a(%edx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -43093,7 +49600,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
- DB 102,15,111,154,164,48,0,0 ; movdqa 0x30a4(%edx),%xmm3
+ DB 102,15,111,154,132,81,0,0 ; movdqa 0x5184(%edx),%xmm3
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,239,226 ; pxor %xmm2,%xmm4
@@ -43101,13 +49608,13 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,15,111,146,196,48,0,0 ; movdqa 0x30c4(%edx),%xmm2
+ DB 102,15,111,146,164,81,0,0 ; movdqa 0x51a4(%edx),%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
DB 102,15,239,226 ; pxor %xmm2,%xmm4
- DB 102,15,111,178,212,48,0,0 ; movdqa 0x30d4(%edx),%xmm6
+ DB 102,15,111,178,180,81,0,0 ; movdqa 0x51b4(%edx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7
- DB 102,15,111,146,180,48,0,0 ; movdqa 0x30b4(%edx),%xmm2
+ DB 102,15,111,146,148,81,0,0 ; movdqa 0x5194(%edx),%xmm2
DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp)
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,223,249 ; pandn %xmm1,%xmm7
@@ -43249,7 +49756,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,153,58,46,0,0 ; movdqa 0x2e3a(%ecx),%xmm3
+ DB 102,15,111,153,26,79,0,0 ; movdqa 0x4f1a(%ecx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -43282,15 +49789,15 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,153,74,46,0,0 ; movdqa 0x2e4a(%ecx),%xmm3
+ DB 102,15,111,153,42,79,0,0 ; movdqa 0x4f2a(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,153,90,46,0,0 ; movdqa 0x2e5a(%ecx),%xmm3
+ DB 102,15,111,153,58,79,0,0 ; movdqa 0x4f3a(%ecx),%xmm3
DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,153,106,46,0,0 ; movdqa 0x2e6a(%ecx),%xmm3
+ DB 102,15,111,153,74,79,0,0 ; movdqa 0x4f4a(%ecx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -43329,18 +49836,18 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 232,0,0,0,0 ; call 54a9 <_sk_store_f16_sse2+0x15>
DB 88 ; pop %eax
- DB 102,15,111,176,183,44,0,0 ; movdqa 0x2cb7(%eax),%xmm6
+ DB 102,15,111,176,151,77,0,0 ; movdqa 0x4d97(%eax),%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,219,214 ; pand %xmm6,%xmm2
DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,239,234 ; pxor %xmm2,%xmm5
- DB 102,15,111,160,199,44,0,0 ; movdqa 0x2cc7(%eax),%xmm4
+ DB 102,15,111,160,167,77,0,0 ; movdqa 0x4da7(%eax),%xmm4
DB 102,15,114,210,16 ; psrld $0x10,%xmm2
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
DB 102,15,114,213,13 ; psrld $0xd,%xmm5
- DB 102,15,111,184,215,44,0,0 ; movdqa 0x2cd7(%eax),%xmm7
+ DB 102,15,111,184,183,77,0,0 ; movdqa 0x4db7(%eax),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp)
DB 102,15,254,213 ; paddd %xmm5,%xmm2
@@ -43475,7 +49982,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,33,43,0,0 ; movaps 0x2b21(%edx),%xmm4
+ DB 15,40,162,1,76,0,0 ; movaps 0x4c01(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -43577,7 +50084,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,170,202,41,0,0 ; movaps 0x29ca(%edx),%xmm5
+ DB 15,40,170,170,74,0,0 ; movaps 0x4aaa(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -43603,7 +50110,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,218,41,0,0 ; movaps 0x29da(%edx),%xmm3
+ DB 15,40,154,186,74,0,0 ; movaps 0x4aba(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -43642,7 +50149,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 232,0,0,0,0 ; call 5931 <_sk_store_u16_be_sse2+0x11>
DB 88 ; pop %eax
- DB 15,40,176,143,40,0,0 ; movaps 0x288f(%eax),%xmm6
+ DB 15,40,176,111,73,0,0 ; movaps 0x496f(%eax),%xmm6
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,89,230 ; mulps %xmm6,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
@@ -43973,7 +50480,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,251,36,0,0 ; andps 0x24fb(%ecx),%xmm6
+ DB 15,84,177,219,69,0,0 ; andps 0x45db(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -44009,7 +50516,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,165,36,0,0 ; andps 0x24a5(%ecx),%xmm6
+ DB 15,84,177,133,69,0,0 ; andps 0x4585(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -44043,13 +50550,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 243,15,89,177,63,41,0,0 ; mulss 0x293f(%ecx),%xmm6
+ DB 243,15,89,177,175,74,0,0 ; mulss 0x4aaf(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,79,36,0,0 ; andps 0x244f(%ecx),%xmm6
+ DB 15,84,177,47,69,0,0 ; andps 0x452f(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -44087,13 +50594,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 243,15,89,177,190,40,0,0 ; mulss 0x28be(%ecx),%xmm6
+ DB 243,15,89,177,46,74,0,0 ; mulss 0x4a2e(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,218,35,0,0 ; andps 0x23da(%ecx),%xmm6
+ DB 15,84,177,186,68,0,0 ; andps 0x44ba(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -44127,7 +50634,7 @@ _sk_clamp_x_1_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,93,160,101,35,0,0 ; minps 0x2365(%eax),%xmm4
+ DB 15,93,160,69,68,0,0 ; minps 0x4445(%eax),%xmm4
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -44150,7 +50657,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,84,168,69,35,0,0 ; andps 0x2345(%eax),%xmm5
+ DB 15,84,168,37,68,0,0 ; andps 0x4425(%eax),%xmm5
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -44170,14 +50677,14 @@ _sk_mirror_x_1_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 5f16 <_sk_mirror_x_1_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,161,26,35,0,0 ; movaps 0x231a(%ecx),%xmm4
+ DB 15,40,161,250,67,0,0 ; movaps 0x43fa(%ecx),%xmm4
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,169,42,35,0,0 ; movaps 0x232a(%ecx),%xmm5
+ DB 15,40,169,10,68,0,0 ; movaps 0x440a(%ecx),%xmm5
DB 15,89,232 ; mulps %xmm0,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,169,58,35,0,0 ; andps 0x233a(%ecx),%xmm5
+ DB 15,84,169,26,68,0,0 ; andps 0x441a(%ecx),%xmm5
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,88,246 ; addps %xmm6,%xmm6
@@ -44203,10 +50710,10 @@ _sk_luminance_to_alpha_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 5f74 <_sk_luminance_to_alpha_sse2+0xe>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,128,236,34,0,0 ; mulps 0x22ec(%eax),%xmm0
- DB 15,89,136,252,34,0,0 ; mulps 0x22fc(%eax),%xmm1
+ DB 15,89,128,204,67,0,0 ; mulps 0x43cc(%eax),%xmm0
+ DB 15,89,136,220,67,0,0 ; mulps 0x43dc(%eax),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,152,12,35,0,0 ; mulps 0x230c(%eax),%xmm3
+ DB 15,89,152,236,67,0,0 ; mulps 0x43ec(%eax),%xmm3
DB 15,88,217 ; addps %xmm1,%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -44591,12 +51098,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 78 ; dec %esi
DB 102,15,110,206 ; movd %esi,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
- DB 102,15,111,146,127,30,0,0 ; movdqa 0x1e7f(%edx),%xmm2
+ DB 102,15,111,146,95,63,0,0 ; movdqa 0x3f5f(%edx),%xmm2
DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,235,146,143,30,0,0 ; por 0x1e8f(%edx),%xmm2
+ DB 102,15,235,146,111,63,0,0 ; por 0x3f6f(%edx),%xmm2
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
- DB 102,15,235,138,159,30,0,0 ; por 0x1e9f(%edx),%xmm1
- DB 15,88,138,175,30,0,0 ; addps 0x1eaf(%edx),%xmm1
+ DB 102,15,235,138,127,63,0,0 ; por 0x3f7f(%edx),%xmm1
+ DB 15,88,138,143,63,0,0 ; addps 0x3f8f(%edx),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -44704,15 +51211,15 @@ _sk_gauss_a_to_rgba_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 65c7 <_sk_gauss_a_to_rgba_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,128,9,29,0,0 ; movaps 0x1d09(%eax),%xmm0
+ DB 15,40,128,233,61,0,0 ; movaps 0x3de9(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,25,29,0,0 ; addps 0x1d19(%eax),%xmm0
+ DB 15,88,128,249,61,0,0 ; addps 0x3df9(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,41,29,0,0 ; addps 0x1d29(%eax),%xmm0
+ DB 15,88,128,9,62,0,0 ; addps 0x3e09(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,57,29,0,0 ; addps 0x1d39(%eax),%xmm0
+ DB 15,88,128,25,62,0,0 ; addps 0x3e19(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,73,29,0,0 ; addps 0x1d49(%eax),%xmm0
+ DB 15,88,128,41,62,0,0 ; addps 0x3e29(%eax),%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,200 ; movaps %xmm0,%xmm1
@@ -44747,7 +51254,7 @@ _sk_gradient_sse2 LABEL PROC
DB 74 ; dec %edx
DB 131,198,4 ; add $0x4,%esi
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,151,254,28,0,0 ; movaps 0x1cfe(%edi),%xmm2
+ DB 15,40,151,222,61,0,0 ; movaps 0x3dde(%edi),%xmm2
DB 243,15,16,30 ; movss (%esi),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -44918,30 +51425,30 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,94,247 ; divps %xmm7,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,40,128,210,26,0,0 ; movaps 0x1ad2(%eax),%xmm0
+ DB 15,40,128,178,59,0,0 ; movaps 0x3bb2(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,226,26,0,0 ; addps 0x1ae2(%eax),%xmm0
+ DB 15,88,128,194,59,0,0 ; addps 0x3bc2(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,242,26,0,0 ; addps 0x1af2(%eax),%xmm0
+ DB 15,88,128,210,59,0,0 ; addps 0x3bd2(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,2,27,0,0 ; addps 0x1b02(%eax),%xmm0
+ DB 15,88,128,226,59,0,0 ; addps 0x3be2(%eax),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,40,176,18,27,0,0 ; movaps 0x1b12(%eax),%xmm6
+ DB 15,40,176,242,59,0,0 ; movaps 0x3bf2(%eax),%xmm6
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,84,245 ; andps %xmm5,%xmm6
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,86,238 ; orps %xmm6,%xmm5
DB 15,194,204,1 ; cmpltps %xmm4,%xmm1
- DB 15,40,128,34,27,0,0 ; movaps 0x1b22(%eax),%xmm0
+ DB 15,40,128,2,60,0,0 ; movaps 0x3c02(%eax),%xmm0
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,205 ; andnps %xmm5,%xmm1
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
- DB 15,40,168,50,27,0,0 ; movaps 0x1b32(%eax),%xmm5
+ DB 15,40,168,18,60,0,0 ; movaps 0x3c12(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,193 ; andnps %xmm1,%xmm0
@@ -45005,8 +51512,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,37,26,0,0 ; mulps 0x1a25(%edx),%xmm4
- DB 15,89,130,53,26,0,0 ; mulps 0x1a35(%edx),%xmm0
+ DB 15,89,162,5,59,0,0 ; mulps 0x3b05(%edx),%xmm4
+ DB 15,89,130,21,59,0,0 ; mulps 0x3b15(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -45014,11 +51521,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,69,26,0,0 ; xorps 0x1a45(%edx),%xmm4
+ DB 15,87,162,37,59,0,0 ; xorps 0x3b25(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,85,26,0,0 ; mulps 0x1a55(%edx),%xmm5
+ DB 15,89,170,53,59,0,0 ; mulps 0x3b35(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,95,196 ; maxps %xmm4,%xmm0
@@ -45054,8 +51561,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,199,25,0,0 ; mulps 0x19c7(%edx),%xmm4
- DB 15,89,130,215,25,0,0 ; mulps 0x19d7(%edx),%xmm0
+ DB 15,89,162,167,58,0,0 ; mulps 0x3aa7(%edx),%xmm4
+ DB 15,89,130,183,58,0,0 ; mulps 0x3ab7(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -45063,11 +51570,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,231,25,0,0 ; xorps 0x19e7(%edx),%xmm4
+ DB 15,87,162,199,58,0,0 ; xorps 0x3ac7(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,247,25,0,0 ; mulps 0x19f7(%edx),%xmm5
+ DB 15,89,170,215,58,0,0 ; mulps 0x3ad7(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
@@ -45094,7 +51601,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,169,143,25,0,0 ; mulps 0x198f(%ecx),%xmm5
+ DB 15,89,169,111,58,0,0 ; mulps 0x3a6f(%ecx),%xmm5
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
@@ -45102,7 +51609,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,228 ; mulss %xmm4,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,129,159,25,0,0 ; xorps 0x199f(%ecx),%xmm0
+ DB 15,87,129,127,58,0,0 ; xorps 0x3a7f(%ecx),%xmm0
DB 15,94,197 ; divps %xmm5,%xmm0
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
@@ -45172,14 +51679,14 @@ _sk_save_xy_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 232,0,0,0,0 ; call 6b6e <_sk_save_xy_sse2+0x12>
DB 88 ; pop %eax
- DB 15,40,160,210,24,0,0 ; movaps 0x18d2(%eax),%xmm4
+ DB 15,40,160,178,57,0,0 ; movaps 0x39b2(%eax),%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,236 ; addps %xmm4,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,144,226,24,0,0 ; movaps 0x18e2(%eax),%xmm2
+ DB 15,40,144,194,57,0,0 ; movaps 0x39c2(%eax),%xmm2
DB 15,84,250 ; andps %xmm2,%xmm7
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,238 ; subps %xmm6,%xmm5
@@ -45257,8 +51764,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,16,24,0,0 ; addps 0x1810(%eax),%xmm0
- DB 15,40,168,32,24,0,0 ; movaps 0x1820(%eax),%xmm5
+ DB 15,88,128,240,56,0,0 ; addps 0x38f0(%eax),%xmm0
+ DB 15,40,168,0,57,0,0 ; movaps 0x3900(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -45284,7 +51791,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,237,23,0,0 ; addps 0x17ed(%eax),%xmm0
+ DB 15,88,128,205,56,0,0 ; addps 0x38cd(%eax),%xmm0
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -45309,8 +51816,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,196,23,0,0 ; addps 0x17c4(%eax),%xmm1
- DB 15,40,168,212,23,0,0 ; movaps 0x17d4(%eax),%xmm5
+ DB 15,88,136,164,56,0,0 ; addps 0x38a4(%eax),%xmm1
+ DB 15,40,168,180,56,0,0 ; movaps 0x38b4(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -45336,7 +51843,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,160,23,0,0 ; addps 0x17a0(%eax),%xmm1
+ DB 15,88,136,128,56,0,0 ; addps 0x3880(%eax),%xmm1
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -45361,13 +51868,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,118,23,0,0 ; addps 0x1776(%eax),%xmm0
- DB 15,40,168,134,23,0,0 ; movaps 0x1786(%eax),%xmm5
+ DB 15,88,128,86,56,0,0 ; addps 0x3856(%eax),%xmm0
+ DB 15,40,168,102,56,0,0 ; movaps 0x3866(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,150,23,0,0 ; mulps 0x1796(%eax),%xmm5
- DB 15,88,168,166,23,0,0 ; addps 0x17a6(%eax),%xmm5
+ DB 15,89,168,118,56,0,0 ; mulps 0x3876(%eax),%xmm5
+ DB 15,88,168,134,56,0,0 ; addps 0x3886(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -45393,16 +51900,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,92,23,0,0 ; addps 0x175c(%eax),%xmm0
- DB 15,40,168,108,23,0,0 ; movaps 0x176c(%eax),%xmm5
+ DB 15,88,128,60,56,0,0 ; addps 0x383c(%eax),%xmm0
+ DB 15,40,168,76,56,0,0 ; movaps 0x384c(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,124,23,0,0 ; movaps 0x177c(%eax),%xmm4
+ DB 15,40,160,92,56,0,0 ; movaps 0x385c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,140,23,0,0 ; addps 0x178c(%eax),%xmm4
+ DB 15,88,160,108,56,0,0 ; addps 0x386c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,156,23,0,0 ; addps 0x179c(%eax),%xmm4
+ DB 15,88,160,124,56,0,0 ; addps 0x387c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,172,23,0,0 ; addps 0x17ac(%eax),%xmm4
+ DB 15,88,160,140,56,0,0 ; addps 0x388c(%eax),%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -45425,17 +51932,17 @@ _sk_bicubic_p1x_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,84,23,0,0 ; movaps 0x1754(%eax),%xmm4
+ DB 15,40,160,52,56,0,0 ; movaps 0x3834(%eax),%xmm4
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,110,64 ; movups 0x40(%esi),%xmm5
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,176,100,23,0,0 ; movaps 0x1764(%eax),%xmm6
+ DB 15,40,176,68,56,0,0 ; movaps 0x3844(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,116,23,0,0 ; addps 0x1774(%eax),%xmm6
+ DB 15,88,176,84,56,0,0 ; addps 0x3854(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,132,23,0,0 ; addps 0x1784(%eax),%xmm6
+ DB 15,88,176,100,56,0,0 ; addps 0x3864(%eax),%xmm6
DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -45460,11 +51967,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,55,23,0,0 ; addps 0x1737(%eax),%xmm0
+ DB 15,88,128,23,56,0,0 ; addps 0x3817(%eax),%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,71,23,0,0 ; mulps 0x1747(%eax),%xmm4
- DB 15,88,160,87,23,0,0 ; addps 0x1757(%eax),%xmm4
+ DB 15,89,160,39,56,0,0 ; mulps 0x3827(%eax),%xmm4
+ DB 15,88,160,55,56,0,0 ; addps 0x3837(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -45490,13 +51997,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,23,23,0,0 ; addps 0x1717(%eax),%xmm1
- DB 15,40,168,39,23,0,0 ; movaps 0x1727(%eax),%xmm5
+ DB 15,88,136,247,55,0,0 ; addps 0x37f7(%eax),%xmm1
+ DB 15,40,168,7,56,0,0 ; movaps 0x3807(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,55,23,0,0 ; mulps 0x1737(%eax),%xmm5
- DB 15,88,168,71,23,0,0 ; addps 0x1747(%eax),%xmm5
+ DB 15,89,168,23,56,0,0 ; mulps 0x3817(%eax),%xmm5
+ DB 15,88,168,39,56,0,0 ; addps 0x3827(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -45522,16 +52029,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,252,22,0,0 ; addps 0x16fc(%eax),%xmm1
- DB 15,40,168,12,23,0,0 ; movaps 0x170c(%eax),%xmm5
+ DB 15,88,136,220,55,0,0 ; addps 0x37dc(%eax),%xmm1
+ DB 15,40,168,236,55,0,0 ; movaps 0x37ec(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,28,23,0,0 ; movaps 0x171c(%eax),%xmm4
+ DB 15,40,160,252,55,0,0 ; movaps 0x37fc(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,44,23,0,0 ; addps 0x172c(%eax),%xmm4
+ DB 15,88,160,12,56,0,0 ; addps 0x380c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,60,23,0,0 ; addps 0x173c(%eax),%xmm4
+ DB 15,88,160,28,56,0,0 ; addps 0x381c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,76,23,0,0 ; addps 0x174c(%eax),%xmm4
+ DB 15,88,160,44,56,0,0 ; addps 0x382c(%eax),%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -45554,17 +52061,17 @@ _sk_bicubic_p1y_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,243,22,0,0 ; movaps 0x16f3(%eax),%xmm4
+ DB 15,40,160,211,55,0,0 ; movaps 0x37d3(%eax),%xmm4
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,110,96 ; movups 0x60(%esi),%xmm5
DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,176,3,23,0,0 ; movaps 0x1703(%eax),%xmm6
+ DB 15,40,176,227,55,0,0 ; movaps 0x37e3(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,19,23,0,0 ; addps 0x1713(%eax),%xmm6
+ DB 15,88,176,243,55,0,0 ; addps 0x37f3(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,35,23,0,0 ; addps 0x1723(%eax),%xmm6
+ DB 15,88,176,3,56,0,0 ; addps 0x3803(%eax),%xmm6
DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -45589,11 +52096,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,213,22,0,0 ; addps 0x16d5(%eax),%xmm1
+ DB 15,88,136,181,55,0,0 ; addps 0x37b5(%eax),%xmm1
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,229,22,0,0 ; mulps 0x16e5(%eax),%xmm4
- DB 15,88,160,245,22,0,0 ; addps 0x16f5(%eax),%xmm4
+ DB 15,89,160,197,55,0,0 ; mulps 0x37c5(%eax),%xmm4
+ DB 15,88,160,213,55,0,0 ; addps 0x37d5(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -45671,6 +52178,1931 @@ _sk_callback_sse2 LABEL PROC
DB 93 ; pop %ebp
DB 195 ; ret
+PUBLIC _sk_clut_3D_sse2
+_sk_clut_3D_sse2 LABEL PROC
+ DB 85 ; push %ebp
+ DB 137,229 ; mov %esp,%ebp
+ DB 83 ; push %ebx
+ DB 87 ; push %edi
+ DB 86 ; push %esi
+ DB 129,236,44,1,0,0 ; sub $0x12c,%esp
+ DB 15,41,157,200,254,255,255 ; movaps %xmm3,-0x138(%ebp)
+ DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 137,141,4,255,255,255 ; mov %ecx,-0xfc(%ebp)
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,81,12 ; mov 0xc(%ecx),%edx
+ DB 141,114,255 ; lea -0x1(%edx),%esi
+ DB 102,15,110,198 ; movd %esi,%xmm0
+ DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
+ DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 102,15,110,194 ; movd %edx,%xmm0
+ DB 102,15,112,240,0 ; pshufd $0x0,%xmm0,%xmm6
+ DB 102,15,127,117,136 ; movdqa %xmm6,-0x78(%ebp)
+ DB 139,81,8 ; mov 0x8(%ecx),%edx
+ DB 141,114,255 ; lea -0x1(%edx),%esi
+ DB 102,15,110,214 ; movd %esi,%xmm2
+ DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
+ DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,41,149,56,255,255,255 ; movaps %xmm2,-0xc8(%ebp)
+ DB 243,15,91,234 ; cvttps2dq %xmm2,%xmm5
+ DB 102,15,127,173,8,255,255,255 ; movdqa %xmm5,-0xf8(%ebp)
+ DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 102,15,244,206 ; pmuludq %xmm6,%xmm1
+ DB 102,15,112,209,232 ; pshufd $0xe8,%xmm1,%xmm2
+ DB 102,15,112,205,245 ; pshufd $0xf5,%xmm5,%xmm1
+ DB 102,15,244,206 ; pmuludq %xmm6,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,209 ; punpckldq %xmm1,%xmm2
+ DB 102,15,127,149,24,255,255,255 ; movdqa %xmm2,-0xe8(%ebp)
+ DB 102,15,110,202 ; movd %edx,%xmm1
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 139,81,4 ; mov 0x4(%ecx),%edx
+ DB 74 ; dec %edx
+ DB 102,15,110,194 ; movd %edx,%xmm0
+ DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
+ DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
+ DB 102,15,112,217,0 ; pshufd $0x0,%xmm1,%xmm3
+ DB 243,15,91,192 ; cvttps2dq %xmm0,%xmm0
+ DB 102,15,127,69,152 ; movdqa %xmm0,-0x68(%ebp)
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
+ DB 102,15,112,233,232 ; pshufd $0xe8,%xmm1,%xmm5
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,112,195,245 ; pshufd $0xf5,%xmm3,%xmm0
+ DB 102,15,127,133,120,255,255,255 ; movdqa %xmm0,-0x88(%ebp)
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,233 ; punpckldq %xmm1,%xmm5
+ DB 102,15,127,173,104,255,255,255 ; movdqa %xmm5,-0x98(%ebp)
+ DB 232,0,0,0,0 ; call 71cf <_sk_clut_3D_sse2+0xff>
+ DB 90 ; pop %edx
+ DB 243,15,91,196 ; cvttps2dq %xmm4,%xmm0
+ DB 102,15,127,133,232,254,255,255 ; movdqa %xmm0,-0x118(%ebp)
+ DB 15,40,244 ; movaps %xmm4,%xmm6
+ DB 15,41,181,216,254,255,255 ; movaps %xmm6,-0x128(%ebp)
+ DB 102,15,254,208 ; paddd %xmm0,%xmm2
+ DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 102,15,254,202 ; paddd %xmm2,%xmm1
+ DB 102,15,111,130,1,54,0,0 ; movdqa 0x3601(%edx),%xmm0
+ DB 102,15,127,133,88,255,255,255 ; movdqa %xmm0,-0xa8(%ebp)
+ DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
+ DB 102,15,112,228,232 ; pshufd $0xe8,%xmm4,%xmm4
+ DB 102,15,98,204 ; punpckldq %xmm4,%xmm1
+ DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 102,15,112,225,231 ; pshufd $0xe7,%xmm1,%xmm4
+ DB 102,15,126,227 ; movd %xmm4,%ebx
+ DB 139,9 ; mov (%ecx),%ecx
+ DB 243,15,16,36,153 ; movss (%ecx,%ebx,4),%xmm4
+ DB 243,15,16,60,177 ; movss (%ecx,%esi,4),%xmm7
+ DB 15,20,252 ; unpcklps %xmm4,%xmm7
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
+ DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
+ DB 15,20,196 ; unpcklps %xmm4,%xmm0
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
+ DB 102,15,111,130,17,54,0,0 ; movdqa 0x3611(%edx),%xmm0
+ DB 102,15,127,133,72,255,255,255 ; movdqa %xmm0,-0xb8(%ebp)
+ DB 102,15,111,225 ; movdqa %xmm1,%xmm4
+ DB 102,15,254,224 ; paddd %xmm0,%xmm4
+ DB 102,15,112,252,229 ; pshufd $0xe5,%xmm4,%xmm7
+ DB 102,15,126,254 ; movd %xmm7,%esi
+ DB 102,15,112,252,78 ; pshufd $0x4e,%xmm4,%xmm7
+ DB 102,15,126,255 ; movd %xmm7,%edi
+ DB 102,15,126,227 ; movd %xmm4,%ebx
+ DB 102,15,112,228,231 ; pshufd $0xe7,%xmm4,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 243,15,16,36,129 ; movss (%ecx,%eax,4),%xmm4
+ DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
+ DB 15,20,196 ; unpcklps %xmm4,%xmm0
+ DB 243,15,16,60,153 ; movss (%ecx,%ebx,4),%xmm7
+ DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
+ DB 15,20,252 ; unpcklps %xmm4,%xmm7
+ DB 15,20,248 ; unpcklps %xmm0,%xmm7
+ DB 102,15,111,130,33,54,0,0 ; movdqa 0x3621(%edx),%xmm0
+ DB 102,15,127,69,216 ; movdqa %xmm0,-0x28(%ebp)
+ DB 102,15,254,200 ; paddd %xmm0,%xmm1
+ DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,193,78 ; pshufd $0x4e,%xmm1,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 102,15,112,193,231 ; pshufd $0xe7,%xmm1,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,153 ; movss (%ecx,%ebx,4),%xmm0
+ DB 243,15,16,36,129 ; movss (%ecx,%eax,4),%xmm4
+ DB 15,20,224 ; unpcklps %xmm0,%xmm4
+ DB 243,15,16,44,185 ; movss (%ecx,%edi,4),%xmm5
+ DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
+ DB 15,20,232 ; unpcklps %xmm0,%xmm5
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 15,40,130,241,53,0,0 ; movaps 0x35f1(%edx),%xmm0
+ DB 15,88,240 ; addps %xmm0,%xmm6
+ DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
+ DB 15,40,141,56,255,255,255 ; movaps -0xc8(%ebp),%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,41,141,40,255,255,255 ; movaps %xmm1,-0xd8(%ebp)
+ DB 15,88,69,200 ; addps -0x38(%ebp),%xmm0
+ DB 243,15,91,192 ; cvttps2dq %xmm0,%xmm0
+ DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
+ DB 102,15,112,192,245 ; pshufd $0xf5,%xmm0,%xmm0
+ DB 102,15,244,133,120,255,255,255 ; pmuludq -0x88(%ebp),%xmm0
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
+ DB 102,15,127,157,120,255,255,255 ; movdqa %xmm3,-0x88(%ebp)
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
+ DB 102,15,111,141,88,255,255,255 ; movdqa -0xa8(%ebp),%xmm1
+ DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
+ DB 102,15,112,194,232 ; pshufd $0xe8,%xmm2,%xmm0
+ DB 102,15,244,217 ; pmuludq %xmm1,%xmm3
+ DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
+ DB 102,15,98,194 ; punpckldq %xmm2,%xmm0
+ DB 102,15,112,208,229 ; pshufd $0xe5,%xmm0,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,208,78 ; pshufd $0x4e,%xmm0,%xmm2
+ DB 102,15,126,210 ; movd %xmm2,%edx
+ DB 102,15,112,208,231 ; pshufd $0xe7,%xmm0,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 243,15,16,20,177 ; movss (%ecx,%esi,4),%xmm2
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,242 ; unpcklps %xmm2,%xmm6
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,12,129 ; movss (%ecx,%eax,4),%xmm1
+ DB 243,15,16,20,145 ; movss (%ecx,%edx,4),%xmm2
+ DB 15,20,202 ; unpcklps %xmm2,%xmm1
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 102,15,111,208 ; movdqa %xmm0,%xmm2
+ DB 102,15,254,149,72,255,255,255 ; paddd -0xb8(%ebp),%xmm2
+ DB 102,15,112,242,229 ; pshufd $0xe5,%xmm2,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
+ DB 102,15,126,242 ; movd %xmm6,%edx
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 243,15,16,20,185 ; movss (%ecx,%edi,4),%xmm2
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,242 ; unpcklps %xmm2,%xmm6
+ DB 243,15,16,20,177 ; movss (%ecx,%esi,4),%xmm2
+ DB 243,15,16,36,145 ; movss (%ecx,%edx,4),%xmm4
+ DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 102,15,254,69,216 ; paddd -0x28(%ebp),%xmm0
+ DB 102,15,112,224,229 ; pshufd $0xe5,%xmm0,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
+ DB 102,15,126,226 ; movd %xmm4,%edx
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,185 ; movss (%ecx,%edi,4),%xmm0
+ DB 243,15,16,36,129 ; movss (%ecx,%eax,4),%xmm4
+ DB 15,20,224 ; unpcklps %xmm0,%xmm4
+ DB 243,15,16,28,177 ; movss (%ecx,%esi,4),%xmm3
+ DB 243,15,16,52,145 ; movss (%ecx,%edx,4),%xmm6
+ DB 15,20,222 ; unpcklps %xmm6,%xmm3
+ DB 15,20,220 ; unpcklps %xmm4,%xmm3
+ DB 15,91,101,152 ; cvtdq2ps -0x68(%ebp),%xmm4
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
+ DB 15,40,101,168 ; movaps -0x58(%ebp),%xmm4
+ DB 15,92,204 ; subps %xmm4,%xmm1
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,41,77,152 ; movaps %xmm1,-0x68(%ebp)
+ DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,88,215 ; addps %xmm7,%xmm2
+ DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 243,15,91,141,40,255,255,255 ; cvttps2dq -0xd8(%ebp),%xmm1
+ DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4
+ DB 102,15,111,69,136 ; movdqa -0x78(%ebp),%xmm0
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
+ DB 102,15,112,193,232 ; pshufd $0xe8,%xmm1,%xmm0
+ DB 102,15,112,204,232 ; pshufd $0xe8,%xmm4,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,127,69,136 ; movdqa %xmm0,-0x78(%ebp)
+ DB 102,15,111,248 ; movdqa %xmm0,%xmm7
+ DB 102,15,254,189,232,254,255,255 ; paddd -0x118(%ebp),%xmm7
+ DB 102,15,111,207 ; movdqa %xmm7,%xmm1
+ DB 102,15,254,141,104,255,255,255 ; paddd -0x98(%ebp),%xmm1
+ DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4
+ DB 102,15,111,133,88,255,255,255 ; movdqa -0xa8(%ebp),%xmm0
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,233,232 ; pshufd $0xe8,%xmm1,%xmm5
+ DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
+ DB 102,15,112,204,232 ; pshufd $0xe8,%xmm4,%xmm1
+ DB 102,15,98,233 ; punpckldq %xmm1,%xmm5
+ DB 102,15,112,205,229 ; pshufd $0xe5,%xmm5,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,205,78 ; pshufd $0x4e,%xmm5,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,112,205,231 ; pshufd $0xe7,%xmm5,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 243,15,16,12,177 ; movss (%ecx,%esi,4),%xmm1
+ DB 243,15,16,36,129 ; movss (%ecx,%eax,4),%xmm4
+ DB 15,20,225 ; unpcklps %xmm1,%xmm4
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 243,15,16,12,129 ; movss (%ecx,%eax,4),%xmm1
+ DB 243,15,16,52,145 ; movss (%ecx,%edx,4),%xmm6
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 15,41,141,40,255,255,255 ; movaps %xmm1,-0xd8(%ebp)
+ DB 102,15,111,229 ; movdqa %xmm5,%xmm4
+ DB 102,15,111,149,72,255,255,255 ; movdqa -0xb8(%ebp),%xmm2
+ DB 102,15,254,226 ; paddd %xmm2,%xmm4
+ DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
+ DB 102,15,126,242 ; movd %xmm6,%edx
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 102,15,112,228,231 ; pshufd $0xe7,%xmm4,%xmm4
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 243,15,16,36,177 ; movss (%ecx,%esi,4),%xmm4
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 15,20,225 ; unpcklps %xmm1,%xmm4
+ DB 15,20,230 ; unpcklps %xmm6,%xmm4
+ DB 102,15,254,109,216 ; paddd -0x28(%ebp),%xmm5
+ DB 102,15,112,205,229 ; pshufd $0xe5,%xmm5,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,205,78 ; pshufd $0x4e,%xmm5,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,112,205,231 ; pshufd $0xe7,%xmm5,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,185 ; movss (%ecx,%edi,4),%xmm1
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 243,15,16,44,177 ; movss (%ecx,%esi,4),%xmm5
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 15,20,233 ; unpcklps %xmm1,%xmm5
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 102,15,254,189,120,255,255,255 ; paddd -0x88(%ebp),%xmm7
+ DB 102,15,112,207,245 ; pshufd $0xf5,%xmm7,%xmm1
+ DB 102,15,244,248 ; pmuludq %xmm0,%xmm7
+ DB 102,15,112,255,232 ; pshufd $0xe8,%xmm7,%xmm7
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,249 ; punpckldq %xmm1,%xmm7
+ DB 102,15,112,207,229 ; pshufd $0xe5,%xmm7,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,207,78 ; pshufd $0x4e,%xmm7,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,112,207,231 ; pshufd $0xe7,%xmm7,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 243,15,16,12,177 ; movss (%ecx,%esi,4),%xmm1
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 243,15,16,4,129 ; movss (%ecx,%eax,4),%xmm0
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 15,20,198 ; unpcklps %xmm6,%xmm0
+ DB 102,15,111,207 ; movdqa %xmm7,%xmm1
+ DB 102,15,254,202 ; paddd %xmm2,%xmm1
+ DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
+ DB 102,15,126,242 ; movd %xmm6,%edx
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,185 ; movss (%ecx,%edi,4),%xmm1
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 243,15,16,20,177 ; movss (%ecx,%esi,4),%xmm2
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 102,15,254,125,216 ; paddd -0x28(%ebp),%xmm7
+ DB 102,15,112,207,229 ; pshufd $0xe5,%xmm7,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,207,78 ; pshufd $0x4e,%xmm7,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,126,254 ; movd %xmm7,%esi
+ DB 102,15,112,207,231 ; pshufd $0xe7,%xmm7,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,185 ; movss (%ecx,%edi,4),%xmm1
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 243,15,16,60,177 ; movss (%ecx,%esi,4),%xmm7
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 15,20,254 ; unpcklps %xmm6,%xmm7
+ DB 15,40,181,40,255,255,255 ; movaps -0xd8(%ebp),%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,92,212 ; subps %xmm4,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 15,92,253 ; subps %xmm5,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 15,88,253 ; addps %xmm5,%xmm7
+ DB 15,91,141,8,255,255,255 ; cvtdq2ps -0xf8(%ebp),%xmm1
+ DB 15,40,165,56,255,255,255 ; movaps -0xc8(%ebp),%xmm4
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,41,165,56,255,255,255 ; movaps %xmm4,-0xc8(%ebp)
+ DB 15,40,77,152 ; movaps -0x68(%ebp),%xmm1
+ DB 15,92,193 ; subps %xmm1,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
+ DB 15,40,69,168 ; movaps -0x58(%ebp),%xmm0
+ DB 15,92,208 ; subps %xmm0,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 15,41,189,8,255,255,255 ; movaps %xmm7,-0xf8(%ebp)
+ DB 243,15,91,77,184 ; cvttps2dq -0x48(%ebp),%xmm1
+ DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp)
+ DB 102,15,111,133,24,255,255,255 ; movdqa -0xe8(%ebp),%xmm0
+ DB 102,15,254,193 ; paddd %xmm1,%xmm0
+ DB 102,15,111,141,104,255,255,255 ; movdqa -0x98(%ebp),%xmm1
+ DB 102,15,254,200 ; paddd %xmm0,%xmm1
+ DB 102,15,111,240 ; movdqa %xmm0,%xmm6
+ DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
+ DB 102,15,111,133,88,255,255,255 ; movdqa -0xa8(%ebp),%xmm0
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
+ DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
+ DB 102,15,112,202,232 ; pshufd $0xe8,%xmm2,%xmm1
+ DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
+ DB 102,15,112,203,229 ; pshufd $0xe5,%xmm3,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,203,78 ; pshufd $0x4e,%xmm3,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,112,203,231 ; pshufd $0xe7,%xmm3,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 243,15,16,12,177 ; movss (%ecx,%esi,4),%xmm1
+ DB 243,15,16,20,129 ; movss (%ecx,%eax,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,60,129 ; movss (%ecx,%eax,4),%xmm7
+ DB 243,15,16,36,145 ; movss (%ecx,%edx,4),%xmm4
+ DB 15,20,252 ; unpcklps %xmm4,%xmm7
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 102,15,111,211 ; movdqa %xmm3,%xmm2
+ DB 102,15,111,133,72,255,255,255 ; movdqa -0xb8(%ebp),%xmm0
+ DB 102,15,254,208 ; paddd %xmm0,%xmm2
+ DB 102,15,112,226,229 ; pshufd $0xe5,%xmm2,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
+ DB 102,15,126,226 ; movd %xmm4,%edx
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 243,15,16,20,185 ; movss (%ecx,%edi,4),%xmm2
+ DB 243,15,16,36,129 ; movss (%ecx,%eax,4),%xmm4
+ DB 15,20,226 ; unpcklps %xmm2,%xmm4
+ DB 243,15,16,20,177 ; movss (%ecx,%esi,4),%xmm2
+ DB 243,15,16,44,145 ; movss (%ecx,%edx,4),%xmm5
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
+ DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 102,15,254,93,216 ; paddd -0x28(%ebp),%xmm3
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,15,126,226 ; movd %xmm4,%edx
+ DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,112,219,231 ; pshufd $0xe7,%xmm3,%xmm3
+ DB 102,15,126,223 ; movd %xmm3,%edi
+ DB 243,15,16,28,185 ; movss (%ecx,%edi,4),%xmm3
+ DB 243,15,16,36,129 ; movss (%ecx,%eax,4),%xmm4
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 243,15,16,44,177 ; movss (%ecx,%esi,4),%xmm5
+ DB 243,15,16,28,145 ; movss (%ecx,%edx,4),%xmm3
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 102,15,111,222 ; movdqa %xmm6,%xmm3
+ DB 102,15,254,157,120,255,255,255 ; paddd -0x88(%ebp),%xmm3
+ DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
+ DB 102,15,111,141,88,255,255,255 ; movdqa -0xa8(%ebp),%xmm1
+ DB 102,15,244,217 ; pmuludq %xmm1,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,244,225 ; pmuludq %xmm1,%xmm4
+ DB 102,15,112,228,232 ; pshufd $0xe8,%xmm4,%xmm4
+ DB 102,15,98,220 ; punpckldq %xmm4,%xmm3
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,15,126,226 ; movd %xmm4,%edx
+ DB 102,15,112,227,231 ; pshufd $0xe7,%xmm3,%xmm4
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 243,15,16,36,177 ; movss (%ecx,%esi,4),%xmm4
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,12,129 ; movss (%ecx,%eax,4),%xmm1
+ DB 243,15,16,36,145 ; movss (%ecx,%edx,4),%xmm4
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 102,15,111,227 ; movdqa %xmm3,%xmm4
+ DB 102,15,254,224 ; paddd %xmm0,%xmm4
+ DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
+ DB 102,15,126,242 ; movd %xmm6,%edx
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 102,15,112,228,231 ; pshufd $0xe7,%xmm4,%xmm4
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
+ DB 243,15,16,4,129 ; movss (%ecx,%eax,4),%xmm0
+ DB 15,20,196 ; unpcklps %xmm4,%xmm0
+ DB 243,15,16,52,177 ; movss (%ecx,%esi,4),%xmm6
+ DB 243,15,16,36,145 ; movss (%ecx,%edx,4),%xmm4
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 102,15,254,93,216 ; paddd -0x28(%ebp),%xmm3
+ DB 102,15,112,195,229 ; pshufd $0xe5,%xmm3,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
+ DB 102,15,126,194 ; movd %xmm0,%edx
+ DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,112,195,231 ; pshufd $0xe7,%xmm3,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,185 ; movss (%ecx,%edi,4),%xmm0
+ DB 243,15,16,28,129 ; movss (%ecx,%eax,4),%xmm3
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 243,15,16,36,177 ; movss (%ecx,%esi,4),%xmm4
+ DB 243,15,16,4,145 ; movss (%ecx,%edx,4),%xmm0
+ DB 15,20,224 ; unpcklps %xmm0,%xmm4
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 15,92,207 ; subps %xmm7,%xmm1
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,41,141,24,255,255,255 ; movaps %xmm1,-0xe8(%ebp)
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 102,15,111,77,136 ; movdqa -0x78(%ebp),%xmm1
+ DB 102,15,254,77,184 ; paddd -0x48(%ebp),%xmm1
+ DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp)
+ DB 102,15,111,133,104,255,255,255 ; movdqa -0x98(%ebp),%xmm0
+ DB 102,15,254,193 ; paddd %xmm1,%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,189,88,255,255,255 ; movdqa -0xa8(%ebp),%xmm7
+ DB 102,15,244,199 ; pmuludq %xmm7,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,244,207 ; pmuludq %xmm7,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 243,15,16,12,177 ; movss (%ecx,%esi,4),%xmm1
+ DB 243,15,16,20,129 ; movss (%ecx,%eax,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,28,129 ; movss (%ecx,%eax,4),%xmm3
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 15,41,157,104,255,255,255 ; movaps %xmm3,-0x98(%ebp)
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,111,173,72,255,255,255 ; movdqa -0xb8(%ebp),%xmm5
+ DB 102,15,254,205 ; paddd %xmm5,%xmm1
+ DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,15,126,210 ; movd %xmm2,%edx
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,185 ; movss (%ecx,%edi,4),%xmm1
+ DB 243,15,16,20,129 ; movss (%ecx,%eax,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 243,15,16,28,177 ; movss (%ecx,%esi,4),%xmm3
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
+ DB 102,15,254,69,216 ; paddd -0x28(%ebp),%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,185 ; movss (%ecx,%edi,4),%xmm0
+ DB 243,15,16,12,129 ; movss (%ecx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 243,15,16,28,177 ; movss (%ecx,%esi,4),%xmm3
+ DB 243,15,16,4,145 ; movss (%ecx,%edx,4),%xmm0
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 102,15,111,77,136 ; movdqa -0x78(%ebp),%xmm1
+ DB 102,15,254,141,120,255,255,255 ; paddd -0x88(%ebp),%xmm1
+ DB 102,15,112,193,245 ; pshufd $0xf5,%xmm1,%xmm0
+ DB 102,15,244,207 ; pmuludq %xmm7,%xmm1
+ DB 102,15,244,199 ; pmuludq %xmm7,%xmm0
+ DB 102,15,112,209,232 ; pshufd $0xe8,%xmm1,%xmm2
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,15,126,194 ; movd %xmm0,%edx
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
+ DB 243,15,16,12,129 ; movss (%ecx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,4,129 ; movss (%ecx,%eax,4),%xmm0
+ DB 243,15,16,60,145 ; movss (%ecx,%edx,4),%xmm7
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 102,15,254,234 ; paddd %xmm2,%xmm5
+ DB 102,15,112,205,229 ; pshufd $0xe5,%xmm5,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,205,78 ; pshufd $0x4e,%xmm5,%xmm1
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,112,205,231 ; pshufd $0xe7,%xmm5,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,185 ; movss (%ecx,%edi,4),%xmm1
+ DB 243,15,16,60,129 ; movss (%ecx,%eax,4),%xmm7
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 243,15,16,12,177 ; movss (%ecx,%esi,4),%xmm1
+ DB 243,15,16,44,145 ; movss (%ecx,%edx,4),%xmm5
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 102,15,254,85,216 ; paddd -0x28(%ebp),%xmm2
+ DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
+ DB 102,15,126,234 ; movd %xmm5,%edx
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 243,15,16,20,185 ; movss (%ecx,%edi,4),%xmm2
+ DB 243,15,16,44,129 ; movss (%ecx,%eax,4),%xmm5
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
+ DB 243,15,16,20,177 ; movss (%ecx,%esi,4),%xmm2
+ DB 243,15,16,60,145 ; movss (%ecx,%edx,4),%xmm7
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
+ DB 15,40,189,104,255,255,255 ; movaps -0x98(%ebp),%xmm7
+ DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,40,109,200 ; movaps -0x38(%ebp),%xmm5
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,88,199 ; addps %xmm7,%xmm0
+ DB 15,40,125,184 ; movaps -0x48(%ebp),%xmm7
+ DB 15,92,207 ; subps %xmm7,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 15,40,173,24,255,255,255 ; movaps -0xe8(%ebp),%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,40,157,56,255,255,255 ; movaps -0xc8(%ebp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,92,212 ; subps %xmm4,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 15,91,157,232,254,255,255 ; cvtdq2ps -0x118(%ebp),%xmm3
+ DB 15,40,165,216,254,255,255 ; movaps -0x128(%ebp),%xmm4
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,40,93,152 ; movaps -0x68(%ebp),%xmm3
+ DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,195 ; addps %xmm3,%xmm0
+ DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,40,157,8,255,255,255 ; movaps -0xf8(%ebp),%xmm3
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 141,74,8 ; lea 0x8(%edx),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,157,200,254,255,255 ; movaps -0x138(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 80 ; push %eax
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 129,196,60,1,0,0 ; add $0x13c,%esp
+ DB 94 ; pop %esi
+ DB 95 ; pop %edi
+ DB 91 ; pop %ebx
+ DB 93 ; pop %ebp
+ DB 195 ; ret
+
+PUBLIC _sk_clut_4D_sse2
+_sk_clut_4D_sse2 LABEL PROC
+ DB 85 ; push %ebp
+ DB 137,229 ; mov %esp,%ebp
+ DB 83 ; push %ebx
+ DB 87 ; push %edi
+ DB 86 ; push %esi
+ DB 129,236,124,1,0,0 ; sub $0x17c,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 137,141,212,254,255,255 ; mov %ecx,-0x12c(%ebp)
+ DB 139,16 ; mov (%eax),%edx
+ DB 139,74,16 ; mov 0x10(%edx),%ecx
+ DB 141,113,255 ; lea -0x1(%ecx),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
+ DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 102,15,110,217 ; movd %ecx,%xmm3
+ DB 102,15,112,251,0 ; pshufd $0x0,%xmm3,%xmm7
+ DB 102,15,127,189,248,254,255,255 ; movdqa %xmm7,-0x108(%ebp)
+ DB 139,74,12 ; mov 0xc(%edx),%ecx
+ DB 141,113,255 ; lea -0x1(%ecx),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
+ DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 15,41,165,232,254,255,255 ; movaps %xmm4,-0x118(%ebp)
+ DB 243,15,91,244 ; cvttps2dq %xmm4,%xmm6
+ DB 102,15,127,181,216,254,255,255 ; movdqa %xmm6,-0x128(%ebp)
+ DB 102,15,111,214 ; movdqa %xmm6,%xmm2
+ DB 102,15,244,215 ; pmuludq %xmm7,%xmm2
+ DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4
+ DB 102,15,112,214,245 ; pshufd $0xf5,%xmm6,%xmm2
+ DB 102,15,244,215 ; pmuludq %xmm7,%xmm2
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,98,226 ; punpckldq %xmm2,%xmm4
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,127,181,56,255,255,255 ; movdqa %xmm6,-0xc8(%ebp)
+ DB 102,15,110,209 ; movd %ecx,%xmm2
+ DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,98,211 ; punpckldq %xmm3,%xmm2
+ DB 139,74,8 ; mov 0x8(%edx),%ecx
+ DB 141,113,255 ; lea -0x1(%ecx),%esi
+ DB 102,15,110,222 ; movd %esi,%xmm3
+ DB 102,15,112,219,0 ; pshufd $0x0,%xmm3,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,41,157,40,255,255,255 ; movaps %xmm3,-0xd8(%ebp)
+ DB 102,15,112,250,0 ; pshufd $0x0,%xmm2,%xmm7
+ DB 102,15,127,189,104,255,255,255 ; movdqa %xmm7,-0x98(%ebp)
+ DB 243,15,91,227 ; cvttps2dq %xmm3,%xmm4
+ DB 102,15,127,165,8,255,255,255 ; movdqa %xmm4,-0xf8(%ebp)
+ DB 102,15,111,204 ; movdqa %xmm4,%xmm1
+ DB 102,15,244,207 ; pmuludq %xmm7,%xmm1
+ DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
+ DB 102,15,112,204,245 ; pshufd $0xf5,%xmm4,%xmm1
+ DB 102,15,112,231,245 ; pshufd $0xf5,%xmm7,%xmm4
+ DB 102,15,127,165,88,255,255,255 ; movdqa %xmm4,-0xa8(%ebp)
+ DB 102,15,244,204 ; pmuludq %xmm4,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
+ DB 102,15,127,157,72,255,255,255 ; movdqa %xmm3,-0xb8(%ebp)
+ DB 102,15,110,201 ; movd %ecx,%xmm1
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 139,74,4 ; mov 0x4(%edx),%ecx
+ DB 73 ; dec %ecx
+ DB 102,15,110,209 ; movd %ecx,%xmm2
+ DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
+ DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
+ DB 102,15,112,193,0 ; pshufd $0x0,%xmm1,%xmm0
+ DB 243,15,91,226 ; cvttps2dq %xmm2,%xmm4
+ DB 102,15,127,101,200 ; movdqa %xmm4,-0x38(%ebp)
+ DB 102,15,111,204 ; movdqa %xmm4,%xmm1
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,209,232 ; pshufd $0xe8,%xmm1,%xmm2
+ DB 102,15,112,204,245 ; pshufd $0xf5,%xmm4,%xmm1
+ DB 102,15,112,224,245 ; pshufd $0xf5,%xmm0,%xmm4
+ DB 102,15,127,101,184 ; movdqa %xmm4,-0x48(%ebp)
+ DB 102,15,244,204 ; pmuludq %xmm4,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,209 ; punpckldq %xmm1,%xmm2
+ DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
+ DB 232,0,0,0,0 ; call 7d45 <_sk_clut_4D_sse2+0x179>
+ DB 89 ; pop %ecx
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,41,165,120,254,255,255 ; movaps %xmm4,-0x188(%ebp)
+ DB 243,15,91,204 ; cvttps2dq %xmm4,%xmm1
+ DB 102,15,127,141,184,254,255,255 ; movdqa %xmm1,-0x148(%ebp)
+ DB 102,15,111,238 ; movdqa %xmm6,%xmm5
+ DB 102,15,254,233 ; paddd %xmm1,%xmm5
+ DB 102,15,127,173,24,255,255,255 ; movdqa %xmm5,-0xe8(%ebp)
+ DB 102,15,111,243 ; movdqa %xmm3,%xmm6
+ DB 102,15,254,245 ; paddd %xmm5,%xmm6
+ DB 102,15,111,202 ; movdqa %xmm2,%xmm1
+ DB 102,15,254,206 ; paddd %xmm6,%xmm1
+ DB 102,15,111,153,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm3
+ DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
+ DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
+ DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 102,15,112,209,231 ; pshufd $0xe7,%xmm1,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 139,18 ; mov (%edx),%edx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 243,15,16,28,178 ; movss (%edx,%esi,4),%xmm3
+ DB 243,15,16,20,186 ; movss (%edx,%edi,4),%xmm2
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 15,20,221 ; unpcklps %xmm5,%xmm3
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 102,15,111,153,219,42,0,0 ; movdqa 0x2adb(%ecx),%xmm3
+ DB 102,15,111,209 ; movdqa %xmm1,%xmm2
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
+ DB 102,15,126,239 ; movd %xmm5,%edi
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,60,186 ; movss (%edx,%edi,4),%xmm7
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
+ DB 15,41,149,136,254,255,255 ; movaps %xmm2,-0x178(%ebp)
+ DB 102,15,254,137,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm1
+ DB 102,15,112,233,229 ; pshufd $0xe5,%xmm1,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,12,154 ; movss (%edx,%ebx,4),%xmm1
+ DB 243,15,16,44,130 ; movss (%edx,%eax,4),%xmm5
+ DB 15,20,233 ; unpcklps %xmm1,%xmm5
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 15,41,141,152,254,255,255 ; movaps %xmm1,-0x168(%ebp)
+ DB 15,40,185,187,42,0,0 ; movaps 0x2abb(%ecx),%xmm7
+ DB 15,88,231 ; addps %xmm7,%xmm4
+ DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
+ DB 15,40,141,232,254,255,255 ; movaps -0x118(%ebp),%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,41,77,136 ; movaps %xmm1,-0x78(%ebp)
+ DB 15,40,141,40,255,255,255 ; movaps -0xd8(%ebp),%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,41,141,168,254,255,255 ; movaps %xmm1,-0x158(%ebp)
+ DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4
+ DB 15,88,252 ; addps %xmm4,%xmm7
+ DB 243,15,91,255 ; cvttps2dq %xmm7,%xmm7
+ DB 102,15,244,199 ; pmuludq %xmm7,%xmm0
+ DB 102,15,112,255,245 ; pshufd $0xf5,%xmm7,%xmm7
+ DB 102,15,244,125,184 ; pmuludq -0x48(%ebp),%xmm7
+ DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
+ DB 102,15,112,199,232 ; pshufd $0xe8,%xmm7,%xmm0
+ DB 102,15,98,200 ; punpckldq %xmm0,%xmm1
+ DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp)
+ DB 102,15,254,241 ; paddd %xmm1,%xmm6
+ DB 102,15,112,254,245 ; pshufd $0xf5,%xmm6,%xmm7
+ DB 102,15,111,137,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm1
+ DB 102,15,244,241 ; pmuludq %xmm1,%xmm6
+ DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
+ DB 102,15,244,249 ; pmuludq %xmm1,%xmm7
+ DB 102,15,112,247,232 ; pshufd $0xe8,%xmm7,%xmm6
+ DB 102,15,98,198 ; punpckldq %xmm6,%xmm0
+ DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 102,15,112,240,231 ; pshufd $0xe7,%xmm0,%xmm6
+ DB 102,15,126,247 ; movd %xmm6,%edi
+ DB 243,15,16,52,186 ; movss (%edx,%edi,4),%xmm6
+ DB 243,15,16,60,130 ; movss (%edx,%eax,4),%xmm7
+ DB 15,20,254 ; unpcklps %xmm6,%xmm7
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 102,15,111,232 ; movdqa %xmm0,%xmm5
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
+ DB 102,15,254,233 ; paddd %xmm1,%xmm5
+ DB 102,15,112,253,229 ; pshufd $0xe5,%xmm5,%xmm7
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 102,15,112,253,78 ; pshufd $0x4e,%xmm5,%xmm7
+ DB 102,15,126,254 ; movd %xmm7,%esi
+ DB 102,15,126,239 ; movd %xmm5,%edi
+ DB 102,15,112,237,231 ; pshufd $0xe7,%xmm5,%xmm5
+ DB 102,15,126,235 ; movd %xmm5,%ebx
+ DB 243,15,16,44,154 ; movss (%edx,%ebx,4),%xmm5
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 15,20,205 ; unpcklps %xmm5,%xmm1
+ DB 243,15,16,28,186 ; movss (%edx,%edi,4),%xmm3
+ DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
+ DB 15,20,221 ; unpcklps %xmm5,%xmm3
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 102,15,111,177,235,42,0,0 ; movdqa 0x2aeb(%ecx),%xmm6
+ DB 102,15,254,198 ; paddd %xmm6,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 243,15,16,60,186 ; movss (%edx,%edi,4),%xmm7
+ DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
+ DB 15,20,253 ; unpcklps %xmm5,%xmm7
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 15,91,77,200 ; cvtdq2ps -0x38(%ebp),%xmm1
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
+ DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
+ DB 15,92,209 ; subps %xmm1,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,209 ; addps %xmm1,%xmm2
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,40,141,136,254,255,255 ; movaps -0x178(%ebp),%xmm1
+ DB 15,92,217 ; subps %xmm1,%xmm3
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,40,141,152,254,255,255 ; movaps -0x168(%ebp),%xmm1
+ DB 15,92,249 ; subps %xmm1,%xmm7
+ DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,88,249 ; addps %xmm1,%xmm7
+ DB 243,15,91,141,168,254,255,255 ; cvttps2dq -0x158(%ebp),%xmm1
+ DB 102,15,111,133,104,255,255,255 ; movdqa -0x98(%ebp),%xmm0
+ DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
+ DB 102,15,112,201,245 ; pshufd $0xf5,%xmm1,%xmm1
+ DB 102,15,244,141,88,255,255,255 ; pmuludq -0xa8(%ebp),%xmm1
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,127,133,88,255,255,255 ; movdqa %xmm0,-0xa8(%ebp)
+ DB 102,15,111,149,24,255,255,255 ; movdqa -0xe8(%ebp),%xmm2
+ DB 102,15,254,208 ; paddd %xmm0,%xmm2
+ DB 102,15,111,202 ; movdqa %xmm2,%xmm1
+ DB 102,15,111,234 ; movdqa %xmm2,%xmm5
+ DB 102,15,254,77,168 ; paddd -0x58(%ebp),%xmm1
+ DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
+ DB 102,15,111,129,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm0
+ DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
+ DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,112,209,231 ; pshufd $0xe7,%xmm1,%xmm2
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 243,15,16,20,186 ; movss (%edx,%edi,4),%xmm2
+ DB 243,15,16,28,130 ; movss (%edx,%eax,4),%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,194 ; unpcklps %xmm2,%xmm0
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
+ DB 102,15,111,209 ; movdqa %xmm1,%xmm2
+ DB 102,15,111,129,219,42,0,0 ; movdqa 0x2adb(%ecx),%xmm0
+ DB 102,15,254,208 ; paddd %xmm0,%xmm2
+ DB 102,15,111,224 ; movdqa %xmm0,%xmm4
+ DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,28,130 ; movss (%edx,%eax,4),%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 243,15,16,4,186 ; movss (%edx,%edi,4),%xmm0
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,194 ; unpcklps %xmm2,%xmm0
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 15,41,133,24,255,255,255 ; movaps %xmm0,-0xe8(%ebp)
+ DB 102,15,254,206 ; paddd %xmm6,%xmm1
+ DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,12,154 ; movss (%edx,%ebx,4),%xmm1
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 243,15,16,52,186 ; movss (%edx,%edi,4),%xmm6
+ DB 243,15,16,28,178 ; movss (%edx,%esi,4),%xmm3
+ DB 15,20,243 ; unpcklps %xmm3,%xmm6
+ DB 15,20,242 ; unpcklps %xmm2,%xmm6
+ DB 102,15,111,197 ; movdqa %xmm5,%xmm0
+ DB 102,15,254,69,184 ; paddd -0x48(%ebp),%xmm0
+ DB 102,15,112,216,245 ; pshufd $0xf5,%xmm0,%xmm3
+ DB 102,15,111,137,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm1
+ DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
+ DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
+ DB 102,15,244,217 ; pmuludq %xmm1,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,98,211 ; punpckldq %xmm3,%xmm2
+ DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,112,218,231 ; pshufd $0xe7,%xmm2,%xmm3
+ DB 102,15,126,223 ; movd %xmm3,%edi
+ DB 243,15,16,28,186 ; movss (%edx,%edi,4),%xmm3
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,44,130 ; movss (%edx,%eax,4),%xmm5
+ DB 243,15,16,28,178 ; movss (%edx,%esi,4),%xmm3
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
+ DB 15,20,232 ; unpcklps %xmm0,%xmm5
+ DB 102,15,111,194 ; movdqa %xmm2,%xmm0
+ DB 102,15,254,196 ; paddd %xmm4,%xmm0
+ DB 102,15,112,216,229 ; pshufd $0xe5,%xmm0,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 102,15,112,216,78 ; pshufd $0x4e,%xmm0,%xmm3
+ DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,28,130 ; movss (%edx,%eax,4),%xmm3
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 243,15,16,36,186 ; movss (%edx,%edi,4),%xmm4
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,224 ; unpcklps %xmm0,%xmm4
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 102,15,111,153,235,42,0,0 ; movdqa 0x2aeb(%ecx),%xmm3
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 243,15,16,20,186 ; movss (%edx,%edi,4),%xmm2
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,208 ; unpcklps %xmm0,%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,173,104,255,255,255 ; movaps -0x98(%ebp),%xmm5
+ DB 15,92,205 ; subps %xmm5,%xmm1
+ DB 15,40,69,152 ; movaps -0x68(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 15,40,141,24,255,255,255 ; movaps -0xe8(%ebp),%xmm1
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,91,133,8,255,255,255 ; cvtdq2ps -0xf8(%ebp),%xmm0
+ DB 15,40,141,40,255,255,255 ; movaps -0xd8(%ebp),%xmm1
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,41,141,40,255,255,255 ; movaps %xmm1,-0xd8(%ebp)
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,92,232 ; subps %xmm0,%xmm5
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,41,173,8,255,255,255 ; movaps %xmm5,-0xf8(%ebp)
+ DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,92,224 ; subps %xmm0,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
+ DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,88,215 ; addps %xmm7,%xmm2
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 243,15,91,69,136 ; cvttps2dq -0x78(%ebp),%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,149,248,254,255,255 ; movdqa -0x108(%ebp),%xmm2
+ DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
+ DB 102,15,112,193,232 ; pshufd $0xe8,%xmm1,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,127,149,248,254,255,255 ; movdqa %xmm2,-0x108(%ebp)
+ DB 102,15,254,149,184,254,255,255 ; paddd -0x148(%ebp),%xmm2
+ DB 102,15,127,85,216 ; movdqa %xmm2,-0x28(%ebp)
+ DB 102,15,111,234 ; movdqa %xmm2,%xmm5
+ DB 102,15,254,173,72,255,255,255 ; paddd -0xb8(%ebp),%xmm5
+ DB 102,15,111,197 ; movdqa %xmm5,%xmm0
+ DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,145,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm2
+ DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 243,15,16,12,178 ; movss (%edx,%esi,4),%xmm1
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,111,145,219,42,0,0 ; movdqa 0x2adb(%ecx),%xmm2
+ DB 102,15,254,202 ; paddd %xmm2,%xmm1
+ DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,12,154 ; movss (%edx,%ebx,4),%xmm1
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 243,15,16,36,186 ; movss (%edx,%edi,4),%xmm4
+ DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
+ DB 15,20,231 ; unpcklps %xmm7,%xmm4
+ DB 15,20,230 ; unpcklps %xmm6,%xmm4
+ DB 102,15,254,195 ; paddd %xmm3,%xmm0
+ DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 102,15,254,109,184 ; paddd -0x48(%ebp),%xmm5
+ DB 102,15,112,245,245 ; pshufd $0xf5,%xmm5,%xmm6
+ DB 102,15,111,129,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm0
+ DB 102,15,244,232 ; pmuludq %xmm0,%xmm5
+ DB 102,15,112,253,232 ; pshufd $0xe8,%xmm5,%xmm7
+ DB 102,15,244,240 ; pmuludq %xmm0,%xmm6
+ DB 102,15,112,238,232 ; pshufd $0xe8,%xmm6,%xmm5
+ DB 102,15,98,253 ; punpckldq %xmm5,%xmm7
+ DB 102,15,112,239,229 ; pshufd $0xe5,%xmm7,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 102,15,112,239,78 ; pshufd $0x4e,%xmm7,%xmm5
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,112,239,231 ; pshufd $0xe7,%xmm7,%xmm5
+ DB 102,15,126,239 ; movd %xmm5,%edi
+ DB 243,15,16,44,186 ; movss (%edx,%edi,4),%xmm5
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,245 ; unpcklps %xmm5,%xmm6
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,28,178 ; movss (%edx,%esi,4),%xmm3
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 15,20,198 ; unpcklps %xmm6,%xmm0
+ DB 102,15,111,223 ; movdqa %xmm7,%xmm3
+ DB 102,15,254,218 ; paddd %xmm2,%xmm3
+ DB 102,15,112,243,229 ; pshufd $0xe5,%xmm3,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 102,15,126,223 ; movd %xmm3,%edi
+ DB 102,15,112,219,231 ; pshufd $0xe7,%xmm3,%xmm3
+ DB 102,15,126,219 ; movd %xmm3,%ebx
+ DB 243,15,16,28,154 ; movss (%edx,%ebx,4),%xmm3
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,243 ; unpcklps %xmm3,%xmm6
+ DB 243,15,16,44,186 ; movss (%edx,%edi,4),%xmm5
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 102,15,111,153,235,42,0,0 ; movdqa 0x2aeb(%ecx),%xmm3
+ DB 102,15,254,251 ; paddd %xmm3,%xmm7
+ DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,255 ; movd %xmm7,%edi
+ DB 102,15,112,215,231 ; pshufd $0xe7,%xmm7,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,242 ; unpcklps %xmm2,%xmm6
+ DB 243,15,16,60,186 ; movss (%edx,%edi,4),%xmm7
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 15,20,254 ; unpcklps %xmm6,%xmm7
+ DB 15,40,117,136 ; movaps -0x78(%ebp),%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,40,85,152 ; movaps -0x68(%ebp),%xmm2
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,41,69,136 ; movaps %xmm0,-0x78(%ebp)
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 15,89,234 ; mulps %xmm2,%xmm5
+ DB 15,88,236 ; addps %xmm4,%xmm5
+ DB 15,92,249 ; subps %xmm1,%xmm7
+ DB 15,89,250 ; mulps %xmm2,%xmm7
+ DB 15,88,249 ; addps %xmm1,%xmm7
+ DB 102,15,111,77,216 ; movdqa -0x28(%ebp),%xmm1
+ DB 102,15,254,141,88,255,255,255 ; paddd -0xa8(%ebp),%xmm1
+ DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,15,111,225 ; movdqa %xmm1,%xmm4
+ DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,177,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm6
+ DB 102,15,244,198 ; pmuludq %xmm6,%xmm0
+ DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
+ DB 102,15,244,206 ; pmuludq %xmm6,%xmm1
+ DB 102,15,112,193,232 ; pshufd $0xe8,%xmm1,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,186 ; movss (%edx,%edi,4),%xmm0
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,52,178 ; movss (%edx,%esi,4),%xmm6
+ DB 15,20,198 ; unpcklps %xmm6,%xmm0
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 102,15,111,202 ; movdqa %xmm2,%xmm1
+ DB 102,15,254,137,219,42,0,0 ; paddd 0x2adb(%ecx),%xmm1
+ DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,12,154 ; movss (%edx,%ebx,4),%xmm1
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,241 ; unpcklps %xmm1,%xmm6
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 15,41,141,24,255,255,255 ; movaps %xmm1,-0xe8(%ebp)
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 243,15,16,28,186 ; movss (%edx,%edi,4),%xmm3
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 15,20,222 ; unpcklps %xmm6,%xmm3
+ DB 102,15,111,212 ; movdqa %xmm4,%xmm2
+ DB 102,15,254,85,184 ; paddd -0x48(%ebp),%xmm2
+ DB 102,15,112,194,245 ; pshufd $0xf5,%xmm2,%xmm0
+ DB 102,15,111,137,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm1
+ DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
+ DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4
+ DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,98,224 ; punpckldq %xmm0,%xmm4
+ DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,196,78 ; pshufd $0x4e,%xmm4,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,196,231 ; pshufd $0xe7,%xmm4,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,186 ; movss (%edx,%edi,4),%xmm0
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 102,15,111,196 ; movdqa %xmm4,%xmm0
+ DB 102,15,254,129,219,42,0,0 ; paddd 0x2adb(%ecx),%xmm0
+ DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 243,15,16,20,186 ; movss (%edx,%edi,4),%xmm2
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,208 ; unpcklps %xmm0,%xmm2
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 102,15,254,161,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm4
+ DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,196,78 ; pshufd $0x4e,%xmm4,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 102,15,112,196,231 ; pshufd $0xe7,%xmm4,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,36,130 ; movss (%edx,%eax,4),%xmm4
+ DB 15,20,224 ; unpcklps %xmm0,%xmm4
+ DB 243,15,16,52,186 ; movss (%edx,%edi,4),%xmm6
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,240 ; unpcklps %xmm0,%xmm6
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 15,40,101,216 ; movaps -0x28(%ebp),%xmm4
+ DB 15,92,204 ; subps %xmm4,%xmm1
+ DB 15,40,69,152 ; movaps -0x68(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,40,165,24,255,255,255 ; movaps -0xe8(%ebp),%xmm4
+ DB 15,92,212 ; subps %xmm4,%xmm2
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 15,92,243 ; subps %xmm3,%xmm6
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,243 ; addps %xmm3,%xmm6
+ DB 15,40,93,136 ; movaps -0x78(%ebp),%xmm3
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,40,133,40,255,255,255 ; movaps -0xd8(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,40,217 ; movaps %xmm1,%xmm3
+ DB 15,92,213 ; subps %xmm5,%xmm2
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,92,247 ; subps %xmm7,%xmm6
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,247 ; addps %xmm7,%xmm6
+ DB 15,91,133,216,254,255,255 ; cvtdq2ps -0x128(%ebp),%xmm0
+ DB 15,40,141,232,254,255,255 ; movaps -0x118(%ebp),%xmm1
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,41,141,232,254,255,255 ; movaps %xmm1,-0x118(%ebp)
+ DB 15,40,133,8,255,255,255 ; movaps -0xf8(%ebp),%xmm0
+ DB 15,92,216 ; subps %xmm0,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,88,216 ; addps %xmm0,%xmm3
+ DB 15,41,157,8,255,255,255 ; movaps %xmm3,-0xf8(%ebp)
+ DB 15,40,133,104,255,255,255 ; movaps -0x98(%ebp),%xmm0
+ DB 15,92,208 ; subps %xmm0,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 15,41,149,104,255,255,255 ; movaps %xmm2,-0x98(%ebp)
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,92,240 ; subps %xmm0,%xmm6
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,88,240 ; addps %xmm0,%xmm6
+ DB 15,41,181,216,254,255,255 ; movaps %xmm6,-0x128(%ebp)
+ DB 243,15,91,141,120,255,255,255 ; cvttps2dq -0x88(%ebp),%xmm1
+ DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp)
+ DB 102,15,111,133,56,255,255,255 ; movdqa -0xc8(%ebp),%xmm0
+ DB 102,15,254,193 ; paddd %xmm1,%xmm0
+ DB 102,15,127,133,56,255,255,255 ; movdqa %xmm0,-0xc8(%ebp)
+ DB 102,15,111,141,72,255,255,255 ; movdqa -0xb8(%ebp),%xmm1
+ DB 102,15,254,200 ; paddd %xmm0,%xmm1
+ DB 102,15,111,69,168 ; movdqa -0x58(%ebp),%xmm0
+ DB 102,15,254,193 ; paddd %xmm1,%xmm0
+ DB 102,15,112,224,245 ; pshufd $0xf5,%xmm0,%xmm4
+ DB 102,15,111,145,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm2
+ DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
+ DB 102,15,112,216,232 ; pshufd $0xe8,%xmm0,%xmm3
+ DB 102,15,244,226 ; pmuludq %xmm2,%xmm4
+ DB 102,15,111,250 ; movdqa %xmm2,%xmm7
+ DB 102,15,112,196,232 ; pshufd $0xe8,%xmm4,%xmm0
+ DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
+ DB 102,15,112,195,229 ; pshufd $0xe5,%xmm3,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,195,231 ; pshufd $0xe7,%xmm3,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,186 ; movss (%edx,%edi,4),%xmm0
+ DB 243,15,16,36,130 ; movss (%edx,%eax,4),%xmm4
+ DB 15,20,224 ; unpcklps %xmm0,%xmm4
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
+ DB 15,20,197 ; unpcklps %xmm5,%xmm0
+ DB 15,20,196 ; unpcklps %xmm4,%xmm0
+ DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
+ DB 102,15,111,227 ; movdqa %xmm3,%xmm4
+ DB 102,15,111,145,219,42,0,0 ; movdqa 0x2adb(%ecx),%xmm2
+ DB 102,15,254,226 ; paddd %xmm2,%xmm4
+ DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 102,15,112,228,231 ; pshufd $0xe7,%xmm4,%xmm4
+ DB 102,15,126,227 ; movd %xmm4,%ebx
+ DB 243,15,16,36,154 ; movss (%edx,%ebx,4),%xmm4
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 243,15,16,44,186 ; movss (%edx,%edi,4),%xmm5
+ DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 102,15,254,153,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm3
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 102,15,126,223 ; movd %xmm3,%edi
+ DB 102,15,112,219,231 ; pshufd $0xe7,%xmm3,%xmm3
+ DB 102,15,126,219 ; movd %xmm3,%ebx
+ DB 243,15,16,28,154 ; movss (%edx,%ebx,4),%xmm3
+ DB 243,15,16,36,130 ; movss (%edx,%eax,4),%xmm4
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 243,15,16,52,186 ; movss (%edx,%edi,4),%xmm6
+ DB 243,15,16,28,178 ; movss (%edx,%esi,4),%xmm3
+ DB 15,20,243 ; unpcklps %xmm3,%xmm6
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 102,15,254,77,184 ; paddd -0x48(%ebp),%xmm1
+ DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
+ DB 102,15,244,207 ; pmuludq %xmm7,%xmm1
+ DB 102,15,112,225,232 ; pshufd $0xe8,%xmm1,%xmm4
+ DB 102,15,244,223 ; pmuludq %xmm7,%xmm3
+ DB 102,15,112,203,232 ; pshufd $0xe8,%xmm3,%xmm1
+ DB 102,15,98,225 ; punpckldq %xmm1,%xmm4
+ DB 102,15,112,204,229 ; pshufd $0xe5,%xmm4,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,112,204,231 ; pshufd $0xe7,%xmm4,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,28,130 ; movss (%edx,%eax,4),%xmm3
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 102,15,111,220 ; movdqa %xmm4,%xmm3
+ DB 102,15,254,218 ; paddd %xmm2,%xmm3
+ DB 102,15,112,251,229 ; pshufd $0xe5,%xmm3,%xmm7
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 102,15,112,251,78 ; pshufd $0x4e,%xmm3,%xmm7
+ DB 102,15,126,254 ; movd %xmm7,%esi
+ DB 102,15,126,223 ; movd %xmm3,%edi
+ DB 102,15,112,219,231 ; pshufd $0xe7,%xmm3,%xmm3
+ DB 102,15,126,219 ; movd %xmm3,%ebx
+ DB 243,15,16,28,154 ; movss (%edx,%ebx,4),%xmm3
+ DB 243,15,16,60,130 ; movss (%edx,%eax,4),%xmm7
+ DB 15,20,251 ; unpcklps %xmm3,%xmm7
+ DB 243,15,16,28,186 ; movss (%edx,%edi,4),%xmm3
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 15,20,223 ; unpcklps %xmm7,%xmm3
+ DB 102,15,254,161,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm4
+ DB 102,15,112,212,229 ; pshufd $0xe5,%xmm4,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,212,78 ; pshufd $0x4e,%xmm4,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 102,15,112,212,231 ; pshufd $0xe7,%xmm4,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,60,130 ; movss (%edx,%eax,4),%xmm7
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 243,15,16,36,186 ; movss (%edx,%edi,4),%xmm4
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,226 ; unpcklps %xmm2,%xmm4
+ DB 15,20,231 ; unpcklps %xmm7,%xmm4
+ DB 15,40,149,120,255,255,255 ; movaps -0x88(%ebp),%xmm2
+ DB 15,92,194 ; subps %xmm2,%xmm0
+ DB 15,40,77,152 ; movaps -0x68(%ebp),%xmm1
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,88,194 ; addps %xmm2,%xmm0
+ DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,92,230 ; subps %xmm6,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,88,230 ; addps %xmm6,%xmm4
+ DB 102,15,111,133,56,255,255,255 ; movdqa -0xc8(%ebp),%xmm0
+ DB 102,15,254,133,88,255,255,255 ; paddd -0xa8(%ebp),%xmm0
+ DB 102,15,127,133,56,255,255,255 ; movdqa %xmm0,-0xc8(%ebp)
+ DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
+ DB 102,15,112,208,245 ; pshufd $0xf5,%xmm0,%xmm2
+ DB 102,15,111,137,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm1
+ DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
+ DB 102,15,112,240,232 ; pshufd $0xe8,%xmm0,%xmm6
+ DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
+ DB 102,15,112,194,232 ; pshufd $0xe8,%xmm2,%xmm0
+ DB 102,15,98,240 ; punpckldq %xmm0,%xmm6
+ DB 102,15,112,198,229 ; pshufd $0xe5,%xmm6,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,198,78 ; pshufd $0x4e,%xmm6,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,198,231 ; pshufd $0xe7,%xmm6,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,186 ; movss (%edx,%edi,4),%xmm0
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 15,20,208 ; unpcklps %xmm0,%xmm2
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
+ DB 15,20,197 ; unpcklps %xmm5,%xmm0
+ DB 15,20,194 ; unpcklps %xmm2,%xmm0
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 102,15,111,214 ; movdqa %xmm6,%xmm2
+ DB 102,15,111,153,219,42,0,0 ; movdqa 0x2adb(%ecx),%xmm3
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
+ DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,60,130 ; movss (%edx,%eax,4),%xmm7
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 243,15,16,44,186 ; movss (%edx,%edi,4),%xmm5
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
+ DB 15,20,239 ; unpcklps %xmm7,%xmm5
+ DB 102,15,254,177,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm6
+ DB 102,15,112,214,229 ; pshufd $0xe5,%xmm6,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,214,78 ; pshufd $0x4e,%xmm6,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,247 ; movd %xmm6,%edi
+ DB 102,15,112,214,231 ; pshufd $0xe7,%xmm6,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,60,130 ; movss (%edx,%eax,4),%xmm7
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 243,15,16,52,186 ; movss (%edx,%edi,4),%xmm6
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,242 ; unpcklps %xmm2,%xmm6
+ DB 15,20,247 ; unpcklps %xmm7,%xmm6
+ DB 102,15,111,133,56,255,255,255 ; movdqa -0xc8(%ebp),%xmm0
+ DB 102,15,254,69,184 ; paddd -0x48(%ebp),%xmm0
+ DB 102,15,112,208,245 ; pshufd $0xf5,%xmm0,%xmm2
+ DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
+ DB 102,15,112,248,232 ; pshufd $0xe8,%xmm0,%xmm7
+ DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
+ DB 102,15,112,210,232 ; pshufd $0xe8,%xmm2,%xmm2
+ DB 102,15,98,250 ; punpckldq %xmm2,%xmm7
+ DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,112,215,231 ; pshufd $0xe7,%xmm7,%xmm2
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 243,15,16,20,186 ; movss (%edx,%edi,4),%xmm2
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 15,20,194 ; unpcklps %xmm2,%xmm0
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
+ DB 15,20,202 ; unpcklps %xmm2,%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,111,199 ; movdqa %xmm7,%xmm0
+ DB 102,15,254,195 ; paddd %xmm3,%xmm0
+ DB 102,15,112,208,229 ; pshufd $0xe5,%xmm0,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,208,78 ; pshufd $0x4e,%xmm0,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 15,20,208 ; unpcklps %xmm0,%xmm2
+ DB 243,15,16,28,186 ; movss (%edx,%edi,4),%xmm3
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 102,15,254,185,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm7
+ DB 102,15,112,199,229 ; pshufd $0xe5,%xmm7,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,199,78 ; pshufd $0x4e,%xmm7,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,255 ; movd %xmm7,%edi
+ DB 102,15,112,199,231 ; pshufd $0xe7,%xmm7,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 15,20,208 ; unpcklps %xmm0,%xmm2
+ DB 243,15,16,60,186 ; movss (%edx,%edi,4),%xmm7
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,248 ; unpcklps %xmm0,%xmm7
+ DB 15,20,250 ; unpcklps %xmm2,%xmm7
+ DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
+ DB 15,92,202 ; subps %xmm2,%xmm1
+ DB 15,40,69,152 ; movaps -0x68(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 15,92,254 ; subps %xmm6,%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,88,254 ; addps %xmm6,%xmm7
+ DB 15,40,149,120,255,255,255 ; movaps -0x88(%ebp),%xmm2
+ DB 15,92,202 ; subps %xmm2,%xmm1
+ DB 15,40,133,40,255,255,255 ; movaps -0xd8(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,41,141,56,255,255,255 ; movaps %xmm1,-0xc8(%ebp)
+ DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
+ DB 15,92,217 ; subps %xmm1,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,41,157,120,255,255,255 ; movaps %xmm3,-0x88(%ebp)
+ DB 15,92,252 ; subps %xmm4,%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,88,252 ; addps %xmm4,%xmm7
+ DB 15,41,125,200 ; movaps %xmm7,-0x38(%ebp)
+ DB 102,15,111,133,248,254,255,255 ; movdqa -0x108(%ebp),%xmm0
+ DB 102,15,254,69,136 ; paddd -0x78(%ebp),%xmm0
+ DB 102,15,127,133,248,254,255,255 ; movdqa %xmm0,-0x108(%ebp)
+ DB 102,15,111,141,72,255,255,255 ; movdqa -0xb8(%ebp),%xmm1
+ DB 102,15,254,200 ; paddd %xmm0,%xmm1
+ DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,15,111,233 ; movdqa %xmm1,%xmm5
+ DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,153,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm3
+ DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
+ DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
+ DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
+ DB 102,15,112,193,232 ; pshufd $0xe8,%xmm1,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,186 ; movss (%edx,%edi,4),%xmm0
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,28,178 ; movss (%edx,%esi,4),%xmm3
+ DB 15,20,195 ; unpcklps %xmm3,%xmm0
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
+ DB 102,15,111,202 ; movdqa %xmm2,%xmm1
+ DB 102,15,111,177,219,42,0,0 ; movdqa 0x2adb(%ecx),%xmm6
+ DB 102,15,254,206 ; paddd %xmm6,%xmm1
+ DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
+ DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,12,154 ; movss (%edx,%ebx,4),%xmm1
+ DB 243,15,16,28,130 ; movss (%edx,%eax,4),%xmm3
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
+ DB 15,20,203 ; unpcklps %xmm3,%xmm1
+ DB 102,15,111,185,235,42,0,0 ; movdqa 0x2aeb(%ecx),%xmm7
+ DB 102,15,254,215 ; paddd %xmm7,%xmm2
+ DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,28,130 ; movss (%edx,%eax,4),%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 243,15,16,20,186 ; movss (%edx,%edi,4),%xmm2
+ DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
+ DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 15,20,211 ; unpcklps %xmm3,%xmm2
+ DB 102,15,111,221 ; movdqa %xmm5,%xmm3
+ DB 102,15,254,93,184 ; paddd -0x48(%ebp),%xmm3
+ DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
+ DB 102,15,111,129,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm0
+ DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
+ DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
+ DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
+ DB 102,15,112,228,232 ; pshufd $0xe8,%xmm4,%xmm4
+ DB 102,15,98,220 ; punpckldq %xmm4,%xmm3
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 102,15,112,227,231 ; pshufd $0xe7,%xmm3,%xmm4
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 243,15,16,36,186 ; movss (%edx,%edi,4),%xmm4
+ DB 243,15,16,44,130 ; movss (%edx,%eax,4),%xmm5
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
+ DB 15,20,196 ; unpcklps %xmm4,%xmm0
+ DB 15,20,197 ; unpcklps %xmm5,%xmm0
+ DB 102,15,111,227 ; movdqa %xmm3,%xmm4
+ DB 102,15,254,230 ; paddd %xmm6,%xmm4
+ DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,126,231 ; movd %xmm4,%edi
+ DB 102,15,112,228,231 ; pshufd $0xe7,%xmm4,%xmm4
+ DB 102,15,126,227 ; movd %xmm4,%ebx
+ DB 243,15,16,36,154 ; movss (%edx,%ebx,4),%xmm4
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,244 ; unpcklps %xmm4,%xmm6
+ DB 243,15,16,44,186 ; movss (%edx,%edi,4),%xmm5
+ DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
+ DB 15,20,236 ; unpcklps %xmm4,%xmm5
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
+ DB 102,15,254,223 ; paddd %xmm7,%xmm3
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 102,15,126,223 ; movd %xmm3,%edi
+ DB 102,15,112,219,231 ; pshufd $0xe7,%xmm3,%xmm3
+ DB 102,15,126,219 ; movd %xmm3,%ebx
+ DB 243,15,16,28,154 ; movss (%edx,%ebx,4),%xmm3
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,243 ; unpcklps %xmm3,%xmm6
+ DB 243,15,16,36,186 ; movss (%edx,%edi,4),%xmm4
+ DB 243,15,16,28,178 ; movss (%edx,%esi,4),%xmm3
+ DB 15,20,227 ; unpcklps %xmm3,%xmm4
+ DB 15,20,230 ; unpcklps %xmm6,%xmm4
+ DB 15,40,181,72,255,255,255 ; movaps -0xb8(%ebp),%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,40,93,152 ; movaps -0x68(%ebp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,89,235 ; mulps %xmm3,%xmm5
+ DB 15,88,233 ; addps %xmm1,%xmm5
+ DB 15,92,226 ; subps %xmm2,%xmm4
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,88,226 ; addps %xmm2,%xmm4
+ DB 102,15,111,141,248,254,255,255 ; movdqa -0x108(%ebp),%xmm1
+ DB 102,15,254,141,88,255,255,255 ; paddd -0xa8(%ebp),%xmm1
+ DB 102,15,111,69,168 ; movdqa -0x58(%ebp),%xmm0
+ DB 102,15,254,193 ; paddd %xmm1,%xmm0
+ DB 102,15,111,241 ; movdqa %xmm1,%xmm6
+ DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
+ DB 102,15,111,145,203,42,0,0 ; movdqa 0x2acb(%ecx),%xmm2
+ DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
+ DB 102,15,111,250 ; movdqa %xmm2,%xmm7
+ DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
+ DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 243,15,16,28,130 ; movss (%edx,%eax,4),%xmm3
+ DB 243,15,16,12,178 ; movss (%edx,%esi,4),%xmm1
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,254,137,219,42,0,0 ; paddd 0x2adb(%ecx),%xmm1
+ DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,12,154 ; movss (%edx,%ebx,4),%xmm1
+ DB 243,15,16,20,130 ; movss (%edx,%eax,4),%xmm2
+ DB 15,20,209 ; unpcklps %xmm1,%xmm2
+ DB 243,15,16,28,186 ; movss (%edx,%edi,4),%xmm3
+ DB 243,15,16,12,178 ; movss (%edx,%esi,4),%xmm1
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
+ DB 102,15,254,129,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm0
+ DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 243,15,16,4,154 ; movss (%edx,%ebx,4),%xmm0
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 243,15,16,28,186 ; movss (%edx,%edi,4),%xmm3
+ DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
+ DB 15,20,216 ; unpcklps %xmm0,%xmm3
+ DB 15,20,217 ; unpcklps %xmm1,%xmm3
+ DB 102,15,111,206 ; movdqa %xmm6,%xmm1
+ DB 102,15,254,77,184 ; paddd -0x48(%ebp),%xmm1
+ DB 102,15,112,193,245 ; pshufd $0xf5,%xmm1,%xmm0
+ DB 102,15,244,207 ; pmuludq %xmm7,%xmm1
+ DB 102,15,244,199 ; pmuludq %xmm7,%xmm0
+ DB 102,15,112,209,232 ; pshufd $0xe8,%xmm1,%xmm2
+ DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
+ DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 243,15,16,4,186 ; movss (%edx,%edi,4),%xmm0
+ DB 243,15,16,12,130 ; movss (%edx,%eax,4),%xmm1
+ DB 15,20,200 ; unpcklps %xmm0,%xmm1
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,4,130 ; movss (%edx,%eax,4),%xmm0
+ DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
+ DB 15,20,193 ; unpcklps %xmm1,%xmm0
+ DB 102,15,111,177,219,42,0,0 ; movdqa 0x2adb(%ecx),%xmm6
+ DB 102,15,254,242 ; paddd %xmm2,%xmm6
+ DB 102,15,112,206,229 ; pshufd $0xe5,%xmm6,%xmm1
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1
+ DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,126,247 ; movd %xmm6,%edi
+ DB 102,15,112,206,231 ; pshufd $0xe7,%xmm6,%xmm1
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,12,154 ; movss (%edx,%ebx,4),%xmm1
+ DB 243,15,16,60,130 ; movss (%edx,%eax,4),%xmm7
+ DB 15,20,249 ; unpcklps %xmm1,%xmm7
+ DB 243,15,16,12,186 ; movss (%edx,%edi,4),%xmm1
+ DB 243,15,16,52,178 ; movss (%edx,%esi,4),%xmm6
+ DB 15,20,206 ; unpcklps %xmm6,%xmm1
+ DB 15,20,207 ; unpcklps %xmm7,%xmm1
+ DB 102,15,254,145,235,42,0,0 ; paddd 0x2aeb(%ecx),%xmm2
+ DB 102,15,112,242,229 ; pshufd $0xe5,%xmm2,%xmm6
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 102,15,126,215 ; movd %xmm2,%edi
+ DB 102,15,112,210,231 ; pshufd $0xe7,%xmm2,%xmm2
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,154 ; movss (%edx,%ebx,4),%xmm2
+ DB 243,15,16,52,130 ; movss (%edx,%eax,4),%xmm6
+ DB 15,20,242 ; unpcklps %xmm2,%xmm6
+ DB 243,15,16,20,186 ; movss (%edx,%edi,4),%xmm2
+ DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
+ DB 15,20,215 ; unpcklps %xmm7,%xmm2
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 15,40,125,168 ; movaps -0x58(%ebp),%xmm7
+ DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,88,199 ; addps %xmm7,%xmm0
+ DB 15,40,189,88,255,255,255 ; movaps -0xa8(%ebp),%xmm7
+ DB 15,92,207 ; subps %xmm7,%xmm1
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 15,40,181,72,255,255,255 ; movaps -0xb8(%ebp),%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,40,157,40,255,255,255 ; movaps -0xd8(%ebp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,92,205 ; subps %xmm5,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 15,92,212 ; subps %xmm4,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 15,40,165,56,255,255,255 ; movaps -0xc8(%ebp),%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,40,157,232,254,255,255 ; movaps -0x118(%ebp),%xmm3
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 15,40,165,120,255,255,255 ; movaps -0x88(%ebp),%xmm4
+ DB 15,92,204 ; subps %xmm4,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
+ DB 15,92,212 ; subps %xmm4,%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 15,91,157,184,254,255,255 ; cvtdq2ps -0x148(%ebp),%xmm3
+ DB 15,40,165,120,254,255,255 ; movaps -0x188(%ebp),%xmm4
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,40,157,8,255,255,255 ; movaps -0xf8(%ebp),%xmm3
+ DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,195 ; addps %xmm3,%xmm0
+ DB 15,40,157,104,255,255,255 ; movaps -0x98(%ebp),%xmm3
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,40,157,216,254,255,255 ; movaps -0x128(%ebp),%xmm3
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 139,117,12 ; mov 0xc(%ebp),%esi
+ DB 141,86,8 ; lea 0x8(%esi),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,153,251,42,0,0 ; movaps 0x2afb(%ecx),%xmm3
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,86,4 ; call *0x4(%esi)
+ DB 129,196,140,1,0,0 ; add $0x18c,%esp
+ DB 94 ; pop %esi
+ DB 95 ; pop %edi
+ DB 91 ; pop %ebx
+ DB 93 ; pop %ebp
+ DB 195 ; ret
+
ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
@@ -45828,9 +54260,9 @@ ALIGN 16
DB 0,224 ; add %ah,%al
DB 64 ; inc %eax
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 72cc <.literal16+0x1fc>
+ DB 224,64 ; loopne 93ac <.literal16+0x1fc>
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 72d0 <.literal16+0x200>
+ DB 224,64 ; loopne 93b0 <.literal16+0x200>
DB 154,153,153,62,154,153,153 ; lcall $0x9999,$0x9a3e9999
DB 62,154,153,153,62,154,153,153 ; ds lcall $0x9999,$0x9a3e9999
DB 62,61,10,23,63,61 ; ds cmp $0x3d3f170a,%eax
@@ -45841,16 +54273,16 @@ ALIGN 16
DB 63 ; aas
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 72f1 <.literal16+0x221>
+ DB 225,61 ; loope 93d1 <.literal16+0x221>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 72f5 <.literal16+0x225>
+ DB 225,61 ; loope 93d5 <.literal16+0x225>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 72f9 <.literal16+0x229>
+ DB 225,61 ; loope 93d9 <.literal16+0x229>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 72fd <.literal16+0x22d>
+ DB 225,61 ; loope 93dd <.literal16+0x22d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45867,16 +54299,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 7331 <.literal16+0x261>
+ DB 225,61 ; loope 9411 <.literal16+0x261>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7335 <.literal16+0x265>
+ DB 225,61 ; loope 9415 <.literal16+0x265>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7339 <.literal16+0x269>
+ DB 225,61 ; loope 9419 <.literal16+0x269>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 733d <.literal16+0x26d>
+ DB 225,61 ; loope 941d <.literal16+0x26d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45893,16 +54325,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 7371 <.literal16+0x2a1>
+ DB 225,61 ; loope 9451 <.literal16+0x2a1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7375 <.literal16+0x2a5>
+ DB 225,61 ; loope 9455 <.literal16+0x2a5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7379 <.literal16+0x2a9>
+ DB 225,61 ; loope 9459 <.literal16+0x2a9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 737d <.literal16+0x2ad>
+ DB 225,61 ; loope 945d <.literal16+0x2ad>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45919,16 +54351,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 73b1 <.literal16+0x2e1>
+ DB 225,61 ; loope 9491 <.literal16+0x2e1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 73b5 <.literal16+0x2e5>
+ DB 225,61 ; loope 9495 <.literal16+0x2e5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 73b9 <.literal16+0x2e9>
+ DB 225,61 ; loope 9499 <.literal16+0x2e9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 73bd <.literal16+0x2ed>
+ DB 225,61 ; loope 949d <.literal16+0x2ed>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45950,11 +54382,11 @@ ALIGN 16
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%eax)
DB 67 ; inc %ebx
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 73fb <.literal16+0x32b>
+ DB 127,67 ; jg 94db <.literal16+0x32b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 73ff <.literal16+0x32f>
+ DB 127,67 ; jg 94df <.literal16+0x32f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7403 <.literal16+0x333>
+ DB 127,67 ; jg 94e3 <.literal16+0x333>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -46228,13 +54660,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7659 <.literal16+0x589>
+ DB 224,7 ; loopne 9739 <.literal16+0x589>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 765d <.literal16+0x58d>
+ DB 224,7 ; loopne 973d <.literal16+0x58d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7661 <.literal16+0x591>
+ DB 224,7 ; loopne 9741 <.literal16+0x591>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7665 <.literal16+0x595>
+ DB 224,7 ; loopne 9745 <.literal16+0x595>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -46283,11 +54715,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 771b <.literal16+0x64b>
+ DB 127,67 ; jg 97fb <.literal16+0x64b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 771f <.literal16+0x64f>
+ DB 127,67 ; jg 97ff <.literal16+0x64f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7723 <.literal16+0x653>
+ DB 127,67 ; jg 9803 <.literal16+0x653>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax)
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%eax)
@@ -46302,16 +54734,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7714 <.literal16+0x644>
+ DB 127,0 ; jg 97f4 <.literal16+0x644>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7718 <.literal16+0x648>
+ DB 127,0 ; jg 97f8 <.literal16+0x648>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 771c <.literal16+0x64c>
+ DB 127,0 ; jg 97fc <.literal16+0x64c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7720 <.literal16+0x650>
+ DB 127,0 ; jg 9800 <.literal16+0x650>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -46320,7 +54752,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 77a5 <.literal16+0x6d5>
+ DB 119,115 ; ja 9885 <.literal16+0x6d5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -46331,7 +54763,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 7709 <.literal16+0x639>
+ DB 117,191 ; jne 97e9 <.literal16+0x639>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -46347,7 +54779,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b746 <_sk_callback_sse2+0xe9a34724>
+ DB 233,220,63,163,233 ; jmp e9a3d826 <_sk_clut_4D_sse2+0xe9a35c5a>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -46402,16 +54834,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 77e4 <.literal16+0x714>
+ DB 127,0 ; jg 98c4 <.literal16+0x714>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 77e8 <.literal16+0x718>
+ DB 127,0 ; jg 98c8 <.literal16+0x718>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 77ec <.literal16+0x71c>
+ DB 127,0 ; jg 98cc <.literal16+0x71c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 77f0 <.literal16+0x720>
+ DB 127,0 ; jg 98d0 <.literal16+0x720>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -46420,7 +54852,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 7875 <.literal16+0x7a5>
+ DB 119,115 ; ja 9955 <.literal16+0x7a5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -46431,7 +54863,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 77d9 <.literal16+0x709>
+ DB 117,191 ; jne 98b9 <.literal16+0x709>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -46447,7 +54879,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b816 <_sk_callback_sse2+0xe9a347f4>
+ DB 233,220,63,163,233 ; jmp e9a3d8f6 <_sk_clut_4D_sse2+0xe9a35d2a>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -46502,16 +54934,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 78b4 <.literal16+0x7e4>
+ DB 127,0 ; jg 9994 <.literal16+0x7e4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 78b8 <.literal16+0x7e8>
+ DB 127,0 ; jg 9998 <.literal16+0x7e8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 78bc <.literal16+0x7ec>
+ DB 127,0 ; jg 999c <.literal16+0x7ec>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 78c0 <.literal16+0x7f0>
+ DB 127,0 ; jg 99a0 <.literal16+0x7f0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -46520,7 +54952,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 7945 <.literal16+0x875>
+ DB 119,115 ; ja 9a25 <.literal16+0x875>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -46531,7 +54963,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 78a9 <.literal16+0x7d9>
+ DB 117,191 ; jne 9989 <.literal16+0x7d9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -46547,7 +54979,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b8e6 <_sk_callback_sse2+0xe9a348c4>
+ DB 233,220,63,163,233 ; jmp e9a3d9c6 <_sk_clut_4D_sse2+0xe9a35dfa>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -46602,16 +55034,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7984 <.literal16+0x8b4>
+ DB 127,0 ; jg 9a64 <.literal16+0x8b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7988 <.literal16+0x8b8>
+ DB 127,0 ; jg 9a68 <.literal16+0x8b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 798c <.literal16+0x8bc>
+ DB 127,0 ; jg 9a6c <.literal16+0x8bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7990 <.literal16+0x8c0>
+ DB 127,0 ; jg 9a70 <.literal16+0x8c0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -46620,7 +55052,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 7a15 <.literal16+0x945>
+ DB 119,115 ; ja 9af5 <.literal16+0x945>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -46631,7 +55063,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 7979 <.literal16+0x8a9>
+ DB 117,191 ; jne 9a59 <.literal16+0x8a9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -46647,7 +55079,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b9b6 <_sk_callback_sse2+0xe9a34994>
+ DB 233,220,63,163,233 ; jmp e9a3da96 <_sk_clut_4D_sse2+0xe9a35eca>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -46702,16 +55134,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7a54 <.literal16+0x984>
+ DB 127,0 ; jg 9b34 <.literal16+0x984>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7a58 <.literal16+0x988>
+ DB 127,0 ; jg 9b38 <.literal16+0x988>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7a5c <.literal16+0x98c>
+ DB 127,0 ; jg 9b3c <.literal16+0x98c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7a60 <.literal16+0x990>
+ DB 127,0 ; jg 9b40 <.literal16+0x990>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -46720,7 +55152,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 7ae5 <.literal16+0xa15>
+ DB 119,115 ; ja 9bc5 <.literal16+0xa15>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -46731,7 +55163,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 7a49 <.literal16+0x979>
+ DB 117,191 ; jne 9b29 <.literal16+0x979>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -46747,7 +55179,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3ba86 <_sk_callback_sse2+0xe9a34a64>
+ DB 233,220,63,163,233 ; jmp e9a3db66 <_sk_clut_4D_sse2+0xe9a35f9a>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -46798,13 +55230,13 @@ ALIGN 16
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
- DB 127,67 ; jg 7b67 <.literal16+0xa97>
+ DB 127,67 ; jg 9c47 <.literal16+0xa97>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7b6b <.literal16+0xa9b>
+ DB 127,67 ; jg 9c4b <.literal16+0xa9b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7b6f <.literal16+0xa9f>
+ DB 127,67 ; jg 9c4f <.literal16+0xa9f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7b73 <.literal16+0xaa3>
+ DB 127,67 ; jg 9c53 <.literal16+0xaa3>
DB 0,0 ; add %al,(%eax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%eax)
@@ -46855,16 +55287,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%ebx)
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 7bf3 <.literal16+0xb23>
+ DB 118,63 ; jbe 9cd3 <.literal16+0xb23>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 7bf7 <.literal16+0xb27>
+ DB 118,63 ; jbe 9cd7 <.literal16+0xb27>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 7bfb <.literal16+0xb2b>
+ DB 118,63 ; jbe 9cdb <.literal16+0xb2b>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 7bff <.literal16+0xb2f>
+ DB 118,63 ; jbe 9cdf <.literal16+0xb2f>
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
@@ -46893,11 +55325,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%ebx)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7c6b <.literal16+0xb9b>
+ DB 127,67 ; jg 9d4b <.literal16+0xb9b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7c6f <.literal16+0xb9f>
+ DB 127,67 ; jg 9d4f <.literal16+0xb9f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7c73 <.literal16+0xba3>
+ DB 127,67 ; jg 9d53 <.literal16+0xba3>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 0,0 ; add %al,(%eax)
@@ -46959,13 +55391,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7ce9 <.literal16+0xc19>
+ DB 224,7 ; loopne 9dc9 <.literal16+0xc19>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7ced <.literal16+0xc1d>
+ DB 224,7 ; loopne 9dcd <.literal16+0xc1d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7cf1 <.literal16+0xc21>
+ DB 224,7 ; loopne 9dd1 <.literal16+0xc21>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7cf5 <.literal16+0xc25>
+ DB 224,7 ; loopne 9dd5 <.literal16+0xc25>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -47011,13 +55443,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7d59 <.literal16+0xc89>
+ DB 224,7 ; loopne 9e39 <.literal16+0xc89>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7d5d <.literal16+0xc8d>
+ DB 224,7 ; loopne 9e3d <.literal16+0xc8d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7d61 <.literal16+0xc91>
+ DB 224,7 ; loopne 9e41 <.literal16+0xc91>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7d65 <.literal16+0xc95>
+ DB 224,7 ; loopne 9e45 <.literal16+0xc95>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -47063,13 +55495,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7dc9 <.literal16+0xcf9>
+ DB 224,7 ; loopne 9ea9 <.literal16+0xcf9>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7dcd <.literal16+0xcfd>
+ DB 224,7 ; loopne 9ead <.literal16+0xcfd>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7dd1 <.literal16+0xd01>
+ DB 224,7 ; loopne 9eb1 <.literal16+0xd01>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7dd5 <.literal16+0xd05>
+ DB 224,7 ; loopne 9eb5 <.literal16+0xd05>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -47111,13 +55543,13 @@ ALIGN 16
DB 248 ; clc
DB 65 ; inc %ecx
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7e66 <.literal16+0xd96>
+ DB 124,66 ; jl 9f46 <.literal16+0xd96>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7e6a <.literal16+0xd9a>
+ DB 124,66 ; jl 9f4a <.literal16+0xd9a>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7e6e <.literal16+0xd9e>
+ DB 124,66 ; jl 9f4e <.literal16+0xd9e>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7e72 <.literal16+0xda2>
+ DB 124,66 ; jl 9f52 <.literal16+0xda2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%eax)
DB 0,240 ; add %dh,%al
@@ -47251,13 +55683,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%eax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 7ff5 <.literal16+0xf25>
+ DB 112,65 ; jo a0d5 <.literal16+0xf25>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 7ff9 <.literal16+0xf29>
+ DB 112,65 ; jo a0d9 <.literal16+0xf29>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 7ffd <.literal16+0xf2d>
+ DB 112,65 ; jo a0dd <.literal16+0xf2d>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 8001 <.literal16+0xf31>
+ DB 112,65 ; jo a0e1 <.literal16+0xf31>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -47288,11 +55720,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 806b <.literal16+0xf9b>
+ DB 127,67 ; jg a14b <.literal16+0xf9b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 806f <.literal16+0xf9f>
+ DB 127,67 ; jg a14f <.literal16+0xf9f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 8073 <.literal16+0xfa3>
+ DB 127,67 ; jg a153 <.literal16+0xfa3>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -47323,11 +55755,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 80db <.literal16+0x100b>
+ DB 127,67 ; jg a1bb <.literal16+0x100b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 80df <.literal16+0x100f>
+ DB 127,67 ; jg a1bf <.literal16+0x100f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 80e3 <.literal16+0x1013>
+ DB 127,67 ; jg a1c3 <.literal16+0x1013>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
DB 0,0 ; add %al,(%eax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
@@ -47426,13 +55858,13 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 255 ; (bad)
- DB 127,71 ; jg 820b <.literal16+0x113b>
+ DB 127,71 ; jg a2eb <.literal16+0x113b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 820f <.literal16+0x113f>
+ DB 127,71 ; jg a2ef <.literal16+0x113f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 8213 <.literal16+0x1143>
+ DB 127,71 ; jg a2f3 <.literal16+0x1143>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 8217 <.literal16+0x1147>
+ DB 127,71 ; jg a2f7 <.literal16+0x1147>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -47540,7 +55972,7 @@ ALIGN 16
DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 831c <.literal16+0x124c>
+ DB 120,57 ; js a3fc <.literal16+0x124c>
DB 64 ; inc %eax
DB 18,120,57 ; adc 0x39(%eax),%bh
DB 64 ; inc %eax
@@ -47733,11 +56165,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 8502 <.literal16+0x1432>
+ DB 62,114,28 ; jb,pt a5e2 <.literal16+0x1432>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8506 <.literal16+0x1436>
+ DB 62,114,28 ; jb,pt a5e6 <.literal16+0x1436>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 850a <.literal16+0x143a>
+ DB 62,114,28 ; jb,pt a5ea <.literal16+0x143a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -47816,13 +56248,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb 85ce <.literal16+0x14fe>
+ DB 114,28 ; jb a6ae <.literal16+0x14fe>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 85d2 <.literal16+0x1502>
+ DB 62,114,28 ; jb,pt a6b2 <.literal16+0x1502>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 85d6 <.literal16+0x1506>
+ DB 62,114,28 ; jb,pt a6b6 <.literal16+0x1506>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 85da <.literal16+0x150a>
+ DB 62,114,28 ; jb,pt a6ba <.literal16+0x150a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -47843,11 +56275,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 8612 <.literal16+0x1542>
+ DB 62,114,28 ; jb,pt a6f2 <.literal16+0x1542>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8616 <.literal16+0x1546>
+ DB 62,114,28 ; jb,pt a6f6 <.literal16+0x1546>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 861a <.literal16+0x154a>
+ DB 62,114,28 ; jb,pt a6fa <.literal16+0x154a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -47926,13 +56358,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb 86de <.literal16+0x160e>
+ DB 114,28 ; jb a7be <.literal16+0x160e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 86e2 <_sk_callback_sse2+0x16c0>
+ DB 62,114,28 ; jb,pt a7c2 <.literal16+0x1612>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 86e6 <_sk_callback_sse2+0x16c4>
+ DB 62,114,28 ; jb,pt a7c6 <.literal16+0x1616>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 86ea <_sk_callback_sse2+0x16c8>
+ DB 62,114,28 ; jb,pt a7ca <.literal16+0x161a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -47942,6 +56374,77 @@ ALIGN 16
DB 170 ; stos %al,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
DB 190,171,170,170,190 ; mov $0xbeaaaaab,%esi
+ DB 114,249 ; jb a7bb <.literal16+0x160b>
+ DB 127,63 ; jg a803 <.literal16+0x1653>
+ DB 114,249 ; jb a7bf <.literal16+0x160f>
+ DB 127,63 ; jg a807 <.literal16+0x1657>
+ DB 114,249 ; jb a7c3 <.literal16+0x1613>
+ DB 127,63 ; jg a80b <.literal16+0x165b>
+ DB 114,249 ; jb a7c7 <.literal16+0x1617>
+ DB 127,63 ; jg a80f <.literal16+0x165f>
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 114,249 ; jb a7fb <.literal16+0x164b>
+ DB 127,63 ; jg a843 <.literal16+0x1693>
+ DB 114,249 ; jb a7ff <.literal16+0x164f>
+ DB 127,63 ; jg a847 <.literal16+0x1697>
+ DB 114,249 ; jb a803 <.literal16+0x1653>
+ DB 127,63 ; jg a84b <.literal16+0x169b>
+ DB 114,249 ; jb a807 <.literal16+0x1657>
+ DB 127,63 ; jg a84f <.literal16+0x169f>
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 3,0 ; add (%eax),%eax
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 2,0 ; add (%eax),%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 128,63,0 ; cmpb $0x0,(%edi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
+ DB 63 ; aas
+ DB 0,0 ; add %al,(%eax)
+ DB 128 ; .byte 0x80
+ DB 63 ; aas
ALIGN 4
DB 0,0 ; add %al,(%eax)
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 4eaa77c5a9..f276ea6e9c 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -1495,3 +1495,55 @@ STAGE(callback) {
c->fn(c, tail ? tail : kStride);
load4(c->read_from,0, &r,&g,&b,&a);
}
+
+// Our general strategy is to recursively interpolate each dimension,
+// accumulating the index to sample at, and our current pixel stride to help accumulate the index.
+template <int dim>
+SI void color_lookup_table(const SkJumper_ColorLookupTableCtx* ctx,
+ F& r, F& g, F& b, F a, U32 index, U32 stride) {
+ // We'd logically like to sample this dimension at x.
+ int limit = ctx->limits[dim-1];
+ F src;
+ switch(dim) {
+ case 1: src = r; break;
+ case 2: src = g; break;
+ case 3: src = b; break;
+ case 4: src = a; break;
+ }
+ F x = src * (limit - 1);
+
+ // We can't index an array by a float (darn) so we have to snap to nearby integers lo and hi.
+ U32 lo = trunc_(x ),
+ hi = trunc_(x + 0.9999f);
+
+ // Recursively sample at lo and hi.
+ F lr = r, lg = g, lb = b,
+ hr = r, hg = g, hb = b;
+ color_lookup_table<dim-1>(ctx, lr,lg,lb,a, stride*lo + index, stride*limit);
+ color_lookup_table<dim-1>(ctx, hr,hg,hb,a, stride*hi + index, stride*limit);
+
+ // Linearly interpolate those colors based on their distance to x.
+ F t = x - cast(lo);
+ r = lerp(lr, hr, t);
+ g = lerp(lg, hg, t);
+ b = lerp(lb, hb, t);
+}
+
+// Bottom out our recursion at 0 dimensions, i.e. just return the colors at index.
+template<>
+inline void color_lookup_table<0>(const SkJumper_ColorLookupTableCtx* ctx,
+ F& r, F& g, F& b, F a, U32 index, U32 stride) {
+ r = gather(ctx->table, 3*index+0);
+ g = gather(ctx->table, 3*index+1);
+ b = gather(ctx->table, 3*index+2);
+}
+
+STAGE(clut_3D) {
+ color_lookup_table<3>(ctx, r,g,b,a, 0,1);
+ // This 3D color lookup table leaves alpha alone.
+}
+STAGE(clut_4D) {
+ color_lookup_table<4>(ctx, r,g,b,a, 0,1);
+ // "a" was really CMYK's K, so we just set alpha opaque.
+ a = 1.0f;
+}