aboutsummaryrefslogtreecommitdiffhomepage
path: root/src
diff options
context:
space:
mode:
Diffstat (limited to 'src')
-rw-r--r--src/core/SkRasterPipeline.cpp11
-rw-r--r--src/jumper/SkJumper.h5
-rw-r--r--src/jumper/SkJumper_generated.S797
-rw-r--r--src/jumper/SkJumper_generated_win.S795
-rw-r--r--src/jumper/SkJumper_stages.cpp10
-rw-r--r--src/jumper/SkJumper_stages_8bit.cpp9
-rw-r--r--src/jumper/SkJumper_stages_lowp.cpp3
7 files changed, 762 insertions, 868 deletions
diff --git a/src/core/SkRasterPipeline.cpp b/src/core/SkRasterPipeline.cpp
index ba07467dfc..a8c4c0de73 100644
--- a/src/core/SkRasterPipeline.cpp
+++ b/src/core/SkRasterPipeline.cpp
@@ -7,6 +7,8 @@
#include "SkRasterPipeline.h"
#include "SkPM4f.h"
+#include "SkPM4fPriv.h"
+#include "../jumper/SkJumper.h"
SkRasterPipeline::SkRasterPipeline(SkArenaAlloc* alloc) : fAlloc(alloc) {
this->reset();
@@ -87,9 +89,12 @@ void SkRasterPipeline::append_constant_color(SkArenaAlloc* alloc, const float rg
this->append(white_color);
INC_WHITE;
} else {
- float* storage = alloc->makeArray<float>(4);
- memcpy(storage, rgba, 4 * sizeof(float));
- this->unchecked_append(uniform_color, storage);
+ auto ctx = alloc->make<SkJumper_UniformColorCtx>();
+ Sk4f color = Sk4f::Load(rgba);
+ color.store(&ctx->r);
+ ctx->rgba = Sk4f_toL32(color);
+
+ this->unchecked_append(uniform_color, ctx);
INC_COLOR;
}
diff --git a/src/jumper/SkJumper.h b/src/jumper/SkJumper.h
index 60e1156e3f..a22bb22da1 100644
--- a/src/jumper/SkJumper.h
+++ b/src/jumper/SkJumper.h
@@ -116,4 +116,9 @@ struct SkJumper_2PtConicalCtx {
fDR;
};
+struct SkJumper_UniformColorCtx {
+ float r,g,b,a;
+ uint32_t rgba;
+};
+
#endif//SkJumper_DEFINED
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index ce01a81595..af5a8b1ff3 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -50443,23 +50443,7 @@ HIDDEN _sk_uniform_color_hsw_8bit
FUNCTION(_sk_uniform_color_hsw_8bit)
_sk_uniform_color_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 197,250,16,5,122,18,0,0 // vmovss 0x127a(%rip),%xmm0 # 132c <_sk_xor__hsw_8bit+0xbd>
- .byte 197,250,89,16 // vmulss (%rax),%xmm0,%xmm2
- .byte 196,225,250,44,202 // vcvttss2si %xmm2,%rcx
- .byte 197,250,89,80,4 // vmulss 0x4(%rax),%xmm0,%xmm2
- .byte 196,225,250,44,210 // vcvttss2si %xmm2,%rdx
- .byte 193,226,8 // shl $0x8,%edx
- .byte 9,202 // or %ecx,%edx
- .byte 197,250,89,80,8 // vmulss 0x8(%rax),%xmm0,%xmm2
- .byte 196,225,250,44,202 // vcvttss2si %xmm2,%rcx
- .byte 193,225,16 // shl $0x10,%ecx
- .byte 197,250,89,64,12 // vmulss 0xc(%rax),%xmm0,%xmm0
- .byte 196,225,250,44,192 // vcvttss2si %xmm0,%rax
- .byte 193,224,24 // shl $0x18,%eax
- .byte 9,200 // or %ecx,%eax
- .byte 9,208 // or %edx,%eax
- .byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
+ .byte 196,226,125,24,64,16 // vbroadcastss 0x10(%rax),%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50468,7 +50452,7 @@ HIDDEN _sk_set_rgb_hsw_8bit
FUNCTION(_sk_set_rgb_hsw_8bit)
_sk_set_rgb_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 197,250,16,21,49,18,0,0 // vmovss 0x1231(%rip),%xmm2 # 1330 <_sk_xor__hsw_8bit+0xc1>
+ .byte 197,250,16,21,42,18,0,0 // vmovss 0x122a(%rip),%xmm2 # 12e8 <_sk_xor__hsw_8bit+0xbd>
.byte 197,234,89,24 // vmulss (%rax),%xmm2,%xmm3
.byte 196,225,250,44,203 // vcvttss2si %xmm3,%rcx
.byte 197,234,89,88,4 // vmulss 0x4(%rax),%xmm2,%xmm3
@@ -50481,7 +50465,7 @@ _sk_set_rgb_hsw_8bit:
.byte 9,208 // or %edx,%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
.byte 196,226,125,88,210 // vpbroadcastd %xmm2,%ymm2
- .byte 197,253,219,5,41,18,0,0 // vpand 0x1229(%rip),%ymm0,%ymm0 # 1360 <_sk_xor__hsw_8bit+0xf1>
+ .byte 197,253,219,5,42,18,0,0 // vpand 0x122a(%rip),%ymm0,%ymm0 # 1320 <_sk_xor__hsw_8bit+0xf5>
.byte 197,237,235,192 // vpor %ymm0,%ymm2,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50490,8 +50474,8 @@ HIDDEN _sk_premul_hsw_8bit
.globl _sk_premul_hsw_8bit
FUNCTION(_sk_premul_hsw_8bit)
_sk_premul_hsw_8bit:
- .byte 196,226,125,0,21,56,18,0,0 // vpshufb 0x1238(%rip),%ymm0,%ymm2 # 1380 <_sk_xor__hsw_8bit+0x111>
- .byte 197,237,235,21,80,18,0,0 // vpor 0x1250(%rip),%ymm2,%ymm2 # 13a0 <_sk_xor__hsw_8bit+0x131>
+ .byte 196,226,125,0,21,57,18,0,0 // vpshufb 0x1239(%rip),%ymm0,%ymm2 # 1340 <_sk_xor__hsw_8bit+0x115>
+ .byte 197,237,235,21,81,18,0,0 // vpor 0x1251(%rip),%ymm2,%ymm2 # 1360 <_sk_xor__hsw_8bit+0x135>
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
.byte 196,227,125,57,192,1 // vextracti128 $0x1,%ymm0,%xmm0
.byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0
@@ -50514,7 +50498,7 @@ HIDDEN _sk_swap_rb_hsw_8bit
.globl _sk_swap_rb_hsw_8bit
FUNCTION(_sk_swap_rb_hsw_8bit)
_sk_swap_rb_hsw_8bit:
- .byte 196,226,125,0,5,25,18,0,0 // vpshufb 0x1219(%rip),%ymm0,%ymm0 # 13c0 <_sk_xor__hsw_8bit+0x151>
+ .byte 196,226,125,0,5,26,18,0,0 // vpshufb 0x121a(%rip),%ymm0,%ymm0 # 1380 <_sk_xor__hsw_8bit+0x155>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50532,7 +50516,7 @@ _sk_load_8888_hsw_8bit:
.byte 72,3,8 // add (%rax),%rcx
.byte 74,141,4,137 // lea (%rcx,%r9,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,8 // jne 1d8 <_sk_load_8888_hsw_8bit+0x2d>
+ .byte 117,8 // jne 197 <_sk_load_8888_hsw_8bit+0x2d>
.byte 197,254,111,0 // vmovdqu (%rax),%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50544,7 +50528,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,225,249,110,194 // vmovq %rdx,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,226,125,140,0 // vpmaskmovd (%rax),%ymm0,%ymm0
- .byte 235,214 // jmp 1d4 <_sk_load_8888_hsw_8bit+0x29>
+ .byte 235,214 // jmp 193 <_sk_load_8888_hsw_8bit+0x29>
HIDDEN _sk_load_8888_dst_hsw_8bit
.globl _sk_load_8888_dst_hsw_8bit
@@ -50560,7 +50544,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 72,3,8 // add (%rax),%rcx
.byte 74,141,4,137 // lea (%rcx,%r9,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,8 // jne 22b <_sk_load_8888_dst_hsw_8bit+0x2d>
+ .byte 117,8 // jne 1ea <_sk_load_8888_dst_hsw_8bit+0x2d>
.byte 197,254,111,8 // vmovdqu (%rax),%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50572,7 +50556,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,225,249,110,202 // vmovq %rdx,%xmm1
.byte 196,226,125,33,201 // vpmovsxbd %xmm1,%ymm1
.byte 196,226,117,140,8 // vpmaskmovd (%rax),%ymm1,%ymm1
- .byte 235,214 // jmp 227 <_sk_load_8888_dst_hsw_8bit+0x29>
+ .byte 235,214 // jmp 1e6 <_sk_load_8888_dst_hsw_8bit+0x29>
HIDDEN _sk_store_8888_hsw_8bit
.globl _sk_store_8888_hsw_8bit
@@ -50588,7 +50572,7 @@ _sk_store_8888_hsw_8bit:
.byte 72,3,8 // add (%rax),%rcx
.byte 74,141,4,137 // lea (%rcx,%r9,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,8 // jne 27e <_sk_store_8888_hsw_8bit+0x2d>
+ .byte 117,8 // jne 23d <_sk_store_8888_hsw_8bit+0x2d>
.byte 197,254,127,0 // vmovdqu %ymm0,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50600,7 +50584,7 @@ _sk_store_8888_hsw_8bit:
.byte 196,225,249,110,210 // vmovq %rdx,%xmm2
.byte 196,226,125,33,210 // vpmovsxbd %xmm2,%ymm2
.byte 196,226,109,142,0 // vpmaskmovd %ymm0,%ymm2,(%rax)
- .byte 235,214 // jmp 27a <_sk_store_8888_hsw_8bit+0x29>
+ .byte 235,214 // jmp 239 <_sk_store_8888_hsw_8bit+0x29>
HIDDEN _sk_load_bgra_hsw_8bit
.globl _sk_load_bgra_hsw_8bit
@@ -50616,9 +50600,9 @@ _sk_load_bgra_hsw_8bit:
.byte 72,3,8 // add (%rax),%rcx
.byte 74,141,4,137 // lea (%rcx,%r9,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 2da <_sk_load_bgra_hsw_8bit+0x36>
+ .byte 117,17 // jne 299 <_sk_load_bgra_hsw_8bit+0x36>
.byte 197,254,111,0 // vmovdqu (%rax),%ymm0
- .byte 196,226,125,0,5,10,17,0,0 // vpshufb 0x110a(%rip),%ymm0,%ymm0 # 13e0 <_sk_xor__hsw_8bit+0x171>
+ .byte 196,226,125,0,5,11,17,0,0 // vpshufb 0x110b(%rip),%ymm0,%ymm0 # 13a0 <_sk_xor__hsw_8bit+0x175>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 185,8,0,0,0 // mov $0x8,%ecx
@@ -50629,7 +50613,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,225,249,110,194 // vmovq %rdx,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,226,125,140,0 // vpmaskmovd (%rax),%ymm0,%ymm0
- .byte 235,205 // jmp 2cd <_sk_load_bgra_hsw_8bit+0x29>
+ .byte 235,205 // jmp 28c <_sk_load_bgra_hsw_8bit+0x29>
HIDDEN _sk_load_bgra_dst_hsw_8bit
.globl _sk_load_bgra_dst_hsw_8bit
@@ -50645,9 +50629,9 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 72,3,8 // add (%rax),%rcx
.byte 74,141,4,137 // lea (%rcx,%r9,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 336 <_sk_load_bgra_dst_hsw_8bit+0x36>
+ .byte 117,17 // jne 2f5 <_sk_load_bgra_dst_hsw_8bit+0x36>
.byte 197,254,111,8 // vmovdqu (%rax),%ymm1
- .byte 196,226,117,0,13,206,16,0,0 // vpshufb 0x10ce(%rip),%ymm1,%ymm1 # 1400 <_sk_xor__hsw_8bit+0x191>
+ .byte 196,226,117,0,13,207,16,0,0 // vpshufb 0x10cf(%rip),%ymm1,%ymm1 # 13c0 <_sk_xor__hsw_8bit+0x195>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 185,8,0,0,0 // mov $0x8,%ecx
@@ -50658,7 +50642,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,225,249,110,202 // vmovq %rdx,%xmm1
.byte 196,226,125,33,201 // vpmovsxbd %xmm1,%ymm1
.byte 196,226,117,140,8 // vpmaskmovd (%rax),%ymm1,%ymm1
- .byte 235,205 // jmp 329 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ .byte 235,205 // jmp 2e8 <_sk_load_bgra_dst_hsw_8bit+0x29>
HIDDEN _sk_store_bgra_hsw_8bit
.globl _sk_store_bgra_hsw_8bit
@@ -50673,9 +50657,9 @@ _sk_store_bgra_hsw_8bit:
.byte 72,193,225,2 // shl $0x2,%rcx
.byte 72,3,8 // add (%rax),%rcx
.byte 74,141,4,137 // lea (%rcx,%r9,4),%rax
- .byte 196,226,125,0,21,155,16,0,0 // vpshufb 0x109b(%rip),%ymm0,%ymm2 # 1420 <_sk_xor__hsw_8bit+0x1b1>
+ .byte 196,226,125,0,21,156,16,0,0 // vpshufb 0x109c(%rip),%ymm0,%ymm2 # 13e0 <_sk_xor__hsw_8bit+0x1b5>
.byte 77,133,192 // test %r8,%r8
- .byte 117,8 // jne 392 <_sk_store_bgra_hsw_8bit+0x36>
+ .byte 117,8 // jne 351 <_sk_store_bgra_hsw_8bit+0x36>
.byte 197,254,127,16 // vmovdqu %ymm2,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50687,7 +50671,7 @@ _sk_store_bgra_hsw_8bit:
.byte 196,225,249,110,218 // vmovq %rdx,%xmm3
.byte 196,226,125,33,219 // vpmovsxbd %xmm3,%ymm3
.byte 196,226,101,142,16 // vpmaskmovd %ymm2,%ymm3,(%rax)
- .byte 235,214 // jmp 38e <_sk_store_bgra_hsw_8bit+0x32>
+ .byte 235,214 // jmp 34d <_sk_store_bgra_hsw_8bit+0x32>
HIDDEN _sk_load_a8_hsw_8bit
.globl _sk_load_a8_hsw_8bit
@@ -50701,9 +50685,9 @@ _sk_load_a8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,28 // jne 3f1 <_sk_load_a8_hsw_8bit+0x39>
+ .byte 117,28 // jne 3b0 <_sk_load_a8_hsw_8bit+0x39>
.byte 196,162,121,48,4,2 // vpmovzxbw (%rdx,%r8,1),%xmm0
- .byte 197,249,219,5,93,18,0,0 // vpand 0x125d(%rip),%xmm0,%xmm0 # 1640 <_sk_xor__hsw_8bit+0x3d1>
+ .byte 197,249,219,5,94,18,0,0 // vpand 0x125e(%rip),%xmm0,%xmm0 # 1600 <_sk_xor__hsw_8bit+0x3d5>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,253,114,240,24 // vpslld $0x18,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50712,15 +50696,15 @@ _sk_load_a8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,217 // ja 3db <_sk_load_a8_hsw_8bit+0x23>
+ .byte 119,217 // ja 39a <_sk_load_a8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 484 <_sk_load_a8_hsw_8bit+0xcc>
+ .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 440 <_sk_load_a8_hsw_8bit+0xc9>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,186 // jmp 3db <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,186 // jmp 39a <_sk_load_a8_hsw_8bit+0x23>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -50728,7 +50712,7 @@ _sk_load_a8_hsw_8bit:
.byte 197,249,110,208 // vmovd %eax,%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,121,2,194,1 // vpblendd $0x1,%xmm2,%xmm0,%xmm0
- .byte 235,149 // jmp 3db <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,149 // jmp 39a <_sk_load_a8_hsw_8bit+0x23>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -50739,23 +50723,24 @@ _sk_load_a8_hsw_8bit:
.byte 196,161,121,110,20,2 // vmovd (%rdx,%r8,1),%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,105,2,192,12 // vpblendd $0xc,%xmm0,%xmm2,%xmm0
- .byte 233,90,255,255,255 // jmpq 3db <_sk_load_a8_hsw_8bit+0x23>
- .byte 15,31,0 // nopl (%rax)
- .byte 146 // xchg %eax,%edx
+ .byte 233,90,255,255,255 // jmpq 39a <_sk_load_a8_hsw_8bit+0x23>
+ .byte 149 // xchg %eax,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,172,255,255,255,157,255 // ljmp *-0x620001(%rdi,%rdi,8)
+ .byte 255,175,255,255,255,160 // ljmp *-0x5f000001(%rdi)
.byte 255 // (bad)
- .byte 255,231 // jmpq *%rdi
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,209 // callq *%rcx
.byte 255 // (bad)
+ .byte 223,255 // (bad)
.byte 255 // (bad)
- .byte 255,194 // inc %edx
+ .byte 255,212 // callq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,197 // inc %ebp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -50772,9 +50757,9 @@ _sk_load_a8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,28 // jne 4d9 <_sk_load_a8_dst_hsw_8bit+0x39>
+ .byte 117,28 // jne 495 <_sk_load_a8_dst_hsw_8bit+0x39>
.byte 196,162,121,48,12,2 // vpmovzxbw (%rdx,%r8,1),%xmm1
- .byte 197,241,219,13,133,17,0,0 // vpand 0x1185(%rip),%xmm1,%xmm1 # 1650 <_sk_xor__hsw_8bit+0x3e1>
+ .byte 197,241,219,13,137,17,0,0 // vpand 0x1189(%rip),%xmm1,%xmm1 # 1610 <_sk_xor__hsw_8bit+0x3e5>
.byte 196,226,125,51,201 // vpmovzxwd %xmm1,%ymm1
.byte 197,245,114,241,24 // vpslld $0x18,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50783,15 +50768,15 @@ _sk_load_a8_dst_hsw_8bit:
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,217 // ja 4c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 119,217 // ja 47f <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 56c <_sk_load_a8_dst_hsw_8bit+0xcc>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 528 <_sk_load_a8_dst_hsw_8bit+0xcc>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
- .byte 235,186 // jmp 4c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,186 // jmp 47f <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,241,196,200,2 // vpinsrw $0x2,%eax,%xmm1,%xmm1
@@ -50799,7 +50784,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 197,249,110,208 // vmovd %eax,%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,113,2,202,1 // vpblendd $0x1,%xmm2,%xmm1,%xmm1
- .byte 235,149 // jmp 4c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,149 // jmp 47f <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,241,196,200,6 // vpinsrw $0x6,%eax,%xmm1,%xmm1
@@ -50810,7 +50795,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 196,161,121,110,20,2 // vmovd (%rdx,%r8,1),%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,105,2,201,12 // vpblendd $0xc,%xmm1,%xmm2,%xmm1
- .byte 233,90,255,255,255 // jmpq 4c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,90,255,255,255 // jmpq 47f <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -50842,35 +50827,35 @@ _sk_store_a8_hsw_8bit:
.byte 72,99,87,8 // movslq 0x8(%rdi),%rdx
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 196,226,125,0,21,151,14,0,0 // vpshufb 0xe97(%rip),%ymm0,%ymm2 # 1440 <_sk_xor__hsw_8bit+0x1d1>
+ .byte 196,226,125,0,21,155,14,0,0 // vpshufb 0xe9b(%rip),%ymm0,%ymm2 # 1400 <_sk_xor__hsw_8bit+0x1d5>
.byte 196,227,253,0,210,232 // vpermq $0xe8,%ymm2,%ymm2
.byte 77,133,201 // test %r9,%r9
- .byte 117,19 // jne 5c7 <_sk_store_a8_hsw_8bit+0x3f>
- .byte 196,226,105,0,21,195,16,0,0 // vpshufb 0x10c3(%rip),%xmm2,%xmm2 # 1680 <_sk_xor__hsw_8bit+0x411>
+ .byte 117,19 // jne 583 <_sk_store_a8_hsw_8bit+0x3f>
+ .byte 196,226,105,0,21,199,16,0,0 // vpshufb 0x10c7(%rip),%xmm2,%xmm2 # 1640 <_sk_xor__hsw_8bit+0x415>
.byte 196,161,121,214,20,2 // vmovq %xmm2,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,239 // ja 5c3 <_sk_store_a8_hsw_8bit+0x3b>
+ .byte 119,239 // ja 57f <_sk_store_a8_hsw_8bit+0x3b>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,85,0,0,0 // lea 0x55(%rip),%rcx # 634 <_sk_store_a8_hsw_8bit+0xac>
+ .byte 72,141,13,85,0,0,0 // lea 0x55(%rip),%rcx # 5f0 <_sk_store_a8_hsw_8bit+0xac>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,163,121,20,20,2,0 // vpextrb $0x0,%xmm2,(%rdx,%r8,1)
- .byte 235,210 // jmp 5c3 <_sk_store_a8_hsw_8bit+0x3b>
+ .byte 235,210 // jmp 57f <_sk_store_a8_hsw_8bit+0x3b>
.byte 196,163,121,20,84,2,2,4 // vpextrb $0x4,%xmm2,0x2(%rdx,%r8,1)
- .byte 196,226,105,0,21,94,16,0,0 // vpshufb 0x105e(%rip),%xmm2,%xmm2 # 1660 <_sk_xor__hsw_8bit+0x3f1>
+ .byte 196,226,105,0,21,98,16,0,0 // vpshufb 0x1062(%rip),%xmm2,%xmm2 # 1620 <_sk_xor__hsw_8bit+0x3f5>
.byte 196,163,121,21,20,2,0 // vpextrw $0x0,%xmm2,(%rdx,%r8,1)
- .byte 235,184 // jmp 5c3 <_sk_store_a8_hsw_8bit+0x3b>
+ .byte 235,184 // jmp 57f <_sk_store_a8_hsw_8bit+0x3b>
.byte 196,163,121,20,84,2,6,12 // vpextrb $0xc,%xmm2,0x6(%rdx,%r8,1)
.byte 196,163,121,20,84,2,5,10 // vpextrb $0xa,%xmm2,0x5(%rdx,%r8,1)
.byte 196,163,121,20,84,2,4,8 // vpextrb $0x8,%xmm2,0x4(%rdx,%r8,1)
- .byte 196,226,105,0,21,68,16,0,0 // vpshufb 0x1044(%rip),%xmm2,%xmm2 # 1670 <_sk_xor__hsw_8bit+0x401>
+ .byte 196,226,105,0,21,72,16,0,0 // vpshufb 0x1048(%rip),%xmm2,%xmm2 # 1630 <_sk_xor__hsw_8bit+0x405>
.byte 196,161,121,126,20,2 // vmovd %xmm2,(%rdx,%r8,1)
- .byte 235,143 // jmp 5c3 <_sk_store_a8_hsw_8bit+0x3b>
+ .byte 235,143 // jmp 57f <_sk_store_a8_hsw_8bit+0x3b>
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
.byte 255,197 // inc %ebp
@@ -50903,13 +50888,13 @@ _sk_load_g8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,50 // jne 69f <_sk_load_g8_hsw_8bit+0x4f>
+ .byte 117,50 // jne 65b <_sk_load_g8_hsw_8bit+0x4f>
.byte 196,162,121,48,4,2 // vpmovzxbw (%rdx,%r8,1),%xmm0
- .byte 197,249,219,5,21,16,0,0 // vpand 0x1015(%rip),%xmm0,%xmm0 # 1690 <_sk_xor__hsw_8bit+0x421>
+ .byte 197,249,219,5,25,16,0,0 // vpand 0x1019(%rip),%xmm0,%xmm0 # 1650 <_sk_xor__hsw_8bit+0x425>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
- .byte 196,226,125,88,21,171,12,0,0 // vpbroadcastd 0xcab(%rip),%ymm2 # 1334 <_sk_xor__hsw_8bit+0xc5>
+ .byte 196,226,125,88,21,167,12,0,0 // vpbroadcastd 0xca7(%rip),%ymm2 # 12ec <_sk_xor__hsw_8bit+0xc1>
.byte 196,226,125,64,194 // vpmulld %ymm2,%ymm0,%ymm0
- .byte 196,226,125,88,21,161,12,0,0 // vpbroadcastd 0xca1(%rip),%ymm2 # 1338 <_sk_xor__hsw_8bit+0xc9>
+ .byte 196,226,125,88,21,157,12,0,0 // vpbroadcastd 0xc9d(%rip),%ymm2 # 12f0 <_sk_xor__hsw_8bit+0xc5>
.byte 197,253,235,194 // vpor %ymm2,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50917,15 +50902,15 @@ _sk_load_g8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,195 // ja 673 <_sk_load_g8_hsw_8bit+0x23>
+ .byte 119,195 // ja 62f <_sk_load_g8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 734 <_sk_load_g8_hsw_8bit+0xe4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 6f0 <_sk_load_g8_hsw_8bit+0xe4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,164 // jmp 673 <_sk_load_g8_hsw_8bit+0x23>
+ .byte 235,164 // jmp 62f <_sk_load_g8_hsw_8bit+0x23>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -50933,7 +50918,7 @@ _sk_load_g8_hsw_8bit:
.byte 197,249,110,208 // vmovd %eax,%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,121,2,194,1 // vpblendd $0x1,%xmm2,%xmm0,%xmm0
- .byte 233,124,255,255,255 // jmpq 673 <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,124,255,255,255 // jmpq 62f <_sk_load_g8_hsw_8bit+0x23>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -50944,7 +50929,7 @@ _sk_load_g8_hsw_8bit:
.byte 196,161,121,110,20,2 // vmovd (%rdx,%r8,1),%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,105,2,192,12 // vpblendd $0xc,%xmm0,%xmm2,%xmm0
- .byte 233,65,255,255,255 // jmpq 673 <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,65,255,255,255 // jmpq 62f <_sk_load_g8_hsw_8bit+0x23>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -50953,7 +50938,7 @@ _sk_load_g8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde000744 <_sk_xor__hsw_8bit+0xffffffffddfff4d5>
+ .byte 232,255,255,255,221 // callq ffffffffde000700 <_sk_xor__hsw_8bit+0xffffffffddfff4d5>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -50976,13 +50961,13 @@ _sk_load_g8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,50 // jne 79f <_sk_load_g8_dst_hsw_8bit+0x4f>
+ .byte 117,50 // jne 75b <_sk_load_g8_dst_hsw_8bit+0x4f>
.byte 196,162,121,48,12,2 // vpmovzxbw (%rdx,%r8,1),%xmm1
- .byte 197,241,219,13,37,15,0,0 // vpand 0xf25(%rip),%xmm1,%xmm1 # 16a0 <_sk_xor__hsw_8bit+0x431>
+ .byte 197,241,219,13,41,15,0,0 // vpand 0xf29(%rip),%xmm1,%xmm1 # 1660 <_sk_xor__hsw_8bit+0x435>
.byte 196,226,125,51,201 // vpmovzxwd %xmm1,%ymm1
- .byte 196,226,125,88,21,179,11,0,0 // vpbroadcastd 0xbb3(%rip),%ymm2 # 133c <_sk_xor__hsw_8bit+0xcd>
+ .byte 196,226,125,88,21,175,11,0,0 // vpbroadcastd 0xbaf(%rip),%ymm2 # 12f4 <_sk_xor__hsw_8bit+0xc9>
.byte 196,226,117,64,202 // vpmulld %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,169,11,0,0 // vpbroadcastd 0xba9(%rip),%ymm2 # 1340 <_sk_xor__hsw_8bit+0xd1>
+ .byte 196,226,125,88,21,165,11,0,0 // vpbroadcastd 0xba5(%rip),%ymm2 # 12f8 <_sk_xor__hsw_8bit+0xcd>
.byte 197,245,235,202 // vpor %ymm2,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50990,15 +50975,15 @@ _sk_load_g8_dst_hsw_8bit:
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,195 // ja 773 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 119,195 // ja 72f <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 834 <_sk_load_g8_dst_hsw_8bit+0xe4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 7f0 <_sk_load_g8_dst_hsw_8bit+0xe4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
- .byte 235,164 // jmp 773 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 235,164 // jmp 72f <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,241,196,200,2 // vpinsrw $0x2,%eax,%xmm1,%xmm1
@@ -51006,7 +50991,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 197,249,110,208 // vmovd %eax,%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,113,2,202,1 // vpblendd $0x1,%xmm2,%xmm1,%xmm1
- .byte 233,124,255,255,255 // jmpq 773 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,124,255,255,255 // jmpq 72f <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,241,196,200,6 // vpinsrw $0x6,%eax,%xmm1,%xmm1
@@ -51017,7 +51002,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 196,161,121,110,20,2 // vmovd (%rdx,%r8,1),%xmm2
.byte 196,226,121,48,210 // vpmovzxbw %xmm2,%xmm2
.byte 196,227,105,2,201,12 // vpblendd $0xc,%xmm1,%xmm2,%xmm1
- .byte 233,65,255,255,255 // jmpq 773 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,65,255,255,255 // jmpq 72f <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -51026,7 +51011,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde000844 <_sk_xor__hsw_8bit+0xffffffffddfff5d5>
+ .byte 232,255,255,255,221 // callq ffffffffde000800 <_sk_xor__hsw_8bit+0xffffffffddfff5d5>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -51051,9 +51036,9 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 72,3,8 // add (%rax),%rcx
.byte 74,141,4,137 // lea (%rcx,%r9,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,108 // jne 8e1 <_sk_srcover_rgba_8888_hsw_8bit+0x91>
+ .byte 117,108 // jne 89d <_sk_srcover_rgba_8888_hsw_8bit+0x91>
.byte 197,254,111,16 // vmovdqu (%rax),%ymm2
- .byte 196,226,125,0,29,222,11,0,0 // vpshufb 0xbde(%rip),%ymm0,%ymm3 # 1460 <_sk_xor__hsw_8bit+0x1f1>
+ .byte 196,226,125,0,29,226,11,0,0 // vpshufb 0xbe2(%rip),%ymm0,%ymm3 # 1420 <_sk_xor__hsw_8bit+0x1f5>
.byte 196,226,125,48,226 // vpmovzxbw %xmm2,%ymm4
.byte 196,227,125,57,213,1 // vextracti128 $0x1,%ymm2,%xmm5
.byte 196,226,125,48,237 // vpmovzxbw %xmm5,%ymm5
@@ -51072,7 +51057,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 197,237,248,211 // vpsubb %ymm3,%ymm2,%ymm2
.byte 197,237,252,208 // vpaddb %ymm0,%ymm2,%ymm2
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 90a <_sk_srcover_rgba_8888_hsw_8bit+0xba>
+ .byte 117,49 // jne 8c6 <_sk_srcover_rgba_8888_hsw_8bit+0xba>
.byte 197,254,127,16 // vmovdqu %ymm2,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -51084,7 +51069,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,225,249,110,210 // vmovq %rdx,%xmm2
.byte 196,226,125,33,210 // vpmovsxbd %xmm2,%ymm2
.byte 196,226,109,140,16 // vpmaskmovd (%rax),%ymm2,%ymm2
- .byte 233,111,255,255,255 // jmpq 879 <_sk_srcover_rgba_8888_hsw_8bit+0x29>
+ .byte 233,111,255,255,255 // jmpq 835 <_sk_srcover_rgba_8888_hsw_8bit+0x29>
.byte 185,8,0,0,0 // mov $0x8,%ecx
.byte 68,41,193 // sub %r8d,%ecx
.byte 192,225,3 // shl $0x3,%cl
@@ -51093,7 +51078,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,225,249,110,218 // vmovq %rdx,%xmm3
.byte 196,226,125,33,219 // vpmovsxbd %xmm3,%ymm3
.byte 196,226,101,142,16 // vpmaskmovd %ymm2,%ymm3,(%rax)
- .byte 235,173 // jmp 8dd <_sk_srcover_rgba_8888_hsw_8bit+0x8d>
+ .byte 235,173 // jmp 899 <_sk_srcover_rgba_8888_hsw_8bit+0x8d>
HIDDEN _sk_scale_1_float_hsw_8bit
.globl _sk_scale_1_float_hsw_8bit
@@ -51101,14 +51086,14 @@ FUNCTION(_sk_scale_1_float_hsw_8bit)
_sk_scale_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,16 // vmovss (%rax),%xmm2
- .byte 197,234,89,21,6,10,0,0 // vmulss 0xa06(%rip),%xmm2,%xmm2 # 1344 <_sk_xor__hsw_8bit+0xd5>
+ .byte 197,234,89,21,2,10,0,0 // vmulss 0xa02(%rip),%xmm2,%xmm2 # 12fc <_sk_xor__hsw_8bit+0xd1>
.byte 197,250,44,194 // vcvttss2si %xmm2,%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
.byte 196,226,125,120,210 // vpbroadcastb %xmm2,%ymm2
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
.byte 196,227,125,57,192,1 // vextracti128 $0x1,%ymm0,%xmm0
.byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0
- .byte 197,237,219,21,29,11,0,0 // vpand 0xb1d(%rip),%ymm2,%ymm2 # 1480 <_sk_xor__hsw_8bit+0x211>
+ .byte 197,237,219,21,33,11,0,0 // vpand 0xb21(%rip),%ymm2,%ymm2 # 1440 <_sk_xor__hsw_8bit+0x215>
.byte 197,237,213,224 // vpmullw %ymm0,%ymm2,%ymm4
.byte 197,237,213,211 // vpmullw %ymm3,%ymm2,%ymm2
.byte 197,237,253,211 // vpaddw %ymm3,%ymm2,%ymm2
@@ -51133,11 +51118,11 @@ _sk_scale_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,106 // jne a18 <_sk_scale_u8_hsw_8bit+0x87>
+ .byte 117,106 // jne 9d4 <_sk_scale_u8_hsw_8bit+0x87>
.byte 196,162,121,48,20,2 // vpmovzxbw (%rdx,%r8,1),%xmm2
- .byte 197,233,219,21,244,12,0,0 // vpand 0xcf4(%rip),%xmm2,%xmm2 # 16b0 <_sk_xor__hsw_8bit+0x441>
+ .byte 197,233,219,21,248,12,0,0 // vpand 0xcf8(%rip),%xmm2,%xmm2 # 1670 <_sk_xor__hsw_8bit+0x445>
.byte 196,226,125,51,210 // vpmovzxwd %xmm2,%ymm2
- .byte 196,226,109,0,21,214,10,0,0 // vpshufb 0xad6(%rip),%ymm2,%ymm2 # 14a0 <_sk_xor__hsw_8bit+0x231>
+ .byte 196,226,109,0,21,218,10,0,0 // vpshufb 0xada(%rip),%ymm2,%ymm2 # 1460 <_sk_xor__hsw_8bit+0x235>
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
.byte 196,227,125,57,192,1 // vextracti128 $0x1,%ymm0,%xmm0
.byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0
@@ -51159,15 +51144,15 @@ _sk_scale_u8_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,139 // ja 9b4 <_sk_scale_u8_hsw_8bit+0x23>
+ .byte 119,139 // ja 970 <_sk_scale_u8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,124,0,0,0 // lea 0x7c(%rip),%rcx # ab0 <_sk_scale_u8_hsw_8bit+0x11f>
+ .byte 72,141,13,124,0,0,0 // lea 0x7c(%rip),%rcx # a6c <_sk_scale_u8_hsw_8bit+0x11f>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 233,105,255,255,255 // jmpq 9b4 <_sk_scale_u8_hsw_8bit+0x23>
+ .byte 233,105,255,255,255 // jmpq 970 <_sk_scale_u8_hsw_8bit+0x23>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 197,233,196,208,2 // vpinsrw $0x2,%eax,%xmm2,%xmm2
@@ -51175,7 +51160,7 @@ _sk_scale_u8_hsw_8bit:
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,226,121,48,219 // vpmovzxbw %xmm3,%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,65,255,255,255 // jmpq 9b4 <_sk_scale_u8_hsw_8bit+0x23>
+ .byte 233,65,255,255,255 // jmpq 970 <_sk_scale_u8_hsw_8bit+0x23>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 197,233,196,208,6 // vpinsrw $0x6,%eax,%xmm2,%xmm2
@@ -51186,7 +51171,7 @@ _sk_scale_u8_hsw_8bit:
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,226,121,48,219 // vpmovzxbw %xmm3,%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,6,255,255,255 // jmpq 9b4 <_sk_scale_u8_hsw_8bit+0x23>
+ .byte 233,6,255,255,255 // jmpq 970 <_sk_scale_u8_hsw_8bit+0x23>
.byte 102,144 // xchg %ax,%ax
.byte 141 // (bad)
.byte 255 // (bad)
@@ -51195,7 +51180,7 @@ _sk_scale_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde000ac0 <_sk_xor__hsw_8bit+0xffffffffddfff851>
+ .byte 232,255,255,255,221 // callq ffffffffde000a7c <_sk_xor__hsw_8bit+0xffffffffddfff851>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -51212,14 +51197,14 @@ FUNCTION(_sk_lerp_1_float_hsw_8bit)
_sk_lerp_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,16 // vmovss (%rax),%xmm2
- .byte 197,234,89,21,110,8,0,0 // vmulss 0x86e(%rip),%xmm2,%xmm2 # 1348 <_sk_xor__hsw_8bit+0xd9>
+ .byte 197,234,89,21,106,8,0,0 // vmulss 0x86a(%rip),%xmm2,%xmm2 # 1300 <_sk_xor__hsw_8bit+0xd5>
.byte 197,250,44,194 // vcvttss2si %xmm2,%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
.byte 196,226,125,120,210 // vpbroadcastb %xmm2,%ymm2
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
.byte 196,227,125,57,192,1 // vextracti128 $0x1,%ymm0,%xmm0
.byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0
- .byte 197,237,219,37,193,9,0,0 // vpand 0x9c1(%rip),%ymm2,%ymm4 # 14c0 <_sk_xor__hsw_8bit+0x251>
+ .byte 197,237,219,37,197,9,0,0 // vpand 0x9c5(%rip),%ymm2,%ymm4 # 1480 <_sk_xor__hsw_8bit+0x255>
.byte 197,221,213,232 // vpmullw %ymm0,%ymm4,%ymm5
.byte 197,221,213,227 // vpmullw %ymm3,%ymm4,%ymm4
.byte 197,221,253,219 // vpaddw %ymm3,%ymm4,%ymm3
@@ -51262,11 +51247,11 @@ _sk_lerp_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,192,0,0,0 // jne c64 <_sk_lerp_u8_hsw_8bit+0xe1>
+ .byte 15,133,192,0,0,0 // jne c20 <_sk_lerp_u8_hsw_8bit+0xe1>
.byte 196,162,121,48,20,2 // vpmovzxbw (%rdx,%r8,1),%xmm2
- .byte 197,233,219,21,14,11,0,0 // vpand 0xb0e(%rip),%xmm2,%xmm2 # 16c0 <_sk_xor__hsw_8bit+0x451>
+ .byte 197,233,219,21,18,11,0,0 // vpand 0xb12(%rip),%xmm2,%xmm2 # 1680 <_sk_xor__hsw_8bit+0x455>
.byte 196,226,125,51,210 // vpmovzxwd %xmm2,%ymm2
- .byte 196,226,109,0,21,32,9,0,0 // vpshufb 0x920(%rip),%ymm2,%ymm2 # 14e0 <_sk_xor__hsw_8bit+0x271>
+ .byte 196,226,109,0,21,36,9,0,0 // vpshufb 0x924(%rip),%ymm2,%ymm2 # 14a0 <_sk_xor__hsw_8bit+0x275>
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
.byte 196,227,125,57,192,1 // vextracti128 $0x1,%ymm0,%xmm0
.byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0
@@ -51306,15 +51291,15 @@ _sk_lerp_u8_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,49,255,255,255 // ja baa <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 15,135,49,255,255,255 // ja b66 <_sk_lerp_u8_hsw_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,124,0,0,0 // lea 0x7c(%rip),%rcx # d00 <_sk_lerp_u8_hsw_8bit+0x17d>
+ .byte 72,141,13,124,0,0,0 // lea 0x7c(%rip),%rcx # cbc <_sk_lerp_u8_hsw_8bit+0x17d>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 233,15,255,255,255 // jmpq baa <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,15,255,255,255 // jmpq b66 <_sk_lerp_u8_hsw_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 197,233,196,208,2 // vpinsrw $0x2,%eax,%xmm2,%xmm2
@@ -51322,7 +51307,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,226,121,48,219 // vpmovzxbw %xmm3,%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,231,254,255,255 // jmpq baa <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,231,254,255,255 // jmpq b66 <_sk_lerp_u8_hsw_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 197,233,196,208,6 // vpinsrw $0x6,%eax,%xmm2,%xmm2
@@ -51333,7 +51318,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,226,121,48,219 // vpmovzxbw %xmm3,%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,172,254,255,255 // jmpq baa <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,172,254,255,255 // jmpq b66 <_sk_lerp_u8_hsw_8bit+0x27>
.byte 102,144 // xchg %ax,%ax
.byte 141 // (bad)
.byte 255 // (bad)
@@ -51342,7 +51327,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde000d10 <_sk_xor__hsw_8bit+0xffffffffddfffaa1>
+ .byte 232,255,255,255,221 // callq ffffffffde000ccc <_sk_xor__hsw_8bit+0xffffffffddfffaa1>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -51374,7 +51359,7 @@ HIDDEN _sk_black_color_hsw_8bit
FUNCTION(_sk_black_color_hsw_8bit)
_sk_black_color_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,25,5,153,9,0,0 // vbroadcastsd 0x999(%rip),%ymm0 # 16d0 <_sk_xor__hsw_8bit+0x461>
+ .byte 196,226,125,25,5,157,9,0,0 // vbroadcastsd 0x99d(%rip),%ymm0 # 1690 <_sk_xor__hsw_8bit+0x465>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_white_color_hsw_8bit
@@ -51397,7 +51382,7 @@ HIDDEN _sk_srcatop_hsw_8bit
.globl _sk_srcatop_hsw_8bit
FUNCTION(_sk_srcatop_hsw_8bit)
_sk_srcatop_hsw_8bit:
- .byte 197,253,111,21,175,7,0,0 // vmovdqa 0x7af(%rip),%ymm2 # 1500 <_sk_xor__hsw_8bit+0x291>
+ .byte 197,253,111,21,179,7,0,0 // vmovdqa 0x7b3(%rip),%ymm2 # 14c0 <_sk_xor__hsw_8bit+0x295>
.byte 196,226,117,0,218 // vpshufb %ymm2,%ymm1,%ymm3
.byte 196,226,125,48,224 // vpmovzxbw %xmm0,%ymm4
.byte 196,227,125,57,197,1 // vextracti128 $0x1,%ymm0,%xmm5
@@ -51440,7 +51425,7 @@ HIDDEN _sk_dstatop_hsw_8bit
.globl _sk_dstatop_hsw_8bit
FUNCTION(_sk_dstatop_hsw_8bit)
_sk_dstatop_hsw_8bit:
- .byte 197,253,111,21,25,7,0,0 // vmovdqa 0x719(%rip),%ymm2 # 1520 <_sk_xor__hsw_8bit+0x2b1>
+ .byte 197,253,111,21,29,7,0,0 // vmovdqa 0x71d(%rip),%ymm2 # 14e0 <_sk_xor__hsw_8bit+0x2b5>
.byte 196,226,125,0,218 // vpshufb %ymm2,%ymm0,%ymm3
.byte 196,226,125,48,225 // vpmovzxbw %xmm1,%ymm4
.byte 196,227,125,57,205,1 // vextracti128 $0x1,%ymm1,%xmm5
@@ -51483,7 +51468,7 @@ HIDDEN _sk_srcin_hsw_8bit
.globl _sk_srcin_hsw_8bit
FUNCTION(_sk_srcin_hsw_8bit)
_sk_srcin_hsw_8bit:
- .byte 196,226,117,0,21,130,6,0,0 // vpshufb 0x682(%rip),%ymm1,%ymm2 # 1540 <_sk_xor__hsw_8bit+0x2d1>
+ .byte 196,226,117,0,21,134,6,0,0 // vpshufb 0x686(%rip),%ymm1,%ymm2 # 1500 <_sk_xor__hsw_8bit+0x2d5>
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
.byte 196,227,125,57,192,1 // vextracti128 $0x1,%ymm0,%xmm0
.byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0
@@ -51506,7 +51491,7 @@ HIDDEN _sk_dstin_hsw_8bit
.globl _sk_dstin_hsw_8bit
FUNCTION(_sk_dstin_hsw_8bit)
_sk_dstin_hsw_8bit:
- .byte 196,226,125,0,5,75,6,0,0 // vpshufb 0x64b(%rip),%ymm0,%ymm0 # 1560 <_sk_xor__hsw_8bit+0x2f1>
+ .byte 196,226,125,0,5,79,6,0,0 // vpshufb 0x64f(%rip),%ymm0,%ymm0 # 1520 <_sk_xor__hsw_8bit+0x2f5>
.byte 196,226,125,48,209 // vpmovzxbw %xmm1,%ymm2
.byte 196,227,125,57,203,1 // vextracti128 $0x1,%ymm1,%xmm3
.byte 196,226,125,48,219 // vpmovzxbw %xmm3,%ymm3
@@ -51529,7 +51514,7 @@ HIDDEN _sk_srcout_hsw_8bit
.globl _sk_srcout_hsw_8bit
FUNCTION(_sk_srcout_hsw_8bit)
_sk_srcout_hsw_8bit:
- .byte 196,226,117,0,21,20,6,0,0 // vpshufb 0x614(%rip),%ymm1,%ymm2 # 1580 <_sk_xor__hsw_8bit+0x311>
+ .byte 196,226,117,0,21,24,6,0,0 // vpshufb 0x618(%rip),%ymm1,%ymm2 # 1540 <_sk_xor__hsw_8bit+0x315>
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
.byte 197,237,239,211 // vpxor %ymm3,%ymm2,%ymm2
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
@@ -51554,7 +51539,7 @@ HIDDEN _sk_dstout_hsw_8bit
.globl _sk_dstout_hsw_8bit
FUNCTION(_sk_dstout_hsw_8bit)
_sk_dstout_hsw_8bit:
- .byte 196,226,125,0,5,213,5,0,0 // vpshufb 0x5d5(%rip),%ymm0,%ymm0 # 15a0 <_sk_xor__hsw_8bit+0x331>
+ .byte 196,226,125,0,5,217,5,0,0 // vpshufb 0x5d9(%rip),%ymm0,%ymm0 # 1560 <_sk_xor__hsw_8bit+0x335>
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 197,253,239,194 // vpxor %ymm2,%ymm0,%ymm0
.byte 196,226,125,48,209 // vpmovzxbw %xmm1,%ymm2
@@ -51579,7 +51564,7 @@ HIDDEN _sk_srcover_hsw_8bit
.globl _sk_srcover_hsw_8bit
FUNCTION(_sk_srcover_hsw_8bit)
_sk_srcover_hsw_8bit:
- .byte 196,226,125,0,21,150,5,0,0 // vpshufb 0x596(%rip),%ymm0,%ymm2 # 15c0 <_sk_xor__hsw_8bit+0x351>
+ .byte 196,226,125,0,21,154,5,0,0 // vpshufb 0x59a(%rip),%ymm0,%ymm2 # 1580 <_sk_xor__hsw_8bit+0x355>
.byte 196,226,125,48,217 // vpmovzxbw %xmm1,%ymm3
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
.byte 196,226,125,48,228 // vpmovzxbw %xmm4,%ymm4
@@ -51604,7 +51589,7 @@ HIDDEN _sk_dstover_hsw_8bit
.globl _sk_dstover_hsw_8bit
FUNCTION(_sk_dstover_hsw_8bit)
_sk_dstover_hsw_8bit:
- .byte 196,226,117,0,21,87,5,0,0 // vpshufb 0x557(%rip),%ymm1,%ymm2 # 15e0 <_sk_xor__hsw_8bit+0x371>
+ .byte 196,226,117,0,21,91,5,0,0 // vpshufb 0x55b(%rip),%ymm1,%ymm2 # 15a0 <_sk_xor__hsw_8bit+0x375>
.byte 196,226,125,48,216 // vpmovzxbw %xmm0,%ymm3
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,226,125,48,228 // vpmovzxbw %xmm4,%ymm4
@@ -51651,7 +51636,7 @@ HIDDEN _sk_multiply_hsw_8bit
.globl _sk_multiply_hsw_8bit
FUNCTION(_sk_multiply_hsw_8bit)
_sk_multiply_hsw_8bit:
- .byte 197,253,111,37,203,4,0,0 // vmovdqa 0x4cb(%rip),%ymm4 # 1600 <_sk_xor__hsw_8bit+0x391>
+ .byte 197,253,111,37,207,4,0,0 // vmovdqa 0x4cf(%rip),%ymm4 # 15c0 <_sk_xor__hsw_8bit+0x395>
.byte 196,226,117,0,212 // vpshufb %ymm4,%ymm1,%ymm2
.byte 197,213,118,237 // vpcmpeqd %ymm5,%ymm5,%ymm5
.byte 197,237,239,245 // vpxor %ymm5,%ymm2,%ymm6
@@ -51730,7 +51715,7 @@ HIDDEN _sk_xor__hsw_8bit
.globl _sk_xor__hsw_8bit
FUNCTION(_sk_xor__hsw_8bit)
_sk_xor__hsw_8bit:
- .byte 197,253,111,21,169,3,0,0 // vmovdqa 0x3a9(%rip),%ymm2 # 1620 <_sk_xor__hsw_8bit+0x3b1>
+ .byte 197,253,111,21,173,3,0,0 // vmovdqa 0x3ad(%rip),%ymm2 # 15e0 <_sk_xor__hsw_8bit+0x3b5>
.byte 196,226,117,0,218 // vpshufb %ymm2,%ymm1,%ymm3
.byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
.byte 197,229,239,220 // vpxor %ymm4,%ymm3,%ymm3
@@ -51772,9 +51757,7 @@ _sk_xor__hsw_8bit:
BALIGN4
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 1373 <_sk_xor__hsw_8bit+0x104>
- .byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 1377 <_sk_xor__hsw_8bit+0x108>
+ .byte 127,67 // jg 132f <_sk_xor__hsw_8bit+0x104>
.byte 1,1 // add %eax,(%rcx)
.byte 1,0 // add %eax,(%rax)
.byte 0,0 // add %al,(%rax)
@@ -51784,9 +51767,9 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 0,255 // add %bh,%bh
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 138b <_sk_xor__hsw_8bit+0x11c>
+ .byte 127,67 // jg 1343 <_sk_xor__hsw_8bit+0x118>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 138f <_sk_xor__hsw_8bit+0x120>
+ .byte 127,67 // jg 1347 <_sk_xor__hsw_8bit+0x11c>
BALIGN32
.byte 0,0 // add %al,(%rax)
@@ -52375,25 +52358,7 @@ HIDDEN _sk_uniform_color_sse41_8bit
FUNCTION(_sk_uniform_color_sse41_8bit)
_sk_uniform_color_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,5,53,15,0,0 // movss 0xf35(%rip),%xmm0 # fe4 <_sk_xor__sse41_8bit+0xae>
- .byte 243,15,16,16 // movss (%rax),%xmm2
- .byte 243,15,89,208 // mulss %xmm0,%xmm2
- .byte 243,72,15,44,202 // cvttss2si %xmm2,%rcx
- .byte 243,15,16,80,4 // movss 0x4(%rax),%xmm2
- .byte 243,15,89,208 // mulss %xmm0,%xmm2
- .byte 243,72,15,44,210 // cvttss2si %xmm2,%rdx
- .byte 193,226,8 // shl $0x8,%edx
- .byte 9,202 // or %ecx,%edx
- .byte 243,15,16,80,8 // movss 0x8(%rax),%xmm2
- .byte 243,15,89,208 // mulss %xmm0,%xmm2
- .byte 243,72,15,44,202 // cvttss2si %xmm2,%rcx
- .byte 193,225,16 // shl $0x10,%ecx
- .byte 243,15,89,64,12 // mulss 0xc(%rax),%xmm0
- .byte 243,72,15,44,192 // cvttss2si %xmm0,%rax
- .byte 193,224,24 // shl $0x18,%eax
- .byte 9,200 // or %ecx,%eax
- .byte 9,208 // or %edx,%eax
- .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 102,15,110,64,16 // movd 0x10(%rax),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -52403,7 +52368,7 @@ HIDDEN _sk_set_rgb_sse41_8bit
FUNCTION(_sk_set_rgb_sse41_8bit)
_sk_set_rgb_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,21,224,14,0,0 // movss 0xee0(%rip),%xmm2 # fe8 <_sk_xor__sse41_8bit+0xb2>
+ .byte 243,15,16,21,221,14,0,0 // movss 0xedd(%rip),%xmm2 # f9c <_sk_xor__sse41_8bit+0xaf>
.byte 243,15,16,24 // movss (%rax),%xmm3
.byte 243,15,89,218 // mulss %xmm2,%xmm3
.byte 243,72,15,44,203 // cvttss2si %xmm3,%rcx
@@ -52418,7 +52383,7 @@ _sk_set_rgb_sse41_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
- .byte 102,15,219,5,184,14,0,0 // pand 0xeb8(%rip),%xmm0 # 1000 <_sk_xor__sse41_8bit+0xca>
+ .byte 102,15,219,5,177,14,0,0 // pand 0xeb1(%rip),%xmm0 # fb0 <_sk_xor__sse41_8bit+0xc3>
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -52428,8 +52393,8 @@ HIDDEN _sk_premul_sse41_8bit
FUNCTION(_sk_premul_sse41_8bit)
_sk_premul_sse41_8bit:
.byte 102,15,111,216 // movdqa %xmm0,%xmm3
- .byte 102,15,56,0,29,179,14,0,0 // pshufb 0xeb3(%rip),%xmm3 # 1010 <_sk_xor__sse41_8bit+0xda>
- .byte 102,15,235,29,187,14,0,0 // por 0xebb(%rip),%xmm3 # 1020 <_sk_xor__sse41_8bit+0xea>
+ .byte 102,15,56,0,29,172,14,0,0 // pshufb 0xeac(%rip),%xmm3 # fc0 <_sk_xor__sse41_8bit+0xd3>
+ .byte 102,15,235,29,180,14,0,0 // por 0xeb4(%rip),%xmm3 # fd0 <_sk_xor__sse41_8bit+0xe3>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,48,232 // pmovzxbw %xmm0,%xmm5
.byte 102,15,104,196 // punpckhbw %xmm4,%xmm0
@@ -52439,7 +52404,7 @@ _sk_premul_sse41_8bit:
.byte 102,15,213,213 // pmullw %xmm5,%xmm2
.byte 102,15,253,216 // paddw %xmm0,%xmm3
.byte 102,15,253,213 // paddw %xmm5,%xmm2
- .byte 102,15,111,5,157,14,0,0 // movdqa 0xe9d(%rip),%xmm0 # 1030 <_sk_xor__sse41_8bit+0xfa>
+ .byte 102,15,111,5,150,14,0,0 // movdqa 0xe96(%rip),%xmm0 # fe0 <_sk_xor__sse41_8bit+0xf3>
.byte 102,15,56,0,216 // pshufb %xmm0,%xmm3
.byte 102,15,56,0,208 // pshufb %xmm0,%xmm2
.byte 102,15,108,211 // punpcklqdq %xmm3,%xmm2
@@ -52451,7 +52416,7 @@ HIDDEN _sk_swap_rb_sse41_8bit
.globl _sk_swap_rb_sse41_8bit
FUNCTION(_sk_swap_rb_sse41_8bit)
_sk_swap_rb_sse41_8bit:
- .byte 102,15,56,0,5,142,14,0,0 // pshufb 0xe8e(%rip),%xmm0 # 1040 <_sk_xor__sse41_8bit+0x10a>
+ .byte 102,15,56,0,5,135,14,0,0 // pshufb 0xe87(%rip),%xmm0 # ff0 <_sk_xor__sse41_8bit+0x103>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -52468,25 +52433,25 @@ _sk_load_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 1e1 <_sk_load_8888_sse41_8bit+0x2b>
+ .byte 117,10 // jne 198 <_sk_load_8888_sse41_8bit+0x2b>
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,42 // je 215 <_sk_load_8888_sse41_8bit+0x5f>
+ .byte 116,42 // je 1cc <_sk_load_8888_sse41_8bit+0x5f>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 207 <_sk_load_8888_sse41_8bit+0x51>
+ .byte 116,18 // je 1be <_sk_load_8888_sse41_8bit+0x51>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,226 // jne 1dd <_sk_load_8888_sse41_8bit+0x27>
+ .byte 117,226 // jne 194 <_sk_load_8888_sse41_8bit+0x27>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,20,130 // movq (%rdx,%r8,4),%xmm2
.byte 102,15,58,14,194,15 // pblendw $0xf,%xmm2,%xmm0
- .byte 235,200 // jmp 1dd <_sk_load_8888_sse41_8bit+0x27>
+ .byte 235,200 // jmp 194 <_sk_load_8888_sse41_8bit+0x27>
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,192 // jmp 1dd <_sk_load_8888_sse41_8bit+0x27>
+ .byte 235,192 // jmp 194 <_sk_load_8888_sse41_8bit+0x27>
HIDDEN _sk_load_8888_dst_sse41_8bit
.globl _sk_load_8888_dst_sse41_8bit
@@ -52501,25 +52466,25 @@ _sk_load_8888_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 248 <_sk_load_8888_dst_sse41_8bit+0x2b>
+ .byte 117,10 // jne 1ff <_sk_load_8888_dst_sse41_8bit+0x2b>
.byte 243,66,15,111,12,130 // movdqu (%rdx,%r8,4),%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,42 // je 27c <_sk_load_8888_dst_sse41_8bit+0x5f>
+ .byte 116,42 // je 233 <_sk_load_8888_dst_sse41_8bit+0x5f>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 26e <_sk_load_8888_dst_sse41_8bit+0x51>
+ .byte 116,18 // je 225 <_sk_load_8888_dst_sse41_8bit+0x51>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,226 // jne 244 <_sk_load_8888_dst_sse41_8bit+0x27>
+ .byte 117,226 // jne 1fb <_sk_load_8888_dst_sse41_8bit+0x27>
.byte 102,66,15,110,76,130,8 // movd 0x8(%rdx,%r8,4),%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
.byte 243,66,15,126,20,130 // movq (%rdx,%r8,4),%xmm2
.byte 102,15,58,14,202,15 // pblendw $0xf,%xmm2,%xmm1
- .byte 235,200 // jmp 244 <_sk_load_8888_dst_sse41_8bit+0x27>
+ .byte 235,200 // jmp 1fb <_sk_load_8888_dst_sse41_8bit+0x27>
.byte 102,66,15,110,12,130 // movd (%rdx,%r8,4),%xmm1
- .byte 235,192 // jmp 244 <_sk_load_8888_dst_sse41_8bit+0x27>
+ .byte 235,192 // jmp 1fb <_sk_load_8888_dst_sse41_8bit+0x27>
HIDDEN _sk_store_8888_sse41_8bit
.globl _sk_store_8888_sse41_8bit
@@ -52534,22 +52499,22 @@ _sk_store_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 2af <_sk_store_8888_sse41_8bit+0x2b>
+ .byte 117,10 // jne 266 <_sk_store_8888_sse41_8bit+0x2b>
.byte 243,66,15,127,4,130 // movdqu %xmm0,(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,29 // je 2d6 <_sk_store_8888_sse41_8bit+0x52>
+ .byte 116,29 // je 28d <_sk_store_8888_sse41_8bit+0x52>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 2ce <_sk_store_8888_sse41_8bit+0x4a>
+ .byte 116,15 // je 285 <_sk_store_8888_sse41_8bit+0x4a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,230 // jne 2ab <_sk_store_8888_sse41_8bit+0x27>
+ .byte 117,230 // jne 262 <_sk_store_8888_sse41_8bit+0x27>
.byte 102,66,15,58,22,68,130,8,2 // pextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
.byte 102,66,15,214,4,130 // movq %xmm0,(%rdx,%r8,4)
- .byte 235,213 // jmp 2ab <_sk_store_8888_sse41_8bit+0x27>
+ .byte 235,213 // jmp 262 <_sk_store_8888_sse41_8bit+0x27>
.byte 102,66,15,126,4,130 // movd %xmm0,(%rdx,%r8,4)
- .byte 235,205 // jmp 2ab <_sk_store_8888_sse41_8bit+0x27>
+ .byte 235,205 // jmp 262 <_sk_store_8888_sse41_8bit+0x27>
HIDDEN _sk_load_bgra_sse41_8bit
.globl _sk_load_bgra_sse41_8bit
@@ -52564,26 +52529,26 @@ _sk_load_bgra_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,19 // jne 312 <_sk_load_bgra_sse41_8bit+0x34>
+ .byte 117,19 // jne 2c9 <_sk_load_bgra_sse41_8bit+0x34>
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
- .byte 102,15,56,0,5,66,13,0,0 // pshufb 0xd42(%rip),%xmm0 # 1050 <_sk_xor__sse41_8bit+0x11a>
+ .byte 102,15,56,0,5,59,13,0,0 // pshufb 0xd3b(%rip),%xmm0 # 1000 <_sk_xor__sse41_8bit+0x113>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,42 // je 346 <_sk_load_bgra_sse41_8bit+0x68>
+ .byte 116,42 // je 2fd <_sk_load_bgra_sse41_8bit+0x68>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 338 <_sk_load_bgra_sse41_8bit+0x5a>
+ .byte 116,18 // je 2ef <_sk_load_bgra_sse41_8bit+0x5a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,217 // jne 305 <_sk_load_bgra_sse41_8bit+0x27>
+ .byte 117,217 // jne 2bc <_sk_load_bgra_sse41_8bit+0x27>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,20,130 // movq (%rdx,%r8,4),%xmm2
.byte 102,15,58,14,194,15 // pblendw $0xf,%xmm2,%xmm0
- .byte 235,191 // jmp 305 <_sk_load_bgra_sse41_8bit+0x27>
+ .byte 235,191 // jmp 2bc <_sk_load_bgra_sse41_8bit+0x27>
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,183 // jmp 305 <_sk_load_bgra_sse41_8bit+0x27>
+ .byte 235,183 // jmp 2bc <_sk_load_bgra_sse41_8bit+0x27>
HIDDEN _sk_load_bgra_dst_sse41_8bit
.globl _sk_load_bgra_dst_sse41_8bit
@@ -52598,26 +52563,26 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,19 // jne 382 <_sk_load_bgra_dst_sse41_8bit+0x34>
+ .byte 117,19 // jne 339 <_sk_load_bgra_dst_sse41_8bit+0x34>
.byte 243,66,15,111,12,130 // movdqu (%rdx,%r8,4),%xmm1
- .byte 102,15,56,0,13,226,12,0,0 // pshufb 0xce2(%rip),%xmm1 # 1060 <_sk_xor__sse41_8bit+0x12a>
+ .byte 102,15,56,0,13,219,12,0,0 // pshufb 0xcdb(%rip),%xmm1 # 1010 <_sk_xor__sse41_8bit+0x123>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,42 // je 3b6 <_sk_load_bgra_dst_sse41_8bit+0x68>
+ .byte 116,42 // je 36d <_sk_load_bgra_dst_sse41_8bit+0x68>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 3a8 <_sk_load_bgra_dst_sse41_8bit+0x5a>
+ .byte 116,18 // je 35f <_sk_load_bgra_dst_sse41_8bit+0x5a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,217 // jne 375 <_sk_load_bgra_dst_sse41_8bit+0x27>
+ .byte 117,217 // jne 32c <_sk_load_bgra_dst_sse41_8bit+0x27>
.byte 102,66,15,110,76,130,8 // movd 0x8(%rdx,%r8,4),%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
.byte 243,66,15,126,20,130 // movq (%rdx,%r8,4),%xmm2
.byte 102,15,58,14,202,15 // pblendw $0xf,%xmm2,%xmm1
- .byte 235,191 // jmp 375 <_sk_load_bgra_dst_sse41_8bit+0x27>
+ .byte 235,191 // jmp 32c <_sk_load_bgra_dst_sse41_8bit+0x27>
.byte 102,66,15,110,12,130 // movd (%rdx,%r8,4),%xmm1
- .byte 235,183 // jmp 375 <_sk_load_bgra_dst_sse41_8bit+0x27>
+ .byte 235,183 // jmp 32c <_sk_load_bgra_dst_sse41_8bit+0x27>
HIDDEN _sk_store_bgra_sse41_8bit
.globl _sk_store_bgra_sse41_8bit
@@ -52632,24 +52597,24 @@ _sk_store_bgra_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,56,0,21,137,12,0,0 // pshufb 0xc89(%rip),%xmm2 # 1070 <_sk_xor__sse41_8bit+0x13a>
+ .byte 102,15,56,0,21,130,12,0,0 // pshufb 0xc82(%rip),%xmm2 # 1020 <_sk_xor__sse41_8bit+0x133>
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 3f6 <_sk_store_bgra_sse41_8bit+0x38>
+ .byte 117,10 // jne 3ad <_sk_store_bgra_sse41_8bit+0x38>
.byte 243,66,15,127,20,130 // movdqu %xmm2,(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,29 // je 41d <_sk_store_bgra_sse41_8bit+0x5f>
+ .byte 116,29 // je 3d4 <_sk_store_bgra_sse41_8bit+0x5f>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 415 <_sk_store_bgra_sse41_8bit+0x57>
+ .byte 116,15 // je 3cc <_sk_store_bgra_sse41_8bit+0x57>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,230 // jne 3f2 <_sk_store_bgra_sse41_8bit+0x34>
+ .byte 117,230 // jne 3a9 <_sk_store_bgra_sse41_8bit+0x34>
.byte 102,66,15,58,22,84,130,8,2 // pextrd $0x2,%xmm2,0x8(%rdx,%r8,4)
.byte 102,66,15,214,20,130 // movq %xmm2,(%rdx,%r8,4)
- .byte 235,213 // jmp 3f2 <_sk_store_bgra_sse41_8bit+0x34>
+ .byte 235,213 // jmp 3a9 <_sk_store_bgra_sse41_8bit+0x34>
.byte 102,66,15,126,20,130 // movd %xmm2,(%rdx,%r8,4)
- .byte 235,205 // jmp 3f2 <_sk_store_bgra_sse41_8bit+0x34>
+ .byte 235,205 // jmp 3a9 <_sk_store_bgra_sse41_8bit+0x34>
HIDDEN _sk_load_a8_sse41_8bit
.globl _sk_load_a8_sse41_8bit
@@ -52663,19 +52628,19 @@ _sk_load_a8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 452 <_sk_load_a8_sse41_8bit+0x2d>
+ .byte 117,16 // jne 409 <_sk_load_a8_sse41_8bit+0x2d>
.byte 102,66,15,56,49,4,2 // pmovzxbd (%rdx,%r8,1),%xmm0
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 491 <_sk_load_a8_sse41_8bit+0x6c>
+ .byte 116,53 // je 448 <_sk_load_a8_sse41_8bit+0x6c>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 47b <_sk_load_a8_sse41_8bit+0x56>
+ .byte 116,21 // je 432 <_sk_load_a8_sse41_8bit+0x56>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 449 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 117,221 // jne 400 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -52683,10 +52648,10 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,49,210 // pmovzxbd %xmm2,%xmm2
.byte 102,15,58,14,194,15 // pblendw $0xf,%xmm2,%xmm0
- .byte 235,184 // jmp 449 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,184 // jmp 400 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,173 // jmp 449 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,173 // jmp 400 <_sk_load_a8_sse41_8bit+0x24>
HIDDEN _sk_load_a8_dst_sse41_8bit
.globl _sk_load_a8_dst_sse41_8bit
@@ -52700,19 +52665,19 @@ _sk_load_a8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 4c9 <_sk_load_a8_dst_sse41_8bit+0x2d>
+ .byte 117,16 // jne 480 <_sk_load_a8_dst_sse41_8bit+0x2d>
.byte 102,66,15,56,49,12,2 // pmovzxbd (%rdx,%r8,1),%xmm1
.byte 102,15,114,241,24 // pslld $0x18,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 508 <_sk_load_a8_dst_sse41_8bit+0x6c>
+ .byte 116,53 // je 4bf <_sk_load_a8_dst_sse41_8bit+0x6c>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 4f2 <_sk_load_a8_dst_sse41_8bit+0x56>
+ .byte 116,21 // je 4a9 <_sk_load_a8_dst_sse41_8bit+0x56>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 4c0 <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 117,221 // jne 477 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
@@ -52720,10 +52685,10 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,49,210 // pmovzxbd %xmm2,%xmm2
.byte 102,15,58,14,202,15 // pblendw $0xf,%xmm2,%xmm1
- .byte 235,184 // jmp 4c0 <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,184 // jmp 477 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,173 // jmp 4c0 <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,173 // jmp 477 <_sk_load_a8_dst_sse41_8bit+0x24>
HIDDEN _sk_store_a8_sse41_8bit
.globl _sk_store_a8_sse41_8bit
@@ -52739,24 +52704,24 @@ _sk_store_a8_sse41_8bit:
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,114,210,24 // psrld $0x18,%xmm2
.byte 77,133,201 // test %r9,%r9
- .byte 117,19 // jne 54c <_sk_store_a8_sse41_8bit+0x39>
- .byte 102,15,56,0,21,78,11,0,0 // pshufb 0xb4e(%rip),%xmm2 # 1090 <_sk_xor__sse41_8bit+0x15a>
+ .byte 117,19 // jne 503 <_sk_store_a8_sse41_8bit+0x39>
+ .byte 102,15,56,0,21,71,11,0,0 // pshufb 0xb47(%rip),%xmm2 # 1040 <_sk_xor__sse41_8bit+0x153>
.byte 102,66,15,126,20,2 // movd %xmm2,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,40 // je 57e <_sk_store_a8_sse41_8bit+0x6b>
+ .byte 116,40 // je 535 <_sk_store_a8_sse41_8bit+0x6b>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 56b <_sk_store_a8_sse41_8bit+0x58>
+ .byte 116,15 // je 522 <_sk_store_a8_sse41_8bit+0x58>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,230 // jne 548 <_sk_store_a8_sse41_8bit+0x35>
+ .byte 117,230 // jne 4ff <_sk_store_a8_sse41_8bit+0x35>
.byte 102,66,15,58,20,84,2,2,8 // pextrb $0x8,%xmm2,0x2(%rdx,%r8,1)
- .byte 102,15,56,0,21,12,11,0,0 // pshufb 0xb0c(%rip),%xmm2 # 1080 <_sk_xor__sse41_8bit+0x14a>
+ .byte 102,15,56,0,21,5,11,0,0 // pshufb 0xb05(%rip),%xmm2 # 1030 <_sk_xor__sse41_8bit+0x143>
.byte 102,66,15,58,21,20,2,0 // pextrw $0x0,%xmm2,(%rdx,%r8,1)
- .byte 235,202 // jmp 548 <_sk_store_a8_sse41_8bit+0x35>
+ .byte 235,202 // jmp 4ff <_sk_store_a8_sse41_8bit+0x35>
.byte 102,66,15,58,20,20,2,0 // pextrb $0x0,%xmm2,(%rdx,%r8,1)
- .byte 235,192 // jmp 548 <_sk_store_a8_sse41_8bit+0x35>
+ .byte 235,192 // jmp 4ff <_sk_store_a8_sse41_8bit+0x35>
HIDDEN _sk_load_g8_sse41_8bit
.globl _sk_load_g8_sse41_8bit
@@ -52770,21 +52735,21 @@ _sk_load_g8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,36 // jne 5c9 <_sk_load_g8_sse41_8bit+0x41>
+ .byte 117,36 // jne 580 <_sk_load_g8_sse41_8bit+0x41>
.byte 102,66,15,56,49,4,2 // pmovzxbd (%rdx,%r8,1),%xmm0
- .byte 102,15,219,5,236,10,0,0 // pand 0xaec(%rip),%xmm0 # 10a0 <_sk_xor__sse41_8bit+0x16a>
- .byte 102,15,56,64,5,243,10,0,0 // pmulld 0xaf3(%rip),%xmm0 # 10b0 <_sk_xor__sse41_8bit+0x17a>
- .byte 102,15,235,5,251,10,0,0 // por 0xafb(%rip),%xmm0 # 10c0 <_sk_xor__sse41_8bit+0x18a>
+ .byte 102,15,219,5,229,10,0,0 // pand 0xae5(%rip),%xmm0 # 1050 <_sk_xor__sse41_8bit+0x163>
+ .byte 102,15,56,64,5,236,10,0,0 // pmulld 0xaec(%rip),%xmm0 # 1060 <_sk_xor__sse41_8bit+0x173>
+ .byte 102,15,235,5,244,10,0,0 // por 0xaf4(%rip),%xmm0 # 1070 <_sk_xor__sse41_8bit+0x183>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 608 <_sk_load_g8_sse41_8bit+0x80>
+ .byte 116,53 // je 5bf <_sk_load_g8_sse41_8bit+0x80>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 5f2 <_sk_load_g8_sse41_8bit+0x6a>
+ .byte 116,21 // je 5a9 <_sk_load_g8_sse41_8bit+0x6a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,201 // jne 5ac <_sk_load_g8_sse41_8bit+0x24>
+ .byte 117,201 // jne 563 <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -52792,10 +52757,10 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,49,210 // pmovzxbd %xmm2,%xmm2
.byte 102,15,58,14,194,15 // pblendw $0xf,%xmm2,%xmm0
- .byte 235,164 // jmp 5ac <_sk_load_g8_sse41_8bit+0x24>
+ .byte 235,164 // jmp 563 <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,153 // jmp 5ac <_sk_load_g8_sse41_8bit+0x24>
+ .byte 235,153 // jmp 563 <_sk_load_g8_sse41_8bit+0x24>
HIDDEN _sk_load_g8_dst_sse41_8bit
.globl _sk_load_g8_dst_sse41_8bit
@@ -52809,21 +52774,21 @@ _sk_load_g8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,36 // jne 654 <_sk_load_g8_dst_sse41_8bit+0x41>
+ .byte 117,36 // jne 60b <_sk_load_g8_dst_sse41_8bit+0x41>
.byte 102,66,15,56,49,12,2 // pmovzxbd (%rdx,%r8,1),%xmm1
- .byte 102,15,219,13,145,10,0,0 // pand 0xa91(%rip),%xmm1 # 10d0 <_sk_xor__sse41_8bit+0x19a>
- .byte 102,15,56,64,13,152,10,0,0 // pmulld 0xa98(%rip),%xmm1 # 10e0 <_sk_xor__sse41_8bit+0x1aa>
- .byte 102,15,235,13,160,10,0,0 // por 0xaa0(%rip),%xmm1 # 10f0 <_sk_xor__sse41_8bit+0x1ba>
+ .byte 102,15,219,13,138,10,0,0 // pand 0xa8a(%rip),%xmm1 # 1080 <_sk_xor__sse41_8bit+0x193>
+ .byte 102,15,56,64,13,145,10,0,0 // pmulld 0xa91(%rip),%xmm1 # 1090 <_sk_xor__sse41_8bit+0x1a3>
+ .byte 102,15,235,13,153,10,0,0 // por 0xa99(%rip),%xmm1 # 10a0 <_sk_xor__sse41_8bit+0x1b3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 693 <_sk_load_g8_dst_sse41_8bit+0x80>
+ .byte 116,53 // je 64a <_sk_load_g8_dst_sse41_8bit+0x80>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 67d <_sk_load_g8_dst_sse41_8bit+0x6a>
+ .byte 116,21 // je 634 <_sk_load_g8_dst_sse41_8bit+0x6a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,201 // jne 637 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 117,201 // jne 5ee <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
@@ -52831,10 +52796,10 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,49,210 // pmovzxbd %xmm2,%xmm2
.byte 102,15,58,14,202,15 // pblendw $0xf,%xmm2,%xmm1
- .byte 235,164 // jmp 637 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 235,164 // jmp 5ee <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,153 // jmp 637 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 235,153 // jmp 5ee <_sk_load_g8_dst_sse41_8bit+0x24>
HIDDEN _sk_srcover_rgba_8888_sse41_8bit
.globl _sk_srcover_rgba_8888_sse41_8bit
@@ -52849,11 +52814,11 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,106 // jne 729 <_sk_srcover_rgba_8888_sse41_8bit+0x8b>
+ .byte 117,106 // jne 6e0 <_sk_srcover_rgba_8888_sse41_8bit+0x8b>
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
.byte 77,133,201 // test %r9,%r9
.byte 102,15,111,216 // movdqa %xmm0,%xmm3
- .byte 102,15,56,0,29,43,10,0,0 // pshufb 0xa2b(%rip),%xmm3 # 1100 <_sk_xor__sse41_8bit+0x1ca>
+ .byte 102,15,56,0,29,36,10,0,0 // pshufb 0xa24(%rip),%xmm3 # 10b0 <_sk_xor__sse41_8bit+0x1c3>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,104,236 // punpckhbw %xmm4,%xmm5
@@ -52864,44 +52829,44 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,15,213,254 // pmullw %xmm6,%xmm7
.byte 102,15,253,221 // paddw %xmm5,%xmm3
.byte 102,15,253,254 // paddw %xmm6,%xmm7
- .byte 102,15,111,37,9,10,0,0 // movdqa 0xa09(%rip),%xmm4 # 1110 <_sk_xor__sse41_8bit+0x1da>
+ .byte 102,15,111,37,2,10,0,0 // movdqa 0xa02(%rip),%xmm4 # 10c0 <_sk_xor__sse41_8bit+0x1d3>
.byte 102,15,56,0,220 // pshufb %xmm4,%xmm3
.byte 102,15,56,0,252 // pshufb %xmm4,%xmm7
.byte 102,15,108,251 // punpcklqdq %xmm3,%xmm7
.byte 102,15,248,215 // psubb %xmm7,%xmm2
.byte 102,15,252,208 // paddb %xmm0,%xmm2
- .byte 117,60 // jne 75b <_sk_srcover_rgba_8888_sse41_8bit+0xbd>
+ .byte 117,60 // jne 712 <_sk_srcover_rgba_8888_sse41_8bit+0xbd>
.byte 243,66,15,127,20,130 // movdqu %xmm2,(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 68,137,200 // mov %r9d,%eax
.byte 36,3 // and $0x3,%al
.byte 60,1 // cmp $0x1,%al
- .byte 116,80 // je 782 <_sk_srcover_rgba_8888_sse41_8bit+0xe4>
+ .byte 116,80 // je 739 <_sk_srcover_rgba_8888_sse41_8bit+0xe4>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 60,2 // cmp $0x2,%al
- .byte 116,16 // je 74a <_sk_srcover_rgba_8888_sse41_8bit+0xac>
+ .byte 116,16 // je 701 <_sk_srcover_rgba_8888_sse41_8bit+0xac>
.byte 60,3 // cmp $0x3,%al
- .byte 117,135 // jne 6c5 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ .byte 117,135 // jne 67c <_sk_srcover_rgba_8888_sse41_8bit+0x27>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,66,15,126,28,130 // movq (%rdx,%r8,4),%xmm3
.byte 102,15,58,14,211,15 // pblendw $0xf,%xmm3,%xmm2
- .byte 233,106,255,255,255 // jmpq 6c5 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ .byte 233,106,255,255,255 // jmpq 67c <_sk_srcover_rgba_8888_sse41_8bit+0x27>
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,40 // je 78d <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 116,40 // je 744 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 77a <_sk_srcover_rgba_8888_sse41_8bit+0xdc>
+ .byte 116,15 // je 731 <_sk_srcover_rgba_8888_sse41_8bit+0xdc>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,180 // jne 725 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
+ .byte 117,180 // jne 6dc <_sk_srcover_rgba_8888_sse41_8bit+0x87>
.byte 102,66,15,58,22,84,130,8,2 // pextrd $0x2,%xmm2,0x8(%rdx,%r8,4)
.byte 102,66,15,214,20,130 // movq %xmm2,(%rdx,%r8,4)
- .byte 235,163 // jmp 725 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
+ .byte 235,163 // jmp 6dc <_sk_srcover_rgba_8888_sse41_8bit+0x87>
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 233,56,255,255,255 // jmpq 6c5 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ .byte 233,56,255,255,255 // jmpq 67c <_sk_srcover_rgba_8888_sse41_8bit+0x27>
.byte 102,66,15,126,20,130 // movd %xmm2,(%rdx,%r8,4)
- .byte 235,144 // jmp 725 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
+ .byte 235,144 // jmp 6dc <_sk_srcover_rgba_8888_sse41_8bit+0x87>
HIDDEN _sk_scale_1_float_sse41_8bit
.globl _sk_scale_1_float_sse41_8bit
@@ -52909,19 +52874,19 @@ FUNCTION(_sk_scale_1_float_sse41_8bit)
_sk_scale_1_float_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,16 // movss (%rax),%xmm2
- .byte 243,15,89,21,73,8,0,0 // mulss 0x849(%rip),%xmm2 # fec <_sk_xor__sse41_8bit+0xb6>
+ .byte 243,15,89,21,70,8,0,0 // mulss 0x846(%rip),%xmm2 # fa0 <_sk_xor__sse41_8bit+0xb3>
.byte 243,15,44,194 // cvttss2si %xmm2,%eax
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 102,15,56,48,224 // pmovzxbw %xmm0,%xmm4
.byte 102,15,104,194 // punpckhbw %xmm2,%xmm0
- .byte 102,15,56,0,29,96,9,0,0 // pshufb 0x960(%rip),%xmm3 # 1120 <_sk_xor__sse41_8bit+0x1ea>
+ .byte 102,15,56,0,29,89,9,0,0 // pshufb 0x959(%rip),%xmm3 # 10d0 <_sk_xor__sse41_8bit+0x1e3>
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
.byte 102,15,213,212 // pmullw %xmm4,%xmm2
.byte 102,15,213,216 // pmullw %xmm0,%xmm3
.byte 102,15,253,216 // paddw %xmm0,%xmm3
.byte 102,15,253,212 // paddw %xmm4,%xmm2
- .byte 102,15,111,5,84,9,0,0 // movdqa 0x954(%rip),%xmm0 # 1130 <_sk_xor__sse41_8bit+0x1fa>
+ .byte 102,15,111,5,77,9,0,0 // movdqa 0x94d(%rip),%xmm0 # 10e0 <_sk_xor__sse41_8bit+0x1f3>
.byte 102,15,56,0,216 // pshufb %xmm0,%xmm3
.byte 102,15,56,0,208 // pshufb %xmm0,%xmm2
.byte 102,15,108,211 // punpcklqdq %xmm3,%xmm2
@@ -52941,10 +52906,10 @@ _sk_scale_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,84 // jne 863 <_sk_scale_u8_sse41_8bit+0x71>
+ .byte 117,84 // jne 81a <_sk_scale_u8_sse41_8bit+0x71>
.byte 102,66,15,56,49,28,2 // pmovzxbd (%rdx,%r8,1),%xmm3
.byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 102,15,56,0,29,29,9,0,0 // pshufb 0x91d(%rip),%xmm3 # 1140 <_sk_xor__sse41_8bit+0x20a>
+ .byte 102,15,56,0,29,22,9,0,0 // pshufb 0x916(%rip),%xmm3 # 10f0 <_sk_xor__sse41_8bit+0x203>
.byte 102,15,56,48,232 // pmovzxbw %xmm0,%xmm5
.byte 102,15,104,196 // punpckhbw %xmm4,%xmm0
.byte 102,15,56,48,211 // pmovzxbw %xmm3,%xmm2
@@ -52953,7 +52918,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,213,213 // pmullw %xmm5,%xmm2
.byte 102,15,253,216 // paddw %xmm0,%xmm3
.byte 102,15,253,213 // paddw %xmm5,%xmm2
- .byte 102,15,111,5,3,9,0,0 // movdqa 0x903(%rip),%xmm0 # 1150 <_sk_xor__sse41_8bit+0x21a>
+ .byte 102,15,111,5,252,8,0,0 // movdqa 0x8fc(%rip),%xmm0 # 1100 <_sk_xor__sse41_8bit+0x213>
.byte 102,15,56,0,216 // pshufb %xmm0,%xmm3
.byte 102,15,56,0,208 // pshufb %xmm0,%xmm2
.byte 102,15,108,211 // punpcklqdq %xmm3,%xmm2
@@ -52962,12 +52927,12 @@ _sk_scale_u8_sse41_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,56 // je 8a5 <_sk_scale_u8_sse41_8bit+0xb3>
+ .byte 116,56 // je 85c <_sk_scale_u8_sse41_8bit+0xb3>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 88c <_sk_scale_u8_sse41_8bit+0x9a>
+ .byte 116,21 // je 843 <_sk_scale_u8_sse41_8bit+0x9a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,153 // jne 816 <_sk_scale_u8_sse41_8bit+0x24>
+ .byte 117,153 // jne 7cd <_sk_scale_u8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
@@ -52975,10 +52940,10 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,49,210 // pmovzxbd %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,113,255,255,255 // jmpq 816 <_sk_scale_u8_sse41_8bit+0x24>
+ .byte 233,113,255,255,255 // jmpq 7cd <_sk_scale_u8_sse41_8bit+0x24>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,99,255,255,255 // jmpq 816 <_sk_scale_u8_sse41_8bit+0x24>
+ .byte 233,99,255,255,255 // jmpq 7cd <_sk_scale_u8_sse41_8bit+0x24>
HIDDEN _sk_lerp_1_float_sse41_8bit
.globl _sk_lerp_1_float_sse41_8bit
@@ -52986,21 +52951,21 @@ FUNCTION(_sk_lerp_1_float_sse41_8bit)
_sk_lerp_1_float_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,16 // movss (%rax),%xmm2
- .byte 243,15,89,21,47,7,0,0 // mulss 0x72f(%rip),%xmm2 # ff0 <_sk_xor__sse41_8bit+0xba>
+ .byte 243,15,89,21,44,7,0,0 // mulss 0x72c(%rip),%xmm2 # fa4 <_sk_xor__sse41_8bit+0xb7>
.byte 243,15,44,194 // cvttss2si %xmm2,%eax
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,0,220 // pshufb %xmm4,%xmm3
.byte 102,15,56,48,232 // pmovzxbw %xmm0,%xmm5
.byte 102,15,104,196 // punpckhbw %xmm4,%xmm0
- .byte 102,15,111,21,125,8,0,0 // movdqa 0x87d(%rip),%xmm2 # 1160 <_sk_xor__sse41_8bit+0x22a>
+ .byte 102,15,111,21,118,8,0,0 // movdqa 0x876(%rip),%xmm2 # 1110 <_sk_xor__sse41_8bit+0x223>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
.byte 102,15,213,240 // pmullw %xmm0,%xmm6
.byte 102,15,213,213 // pmullw %xmm5,%xmm2
.byte 102,15,253,240 // paddw %xmm0,%xmm6
.byte 102,15,253,213 // paddw %xmm5,%xmm2
- .byte 102,15,111,45,109,8,0,0 // movdqa 0x86d(%rip),%xmm5 # 1170 <_sk_xor__sse41_8bit+0x23a>
+ .byte 102,15,111,45,102,8,0,0 // movdqa 0x866(%rip),%xmm5 # 1120 <_sk_xor__sse41_8bit+0x233>
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,56,0,213 // pshufb %xmm5,%xmm2
.byte 102,15,108,214 // punpcklqdq %xmm6,%xmm2
@@ -53034,10 +52999,10 @@ _sk_lerp_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,148,0,0,0 // jne a0a <_sk_lerp_u8_sse41_8bit+0xb5>
+ .byte 15,133,148,0,0,0 // jne 9c1 <_sk_lerp_u8_sse41_8bit+0xb5>
.byte 102,66,15,56,49,20,2 // pmovzxbd (%rdx,%r8,1),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 102,15,56,0,21,246,7,0,0 // pshufb 0x7f6(%rip),%xmm2 # 1180 <_sk_xor__sse41_8bit+0x24a>
+ .byte 102,15,56,0,21,239,7,0,0 // pshufb 0x7ef(%rip),%xmm2 # 1130 <_sk_xor__sse41_8bit+0x243>
.byte 102,15,56,48,232 // pmovzxbw %xmm0,%xmm5
.byte 102,15,104,196 // punpckhbw %xmm4,%xmm0
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -53047,7 +53012,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,213,221 // pmullw %xmm5,%xmm3
.byte 102,15,253,240 // paddw %xmm0,%xmm6
.byte 102,15,253,221 // paddw %xmm5,%xmm3
- .byte 102,15,111,45,216,7,0,0 // movdqa 0x7d8(%rip),%xmm5 # 1190 <_sk_xor__sse41_8bit+0x25a>
+ .byte 102,15,111,45,209,7,0,0 // movdqa 0x7d1(%rip),%xmm5 # 1140 <_sk_xor__sse41_8bit+0x253>
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,56,0,221 // pshufb %xmm5,%xmm3
.byte 102,15,108,222 // punpcklqdq %xmm6,%xmm3
@@ -53070,12 +53035,12 @@ _sk_lerp_u8_sse41_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,60 // je a50 <_sk_lerp_u8_sse41_8bit+0xfb>
+ .byte 116,60 // je a07 <_sk_lerp_u8_sse41_8bit+0xfb>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,25 // je a37 <_sk_lerp_u8_sse41_8bit+0xe2>
+ .byte 116,25 // je 9ee <_sk_lerp_u8_sse41_8bit+0xe2>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,85,255,255,255 // jne 97d <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 15,133,85,255,255,255 // jne 934 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
@@ -53083,10 +53048,10 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,56,49,219 // pmovzxbd %xmm3,%xmm3
.byte 102,15,58,14,211,15 // pblendw $0xf,%xmm3,%xmm2
- .byte 233,45,255,255,255 // jmpq 97d <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,45,255,255,255 // jmpq 934 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,31,255,255,255 // jmpq 97d <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,31,255,255,255 // jmpq 934 <_sk_lerp_u8_sse41_8bit+0x28>
HIDDEN _sk_move_src_dst_sse41_8bit
.globl _sk_move_src_dst_sse41_8bit
@@ -53109,7 +53074,7 @@ HIDDEN _sk_black_color_sse41_8bit
FUNCTION(_sk_black_color_sse41_8bit)
_sk_black_color_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,43,7,0,0 // movaps 0x72b(%rip),%xmm0 # 11a0 <_sk_xor__sse41_8bit+0x26a>
+ .byte 15,40,5,36,7,0,0 // movaps 0x724(%rip),%xmm0 # 1150 <_sk_xor__sse41_8bit+0x263>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_white_color_sse41_8bit
@@ -53132,7 +53097,7 @@ HIDDEN _sk_srcatop_sse41_8bit
.globl _sk_srcatop_sse41_8bit
FUNCTION(_sk_srcatop_sse41_8bit)
_sk_srcatop_sse41_8bit:
- .byte 102,68,15,111,5,33,7,0,0 // movdqa 0x721(%rip),%xmm8 # 11b0 <_sk_xor__sse41_8bit+0x27a>
+ .byte 102,68,15,111,5,26,7,0,0 // movdqa 0x71a(%rip),%xmm8 # 1160 <_sk_xor__sse41_8bit+0x273>
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
.byte 102,15,56,48,225 // pmovzxbw %xmm1,%xmm4
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
@@ -53147,7 +53112,7 @@ _sk_srcatop_sse41_8bit:
.byte 102,15,56,48,248 // pmovzxbw %xmm0,%xmm7
.byte 102,15,213,215 // pmullw %xmm7,%xmm2
.byte 102,15,253,215 // paddw %xmm7,%xmm2
- .byte 102,15,111,61,236,6,0,0 // movdqa 0x6ec(%rip),%xmm7 # 11c0 <_sk_xor__sse41_8bit+0x28a>
+ .byte 102,15,111,61,229,6,0,0 // movdqa 0x6e5(%rip),%xmm7 # 1170 <_sk_xor__sse41_8bit+0x283>
.byte 102,15,56,0,239 // pshufb %xmm7,%xmm5
.byte 102,15,56,0,215 // pshufb %xmm7,%xmm2
.byte 102,15,108,213 // punpcklqdq %xmm5,%xmm2
@@ -53172,7 +53137,7 @@ HIDDEN _sk_dstatop_sse41_8bit
.globl _sk_dstatop_sse41_8bit
FUNCTION(_sk_dstatop_sse41_8bit)
_sk_dstatop_sse41_8bit:
- .byte 102,15,111,21,165,6,0,0 // movdqa 0x6a5(%rip),%xmm2 # 11d0 <_sk_xor__sse41_8bit+0x29a>
+ .byte 102,15,111,21,158,6,0,0 // movdqa 0x69e(%rip),%xmm2 # 1180 <_sk_xor__sse41_8bit+0x293>
.byte 102,15,111,216 // movdqa %xmm0,%xmm3
.byte 102,15,56,0,218 // pshufb %xmm2,%xmm3
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -53186,7 +53151,7 @@ _sk_dstatop_sse41_8bit:
.byte 102,15,253,223 // paddw %xmm7,%xmm3
.byte 102,15,213,229 // pmullw %xmm5,%xmm4
.byte 102,15,253,229 // paddw %xmm5,%xmm4
- .byte 102,15,111,45,115,6,0,0 // movdqa 0x673(%rip),%xmm5 # 11e0 <_sk_xor__sse41_8bit+0x2aa>
+ .byte 102,15,111,45,108,6,0,0 // movdqa 0x66c(%rip),%xmm5 # 1190 <_sk_xor__sse41_8bit+0x2a3>
.byte 102,15,56,0,221 // pshufb %xmm5,%xmm3
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,15,108,227 // punpcklqdq %xmm3,%xmm4
@@ -53214,7 +53179,7 @@ HIDDEN _sk_srcin_sse41_8bit
FUNCTION(_sk_srcin_sse41_8bit)
_sk_srcin_sse41_8bit:
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
- .byte 102,15,56,0,29,29,6,0,0 // pshufb 0x61d(%rip),%xmm3 # 11f0 <_sk_xor__sse41_8bit+0x2ba>
+ .byte 102,15,56,0,29,22,6,0,0 // pshufb 0x616(%rip),%xmm3 # 11a0 <_sk_xor__sse41_8bit+0x2b3>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,48,232 // pmovzxbw %xmm0,%xmm5
.byte 102,15,104,196 // punpckhbw %xmm4,%xmm0
@@ -53224,7 +53189,7 @@ _sk_srcin_sse41_8bit:
.byte 102,15,213,213 // pmullw %xmm5,%xmm2
.byte 102,15,253,216 // paddw %xmm0,%xmm3
.byte 102,15,253,213 // paddw %xmm5,%xmm2
- .byte 102,15,111,5,255,5,0,0 // movdqa 0x5ff(%rip),%xmm0 # 1200 <_sk_xor__sse41_8bit+0x2ca>
+ .byte 102,15,111,5,248,5,0,0 // movdqa 0x5f8(%rip),%xmm0 # 11b0 <_sk_xor__sse41_8bit+0x2c3>
.byte 102,15,56,0,216 // pshufb %xmm0,%xmm3
.byte 102,15,56,0,208 // pshufb %xmm0,%xmm2
.byte 102,15,108,211 // punpcklqdq %xmm3,%xmm2
@@ -53236,7 +53201,7 @@ HIDDEN _sk_dstin_sse41_8bit
.globl _sk_dstin_sse41_8bit
FUNCTION(_sk_dstin_sse41_8bit)
_sk_dstin_sse41_8bit:
- .byte 102,15,56,0,5,240,5,0,0 // pshufb 0x5f0(%rip),%xmm0 # 1210 <_sk_xor__sse41_8bit+0x2da>
+ .byte 102,15,56,0,5,233,5,0,0 // pshufb 0x5e9(%rip),%xmm0 # 11c0 <_sk_xor__sse41_8bit+0x2d3>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,56,48,225 // pmovzxbw %xmm1,%xmm4
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
@@ -53247,7 +53212,7 @@ _sk_dstin_sse41_8bit:
.byte 102,15,213,212 // pmullw %xmm4,%xmm2
.byte 102,15,253,197 // paddw %xmm5,%xmm0
.byte 102,15,253,212 // paddw %xmm4,%xmm2
- .byte 102,15,111,29,206,5,0,0 // movdqa 0x5ce(%rip),%xmm3 # 1220 <_sk_xor__sse41_8bit+0x2ea>
+ .byte 102,15,111,29,199,5,0,0 // movdqa 0x5c7(%rip),%xmm3 # 11d0 <_sk_xor__sse41_8bit+0x2e3>
.byte 102,15,56,0,195 // pshufb %xmm3,%xmm0
.byte 102,15,56,0,211 // pshufb %xmm3,%xmm2
.byte 102,15,108,208 // punpcklqdq %xmm0,%xmm2
@@ -53260,7 +53225,7 @@ HIDDEN _sk_srcout_sse41_8bit
FUNCTION(_sk_srcout_sse41_8bit)
_sk_srcout_sse41_8bit:
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,56,0,21,187,5,0,0 // pshufb 0x5bb(%rip),%xmm2 # 1230 <_sk_xor__sse41_8bit+0x2fa>
+ .byte 102,15,56,0,21,180,5,0,0 // pshufb 0x5b4(%rip),%xmm2 # 11e0 <_sk_xor__sse41_8bit+0x2f3>
.byte 102,15,118,219 // pcmpeqd %xmm3,%xmm3
.byte 102,15,239,218 // pxor %xmm2,%xmm3
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -53272,7 +53237,7 @@ _sk_srcout_sse41_8bit:
.byte 102,15,213,213 // pmullw %xmm5,%xmm2
.byte 102,15,253,216 // paddw %xmm0,%xmm3
.byte 102,15,253,213 // paddw %xmm5,%xmm2
- .byte 102,15,111,5,149,5,0,0 // movdqa 0x595(%rip),%xmm0 # 1240 <_sk_xor__sse41_8bit+0x30a>
+ .byte 102,15,111,5,142,5,0,0 // movdqa 0x58e(%rip),%xmm0 # 11f0 <_sk_xor__sse41_8bit+0x303>
.byte 102,15,56,0,216 // pshufb %xmm0,%xmm3
.byte 102,15,56,0,208 // pshufb %xmm0,%xmm2
.byte 102,15,108,211 // punpcklqdq %xmm3,%xmm2
@@ -53284,7 +53249,7 @@ HIDDEN _sk_dstout_sse41_8bit
.globl _sk_dstout_sse41_8bit
FUNCTION(_sk_dstout_sse41_8bit)
_sk_dstout_sse41_8bit:
- .byte 102,15,56,0,5,134,5,0,0 // pshufb 0x586(%rip),%xmm0 # 1250 <_sk_xor__sse41_8bit+0x31a>
+ .byte 102,15,56,0,5,127,5,0,0 // pshufb 0x57f(%rip),%xmm0 # 1200 <_sk_xor__sse41_8bit+0x313>
.byte 102,15,118,210 // pcmpeqd %xmm2,%xmm2
.byte 102,15,239,208 // pxor %xmm0,%xmm2
.byte 102,15,239,219 // pxor %xmm3,%xmm3
@@ -53297,7 +53262,7 @@ _sk_dstout_sse41_8bit:
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
.byte 102,15,253,213 // paddw %xmm5,%xmm2
.byte 102,15,253,196 // paddw %xmm4,%xmm0
- .byte 102,15,111,29,92,5,0,0 // movdqa 0x55c(%rip),%xmm3 # 1260 <_sk_xor__sse41_8bit+0x32a>
+ .byte 102,15,111,29,85,5,0,0 // movdqa 0x555(%rip),%xmm3 # 1210 <_sk_xor__sse41_8bit+0x323>
.byte 102,15,56,0,211 // pshufb %xmm3,%xmm2
.byte 102,15,56,0,195 // pshufb %xmm3,%xmm0
.byte 102,15,108,194 // punpcklqdq %xmm2,%xmm0
@@ -53309,7 +53274,7 @@ HIDDEN _sk_srcover_sse41_8bit
FUNCTION(_sk_srcover_sse41_8bit)
_sk_srcover_sse41_8bit:
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,56,0,21,77,5,0,0 // pshufb 0x54d(%rip),%xmm2 # 1270 <_sk_xor__sse41_8bit+0x33a>
+ .byte 102,15,56,0,21,70,5,0,0 // pshufb 0x546(%rip),%xmm2 # 1220 <_sk_xor__sse41_8bit+0x333>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,56,48,225 // pmovzxbw %xmm1,%xmm4
.byte 102,15,252,193 // paddb %xmm1,%xmm0
@@ -53321,7 +53286,7 @@ _sk_srcover_sse41_8bit:
.byte 102,15,213,244 // pmullw %xmm4,%xmm6
.byte 102,15,253,213 // paddw %xmm5,%xmm2
.byte 102,15,253,244 // paddw %xmm4,%xmm6
- .byte 102,15,111,29,39,5,0,0 // movdqa 0x527(%rip),%xmm3 # 1280 <_sk_xor__sse41_8bit+0x34a>
+ .byte 102,15,111,29,32,5,0,0 // movdqa 0x520(%rip),%xmm3 # 1230 <_sk_xor__sse41_8bit+0x343>
.byte 102,15,56,0,211 // pshufb %xmm3,%xmm2
.byte 102,15,56,0,243 // pshufb %xmm3,%xmm6
.byte 102,15,108,242 // punpcklqdq %xmm2,%xmm6
@@ -53337,7 +53302,7 @@ _sk_dstover_sse41_8bit:
.byte 102,15,56,48,216 // pmovzxbw %xmm0,%xmm3
.byte 102,15,252,193 // paddb %xmm1,%xmm0
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
- .byte 102,15,56,0,37,7,5,0,0 // pshufb 0x507(%rip),%xmm4 # 1290 <_sk_xor__sse41_8bit+0x35a>
+ .byte 102,15,56,0,37,0,5,0,0 // pshufb 0x500(%rip),%xmm4 # 1240 <_sk_xor__sse41_8bit+0x353>
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,104,213 // punpckhbw %xmm5,%xmm2
.byte 102,15,56,48,244 // pmovzxbw %xmm4,%xmm6
@@ -53346,7 +53311,7 @@ _sk_dstover_sse41_8bit:
.byte 102,15,213,243 // pmullw %xmm3,%xmm6
.byte 102,15,253,226 // paddw %xmm2,%xmm4
.byte 102,15,253,243 // paddw %xmm3,%xmm6
- .byte 102,15,111,21,238,4,0,0 // movdqa 0x4ee(%rip),%xmm2 # 12a0 <_sk_xor__sse41_8bit+0x36a>
+ .byte 102,15,111,21,231,4,0,0 // movdqa 0x4e7(%rip),%xmm2 # 1250 <_sk_xor__sse41_8bit+0x363>
.byte 102,15,56,0,226 // pshufb %xmm2,%xmm4
.byte 102,15,56,0,242 // pshufb %xmm2,%xmm6
.byte 102,15,108,244 // punpcklqdq %xmm4,%xmm6
@@ -53368,7 +53333,7 @@ _sk_modulate_sse41_8bit:
.byte 102,15,213,212 // pmullw %xmm4,%xmm2
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,212 // paddw %xmm4,%xmm2
- .byte 102,15,111,5,182,4,0,0 // movdqa 0x4b6(%rip),%xmm0 # 12b0 <_sk_xor__sse41_8bit+0x37a>
+ .byte 102,15,111,5,175,4,0,0 // movdqa 0x4af(%rip),%xmm0 # 1260 <_sk_xor__sse41_8bit+0x373>
.byte 102,15,56,0,232 // pshufb %xmm0,%xmm5
.byte 102,15,56,0,208 // pshufb %xmm0,%xmm2
.byte 102,15,108,213 // punpcklqdq %xmm5,%xmm2
@@ -53380,7 +53345,7 @@ HIDDEN _sk_multiply_sse41_8bit
.globl _sk_multiply_sse41_8bit
FUNCTION(_sk_multiply_sse41_8bit)
_sk_multiply_sse41_8bit:
- .byte 102,68,15,111,5,167,4,0,0 // movdqa 0x4a7(%rip),%xmm8 # 12c0 <_sk_xor__sse41_8bit+0x38a>
+ .byte 102,68,15,111,5,160,4,0,0 // movdqa 0x4a0(%rip),%xmm8 # 1270 <_sk_xor__sse41_8bit+0x383>
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,56,48,209 // pmovzxbw %xmm1,%xmm2
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
@@ -53397,7 +53362,7 @@ _sk_multiply_sse41_8bit:
.byte 102,15,213,254 // pmullw %xmm6,%xmm7
.byte 102,15,253,235 // paddw %xmm3,%xmm5
.byte 102,15,253,254 // paddw %xmm6,%xmm7
- .byte 102,68,15,111,29,100,4,0,0 // movdqa 0x464(%rip),%xmm11 # 12d0 <_sk_xor__sse41_8bit+0x39a>
+ .byte 102,68,15,111,29,93,4,0,0 // movdqa 0x45d(%rip),%xmm11 # 1280 <_sk_xor__sse41_8bit+0x393>
.byte 102,65,15,56,0,235 // pshufb %xmm11,%xmm5
.byte 102,65,15,56,0,251 // pshufb %xmm11,%xmm7
.byte 102,15,108,253 // punpcklqdq %xmm5,%xmm7
@@ -53442,7 +53407,7 @@ _sk_screen_sse41_8bit:
.byte 102,15,213,235 // pmullw %xmm3,%xmm5
.byte 102,15,253,235 // paddw %xmm3,%xmm5
.byte 102,15,253,242 // paddw %xmm2,%xmm6
- .byte 102,15,111,21,192,3,0,0 // movdqa 0x3c0(%rip),%xmm2 # 12e0 <_sk_xor__sse41_8bit+0x3aa>
+ .byte 102,15,111,21,185,3,0,0 // movdqa 0x3b9(%rip),%xmm2 # 1290 <_sk_xor__sse41_8bit+0x3a3>
.byte 102,15,56,0,242 // pshufb %xmm2,%xmm6
.byte 102,15,56,0,234 // pshufb %xmm2,%xmm5
.byte 102,15,108,238 // punpcklqdq %xmm6,%xmm5
@@ -53454,7 +53419,7 @@ HIDDEN _sk_xor__sse41_8bit
.globl _sk_xor__sse41_8bit
FUNCTION(_sk_xor__sse41_8bit)
_sk_xor__sse41_8bit:
- .byte 102,68,15,111,5,177,3,0,0 // movdqa 0x3b1(%rip),%xmm8 # 12f0 <_sk_xor__sse41_8bit+0x3ba>
+ .byte 102,68,15,111,5,170,3,0,0 // movdqa 0x3aa(%rip),%xmm8 # 12a0 <_sk_xor__sse41_8bit+0x3b3>
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
.byte 102,15,56,48,225 // pmovzxbw %xmm1,%xmm4
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
@@ -53471,7 +53436,7 @@ _sk_xor__sse41_8bit:
.byte 102,15,56,48,208 // pmovzxbw %xmm0,%xmm2
.byte 102,15,213,242 // pmullw %xmm2,%xmm6
.byte 102,15,253,242 // paddw %xmm2,%xmm6
- .byte 102,68,15,111,21,113,3,0,0 // movdqa 0x371(%rip),%xmm10 # 1300 <_sk_xor__sse41_8bit+0x3ca>
+ .byte 102,68,15,111,21,106,3,0,0 // movdqa 0x36a(%rip),%xmm10 # 12b0 <_sk_xor__sse41_8bit+0x3c3>
.byte 102,65,15,56,0,234 // pshufb %xmm10,%xmm5
.byte 102,65,15,56,0,242 // pshufb %xmm10,%xmm6
.byte 102,15,108,245 // punpcklqdq %xmm5,%xmm6
@@ -53494,13 +53459,11 @@ _sk_xor__sse41_8bit:
BALIGN4
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 102b <_sk_xor__sse41_8bit+0xf5>
+ .byte 127,67 // jg fe3 <_sk_xor__sse41_8bit+0xf6>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 102f <_sk_xor__sse41_8bit+0xf9>
+ .byte 127,67 // jg fe7 <_sk_xor__sse41_8bit+0xfa>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 1033 <_sk_xor__sse41_8bit+0xfd>
- .byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 1037 <_sk_xor__sse41_8bit+0x101>
+ .byte 127,67 // jg feb <_sk_xor__sse41_8bit+0xfe>
BALIGN16
.byte 0,0 // add %al,(%rax)
@@ -53960,25 +53923,7 @@ HIDDEN _sk_uniform_color_sse2_8bit
FUNCTION(_sk_uniform_color_sse2_8bit)
_sk_uniform_color_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,5,85,17,0,0 // movss 0x1155(%rip),%xmm0 # 1204 <_sk_xor__sse2_8bit+0xc8>
- .byte 243,15,16,16 // movss (%rax),%xmm2
- .byte 243,15,89,208 // mulss %xmm0,%xmm2
- .byte 243,72,15,44,202 // cvttss2si %xmm2,%rcx
- .byte 243,15,16,80,4 // movss 0x4(%rax),%xmm2
- .byte 243,15,89,208 // mulss %xmm0,%xmm2
- .byte 243,72,15,44,210 // cvttss2si %xmm2,%rdx
- .byte 193,226,8 // shl $0x8,%edx
- .byte 9,202 // or %ecx,%edx
- .byte 243,15,16,80,8 // movss 0x8(%rax),%xmm2
- .byte 243,15,89,208 // mulss %xmm0,%xmm2
- .byte 243,72,15,44,202 // cvttss2si %xmm2,%rcx
- .byte 193,225,16 // shl $0x10,%ecx
- .byte 243,15,89,64,12 // mulss 0xc(%rax),%xmm0
- .byte 243,72,15,44,192 // cvttss2si %xmm0,%rax
- .byte 193,224,24 // shl $0x18,%eax
- .byte 9,200 // or %ecx,%eax
- .byte 9,208 // or %edx,%eax
- .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 102,15,110,64,16 // movd 0x10(%rax),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -53988,7 +53933,7 @@ HIDDEN _sk_set_rgb_sse2_8bit
FUNCTION(_sk_set_rgb_sse2_8bit)
_sk_set_rgb_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,21,0,17,0,0 // movss 0x1100(%rip),%xmm2 # 1208 <_sk_xor__sse2_8bit+0xcc>
+ .byte 243,15,16,21,253,16,0,0 // movss 0x10fd(%rip),%xmm2 # 11bc <_sk_xor__sse2_8bit+0xc9>
.byte 243,15,16,24 // movss (%rax),%xmm3
.byte 243,15,89,218 // mulss %xmm2,%xmm3
.byte 243,72,15,44,203 // cvttss2si %xmm3,%rcx
@@ -54003,7 +53948,7 @@ _sk_set_rgb_sse2_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
- .byte 102,15,219,5,216,16,0,0 // pand 0x10d8(%rip),%xmm0 # 1220 <_sk_xor__sse2_8bit+0xe4>
+ .byte 102,15,219,5,209,16,0,0 // pand 0x10d1(%rip),%xmm0 # 11d0 <_sk_xor__sse2_8bit+0xdd>
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -54018,7 +53963,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,210 // punpcklbw %xmm2,%xmm2
.byte 242,15,112,210,95 // pshuflw $0x5f,%xmm2,%xmm2
.byte 243,15,112,218,95 // pshufhw $0x5f,%xmm2,%xmm3
- .byte 102,15,235,29,187,16,0,0 // por 0x10bb(%rip),%xmm3 # 1230 <_sk_xor__sse2_8bit+0xf4>
+ .byte 102,15,235,29,180,16,0,0 // por 0x10b4(%rip),%xmm3 # 11e0 <_sk_xor__sse2_8bit+0xed>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,96,212 // punpcklbw %xmm4,%xmm2
@@ -54066,24 +54011,24 @@ _sk_load_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 20e <_sk_load_8888_sse2_8bit+0x2b>
+ .byte 117,10 // jne 1c5 <_sk_load_8888_sse2_8bit+0x2b>
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,36 // je 23c <_sk_load_8888_sse2_8bit+0x59>
+ .byte 116,36 // je 1f3 <_sk_load_8888_sse2_8bit+0x59>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 234 <_sk_load_8888_sse2_8bit+0x51>
+ .byte 116,18 // je 1eb <_sk_load_8888_sse2_8bit+0x51>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,226 // jne 20a <_sk_load_8888_sse2_8bit+0x27>
+ .byte 117,226 // jne 1c1 <_sk_load_8888_sse2_8bit+0x27>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 235,206 // jmp 20a <_sk_load_8888_sse2_8bit+0x27>
+ .byte 235,206 // jmp 1c1 <_sk_load_8888_sse2_8bit+0x27>
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,198 // jmp 20a <_sk_load_8888_sse2_8bit+0x27>
+ .byte 235,198 // jmp 1c1 <_sk_load_8888_sse2_8bit+0x27>
HIDDEN _sk_load_8888_dst_sse2_8bit
.globl _sk_load_8888_dst_sse2_8bit
@@ -54098,24 +54043,24 @@ _sk_load_8888_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 26f <_sk_load_8888_dst_sse2_8bit+0x2b>
+ .byte 117,10 // jne 226 <_sk_load_8888_dst_sse2_8bit+0x2b>
.byte 243,66,15,111,12,130 // movdqu (%rdx,%r8,4),%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,36 // je 29d <_sk_load_8888_dst_sse2_8bit+0x59>
+ .byte 116,36 // je 254 <_sk_load_8888_dst_sse2_8bit+0x59>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 295 <_sk_load_8888_dst_sse2_8bit+0x51>
+ .byte 116,18 // je 24c <_sk_load_8888_dst_sse2_8bit+0x51>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,226 // jne 26b <_sk_load_8888_dst_sse2_8bit+0x27>
+ .byte 117,226 // jne 222 <_sk_load_8888_dst_sse2_8bit+0x27>
.byte 102,66,15,110,76,130,8 // movd 0x8(%rdx,%r8,4),%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
.byte 102,66,15,18,12,130 // movlpd (%rdx,%r8,4),%xmm1
- .byte 235,206 // jmp 26b <_sk_load_8888_dst_sse2_8bit+0x27>
+ .byte 235,206 // jmp 222 <_sk_load_8888_dst_sse2_8bit+0x27>
.byte 102,66,15,110,12,130 // movd (%rdx,%r8,4),%xmm1
- .byte 235,198 // jmp 26b <_sk_load_8888_dst_sse2_8bit+0x27>
+ .byte 235,198 // jmp 222 <_sk_load_8888_dst_sse2_8bit+0x27>
HIDDEN _sk_store_8888_sse2_8bit
.globl _sk_store_8888_sse2_8bit
@@ -54130,23 +54075,23 @@ _sk_store_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 2d0 <_sk_store_8888_sse2_8bit+0x2b>
+ .byte 117,10 // jne 287 <_sk_store_8888_sse2_8bit+0x2b>
.byte 243,66,15,127,4,130 // movdqu %xmm0,(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,32 // je 2fa <_sk_store_8888_sse2_8bit+0x55>
+ .byte 116,32 // je 2b1 <_sk_store_8888_sse2_8bit+0x55>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 2f2 <_sk_store_8888_sse2_8bit+0x4d>
+ .byte 116,18 // je 2a9 <_sk_store_8888_sse2_8bit+0x4d>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,230 // jne 2cc <_sk_store_8888_sse2_8bit+0x27>
+ .byte 117,230 // jne 283 <_sk_store_8888_sse2_8bit+0x27>
.byte 102,15,112,208,78 // pshufd $0x4e,%xmm0,%xmm2
.byte 102,66,15,126,84,130,8 // movd %xmm2,0x8(%rdx,%r8,4)
.byte 102,66,15,214,4,130 // movq %xmm0,(%rdx,%r8,4)
- .byte 235,210 // jmp 2cc <_sk_store_8888_sse2_8bit+0x27>
+ .byte 235,210 // jmp 283 <_sk_store_8888_sse2_8bit+0x27>
.byte 102,66,15,126,4,130 // movd %xmm0,(%rdx,%r8,4)
- .byte 235,202 // jmp 2cc <_sk_store_8888_sse2_8bit+0x27>
+ .byte 235,202 // jmp 283 <_sk_store_8888_sse2_8bit+0x27>
HIDDEN _sk_load_bgra_sse2_8bit
.globl _sk_load_bgra_sse2_8bit
@@ -54161,7 +54106,7 @@ _sk_load_bgra_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,50 // jne 355 <_sk_load_bgra_sse2_8bit+0x53>
+ .byte 117,50 // jne 30c <_sk_load_bgra_sse2_8bit+0x53>
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,111,216 // movdqa %xmm0,%xmm3
@@ -54176,18 +54121,18 @@ _sk_load_bgra_sse2_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,36 // je 383 <_sk_load_bgra_sse2_8bit+0x81>
+ .byte 116,36 // je 33a <_sk_load_bgra_sse2_8bit+0x81>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 37b <_sk_load_bgra_sse2_8bit+0x79>
+ .byte 116,18 // je 332 <_sk_load_bgra_sse2_8bit+0x79>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,186 // jne 329 <_sk_load_bgra_sse2_8bit+0x27>
+ .byte 117,186 // jne 2e0 <_sk_load_bgra_sse2_8bit+0x27>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 235,166 // jmp 329 <_sk_load_bgra_sse2_8bit+0x27>
+ .byte 235,166 // jmp 2e0 <_sk_load_bgra_sse2_8bit+0x27>
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,158 // jmp 329 <_sk_load_bgra_sse2_8bit+0x27>
+ .byte 235,158 // jmp 2e0 <_sk_load_bgra_sse2_8bit+0x27>
HIDDEN _sk_load_bgra_dst_sse2_8bit
.globl _sk_load_bgra_dst_sse2_8bit
@@ -54202,7 +54147,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,50 // jne 3de <_sk_load_bgra_dst_sse2_8bit+0x53>
+ .byte 117,50 // jne 395 <_sk_load_bgra_dst_sse2_8bit+0x53>
.byte 243,66,15,111,12,130 // movdqu (%rdx,%r8,4),%xmm1
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
@@ -54217,18 +54162,18 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,36 // je 40c <_sk_load_bgra_dst_sse2_8bit+0x81>
+ .byte 116,36 // je 3c3 <_sk_load_bgra_dst_sse2_8bit+0x81>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 404 <_sk_load_bgra_dst_sse2_8bit+0x79>
+ .byte 116,18 // je 3bb <_sk_load_bgra_dst_sse2_8bit+0x79>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,186 // jne 3b2 <_sk_load_bgra_dst_sse2_8bit+0x27>
+ .byte 117,186 // jne 369 <_sk_load_bgra_dst_sse2_8bit+0x27>
.byte 102,66,15,110,76,130,8 // movd 0x8(%rdx,%r8,4),%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
.byte 102,66,15,18,12,130 // movlpd (%rdx,%r8,4),%xmm1
- .byte 235,166 // jmp 3b2 <_sk_load_bgra_dst_sse2_8bit+0x27>
+ .byte 235,166 // jmp 369 <_sk_load_bgra_dst_sse2_8bit+0x27>
.byte 102,66,15,110,12,130 // movd (%rdx,%r8,4),%xmm1
- .byte 235,158 // jmp 3b2 <_sk_load_bgra_dst_sse2_8bit+0x27>
+ .byte 235,158 // jmp 369 <_sk_load_bgra_dst_sse2_8bit+0x27>
HIDDEN _sk_store_bgra_sse2_8bit
.globl _sk_store_bgra_sse2_8bit
@@ -54253,23 +54198,23 @@ _sk_store_bgra_sse2_8bit:
.byte 243,15,112,210,198 // pshufhw $0xc6,%xmm2,%xmm2
.byte 102,15,103,211 // packuswb %xmm3,%xmm2
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 46b <_sk_store_bgra_sse2_8bit+0x57>
+ .byte 117,10 // jne 422 <_sk_store_bgra_sse2_8bit+0x57>
.byte 243,66,15,127,20,130 // movdqu %xmm2,(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,32 // je 495 <_sk_store_bgra_sse2_8bit+0x81>
+ .byte 116,32 // je 44c <_sk_store_bgra_sse2_8bit+0x81>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 48d <_sk_store_bgra_sse2_8bit+0x79>
+ .byte 116,18 // je 444 <_sk_store_bgra_sse2_8bit+0x79>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,230 // jne 467 <_sk_store_bgra_sse2_8bit+0x53>
+ .byte 117,230 // jne 41e <_sk_store_bgra_sse2_8bit+0x53>
.byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
.byte 102,66,15,126,92,130,8 // movd %xmm3,0x8(%rdx,%r8,4)
.byte 102,66,15,214,20,130 // movq %xmm2,(%rdx,%r8,4)
- .byte 235,210 // jmp 467 <_sk_store_bgra_sse2_8bit+0x53>
+ .byte 235,210 // jmp 41e <_sk_store_bgra_sse2_8bit+0x53>
.byte 102,66,15,126,20,130 // movd %xmm2,(%rdx,%r8,4)
- .byte 235,202 // jmp 467 <_sk_store_bgra_sse2_8bit+0x53>
+ .byte 235,202 // jmp 41e <_sk_store_bgra_sse2_8bit+0x53>
HIDDEN _sk_load_a8_sse2_8bit
.globl _sk_load_a8_sse2_8bit
@@ -54283,7 +54228,7 @@ _sk_load_a8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,23 // jne 4d1 <_sk_load_a8_sse2_8bit+0x34>
+ .byte 117,23 // jne 488 <_sk_load_a8_sse2_8bit+0x34>
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
@@ -54292,12 +54237,12 @@ _sk_load_a8_sse2_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 511 <_sk_load_a8_sse2_8bit+0x74>
+ .byte 116,54 // je 4c8 <_sk_load_a8_sse2_8bit+0x74>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 4fa <_sk_load_a8_sse2_8bit+0x5d>
+ .byte 116,21 // je 4b1 <_sk_load_a8_sse2_8bit+0x5d>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 4c8 <_sk_load_a8_sse2_8bit+0x2b>
+ .byte 117,221 // jne 47f <_sk_load_a8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -54306,10 +54251,10 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
.byte 242,15,16,194 // movsd %xmm2,%xmm0
- .byte 235,183 // jmp 4c8 <_sk_load_a8_sse2_8bit+0x2b>
+ .byte 235,183 // jmp 47f <_sk_load_a8_sse2_8bit+0x2b>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,172 // jmp 4c8 <_sk_load_a8_sse2_8bit+0x2b>
+ .byte 235,172 // jmp 47f <_sk_load_a8_sse2_8bit+0x2b>
HIDDEN _sk_load_a8_dst_sse2_8bit
.globl _sk_load_a8_dst_sse2_8bit
@@ -54323,7 +54268,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,23 // jne 550 <_sk_load_a8_dst_sse2_8bit+0x34>
+ .byte 117,23 // jne 507 <_sk_load_a8_dst_sse2_8bit+0x34>
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
@@ -54332,12 +54277,12 @@ _sk_load_a8_dst_sse2_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 590 <_sk_load_a8_dst_sse2_8bit+0x74>
+ .byte 116,54 // je 547 <_sk_load_a8_dst_sse2_8bit+0x74>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 579 <_sk_load_a8_dst_sse2_8bit+0x5d>
+ .byte 116,21 // je 530 <_sk_load_a8_dst_sse2_8bit+0x5d>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 547 <_sk_load_a8_dst_sse2_8bit+0x2b>
+ .byte 117,221 // jne 4fe <_sk_load_a8_dst_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
@@ -54346,10 +54291,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
.byte 242,15,16,202 // movsd %xmm2,%xmm1
- .byte 235,183 // jmp 547 <_sk_load_a8_dst_sse2_8bit+0x2b>
+ .byte 235,183 // jmp 4fe <_sk_load_a8_dst_sse2_8bit+0x2b>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,172 // jmp 547 <_sk_load_a8_dst_sse2_8bit+0x2b>
+ .byte 235,172 // jmp 4fe <_sk_load_a8_dst_sse2_8bit+0x2b>
HIDDEN _sk_store_a8_sse2_8bit
.globl _sk_store_a8_sse2_8bit
@@ -54365,8 +54310,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,114,210,24 // psrld $0x18,%xmm2
.byte 77,133,201 // test %r9,%r9
- .byte 117,26 // jne 5db <_sk_store_a8_sse2_8bit+0x40>
- .byte 102,15,219,21,119,12,0,0 // pand 0xc77(%rip),%xmm2 # 1240 <_sk_xor__sse2_8bit+0x104>
+ .byte 117,26 // jne 592 <_sk_store_a8_sse2_8bit+0x40>
+ .byte 102,15,219,21,112,12,0,0 // pand 0xc70(%rip),%xmm2 # 11f0 <_sk_xor__sse2_8bit+0xfd>
.byte 102,15,103,210 // packuswb %xmm2,%xmm2
.byte 102,15,103,210 // packuswb %xmm2,%xmm2
.byte 102,66,15,126,20,2 // movd %xmm2,(%rdx,%r8,1)
@@ -54374,24 +54319,24 @@ _sk_store_a8_sse2_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 61b <_sk_store_a8_sse2_8bit+0x80>
+ .byte 116,54 // je 5d2 <_sk_store_a8_sse2_8bit+0x80>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 600 <_sk_store_a8_sse2_8bit+0x65>
+ .byte 116,21 // je 5b7 <_sk_store_a8_sse2_8bit+0x65>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,230 // jne 5d7 <_sk_store_a8_sse2_8bit+0x3c>
+ .byte 117,230 // jne 58e <_sk_store_a8_sse2_8bit+0x3c>
.byte 102,15,127,84,36,232 // movdqa %xmm2,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 66,136,68,2,2 // mov %al,0x2(%rdx,%r8,1)
- .byte 102,15,219,21,56,12,0,0 // pand 0xc38(%rip),%xmm2 # 1240 <_sk_xor__sse2_8bit+0x104>
+ .byte 102,15,219,21,49,12,0,0 // pand 0xc31(%rip),%xmm2 # 11f0 <_sk_xor__sse2_8bit+0xfd>
.byte 102,15,103,210 // packuswb %xmm2,%xmm2
.byte 102,15,103,210 // packuswb %xmm2,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,66,137,4,2 // mov %ax,(%rdx,%r8,1)
- .byte 235,188 // jmp 5d7 <_sk_store_a8_sse2_8bit+0x3c>
+ .byte 235,188 // jmp 58e <_sk_store_a8_sse2_8bit+0x3c>
.byte 102,15,127,84,36,216 // movdqa %xmm2,-0x28(%rsp)
.byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 66,136,4,2 // mov %al,(%rdx,%r8,1)
- .byte 235,172 // jmp 5d7 <_sk_store_a8_sse2_8bit+0x3c>
+ .byte 235,172 // jmp 58e <_sk_store_a8_sse2_8bit+0x3c>
HIDDEN _sk_load_g8_sse2_8bit
.globl _sk_load_g8_sse2_8bit
@@ -54405,29 +54350,29 @@ _sk_load_g8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,69 // jne 68d <_sk_load_g8_sse2_8bit+0x62>
+ .byte 117,69 // jne 644 <_sk_load_g8_sse2_8bit+0x62>
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,242,11,0,0 // pand 0xbf2(%rip),%xmm0 # 1250 <_sk_xor__sse2_8bit+0x114>
- .byte 102,15,111,21,250,11,0,0 // movdqa 0xbfa(%rip),%xmm2 # 1260 <_sk_xor__sse2_8bit+0x124>
+ .byte 102,15,219,5,235,11,0,0 // pand 0xbeb(%rip),%xmm0 # 1200 <_sk_xor__sse2_8bit+0x10d>
+ .byte 102,15,111,21,243,11,0,0 // movdqa 0xbf3(%rip),%xmm2 # 1210 <_sk_xor__sse2_8bit+0x11d>
.byte 102,15,112,216,245 // pshufd $0xf5,%xmm0,%xmm3
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,218 // pmuludq %xmm2,%xmm3
.byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
.byte 102,15,98,194 // punpckldq %xmm2,%xmm0
- .byte 102,15,235,5,231,11,0,0 // por 0xbe7(%rip),%xmm0 # 1270 <_sk_xor__sse2_8bit+0x134>
+ .byte 102,15,235,5,224,11,0,0 // por 0xbe0(%rip),%xmm0 # 1220 <_sk_xor__sse2_8bit+0x12d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 6cd <_sk_load_g8_sse2_8bit+0xa2>
+ .byte 116,54 // je 684 <_sk_load_g8_sse2_8bit+0xa2>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 6b6 <_sk_load_g8_sse2_8bit+0x8b>
+ .byte 116,21 // je 66d <_sk_load_g8_sse2_8bit+0x8b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,175 // jne 656 <_sk_load_g8_sse2_8bit+0x2b>
+ .byte 117,175 // jne 60d <_sk_load_g8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -54436,10 +54381,10 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
.byte 242,15,16,194 // movsd %xmm2,%xmm0
- .byte 235,137 // jmp 656 <_sk_load_g8_sse2_8bit+0x2b>
+ .byte 235,137 // jmp 60d <_sk_load_g8_sse2_8bit+0x2b>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 233,123,255,255,255 // jmpq 656 <_sk_load_g8_sse2_8bit+0x2b>
+ .byte 233,123,255,255,255 // jmpq 60d <_sk_load_g8_sse2_8bit+0x2b>
HIDDEN _sk_load_g8_dst_sse2_8bit
.globl _sk_load_g8_dst_sse2_8bit
@@ -54453,29 +54398,29 @@ _sk_load_g8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,69 // jne 73d <_sk_load_g8_dst_sse2_8bit+0x62>
+ .byte 117,69 // jne 6f4 <_sk_load_g8_dst_sse2_8bit+0x62>
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,219,13,114,11,0,0 // pand 0xb72(%rip),%xmm1 # 1280 <_sk_xor__sse2_8bit+0x144>
- .byte 102,15,111,21,122,11,0,0 // movdqa 0xb7a(%rip),%xmm2 # 1290 <_sk_xor__sse2_8bit+0x154>
+ .byte 102,15,219,13,107,11,0,0 // pand 0xb6b(%rip),%xmm1 # 1230 <_sk_xor__sse2_8bit+0x13d>
+ .byte 102,15,111,21,115,11,0,0 // movdqa 0xb73(%rip),%xmm2 # 1240 <_sk_xor__sse2_8bit+0x14d>
.byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,218 // pmuludq %xmm2,%xmm3
.byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
- .byte 102,15,235,13,103,11,0,0 // por 0xb67(%rip),%xmm1 # 12a0 <_sk_xor__sse2_8bit+0x164>
+ .byte 102,15,235,13,96,11,0,0 // por 0xb60(%rip),%xmm1 # 1250 <_sk_xor__sse2_8bit+0x15d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 77d <_sk_load_g8_dst_sse2_8bit+0xa2>
+ .byte 116,54 // je 734 <_sk_load_g8_dst_sse2_8bit+0xa2>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 766 <_sk_load_g8_dst_sse2_8bit+0x8b>
+ .byte 116,21 // je 71d <_sk_load_g8_dst_sse2_8bit+0x8b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,175 // jne 706 <_sk_load_g8_dst_sse2_8bit+0x2b>
+ .byte 117,175 // jne 6bd <_sk_load_g8_dst_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,112,201,69 // pshufd $0x45,%xmm1,%xmm1
@@ -54484,10 +54429,10 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
.byte 242,15,16,202 // movsd %xmm2,%xmm1
- .byte 235,137 // jmp 706 <_sk_load_g8_dst_sse2_8bit+0x2b>
+ .byte 235,137 // jmp 6bd <_sk_load_g8_dst_sse2_8bit+0x2b>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 233,123,255,255,255 // jmpq 706 <_sk_load_g8_dst_sse2_8bit+0x2b>
+ .byte 233,123,255,255,255 // jmpq 6bd <_sk_load_g8_dst_sse2_8bit+0x2b>
HIDDEN _sk_srcover_rgba_8888_sse2_8bit
.globl _sk_srcover_rgba_8888_sse2_8bit
@@ -54502,7 +54447,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,120 // jne 824 <_sk_srcover_rgba_8888_sse2_8bit+0x99>
+ .byte 117,120 // jne 7db <_sk_srcover_rgba_8888_sse2_8bit+0x99>
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
.byte 77,133,201 // test %r9,%r9
.byte 242,15,112,216,231 // pshuflw $0xe7,%xmm0,%xmm3
@@ -54528,38 +54473,38 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,15,103,251 // packuswb %xmm3,%xmm7
.byte 102,15,248,215 // psubb %xmm7,%xmm2
.byte 102,15,252,208 // paddb %xmm0,%xmm2
- .byte 117,58 // jne 854 <_sk_srcover_rgba_8888_sse2_8bit+0xc9>
+ .byte 117,58 // jne 80b <_sk_srcover_rgba_8888_sse2_8bit+0xc9>
.byte 243,66,15,127,20,130 // movdqu %xmm2,(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 68,137,200 // mov %r9d,%eax
.byte 36,3 // and $0x3,%al
.byte 60,1 // cmp $0x1,%al
- .byte 116,81 // je 87e <_sk_srcover_rgba_8888_sse2_8bit+0xf3>
+ .byte 116,81 // je 835 <_sk_srcover_rgba_8888_sse2_8bit+0xf3>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 60,2 // cmp $0x2,%al
- .byte 116,20 // je 849 <_sk_srcover_rgba_8888_sse2_8bit+0xbe>
+ .byte 116,20 // je 800 <_sk_srcover_rgba_8888_sse2_8bit+0xbe>
.byte 60,3 // cmp $0x3,%al
- .byte 15,133,117,255,255,255 // jne 7b2 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
+ .byte 15,133,117,255,255,255 // jne 769 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2
- .byte 233,94,255,255,255 // jmpq 7b2 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
+ .byte 233,94,255,255,255 // jmpq 769 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,43 // je 889 <_sk_srcover_rgba_8888_sse2_8bit+0xfe>
+ .byte 116,43 // je 840 <_sk_srcover_rgba_8888_sse2_8bit+0xfe>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 876 <_sk_srcover_rgba_8888_sse2_8bit+0xeb>
+ .byte 116,18 // je 82d <_sk_srcover_rgba_8888_sse2_8bit+0xeb>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,182 // jne 820 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
+ .byte 117,182 // jne 7d7 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
.byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
.byte 102,66,15,126,92,130,8 // movd %xmm3,0x8(%rdx,%r8,4)
.byte 102,66,15,214,20,130 // movq %xmm2,(%rdx,%r8,4)
- .byte 235,162 // jmp 820 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
+ .byte 235,162 // jmp 7d7 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 233,41,255,255,255 // jmpq 7b2 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
+ .byte 233,41,255,255,255 // jmpq 769 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
.byte 102,66,15,126,20,130 // movd %xmm2,(%rdx,%r8,4)
- .byte 235,143 // jmp 820 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
+ .byte 235,143 // jmp 7d7 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
HIDDEN _sk_scale_1_float_sse2_8bit
.globl _sk_scale_1_float_sse2_8bit
@@ -54567,7 +54512,7 @@ FUNCTION(_sk_scale_1_float_sse2_8bit)
_sk_scale_1_float_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,16 // movss (%rax),%xmm2
- .byte 243,15,89,21,109,9,0,0 // mulss 0x96d(%rip),%xmm2 # 120c <_sk_xor__sse2_8bit+0xd0>
+ .byte 243,15,89,21,106,9,0,0 // mulss 0x96a(%rip),%xmm2 # 11c0 <_sk_xor__sse2_8bit+0xcd>
.byte 243,15,44,194 // cvttss2si %xmm2,%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
@@ -54577,7 +54522,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,219 // punpcklbw %xmm3,%xmm3
.byte 242,15,112,219,0 // pshuflw $0x0,%xmm3,%xmm3
.byte 102,15,112,219,80 // pshufd $0x50,%xmm3,%xmm3
- .byte 102,15,219,29,227,9,0,0 // pand 0x9e3(%rip),%xmm3 # 12b0 <_sk_xor__sse2_8bit+0x174>
+ .byte 102,15,219,29,220,9,0,0 // pand 0x9dc(%rip),%xmm3 # 1260 <_sk_xor__sse2_8bit+0x16d>
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,213,224 // pmullw %xmm0,%xmm4
.byte 102,15,213,218 // pmullw %xmm2,%xmm3
@@ -54602,7 +54547,7 @@ _sk_scale_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,114 // jne 986 <_sk_scale_u8_sse2_8bit+0x8f>
+ .byte 117,114 // jne 93d <_sk_scale_u8_sse2_8bit+0x8f>
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
@@ -54632,12 +54577,12 @@ _sk_scale_u8_sse2_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,57 // je 9c9 <_sk_scale_u8_sse2_8bit+0xd2>
+ .byte 116,57 // je 980 <_sk_scale_u8_sse2_8bit+0xd2>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 9af <_sk_scale_u8_sse2_8bit+0xb8>
+ .byte 116,21 // je 966 <_sk_scale_u8_sse2_8bit+0xb8>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,130 // jne 922 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 117,130 // jne 8d9 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
@@ -54646,10 +54591,10 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,89,255,255,255 // jmpq 922 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,89,255,255,255 // jmpq 8d9 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,75,255,255,255 // jmpq 922 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,75,255,255,255 // jmpq 8d9 <_sk_scale_u8_sse2_8bit+0x2b>
HIDDEN _sk_lerp_1_float_sse2_8bit
.globl _sk_lerp_1_float_sse2_8bit
@@ -54657,7 +54602,7 @@ FUNCTION(_sk_lerp_1_float_sse2_8bit)
_sk_lerp_1_float_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,16 // movss (%rax),%xmm2
- .byte 243,15,89,21,43,8,0,0 // mulss 0x82b(%rip),%xmm2 # 1210 <_sk_xor__sse2_8bit+0xd4>
+ .byte 243,15,89,21,40,8,0,0 // mulss 0x828(%rip),%xmm2 # 11c4 <_sk_xor__sse2_8bit+0xd1>
.byte 243,15,44,194 // cvttss2si %xmm2,%eax
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,96,210 // punpcklbw %xmm2,%xmm2
@@ -54667,7 +54612,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,96,236 // punpcklbw %xmm4,%xmm5
.byte 102,15,104,196 // punpckhbw %xmm4,%xmm0
- .byte 102,15,111,21,173,8,0,0 // movdqa 0x8ad(%rip),%xmm2 # 12c0 <_sk_xor__sse2_8bit+0x184>
+ .byte 102,15,111,21,166,8,0,0 // movdqa 0x8a6(%rip),%xmm2 # 1270 <_sk_xor__sse2_8bit+0x17d>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
.byte 102,15,213,240 // pmullw %xmm0,%xmm6
@@ -54709,7 +54654,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,180,0,0,0 // jne b58 <_sk_lerp_u8_sse2_8bit+0xd5>
+ .byte 15,133,180,0,0,0 // jne b0f <_sk_lerp_u8_sse2_8bit+0xd5>
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
@@ -54755,12 +54700,12 @@ _sk_lerp_u8_sse2_8bit:
.byte 255,224 // jmpq *%rax
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,61 // je b9f <_sk_lerp_u8_sse2_8bit+0x11c>
+ .byte 116,61 // je b56 <_sk_lerp_u8_sse2_8bit+0x11c>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,25 // je b85 <_sk_lerp_u8_sse2_8bit+0x102>
+ .byte 116,25 // je b3c <_sk_lerp_u8_sse2_8bit+0x102>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,60,255,255,255 // jne ab2 <_sk_lerp_u8_sse2_8bit+0x2f>
+ .byte 15,133,60,255,255,255 // jne a69 <_sk_lerp_u8_sse2_8bit+0x2f>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
@@ -54769,10 +54714,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,19,255,255,255 // jmpq ab2 <_sk_lerp_u8_sse2_8bit+0x2f>
+ .byte 233,19,255,255,255 // jmpq a69 <_sk_lerp_u8_sse2_8bit+0x2f>
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,5,255,255,255 // jmpq ab2 <_sk_lerp_u8_sse2_8bit+0x2f>
+ .byte 233,5,255,255,255 // jmpq a69 <_sk_lerp_u8_sse2_8bit+0x2f>
HIDDEN _sk_move_src_dst_sse2_8bit
.globl _sk_move_src_dst_sse2_8bit
@@ -54795,7 +54740,7 @@ HIDDEN _sk_black_color_sse2_8bit
FUNCTION(_sk_black_color_sse2_8bit)
_sk_black_color_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,12,7,0,0 // movaps 0x70c(%rip),%xmm0 # 12d0 <_sk_xor__sse2_8bit+0x194>
+ .byte 15,40,5,5,7,0,0 // movaps 0x705(%rip),%xmm0 # 1280 <_sk_xor__sse2_8bit+0x18d>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_white_color_sse2_8bit
@@ -55255,13 +55200,11 @@ _sk_xor__sse2_8bit:
BALIGN4
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 124b <_sk_xor__sse2_8bit+0x10f>
- .byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 124f <_sk_xor__sse2_8bit+0x113>
+ .byte 127,67 // jg 1203 <_sk_xor__sse2_8bit+0x110>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 1253 <_sk_xor__sse2_8bit+0x117>
+ .byte 127,67 // jg 1207 <_sk_xor__sse2_8bit+0x114>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 1257 <_sk_xor__sse2_8bit+0x11b>
+ .byte 127,67 // jg 120b <_sk_xor__sse2_8bit+0x118>
BALIGN16
.byte 0,0 // add %al,(%rax)
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 13728a577b..90cfb05893 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -36244,30 +36244,14 @@ _sk_just_return_hsw_8bit LABEL PROC
PUBLIC _sk_uniform_color_hsw_8bit
_sk_uniform_color_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 197,250,16,5,121,18,0,0 ; vmovss 0x1279(%rip),%xmm0 # 13ec <_sk_xor__hsw_8bit+0xbd>
- DB 197,250,89,16 ; vmulss (%rax),%xmm0,%xmm2
- DB 196,225,250,44,202 ; vcvttss2si %xmm2,%rcx
- DB 197,250,89,80,4 ; vmulss 0x4(%rax),%xmm0,%xmm2
- DB 196,225,250,44,210 ; vcvttss2si %xmm2,%rdx
- DB 193,226,8 ; shl $0x8,%edx
- DB 9,202 ; or %ecx,%edx
- DB 197,250,89,80,8 ; vmulss 0x8(%rax),%xmm0,%xmm2
- DB 196,225,250,44,202 ; vcvttss2si %xmm2,%rcx
- DB 193,225,16 ; shl $0x10,%ecx
- DB 197,250,89,64,12 ; vmulss 0xc(%rax),%xmm0,%xmm0
- DB 196,225,250,44,192 ; vcvttss2si %xmm0,%rax
- DB 193,224,24 ; shl $0x18,%eax
- DB 9,200 ; or %ecx,%eax
- DB 9,208 ; or %edx,%eax
- DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
+ DB 196,226,125,24,64,16 ; vbroadcastss 0x10(%rax),%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
PUBLIC _sk_set_rgb_hsw_8bit
_sk_set_rgb_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 197,250,16,21,48,18,0,0 ; vmovss 0x1230(%rip),%xmm2 # 13f0 <_sk_xor__hsw_8bit+0xc1>
+ DB 197,250,16,21,45,18,0,0 ; vmovss 0x122d(%rip),%xmm2 # 13ac <_sk_xor__hsw_8bit+0xbd>
DB 197,234,89,24 ; vmulss (%rax),%xmm2,%xmm3
DB 196,225,250,44,203 ; vcvttss2si %xmm3,%rcx
DB 197,234,89,88,4 ; vmulss 0x4(%rax),%xmm2,%xmm3
@@ -36280,15 +36264,15 @@ _sk_set_rgb_hsw_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
DB 196,226,125,88,210 ; vpbroadcastd %xmm2,%ymm2
- DB 197,253,219,5,40,18,0,0 ; vpand 0x1228(%rip),%ymm0,%ymm0 # 1420 <_sk_xor__hsw_8bit+0xf1>
+ DB 197,253,219,5,41,18,0,0 ; vpand 0x1229(%rip),%ymm0,%ymm0 # 13e0 <_sk_xor__hsw_8bit+0xf1>
DB 197,237,235,192 ; vpor %ymm0,%ymm2,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
PUBLIC _sk_premul_hsw_8bit
_sk_premul_hsw_8bit LABEL PROC
- DB 196,226,125,0,21,55,18,0,0 ; vpshufb 0x1237(%rip),%ymm0,%ymm2 # 1440 <_sk_xor__hsw_8bit+0x111>
- DB 197,237,235,21,79,18,0,0 ; vpor 0x124f(%rip),%ymm2,%ymm2 # 1460 <_sk_xor__hsw_8bit+0x131>
+ DB 196,226,125,0,21,56,18,0,0 ; vpshufb 0x1238(%rip),%ymm0,%ymm2 # 1400 <_sk_xor__hsw_8bit+0x111>
+ DB 197,237,235,21,80,18,0,0 ; vpor 0x1250(%rip),%ymm2,%ymm2 # 1420 <_sk_xor__hsw_8bit+0x131>
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
DB 196,227,125,57,192,1 ; vextracti128 $0x1,%ymm0,%xmm0
DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0
@@ -36309,7 +36293,7 @@ _sk_premul_hsw_8bit LABEL PROC
PUBLIC _sk_swap_rb_hsw_8bit
_sk_swap_rb_hsw_8bit LABEL PROC
- DB 196,226,125,0,5,24,18,0,0 ; vpshufb 0x1218(%rip),%ymm0,%ymm0 # 1480 <_sk_xor__hsw_8bit+0x151>
+ DB 196,226,125,0,5,25,18,0,0 ; vpshufb 0x1219(%rip),%ymm0,%ymm0 # 1440 <_sk_xor__hsw_8bit+0x151>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36325,7 +36309,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 74,141,4,137 ; lea (%rcx,%r9,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,8 ; jne 299 <_sk_load_8888_hsw_8bit+0x2d>
+ DB 117,8 ; jne 258 <_sk_load_8888_hsw_8bit+0x2d>
DB 197,254,111,0 ; vmovdqu (%rax),%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36337,7 +36321,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,225,249,110,194 ; vmovq %rdx,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,226,125,140,0 ; vpmaskmovd (%rax),%ymm0,%ymm0
- DB 235,214 ; jmp 295 <_sk_load_8888_hsw_8bit+0x29>
+ DB 235,214 ; jmp 254 <_sk_load_8888_hsw_8bit+0x29>
PUBLIC _sk_load_8888_dst_hsw_8bit
_sk_load_8888_dst_hsw_8bit LABEL PROC
@@ -36351,7 +36335,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 74,141,4,137 ; lea (%rcx,%r9,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,8 ; jne 2ec <_sk_load_8888_dst_hsw_8bit+0x2d>
+ DB 117,8 ; jne 2ab <_sk_load_8888_dst_hsw_8bit+0x2d>
DB 197,254,111,8 ; vmovdqu (%rax),%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36363,7 +36347,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,225,249,110,202 ; vmovq %rdx,%xmm1
DB 196,226,125,33,201 ; vpmovsxbd %xmm1,%ymm1
DB 196,226,117,140,8 ; vpmaskmovd (%rax),%ymm1,%ymm1
- DB 235,214 ; jmp 2e8 <_sk_load_8888_dst_hsw_8bit+0x29>
+ DB 235,214 ; jmp 2a7 <_sk_load_8888_dst_hsw_8bit+0x29>
PUBLIC _sk_store_8888_hsw_8bit
_sk_store_8888_hsw_8bit LABEL PROC
@@ -36377,7 +36361,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 74,141,4,137 ; lea (%rcx,%r9,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,8 ; jne 33f <_sk_store_8888_hsw_8bit+0x2d>
+ DB 117,8 ; jne 2fe <_sk_store_8888_hsw_8bit+0x2d>
DB 197,254,127,0 ; vmovdqu %ymm0,(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36389,7 +36373,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,225,249,110,210 ; vmovq %rdx,%xmm2
DB 196,226,125,33,210 ; vpmovsxbd %xmm2,%ymm2
DB 196,226,109,142,0 ; vpmaskmovd %ymm0,%ymm2,(%rax)
- DB 235,214 ; jmp 33b <_sk_store_8888_hsw_8bit+0x29>
+ DB 235,214 ; jmp 2fa <_sk_store_8888_hsw_8bit+0x29>
PUBLIC _sk_load_bgra_hsw_8bit
_sk_load_bgra_hsw_8bit LABEL PROC
@@ -36403,9 +36387,9 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 74,141,4,137 ; lea (%rcx,%r9,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 39b <_sk_load_bgra_hsw_8bit+0x36>
+ DB 117,17 ; jne 35a <_sk_load_bgra_hsw_8bit+0x36>
DB 197,254,111,0 ; vmovdqu (%rax),%ymm0
- DB 196,226,125,0,5,9,17,0,0 ; vpshufb 0x1109(%rip),%ymm0,%ymm0 # 14a0 <_sk_xor__hsw_8bit+0x171>
+ DB 196,226,125,0,5,10,17,0,0 ; vpshufb 0x110a(%rip),%ymm0,%ymm0 # 1460 <_sk_xor__hsw_8bit+0x171>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 185,8,0,0,0 ; mov $0x8,%ecx
@@ -36416,7 +36400,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,225,249,110,194 ; vmovq %rdx,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,226,125,140,0 ; vpmaskmovd (%rax),%ymm0,%ymm0
- DB 235,205 ; jmp 38e <_sk_load_bgra_hsw_8bit+0x29>
+ DB 235,205 ; jmp 34d <_sk_load_bgra_hsw_8bit+0x29>
PUBLIC _sk_load_bgra_dst_hsw_8bit
_sk_load_bgra_dst_hsw_8bit LABEL PROC
@@ -36430,9 +36414,9 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 74,141,4,137 ; lea (%rcx,%r9,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 3f7 <_sk_load_bgra_dst_hsw_8bit+0x36>
+ DB 117,17 ; jne 3b6 <_sk_load_bgra_dst_hsw_8bit+0x36>
DB 197,254,111,8 ; vmovdqu (%rax),%ymm1
- DB 196,226,117,0,13,205,16,0,0 ; vpshufb 0x10cd(%rip),%ymm1,%ymm1 # 14c0 <_sk_xor__hsw_8bit+0x191>
+ DB 196,226,117,0,13,206,16,0,0 ; vpshufb 0x10ce(%rip),%ymm1,%ymm1 # 1480 <_sk_xor__hsw_8bit+0x191>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 185,8,0,0,0 ; mov $0x8,%ecx
@@ -36443,7 +36427,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,225,249,110,202 ; vmovq %rdx,%xmm1
DB 196,226,125,33,201 ; vpmovsxbd %xmm1,%ymm1
DB 196,226,117,140,8 ; vpmaskmovd (%rax),%ymm1,%ymm1
- DB 235,205 ; jmp 3ea <_sk_load_bgra_dst_hsw_8bit+0x29>
+ DB 235,205 ; jmp 3a9 <_sk_load_bgra_dst_hsw_8bit+0x29>
PUBLIC _sk_store_bgra_hsw_8bit
_sk_store_bgra_hsw_8bit LABEL PROC
@@ -36456,9 +36440,9 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 72,193,225,2 ; shl $0x2,%rcx
DB 72,3,8 ; add (%rax),%rcx
DB 74,141,4,137 ; lea (%rcx,%r9,4),%rax
- DB 196,226,125,0,21,154,16,0,0 ; vpshufb 0x109a(%rip),%ymm0,%ymm2 # 14e0 <_sk_xor__hsw_8bit+0x1b1>
+ DB 196,226,125,0,21,155,16,0,0 ; vpshufb 0x109b(%rip),%ymm0,%ymm2 # 14a0 <_sk_xor__hsw_8bit+0x1b1>
DB 77,133,192 ; test %r8,%r8
- DB 117,8 ; jne 453 <_sk_store_bgra_hsw_8bit+0x36>
+ DB 117,8 ; jne 412 <_sk_store_bgra_hsw_8bit+0x36>
DB 197,254,127,16 ; vmovdqu %ymm2,(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36470,7 +36454,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,225,249,110,218 ; vmovq %rdx,%xmm3
DB 196,226,125,33,219 ; vpmovsxbd %xmm3,%ymm3
DB 196,226,101,142,16 ; vpmaskmovd %ymm2,%ymm3,(%rax)
- DB 235,214 ; jmp 44f <_sk_store_bgra_hsw_8bit+0x32>
+ DB 235,214 ; jmp 40e <_sk_store_bgra_hsw_8bit+0x32>
PUBLIC _sk_load_a8_hsw_8bit
_sk_load_a8_hsw_8bit LABEL PROC
@@ -36482,9 +36466,9 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,28 ; jne 4b2 <_sk_load_a8_hsw_8bit+0x39>
+ DB 117,28 ; jne 471 <_sk_load_a8_hsw_8bit+0x39>
DB 196,162,121,48,4,2 ; vpmovzxbw (%rdx,%r8,1),%xmm0
- DB 197,249,219,5,92,18,0,0 ; vpand 0x125c(%rip),%xmm0,%xmm0 # 1700 <_sk_xor__hsw_8bit+0x3d1>
+ DB 197,249,219,5,93,18,0,0 ; vpand 0x125d(%rip),%xmm0,%xmm0 # 16c0 <_sk_xor__hsw_8bit+0x3d1>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,253,114,240,24 ; vpslld $0x18,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36493,15 +36477,15 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,217 ; ja 49c <_sk_load_a8_hsw_8bit+0x23>
+ DB 119,217 ; ja 45b <_sk_load_a8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,118,0,0,0 ; lea 0x76(%rip),%rcx # 544 <_sk_load_a8_hsw_8bit+0xcb>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 504 <_sk_load_a8_hsw_8bit+0xcc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,186 ; jmp 49c <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,186 ; jmp 45b <_sk_load_a8_hsw_8bit+0x23>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -36509,7 +36493,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 197,249,110,208 ; vmovd %eax,%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,121,2,194,1 ; vpblendd $0x1,%xmm2,%xmm0,%xmm0
- DB 235,149 ; jmp 49c <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,149 ; jmp 45b <_sk_load_a8_hsw_8bit+0x23>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -36520,22 +36504,23 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 196,161,121,110,20,2 ; vmovd (%rdx,%r8,1),%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,105,2,192,12 ; vpblendd $0xc,%xmm0,%xmm2,%xmm0
- DB 233,90,255,255,255 ; jmpq 49c <_sk_load_a8_hsw_8bit+0x23>
- DB 102,144 ; xchg %ax,%ax
- DB 147 ; xchg %eax,%ebx
+ DB 233,90,255,255,255 ; jmpq 45b <_sk_load_a8_hsw_8bit+0x23>
+ DB 15,31,0 ; nopl (%rax)
+ DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,173,255,255,255,158 ; ljmp *-0x61000001(%rbp)
+ DB 255,172,255,255,255,157,255 ; ljmp *-0x620001(%rdi,%rdi,8)
DB 255 ; (bad)
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde000554 <_sk_xor__hsw_8bit+0xffffffffddfff225>
DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
+ DB 255,209 ; callq *%rcx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,195 ; inc %ebx
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -36550,9 +36535,9 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,28 ; jne 599 <_sk_load_a8_dst_hsw_8bit+0x39>
+ DB 117,28 ; jne 559 <_sk_load_a8_dst_hsw_8bit+0x39>
DB 196,162,121,48,12,2 ; vpmovzxbw (%rdx,%r8,1),%xmm1
- DB 197,241,219,13,133,17,0,0 ; vpand 0x1185(%rip),%xmm1,%xmm1 # 1710 <_sk_xor__hsw_8bit+0x3e1>
+ DB 197,241,219,13,133,17,0,0 ; vpand 0x1185(%rip),%xmm1,%xmm1 # 16d0 <_sk_xor__hsw_8bit+0x3e1>
DB 196,226,125,51,201 ; vpmovzxwd %xmm1,%ymm1
DB 197,245,114,241,24 ; vpslld $0x18,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36561,15 +36546,15 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,217 ; ja 583 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 119,217 ; ja 543 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 62c <_sk_load_a8_dst_hsw_8bit+0xcc>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 5ec <_sk_load_a8_dst_hsw_8bit+0xcc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
- DB 235,186 ; jmp 583 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,186 ; jmp 543 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,241,196,200,2 ; vpinsrw $0x2,%eax,%xmm1,%xmm1
@@ -36577,7 +36562,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 197,249,110,208 ; vmovd %eax,%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,113,2,202,1 ; vpblendd $0x1,%xmm2,%xmm1,%xmm1
- DB 235,149 ; jmp 583 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,149 ; jmp 543 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,241,196,200,6 ; vpinsrw $0x6,%eax,%xmm1,%xmm1
@@ -36588,7 +36573,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 196,161,121,110,20,2 ; vmovd (%rdx,%r8,1),%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,105,2,201,12 ; vpblendd $0xc,%xmm1,%xmm2,%xmm1
- DB 233,90,255,255,255 ; jmpq 583 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,90,255,255,255 ; jmpq 543 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -36618,35 +36603,35 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 196,226,125,0,21,151,14,0,0 ; vpshufb 0xe97(%rip),%ymm0,%ymm2 # 1500 <_sk_xor__hsw_8bit+0x1d1>
+ DB 196,226,125,0,21,151,14,0,0 ; vpshufb 0xe97(%rip),%ymm0,%ymm2 # 14c0 <_sk_xor__hsw_8bit+0x1d1>
DB 196,227,253,0,210,232 ; vpermq $0xe8,%ymm2,%ymm2
DB 77,133,201 ; test %r9,%r9
- DB 117,19 ; jne 687 <_sk_store_a8_hsw_8bit+0x3f>
- DB 196,226,105,0,21,195,16,0,0 ; vpshufb 0x10c3(%rip),%xmm2,%xmm2 # 1740 <_sk_xor__hsw_8bit+0x411>
+ DB 117,19 ; jne 647 <_sk_store_a8_hsw_8bit+0x3f>
+ DB 196,226,105,0,21,195,16,0,0 ; vpshufb 0x10c3(%rip),%xmm2,%xmm2 # 1700 <_sk_xor__hsw_8bit+0x411>
DB 196,161,121,214,20,2 ; vmovq %xmm2,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,239 ; ja 683 <_sk_store_a8_hsw_8bit+0x3b>
+ DB 119,239 ; ja 643 <_sk_store_a8_hsw_8bit+0x3b>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,85,0,0,0 ; lea 0x55(%rip),%rcx # 6f4 <_sk_store_a8_hsw_8bit+0xac>
+ DB 72,141,13,85,0,0,0 ; lea 0x55(%rip),%rcx # 6b4 <_sk_store_a8_hsw_8bit+0xac>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,163,121,20,20,2,0 ; vpextrb $0x0,%xmm2,(%rdx,%r8,1)
- DB 235,210 ; jmp 683 <_sk_store_a8_hsw_8bit+0x3b>
+ DB 235,210 ; jmp 643 <_sk_store_a8_hsw_8bit+0x3b>
DB 196,163,121,20,84,2,2,4 ; vpextrb $0x4,%xmm2,0x2(%rdx,%r8,1)
- DB 196,226,105,0,21,94,16,0,0 ; vpshufb 0x105e(%rip),%xmm2,%xmm2 # 1720 <_sk_xor__hsw_8bit+0x3f1>
+ DB 196,226,105,0,21,94,16,0,0 ; vpshufb 0x105e(%rip),%xmm2,%xmm2 # 16e0 <_sk_xor__hsw_8bit+0x3f1>
DB 196,163,121,21,20,2,0 ; vpextrw $0x0,%xmm2,(%rdx,%r8,1)
- DB 235,184 ; jmp 683 <_sk_store_a8_hsw_8bit+0x3b>
+ DB 235,184 ; jmp 643 <_sk_store_a8_hsw_8bit+0x3b>
DB 196,163,121,20,84,2,6,12 ; vpextrb $0xc,%xmm2,0x6(%rdx,%r8,1)
DB 196,163,121,20,84,2,5,10 ; vpextrb $0xa,%xmm2,0x5(%rdx,%r8,1)
DB 196,163,121,20,84,2,4,8 ; vpextrb $0x8,%xmm2,0x4(%rdx,%r8,1)
- DB 196,226,105,0,21,68,16,0,0 ; vpshufb 0x1044(%rip),%xmm2,%xmm2 # 1730 <_sk_xor__hsw_8bit+0x401>
+ DB 196,226,105,0,21,68,16,0,0 ; vpshufb 0x1044(%rip),%xmm2,%xmm2 # 16f0 <_sk_xor__hsw_8bit+0x401>
DB 196,161,121,126,20,2 ; vmovd %xmm2,(%rdx,%r8,1)
- DB 235,143 ; jmp 683 <_sk_store_a8_hsw_8bit+0x3b>
+ DB 235,143 ; jmp 643 <_sk_store_a8_hsw_8bit+0x3b>
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
DB 255,197 ; inc %ebp
@@ -36677,13 +36662,13 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,50 ; jne 75f <_sk_load_g8_hsw_8bit+0x4f>
+ DB 117,50 ; jne 71f <_sk_load_g8_hsw_8bit+0x4f>
DB 196,162,121,48,4,2 ; vpmovzxbw (%rdx,%r8,1),%xmm0
- DB 197,249,219,5,21,16,0,0 ; vpand 0x1015(%rip),%xmm0,%xmm0 # 1750 <_sk_xor__hsw_8bit+0x421>
+ DB 197,249,219,5,21,16,0,0 ; vpand 0x1015(%rip),%xmm0,%xmm0 # 1710 <_sk_xor__hsw_8bit+0x421>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
- DB 196,226,125,88,21,171,12,0,0 ; vpbroadcastd 0xcab(%rip),%ymm2 # 13f4 <_sk_xor__hsw_8bit+0xc5>
+ DB 196,226,125,88,21,167,12,0,0 ; vpbroadcastd 0xca7(%rip),%ymm2 # 13b0 <_sk_xor__hsw_8bit+0xc1>
DB 196,226,125,64,194 ; vpmulld %ymm2,%ymm0,%ymm0
- DB 196,226,125,88,21,161,12,0,0 ; vpbroadcastd 0xca1(%rip),%ymm2 # 13f8 <_sk_xor__hsw_8bit+0xc9>
+ DB 196,226,125,88,21,157,12,0,0 ; vpbroadcastd 0xc9d(%rip),%ymm2 # 13b4 <_sk_xor__hsw_8bit+0xc5>
DB 197,253,235,194 ; vpor %ymm2,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36691,15 +36676,15 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,195 ; ja 733 <_sk_load_g8_hsw_8bit+0x23>
+ DB 119,195 ; ja 6f3 <_sk_load_g8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 7f4 <_sk_load_g8_hsw_8bit+0xe4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 7b4 <_sk_load_g8_hsw_8bit+0xe4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,164 ; jmp 733 <_sk_load_g8_hsw_8bit+0x23>
+ DB 235,164 ; jmp 6f3 <_sk_load_g8_hsw_8bit+0x23>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -36707,7 +36692,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 197,249,110,208 ; vmovd %eax,%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,121,2,194,1 ; vpblendd $0x1,%xmm2,%xmm0,%xmm0
- DB 233,124,255,255,255 ; jmpq 733 <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,124,255,255,255 ; jmpq 6f3 <_sk_load_g8_hsw_8bit+0x23>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -36718,7 +36703,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 196,161,121,110,20,2 ; vmovd (%rdx,%r8,1),%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,105,2,192,12 ; vpblendd $0xc,%xmm0,%xmm2,%xmm0
- DB 233,65,255,255,255 ; jmpq 733 <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,65,255,255,255 ; jmpq 6f3 <_sk_load_g8_hsw_8bit+0x23>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36727,7 +36712,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde000804 <_sk_xor__hsw_8bit+0xffffffffddfff4d5>
+ DB 232,255,255,255,221 ; callq ffffffffde0007c4 <_sk_xor__hsw_8bit+0xffffffffddfff4d5>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36748,13 +36733,13 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,50 ; jne 85f <_sk_load_g8_dst_hsw_8bit+0x4f>
+ DB 117,50 ; jne 81f <_sk_load_g8_dst_hsw_8bit+0x4f>
DB 196,162,121,48,12,2 ; vpmovzxbw (%rdx,%r8,1),%xmm1
- DB 197,241,219,13,37,15,0,0 ; vpand 0xf25(%rip),%xmm1,%xmm1 # 1760 <_sk_xor__hsw_8bit+0x431>
+ DB 197,241,219,13,37,15,0,0 ; vpand 0xf25(%rip),%xmm1,%xmm1 # 1720 <_sk_xor__hsw_8bit+0x431>
DB 196,226,125,51,201 ; vpmovzxwd %xmm1,%ymm1
- DB 196,226,125,88,21,179,11,0,0 ; vpbroadcastd 0xbb3(%rip),%ymm2 # 13fc <_sk_xor__hsw_8bit+0xcd>
+ DB 196,226,125,88,21,175,11,0,0 ; vpbroadcastd 0xbaf(%rip),%ymm2 # 13b8 <_sk_xor__hsw_8bit+0xc9>
DB 196,226,117,64,202 ; vpmulld %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,169,11,0,0 ; vpbroadcastd 0xba9(%rip),%ymm2 # 1400 <_sk_xor__hsw_8bit+0xd1>
+ DB 196,226,125,88,21,165,11,0,0 ; vpbroadcastd 0xba5(%rip),%ymm2 # 13bc <_sk_xor__hsw_8bit+0xcd>
DB 197,245,235,202 ; vpor %ymm2,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36762,15 +36747,15 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,195 ; ja 833 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 119,195 ; ja 7f3 <_sk_load_g8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 8f4 <_sk_load_g8_dst_hsw_8bit+0xe4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 8b4 <_sk_load_g8_dst_hsw_8bit+0xe4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
- DB 235,164 ; jmp 833 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 235,164 ; jmp 7f3 <_sk_load_g8_dst_hsw_8bit+0x23>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,241,196,200,2 ; vpinsrw $0x2,%eax,%xmm1,%xmm1
@@ -36778,7 +36763,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 197,249,110,208 ; vmovd %eax,%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,113,2,202,1 ; vpblendd $0x1,%xmm2,%xmm1,%xmm1
- DB 233,124,255,255,255 ; jmpq 833 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,124,255,255,255 ; jmpq 7f3 <_sk_load_g8_dst_hsw_8bit+0x23>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,241,196,200,6 ; vpinsrw $0x6,%eax,%xmm1,%xmm1
@@ -36789,7 +36774,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 196,161,121,110,20,2 ; vmovd (%rdx,%r8,1),%xmm2
DB 196,226,121,48,210 ; vpmovzxbw %xmm2,%xmm2
DB 196,227,105,2,201,12 ; vpblendd $0xc,%xmm1,%xmm2,%xmm1
- DB 233,65,255,255,255 ; jmpq 833 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,65,255,255,255 ; jmpq 7f3 <_sk_load_g8_dst_hsw_8bit+0x23>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36798,7 +36783,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde000904 <_sk_xor__hsw_8bit+0xffffffffddfff5d5>
+ DB 232,255,255,255,221 ; callq ffffffffde0008c4 <_sk_xor__hsw_8bit+0xffffffffddfff5d5>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36821,9 +36806,9 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 74,141,4,137 ; lea (%rcx,%r9,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,108 ; jne 9a1 <_sk_srcover_rgba_8888_hsw_8bit+0x91>
+ DB 117,108 ; jne 961 <_sk_srcover_rgba_8888_hsw_8bit+0x91>
DB 197,254,111,16 ; vmovdqu (%rax),%ymm2
- DB 196,226,125,0,29,222,11,0,0 ; vpshufb 0xbde(%rip),%ymm0,%ymm3 # 1520 <_sk_xor__hsw_8bit+0x1f1>
+ DB 196,226,125,0,29,222,11,0,0 ; vpshufb 0xbde(%rip),%ymm0,%ymm3 # 14e0 <_sk_xor__hsw_8bit+0x1f1>
DB 196,226,125,48,226 ; vpmovzxbw %xmm2,%ymm4
DB 196,227,125,57,213,1 ; vextracti128 $0x1,%ymm2,%xmm5
DB 196,226,125,48,237 ; vpmovzxbw %xmm5,%ymm5
@@ -36842,7 +36827,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 197,237,248,211 ; vpsubb %ymm3,%ymm2,%ymm2
DB 197,237,252,208 ; vpaddb %ymm0,%ymm2,%ymm2
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 9ca <_sk_srcover_rgba_8888_hsw_8bit+0xba>
+ DB 117,49 ; jne 98a <_sk_srcover_rgba_8888_hsw_8bit+0xba>
DB 197,254,127,16 ; vmovdqu %ymm2,(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -36854,7 +36839,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,225,249,110,210 ; vmovq %rdx,%xmm2
DB 196,226,125,33,210 ; vpmovsxbd %xmm2,%ymm2
DB 196,226,109,140,16 ; vpmaskmovd (%rax),%ymm2,%ymm2
- DB 233,111,255,255,255 ; jmpq 939 <_sk_srcover_rgba_8888_hsw_8bit+0x29>
+ DB 233,111,255,255,255 ; jmpq 8f9 <_sk_srcover_rgba_8888_hsw_8bit+0x29>
DB 185,8,0,0,0 ; mov $0x8,%ecx
DB 68,41,193 ; sub %r8d,%ecx
DB 192,225,3 ; shl $0x3,%cl
@@ -36863,20 +36848,20 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,225,249,110,218 ; vmovq %rdx,%xmm3
DB 196,226,125,33,219 ; vpmovsxbd %xmm3,%ymm3
DB 196,226,101,142,16 ; vpmaskmovd %ymm2,%ymm3,(%rax)
- DB 235,173 ; jmp 99d <_sk_srcover_rgba_8888_hsw_8bit+0x8d>
+ DB 235,173 ; jmp 95d <_sk_srcover_rgba_8888_hsw_8bit+0x8d>
PUBLIC _sk_scale_1_float_hsw_8bit
_sk_scale_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,16 ; vmovss (%rax),%xmm2
- DB 197,234,89,21,6,10,0,0 ; vmulss 0xa06(%rip),%xmm2,%xmm2 # 1404 <_sk_xor__hsw_8bit+0xd5>
+ DB 197,234,89,21,2,10,0,0 ; vmulss 0xa02(%rip),%xmm2,%xmm2 # 13c0 <_sk_xor__hsw_8bit+0xd1>
DB 197,250,44,194 ; vcvttss2si %xmm2,%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
DB 196,226,125,120,210 ; vpbroadcastb %xmm2,%ymm2
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
DB 196,227,125,57,192,1 ; vextracti128 $0x1,%ymm0,%xmm0
DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0
- DB 197,237,219,21,29,11,0,0 ; vpand 0xb1d(%rip),%ymm2,%ymm2 # 1540 <_sk_xor__hsw_8bit+0x211>
+ DB 197,237,219,21,29,11,0,0 ; vpand 0xb1d(%rip),%ymm2,%ymm2 # 1500 <_sk_xor__hsw_8bit+0x211>
DB 197,237,213,224 ; vpmullw %ymm0,%ymm2,%ymm4
DB 197,237,213,211 ; vpmullw %ymm3,%ymm2,%ymm2
DB 197,237,253,211 ; vpaddw %ymm3,%ymm2,%ymm2
@@ -36899,11 +36884,11 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,106 ; jne ad8 <_sk_scale_u8_hsw_8bit+0x87>
+ DB 117,106 ; jne a98 <_sk_scale_u8_hsw_8bit+0x87>
DB 196,162,121,48,20,2 ; vpmovzxbw (%rdx,%r8,1),%xmm2
- DB 197,233,219,21,244,12,0,0 ; vpand 0xcf4(%rip),%xmm2,%xmm2 # 1770 <_sk_xor__hsw_8bit+0x441>
+ DB 197,233,219,21,244,12,0,0 ; vpand 0xcf4(%rip),%xmm2,%xmm2 # 1730 <_sk_xor__hsw_8bit+0x441>
DB 196,226,125,51,210 ; vpmovzxwd %xmm2,%ymm2
- DB 196,226,109,0,21,214,10,0,0 ; vpshufb 0xad6(%rip),%ymm2,%ymm2 # 1560 <_sk_xor__hsw_8bit+0x231>
+ DB 196,226,109,0,21,214,10,0,0 ; vpshufb 0xad6(%rip),%ymm2,%ymm2 # 1520 <_sk_xor__hsw_8bit+0x231>
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
DB 196,227,125,57,192,1 ; vextracti128 $0x1,%ymm0,%xmm0
DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0
@@ -36925,15 +36910,15 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,139 ; ja a74 <_sk_scale_u8_hsw_8bit+0x23>
+ DB 119,139 ; ja a34 <_sk_scale_u8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,124,0,0,0 ; lea 0x7c(%rip),%rcx # b70 <_sk_scale_u8_hsw_8bit+0x11f>
+ DB 72,141,13,124,0,0,0 ; lea 0x7c(%rip),%rcx # b30 <_sk_scale_u8_hsw_8bit+0x11f>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 233,105,255,255,255 ; jmpq a74 <_sk_scale_u8_hsw_8bit+0x23>
+ DB 233,105,255,255,255 ; jmpq a34 <_sk_scale_u8_hsw_8bit+0x23>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 197,233,196,208,2 ; vpinsrw $0x2,%eax,%xmm2,%xmm2
@@ -36941,7 +36926,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,226,121,48,219 ; vpmovzxbw %xmm3,%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,65,255,255,255 ; jmpq a74 <_sk_scale_u8_hsw_8bit+0x23>
+ DB 233,65,255,255,255 ; jmpq a34 <_sk_scale_u8_hsw_8bit+0x23>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 197,233,196,208,6 ; vpinsrw $0x6,%eax,%xmm2,%xmm2
@@ -36952,7 +36937,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,226,121,48,219 ; vpmovzxbw %xmm3,%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,6,255,255,255 ; jmpq a74 <_sk_scale_u8_hsw_8bit+0x23>
+ DB 233,6,255,255,255 ; jmpq a34 <_sk_scale_u8_hsw_8bit+0x23>
DB 102,144 ; xchg %ax,%ax
DB 141 ; (bad)
DB 255 ; (bad)
@@ -36961,7 +36946,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde000b80 <_sk_xor__hsw_8bit+0xffffffffddfff851>
+ DB 232,255,255,255,221 ; callq ffffffffde000b40 <_sk_xor__hsw_8bit+0xffffffffddfff851>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36976,14 +36961,14 @@ PUBLIC _sk_lerp_1_float_hsw_8bit
_sk_lerp_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,16 ; vmovss (%rax),%xmm2
- DB 197,234,89,21,110,8,0,0 ; vmulss 0x86e(%rip),%xmm2,%xmm2 # 1408 <_sk_xor__hsw_8bit+0xd9>
+ DB 197,234,89,21,106,8,0,0 ; vmulss 0x86a(%rip),%xmm2,%xmm2 # 13c4 <_sk_xor__hsw_8bit+0xd5>
DB 197,250,44,194 ; vcvttss2si %xmm2,%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
DB 196,226,125,120,210 ; vpbroadcastb %xmm2,%ymm2
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
DB 196,227,125,57,192,1 ; vextracti128 $0x1,%ymm0,%xmm0
DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0
- DB 197,237,219,37,193,9,0,0 ; vpand 0x9c1(%rip),%ymm2,%ymm4 # 1580 <_sk_xor__hsw_8bit+0x251>
+ DB 197,237,219,37,193,9,0,0 ; vpand 0x9c1(%rip),%ymm2,%ymm4 # 1540 <_sk_xor__hsw_8bit+0x251>
DB 197,221,213,232 ; vpmullw %ymm0,%ymm4,%ymm5
DB 197,221,213,227 ; vpmullw %ymm3,%ymm4,%ymm4
DB 197,221,253,219 ; vpaddw %ymm3,%ymm4,%ymm3
@@ -37024,11 +37009,11 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,192,0,0,0 ; jne d24 <_sk_lerp_u8_hsw_8bit+0xe1>
+ DB 15,133,192,0,0,0 ; jne ce4 <_sk_lerp_u8_hsw_8bit+0xe1>
DB 196,162,121,48,20,2 ; vpmovzxbw (%rdx,%r8,1),%xmm2
- DB 197,233,219,21,14,11,0,0 ; vpand 0xb0e(%rip),%xmm2,%xmm2 # 1780 <_sk_xor__hsw_8bit+0x451>
+ DB 197,233,219,21,14,11,0,0 ; vpand 0xb0e(%rip),%xmm2,%xmm2 # 1740 <_sk_xor__hsw_8bit+0x451>
DB 196,226,125,51,210 ; vpmovzxwd %xmm2,%ymm2
- DB 196,226,109,0,21,32,9,0,0 ; vpshufb 0x920(%rip),%ymm2,%ymm2 # 15a0 <_sk_xor__hsw_8bit+0x271>
+ DB 196,226,109,0,21,32,9,0,0 ; vpshufb 0x920(%rip),%ymm2,%ymm2 # 1560 <_sk_xor__hsw_8bit+0x271>
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
DB 196,227,125,57,192,1 ; vextracti128 $0x1,%ymm0,%xmm0
DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0
@@ -37068,15 +37053,15 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,49,255,255,255 ; ja c6a <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 15,135,49,255,255,255 ; ja c2a <_sk_lerp_u8_hsw_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,124,0,0,0 ; lea 0x7c(%rip),%rcx # dc0 <_sk_lerp_u8_hsw_8bit+0x17d>
+ DB 72,141,13,124,0,0,0 ; lea 0x7c(%rip),%rcx # d80 <_sk_lerp_u8_hsw_8bit+0x17d>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 233,15,255,255,255 ; jmpq c6a <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,15,255,255,255 ; jmpq c2a <_sk_lerp_u8_hsw_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 197,233,196,208,2 ; vpinsrw $0x2,%eax,%xmm2,%xmm2
@@ -37084,7 +37069,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,226,121,48,219 ; vpmovzxbw %xmm3,%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,231,254,255,255 ; jmpq c6a <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,231,254,255,255 ; jmpq c2a <_sk_lerp_u8_hsw_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 197,233,196,208,6 ; vpinsrw $0x6,%eax,%xmm2,%xmm2
@@ -37095,7 +37080,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,226,121,48,219 ; vpmovzxbw %xmm3,%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,172,254,255,255 ; jmpq c6a <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,172,254,255,255 ; jmpq c2a <_sk_lerp_u8_hsw_8bit+0x27>
DB 102,144 ; xchg %ax,%ax
DB 141 ; (bad)
DB 255 ; (bad)
@@ -37104,7 +37089,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde000dd0 <_sk_xor__hsw_8bit+0xffffffffddfffaa1>
+ DB 232,255,255,255,221 ; callq ffffffffde000d90 <_sk_xor__hsw_8bit+0xffffffffddfffaa1>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -37130,7 +37115,7 @@ _sk_move_dst_src_hsw_8bit LABEL PROC
PUBLIC _sk_black_color_hsw_8bit
_sk_black_color_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,25,5,153,9,0,0 ; vbroadcastsd 0x999(%rip),%ymm0 # 1790 <_sk_xor__hsw_8bit+0x461>
+ DB 196,226,125,25,5,153,9,0,0 ; vbroadcastsd 0x999(%rip),%ymm0 # 1750 <_sk_xor__hsw_8bit+0x461>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_white_color_hsw_8bit
@@ -37147,7 +37132,7 @@ _sk_clear_hsw_8bit LABEL PROC
PUBLIC _sk_srcatop_hsw_8bit
_sk_srcatop_hsw_8bit LABEL PROC
- DB 197,253,111,21,175,7,0,0 ; vmovdqa 0x7af(%rip),%ymm2 # 15c0 <_sk_xor__hsw_8bit+0x291>
+ DB 197,253,111,21,175,7,0,0 ; vmovdqa 0x7af(%rip),%ymm2 # 1580 <_sk_xor__hsw_8bit+0x291>
DB 196,226,117,0,218 ; vpshufb %ymm2,%ymm1,%ymm3
DB 196,226,125,48,224 ; vpmovzxbw %xmm0,%ymm4
DB 196,227,125,57,197,1 ; vextracti128 $0x1,%ymm0,%xmm5
@@ -37188,7 +37173,7 @@ _sk_srcatop_hsw_8bit LABEL PROC
PUBLIC _sk_dstatop_hsw_8bit
_sk_dstatop_hsw_8bit LABEL PROC
- DB 197,253,111,21,25,7,0,0 ; vmovdqa 0x719(%rip),%ymm2 # 15e0 <_sk_xor__hsw_8bit+0x2b1>
+ DB 197,253,111,21,25,7,0,0 ; vmovdqa 0x719(%rip),%ymm2 # 15a0 <_sk_xor__hsw_8bit+0x2b1>
DB 196,226,125,0,218 ; vpshufb %ymm2,%ymm0,%ymm3
DB 196,226,125,48,225 ; vpmovzxbw %xmm1,%ymm4
DB 196,227,125,57,205,1 ; vextracti128 $0x1,%ymm1,%xmm5
@@ -37229,7 +37214,7 @@ _sk_dstatop_hsw_8bit LABEL PROC
PUBLIC _sk_srcin_hsw_8bit
_sk_srcin_hsw_8bit LABEL PROC
- DB 196,226,117,0,21,130,6,0,0 ; vpshufb 0x682(%rip),%ymm1,%ymm2 # 1600 <_sk_xor__hsw_8bit+0x2d1>
+ DB 196,226,117,0,21,130,6,0,0 ; vpshufb 0x682(%rip),%ymm1,%ymm2 # 15c0 <_sk_xor__hsw_8bit+0x2d1>
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
DB 196,227,125,57,192,1 ; vextracti128 $0x1,%ymm0,%xmm0
DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0
@@ -37250,7 +37235,7 @@ _sk_srcin_hsw_8bit LABEL PROC
PUBLIC _sk_dstin_hsw_8bit
_sk_dstin_hsw_8bit LABEL PROC
- DB 196,226,125,0,5,75,6,0,0 ; vpshufb 0x64b(%rip),%ymm0,%ymm0 # 1620 <_sk_xor__hsw_8bit+0x2f1>
+ DB 196,226,125,0,5,75,6,0,0 ; vpshufb 0x64b(%rip),%ymm0,%ymm0 # 15e0 <_sk_xor__hsw_8bit+0x2f1>
DB 196,226,125,48,209 ; vpmovzxbw %xmm1,%ymm2
DB 196,227,125,57,203,1 ; vextracti128 $0x1,%ymm1,%xmm3
DB 196,226,125,48,219 ; vpmovzxbw %xmm3,%ymm3
@@ -37271,7 +37256,7 @@ _sk_dstin_hsw_8bit LABEL PROC
PUBLIC _sk_srcout_hsw_8bit
_sk_srcout_hsw_8bit LABEL PROC
- DB 196,226,117,0,21,20,6,0,0 ; vpshufb 0x614(%rip),%ymm1,%ymm2 # 1640 <_sk_xor__hsw_8bit+0x311>
+ DB 196,226,117,0,21,20,6,0,0 ; vpshufb 0x614(%rip),%ymm1,%ymm2 # 1600 <_sk_xor__hsw_8bit+0x311>
DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
DB 197,237,239,211 ; vpxor %ymm3,%ymm2,%ymm2
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
@@ -37294,7 +37279,7 @@ _sk_srcout_hsw_8bit LABEL PROC
PUBLIC _sk_dstout_hsw_8bit
_sk_dstout_hsw_8bit LABEL PROC
- DB 196,226,125,0,5,213,5,0,0 ; vpshufb 0x5d5(%rip),%ymm0,%ymm0 # 1660 <_sk_xor__hsw_8bit+0x331>
+ DB 196,226,125,0,5,213,5,0,0 ; vpshufb 0x5d5(%rip),%ymm0,%ymm0 # 1620 <_sk_xor__hsw_8bit+0x331>
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 197,253,239,194 ; vpxor %ymm2,%ymm0,%ymm0
DB 196,226,125,48,209 ; vpmovzxbw %xmm1,%ymm2
@@ -37317,7 +37302,7 @@ _sk_dstout_hsw_8bit LABEL PROC
PUBLIC _sk_srcover_hsw_8bit
_sk_srcover_hsw_8bit LABEL PROC
- DB 196,226,125,0,21,150,5,0,0 ; vpshufb 0x596(%rip),%ymm0,%ymm2 # 1680 <_sk_xor__hsw_8bit+0x351>
+ DB 196,226,125,0,21,150,5,0,0 ; vpshufb 0x596(%rip),%ymm0,%ymm2 # 1640 <_sk_xor__hsw_8bit+0x351>
DB 196,226,125,48,217 ; vpmovzxbw %xmm1,%ymm3
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
DB 196,226,125,48,228 ; vpmovzxbw %xmm4,%ymm4
@@ -37340,7 +37325,7 @@ _sk_srcover_hsw_8bit LABEL PROC
PUBLIC _sk_dstover_hsw_8bit
_sk_dstover_hsw_8bit LABEL PROC
- DB 196,226,117,0,21,87,5,0,0 ; vpshufb 0x557(%rip),%ymm1,%ymm2 # 16a0 <_sk_xor__hsw_8bit+0x371>
+ DB 196,226,117,0,21,87,5,0,0 ; vpshufb 0x557(%rip),%ymm1,%ymm2 # 1660 <_sk_xor__hsw_8bit+0x371>
DB 196,226,125,48,216 ; vpmovzxbw %xmm0,%ymm3
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,226,125,48,228 ; vpmovzxbw %xmm4,%ymm4
@@ -37383,7 +37368,7 @@ _sk_modulate_hsw_8bit LABEL PROC
PUBLIC _sk_multiply_hsw_8bit
_sk_multiply_hsw_8bit LABEL PROC
- DB 197,253,111,37,203,4,0,0 ; vmovdqa 0x4cb(%rip),%ymm4 # 16c0 <_sk_xor__hsw_8bit+0x391>
+ DB 197,253,111,37,203,4,0,0 ; vmovdqa 0x4cb(%rip),%ymm4 # 1680 <_sk_xor__hsw_8bit+0x391>
DB 196,226,117,0,212 ; vpshufb %ymm4,%ymm1,%ymm2
DB 197,213,118,237 ; vpcmpeqd %ymm5,%ymm5,%ymm5
DB 197,237,239,245 ; vpxor %ymm5,%ymm2,%ymm6
@@ -37458,7 +37443,7 @@ _sk_screen_hsw_8bit LABEL PROC
PUBLIC _sk_xor__hsw_8bit
_sk_xor__hsw_8bit LABEL PROC
- DB 197,253,111,21,169,3,0,0 ; vmovdqa 0x3a9(%rip),%ymm2 # 16e0 <_sk_xor__hsw_8bit+0x3b1>
+ DB 197,253,111,21,169,3,0,0 ; vmovdqa 0x3a9(%rip),%ymm2 # 16a0 <_sk_xor__hsw_8bit+0x3b1>
DB 196,226,117,0,218 ; vpshufb %ymm2,%ymm1,%ymm3
DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
DB 197,229,239,220 ; vpxor %ymm4,%ymm3,%ymm3
@@ -37500,9 +37485,7 @@ _sk_xor__hsw_8bit LABEL PROC
ALIGN 4
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 1433 <_sk_xor__hsw_8bit+0x104>
- DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 1437 <_sk_xor__hsw_8bit+0x108>
+ DB 127,67 ; jg 13f3 <_sk_xor__hsw_8bit+0x104>
DB 1,1 ; add %eax,(%rcx)
DB 1,0 ; add %eax,(%rax)
DB 0,0 ; add %al,(%rax)
@@ -37512,9 +37495,9 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 0,255 ; add %bh,%bh
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 144b <_sk_xor__hsw_8bit+0x11c>
+ DB 127,67 ; jg 1407 <_sk_xor__hsw_8bit+0x118>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 144f <_sk_xor__hsw_8bit+0x120>
+ DB 127,67 ; jg 140b <_sk_xor__hsw_8bit+0x11c>
ALIGN 32
DB 0,0 ; add %al,(%rax)
@@ -38121,25 +38104,7 @@ _sk_just_return_sse41_8bit LABEL PROC
PUBLIC _sk_uniform_color_sse41_8bit
_sk_uniform_color_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,5,52,15,0,0 ; movss 0xf34(%rip),%xmm0 # 10a0 <_sk_xor__sse41_8bit+0xad>
- DB 243,15,16,16 ; movss (%rax),%xmm2
- DB 243,15,89,208 ; mulss %xmm0,%xmm2
- DB 243,72,15,44,202 ; cvttss2si %xmm2,%rcx
- DB 243,15,16,80,4 ; movss 0x4(%rax),%xmm2
- DB 243,15,89,208 ; mulss %xmm0,%xmm2
- DB 243,72,15,44,210 ; cvttss2si %xmm2,%rdx
- DB 193,226,8 ; shl $0x8,%edx
- DB 9,202 ; or %ecx,%edx
- DB 243,15,16,80,8 ; movss 0x8(%rax),%xmm2
- DB 243,15,89,208 ; mulss %xmm0,%xmm2
- DB 243,72,15,44,202 ; cvttss2si %xmm2,%rcx
- DB 193,225,16 ; shl $0x10,%ecx
- DB 243,15,89,64,12 ; mulss 0xc(%rax),%xmm0
- DB 243,72,15,44,192 ; cvttss2si %xmm0,%rax
- DB 193,224,24 ; shl $0x18,%eax
- DB 9,200 ; or %ecx,%eax
- DB 9,208 ; or %edx,%eax
- DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 102,15,110,64,16 ; movd 0x10(%rax),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -38147,7 +38112,7 @@ _sk_uniform_color_sse41_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse41_8bit
_sk_set_rgb_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,21,223,14,0,0 ; movss 0xedf(%rip),%xmm2 # 10a4 <_sk_xor__sse41_8bit+0xb1>
+ DB 243,15,16,21,220,14,0,0 ; movss 0xedc(%rip),%xmm2 # 1058 <_sk_xor__sse41_8bit+0xae>
DB 243,15,16,24 ; movss (%rax),%xmm3
DB 243,15,89,218 ; mulss %xmm2,%xmm3
DB 243,72,15,44,203 ; cvttss2si %xmm3,%rcx
@@ -38162,7 +38127,7 @@ _sk_set_rgb_sse41_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
- DB 102,15,219,5,171,14,0,0 ; pand 0xeab(%rip),%xmm0 # 10b0 <_sk_xor__sse41_8bit+0xbd>
+ DB 102,15,219,5,180,14,0,0 ; pand 0xeb4(%rip),%xmm0 # 1070 <_sk_xor__sse41_8bit+0xc6>
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -38170,8 +38135,8 @@ _sk_set_rgb_sse41_8bit LABEL PROC
PUBLIC _sk_premul_sse41_8bit
_sk_premul_sse41_8bit LABEL PROC
DB 102,15,111,216 ; movdqa %xmm0,%xmm3
- DB 102,15,56,0,29,166,14,0,0 ; pshufb 0xea6(%rip),%xmm3 # 10c0 <_sk_xor__sse41_8bit+0xcd>
- DB 102,15,235,29,174,14,0,0 ; por 0xeae(%rip),%xmm3 # 10d0 <_sk_xor__sse41_8bit+0xdd>
+ DB 102,15,56,0,29,175,14,0,0 ; pshufb 0xeaf(%rip),%xmm3 # 1080 <_sk_xor__sse41_8bit+0xd6>
+ DB 102,15,235,29,183,14,0,0 ; por 0xeb7(%rip),%xmm3 # 1090 <_sk_xor__sse41_8bit+0xe6>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,48,232 ; pmovzxbw %xmm0,%xmm5
DB 102,15,104,196 ; punpckhbw %xmm4,%xmm0
@@ -38181,7 +38146,7 @@ _sk_premul_sse41_8bit LABEL PROC
DB 102,15,213,213 ; pmullw %xmm5,%xmm2
DB 102,15,253,216 ; paddw %xmm0,%xmm3
DB 102,15,253,213 ; paddw %xmm5,%xmm2
- DB 102,15,111,5,144,14,0,0 ; movdqa 0xe90(%rip),%xmm0 # 10e0 <_sk_xor__sse41_8bit+0xed>
+ DB 102,15,111,5,153,14,0,0 ; movdqa 0xe99(%rip),%xmm0 # 10a0 <_sk_xor__sse41_8bit+0xf6>
DB 102,15,56,0,216 ; pshufb %xmm0,%xmm3
DB 102,15,56,0,208 ; pshufb %xmm0,%xmm2
DB 102,15,108,211 ; punpcklqdq %xmm3,%xmm2
@@ -38191,7 +38156,7 @@ _sk_premul_sse41_8bit LABEL PROC
PUBLIC _sk_swap_rb_sse41_8bit
_sk_swap_rb_sse41_8bit LABEL PROC
- DB 102,15,56,0,5,129,14,0,0 ; pshufb 0xe81(%rip),%xmm0 # 10f0 <_sk_xor__sse41_8bit+0xfd>
+ DB 102,15,56,0,5,138,14,0,0 ; pshufb 0xe8a(%rip),%xmm0 # 10b0 <_sk_xor__sse41_8bit+0x106>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -38206,25 +38171,25 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 29e <_sk_load_8888_sse41_8bit+0x2b>
+ DB 117,10 ; jne 255 <_sk_load_8888_sse41_8bit+0x2b>
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,42 ; je 2d2 <_sk_load_8888_sse41_8bit+0x5f>
+ DB 116,42 ; je 289 <_sk_load_8888_sse41_8bit+0x5f>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 2c4 <_sk_load_8888_sse41_8bit+0x51>
+ DB 116,18 ; je 27b <_sk_load_8888_sse41_8bit+0x51>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,226 ; jne 29a <_sk_load_8888_sse41_8bit+0x27>
+ DB 117,226 ; jne 251 <_sk_load_8888_sse41_8bit+0x27>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,20,130 ; movq (%rdx,%r8,4),%xmm2
DB 102,15,58,14,194,15 ; pblendw $0xf,%xmm2,%xmm0
- DB 235,200 ; jmp 29a <_sk_load_8888_sse41_8bit+0x27>
+ DB 235,200 ; jmp 251 <_sk_load_8888_sse41_8bit+0x27>
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,192 ; jmp 29a <_sk_load_8888_sse41_8bit+0x27>
+ DB 235,192 ; jmp 251 <_sk_load_8888_sse41_8bit+0x27>
PUBLIC _sk_load_8888_dst_sse41_8bit
_sk_load_8888_dst_sse41_8bit LABEL PROC
@@ -38237,25 +38202,25 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 305 <_sk_load_8888_dst_sse41_8bit+0x2b>
+ DB 117,10 ; jne 2bc <_sk_load_8888_dst_sse41_8bit+0x2b>
DB 243,66,15,111,12,130 ; movdqu (%rdx,%r8,4),%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,42 ; je 339 <_sk_load_8888_dst_sse41_8bit+0x5f>
+ DB 116,42 ; je 2f0 <_sk_load_8888_dst_sse41_8bit+0x5f>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 32b <_sk_load_8888_dst_sse41_8bit+0x51>
+ DB 116,18 ; je 2e2 <_sk_load_8888_dst_sse41_8bit+0x51>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,226 ; jne 301 <_sk_load_8888_dst_sse41_8bit+0x27>
+ DB 117,226 ; jne 2b8 <_sk_load_8888_dst_sse41_8bit+0x27>
DB 102,66,15,110,76,130,8 ; movd 0x8(%rdx,%r8,4),%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
DB 243,66,15,126,20,130 ; movq (%rdx,%r8,4),%xmm2
DB 102,15,58,14,202,15 ; pblendw $0xf,%xmm2,%xmm1
- DB 235,200 ; jmp 301 <_sk_load_8888_dst_sse41_8bit+0x27>
+ DB 235,200 ; jmp 2b8 <_sk_load_8888_dst_sse41_8bit+0x27>
DB 102,66,15,110,12,130 ; movd (%rdx,%r8,4),%xmm1
- DB 235,192 ; jmp 301 <_sk_load_8888_dst_sse41_8bit+0x27>
+ DB 235,192 ; jmp 2b8 <_sk_load_8888_dst_sse41_8bit+0x27>
PUBLIC _sk_store_8888_sse41_8bit
_sk_store_8888_sse41_8bit LABEL PROC
@@ -38268,22 +38233,22 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 36c <_sk_store_8888_sse41_8bit+0x2b>
+ DB 117,10 ; jne 323 <_sk_store_8888_sse41_8bit+0x2b>
DB 243,66,15,127,4,130 ; movdqu %xmm0,(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,29 ; je 393 <_sk_store_8888_sse41_8bit+0x52>
+ DB 116,29 ; je 34a <_sk_store_8888_sse41_8bit+0x52>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 38b <_sk_store_8888_sse41_8bit+0x4a>
+ DB 116,15 ; je 342 <_sk_store_8888_sse41_8bit+0x4a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,230 ; jne 368 <_sk_store_8888_sse41_8bit+0x27>
+ DB 117,230 ; jne 31f <_sk_store_8888_sse41_8bit+0x27>
DB 102,66,15,58,22,68,130,8,2 ; pextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
DB 102,66,15,214,4,130 ; movq %xmm0,(%rdx,%r8,4)
- DB 235,213 ; jmp 368 <_sk_store_8888_sse41_8bit+0x27>
+ DB 235,213 ; jmp 31f <_sk_store_8888_sse41_8bit+0x27>
DB 102,66,15,126,4,130 ; movd %xmm0,(%rdx,%r8,4)
- DB 235,205 ; jmp 368 <_sk_store_8888_sse41_8bit+0x27>
+ DB 235,205 ; jmp 31f <_sk_store_8888_sse41_8bit+0x27>
PUBLIC _sk_load_bgra_sse41_8bit
_sk_load_bgra_sse41_8bit LABEL PROC
@@ -38296,26 +38261,26 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,19 ; jne 3cf <_sk_load_bgra_sse41_8bit+0x34>
+ DB 117,19 ; jne 386 <_sk_load_bgra_sse41_8bit+0x34>
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
- DB 102,15,56,0,5,53,13,0,0 ; pshufb 0xd35(%rip),%xmm0 # 1100 <_sk_xor__sse41_8bit+0x10d>
+ DB 102,15,56,0,5,62,13,0,0 ; pshufb 0xd3e(%rip),%xmm0 # 10c0 <_sk_xor__sse41_8bit+0x116>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,42 ; je 403 <_sk_load_bgra_sse41_8bit+0x68>
+ DB 116,42 ; je 3ba <_sk_load_bgra_sse41_8bit+0x68>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 3f5 <_sk_load_bgra_sse41_8bit+0x5a>
+ DB 116,18 ; je 3ac <_sk_load_bgra_sse41_8bit+0x5a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,217 ; jne 3c2 <_sk_load_bgra_sse41_8bit+0x27>
+ DB 117,217 ; jne 379 <_sk_load_bgra_sse41_8bit+0x27>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,20,130 ; movq (%rdx,%r8,4),%xmm2
DB 102,15,58,14,194,15 ; pblendw $0xf,%xmm2,%xmm0
- DB 235,191 ; jmp 3c2 <_sk_load_bgra_sse41_8bit+0x27>
+ DB 235,191 ; jmp 379 <_sk_load_bgra_sse41_8bit+0x27>
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,183 ; jmp 3c2 <_sk_load_bgra_sse41_8bit+0x27>
+ DB 235,183 ; jmp 379 <_sk_load_bgra_sse41_8bit+0x27>
PUBLIC _sk_load_bgra_dst_sse41_8bit
_sk_load_bgra_dst_sse41_8bit LABEL PROC
@@ -38328,26 +38293,26 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,19 ; jne 43f <_sk_load_bgra_dst_sse41_8bit+0x34>
+ DB 117,19 ; jne 3f6 <_sk_load_bgra_dst_sse41_8bit+0x34>
DB 243,66,15,111,12,130 ; movdqu (%rdx,%r8,4),%xmm1
- DB 102,15,56,0,13,213,12,0,0 ; pshufb 0xcd5(%rip),%xmm1 # 1110 <_sk_xor__sse41_8bit+0x11d>
+ DB 102,15,56,0,13,222,12,0,0 ; pshufb 0xcde(%rip),%xmm1 # 10d0 <_sk_xor__sse41_8bit+0x126>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,42 ; je 473 <_sk_load_bgra_dst_sse41_8bit+0x68>
+ DB 116,42 ; je 42a <_sk_load_bgra_dst_sse41_8bit+0x68>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 465 <_sk_load_bgra_dst_sse41_8bit+0x5a>
+ DB 116,18 ; je 41c <_sk_load_bgra_dst_sse41_8bit+0x5a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,217 ; jne 432 <_sk_load_bgra_dst_sse41_8bit+0x27>
+ DB 117,217 ; jne 3e9 <_sk_load_bgra_dst_sse41_8bit+0x27>
DB 102,66,15,110,76,130,8 ; movd 0x8(%rdx,%r8,4),%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
DB 243,66,15,126,20,130 ; movq (%rdx,%r8,4),%xmm2
DB 102,15,58,14,202,15 ; pblendw $0xf,%xmm2,%xmm1
- DB 235,191 ; jmp 432 <_sk_load_bgra_dst_sse41_8bit+0x27>
+ DB 235,191 ; jmp 3e9 <_sk_load_bgra_dst_sse41_8bit+0x27>
DB 102,66,15,110,12,130 ; movd (%rdx,%r8,4),%xmm1
- DB 235,183 ; jmp 432 <_sk_load_bgra_dst_sse41_8bit+0x27>
+ DB 235,183 ; jmp 3e9 <_sk_load_bgra_dst_sse41_8bit+0x27>
PUBLIC _sk_store_bgra_sse41_8bit
_sk_store_bgra_sse41_8bit LABEL PROC
@@ -38360,24 +38325,24 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,56,0,21,124,12,0,0 ; pshufb 0xc7c(%rip),%xmm2 # 1120 <_sk_xor__sse41_8bit+0x12d>
+ DB 102,15,56,0,21,133,12,0,0 ; pshufb 0xc85(%rip),%xmm2 # 10e0 <_sk_xor__sse41_8bit+0x136>
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 4b3 <_sk_store_bgra_sse41_8bit+0x38>
+ DB 117,10 ; jne 46a <_sk_store_bgra_sse41_8bit+0x38>
DB 243,66,15,127,20,130 ; movdqu %xmm2,(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,29 ; je 4da <_sk_store_bgra_sse41_8bit+0x5f>
+ DB 116,29 ; je 491 <_sk_store_bgra_sse41_8bit+0x5f>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 4d2 <_sk_store_bgra_sse41_8bit+0x57>
+ DB 116,15 ; je 489 <_sk_store_bgra_sse41_8bit+0x57>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,230 ; jne 4af <_sk_store_bgra_sse41_8bit+0x34>
+ DB 117,230 ; jne 466 <_sk_store_bgra_sse41_8bit+0x34>
DB 102,66,15,58,22,84,130,8,2 ; pextrd $0x2,%xmm2,0x8(%rdx,%r8,4)
DB 102,66,15,214,20,130 ; movq %xmm2,(%rdx,%r8,4)
- DB 235,213 ; jmp 4af <_sk_store_bgra_sse41_8bit+0x34>
+ DB 235,213 ; jmp 466 <_sk_store_bgra_sse41_8bit+0x34>
DB 102,66,15,126,20,130 ; movd %xmm2,(%rdx,%r8,4)
- DB 235,205 ; jmp 4af <_sk_store_bgra_sse41_8bit+0x34>
+ DB 235,205 ; jmp 466 <_sk_store_bgra_sse41_8bit+0x34>
PUBLIC _sk_load_a8_sse41_8bit
_sk_load_a8_sse41_8bit LABEL PROC
@@ -38389,19 +38354,19 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 50f <_sk_load_a8_sse41_8bit+0x2d>
+ DB 117,16 ; jne 4c6 <_sk_load_a8_sse41_8bit+0x2d>
DB 102,66,15,56,49,4,2 ; pmovzxbd (%rdx,%r8,1),%xmm0
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 54e <_sk_load_a8_sse41_8bit+0x6c>
+ DB 116,53 ; je 505 <_sk_load_a8_sse41_8bit+0x6c>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 538 <_sk_load_a8_sse41_8bit+0x56>
+ DB 116,21 ; je 4ef <_sk_load_a8_sse41_8bit+0x56>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 506 <_sk_load_a8_sse41_8bit+0x24>
+ DB 117,221 ; jne 4bd <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -38409,10 +38374,10 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,49,210 ; pmovzxbd %xmm2,%xmm2
DB 102,15,58,14,194,15 ; pblendw $0xf,%xmm2,%xmm0
- DB 235,184 ; jmp 506 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,184 ; jmp 4bd <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,173 ; jmp 506 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,173 ; jmp 4bd <_sk_load_a8_sse41_8bit+0x24>
PUBLIC _sk_load_a8_dst_sse41_8bit
_sk_load_a8_dst_sse41_8bit LABEL PROC
@@ -38424,19 +38389,19 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 586 <_sk_load_a8_dst_sse41_8bit+0x2d>
+ DB 117,16 ; jne 53d <_sk_load_a8_dst_sse41_8bit+0x2d>
DB 102,66,15,56,49,12,2 ; pmovzxbd (%rdx,%r8,1),%xmm1
DB 102,15,114,241,24 ; pslld $0x18,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 5c5 <_sk_load_a8_dst_sse41_8bit+0x6c>
+ DB 116,53 ; je 57c <_sk_load_a8_dst_sse41_8bit+0x6c>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 5af <_sk_load_a8_dst_sse41_8bit+0x56>
+ DB 116,21 ; je 566 <_sk_load_a8_dst_sse41_8bit+0x56>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 57d <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 117,221 ; jne 534 <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
@@ -38444,10 +38409,10 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,49,210 ; pmovzxbd %xmm2,%xmm2
DB 102,15,58,14,202,15 ; pblendw $0xf,%xmm2,%xmm1
- DB 235,184 ; jmp 57d <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,184 ; jmp 534 <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,173 ; jmp 57d <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,173 ; jmp 534 <_sk_load_a8_dst_sse41_8bit+0x24>
PUBLIC _sk_store_a8_sse41_8bit
_sk_store_a8_sse41_8bit LABEL PROC
@@ -38461,24 +38426,24 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,114,210,24 ; psrld $0x18,%xmm2
DB 77,133,201 ; test %r9,%r9
- DB 117,19 ; jne 609 <_sk_store_a8_sse41_8bit+0x39>
- DB 102,15,56,0,21,65,11,0,0 ; pshufb 0xb41(%rip),%xmm2 # 1140 <_sk_xor__sse41_8bit+0x14d>
+ DB 117,19 ; jne 5c0 <_sk_store_a8_sse41_8bit+0x39>
+ DB 102,15,56,0,21,74,11,0,0 ; pshufb 0xb4a(%rip),%xmm2 # 1100 <_sk_xor__sse41_8bit+0x156>
DB 102,66,15,126,20,2 ; movd %xmm2,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,40 ; je 63b <_sk_store_a8_sse41_8bit+0x6b>
+ DB 116,40 ; je 5f2 <_sk_store_a8_sse41_8bit+0x6b>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 628 <_sk_store_a8_sse41_8bit+0x58>
+ DB 116,15 ; je 5df <_sk_store_a8_sse41_8bit+0x58>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,230 ; jne 605 <_sk_store_a8_sse41_8bit+0x35>
+ DB 117,230 ; jne 5bc <_sk_store_a8_sse41_8bit+0x35>
DB 102,66,15,58,20,84,2,2,8 ; pextrb $0x8,%xmm2,0x2(%rdx,%r8,1)
- DB 102,15,56,0,21,255,10,0,0 ; pshufb 0xaff(%rip),%xmm2 # 1130 <_sk_xor__sse41_8bit+0x13d>
+ DB 102,15,56,0,21,8,11,0,0 ; pshufb 0xb08(%rip),%xmm2 # 10f0 <_sk_xor__sse41_8bit+0x146>
DB 102,66,15,58,21,20,2,0 ; pextrw $0x0,%xmm2,(%rdx,%r8,1)
- DB 235,202 ; jmp 605 <_sk_store_a8_sse41_8bit+0x35>
+ DB 235,202 ; jmp 5bc <_sk_store_a8_sse41_8bit+0x35>
DB 102,66,15,58,20,20,2,0 ; pextrb $0x0,%xmm2,(%rdx,%r8,1)
- DB 235,192 ; jmp 605 <_sk_store_a8_sse41_8bit+0x35>
+ DB 235,192 ; jmp 5bc <_sk_store_a8_sse41_8bit+0x35>
PUBLIC _sk_load_g8_sse41_8bit
_sk_load_g8_sse41_8bit LABEL PROC
@@ -38490,21 +38455,21 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,36 ; jne 686 <_sk_load_g8_sse41_8bit+0x41>
+ DB 117,36 ; jne 63d <_sk_load_g8_sse41_8bit+0x41>
DB 102,66,15,56,49,4,2 ; pmovzxbd (%rdx,%r8,1),%xmm0
- DB 102,15,219,5,223,10,0,0 ; pand 0xadf(%rip),%xmm0 # 1150 <_sk_xor__sse41_8bit+0x15d>
- DB 102,15,56,64,5,230,10,0,0 ; pmulld 0xae6(%rip),%xmm0 # 1160 <_sk_xor__sse41_8bit+0x16d>
- DB 102,15,235,5,238,10,0,0 ; por 0xaee(%rip),%xmm0 # 1170 <_sk_xor__sse41_8bit+0x17d>
+ DB 102,15,219,5,232,10,0,0 ; pand 0xae8(%rip),%xmm0 # 1110 <_sk_xor__sse41_8bit+0x166>
+ DB 102,15,56,64,5,239,10,0,0 ; pmulld 0xaef(%rip),%xmm0 # 1120 <_sk_xor__sse41_8bit+0x176>
+ DB 102,15,235,5,247,10,0,0 ; por 0xaf7(%rip),%xmm0 # 1130 <_sk_xor__sse41_8bit+0x186>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 6c5 <_sk_load_g8_sse41_8bit+0x80>
+ DB 116,53 ; je 67c <_sk_load_g8_sse41_8bit+0x80>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 6af <_sk_load_g8_sse41_8bit+0x6a>
+ DB 116,21 ; je 666 <_sk_load_g8_sse41_8bit+0x6a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,201 ; jne 669 <_sk_load_g8_sse41_8bit+0x24>
+ DB 117,201 ; jne 620 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -38512,10 +38477,10 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,49,210 ; pmovzxbd %xmm2,%xmm2
DB 102,15,58,14,194,15 ; pblendw $0xf,%xmm2,%xmm0
- DB 235,164 ; jmp 669 <_sk_load_g8_sse41_8bit+0x24>
+ DB 235,164 ; jmp 620 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,153 ; jmp 669 <_sk_load_g8_sse41_8bit+0x24>
+ DB 235,153 ; jmp 620 <_sk_load_g8_sse41_8bit+0x24>
PUBLIC _sk_load_g8_dst_sse41_8bit
_sk_load_g8_dst_sse41_8bit LABEL PROC
@@ -38527,21 +38492,21 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,36 ; jne 711 <_sk_load_g8_dst_sse41_8bit+0x41>
+ DB 117,36 ; jne 6c8 <_sk_load_g8_dst_sse41_8bit+0x41>
DB 102,66,15,56,49,12,2 ; pmovzxbd (%rdx,%r8,1),%xmm1
- DB 102,15,219,13,132,10,0,0 ; pand 0xa84(%rip),%xmm1 # 1180 <_sk_xor__sse41_8bit+0x18d>
- DB 102,15,56,64,13,139,10,0,0 ; pmulld 0xa8b(%rip),%xmm1 # 1190 <_sk_xor__sse41_8bit+0x19d>
- DB 102,15,235,13,147,10,0,0 ; por 0xa93(%rip),%xmm1 # 11a0 <_sk_xor__sse41_8bit+0x1ad>
+ DB 102,15,219,13,141,10,0,0 ; pand 0xa8d(%rip),%xmm1 # 1140 <_sk_xor__sse41_8bit+0x196>
+ DB 102,15,56,64,13,148,10,0,0 ; pmulld 0xa94(%rip),%xmm1 # 1150 <_sk_xor__sse41_8bit+0x1a6>
+ DB 102,15,235,13,156,10,0,0 ; por 0xa9c(%rip),%xmm1 # 1160 <_sk_xor__sse41_8bit+0x1b6>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 750 <_sk_load_g8_dst_sse41_8bit+0x80>
+ DB 116,53 ; je 707 <_sk_load_g8_dst_sse41_8bit+0x80>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 73a <_sk_load_g8_dst_sse41_8bit+0x6a>
+ DB 116,21 ; je 6f1 <_sk_load_g8_dst_sse41_8bit+0x6a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,201 ; jne 6f4 <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 117,201 ; jne 6ab <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
@@ -38549,10 +38514,10 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,49,210 ; pmovzxbd %xmm2,%xmm2
DB 102,15,58,14,202,15 ; pblendw $0xf,%xmm2,%xmm1
- DB 235,164 ; jmp 6f4 <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 235,164 ; jmp 6ab <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,153 ; jmp 6f4 <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 235,153 ; jmp 6ab <_sk_load_g8_dst_sse41_8bit+0x24>
PUBLIC _sk_srcover_rgba_8888_sse41_8bit
_sk_srcover_rgba_8888_sse41_8bit LABEL PROC
@@ -38565,11 +38530,11 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,106 ; jne 7e6 <_sk_srcover_rgba_8888_sse41_8bit+0x8b>
+ DB 117,106 ; jne 79d <_sk_srcover_rgba_8888_sse41_8bit+0x8b>
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
DB 77,133,201 ; test %r9,%r9
DB 102,15,111,216 ; movdqa %xmm0,%xmm3
- DB 102,15,56,0,29,30,10,0,0 ; pshufb 0xa1e(%rip),%xmm3 # 11b0 <_sk_xor__sse41_8bit+0x1bd>
+ DB 102,15,56,0,29,39,10,0,0 ; pshufb 0xa27(%rip),%xmm3 # 1170 <_sk_xor__sse41_8bit+0x1c6>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,104,236 ; punpckhbw %xmm4,%xmm5
@@ -38580,62 +38545,62 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,15,213,254 ; pmullw %xmm6,%xmm7
DB 102,15,253,221 ; paddw %xmm5,%xmm3
DB 102,15,253,254 ; paddw %xmm6,%xmm7
- DB 102,15,111,37,252,9,0,0 ; movdqa 0x9fc(%rip),%xmm4 # 11c0 <_sk_xor__sse41_8bit+0x1cd>
+ DB 102,15,111,37,5,10,0,0 ; movdqa 0xa05(%rip),%xmm4 # 1180 <_sk_xor__sse41_8bit+0x1d6>
DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3
DB 102,15,56,0,252 ; pshufb %xmm4,%xmm7
DB 102,15,108,251 ; punpcklqdq %xmm3,%xmm7
DB 102,15,248,215 ; psubb %xmm7,%xmm2
DB 102,15,252,208 ; paddb %xmm0,%xmm2
- DB 117,60 ; jne 818 <_sk_srcover_rgba_8888_sse41_8bit+0xbd>
+ DB 117,60 ; jne 7cf <_sk_srcover_rgba_8888_sse41_8bit+0xbd>
DB 243,66,15,127,20,130 ; movdqu %xmm2,(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 68,137,200 ; mov %r9d,%eax
DB 36,3 ; and $0x3,%al
DB 60,1 ; cmp $0x1,%al
- DB 116,80 ; je 83f <_sk_srcover_rgba_8888_sse41_8bit+0xe4>
+ DB 116,80 ; je 7f6 <_sk_srcover_rgba_8888_sse41_8bit+0xe4>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 60,2 ; cmp $0x2,%al
- DB 116,16 ; je 807 <_sk_srcover_rgba_8888_sse41_8bit+0xac>
+ DB 116,16 ; je 7be <_sk_srcover_rgba_8888_sse41_8bit+0xac>
DB 60,3 ; cmp $0x3,%al
- DB 117,135 ; jne 782 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ DB 117,135 ; jne 739 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,66,15,126,28,130 ; movq (%rdx,%r8,4),%xmm3
DB 102,15,58,14,211,15 ; pblendw $0xf,%xmm3,%xmm2
- DB 233,106,255,255,255 ; jmpq 782 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ DB 233,106,255,255,255 ; jmpq 739 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,40 ; je 84a <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 116,40 ; je 801 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 837 <_sk_srcover_rgba_8888_sse41_8bit+0xdc>
+ DB 116,15 ; je 7ee <_sk_srcover_rgba_8888_sse41_8bit+0xdc>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,180 ; jne 7e2 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
+ DB 117,180 ; jne 799 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
DB 102,66,15,58,22,84,130,8,2 ; pextrd $0x2,%xmm2,0x8(%rdx,%r8,4)
DB 102,66,15,214,20,130 ; movq %xmm2,(%rdx,%r8,4)
- DB 235,163 ; jmp 7e2 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
+ DB 235,163 ; jmp 799 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 233,56,255,255,255 ; jmpq 782 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ DB 233,56,255,255,255 ; jmpq 739 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
DB 102,66,15,126,20,130 ; movd %xmm2,(%rdx,%r8,4)
- DB 235,144 ; jmp 7e2 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
+ DB 235,144 ; jmp 799 <_sk_srcover_rgba_8888_sse41_8bit+0x87>
PUBLIC _sk_scale_1_float_sse41_8bit
_sk_scale_1_float_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,16 ; movss (%rax),%xmm2
- DB 243,15,89,21,72,8,0,0 ; mulss 0x848(%rip),%xmm2 # 10a8 <_sk_xor__sse41_8bit+0xb5>
+ DB 243,15,89,21,69,8,0,0 ; mulss 0x845(%rip),%xmm2 # 105c <_sk_xor__sse41_8bit+0xb2>
DB 243,15,44,194 ; cvttss2si %xmm2,%eax
DB 102,15,110,216 ; movd %eax,%xmm3
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 102,15,56,48,224 ; pmovzxbw %xmm0,%xmm4
DB 102,15,104,194 ; punpckhbw %xmm2,%xmm0
- DB 102,15,56,0,29,83,9,0,0 ; pshufb 0x953(%rip),%xmm3 # 11d0 <_sk_xor__sse41_8bit+0x1dd>
+ DB 102,15,56,0,29,92,9,0,0 ; pshufb 0x95c(%rip),%xmm3 # 1190 <_sk_xor__sse41_8bit+0x1e6>
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
DB 102,15,213,212 ; pmullw %xmm4,%xmm2
DB 102,15,213,216 ; pmullw %xmm0,%xmm3
DB 102,15,253,216 ; paddw %xmm0,%xmm3
DB 102,15,253,212 ; paddw %xmm4,%xmm2
- DB 102,15,111,5,71,9,0,0 ; movdqa 0x947(%rip),%xmm0 # 11e0 <_sk_xor__sse41_8bit+0x1ed>
+ DB 102,15,111,5,80,9,0,0 ; movdqa 0x950(%rip),%xmm0 # 11a0 <_sk_xor__sse41_8bit+0x1f6>
DB 102,15,56,0,216 ; pshufb %xmm0,%xmm3
DB 102,15,56,0,208 ; pshufb %xmm0,%xmm2
DB 102,15,108,211 ; punpcklqdq %xmm3,%xmm2
@@ -38653,10 +38618,10 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,84 ; jne 920 <_sk_scale_u8_sse41_8bit+0x71>
+ DB 117,84 ; jne 8d7 <_sk_scale_u8_sse41_8bit+0x71>
DB 102,66,15,56,49,28,2 ; pmovzxbd (%rdx,%r8,1),%xmm3
DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 102,15,56,0,29,16,9,0,0 ; pshufb 0x910(%rip),%xmm3 # 11f0 <_sk_xor__sse41_8bit+0x1fd>
+ DB 102,15,56,0,29,25,9,0,0 ; pshufb 0x919(%rip),%xmm3 # 11b0 <_sk_xor__sse41_8bit+0x206>
DB 102,15,56,48,232 ; pmovzxbw %xmm0,%xmm5
DB 102,15,104,196 ; punpckhbw %xmm4,%xmm0
DB 102,15,56,48,211 ; pmovzxbw %xmm3,%xmm2
@@ -38665,7 +38630,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,213,213 ; pmullw %xmm5,%xmm2
DB 102,15,253,216 ; paddw %xmm0,%xmm3
DB 102,15,253,213 ; paddw %xmm5,%xmm2
- DB 102,15,111,5,246,8,0,0 ; movdqa 0x8f6(%rip),%xmm0 # 1200 <_sk_xor__sse41_8bit+0x20d>
+ DB 102,15,111,5,255,8,0,0 ; movdqa 0x8ff(%rip),%xmm0 # 11c0 <_sk_xor__sse41_8bit+0x216>
DB 102,15,56,0,216 ; pshufb %xmm0,%xmm3
DB 102,15,56,0,208 ; pshufb %xmm0,%xmm2
DB 102,15,108,211 ; punpcklqdq %xmm3,%xmm2
@@ -38674,12 +38639,12 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,56 ; je 962 <_sk_scale_u8_sse41_8bit+0xb3>
+ DB 116,56 ; je 919 <_sk_scale_u8_sse41_8bit+0xb3>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 949 <_sk_scale_u8_sse41_8bit+0x9a>
+ DB 116,21 ; je 900 <_sk_scale_u8_sse41_8bit+0x9a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,153 ; jne 8d3 <_sk_scale_u8_sse41_8bit+0x24>
+ DB 117,153 ; jne 88a <_sk_scale_u8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
@@ -38687,30 +38652,30 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,49,210 ; pmovzxbd %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,113,255,255,255 ; jmpq 8d3 <_sk_scale_u8_sse41_8bit+0x24>
+ DB 233,113,255,255,255 ; jmpq 88a <_sk_scale_u8_sse41_8bit+0x24>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,99,255,255,255 ; jmpq 8d3 <_sk_scale_u8_sse41_8bit+0x24>
+ DB 233,99,255,255,255 ; jmpq 88a <_sk_scale_u8_sse41_8bit+0x24>
PUBLIC _sk_lerp_1_float_sse41_8bit
_sk_lerp_1_float_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,16 ; movss (%rax),%xmm2
- DB 243,15,89,21,46,7,0,0 ; mulss 0x72e(%rip),%xmm2 # 10ac <_sk_xor__sse41_8bit+0xb9>
+ DB 243,15,89,21,43,7,0,0 ; mulss 0x72b(%rip),%xmm2 # 1060 <_sk_xor__sse41_8bit+0xb6>
DB 243,15,44,194 ; cvttss2si %xmm2,%eax
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3
DB 102,15,56,48,232 ; pmovzxbw %xmm0,%xmm5
DB 102,15,104,196 ; punpckhbw %xmm4,%xmm0
- DB 102,15,111,21,112,8,0,0 ; movdqa 0x870(%rip),%xmm2 # 1210 <_sk_xor__sse41_8bit+0x21d>
+ DB 102,15,111,21,121,8,0,0 ; movdqa 0x879(%rip),%xmm2 # 11d0 <_sk_xor__sse41_8bit+0x226>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
DB 102,15,213,240 ; pmullw %xmm0,%xmm6
DB 102,15,213,213 ; pmullw %xmm5,%xmm2
DB 102,15,253,240 ; paddw %xmm0,%xmm6
DB 102,15,253,213 ; paddw %xmm5,%xmm2
- DB 102,15,111,45,96,8,0,0 ; movdqa 0x860(%rip),%xmm5 # 1220 <_sk_xor__sse41_8bit+0x22d>
+ DB 102,15,111,45,105,8,0,0 ; movdqa 0x869(%rip),%xmm5 # 11e0 <_sk_xor__sse41_8bit+0x236>
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,56,0,213 ; pshufb %xmm5,%xmm2
DB 102,15,108,214 ; punpcklqdq %xmm6,%xmm2
@@ -38742,10 +38707,10 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,148,0,0,0 ; jne ac7 <_sk_lerp_u8_sse41_8bit+0xb5>
+ DB 15,133,148,0,0,0 ; jne a7e <_sk_lerp_u8_sse41_8bit+0xb5>
DB 102,66,15,56,49,20,2 ; pmovzxbd (%rdx,%r8,1),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 102,15,56,0,21,233,7,0,0 ; pshufb 0x7e9(%rip),%xmm2 # 1230 <_sk_xor__sse41_8bit+0x23d>
+ DB 102,15,56,0,21,242,7,0,0 ; pshufb 0x7f2(%rip),%xmm2 # 11f0 <_sk_xor__sse41_8bit+0x246>
DB 102,15,56,48,232 ; pmovzxbw %xmm0,%xmm5
DB 102,15,104,196 ; punpckhbw %xmm4,%xmm0
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
@@ -38755,7 +38720,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,213,221 ; pmullw %xmm5,%xmm3
DB 102,15,253,240 ; paddw %xmm0,%xmm6
DB 102,15,253,221 ; paddw %xmm5,%xmm3
- DB 102,15,111,45,203,7,0,0 ; movdqa 0x7cb(%rip),%xmm5 # 1240 <_sk_xor__sse41_8bit+0x24d>
+ DB 102,15,111,45,212,7,0,0 ; movdqa 0x7d4(%rip),%xmm5 # 1200 <_sk_xor__sse41_8bit+0x256>
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,56,0,221 ; pshufb %xmm5,%xmm3
DB 102,15,108,222 ; punpcklqdq %xmm6,%xmm3
@@ -38778,12 +38743,12 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,60 ; je b0d <_sk_lerp_u8_sse41_8bit+0xfb>
+ DB 116,60 ; je ac4 <_sk_lerp_u8_sse41_8bit+0xfb>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,25 ; je af4 <_sk_lerp_u8_sse41_8bit+0xe2>
+ DB 116,25 ; je aab <_sk_lerp_u8_sse41_8bit+0xe2>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,85,255,255,255 ; jne a3a <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 15,133,85,255,255,255 ; jne 9f1 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
@@ -38791,10 +38756,10 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,56,49,219 ; pmovzxbd %xmm3,%xmm3
DB 102,15,58,14,211,15 ; pblendw $0xf,%xmm3,%xmm2
- DB 233,45,255,255,255 ; jmpq a3a <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,45,255,255,255 ; jmpq 9f1 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,31,255,255,255 ; jmpq a3a <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,31,255,255,255 ; jmpq 9f1 <_sk_lerp_u8_sse41_8bit+0x28>
PUBLIC _sk_move_src_dst_sse41_8bit
_sk_move_src_dst_sse41_8bit LABEL PROC
@@ -38811,7 +38776,7 @@ _sk_move_dst_src_sse41_8bit LABEL PROC
PUBLIC _sk_black_color_sse41_8bit
_sk_black_color_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,30,7,0,0 ; movaps 0x71e(%rip),%xmm0 # 1250 <_sk_xor__sse41_8bit+0x25d>
+ DB 15,40,5,39,7,0,0 ; movaps 0x727(%rip),%xmm0 # 1210 <_sk_xor__sse41_8bit+0x266>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_white_color_sse41_8bit
@@ -38828,7 +38793,7 @@ _sk_clear_sse41_8bit LABEL PROC
PUBLIC _sk_srcatop_sse41_8bit
_sk_srcatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,5,20,7,0,0 ; movdqa 0x714(%rip),%xmm8 # 1260 <_sk_xor__sse41_8bit+0x26d>
+ DB 102,68,15,111,5,29,7,0,0 ; movdqa 0x71d(%rip),%xmm8 # 1220 <_sk_xor__sse41_8bit+0x276>
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
DB 102,15,56,48,225 ; pmovzxbw %xmm1,%xmm4
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
@@ -38843,7 +38808,7 @@ _sk_srcatop_sse41_8bit LABEL PROC
DB 102,15,56,48,248 ; pmovzxbw %xmm0,%xmm7
DB 102,15,213,215 ; pmullw %xmm7,%xmm2
DB 102,15,253,215 ; paddw %xmm7,%xmm2
- DB 102,15,111,61,223,6,0,0 ; movdqa 0x6df(%rip),%xmm7 # 1270 <_sk_xor__sse41_8bit+0x27d>
+ DB 102,15,111,61,232,6,0,0 ; movdqa 0x6e8(%rip),%xmm7 # 1230 <_sk_xor__sse41_8bit+0x286>
DB 102,15,56,0,239 ; pshufb %xmm7,%xmm5
DB 102,15,56,0,215 ; pshufb %xmm7,%xmm2
DB 102,15,108,213 ; punpcklqdq %xmm5,%xmm2
@@ -38866,7 +38831,7 @@ _sk_srcatop_sse41_8bit LABEL PROC
PUBLIC _sk_dstatop_sse41_8bit
_sk_dstatop_sse41_8bit LABEL PROC
- DB 102,15,111,21,152,6,0,0 ; movdqa 0x698(%rip),%xmm2 # 1280 <_sk_xor__sse41_8bit+0x28d>
+ DB 102,15,111,21,161,6,0,0 ; movdqa 0x6a1(%rip),%xmm2 # 1240 <_sk_xor__sse41_8bit+0x296>
DB 102,15,111,216 ; movdqa %xmm0,%xmm3
DB 102,15,56,0,218 ; pshufb %xmm2,%xmm3
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -38880,7 +38845,7 @@ _sk_dstatop_sse41_8bit LABEL PROC
DB 102,15,253,223 ; paddw %xmm7,%xmm3
DB 102,15,213,229 ; pmullw %xmm5,%xmm4
DB 102,15,253,229 ; paddw %xmm5,%xmm4
- DB 102,15,111,45,102,6,0,0 ; movdqa 0x666(%rip),%xmm5 # 1290 <_sk_xor__sse41_8bit+0x29d>
+ DB 102,15,111,45,111,6,0,0 ; movdqa 0x66f(%rip),%xmm5 # 1250 <_sk_xor__sse41_8bit+0x2a6>
DB 102,15,56,0,221 ; pshufb %xmm5,%xmm3
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,15,108,227 ; punpcklqdq %xmm3,%xmm4
@@ -38906,7 +38871,7 @@ _sk_dstatop_sse41_8bit LABEL PROC
PUBLIC _sk_srcin_sse41_8bit
_sk_srcin_sse41_8bit LABEL PROC
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
- DB 102,15,56,0,29,16,6,0,0 ; pshufb 0x610(%rip),%xmm3 # 12a0 <_sk_xor__sse41_8bit+0x2ad>
+ DB 102,15,56,0,29,25,6,0,0 ; pshufb 0x619(%rip),%xmm3 # 1260 <_sk_xor__sse41_8bit+0x2b6>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,48,232 ; pmovzxbw %xmm0,%xmm5
DB 102,15,104,196 ; punpckhbw %xmm4,%xmm0
@@ -38916,7 +38881,7 @@ _sk_srcin_sse41_8bit LABEL PROC
DB 102,15,213,213 ; pmullw %xmm5,%xmm2
DB 102,15,253,216 ; paddw %xmm0,%xmm3
DB 102,15,253,213 ; paddw %xmm5,%xmm2
- DB 102,15,111,5,242,5,0,0 ; movdqa 0x5f2(%rip),%xmm0 # 12b0 <_sk_xor__sse41_8bit+0x2bd>
+ DB 102,15,111,5,251,5,0,0 ; movdqa 0x5fb(%rip),%xmm0 # 1270 <_sk_xor__sse41_8bit+0x2c6>
DB 102,15,56,0,216 ; pshufb %xmm0,%xmm3
DB 102,15,56,0,208 ; pshufb %xmm0,%xmm2
DB 102,15,108,211 ; punpcklqdq %xmm3,%xmm2
@@ -38926,7 +38891,7 @@ _sk_srcin_sse41_8bit LABEL PROC
PUBLIC _sk_dstin_sse41_8bit
_sk_dstin_sse41_8bit LABEL PROC
- DB 102,15,56,0,5,227,5,0,0 ; pshufb 0x5e3(%rip),%xmm0 # 12c0 <_sk_xor__sse41_8bit+0x2cd>
+ DB 102,15,56,0,5,236,5,0,0 ; pshufb 0x5ec(%rip),%xmm0 # 1280 <_sk_xor__sse41_8bit+0x2d6>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,56,48,225 ; pmovzxbw %xmm1,%xmm4
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
@@ -38937,7 +38902,7 @@ _sk_dstin_sse41_8bit LABEL PROC
DB 102,15,213,212 ; pmullw %xmm4,%xmm2
DB 102,15,253,197 ; paddw %xmm5,%xmm0
DB 102,15,253,212 ; paddw %xmm4,%xmm2
- DB 102,15,111,29,193,5,0,0 ; movdqa 0x5c1(%rip),%xmm3 # 12d0 <_sk_xor__sse41_8bit+0x2dd>
+ DB 102,15,111,29,202,5,0,0 ; movdqa 0x5ca(%rip),%xmm3 # 1290 <_sk_xor__sse41_8bit+0x2e6>
DB 102,15,56,0,195 ; pshufb %xmm3,%xmm0
DB 102,15,56,0,211 ; pshufb %xmm3,%xmm2
DB 102,15,108,208 ; punpcklqdq %xmm0,%xmm2
@@ -38948,7 +38913,7 @@ _sk_dstin_sse41_8bit LABEL PROC
PUBLIC _sk_srcout_sse41_8bit
_sk_srcout_sse41_8bit LABEL PROC
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,56,0,21,174,5,0,0 ; pshufb 0x5ae(%rip),%xmm2 # 12e0 <_sk_xor__sse41_8bit+0x2ed>
+ DB 102,15,56,0,21,183,5,0,0 ; pshufb 0x5b7(%rip),%xmm2 # 12a0 <_sk_xor__sse41_8bit+0x2f6>
DB 102,15,118,219 ; pcmpeqd %xmm3,%xmm3
DB 102,15,239,218 ; pxor %xmm2,%xmm3
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -38960,7 +38925,7 @@ _sk_srcout_sse41_8bit LABEL PROC
DB 102,15,213,213 ; pmullw %xmm5,%xmm2
DB 102,15,253,216 ; paddw %xmm0,%xmm3
DB 102,15,253,213 ; paddw %xmm5,%xmm2
- DB 102,15,111,5,136,5,0,0 ; movdqa 0x588(%rip),%xmm0 # 12f0 <_sk_xor__sse41_8bit+0x2fd>
+ DB 102,15,111,5,145,5,0,0 ; movdqa 0x591(%rip),%xmm0 # 12b0 <_sk_xor__sse41_8bit+0x306>
DB 102,15,56,0,216 ; pshufb %xmm0,%xmm3
DB 102,15,56,0,208 ; pshufb %xmm0,%xmm2
DB 102,15,108,211 ; punpcklqdq %xmm3,%xmm2
@@ -38970,7 +38935,7 @@ _sk_srcout_sse41_8bit LABEL PROC
PUBLIC _sk_dstout_sse41_8bit
_sk_dstout_sse41_8bit LABEL PROC
- DB 102,15,56,0,5,121,5,0,0 ; pshufb 0x579(%rip),%xmm0 # 1300 <_sk_xor__sse41_8bit+0x30d>
+ DB 102,15,56,0,5,130,5,0,0 ; pshufb 0x582(%rip),%xmm0 # 12c0 <_sk_xor__sse41_8bit+0x316>
DB 102,15,118,210 ; pcmpeqd %xmm2,%xmm2
DB 102,15,239,208 ; pxor %xmm0,%xmm2
DB 102,15,239,219 ; pxor %xmm3,%xmm3
@@ -38983,7 +38948,7 @@ _sk_dstout_sse41_8bit LABEL PROC
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
DB 102,15,253,213 ; paddw %xmm5,%xmm2
DB 102,15,253,196 ; paddw %xmm4,%xmm0
- DB 102,15,111,29,79,5,0,0 ; movdqa 0x54f(%rip),%xmm3 # 1310 <_sk_xor__sse41_8bit+0x31d>
+ DB 102,15,111,29,88,5,0,0 ; movdqa 0x558(%rip),%xmm3 # 12d0 <_sk_xor__sse41_8bit+0x326>
DB 102,15,56,0,211 ; pshufb %xmm3,%xmm2
DB 102,15,56,0,195 ; pshufb %xmm3,%xmm0
DB 102,15,108,194 ; punpcklqdq %xmm2,%xmm0
@@ -38993,7 +38958,7 @@ _sk_dstout_sse41_8bit LABEL PROC
PUBLIC _sk_srcover_sse41_8bit
_sk_srcover_sse41_8bit LABEL PROC
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,56,0,21,64,5,0,0 ; pshufb 0x540(%rip),%xmm2 # 1320 <_sk_xor__sse41_8bit+0x32d>
+ DB 102,15,56,0,21,73,5,0,0 ; pshufb 0x549(%rip),%xmm2 # 12e0 <_sk_xor__sse41_8bit+0x336>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,56,48,225 ; pmovzxbw %xmm1,%xmm4
DB 102,15,252,193 ; paddb %xmm1,%xmm0
@@ -39005,7 +38970,7 @@ _sk_srcover_sse41_8bit LABEL PROC
DB 102,15,213,244 ; pmullw %xmm4,%xmm6
DB 102,15,253,213 ; paddw %xmm5,%xmm2
DB 102,15,253,244 ; paddw %xmm4,%xmm6
- DB 102,15,111,29,26,5,0,0 ; movdqa 0x51a(%rip),%xmm3 # 1330 <_sk_xor__sse41_8bit+0x33d>
+ DB 102,15,111,29,35,5,0,0 ; movdqa 0x523(%rip),%xmm3 # 12f0 <_sk_xor__sse41_8bit+0x346>
DB 102,15,56,0,211 ; pshufb %xmm3,%xmm2
DB 102,15,56,0,243 ; pshufb %xmm3,%xmm6
DB 102,15,108,242 ; punpcklqdq %xmm2,%xmm6
@@ -39019,7 +38984,7 @@ _sk_dstover_sse41_8bit LABEL PROC
DB 102,15,56,48,216 ; pmovzxbw %xmm0,%xmm3
DB 102,15,252,193 ; paddb %xmm1,%xmm0
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
- DB 102,15,56,0,37,250,4,0,0 ; pshufb 0x4fa(%rip),%xmm4 # 1340 <_sk_xor__sse41_8bit+0x34d>
+ DB 102,15,56,0,37,3,5,0,0 ; pshufb 0x503(%rip),%xmm4 # 1300 <_sk_xor__sse41_8bit+0x356>
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,104,213 ; punpckhbw %xmm5,%xmm2
DB 102,15,56,48,244 ; pmovzxbw %xmm4,%xmm6
@@ -39028,7 +38993,7 @@ _sk_dstover_sse41_8bit LABEL PROC
DB 102,15,213,243 ; pmullw %xmm3,%xmm6
DB 102,15,253,226 ; paddw %xmm2,%xmm4
DB 102,15,253,243 ; paddw %xmm3,%xmm6
- DB 102,15,111,21,225,4,0,0 ; movdqa 0x4e1(%rip),%xmm2 # 1350 <_sk_xor__sse41_8bit+0x35d>
+ DB 102,15,111,21,234,4,0,0 ; movdqa 0x4ea(%rip),%xmm2 # 1310 <_sk_xor__sse41_8bit+0x366>
DB 102,15,56,0,226 ; pshufb %xmm2,%xmm4
DB 102,15,56,0,242 ; pshufb %xmm2,%xmm6
DB 102,15,108,244 ; punpcklqdq %xmm4,%xmm6
@@ -39048,7 +39013,7 @@ _sk_modulate_sse41_8bit LABEL PROC
DB 102,15,213,212 ; pmullw %xmm4,%xmm2
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,212 ; paddw %xmm4,%xmm2
- DB 102,15,111,5,169,4,0,0 ; movdqa 0x4a9(%rip),%xmm0 # 1360 <_sk_xor__sse41_8bit+0x36d>
+ DB 102,15,111,5,178,4,0,0 ; movdqa 0x4b2(%rip),%xmm0 # 1320 <_sk_xor__sse41_8bit+0x376>
DB 102,15,56,0,232 ; pshufb %xmm0,%xmm5
DB 102,15,56,0,208 ; pshufb %xmm0,%xmm2
DB 102,15,108,213 ; punpcklqdq %xmm5,%xmm2
@@ -39058,7 +39023,7 @@ _sk_modulate_sse41_8bit LABEL PROC
PUBLIC _sk_multiply_sse41_8bit
_sk_multiply_sse41_8bit LABEL PROC
- DB 102,68,15,111,5,154,4,0,0 ; movdqa 0x49a(%rip),%xmm8 # 1370 <_sk_xor__sse41_8bit+0x37d>
+ DB 102,68,15,111,5,163,4,0,0 ; movdqa 0x4a3(%rip),%xmm8 # 1330 <_sk_xor__sse41_8bit+0x386>
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,56,48,209 ; pmovzxbw %xmm1,%xmm2
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
@@ -39075,7 +39040,7 @@ _sk_multiply_sse41_8bit LABEL PROC
DB 102,15,213,254 ; pmullw %xmm6,%xmm7
DB 102,15,253,235 ; paddw %xmm3,%xmm5
DB 102,15,253,254 ; paddw %xmm6,%xmm7
- DB 102,68,15,111,29,87,4,0,0 ; movdqa 0x457(%rip),%xmm11 # 1380 <_sk_xor__sse41_8bit+0x38d>
+ DB 102,68,15,111,29,96,4,0,0 ; movdqa 0x460(%rip),%xmm11 # 1340 <_sk_xor__sse41_8bit+0x396>
DB 102,65,15,56,0,235 ; pshufb %xmm11,%xmm5
DB 102,65,15,56,0,251 ; pshufb %xmm11,%xmm7
DB 102,15,108,253 ; punpcklqdq %xmm5,%xmm7
@@ -39118,7 +39083,7 @@ _sk_screen_sse41_8bit LABEL PROC
DB 102,15,213,235 ; pmullw %xmm3,%xmm5
DB 102,15,253,235 ; paddw %xmm3,%xmm5
DB 102,15,253,242 ; paddw %xmm2,%xmm6
- DB 102,15,111,21,179,3,0,0 ; movdqa 0x3b3(%rip),%xmm2 # 1390 <_sk_xor__sse41_8bit+0x39d>
+ DB 102,15,111,21,188,3,0,0 ; movdqa 0x3bc(%rip),%xmm2 # 1350 <_sk_xor__sse41_8bit+0x3a6>
DB 102,15,56,0,242 ; pshufb %xmm2,%xmm6
DB 102,15,56,0,234 ; pshufb %xmm2,%xmm5
DB 102,15,108,238 ; punpcklqdq %xmm6,%xmm5
@@ -39128,7 +39093,7 @@ _sk_screen_sse41_8bit LABEL PROC
PUBLIC _sk_xor__sse41_8bit
_sk_xor__sse41_8bit LABEL PROC
- DB 102,68,15,111,5,164,3,0,0 ; movdqa 0x3a4(%rip),%xmm8 # 13a0 <_sk_xor__sse41_8bit+0x3ad>
+ DB 102,68,15,111,5,173,3,0,0 ; movdqa 0x3ad(%rip),%xmm8 # 1360 <_sk_xor__sse41_8bit+0x3b6>
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
DB 102,15,56,48,225 ; pmovzxbw %xmm1,%xmm4
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
@@ -39145,7 +39110,7 @@ _sk_xor__sse41_8bit LABEL PROC
DB 102,15,56,48,208 ; pmovzxbw %xmm0,%xmm2
DB 102,15,213,242 ; pmullw %xmm2,%xmm6
DB 102,15,253,242 ; paddw %xmm2,%xmm6
- DB 102,68,15,111,21,100,3,0,0 ; movdqa 0x364(%rip),%xmm10 # 13b0 <_sk_xor__sse41_8bit+0x3bd>
+ DB 102,68,15,111,21,109,3,0,0 ; movdqa 0x36d(%rip),%xmm10 # 1370 <_sk_xor__sse41_8bit+0x3c6>
DB 102,65,15,56,0,234 ; pshufb %xmm10,%xmm5
DB 102,65,15,56,0,242 ; pshufb %xmm10,%xmm6
DB 102,15,108,245 ; punpcklqdq %xmm5,%xmm6
@@ -39168,13 +39133,11 @@ _sk_xor__sse41_8bit LABEL PROC
ALIGN 4
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 10e7 <_sk_xor__sse41_8bit+0xf4>
- DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 10eb <_sk_xor__sse41_8bit+0xf8>
+ DB 127,67 ; jg 109f <_sk_xor__sse41_8bit+0xf5>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 10ef <_sk_xor__sse41_8bit+0xfc>
+ DB 127,67 ; jg 10a3 <_sk_xor__sse41_8bit+0xf9>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 10f3 <_sk_xor__sse41_8bit+0x100>
+ DB 127,67 ; jg 10a7 <_sk_xor__sse41_8bit+0xfd>
ALIGN 16
DB 0,0 ; add %al,(%rax)
@@ -39652,25 +39615,7 @@ _sk_just_return_sse2_8bit LABEL PROC
PUBLIC _sk_uniform_color_sse2_8bit
_sk_uniform_color_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,5,92,17,0,0 ; movss 0x115c(%rip),%xmm0 # 12c8 <_sk_xor__sse2_8bit+0xc9>
- DB 243,15,16,16 ; movss (%rax),%xmm2
- DB 243,15,89,208 ; mulss %xmm0,%xmm2
- DB 243,72,15,44,202 ; cvttss2si %xmm2,%rcx
- DB 243,15,16,80,4 ; movss 0x4(%rax),%xmm2
- DB 243,15,89,208 ; mulss %xmm0,%xmm2
- DB 243,72,15,44,210 ; cvttss2si %xmm2,%rdx
- DB 193,226,8 ; shl $0x8,%edx
- DB 9,202 ; or %ecx,%edx
- DB 243,15,16,80,8 ; movss 0x8(%rax),%xmm2
- DB 243,15,89,208 ; mulss %xmm0,%xmm2
- DB 243,72,15,44,202 ; cvttss2si %xmm2,%rcx
- DB 193,225,16 ; shl $0x10,%ecx
- DB 243,15,89,64,12 ; mulss 0xc(%rax),%xmm0
- DB 243,72,15,44,192 ; cvttss2si %xmm0,%rax
- DB 193,224,24 ; shl $0x18,%eax
- DB 9,200 ; or %ecx,%eax
- DB 9,208 ; or %edx,%eax
- DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 102,15,110,64,16 ; movd 0x10(%rax),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -39678,7 +39623,7 @@ _sk_uniform_color_sse2_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse2_8bit
_sk_set_rgb_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,21,7,17,0,0 ; movss 0x1107(%rip),%xmm2 # 12cc <_sk_xor__sse2_8bit+0xcd>
+ DB 243,15,16,21,0,17,0,0 ; movss 0x1100(%rip),%xmm2 # 127c <_sk_xor__sse2_8bit+0xc6>
DB 243,15,16,24 ; movss (%rax),%xmm3
DB 243,15,89,218 ; mulss %xmm2,%xmm3
DB 243,72,15,44,203 ; cvttss2si %xmm3,%rcx
@@ -39693,7 +39638,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
- DB 102,15,219,5,219,16,0,0 ; pand 0x10db(%rip),%xmm0 # 12e0 <_sk_xor__sse2_8bit+0xe1>
+ DB 102,15,219,5,212,16,0,0 ; pand 0x10d4(%rip),%xmm0 # 1290 <_sk_xor__sse2_8bit+0xda>
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -39706,7 +39651,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,210 ; punpcklbw %xmm2,%xmm2
DB 242,15,112,210,95 ; pshuflw $0x5f,%xmm2,%xmm2
DB 243,15,112,218,95 ; pshufhw $0x5f,%xmm2,%xmm3
- DB 102,15,235,29,190,16,0,0 ; por 0x10be(%rip),%xmm3 # 12f0 <_sk_xor__sse2_8bit+0xf1>
+ DB 102,15,235,29,183,16,0,0 ; por 0x10b7(%rip),%xmm3 # 12a0 <_sk_xor__sse2_8bit+0xea>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,96,212 ; punpcklbw %xmm4,%xmm2
@@ -39750,24 +39695,24 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 2cb <_sk_load_8888_sse2_8bit+0x2b>
+ DB 117,10 ; jne 282 <_sk_load_8888_sse2_8bit+0x2b>
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,36 ; je 2f9 <_sk_load_8888_sse2_8bit+0x59>
+ DB 116,36 ; je 2b0 <_sk_load_8888_sse2_8bit+0x59>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 2f1 <_sk_load_8888_sse2_8bit+0x51>
+ DB 116,18 ; je 2a8 <_sk_load_8888_sse2_8bit+0x51>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,226 ; jne 2c7 <_sk_load_8888_sse2_8bit+0x27>
+ DB 117,226 ; jne 27e <_sk_load_8888_sse2_8bit+0x27>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 235,206 ; jmp 2c7 <_sk_load_8888_sse2_8bit+0x27>
+ DB 235,206 ; jmp 27e <_sk_load_8888_sse2_8bit+0x27>
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,198 ; jmp 2c7 <_sk_load_8888_sse2_8bit+0x27>
+ DB 235,198 ; jmp 27e <_sk_load_8888_sse2_8bit+0x27>
PUBLIC _sk_load_8888_dst_sse2_8bit
_sk_load_8888_dst_sse2_8bit LABEL PROC
@@ -39780,24 +39725,24 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 32c <_sk_load_8888_dst_sse2_8bit+0x2b>
+ DB 117,10 ; jne 2e3 <_sk_load_8888_dst_sse2_8bit+0x2b>
DB 243,66,15,111,12,130 ; movdqu (%rdx,%r8,4),%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,36 ; je 35a <_sk_load_8888_dst_sse2_8bit+0x59>
+ DB 116,36 ; je 311 <_sk_load_8888_dst_sse2_8bit+0x59>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 352 <_sk_load_8888_dst_sse2_8bit+0x51>
+ DB 116,18 ; je 309 <_sk_load_8888_dst_sse2_8bit+0x51>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,226 ; jne 328 <_sk_load_8888_dst_sse2_8bit+0x27>
+ DB 117,226 ; jne 2df <_sk_load_8888_dst_sse2_8bit+0x27>
DB 102,66,15,110,76,130,8 ; movd 0x8(%rdx,%r8,4),%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
DB 102,66,15,18,12,130 ; movlpd (%rdx,%r8,4),%xmm1
- DB 235,206 ; jmp 328 <_sk_load_8888_dst_sse2_8bit+0x27>
+ DB 235,206 ; jmp 2df <_sk_load_8888_dst_sse2_8bit+0x27>
DB 102,66,15,110,12,130 ; movd (%rdx,%r8,4),%xmm1
- DB 235,198 ; jmp 328 <_sk_load_8888_dst_sse2_8bit+0x27>
+ DB 235,198 ; jmp 2df <_sk_load_8888_dst_sse2_8bit+0x27>
PUBLIC _sk_store_8888_sse2_8bit
_sk_store_8888_sse2_8bit LABEL PROC
@@ -39810,23 +39755,23 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 38d <_sk_store_8888_sse2_8bit+0x2b>
+ DB 117,10 ; jne 344 <_sk_store_8888_sse2_8bit+0x2b>
DB 243,66,15,127,4,130 ; movdqu %xmm0,(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,32 ; je 3b7 <_sk_store_8888_sse2_8bit+0x55>
+ DB 116,32 ; je 36e <_sk_store_8888_sse2_8bit+0x55>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 3af <_sk_store_8888_sse2_8bit+0x4d>
+ DB 116,18 ; je 366 <_sk_store_8888_sse2_8bit+0x4d>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,230 ; jne 389 <_sk_store_8888_sse2_8bit+0x27>
+ DB 117,230 ; jne 340 <_sk_store_8888_sse2_8bit+0x27>
DB 102,15,112,208,78 ; pshufd $0x4e,%xmm0,%xmm2
DB 102,66,15,126,84,130,8 ; movd %xmm2,0x8(%rdx,%r8,4)
DB 102,66,15,214,4,130 ; movq %xmm0,(%rdx,%r8,4)
- DB 235,210 ; jmp 389 <_sk_store_8888_sse2_8bit+0x27>
+ DB 235,210 ; jmp 340 <_sk_store_8888_sse2_8bit+0x27>
DB 102,66,15,126,4,130 ; movd %xmm0,(%rdx,%r8,4)
- DB 235,202 ; jmp 389 <_sk_store_8888_sse2_8bit+0x27>
+ DB 235,202 ; jmp 340 <_sk_store_8888_sse2_8bit+0x27>
PUBLIC _sk_load_bgra_sse2_8bit
_sk_load_bgra_sse2_8bit LABEL PROC
@@ -39839,7 +39784,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,50 ; jne 412 <_sk_load_bgra_sse2_8bit+0x53>
+ DB 117,50 ; jne 3c9 <_sk_load_bgra_sse2_8bit+0x53>
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,111,216 ; movdqa %xmm0,%xmm3
@@ -39854,18 +39799,18 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,36 ; je 440 <_sk_load_bgra_sse2_8bit+0x81>
+ DB 116,36 ; je 3f7 <_sk_load_bgra_sse2_8bit+0x81>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 438 <_sk_load_bgra_sse2_8bit+0x79>
+ DB 116,18 ; je 3ef <_sk_load_bgra_sse2_8bit+0x79>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,186 ; jne 3e6 <_sk_load_bgra_sse2_8bit+0x27>
+ DB 117,186 ; jne 39d <_sk_load_bgra_sse2_8bit+0x27>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 235,166 ; jmp 3e6 <_sk_load_bgra_sse2_8bit+0x27>
+ DB 235,166 ; jmp 39d <_sk_load_bgra_sse2_8bit+0x27>
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,158 ; jmp 3e6 <_sk_load_bgra_sse2_8bit+0x27>
+ DB 235,158 ; jmp 39d <_sk_load_bgra_sse2_8bit+0x27>
PUBLIC _sk_load_bgra_dst_sse2_8bit
_sk_load_bgra_dst_sse2_8bit LABEL PROC
@@ -39878,7 +39823,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,50 ; jne 49b <_sk_load_bgra_dst_sse2_8bit+0x53>
+ DB 117,50 ; jne 452 <_sk_load_bgra_dst_sse2_8bit+0x53>
DB 243,66,15,111,12,130 ; movdqu (%rdx,%r8,4),%xmm1
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
@@ -39893,18 +39838,18 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,36 ; je 4c9 <_sk_load_bgra_dst_sse2_8bit+0x81>
+ DB 116,36 ; je 480 <_sk_load_bgra_dst_sse2_8bit+0x81>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 4c1 <_sk_load_bgra_dst_sse2_8bit+0x79>
+ DB 116,18 ; je 478 <_sk_load_bgra_dst_sse2_8bit+0x79>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,186 ; jne 46f <_sk_load_bgra_dst_sse2_8bit+0x27>
+ DB 117,186 ; jne 426 <_sk_load_bgra_dst_sse2_8bit+0x27>
DB 102,66,15,110,76,130,8 ; movd 0x8(%rdx,%r8,4),%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
DB 102,66,15,18,12,130 ; movlpd (%rdx,%r8,4),%xmm1
- DB 235,166 ; jmp 46f <_sk_load_bgra_dst_sse2_8bit+0x27>
+ DB 235,166 ; jmp 426 <_sk_load_bgra_dst_sse2_8bit+0x27>
DB 102,66,15,110,12,130 ; movd (%rdx,%r8,4),%xmm1
- DB 235,158 ; jmp 46f <_sk_load_bgra_dst_sse2_8bit+0x27>
+ DB 235,158 ; jmp 426 <_sk_load_bgra_dst_sse2_8bit+0x27>
PUBLIC _sk_store_bgra_sse2_8bit
_sk_store_bgra_sse2_8bit LABEL PROC
@@ -39927,23 +39872,23 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 243,15,112,210,198 ; pshufhw $0xc6,%xmm2,%xmm2
DB 102,15,103,211 ; packuswb %xmm3,%xmm2
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 528 <_sk_store_bgra_sse2_8bit+0x57>
+ DB 117,10 ; jne 4df <_sk_store_bgra_sse2_8bit+0x57>
DB 243,66,15,127,20,130 ; movdqu %xmm2,(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,32 ; je 552 <_sk_store_bgra_sse2_8bit+0x81>
+ DB 116,32 ; je 509 <_sk_store_bgra_sse2_8bit+0x81>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 54a <_sk_store_bgra_sse2_8bit+0x79>
+ DB 116,18 ; je 501 <_sk_store_bgra_sse2_8bit+0x79>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,230 ; jne 524 <_sk_store_bgra_sse2_8bit+0x53>
+ DB 117,230 ; jne 4db <_sk_store_bgra_sse2_8bit+0x53>
DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
DB 102,66,15,126,92,130,8 ; movd %xmm3,0x8(%rdx,%r8,4)
DB 102,66,15,214,20,130 ; movq %xmm2,(%rdx,%r8,4)
- DB 235,210 ; jmp 524 <_sk_store_bgra_sse2_8bit+0x53>
+ DB 235,210 ; jmp 4db <_sk_store_bgra_sse2_8bit+0x53>
DB 102,66,15,126,20,130 ; movd %xmm2,(%rdx,%r8,4)
- DB 235,202 ; jmp 524 <_sk_store_bgra_sse2_8bit+0x53>
+ DB 235,202 ; jmp 4db <_sk_store_bgra_sse2_8bit+0x53>
PUBLIC _sk_load_a8_sse2_8bit
_sk_load_a8_sse2_8bit LABEL PROC
@@ -39955,7 +39900,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,23 ; jne 58e <_sk_load_a8_sse2_8bit+0x34>
+ DB 117,23 ; jne 545 <_sk_load_a8_sse2_8bit+0x34>
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
@@ -39964,12 +39909,12 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 5ce <_sk_load_a8_sse2_8bit+0x74>
+ DB 116,54 ; je 585 <_sk_load_a8_sse2_8bit+0x74>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 5b7 <_sk_load_a8_sse2_8bit+0x5d>
+ DB 116,21 ; je 56e <_sk_load_a8_sse2_8bit+0x5d>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 585 <_sk_load_a8_sse2_8bit+0x2b>
+ DB 117,221 ; jne 53c <_sk_load_a8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -39978,10 +39923,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
DB 242,15,16,194 ; movsd %xmm2,%xmm0
- DB 235,183 ; jmp 585 <_sk_load_a8_sse2_8bit+0x2b>
+ DB 235,183 ; jmp 53c <_sk_load_a8_sse2_8bit+0x2b>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,172 ; jmp 585 <_sk_load_a8_sse2_8bit+0x2b>
+ DB 235,172 ; jmp 53c <_sk_load_a8_sse2_8bit+0x2b>
PUBLIC _sk_load_a8_dst_sse2_8bit
_sk_load_a8_dst_sse2_8bit LABEL PROC
@@ -39993,7 +39938,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,23 ; jne 60d <_sk_load_a8_dst_sse2_8bit+0x34>
+ DB 117,23 ; jne 5c4 <_sk_load_a8_dst_sse2_8bit+0x34>
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
@@ -40002,12 +39947,12 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 64d <_sk_load_a8_dst_sse2_8bit+0x74>
+ DB 116,54 ; je 604 <_sk_load_a8_dst_sse2_8bit+0x74>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 636 <_sk_load_a8_dst_sse2_8bit+0x5d>
+ DB 116,21 ; je 5ed <_sk_load_a8_dst_sse2_8bit+0x5d>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 604 <_sk_load_a8_dst_sse2_8bit+0x2b>
+ DB 117,221 ; jne 5bb <_sk_load_a8_dst_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
@@ -40016,10 +39961,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
DB 242,15,16,202 ; movsd %xmm2,%xmm1
- DB 235,183 ; jmp 604 <_sk_load_a8_dst_sse2_8bit+0x2b>
+ DB 235,183 ; jmp 5bb <_sk_load_a8_dst_sse2_8bit+0x2b>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,172 ; jmp 604 <_sk_load_a8_dst_sse2_8bit+0x2b>
+ DB 235,172 ; jmp 5bb <_sk_load_a8_dst_sse2_8bit+0x2b>
PUBLIC _sk_store_a8_sse2_8bit
_sk_store_a8_sse2_8bit LABEL PROC
@@ -40034,8 +39979,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,114,210,24 ; psrld $0x18,%xmm2
DB 77,133,201 ; test %r9,%r9
- DB 117,30 ; jne 6a0 <_sk_store_a8_sse2_8bit+0x48>
- DB 102,15,219,21,118,12,0,0 ; pand 0xc76(%rip),%xmm2 # 1300 <_sk_xor__sse2_8bit+0x101>
+ DB 117,30 ; jne 657 <_sk_store_a8_sse2_8bit+0x48>
+ DB 102,15,219,21,111,12,0,0 ; pand 0xc6f(%rip),%xmm2 # 12b0 <_sk_xor__sse2_8bit+0xfa>
DB 102,15,103,210 ; packuswb %xmm2,%xmm2
DB 102,15,103,210 ; packuswb %xmm2,%xmm2
DB 102,66,15,126,20,2 ; movd %xmm2,(%rdx,%r8,1)
@@ -40044,24 +39989,24 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 6e0 <_sk_store_a8_sse2_8bit+0x88>
+ DB 116,54 ; je 697 <_sk_store_a8_sse2_8bit+0x88>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 6c5 <_sk_store_a8_sse2_8bit+0x6d>
+ DB 116,21 ; je 67c <_sk_store_a8_sse2_8bit+0x6d>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,226 ; jne 698 <_sk_store_a8_sse2_8bit+0x40>
+ DB 117,226 ; jne 64f <_sk_store_a8_sse2_8bit+0x40>
DB 102,15,127,84,36,16 ; movdqa %xmm2,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 66,136,68,2,2 ; mov %al,0x2(%rdx,%r8,1)
- DB 102,15,219,21,51,12,0,0 ; pand 0xc33(%rip),%xmm2 # 1300 <_sk_xor__sse2_8bit+0x101>
+ DB 102,15,219,21,44,12,0,0 ; pand 0xc2c(%rip),%xmm2 # 12b0 <_sk_xor__sse2_8bit+0xfa>
DB 102,15,103,210 ; packuswb %xmm2,%xmm2
DB 102,15,103,210 ; packuswb %xmm2,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,66,137,4,2 ; mov %ax,(%rdx,%r8,1)
- DB 235,184 ; jmp 698 <_sk_store_a8_sse2_8bit+0x40>
+ DB 235,184 ; jmp 64f <_sk_store_a8_sse2_8bit+0x40>
DB 102,15,127,20,36 ; movdqa %xmm2,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 66,136,4,2 ; mov %al,(%rdx,%r8,1)
- DB 235,170 ; jmp 698 <_sk_store_a8_sse2_8bit+0x40>
+ DB 235,170 ; jmp 64f <_sk_store_a8_sse2_8bit+0x40>
PUBLIC _sk_load_g8_sse2_8bit
_sk_load_g8_sse2_8bit LABEL PROC
@@ -40073,29 +40018,29 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,69 ; jne 750 <_sk_load_g8_sse2_8bit+0x62>
+ DB 117,69 ; jne 707 <_sk_load_g8_sse2_8bit+0x62>
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,239,11,0,0 ; pand 0xbef(%rip),%xmm0 # 1310 <_sk_xor__sse2_8bit+0x111>
- DB 102,15,111,21,247,11,0,0 ; movdqa 0xbf7(%rip),%xmm2 # 1320 <_sk_xor__sse2_8bit+0x121>
+ DB 102,15,219,5,232,11,0,0 ; pand 0xbe8(%rip),%xmm0 # 12c0 <_sk_xor__sse2_8bit+0x10a>
+ DB 102,15,111,21,240,11,0,0 ; movdqa 0xbf0(%rip),%xmm2 # 12d0 <_sk_xor__sse2_8bit+0x11a>
DB 102,15,112,216,245 ; pshufd $0xf5,%xmm0,%xmm3
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,218 ; pmuludq %xmm2,%xmm3
DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
DB 102,15,98,194 ; punpckldq %xmm2,%xmm0
- DB 102,15,235,5,228,11,0,0 ; por 0xbe4(%rip),%xmm0 # 1330 <_sk_xor__sse2_8bit+0x131>
+ DB 102,15,235,5,221,11,0,0 ; por 0xbdd(%rip),%xmm0 # 12e0 <_sk_xor__sse2_8bit+0x12a>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 790 <_sk_load_g8_sse2_8bit+0xa2>
+ DB 116,54 ; je 747 <_sk_load_g8_sse2_8bit+0xa2>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 779 <_sk_load_g8_sse2_8bit+0x8b>
+ DB 116,21 ; je 730 <_sk_load_g8_sse2_8bit+0x8b>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,175 ; jne 719 <_sk_load_g8_sse2_8bit+0x2b>
+ DB 117,175 ; jne 6d0 <_sk_load_g8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -40104,10 +40049,10 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
DB 242,15,16,194 ; movsd %xmm2,%xmm0
- DB 235,137 ; jmp 719 <_sk_load_g8_sse2_8bit+0x2b>
+ DB 235,137 ; jmp 6d0 <_sk_load_g8_sse2_8bit+0x2b>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 233,123,255,255,255 ; jmpq 719 <_sk_load_g8_sse2_8bit+0x2b>
+ DB 233,123,255,255,255 ; jmpq 6d0 <_sk_load_g8_sse2_8bit+0x2b>
PUBLIC _sk_load_g8_dst_sse2_8bit
_sk_load_g8_dst_sse2_8bit LABEL PROC
@@ -40119,29 +40064,29 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,69 ; jne 800 <_sk_load_g8_dst_sse2_8bit+0x62>
+ DB 117,69 ; jne 7b7 <_sk_load_g8_dst_sse2_8bit+0x62>
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,219,13,111,11,0,0 ; pand 0xb6f(%rip),%xmm1 # 1340 <_sk_xor__sse2_8bit+0x141>
- DB 102,15,111,21,119,11,0,0 ; movdqa 0xb77(%rip),%xmm2 # 1350 <_sk_xor__sse2_8bit+0x151>
+ DB 102,15,219,13,104,11,0,0 ; pand 0xb68(%rip),%xmm1 # 12f0 <_sk_xor__sse2_8bit+0x13a>
+ DB 102,15,111,21,112,11,0,0 ; movdqa 0xb70(%rip),%xmm2 # 1300 <_sk_xor__sse2_8bit+0x14a>
DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,218 ; pmuludq %xmm2,%xmm3
DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
- DB 102,15,235,13,100,11,0,0 ; por 0xb64(%rip),%xmm1 # 1360 <_sk_xor__sse2_8bit+0x161>
+ DB 102,15,235,13,93,11,0,0 ; por 0xb5d(%rip),%xmm1 # 1310 <_sk_xor__sse2_8bit+0x15a>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 840 <_sk_load_g8_dst_sse2_8bit+0xa2>
+ DB 116,54 ; je 7f7 <_sk_load_g8_dst_sse2_8bit+0xa2>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 829 <_sk_load_g8_dst_sse2_8bit+0x8b>
+ DB 116,21 ; je 7e0 <_sk_load_g8_dst_sse2_8bit+0x8b>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,175 ; jne 7c9 <_sk_load_g8_dst_sse2_8bit+0x2b>
+ DB 117,175 ; jne 780 <_sk_load_g8_dst_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,112,201,69 ; pshufd $0x45,%xmm1,%xmm1
@@ -40150,10 +40095,10 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
DB 242,15,16,202 ; movsd %xmm2,%xmm1
- DB 235,137 ; jmp 7c9 <_sk_load_g8_dst_sse2_8bit+0x2b>
+ DB 235,137 ; jmp 780 <_sk_load_g8_dst_sse2_8bit+0x2b>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 233,123,255,255,255 ; jmpq 7c9 <_sk_load_g8_dst_sse2_8bit+0x2b>
+ DB 233,123,255,255,255 ; jmpq 780 <_sk_load_g8_dst_sse2_8bit+0x2b>
PUBLIC _sk_srcover_rgba_8888_sse2_8bit
_sk_srcover_rgba_8888_sse2_8bit LABEL PROC
@@ -40166,7 +40111,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,120 ; jne 8e7 <_sk_srcover_rgba_8888_sse2_8bit+0x99>
+ DB 117,120 ; jne 89e <_sk_srcover_rgba_8888_sse2_8bit+0x99>
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
DB 77,133,201 ; test %r9,%r9
DB 242,15,112,216,231 ; pshuflw $0xe7,%xmm0,%xmm3
@@ -40192,44 +40137,44 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,15,103,251 ; packuswb %xmm3,%xmm7
DB 102,15,248,215 ; psubb %xmm7,%xmm2
DB 102,15,252,208 ; paddb %xmm0,%xmm2
- DB 117,58 ; jne 917 <_sk_srcover_rgba_8888_sse2_8bit+0xc9>
+ DB 117,58 ; jne 8ce <_sk_srcover_rgba_8888_sse2_8bit+0xc9>
DB 243,66,15,127,20,130 ; movdqu %xmm2,(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 68,137,200 ; mov %r9d,%eax
DB 36,3 ; and $0x3,%al
DB 60,1 ; cmp $0x1,%al
- DB 116,81 ; je 941 <_sk_srcover_rgba_8888_sse2_8bit+0xf3>
+ DB 116,81 ; je 8f8 <_sk_srcover_rgba_8888_sse2_8bit+0xf3>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 60,2 ; cmp $0x2,%al
- DB 116,20 ; je 90c <_sk_srcover_rgba_8888_sse2_8bit+0xbe>
+ DB 116,20 ; je 8c3 <_sk_srcover_rgba_8888_sse2_8bit+0xbe>
DB 60,3 ; cmp $0x3,%al
- DB 15,133,117,255,255,255 ; jne 875 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
+ DB 15,133,117,255,255,255 ; jne 82c <_sk_srcover_rgba_8888_sse2_8bit+0x27>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2
- DB 233,94,255,255,255 ; jmpq 875 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
+ DB 233,94,255,255,255 ; jmpq 82c <_sk_srcover_rgba_8888_sse2_8bit+0x27>
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,43 ; je 94c <_sk_srcover_rgba_8888_sse2_8bit+0xfe>
+ DB 116,43 ; je 903 <_sk_srcover_rgba_8888_sse2_8bit+0xfe>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 939 <_sk_srcover_rgba_8888_sse2_8bit+0xeb>
+ DB 116,18 ; je 8f0 <_sk_srcover_rgba_8888_sse2_8bit+0xeb>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,182 ; jne 8e3 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
+ DB 117,182 ; jne 89a <_sk_srcover_rgba_8888_sse2_8bit+0x95>
DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
DB 102,66,15,126,92,130,8 ; movd %xmm3,0x8(%rdx,%r8,4)
DB 102,66,15,214,20,130 ; movq %xmm2,(%rdx,%r8,4)
- DB 235,162 ; jmp 8e3 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
+ DB 235,162 ; jmp 89a <_sk_srcover_rgba_8888_sse2_8bit+0x95>
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 233,41,255,255,255 ; jmpq 875 <_sk_srcover_rgba_8888_sse2_8bit+0x27>
+ DB 233,41,255,255,255 ; jmpq 82c <_sk_srcover_rgba_8888_sse2_8bit+0x27>
DB 102,66,15,126,20,130 ; movd %xmm2,(%rdx,%r8,4)
- DB 235,143 ; jmp 8e3 <_sk_srcover_rgba_8888_sse2_8bit+0x95>
+ DB 235,143 ; jmp 89a <_sk_srcover_rgba_8888_sse2_8bit+0x95>
PUBLIC _sk_scale_1_float_sse2_8bit
_sk_scale_1_float_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,16 ; movss (%rax),%xmm2
- DB 243,15,89,21,110,9,0,0 ; mulss 0x96e(%rip),%xmm2 # 12d0 <_sk_xor__sse2_8bit+0xd1>
+ DB 243,15,89,21,103,9,0,0 ; mulss 0x967(%rip),%xmm2 # 1280 <_sk_xor__sse2_8bit+0xca>
DB 243,15,44,194 ; cvttss2si %xmm2,%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
@@ -40239,7 +40184,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,219 ; punpcklbw %xmm3,%xmm3
DB 242,15,112,219,0 ; pshuflw $0x0,%xmm3,%xmm3
DB 102,15,112,219,80 ; pshufd $0x50,%xmm3,%xmm3
- DB 102,15,219,29,224,9,0,0 ; pand 0x9e0(%rip),%xmm3 # 1370 <_sk_xor__sse2_8bit+0x171>
+ DB 102,15,219,29,217,9,0,0 ; pand 0x9d9(%rip),%xmm3 # 1320 <_sk_xor__sse2_8bit+0x16a>
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,213,224 ; pmullw %xmm0,%xmm4
DB 102,15,213,218 ; pmullw %xmm2,%xmm3
@@ -40262,7 +40207,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,114 ; jne a49 <_sk_scale_u8_sse2_8bit+0x8f>
+ DB 117,114 ; jne a00 <_sk_scale_u8_sse2_8bit+0x8f>
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
@@ -40292,12 +40237,12 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,57 ; je a8c <_sk_scale_u8_sse2_8bit+0xd2>
+ DB 116,57 ; je a43 <_sk_scale_u8_sse2_8bit+0xd2>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je a72 <_sk_scale_u8_sse2_8bit+0xb8>
+ DB 116,21 ; je a29 <_sk_scale_u8_sse2_8bit+0xb8>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,130 ; jne 9e5 <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 117,130 ; jne 99c <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
@@ -40306,16 +40251,16 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,89,255,255,255 ; jmpq 9e5 <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,89,255,255,255 ; jmpq 99c <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,75,255,255,255 ; jmpq 9e5 <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,75,255,255,255 ; jmpq 99c <_sk_scale_u8_sse2_8bit+0x2b>
PUBLIC _sk_lerp_1_float_sse2_8bit
_sk_lerp_1_float_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,16 ; movss (%rax),%xmm2
- DB 243,15,89,21,44,8,0,0 ; mulss 0x82c(%rip),%xmm2 # 12d4 <_sk_xor__sse2_8bit+0xd5>
+ DB 243,15,89,21,37,8,0,0 ; mulss 0x825(%rip),%xmm2 # 1284 <_sk_xor__sse2_8bit+0xce>
DB 243,15,44,194 ; cvttss2si %xmm2,%eax
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,96,210 ; punpcklbw %xmm2,%xmm2
@@ -40325,7 +40270,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,96,236 ; punpcklbw %xmm4,%xmm5
DB 102,15,104,196 ; punpckhbw %xmm4,%xmm0
- DB 102,15,111,21,170,8,0,0 ; movdqa 0x8aa(%rip),%xmm2 # 1380 <_sk_xor__sse2_8bit+0x181>
+ DB 102,15,111,21,163,8,0,0 ; movdqa 0x8a3(%rip),%xmm2 # 1330 <_sk_xor__sse2_8bit+0x17a>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
DB 102,15,213,240 ; pmullw %xmm0,%xmm6
@@ -40365,7 +40310,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,180,0,0,0 ; jne c1b <_sk_lerp_u8_sse2_8bit+0xd5>
+ DB 15,133,180,0,0,0 ; jne bd2 <_sk_lerp_u8_sse2_8bit+0xd5>
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
@@ -40411,12 +40356,12 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 255,224 ; jmpq *%rax
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,61 ; je c62 <_sk_lerp_u8_sse2_8bit+0x11c>
+ DB 116,61 ; je c19 <_sk_lerp_u8_sse2_8bit+0x11c>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,25 ; je c48 <_sk_lerp_u8_sse2_8bit+0x102>
+ DB 116,25 ; je bff <_sk_lerp_u8_sse2_8bit+0x102>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,60,255,255,255 ; jne b75 <_sk_lerp_u8_sse2_8bit+0x2f>
+ DB 15,133,60,255,255,255 ; jne b2c <_sk_lerp_u8_sse2_8bit+0x2f>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
@@ -40425,10 +40370,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,19,255,255,255 ; jmpq b75 <_sk_lerp_u8_sse2_8bit+0x2f>
+ DB 233,19,255,255,255 ; jmpq b2c <_sk_lerp_u8_sse2_8bit+0x2f>
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,5,255,255,255 ; jmpq b75 <_sk_lerp_u8_sse2_8bit+0x2f>
+ DB 233,5,255,255,255 ; jmpq b2c <_sk_lerp_u8_sse2_8bit+0x2f>
PUBLIC _sk_move_src_dst_sse2_8bit
_sk_move_src_dst_sse2_8bit LABEL PROC
@@ -40445,7 +40390,7 @@ _sk_move_dst_src_sse2_8bit LABEL PROC
PUBLIC _sk_black_color_sse2_8bit
_sk_black_color_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,9,7,0,0 ; movaps 0x709(%rip),%xmm0 # 1390 <_sk_xor__sse2_8bit+0x191>
+ DB 15,40,5,2,7,0,0 ; movaps 0x702(%rip),%xmm0 # 1340 <_sk_xor__sse2_8bit+0x18a>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_white_color_sse2_8bit
@@ -40877,13 +40822,11 @@ _sk_xor__sse2_8bit LABEL PROC
ALIGN 4
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 130f <_sk_xor__sse2_8bit+0x110>
- DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 1313 <_sk_xor__sse2_8bit+0x114>
+ DB 127,67 ; jg 12c3 <_sk_xor__sse2_8bit+0x10d>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 1317 <_sk_xor__sse2_8bit+0x118>
+ DB 127,67 ; jg 12c7 <_sk_xor__sse2_8bit+0x111>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 131b <_sk_xor__sse2_8bit+0x11c>
+ DB 127,67 ; jg 12cb <_sk_xor__sse2_8bit+0x115>
ALIGN 16
DB 0,0 ; add %al,(%rax)
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index baa6083f44..ce14eccbbb 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -302,11 +302,11 @@ STAGE(dither) {
// load 4 floats from memory, and splat them into r,g,b,a
STAGE(uniform_color) {
- auto rgba = (const float*)ctx;
- r = rgba[0];
- g = rgba[1];
- b = rgba[2];
- a = rgba[3];
+ auto c = (const SkJumper_UniformColorCtx*)ctx;
+ r = c->r;
+ g = c->g;
+ b = c->b;
+ a = c->a;
}
// splats opaque-black into r,g,b,a
diff --git a/src/jumper/SkJumper_stages_8bit.cpp b/src/jumper/SkJumper_stages_8bit.cpp
index dfc16702a8..05ec16bf99 100644
--- a/src/jumper/SkJumper_stages_8bit.cpp
+++ b/src/jumper/SkJumper_stages_8bit.cpp
@@ -220,13 +220,10 @@ SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, int x, int y) {
}
STAGE(uniform_color) {
- auto c = (const float*)ctx;
-
- src.u32 = (uint32_t)(c[0] * 255) << 0
- | (uint32_t)(c[1] * 255) << 8
- | (uint32_t)(c[2] * 255) << 16
- | (uint32_t)(c[3] * 255) << 24;
+ auto c = (const SkJumper_UniformColorCtx*)ctx;
+ src.u32 = c->rgba;
}
+
STAGE(set_rgb) {
auto c = (const float*)ctx;
diff --git a/src/jumper/SkJumper_stages_lowp.cpp b/src/jumper/SkJumper_stages_lowp.cpp
index 7f6141d8e0..f90ebdb5d3 100644
--- a/src/jumper/SkJumper_stages_lowp.cpp
+++ b/src/jumper/SkJumper_stages_lowp.cpp
@@ -218,11 +218,12 @@ SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, int x, int y) {
// Stages!
STAGE(uniform_color) {
+ auto c = (const SkJumper_UniformColorCtx*)ctx;
// We're converting to fixed point, which lets us play some IEEE representation tricks,
// replacing a naive *32768 and float->int conversion with a simple float add.
using F32x4 = float __attribute__((ext_vector_type(4)));
using U16x8 = uint16_t __attribute__((ext_vector_type(8)));
- auto bits = (U16x8)(unaligned_load<F32x4>((const float*)ctx) + 256.0f);
+ auto bits = (U16x8)(unaligned_load<F32x4>((const float*)&c->r) + 256.0f);
r = (U16)bits[0];
g = (U16)bits[2];
b = (U16)bits[4];